SPOJITÝ PŘÍSTUP K MODELOVÁNÍ RIZIKA ŠKODNÍCH REZERV Pavel Zimmermann
Obsah Současné modely a motivace Veličiny + rozdělení Model
Sestavit stochastický model rozdělení budoucích plnění pojišťovny Cíl Sestavit stochastický model rozdělení budoucích plnění pojišťovny Klíčová otázka: KDY? KOLIK?
Trojúhelníková schémata Více možných modelů Většinou založeny na trojúhelníkových schématech Extrapolace historického vývoje vývojové faktory regresní funkce (tail factor) + nesystematická složka (rozdělení?) Zpoždění plnění Období vzniku
Problém Pro některé produkty pouze krátká historie Vývoj nemusí být ukončen Odhad daleké budoucnosti (teoreticky ∞) na základě malého počtu pozorování Některé produkty resp. skupiny PU mají nestabilní vývoj
Příklad Occurence Development year year 1-2 2-3 3-4 4-5 5-6 2000 386% 191% 101% 108% 109% 2001 518% 163% 122% 106% 2002 969% 172% 130% 2003 1546% 160% 2004 311% 1-2 2-3 3-4 4-5 5-6 514% 174% 116% 107% 109% Vývojové faktory – většinou vážené průměry (odlehlá pozorování?) Extrapolace: Volba regresní funkce Volba prahu predikce
Neagregovat data do trojúhelníků Základní myšlenka Neagregovat data do trojúhelníků Na základě individuálních pozorování najít vhodná rozdělení zpoždění výplaty výše výplaty Podobná myšlenka obsažena v Herbst T.: An application of randomly truncated data models in reserving IBNR claims, Insurance: Mathematics and Economics 25 (1999) 123–131
První „prototyp“ pouze pro havarijní pojištění (KASKO) Využití modelu plánováno pro pojištění odpovědnosti z provozu motorových vozidel (MTPL) První „prototyp“ pouze pro havarijní pojištění (KASKO) Delší historie Kratší zpoždění Zobecnění na konci prezentace
je nahlášena se zpožděním a plnění nastane po čase po nahlášení Proměnné modelu počátek produktu = čas 0 škoda vznikne v čase je nahlášena se zpožděním a plnění nastane po čase po nahlášení ve výši X Plnění (uzavření)
Doba od vzniku do plnění je rozdělena na 2 úseky Zpoždění plnění Doba od vzniku do plnění je rozdělena na 2 úseky = Zpoždění plnění Modelování a odlišné metody Doby do nastání jevu – analýza přežívání (survival analysis)
Modelovaný úsek délky dnů Nekompletní data K dispozici data od 1.1.1998 do 21.9.2006 Modelovaný úsek délky dnů Pro obě doby k dispozici nekompletní pozorování (incomplete data) Některé nahlášené škody do neuzavřené Některé nejsou do ani nahlášené Pro KASKO krátká doba do nahlášení i od nahlášení do plnění => pro škody vzniklé do konce r. 2005 data kompletní
Korelační matice Závislosti pro model nepodstatné 1,000 -0,099 -0,013 0,017 -0,038 -0,123 0,015 Závislosti pro model nepodstatné Zjednodušení – veličiny lze generovat nezávisle Pro MTPL? Míry závislosti pro nekompletní pozorování ???
Doba od vzniku do registrace =3185 10 2 ZPRAVA USEKNUTÁ (RIGHT TRUNCATED) POZOROVÁNÍ
Odhad rozdělení – useknuá pozorování V databázi pouze škody vzniklé a nahlášené do tzn. jen kde Neparametrický odhad distribuční funkce pro useknutá pozorování: Kaplan-Meierův odhad (=Product Limit odhad) čas useknutí (truncation time)
Kaplan-Meierův odhad-useknutá poz. Pozorování: i.i.d. uspořádané různé hodnoty označíme K-M odhad pro zprava useknutá data existuje pouze pro podmíněnou distribuční funkci
Kaplan-Meierův odhad-useknutá poz. Označme počet hlášení v den od vzniku a Potom je neparametrickým odhadem
Parametrický odhad-useknutá poz. Pokud patří do nějaké parametrické třídy rozdělení M.M.V. odhad parametru Podmíněné rozdělení čas useknutí
Výběr rozdělení Stochastické modelování praktičtější parametrická rozdělení (generátory n. č.) Výběr vhodného parametrického rozdělení: srovnáním K-M odhadu s parametrickým odhadem Srovnáváme odhady podmíněných rozdělení
Grafické metody Srovnáváme: Existují i statistické testy distribuční funkce (CDF plot) kvantilové funkce (Q-Q plot) Existují i statistické testy „Large n problem“ Při velkém počtu pozorování bude i malá odchylka statisticky významná Parametrická rozdělení v analýze přežívání: LN, Weibullovo + speciální případy (Gamma, exponenciální) 3 skupiny škod (MP): Škody na majetku, odcizení, ostatní
Exponenciální rozdělení
Gamma
Weibull
Logaritmicko normální
Doba od registrace do plnění Většina škod - jedno plnění Některé více plnění (zálohy) potom definováno jako vážený průměr váhy = výše plateb Pro některé škody plnění ještě neproběhlo (RBNS) Některé z části vyplacené – viz konec prezentace Vznik Hlášení Platba 1 t = 20 d 5000 Czk Platba 2 t = 50 d 2000 Czk Platba 3 (konečná) t = 100 d 100 000 Czk
Doba od registrace do plnění 10 Reg. =3185 20 ZPRAVA CENZOROVANÁ (RIGHT CENSORED) POZOROVÁNÍ
Cenzorovaná vs. useknutá pozorování 2 10 =3185 20 USEKNUTÁ CENZOROVANÁ vznik registrace registrace plnění Neznám počet Znám počet a dolní hranici
Doba od registrace do plnění Dobu od registrace do plnění znám pouze pokud neboli pokud kde Jinak víme čas cenzorování
Cenzorovaná pozorování i.i.d. kde je : čas do plnění (je-li známý) nebo čas cenzorování kde je indikátor ... je skutečná doba do plnění ... je čas cenzorování
Kaplan-Meierův odhad-cenzorovaná poz. Většinou ve tvaru funkce přežití (survival f.) uspořádané různé hodnoty označíme Označme počet necenz. PU s dobou od registrace do plnění počet necenzorovaných nevyplacených PU těsně před
Kaplan-Meierův odhad-cenzorovaná poz. Potom je neparametrickým odhadem pravděpodobnost „přežití v “
Parametrický odhad-useknutá poz. Pokud patří do nějaké parametrické třídy rozdělení M.M.V. odhad parametru naměřené cenzorované Výběr : srovnáním K-M odhadu s parametrickým odhadem
Exponenciální
Gamma
Weibullovo
Logaritmicko normální
Výše pojistné události Pokud nezávislost - standardní statistické metody Pro odhad 2 možnosti: Jen ukončené škody Výplata + RBNS rezerva (runoff!) Často Logaritmicko normální r. Pro „škody na majetku“ a „ostatní“ je LN dobrou aproximací
LN „škody na majetku“
LN “ostatní“
Výše pojistné události Pro třídu „odcizení“ na hranici použitelnosti Třída „odcizení“ – více zdrojů rizika Odcizení zahrnují odcizení vybavení, zavazadel atd. odcizení vozidla škody log. škody
Rozdělit ještě odcizení na „malá“ a „velká“ Použít flexibilnější rozdělení Například Gaussovskou směs (GMM) počet zdrojů rizika váhy - pst. zdrojů komponenty – rozdělení jednotlivých rizik (normální r.)
GMM Odhad parametrů komponent a vah : Expectation Maximization (EM) Algorithm Neznám počet komponent k => rozšíření EM: Figueiredo M. A. T., Jain, A. K.: Unsupervised Learning of Finite Mixture Models, IEEE transactions of pattern analysis and machine intelligence, vol.24, no3, March 2002
Založeno na informačním kritériu Rozšířený EM Založeno na informačním kritériu Logaritmická transformace dat (předpokládáme LN komponenty) odhad: Komponenta Parametr 1 2 3 0,28 0,54 0,18 21,92 15,6 17,4 0,65 1,01 6,59
Odcizení lognormální
Odcizení GMM
Struktuta modelu 2 části RBNS škody - neznáme: IBNR škody - neznáme: Dobu od registrace do plnění Výši plnění IBNR škody Počet Datum vzniku Dobu od vzniku do registrace - neznáme: - neznáme:
RBNS část RBNS
RBNS škody – doba do plnění Známe a O víme pouze, že Generujeme z podmíněného rozdělení
RBNS škody - výše Výše škody neznámá K dispozici odhad likvidátorů RBNS rezerva Zatíženo chybou Pokud je systematická (runoff) je třeba opravit Stochastický model chyby? Rozdělení by mělo záviset na stádiu likvidace Pro KASKO runoff 100 % => = RBNS rez.
IBNR část IBNR
IBNR škody - počet Pro každý den vzniku Počet škod Odhad podobně jako v [Herbst 99] Pravděpodobnost, že škoda vzniklá v bude do nahlášena je Počet škod vzniklých v a do nahlášených známe ( ) Očekávaný počet hlášených i nehlášených škod vzniklých v
např. exponenciální vyrovnání Automaticky generuji IBNR škody - počet Pro každý den odhaduji nepřesnost: místo použít např. exponenciální vyrovnání Automaticky generuji 0,99999 0,00000 1 2 1,00002 0,00002 3 0,99998 4 2,00006 0,00006 … 2770 0,82751 3,62533 0,62533 2771 0,82079 2,43669 0,43669 2772 0,81371 1,22893 0,22893 2773 5 0,80627 6,20136 1,20136 2774 0,79844 5,00975 1,00975 2775 0,79019 2,53103 0,53103 2776 0,78149 6,39800 1,39800 2777 7 0,77232 9,06359 2,06359 2778 0,76264 9,17868 2,17868 2779 0,75241 1,32907 0,32907 2780 0,74159 5,39378 1,39378
IBNR škody - doby O době od vzniku do nahlášení víme Generovat z podmíněného rozdělení O ani nejsou další informace Generovat z nepodmíněných rozdělení
Výsledky Získáme odhad rozdělení budoucích plateb pojišťovny 20000 simulací:
Diskontované i nediskontované (u generovaných škod znám datum plnění) Výsledky Charakteristiky: střední hodnota („Best estimate“) kvantilová mapa – mohu srovnat s účetními rezervami Lze zkoumat podle: roku vzniku jednotlivých produktů IBNR a RBNS Diskontované i nediskontované (u generovaných škod znám datum plnění)
Škody z části vyplacené Na začátku jsme ignorovali škody z části vyplacené Pro ně třeba modelovat dobu od registrace do ukončení = posledního plnění Opět cenzorovaná pozorování odhad rozdělení Pro tyto škody generovat fiktivní platbu: vyplacenou dní od registrace; generované z výše = zbývající RBNS (opravená o runoff)
Předpokládané rozšíření Pro MTPL zahrnutí alespoň některých závislostí Využití regresních modelů pro cenzorovaná data Stochastický model „práce likvidátorů“ (RBNS) Zahrnutí zajištění
Prameny
Děkuji za pozornost Dotazy? Konec Děkuji za pozornost Dotazy?