TECHNIKY VÝPOČTU IBNR A JEJICH APLIKACE V POJIŠTĚNÍ ODPOVĚDNOSTI Z PROVOZU VOZIDEL Petr Jedlička Jan Kočvara Jakub Strnad.

Slides:



Advertisements
Podobné prezentace
ZÁKLADY EKONOMETRIE 6. cvičení Autokorelace
Advertisements

Téma 5 Metody řešení desek, metoda sítí.
Statistická indukce Teorie odhadu.
TEORIE ROZHODOVÁNÍ A TEORIE HER
Použité statistické metody
Kvantitativní metody výzkumu v praxi
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
EDA pro časové řady.
Téma 3 Metody řešení stěn, metoda sítí.
Cvičení 6 – 25. října 2010 Heteroskedasticita
Predikce Zobecněná MNČ
Cvičení října 2010.
4EK211 Základy ekonometrie Autokorelace Cvičení /
Lineární regresní analýza Úvod od problému
ZÁKLADY EKONOMETRIE 2. cvičení KLRM
Regulační diagram je to základní grafický nástroj statistické regulace procesu, který umožňuje posoudit statistickou zvládnutost procesu statisticky zvládnutý.
CENOVÁ KONVERGENCE K EU: Poznatky z mezinárodního srovnání Seminář MF ČR Smilovice, 2. prosince 2003 Martin Čihák (MMF) Tomáš Holub (ČNB)
Lineární algebra.
Diplomová práce Autorka: Ing. et Ing. Zuzana Hynoušová
MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA reg. č.: CZ.1.07/1.4.00/ Základní škola, Šlapanice, okres Brno-venkov, příspěvková organizace Masarykovo nám.
Úvod do regresní analýzy
Regresní analýza a korelační analýza
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Získávání informací Získání informací o reálném systému
Testování hypotéz (ordinální data)
Statistika Vypracoval: Mgr. Lukáš Bičík
Jazyk vývojových diagramů
Tloušťková struktura porostu
Posloupnosti, řady Posloupnost je každá funkce daná nějakým předpisem, jejímž definičním oborem je množina všech přirozených čísel n=1,2,3,… Zapisujeme.
Korelace a regrese síla (těsnost) závislosti dvou náhodných veličin: korelace symetrický vztah obou veličin neslouží k předpovědi způsob (tvar) závislosti.
SPC v případě autokorelovaných dat
Základy ekonometrie Cvičení září 2010.
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Základy ekonometrie Cvičení října 2010.
Řízení a supervize v sociálních a zdravotnických organizacích
Pojmy a interpretace.
Základy ekonometrie Cvičení 3 4. října 2010.
1 Celostátní konference ředitelů gymnázií ČR AŘG ČR P ř e r o v Mezikrajová komparace ekonomiky gymnázií.
ANALÝZA VÝSLEDKŮ LINEÁRNÍHO OPTIMALIZAČNÍHO MODELU
Lineární regrese.
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Korelace a elaborace aneb úvod do vztahů proměnných
Lineární regrese.
Praktické využití regresní analýzy Struktura národního hospodářství a znečištění ovzduší v tranzitivních ekonomikách: Případ České republiky Gabriela Jandová.
REGIONÁLNÍ ANALÝZA Cvičení 3 Evropský sociální fond
Lineární regresní analýza
Jedno-indexový model a určení podílů cenných papírů v portfoliu
Experimentální fyzika I. 2
Teorie psychodiagnostiky a psychometrie
Normální rozdělení a ověření normality dat
Korelace.
Modeling claim size in time via copulas (Gaida Pettere & Tonu Kollo) Mgr. Jan Šváb
Míra růstu dividend, popř. zisku
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
METODY STŘEDNĚDOBÉHO PROGNÓZOVÁNÍ SURO jaro 2010.
IV..
Aplikovaná statistika 2.
Gender Pay Gap a jeho determinanty s využitím dat EU-SILC 2005 PhDr. Martina Mysíková IES FSV UK ČSÚ.
Základy zpracování geologických dat R. Čopjaková.
Odhady odhady bodové a intervalové odhady
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
INDUKTIVNÍ STATISTIKA
Korelace Korelace obecně je míra kvality (vhodnosti, těsnosti) nalezeného regresního modelu pro daná data; vychází z hodnot reziduí V každém typu regresního.
Induktivní statistika
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Příklad (investiční projekt)
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
jednoduchá regrese kvadratický Y=b0+b1X+b2X 2
Lineární regrese.
Induktivní statistika
Transkript prezentace:

TECHNIKY VÝPOČTU IBNR A JEJICH APLIKACE V POJIŠTĚNÍ ODPOVĚDNOSTI Z PROVOZU VOZIDEL Petr Jedlička Jan Kočvara Jakub Strnad

Obsah prezentace Munich Chain-Lader (MCL) Regresní metody výpočtu rezerv (Probabilistic Trend Family – PTF) Simulační techniky k určení rozdělení IBNR Aplikace v pojištění odpovědnosti z provozu vozidla (POV) Ilustrace použití metod na škodách způsobených nepojištěnými řidiči

Trojúhelníková schémata zpoždění Data Pojistná plnění Závazky Počty událostí… Forma dat (v řádcích) Kumulativní Přírůstková Interpretace Řádky: odpovídají období vzniku relevantní události Sloupce: období zpoždění ve hlášení nebo plnění události od data vzniku Diagonály: údaje pro jednotlivá kalendářní období Snahou je odhad dat pod aktuální diagonálou Doplnění trojúhelníku na čtverec (obdélník) Statistické metody, nejznámější je Chain-Ladder známá data období vzniku odhadovaná část

Standardní Chain-Ladder a jeho nedostatky Neuvažuje / neumožňuje: Systematický vývoj podle roku vzniku Odhadnout inflaci ve výši škod (vývoj podle kalendářního období) Určit vedle bodového odhadu IBNR její pravděpodobnostní rozdělení  nelze spočítat interval spolehlivosti pro IBNR, medián atd. Projekce vyplacených plnění (Paid) a celkových závazků (Incurred) často zcela odlišné Nevýhody z hlediska POV V celém trhu POV je pozorován nárůst škod v čase převyšující inflaci (tzv. superimposed inflation) Výrazný meziroční nárůst objemu škod u ŠU placených z GF ČKP

Úvod k Munich Chain-Ladder Metoda vyvinuta aktuáry Münchener Rück Odtud odvozen její název Rozšiřuje model T. Macka (1993) stejné kalkulace variability vývojových faktorů Hlavní znaky Pracuje zároveň s kumulativními trojúhelníky Paid i Incurred Snahou je zmenšit rozdíly projekcí obou trojúhelníků Úprava vývojových faktorů Standardního Chain-Ladderu (SCL) Modelování závislostí mezi trojúhelníky

Používané symboly pro MCL n…rozměr trojúhelníků a(i)…poslední známé období vývoje pro rok vzniku i Pi,j …kumulativní hodnota vyplaceného plnění pro rok vzniku i a zpoždění j I i,j …kumulativní hodnota celkového závazku = Pi,j + odpovídající stav RBNS (P/I) i,j = Pi,j / I i,j i = 1,…,n; j = 1,…,a(i). Trojúhelník podílů vyplacených plnění a celkového závazku (měl by konvergovat k 1)

Vývojové faktory Standardní faktory Chain Ladder pro oba trojúhelníky: Průměrný poměr Paid a Incurred: Dodefinujeme pro Při použití těchto projekcí SCL platí následující: Grafická interpretace na následujícím grafu (Závislost poměru P/I na období vývoje): podíly projekcí Paid a Incurred nekonvergují k 1. Nízká hodnota podílu ve známé části  také nízké hodnoty podílu predikcí

Graf podílu Paid a Incurred Graf vlevo znázorňuje známá data včetně průměrných podílů Druhý graf je doplněn o podíly predikcí P/I dle SCL - Podíl Paid a Incurred nekonverguje ke 100%

Hlavní myšlenka MCL metody Nízký podíl dosud vyplaceného plnění (Paid) z celk. závazku (Incurred), tj. (P/I)i,j  vyšší podíl plnění Pi,j+1/Pi,j  je vhodné navýšit vývojový faktor  nižší podíl závazků Ii,j+1/Ii,j  je vhodné snížit vývojový faktor Matematicky Záporná korelace mezi oběma veličinami (P/I)i,j a Pi,j+1/Pi,j Možnost modelovat závislost pomocí regrese a následně vývojový faktor ze SCL upravit: Pro roky vzniku s nízkým podílem P/I dojde k urychlení vývoje  vyšší faktor u Paid trojúhelníku a naopak

Problémy s implementací Není možné formulovat oddělené regrese pro každé období vývoje Modely pak ovlivněny nedostatkem pozorování Vysoká variabilita odhadů Lineární regrese není vhodná Málokdy je vývojový faktor menší než 1 a nikdy není záporný Možno proto modelovat hyperbolickou křivkou

Řešení uvedených problémů Linearita regrese Uvažovat závislost Pi,j+1/Pi,j na (I/P)i,j namísto na (P/I)i,j Nedostatek dat a kvalita odhadů Nebrat oddělené regresní modely pro každé období vývoje, ale uvažovat všechna data společně v jednom modelu K tomu je nutná standardizace hodnot vysvětlující i vysvětlované proměnné  Nutné předpoklady o variabilitě a střední hodnotě Predikce regresního modelu pak určují „korekce“ vývojových faktorů standardního Chain-Ladderu pro trojúhelník vyplacených plnění

Technika standardizace Podobně jako závislost Pi,j+1/Pi,j na (I/P)i,j lze uvažovat závislost Ii,j+1/Ii,j na (P/I)i,j Užitečné pro adjustaci vývojových koeficientů trojúhelníku Incurred Stejné důvody pro standardizaci Analogické předpoklady o variabilitě faktorů (T. Mack) Odhady parametrů obou regresí by měly vycházet kladné

Předpoklady – Trojúhelník Paid Viz Thomas Mack (1993) Náhodná posloupnost Pi:=(Pi,1,Pi,2,…,Pi,n)’ Střední hodnota: Variabilita: Označení: Pi(j)=(Pi,1,…Pi,j)’ (tj. známá část procesu v okamžiku odhadu) Posloupnosti Px a Py jsou nezávislé pro x ≠ y Analogické předpoklady pro Incurred trojúhelník

Komentář k předpokladům Předpoklad o střední hodnotě lze upravit: Úprava předpokladu o rozptylu:  Analogický předpoklad je ve speciálním případě modelů ELRF (Extended Link Ratio Family) odpovídající právě SCL

Předpoklady – Trojúhelník Incurred Náhodná posloupnost Ii:=(Ii,1,Ii,2,…,Ii,n)’ Střední hodnota: Variabilita: Označení: Ii(j)=(Ii,1,…Ii,j)’ (tj. známá část procesu v okamžiku odhadu) Posloupnosti Ix a Iy jsou nezávislé pro x ≠ y Limitace Neuvažují se (zatím) předpoklady o vztahu Paid a Incurred

Předpoklady o závislostech V praxi znalost obou trojúhelníků Paid i Incurred Pi,j, Ii,j Značení: Bi={Pi,;Ii} Bi(j)={Pi(j); Ii(j)}’ (známá část obou procesů v čase výpočtu projekcí) Qi=Pi / Ii Standardizovaná náhodná veličina X při znalosti C: Předpoklad základního vztahu MCL Předpokládaná lineární závislost Paid vývojového faktoru na poměru I/P (ve standardizovaném tvaru)… udává sklon regresní přímky Předpoklad nezávislosti Procesy Bx a By jsou stochasticky nezávislé

Korekce vývojového faktoru Z předchozího vyplývá: Poznámky Vývojový faktor MCL je přirozeně určen jako korekce faktoru SCL Postup odvození ukázán pro Paid trojúhelník Analogické principy i pro Incurred trojúhelník:

Korelační koeficienty Označení X …standardizované hodnoty podílů P/I resp. I/P Y…standardizované vývojové faktory V předpokladech modelu uvedeno:  Dosazením dostáváme matematickou interpretaci koeficientů: Standardizace hodnotu korelačního koeficientu neovlivní „Rozumná“ situace

Výpočty odhadů - variabilita Standardní odhady vývojových faktorů (viz dříve) Variabilita faktorů Trojúhelník Paid Trojúhelník Incurred Odhad : Odhad variabilit podílů Paid a Incurred Paid: je odhadem Incurred: je odhadem

Tvar vypočtených residuí Teoretická veličina Vypočtené hodnoty

Výpočty MCL vývojových faktorů Na základě vypočtených standardizovaných hodnot formulujeme regresní modely Odhady parametrů pomocí MNČ Odhady vývojových faktorů MCL Odvození projekcí obou trojúhelníků pro j=a(i) pro ostatní j

Aplikace metody MCL v POV ČKP aplikovala MCL na data Vybraných členských pojišťoven Garančního fondu Zkušenosti s metodou na datech členů Očekávanou závislost veličin se ne vždy podařilo prokázat K přiblížení výsledků projekcí obou trojúhelníků došlo jen částečně Analýza GF ČKP (přesněji ŠU způsobené nepojištěnými) Podobně rozporuplné výsledky Např. citlivost odhadů regresních parametrů na odlehlá pozorování

Ukázka závislosti Grafy ukazují závislosti normovaných hodnot podílu Pi,j+1/Pi,j na (I/P)i,j (všechna data, resp. data po vyloučení dvou odlehlých pozorování) Odhady parametrů: Citlivost na odlehlá pozorování je výrazná. Vynechání dvou pozorování způsobilo pokles korelace o 0,2 (!)

Zhodnocení výsledků MCL Predikce založené na MCL Při „správném“ charakteru závislostí: podobné odhady finálních projekcí nezávisle na typu trojúhelníku U SCL problém: některé predikce Paid převyšují odhady Incurred jiné jich nedosahují (viz graf) zvlášť často v pozdějších letech vzniku (extrém např. v posledním období vzniku, pokud např. (P/I)n,j ~ 0 pro j=a(n)) IBNR podle MCL může vyjít nižší než podle SCL (z Incurred trojúhelníku) V našem příkladě škod nepojištěných cca. o 44% Obecně ale platit nemusí

Grafické srovnání projekcí SCL a MCL Podíl P/I u MCL konverguje ke 100% pro každý rok vzniku Dokonce i pro ta období vzniku, kde je dosud vyplacené plnění relativně zanedbatelné vůči závazku

Přestávka

Regresní techniky výpočtu rezervy Dynamické modely: Y i,j=bj*Yi,j-1+ei,j, Var(ei,j)=2(Yi,j-1) Yi,j kumulativní data (počty škod, plnění nebo závazek k období vzniku i a vývoje j) Přímočaré rozšíření SCL metody Speciálně  = 0 Metoda nejmenších čtverců  = 1 SCL metoda  = 2 Zobecnění modelu: Y i,j = a0+a1*i+bj*Y i,j-1+ei,j , Var(ei,j)=2 (Y i,j-1) Zahrnutí vývoje podle období vzniku události Extended link ratio family model Úvod: „Na začátku prezentace jsme uvedli základní metodu analýzy vývojových trojúhelníků, kterou je Chain-Ladder, a posléze jsme se zmínili o jeho základních nedostatcích. Před přestávkou můj kolega mluvil o Mnichovském Chain-Ladderu, který je zobecněním Standardního Chain-Ladderu jedním směrem a řeší tak některé jeho nedostatky. Nyní se budeme zabývat zobecněním Chain-Ladderu směrem k regresním modelům, odkud postupně odvodíme model PTF (Probabilistic Trend Family).“ „Uvažujme tedy regresní modely obecně vyjádřené rovnicí... Tyto modely jsme nazvali jako dynamické a jde o přímočaré rozšíření SCL, neboť pro Delta = 1 dostáváme přímo SCL. Pro Delta = 0 ...“ „Dalším zobecněním...“ „Nyní odstraníme z regresního modelu závislost na předchozích hodnotách v řádku, čímž se dostáváme k předmětu této části přednášky, k modelům PTF... (další slide)“ delta = 0: Y = b X => b~ = (X’X)-1 . X’ Y ... delta = 1: Y/sqrt(X) = b X/sqrt(X) => b~ = X-1 . sqrt(X)’ Y/sqrt(X) = X-1 Y delta = 2: Y/X = b => b~ = avg( Y/X ) - V zobecněném modelu se přidává rok vzniku, tj. lineární trend!

Popis PTF Modelu PTF = Probabilistic Trend Family Modelování vývoje pomocí trendů ve třech směrech Accident (vývoj počtu nebo objemu škod mezi řádky trojúhelníku) i Důležitý u škod s neznámou expozicí (např. právě GF ČKP) Development (vývoj mezi sloupci) j Payment/Calendar trend (vývoj po diagonálách) t = i + j pomocí něj lze odhadnout tzv. superimposed inflaci Regresní model Vysvětlující proměnné jsou „indikátory“ časových období Vysvětlovaná proměnná je logaritmus přírůstkových nebo i kumulativních údajů počty událostí, plnění, závazky Payment/Calendar ... odpovídá okamžiku splacení, nahlášení, zlikvidování, atd. události Indikátory období je myšleno, že model neobsahuje rekurzivní vztah závisle a nezávisle proměnné (tj. nejde o autoregresní model). Hodnoty parametry tak samy o sobě určují hodnotu vysvětlované proměnné. Pozn. „Y“ jsou nezávislé. Byť střední hodnoty Y mezi sebou mohou mít známý vztah daný X (tj. je závislost X a Y, ale nezávislost mezi různými Y), skutečné (též známé) odchylky od těchto hodnot budou realizací náhodné veličiny epsilon a tudíž nezávislé. Přičtení nenáhodné (deterministické) složky X k náhodné (stochastické) složce epsilon nemá vliv na nezávislost Y.

Specifikace regresního modelu Nejpodrobnější možný model: Každý přechod v libovolném směru je modelován odlišným parametrem Model je evidentně přeparametrizován (vysoká vysvětlovací schopnost, avšak přesto nevhodné pro predikci) Odhady mohou být zatíženy velkou chybou Špatně podmíněná matice X (LZ sloupce, XTX singulární) Ukázka designové matice X takového modelu Předpolkádáme, že epsilon ~ N ( 0 , sigma2 ) Rozptyl odhadů parametrů var (b~) = sigma2 (X’X)-1 , ale když je X špatně podmíněná, tj. sloupce X jsou lineárně závislé, pak je X’X singulární a model tedy nemá smysl (i Statistica hodí chybovou hlášku). vs. multikolinearita – stav blízký tomuto, determinant blízký nule, proto velký rozptyl, ale ne dělení nulou. (multikolinearita je vlastnost modelu)

Poznámky k formulaci PTF Pro obecný PTF platí: Vývoj v libovolném směru lze převést na zbylé dva směry Příklad: Následující dva modely jsou ekvivalentní Stabilní shodné trendy a v accident a development = stabilní trend a v payment směru 2a Příklad lze ilustrovat i vzorcem: nechť trend v accident alpha_i = a . i, trend v developmet beta_j = a, gamma_i+j = 0. Potom (obrázek vpravo): E (cílový puntík – startovní puntík) = E (cílový puntík – mezipuntík) + E (mezipuntík – startovní puntík) = a + a = 2a.

Předpoklady o rozdělení plateb přírůstek trojúhelníku Normalita residuí v PTF modelu  Vztahy pro logaritmicko-normální rozdělení Pi,j Rozdělení podílů Uvažujeme přírůstkový trojúhelník ! Rozdělení podílů naznačuje vztah mezi Pi,j a výslednými parametry modelu. Problém vlivu rozptylu (vzorec vpravo). U přírůstkových P horší interpretace podílů. U kumulativních snazší interpretace podílů, stř. hodnota podílu je pseudo Chain-Ladder faktor. S kumulativními ale problém, viz dále.

Hledání vhodného modelu – 1. možnost Začínáme s popsaným „plným“ modelem resp. modelem získaným forward krokovou regresí Použitý přístup: vytvářet podmodely sčítáním sloupců matice CSS = Columns Sum Submodel Pro období se stabilním J vývojem stačí jediný parametr trendu, např. Rozdílné od myšlenky vypouštět nevýznamné parametry původního modelu Cíl: Kompromisní model, který: přijatelně vysvětluje data, ale neobsahuje mnoho parametrů  např. model minimalizující AIC (Akaikeho informační kritérium) Forward kroková regrese: Začínáme s prázdným modelem, spočte se významnost každého parametru zvlášť, postupně se přidávají nejvýznamnější parametry a zkoumá se, které by se daly vypustit, aniž by klesla vysvětlovací schopnost modelu. Skončí se v momentě, kdy se nemůže přidat parametr (příliš nevýznamný), ani ubrat (příliš významný). – „přílišnost“ se posuzuje podle zvolené hladiny. U těchto velkých modelů je problém s interpretací výstupu ! Značení: l (theta) = logaritmicko-věrohodnostní funkce v bodě daném odhadnutými parametry p = počet parametrů modelu N = počet pozorování sigma~2 = odhad rozptylu Y, tj. maximálně věrohodný odhad sigma2 SSE = reziduální součet čtverců = suma ( y_i – x_i b~ )2 ... chyba modelu

Hledání vhodného modelu – 2. možnost Postupujeme „zdola“ od jednoduchých modelů Např. začínáme s modelem: Yi,j = a + b*i + c*j + ei,j V něm se předpokládá, že platí Yi+1,j – Yi,j ~ b, pro každé j a Yi,j+1 – Yi,j ~ c, pro každé i Hledáním „zlomů“ ve vývoji grafů residuí vůči hodnotám i, j a t se pak dá odvodit, mezi jakými okamžiky uvažovat změnu parametru Např. model bude tvaru Yi,j+1 – Yi,j ~ c0 pokud j < j0 a Yi,j+1 – Yi,j ~ c1 jinak. K nalezení vhodného modelu pomůže i znalost okamžiku intervence jakýkoliv vnější vliv – legislativní, ekonomické změny apod. Opět vhodnou mírou kvality výsledného modelu je AIC nebo modifikovaný koeficient determinace a ... absolutní člen zahrnutí trendu t (= i+j) v nejjednodušším modelu by mohla být chyba kvůli vzájemné nahraditelnosti směrů (viz dříve) a způsobilo by multikolinearitu. Modifikovaný R2 1-podíl nestranných odhadů variabilit zbytkové ku totální)

Postup tvorby modelů dle grafů residuí Graf průměrů residuí základního modelu proti zpoždění Zřejmý trend v grafu Růst residuí do 4. období vývoje (model trend podhodnocuje) Pak následuje pokles (model trend nadhodnocuje) Řešení: uvažovat dva parametry pro development trend („zlom“ ve 4. období) V rozšířeném modelu nepozorujeme trendy v residuích zpoždění = development Graf residuí: stadardizované hodnoty, y – osa udává násobky směrodatné odchylky (součet veškerých residuí je 0)

Kumulativní vs. přírůstková data PTF model je možné aplikovat na kumulativní i přírůstková data Zehnwirth (1994, 1998) uvažuje logaritmus přírůstkových dat Nevýhody tohoto přístupu podle ČKP Nulové hodnoty v pozdějších obdobích vývoje nelze logaritmovat Případné nahrazení nulových hodnot „malými hodnotami“ zkresluje model Občas náročné najít model s dobrou vysvětlující schopností Řešení Někdy lze použít logaritmy kumulativních dat (nesmí ale být významná autokorelace residuí) Obtížněji interpretovatelné odhady parametrů a teoretické zdůvodnění modelu Přírůstkové jsou mírně nadhodnocující v následujícím: jestliže je v trojúhelníku číslo „1“, pak v logaritmickém číslo „0“ (typicky přírůstkové na konci), predikce může být blízká „0“ v logaritmovaném, což logaritmovaný bere jako žádný vývoj, ale po odlogaritmování vyjde „1“ – nízký trend => mírné nadhodnocení. Tento problém u kumulativních není, protože nikdy nepredikují hodnotu „0“ – vyjádření nulového trendu je rovno opakování stejné hodnoty! Autokorelace: vysoká korelace reziduí => 1. nelze aplikovat bootstrap, 2. selhává idea, že Y_ij je nezávislé na ostatních Y_lk , což je základní myšlenka PTF modelu (viz dříve). Kumulativní model, pokud nemá významnou autokorelaci reziduí, bývá často méně parametrický a s vyšším koeficientem determinace. Srovnání přírůstkového a kumulativního přístupu pro garanční fond uvedeme dále.

Požadavky na výsledný model Jejich splnění důležité pro adekvátnost bootstrapu (viz dále) Dostatečná vysvětlovací schopnost Při hodnotách R2 < 0,85 narůstá při přechodu na nelogaritmované hodnoty rozdíl mezi střední hodnotou a mediánem (vysoká variabilita) Odstranění systematických složek z grafů residuí Nezamítnutí normality residuí Shapiro – Wilkův test, Normal Probability plot Histogram residuí Nekorelovanost residuí Durbinův – Watsonův test Pozor na multikolinearitu (i + j = t) Shapiro-Wilkův test: simulace se setřídí dle velikosti, měly by odpovídat přímce u(i) = mu + sigma. gi , kde gi je funkcí kvantilu (něco jako i/n, n… poč. pozorování) Normal Probability Plot: osa X: expected normal value (očekávaná normální hodnota), osa Y: reziduals. => výchylky od červené přímky svědčí o nenormalitě dat. Histogram: Normalita reziduí. Sleduje se, zda modré sloupečky (skutečné rezidua) odpovídají červené křivce. Zvláště pak: šikmost, dvouvrcholovost, těžké chvosty Durbin-Watson: test, kde H0: rezidua jsou bílým šumem, H1: rezidua jsou AR(1) proces. Korelovanost reziduí – viz dříve (není možný bootstrap, neodpovídá PTF modelu). Multikolinearita: viz dříve; sloupce matice X jsou skoro lineárně závislé, a proto je (X‘X) skoro singulární, a tedy (X‘X)-1 způsobuje velký rozptyl odhadů. Multikolinearita může být způsobena tím, že nějakou část trojúhelníku pokrývají tři trendy najednou.

Doplnění trojúhelníku na čtverec Výpočet lineárních předpovědí Yi,j včetně predikčních intervalů pro i, j splňující: i+j > T i <= T T je poslední známé kalendářní období Přechod na původní (nelogaritmované) hodnoty Předpokládáme splnění normality v logaritmovaném modelu Použijeme vztah pro střední hodnotu a medián logaritmicko-normálního rozdělení Potřebnou variabilitu odvodíme v logaritmickém tvaru z rozdílu: 97,5% kvantil – stř. hodnota ~ 2* směr. odchylka u0,975 = 1,96 téměř přesně

Zhodnocení implementace PTF metody Metoda je flexibilní Lze jí uplatnit i na trojúhelníky z nejrůznějších důvodů neúplné Z jednou vytvořeného modelu lze někdy vycházet i při další analýze Rozmanité možnosti předpovídání Limitace metody Předpoklad stejného vývoje plateb podle kalendářního období do budoucna (vývoj ve směru payment nemusí být stabilní) Při predikci tail faktoru se uvažuje vývoj daný posledním parametrem i na další období vývoje Softwarová realizace Software ICRFS (vyvinutý jedním z autorů metody Dr. B. Zehnwirthem) automaticky určí „nejlepší“ model a vše ostatní Realizace ČKP (regresní modely vytvářeny manuálně) Regresní část: STATISTICA Simulační část: Excel, Mathematica

Odhady rozdělení předpovědí Z předpovědí k dispozici: Odhad střední hodnoty a kvantilů Zajímá nás: Např. rozdělení součtu v neznámé části čtverce Sice platí, že střední hodnota součtu = součet středních hodnot, ale pro kvantily žádná analogie neplatí Řešení použité ČKP Bootstrap na základě lineárních předpovědí z modelu v logaritmickém tvaru získáme odhad střední hodnoty, směrodatné odchylky (předpokládáme normalitu a také nezávislost) – viz požadavky na regresní model Opakované generování takto určených náhodných veličin a následné součty realizací (součty odlogaritmovaných hodnot)  Získáme empirické rozdělení součtu (plnění, závazku nebo počtu událostí)  Pravděpodobnostní meze např. pro IBNR ( neříkat, pouze pro informaci: ) Problém bootstrapu je závislost Y~ : Var Yb~ = sigma2 ( 1 + xb (X‘X)-1 xb‘ ) , ale pro N -> infinity je (X‘X)-1 -> 0. To je způsobeno tím, že b je konzistentní odhad, címž je dle vlastností regrese (Yb jsou data za diagonálou) . Počítali jsme pouze s Var Yb~ = sigma2, tj pouze rozptyl dat a ne rozptyl modelu (jinak by bootstrap nebyl realizovatelný – šlo by o součet závislých veličin).

Aplikace PTF metody a simulací v ČKP Odhady IBNR Garančního fondu ČKP Nezjištění Nepojištění Problém Neznámá velikost „kmene“ těchto motoristů Stálý nárůst počtu událostí i objemů způsobených škod Analýzy IBNR členských pojišťoven Analýzy agregované IBNR celého trhu Ve všech případech poskytl vhodně zvolený PTF model velmi dobré výsledky

Aplikace PTF pro GF ČKP – „nepojištění“ Analýza pomocí objemů škod nedala přijatelné výsledky Nízké R2 (pouze cca. 72%)  přes splnění normality residuí predikce nepoužitelné v praxi Nerealisticky široký predikční interval po odlogaritmování Možné řešení Přechod k analýze počtu pojistných událostí pomocí PTF R2 výsledného modelu 89% Regresní diagnostika neindikuje nesplnění předpokladů Odhad celkového plnění a IBNR proveden pomocí vývoje průměrné PU Následuje postup hledání modelu pro kumulativní data počtů událostí o nepojištěných a porovnání s modelem pro přírůstková data.

Příklad tvorby modelu Porovnání výsledků modelu z kumulativních i přírůstkových dat Tvorba kumulativního modelu Odhadnutí okamžiků změny vývoje  Grafy logaritmovaných hodnot vůči směrům Pro nepojištěné řidiče, počty událostí. Protože vždy jeden parametr je nahraditelný zbylými dvěma, volili jsme zatím pouze parametry pro accident a development trend. Accident – stabilní růst do 10. období, pak pokles Development – zlom vývoje ve 3. období Payment – stabilní růst

Formulace kumulativního modelu Odhady parametrů Obdobným postupem hledání zlomů v grafech residuí jsme odvodili podrobnější model: Jde o první model; má nízké R2 a rezidua jsou s trendy. Stále systematický vývoj v grafech residuí  např. zřejmý zlom ve vývoji residuí podle roku vzniku

Hledání modelu - pokračování Nakonec formulován model se šesti parametry Ten byl následně zredukován o nevýznamné parametry Byl přidán parametr popisující payment trend. Výsledky konečného modelu včetně grafů vývoje residuí: Model se šesti parametry byl již přeparametrizován, byť měl dobré R2 a dobrá rezidua. Zubatost u accident (viz graf) je dána sezónností dat … (neříkat).

Srovnání výsledků obou přístupů Kumulativní Součet predikcí: 22 520 Součet diagonály 15 925  Očekávaný přírůstek 6 595 R2 = 0,935 DW = 1,08  corr = 0,454 (!) Normalita: Přírůstkový Součet predikcí: 19 025 Součet diagonály 15 925  Očekávaný přírůstek 3 100 R2 = 0,886 DW=1,68  corr = 0,157 Normalita: Jak již bylo řečeno, vysoká korela reziduí (autokorelace) způsobuje jednak nemožnost použít boostrap a druhak selhává idea, že Y_ij je nezávislé na ostatních Y_lk , což je základní mylšenka PTF modelu. kumulativní data: Nicméně jsou případy, kdy autokorela reziduí vyšla mizivá a v těchto případěch jsme kumulativní data použili – například analýza dat členů a celého trohu POV. zde, pro GF nepojištěné řidiče, byl z výše uvedených důvodů ovšem použit přírůstkový model. Na základě těchto výsledků jsme se rozhodli pro přírůstkový model. (Nicméně v jiných případech byl kumulativní použitelný)

Další simulační technika Vyvinuta firmou Deloitte Rozšiřuje možnosti softwaru na výpočet rezerv Cros Poskytuje podobné informace o empirickém rozdělení jako bootstrap používaný ČKP

Stručný popis techniky Vychází z projekcí získaných SW Cros: Standardní Chain Ladder Vyhlazení vývojových faktorů různými křivkami Bornhuetter – Fergusonova metoda Kredibilitní přístup… Vlastní simulace v Excelu (odvolává se na struktury Crosu) Myšlenka generování scénářů Náhodné prohazování vypočtených residuí a nové výpočty projekcí

Doplnění trojúhelníku na čtverec Princip simulací Doplnění trojúhelníku na čtverec Zpětné určení vyhlazených hodnot ve známé části trojúhelníku Protažení vývojovými faktory od diagonálních hodnot nazpátek Přechod od kumulativních hodnot na přírůstková data U původních i zpětně vyhlazených trojúhelníků Výpočet residuí Odečtením přírůstkových trojúhelníků pozorovaných a očekávaných hodnot

Použitá standardizace residuí Uvažují se standardizovaná residua Snaha o zdůvodnění Uvedený postup smysluplný, pokud je rozptyl přímo úměrný stř. hodnotě To se sice předpokládá (se zpožděním) u ELRF modelu, ale pro kumulativní data Yi,j Regresní model Y i,j+1=bj*Yi,j+ei,j+1, Var(ei,j+1)=2(Yi,j+1) (*) je ekvivalentní SCL a také var(Y i,j+1| Yi,j)= 2(Yi,j) Teď se předpokládá přímá úměra pro přírůstková data Xi,j+1=Yi,j+1 – Yi,j Odvození Var(Xi,j+1| Y i,j) za platnosti modelu (*) Standardizace residuí má smysl, aby byl konstantní rozptyl, ale není jasné, jak má uvedený předpoklad přémé úměry na přírůstkových datech smysl.

Zhodnocení uvažované standardizace Odvodili jsme: Standardizace by byla v pořádku, pokud: Nepodařilo se najít zdůvodnění použitého přístupu standardizace V dodaných materiálech žádná interpretace standardizace residuí nebyla uvedena.

Další postup – prohazování residuí Trojúhelník možno rozdělit na několik oblastí Residua jsou pak prohazována uvnitř daných oblastí Tím vytvářeny „nové“ průběhy vývojového trojúhelníku  nový výpočet vývojových faktorů  pomocí nich protažen původní trojúhelník  zahrnutí případného tail faktoru  scénáře ultimates  opakováním empirické rozdělení ultimates

Otevřené otázky a problémy Jak volit uzavřené oblasti s odděleným prohazováním dat? Věcná interpretace rozdělení trojúhelníku na oblasti je obtížná Snaha, aby uvnitř oblastí byly splněny předpoklady o shodných rozptylech residuí Problém s určením oblastí pro oddělené prohazování residuí Rozdělení residuí v rámci oblastí Nejsou nutné žádné apriorní předpoklady o jejich rozdělení Předpokládá se Uvnitř každé oblasti residua nezávislá Namísto generování z odhadnuté distribuce prohazování empirických residuí „Prohazování“ probíhá s vracením (možnost opakování stejných residuí)  Postup obtížně interpretovatelný (zvláště při malé velikosti oblastí) Např. by k určení stabilních oblastí mohlo pomoci PTF (regresní model na incrementál. datech), ale pokud se předem neprovádělo PTFko, je problém určit stabilní oblasti na rozdělení trojúhelníku. PTF se v celé proceduře neuvažuje. Empirické rozdělení reziduí (odpovídající ideji prohazování) se může dost lišit od skutečného spojitého rozdělení reziduí v každé oblasti

Numerické srovnání prezentovaných metod Předpovědi IBNR nepojištěných Standard Chain Ladder (SCL) = 100% Intervalové odhady PTF 1 nepoužitelné (Model vycházející z výše škod) Model PTF 2 dává přijatelné výsledky intervalového odhadu (Přírůstkový model počtu pojistných událostí) MCL kvůli nesplnění předpokladu závislosti IBNR nerealisticky podceňuje Následuje grafické srovnání

Grafické porovnání výsledků metod

Použité prameny Zehnwirth: Probabilistic Development Factor Models with Applications to Loss Reserves Variability, Prediction Intervals and Risk Based Capital, 1994 Barnett, Zehnwirth: Best Estimes for Reserves, 1998 Mack: Distribution–free Calculation of the Standard Error of Chain Ladder Reserve Estimates, 1993 Quarg, Mack: Munich Chain Ladder, 2004 Cros manual

Děkujeme za pozornost