Estimaciones de los parámetros y la cola de una distribución · 2017-06-05 · •La inflación...
Transcript of Estimaciones de los parámetros y la cola de una distribución · 2017-06-05 · •La inflación...
Estimaciones de los
parámetros y la cola de una
distribución
Actuaries Collaborating TogetherColegio Actuarial Mexicano, A.C.
Chicago, Illinois1 Junio 2017
Alejandro Ortega, FCAS, CFA
2
Usos del método
• Para medir Capital Económico, y Capital
Regulatorio (Solvencia II)
• Comparar Planes de Reaseguro
• También para consultoría con: un cliente, una
cartera, o una empresa entera
• Estimar la Distribución de Siniestros para 2016
• Embrechts, Paul – Teoría de valores extremos
3
Datos
• Fecha de Análisis – 13 noviembre 2015
• Primas: 2010 – 2014
• Siniestros: 2010 – 2014
• Fecha de Datos: 30 Sep 2015
• ¿Por qué no usamos los siniestros de 2015?
4
Resumen de Siniestralidad
AñoNúmero de Siniestros Monto Pagado
2010 330 3,057,507
2011 312 3,177,057
2012 256 2,849,844
2013 272 3,571,991
2014 367 4,680,122
5
Resumen de la Información
Supuestos
• Tamaño de la cartera no ha cambiado
• En general, se calcula la frecuencia de siniestros
• La inflación es cero – 0%
• En general, se necesita ajustar los datos históricos
• Con una cartera grande se puede estimar la inflación
(tendencia)
• Información del mercado o inflación general
6
Resumen de Datos
Monto Pagado
1,000
2,000
3,000
4,000
5,000
2010 2011 2012 2013 2014
Amount Paid
7
Resumen de Datos
Número de Siniestros
0
100
200
300
400
Number of Claims
8
AñoNúmero de
SiniestrosMonto Pagado Severidad
2010 330 3,057,507 9,265
2011 312 3,177,057 10,183
2012 256 2,849,844 11,132
2013 272 3,571,991 13,132
2014 367 4,680,122 12,752
• En aparencia la Severidad está aumentando
• Aspectos de Siniestralidad y Suscripción
Resumen de Datos
9
Resumen de Datos
Número de Siniestros (Trimestrales)
Media 77 Mediana 77 Mín. 49 Máx. 114 Desv Est. 15
• No se nota una tendencia
• Hacemos el supuesto que los expuestos no estan cambiando
0
20
40
60
80
100
120
2010Q1 2011Q1 2012Q1 2013Q1 2014Q1
Number of Claims
Claims Mean
10
Resumen de Datos
Número de Siniestros (Trimestrales)
Media 77 Mediana 77 Mín. 49 Máx. 114 Des Est. 15
• Promedios móviles son utiles para buscar tendencias
• Se usa un periodo anuales para minimizar estacionalidad
0
20
40
60
80
100
120
2010Q1 2011Q1 2012Q1 2013Q1 2014Q1
Number of Claims
Claims Mean Rolling 8
11
Pasos
• Estimar la Distribución de Frecuencia
• En general, estimar frecuencia y aplicar a
los expuestos pronosticados
• Estimar la Distribución de Severidad
• Primero la Panza
• Después la Cola
12
Distribuciónes de Frecuencia
• Binomial
• Poisson
• Over Dispersed Poisson
• Binomial Negativa
Parámeteros de Frecuencia
13
Parámeteros elegidos
37
0.68
Datos Actuales
Media 76.9
Desviaciónestándar
15.4
Binomial Negativa
Parámeteros de Frecuencia
14
Parámetros elegidos
37
0.68
Estimado
Media 77.3
Desviaciónestándar
15.5
Datos Actuales
Media 76.9
Desviaciónestándar
15.4
15
Frecuencia Simulación 1
0
40
80
120
2010Q1 2011Q1 2012Q1 2013Q1 2014Q1
Actual Claims Simulated Negative Binomial
16
Frecuencia Simulación 2
0
40
80
120
2010Q1 2011Q1 2012Q1 2013Q1 2014Q1
Actual Claims Simulated Negative Binomial
17
Frecuencia Simulación 3
0
40
80
120
2010Q1 2011Q1 2012Q1 2013Q1 2014Q1
Actual Claims Simulated Negative Binomial
18
Frecuencia Simulación 4
0
40
80
120
2010Q1 2011Q1 2012Q1 2013Q1 2014Q1
Actual Claims Simulated Negative Binomial
19
Pasos
• Estimar la Distribución de Frecuencia
• En general, estimar frecuencia y aplicar a
los expuestos pronosticados
• Estimar la Distribución de Severidad
• Primero la Panza
• Después la Cola
20
Distribuciones de Severidad
• Normal
• Exponencial
• LogNormal
• Weibull
• Gamma
• Pareto
Datos - Severidad
21
Número de Siniestros Trimestre
Monto Pagado
MontoPagado con Tendencia
1 2010Q1 14,101 14,101 2 2010Q1 1,824 1,824 3 2010Q1 688 688
… … ... …1534 2014Q4 25 25 1535 2014Q4 32,574 32,574 1536 2014Q4 15,380 15,380 1537 2014Q4 1,016 1,016
Datos - Severidad
Siniestros Grandes
22
Número de Siniestros Trimestre
Monto Pagado
1305 2014Q2 126,434
415 2011Q1 135,387
1392 2014Q3 149,925
1055 2013Q3 153,900
1423 2014Q3 166,335
225 2010Q3 181,881
1381 2014Q3 254,864
1310 2014Q2 510,060
23
Parámeteros - Severidad
• Estimación de Parámetros
• Estimación de Máxima Verosimilitud
• Util preparar un gráfico con la
Distribución de los siniestros y la
Distribución estimada
• El gráfico confirma que la
distribución elegida se ajusta los datos
0%
20%
40%
60%
80%
100%
- 100,000 200,000 300,000 400,000 500,000 600,000
Empirical F(y) Fit F(y)
24
Distribución Estimada con Máxima Verosimilitud
Distribución Estimada y
Distribución Empírica
Weibull Fit
𝐹 𝑦 = 1 − 𝑒−
𝑦𝜃
𝜔
𝜃 = 5,600𝜔 = .49
0%
20%
40%
60%
80%
100%
1 8 64 512 4,096 32,768 262,144
Empirical S(y) Fit S(y)
25
Distribución Estimada con Máxima Verosimilitud
Supervivencia vs Log de Siniestros
No es importante que se
ajuste para siniestros
pequeños.
Weibull Fit
𝐹 𝑥 = 1 − 𝑒−
𝑥𝜃
𝜔
𝜃 = 5,600𝜔 = .49
0.01%0.02%0.03%0.06%0.13%0.25%0.50%1.00%2.00%4.00%8.00%
16.00%
10,000 80,000 640,000
Empirical S(y) Fit S(y)
26
Distribución Estimada con Máxima Verosimilitud
Log Supervivencia vs Log de Siniestros
Weibull Fit
𝐹 𝑥 = 1 − 𝑒−
𝑥𝜃
𝜔
𝜃 = 5,600𝜔 = .49
Es dificil encontrar un a distribución
que pueda modelar la panza y la cola
a la vez, en particular para
distribuciones con cola larga
Es Importante la Cola?
No es impartante para:
Sinestralidad Esperada
Eventos de 1-en-5 años
Sí es importante para:
Asignación de Capital
Reaseguro
Estadisticas de la cola - 𝑉𝑎𝑅98%
27
28
Pasos
• Estimar la Distribución de Frecuencia
• En general, estimar frecuencia y aplicar a
los expuestos pronosticados
• Estimar la Distribución de Severidad
• Primero la Panza
• Después la Cola
Esperanza condicional de la
Siniestralidad mayor a la media
Para todos los siniestros más grandes que
𝑢; calculamos la media que sobrepasa a
𝑢.
𝐸 𝑌 − 𝑢 𝑌 > 𝑢
• Por qualquier 𝑢
Cuando esta medida aumenta, con
respeto a 𝑢, tenemos una distribución con
cola larga29
Esperanza condicional de la
Siniestralidad mayor a la media -
Normal
30
93
-
250
500
- 500 1,000 1,500 2,000u
Excess Mean Normal
Esperanza condicional de la
Siniestralidad mayor a la media-
Exponencial
31
200
-
250
500
- 500 1,000 1,500 2,000u
Excess Mean Exponential
Esperanza condicional de la
Siniestralidad mayor a la media-
Weibull
32
454
-
500
1,000
1,500
2,000
- 500 1,000 1,500 2,000u
Excess Mean Weibull
Esperanza condicional de la
Siniestralidad mayor a la media-
LogNormal
33
622
-
500
1,000
1,500
2,000
- 500 1,000 1,500 2,000u
Excess Mean Lognormal
Esperanza condicional de la
Siniestralidad mayor a la media-
Pareto
34
832
-
500
1,000
1,500
2,000
0 500 1000 1500 2000u
Excess Mean Pareto
Datos - Severidad
Siniestros Grandes (de 1,537 siniestros)
35
Siniestro TrimestreMonto Pagado
1305 2014Q2 126,434
415 2011Q1 135,387
1392 2014Q3 149,925
1055 2013Q3 153,900
1423 2014Q3 166,335
225 2010Q3 181,881
1381 2014Q3 254,864
1310 2014Q2 510,060
Esperanza condicional de la Siniestralidad
mayor a la media (empírico)
36
-
50
100
150
- 50 100 150
Tho
usa
nd
s
uThousands
Esperanza condicional de la
Siniestralidad mayor a la media
(empírico)
37
-
100
200
300
400
500
600
- 50 100 150 200 250 300 350 400 450 500 550 600
Tho
usa
nd
s
uThousands
El gráfico tiene escalones, pero
observe los últimos 10-20
siniestros
El décimo
siniestro es de
122,399
Cambio en Precio de ActivosEsperanza condicional de la Siniestralidad mayor a la media
38
0%
2%
4%
6%
8%
10%
0% 2% 4% 6% 8% 10%
Negative Daily Return
Excess MeanATVI
0%
2%
4%
6%
8%
10%
0% 2% 4% 6% 8% 10%
Negative Daily Return
Excess MeanAIG
Cola Larga
Embrechts:
Una Distribución con Cola Larga
En el Límite es una distribución Pareto
39
El parámetro 𝜉 (Xi) controla el tamaño de la cola
0.5 < 𝜉 Varianza no existe
1 < 𝜉 Media no existe
Cola Larga
40
Puede llegar hastas:
1 < 𝜉 < 2 Seguros
2 < 𝜉 < 5 Financia (activos,
opciones)
Embrechts:
Una Distribución con Cola Larga
En el Límite es una distribución Pareto
Implementación usando Pareto
Elige un percentil 𝑝 donde empieza la cola
Estima el valor de 𝑢 para el percentil 𝑝𝐹 𝑢 = 𝑝
Modelamos el siniestro 𝑦, usando 𝑥 > 0𝑦 = 𝑥 + 𝑢
Modelamos 𝑥, el monto del siniestro que
excede a 𝑢
41
Distribución Pareto
𝐹𝑢 𝑥 = 1 − 1 +𝜉𝑥
𝛽
−1𝜉
𝑆𝑢 𝑥 = 1 +𝜉𝑥
𝛽
−1𝜉
42
Distribución Pareto
𝑆 𝑦 = 𝑆 𝑢 ⋅ 𝑆𝑢(𝑥)
𝑆 𝑦 = 𝑆 𝑢 ⋅ 1 +𝜉𝑥
𝛽
−1𝜉
𝑦 = 𝑥 + 𝑢
43
0.031%
0.063%
0.125%
0.250%
0.500%
1.000%
2.000%
4.000%
8.001%
16.001%
10,000 80,000 640,000
Empirical Log Log Scale
Supervivencia – Log Log
44
𝑆 𝑥 = 1 − 𝐹(𝑥)
Busca el punto de inflexión
La cola de un Pareto es una línea en un gráfico log log
Supervivencia – Log Log Scale
45
0.031%
0.063%
0.125%
0.250%
0.500%
1.000%
2.000%
4.000%
8.001%
40,000 320,000
Empirical Log Log Scale𝑆 𝑥 = 1 − 𝐹(𝑥)
La cola de un Pareto es una línea en un gráfico log log
Supervivencia – Log Log
46
0.031%
0.063%
0.125%
0.250%
0.500%
1.000%
2.000%
4.000%
8.001%
40,000 320,000
Empirical Log Log Scale
La cola de un Pareto es una línea en un gráfico log log
0.031%
0.063%
0.125%
0.250%
0.500%
1.000%
2.000%
4.000%
8.001%
40,000 320,000
Empirical Log Log Scale
Supervivencia – Log Log
47No se debe elegir la lina nomas mirando a los ultimos puntos
La cola de un Pareto es una línea en un gráfico log log
Elegir Parameteros - Severidad
𝑝 = 𝐹 𝑢 = 95.00%
𝑢 = 48,900
𝑆 𝑢 = 5.00%
Se puede elegir otro percentil 𝑝 (o 𝑢) y
revisar si los resultados son similares
𝑢 debe ser apropiada en la cola
También para tener certeza en 𝐹(𝑢), queremos tener varios siniestros más
grande que 𝑢
48
Elegir 𝑢, estimar 𝐹(𝑢)
49
MontoEmpírico
𝐹(𝑥)
47,993 94.928%
48,896 94.993%
48,900 95.000%
49,274 95.059%
49,302 95.124%
𝐹 𝑦 =𝑟𝑎𝑛𝑔𝑜
𝒏 + 𝟏𝑛 =Número de Siniestros
Selección de Parámetros
Parámetros elegidos
50
𝑢 = 48,900
𝑆 𝑢 = 5.00%
0.00%0.00%0.00%0.01%0.02%0.03%0.06%0.13%0.25%0.50%1.00%2.00%4.00%8.00%
15,000 120,000 960,000
Fit S(y)
Empirical S(y)
0.34
24,600
Empirical Log Log Scale
0.03%
0.06%
0.13%
0.25%
0.50%
1.00%
2.00%
4.00%
8.00%
15,000 120,000 960,000
0.34
24,600
Empirical Log Log Scale
𝜉 más pequeña
La cola es más delgada51
𝑢 = 48,900
𝑆 𝑢 = 5.00%
0.00%0.00%0.00%0.01%0.02%0.03%0.06%0.13%0.25%0.50%1.00%2.00%4.00%8.00%
15,000 120,000 960,000
Fit S(y)
Empirical S(y)
0.34
24,600
Empirical Log Log Scale
0.03%
0.06%
0.13%
0.25%
0.50%
1.00%
2.00%
4.00%
8.00%
15,000 120,000 960,000
0.25
22,800
Empirical Log Log Scale
𝜉 más grande
La cola es más gruesa52
𝑢 = 48,900
𝑆 𝑢 = 5.00%
0.00%0.00%0.00%0.01%0.02%0.03%0.06%0.13%0.25%0.50%1.00%2.00%4.00%8.00%
15,000 120,000 960,000
Fit S(y)
Empirical S(y)
0.34
24,600
Empirical Log Log Scale
0.03%
0.06%
0.13%
0.25%
0.50%
1.00%
2.00%
4.00%
8.00%
15,000 120,000 960,000
0.45
22,800
Empirical Log Log Scale
𝜉 más grande
La cola es más gruesa53
𝑢 = 48,900
𝑆 𝑢 = 5.00%
0.00%0.00%0.00%0.01%0.02%0.03%0.06%0.13%0.25%0.50%1.00%2.00%4.00%8.00%
15,000 120,000 960,000
Fit S(y)
Empirical S(y)
0.34
24,600
Empirical Log Log Scale
0.03%
0.06%
0.13%
0.25%
0.50%
1.00%
2.00%
4.00%
8.00%
15,000 120,000 960,000
0.60
21,000
Empirical Log Log Scale
Selección Final de Parámetros
293,000 es el monto estimado
54
0.03%
0.06%
0.13%
0.25%
0.50%
1.00%
2.00%
4.00%
8.00%
15,000 120,000 960,000
0.34
24,600
Empirical Log Log Scale𝑢 = 48,900
𝑆 𝑢 = 5.00%
Selección de Parametros
Estimamos la distribución de la panza
• Hasta el 95.0%
En la cola usamos Pareto con los siguentes
parámetros:
• 𝑢 = 48,900
• 𝐹 𝑢 = 95.00%
• 𝜉 = 0.34
• 𝛽 = 24,600
55
Beneficios
Fundamentada por la teoria
Forma limpia de juntar las distribuciones
Fácil de implementar
Usos:
– Reaseguro
– Cuentas Grandes
– Capital
56
57
Pasos
• Estimar la Distribución de Frecuencia
• En general, estimar frecuencia y aplicar a
los expuestos pronosticados
• Estimar la Distribución de Severidad
• Primero la Panza
• Después la Cola
Supuestos
Cartera es Homogénea
• Casas, Departamentos
Base de Expuestos
• Autos, Casas, Ventas
Ajuste inflacionario (tendencia)
• Inflación del mercardo
Riesgo del Modelo
• Expuestos, Inflación
58
Thank You