DEFINICION. Una serie de tiempo es un conjunto de datos numéricos que se obtienen en periodos...

20

Transcript of DEFINICION. Una serie de tiempo es un conjunto de datos numéricos que se obtienen en periodos...

Page 1: DEFINICION. Una serie de tiempo es un conjunto de datos numéricos que se obtienen en periodos regulares a través del tiempo. La unidad de tiempo puede.
Page 2: DEFINICION. Una serie de tiempo es un conjunto de datos numéricos que se obtienen en periodos regulares a través del tiempo. La unidad de tiempo puede.

DEFINICION. Una serie de tiempo es un conjunto de datos numéricos

que se obtienen en periodos regulares a través del tiempo. La unidad de tiempo puede ser: Hora, día, mes, trimestre, año o cualquier periodo que se pueda considerar de interés.

OBJETIVO.Identificar y aislar los factores de influencia con propósitos de hacer predicciones (pronósticos), y prevenir “brotes” o “epidemias”.

Material preparado por:

Profesor León Darío Bello Parias

Estudio Secretaría Distrital de Santa Fé de Bogotá año 2002[1] [1] Realizado por Grisales R, Hugo. Bello P, León Darío., Hincapié Doraceli.

Page 3: DEFINICION. Una serie de tiempo es un conjunto de datos numéricos que se obtienen en periodos regulares a través del tiempo. La unidad de tiempo puede.

Con el análisis de series temporales se pretende extraer

el patrón de comportamiento sistemático contenido en

una sucesión de observaciones que se recoge de forma

regular y homogénea a lo largo del tiempo. Con este

patrón es posible: a) caracterizar el comportamiento del

fenómeno estudiado; b) predecir su evolución futura; y c)

extraer componentes no observables (señales) que

reflejan más fielmente la evolución subyacente de la

variable de interés. Preparado por: León Dario Bello

Page 4: DEFINICION. Una serie de tiempo es un conjunto de datos numéricos que se obtienen en periodos regulares a través del tiempo. La unidad de tiempo puede.

Número de Casos Acumulados de Tosferina Periodo 13 (Antioquia 1994-2001)

0

100

200

300

400

500

600

1994 1995 1996 1997 1998 1999 2000 2001

Año

Cas

os

Tasas Acumulada por 100.000 habitantes de Tosferina Perioido 13 (Antioquia 1994-2001)

0.0

2.0

4.0

6.0

8.0

10.0

12.0

1994 1995 1996 1997 1998 1999 2000 2001

Años

Tasa

s * 1

00.0

00

http://www.col.ops-oms.org/iah/lisnalsds.htm

Page 5: DEFINICION. Una serie de tiempo es un conjunto de datos numéricos que se obtienen en periodos regulares a través del tiempo. La unidad de tiempo puede.

Número de Casos Acumulados de Rubeola Periodo 13 (Antioquia 1994-2001)

0

1000

2000

3000

4000

5000

6000

1994 1995 1996 1997 1998 1999 2000 2001

Años

Cas

os

Tasas Acumuladas por 100.000 habitantes de Rubeola Periodo 13 (Antioquia 1994-2001)

0.0

20.0

40.0

60.0

80.0

100.0

120.0

1994 1995 1996 1997 1998 1999 2000 2001

Años

Tasa

s *

100.

000

Page 6: DEFINICION. Una serie de tiempo es un conjunto de datos numéricos que se obtienen en periodos regulares a través del tiempo. La unidad de tiempo puede.

Número de Casos Acumulados de HIV/Sida Periodo 13 (Antioquia 1992-2001)

0

100

200

300

400

500

600

700

800

1992 1993 1994 1995 1996 1997 1998 1999 2000 2001

Tasas Acumuladas por 100.000 habitantes de VIH/Sida Periodo 13 (Antioquia 1992-2001)

0.0

2.0

4.0

6.0

8.0

10.0

12.0

14.0

1992 1993 1994 1995 1996 1997 1998 1999 2000 2001

AñosTa

sas

* 10

0.00

0

FUENTE: SIS 12 , REGISTROS DE PROGRAMA, Y SIVIGILA * CERTIFICADOS DE DEFUNCIÓN DANE( SISTEMAS)http://www.dssa.gov.co/infecc/infecciosas.htm

Page 7: DEFINICION. Una serie de tiempo es un conjunto de datos numéricos que se obtienen en periodos regulares a través del tiempo. La unidad de tiempo puede.

Consideraciones Previas

Consistencia: Mecanismos de notificación, los cuales pueden cambiar la forma de captura de la información.

Comparabilidad: cambios que se originan a través del tiempo.

Preparado por: León Dario Bello

Page 8: DEFINICION. Una serie de tiempo es un conjunto de datos numéricos que se obtienen en periodos regulares a través del tiempo. La unidad de tiempo puede.

COMPONENTES DE UNA SERIE Tendencia: Movimientos percistentes

ascendentes o descendentes a través del tiempo. Variaciones estacionales. Fluctuaciones

periódicas en periodos de tiempo cuya frecuencia es menor a un año, aproximadamente en las mismas fechas y casi con la misma intensidad.

Movimientos o variaciones cíclicas.

Los movimientos se consideran cíclicos, solo si se producen en un intervalo de tiempo superior al año.

Movimientos irregulares o al azar. movimientos esporádicos o de corto plazo.Material preparado por:

Profesor León Darío Bello Parias

Page 9: DEFINICION. Una serie de tiempo es un conjunto de datos numéricos que se obtienen en periodos regulares a través del tiempo. La unidad de tiempo puede.

PASOS EN EL ANALISIS CLASICO DE UNA SERIE DE TIEMPO.

 1. DETERMINAR SI LA SECUENCIA DE DATOS

FORMAN UNA SERIE NO ALEATORIA.2. ANALISIS EXPLORATORIO DE DATOS. 3.SUAVIZAR LA SERIE para identificar el

comportamiento subyacente de la misma.4. DESCOMPONER LA SERIE en sus respectivas

componentes.5.  AJUSTE DE MODELOS MATEMATICOS.6. ANALISIS DE RESIDUALES7. REALIZAR ESTIMACIONES Y PRONOSTICOS.8. VALIDAR EL MODELO Material preparado por:

Profesor León Darío Bello Parias

Page 10: DEFINICION. Una serie de tiempo es un conjunto de datos numéricos que se obtienen en periodos regulares a través del tiempo. La unidad de tiempo puede.

Desarrollo de los Pasos

1. Realmente es una serie no aleatoria: Rachas

2. Análisis exploratorio de datos: -Gráfico de secuencias.   Gráfico de Caja y Sesgo. - Cálculo de estadísticas descriptivas.3. Identificación de las componentes de la serie:

YEAR, not periodic

1999

1998

1998

1997

1996

1996

1995

1994

1994

1993

1992

1992

1991

1990

1990

1989

1988

1988

me

ro

d

e C

aso

s

140

120

100

80

60

40

20

Serie IRA la cual contiene número de casos reportados en Santa Fé de Bogotá desde enero de 1988 hasta diciembre de 1999

Preparado por: León Dario Bello

Page 11: DEFINICION. Una serie de tiempo es un conjunto de datos numéricos que se obtienen en periodos regulares a través del tiempo. La unidad de tiempo puede.

Desarrollo de los Pasos

4. Descomponer la serie.

Preparado por: León Dario Bello

Prueba de homogeneidad de varianzas

Número de Casos

1.009 11 132 .442

Estadísticode Levene gl1 gl2 Sig.

ANOVA

Número de Casos

11507.243 11 1046.113 5.408 .000

25532.083 132 193.425

37039.326 143

Inter-grupos

Intra-grupos

Total

Suma decuadrados gl

Mediacuadrática F Sig.

Prueba de homogeneidad de varianzas

Número de Casos

1.242 11 132 .266

Estadísticode Levene gl1 gl2 Sig.

ANOVA

Número de Casos

8462.910 11 769.355 3.554 .000

28576.417 132 216.488

37039.326 143

Inter-grupos

Intra-grupos

Total

Suma decuadrados gl

Mediacuadrática F Sig.

Diferencia de Medias por año. Diferencia de Medias por mes.Hay Tendencia Hay Estacionalidad

MONTH, period 12

121110987654321

Me

dia

de

me

ro d

e C

aso

s

100

90

80

70

60

50

YEAR, not periodic

199919981997199619951994199319921991199019891988

Me

dia

de

me

ro d

e C

aso

s

100

90

80

70

60

Page 12: DEFINICION. Una serie de tiempo es un conjunto de datos numéricos que se obtienen en periodos regulares a través del tiempo. La unidad de tiempo puede.

Desarrollo de los Pasos

Modelo de Winter, se realizó el análisis de residuos.Prueba de rachas

-.3225664

72

72

144

62

-1.840

.066

Valor de pruebaa

Casos < Valor de prueba

Casos >= Valor deprueba

Casos en total

Número de rachas

Z

Sig. asintót. (bilateral)

Error forCASOS fromEXSMOOTH,MOD_6 WI A.20 G .00 D

.00

Medianaa.

Prueba de Kolmogorov-Smirnov para una muestra

144

-.1041087

11.7830248

.035

.035

-.033

.425

.994

N

Media

Desviación típica

Parámetros normales a,b

Absoluta

Positiva

Negativa

Diferencias másextremas

Z de Kolmogorov-Smirnov

Sig. asintót. (bilateral)

Error forCASOS fromEXSMOOTH,MOD_6 WI A.20 G .00 D

.00

La distribución de contraste es la Normal.a.

Se han calculado a partir de los datos.b.

YEAR, not periodic

140

120

100

80

60

40

20

Número de Casos

Fit for CASOS from E

XSMOOTH, MOD_6 WI A

Preparado por: León Dario Bello

Page 13: DEFINICION. Una serie de tiempo es un conjunto de datos numéricos que se obtienen en periodos regulares a través del tiempo. La unidad de tiempo puede.

Gráfico de Pronosticos

YEAR, not periodic

2000

2000

1999

1998

1998

1997

1996

1996

1995

1994

1994

1993

1992

1992

1991

1990

1990

1989

1988

1988

140

120

100

80

60

40

20

Número de Casos

Fit for CASOS from A

RIMA, MOD_16 NOCON

El conocimiento del área específica será de gran ayuda para seleccionar modelo adecuado. el participante puede comparando los errores absolutos de otros modelos y realizando las pruebas de residuales, encontrar otros modelos validos.

Preparado por: León Dario Bello

Page 14: DEFINICION. Una serie de tiempo es un conjunto de datos numéricos que se obtienen en periodos regulares a través del tiempo. La unidad de tiempo puede.

Fecha

JUN 1999

JUL 1998

AUG 1997

SEP 1996

OCT 1995

NOV 1994

DEC 1993

JAN 1993

FEB 1992

MAR 1991

APR 1990

MAY 1989

JUN 1988

JUL 1987

AUG 1986

SEP 1985

OCT 1984

NOV 1983

DEC 1982

JAN 1982

120

100

80

60

40

20

0

HOMBRE

LINT(HOMBRE)

Fecha

140

120

100

80

60

40

20

0

HOMBRE

MUJER

TOTAL

MORTALIDAD POR ACCIDENTE EN BOGOTÁ ENERO 1995 – OCTUBRE

1999

Estimar valores perdidos.Identificar componentes de la serieNo existencia de tendencia ni estacionalidad, ajustar suavización simpleExiste tendencia sin estacionalidad, ajustar HoltExiste tendencia y estacionalidad, ajustar WinterAjustar modelos mínimo cuadrátricos y comparar SCEValidar supuestos de los residualesCalcular los pronósticos.

Preparado por: León Dario Bello

Page 15: DEFINICION. Una serie de tiempo es un conjunto de datos numéricos que se obtienen en periodos regulares a través del tiempo. La unidad de tiempo puede.

MODELOS AUTORREGRESIVOS Y DE PROMEDIOS MOVILES

Box y Jenkins Conceptos básicos

Proceso estocástico: llamamos proceso estocástico a una sucesión de variables aleatorias {Yt} donde t= -.....-1, 0 , 1, 2 , .......

Estacionariedad:Puede ser estacionario en medias y/o en varianzas (no cambios)

Ruido Blando (White noice):se llama ruido blanco a una sucesión de variables aleatorias con esperanza cero, igual varianza e independientes en el tiempo

Paseo aleatorio: llamamos paseo aleatorio a un proceso estocástico {Yt} cuyas primeras diferencias forman un proceso ruido blanco

Preparado por: León Dario Bello

Page 16: DEFINICION. Una serie de tiempo es un conjunto de datos numéricos que se obtienen en periodos regulares a través del tiempo. La unidad de tiempo puede.

MODELOS AUTORREGRESIVOS Y DE PROMEDIOS MOVILES

Estacionariedad en medias hace referencia a que no tenga tendencia, estacionariedad en varianzas a que se tenga varianzas iguales, supuestos que se validaron anteriormente funciones de Autocorrelación y Autocorrelación Parcial son claves para éste análisis.

Número de Casos

Nº de retardos

16

15

14

13

12

11

10

9

8

7

6

5

4

3

2

1

AC

F

1.0

.5

0.0

-.5

-1.0

Límites confidencial

es

Coeficiente

Número de Casos

Nº de retardos

16

15

14

13

12

11

10

9

8

7

6

5

4

3

2

1

AC

F p

arci

al

1.0

.5

0.0

-.5

-1.0

Límites confidencial

es

Coeficiente

Preparado por: León Dario Bello

Page 17: DEFINICION. Una serie de tiempo es un conjunto de datos numéricos que se obtienen en periodos regulares a través del tiempo. La unidad de tiempo puede.

MODELOS AUTORREGRESIVOS Y DE PROMEDIOS MOVILES

Se utilizan cuando en algunos puntos de la serie estos están relacionados con otros que le anteceden y que les siguen.

Son aquellos que reúnen en una sola expresión las componentes autoregresiva y de media móvil de la serie de tiempo, si la tienen. La componente Autoregresiva se encarga de determinar cada observación como una combinación lineal de las observaciones anteriores; la componente de Media Móvil incluye una parte aleatoria

Preparado por: León Dario Bello

Page 18: DEFINICION. Una serie de tiempo es un conjunto de datos numéricos que se obtienen en periodos regulares a través del tiempo. La unidad de tiempo puede.

Los modelos deben ser construidos sobre una serie Xt estacionaria con respecto a la media, varianza y autocorrelaciones. Si la serie Xt no es estacionaria con respecto a la media, para volverla estacionaria hay que aplicar una diferenciación de orden d: d Xt; si no lo es con respecto a las autocorrelaciones deben emplearse una diferenciación de orden D; si no lo es con respecto a la varianza debe utilizarse la transformación de Box-Cox. 

DESCRIPCIÓN DE LOS MODELOSDESCRIPCIÓN DE LOS MODELOS

Preparado por: León Dario Bello

Page 19: DEFINICION. Una serie de tiempo es un conjunto de datos numéricos que se obtienen en periodos regulares a través del tiempo. La unidad de tiempo puede.

Metodología ARIMA

Número de Casos

Nº de retardos

16

15

14

13

12

11

10

9

8

7

6

5

4

3

2

1

AC

F

1.0

.5

0.0

-.5

-1.0

Límites confidencial

es

Coeficiente

Número de Casos

Nº de retardos

16

15

14

13

12

11

10

9

8

7

6

5

4

3

2

1

AC

F p

arc

ial

1.0

.5

0.0

-.5

-1.0

Límites confidencial

es

Coeficiente

Estacionariedad en medias hace referencia a que no tenga tendencia, estacionariedad en varianzas a que se tenga varianzas iguales, supuestos que se validaron anteriormente.

Preparado por: León Dario Bello

El modelo corrido con el SPSS fue el ARIMA (1,1,0)(1,1,0)12

Page 20: DEFINICION. Una serie de tiempo es un conjunto de datos numéricos que se obtienen en periodos regulares a través del tiempo. La unidad de tiempo puede.

Metodología ARIMA

Número de Casos

Nº de retardos

16

15

14

13

12

11

10

9

8

7

6

5

4

3

2

1

AC

F

1.0

.5

0.0

-.5

-1.0

Límites confidencial

es

Coeficiente

Número de Casos

Nº de retardos

16

15

14

13

12

11

10

9

8

7

6

5

4

3

2

1

AC

F p

arc

ial

1.0

.5

0.0

-.5

-1.0

Límites confidencial

es

Coeficiente

Estacionariedad en medias hace referencia a que no tenga tendencia, estacionariedad en varianzas a que se tenga varianzas iguales, supuestos que se validaron anteriormente.

Preparado por: León Dario Bello

El modelo corrido con el SPSS fue el ARIMA (1,1,0)(1,1,0)12