Pronóstico de la producción de leche, mediante modelos...

81
Pronóstico de la producción de leche, mediante modelos ARIMA. Facultad de Matemática y Computación "Universidad de La Habana" Pronóstico de la producción de leche, mediante modelos ARIMA. Caso UBPC “Maniabo”. Autor Lyhen Sánchez Suárez Tutores MSc. Gladis Cabanas Gómez DrC. Verena Tórres Cárdenas Asesor MSc. Yoandra Abad Lamoth Tesis presentada en opción al título académico de Máster en Bioestadística Ciudad de La Habana 2013

Transcript of Pronóstico de la producción de leche, mediante modelos...

Pronóstico de la producción de leche, mediante modelos ARIMA.

Facultad de Matemática y Computación "Universidad de La Habana"

Pronóstico de la producción de leche, mediante

modelos ARIMA. Caso UBPC “Maniabo”.

Autor Lyhen Sánchez Suárez

Tutores

MSc. Gladis Cabanas Gómez DrC. Verena Tórres Cárdenas

Asesor

MSc. Yoandra Abad Lamoth

Tesis presentada en opción al título académico de Máster en

Bioestadística

Ciudad de La Habana 2013

Pronóstico de la producción de leche, mediante modelos ARIMA.

"Si buscas resultados distintos, no hagas siempre lo mismo."

Albert Einstein

Pronóstico de la producción de leche, mediante modelos ARIMA.

DEDICATORIA

A mi mamita, fiel amiga y consejera, gracias a su sacrificio estoy aquí en estos

momentos. Serás siempre mi inspiración para alcanzar mis metas, por enseñarme

que todo se aprende y que todo esfuerzo es al final recompensado. Tu esfuerzo,

se convirtió en tu triunfo y el mío, TE AMO.

A mis abuelos, que por su modo de conducir mi educación, supieron guiarme bajo

los principios éticos morales y fueron fuente constante de apoyo, amor

incondicional y motivación.

A mis padres, Julio y Reinaldo, que con su empeño diario me han enseñado que la

vida exige sacrificios y perseverancia para lograr los objetivos.

A toda mi familia que es el mejor regalo que me ha dado la vida.

A mis amigos Yoandra y Eliecer, que fueron incondicionales y estuvieron a mi lado

ayudándome y depositando toda su confianza en mí.

A mis tutores Gladis y Verena que estuvieron al tanto de mi trabajo todo el tiempo

e hicieron sus exigencias cada vez mayores, gracias por haberme transmitido

todos los conocimientos que hoy tengo y por hacer de mi la profesional que soy.

A mis compañeros de trabajo que depositaron confianza en mí y confiaron más

para hacer de mí una mejor persona y profesional.

A todos aquellos que de alguna forma contribuyeron en mi formación, que

soportaron mis buenos y malos humores, mis canturías y mis locuras, a todos

muchas gracias, por ser lo que soy hoy.

Gracias de todo corazón.

Pronóstico de la producción de leche, mediante modelos ARIMA.

Resumen

El trabajo presenta una metodología para el estudio y predicción de la producción

de leche en las condiciones de UBPC ganaderas en Cuba incluyendo métodos

estadísticos de validación de los pronósticos y modelos encontrados. A partir de la

serie de litros de leche producidos, observada en el caso de estudio, se realiza un

análisis de la misma en los años del 1994 al 2010, encontrándose ausencia de

tendencia y una estacionalidad altamente significativa, se ajusta un modelo de tipo

ARIMA que resultó un ARIMA (1,0,3)x(0,1,0) y se halla un pronóstico a mediano

plazo (2011 - 2013) donde se obtuvieron errores aceptables, incluyendo un error

medio porcentual aproximadamente del 15% y valores extremadamente similares

a los reales en el 2011 (primer año pronosticado y tomado como año de

validación). Se obtienen resultados en el caso de la UBPC “Maniabo” de La Tunas

que incluyen un estudio descriptivo de los principales indicadores registrados en

estas unidades y que estaban más relacionados con la producción de leche, en

este caso se encontró que la misma está estrechamente relacionada con la

cantidad de vacas en ordeño y los litros por vaca, variables que explican un

97.40% de la variabilidad de la producción de leche, estas variables (vacas en

ordeño, litros de leche por vaca) son tan difíciles de predecir como la propia

producción de leche, por ello es necesario su estudio y control, para el logro de

una predicción confiable de producción de leche.

Pronóstico de la producción de leche, mediante modelos ARIMA.

Abstract

This paper presents a methodology for studying and predicting the milk production

under the conditions of Cuban cattle Basic Units of Cooperative Production

(BUCP), including statistical methods of validating the prognosis and models found.

From the amount of milk liters produced in the case of study, an analysis is

conducted from 1994 to 2010, and there was not high significant tendency or

seasonal, adjusted to a model type ARIMA that resulted to be an ARIMA

(1,0,3)x(0,1,0) and a prognosis will be found at middle term (2011 - 2013), where

acceptable mistakes were obtained, including a mean percent error of about 15%

and values similar to those real in 2011 (first predicted year and considered as

validation year). Results are obtained in the case of the BUCP “Maniabo”, Las

Tunas that includes a more detailed study of the main indicators recorded in these

units and that are also related with milk production. In this case, it is closely related

with the amount of milking cows and liters per cow, variables that explain 97.40%

of the variability of milk production. These variables (milking cows, liters per cow)

are so difficult to predict as milk production itself. Therefore, its study and control

are needed to achieve a reliable milk production prediction.

Pronóstico de la producción de leche, mediante modelos ARIMA.

Índice General

Introducción ………………………………………………………...………….…...1

1. Las Series Temporales…………………………………………..............…….6

1.1 Aspectos generales de las series temporales y su uso……………………..……….....6

1.2 Generalidades de los modelos clásicos de series temporales………………..…….....8

1.3 Componentes de las series…………….………………………………………….……….9

1.4 Enfoque a partir de procesos estocásticos. Proceso estacionario de

segundo orden……………………………………………………………………….…….22

1.5 Modelos Autorregresivos (AR) y de Medias Móviles (MA) …….……………………..25

1.6 Modelo Autorregresivo de Medias Móviles (ARMA)……………………………..…….27

1.7 Series no estacionarias en media. Diferencias estacionales y no

estacionales………….……………………………………………………………….…….28

1.8 Autorregresivo Integrado de Medias Móviles (ARIMA)………………………….…….30

1.9 Criterios de selección………………………………………………………………..…….33

2. Materiales y Métodos…………………………………………………………..33 2.1 Área de Estudio…………………………………………...………..……………..………33

2.2 Recolección de Datos…………………………………...………………………..………34

2.3 Métodos estadísticos……………………………………………………………….…….35

3. Resultados y Discusión…………………………………………………...…..36 3.1 Metodología de análisis en una UBPC……………………………...........…….……...42

3.2 Estudio de caso UBPC “Maniabo”………………………...…………………….……....44

Conclusiones………………………………………......…...………………….…..64

Recomendaciones.……………………………………………………...…….…..65

Bibliografía………………………………………………………………..…….…..66

Pronóstico de la producción de leche, mediante modelos ARIMA.

Introducción

La producción ganadera en los países tropicales se caracteriza por la baja

productividad que se alcanza en los indicadores productivos, y si se toma en

consideración la importancia que tiene para el hombre la producción de leche y

carne, se deben tener en cuenta todos los estudios que se desarrollen en las

explotaciones pecuarias actuales, que ayuden a la toma de decisiones correctas y

a conocer las estructuras que hacen posible este mecanismo [34, 35].

En los sistemas de producción de leche en Cuba, la alimentación se sustenta en la

utilización de los pastos y forrajes [32, 36]; estos no se escapan a la necesidad de

encontrar sistemas que sean eficientes aún en condiciones de bajos insumos [20].

Entre sus grandes retos se encuentran los desequilibrios financieros y los

esfuerzos por mantener un crecimiento sostenido en el orden social y productivo,

con el que se garantice el bienestar de la población y la equidad social [29]. Para

poder afrontar con eficiencia y previsión la planificación de los recursos es

necesario tener predicciones confiables de la futura situación de la producción del

sector.

La estadística ha desarrollado teorías y métodos que se han convertido en

herramientas imprescindibles para la estimación, comparación y la predicción.

Entre estos métodos estadísticos se encuentran la regresión, los métodos

multivariados y los aplicados a las series temporales entre otros.

Estos métodos pueden ser empleados para analizar fundamentalmente las

relaciones existentes entre variables, la incidencia de una variable particular sobre

un fenómeno analizado [44].

En el caso particular de las series temporales se aplican, fundamentalmente, los

métodos de pronósticos y, su mayor dificultad radica generalmente en la escasez

Pronóstico de la producción de leche, mediante modelos ARIMA.

de datos para analizar el problema y la falta de comunicación entre los estadísticos

y los usuarios que emplean los resultados de estos métodos [57].

El análisis estadístico de series temporales o cronológicas, como también se les

conoce, se usa hoy día con profusión en muchas otras áreas de la ciencia como

son: la física, ingeniería, la demografía, el marketing, las telecomunicaciones, la

meteorología, la química, las ciencias médicas y fundamentalmente en economía

[7, 34].

El uso de los métodos de estudio de las series cronológicas se ha venido

acrecentando debido a sus propios objetivos, dentro de los que se destacan la

predicción, el control y la simulación de los procesos. Cuando se toma en cuenta

la crisis económica que hoy atraviesa el mundo, es cada vez más necesaria la

planificación de los recursos para sobrevivir y progresar [8, 34].

El uso de las series temporales en diferentes áreas de la ciencia se evidencia

través de diferentes trabajos como son: “Evaluación epidemiológica de procesos

respiratorios bacterianos en gallinas ponedoras”, presentado por Colás Chávez y

colaboradores en el 2011, “Liga española contra la hipertensión arterial”,

desarrollado por Molinero M. Luis en el 2004 y otro desarrollado por Cañedo A., R.

and Arencibia J., R., “En busca de los secretos moleculares de la vida”, entre

otros [18, 26, 54].

El Ministerio de Agricultura, Ganadería y Pesca, en Argentina, es uno de los que

emplean los métodos estadísticos de las series temporales en la rama

agropecuaria, ellos emplean un Sistema Integrado de Información Agropecuaria,

en el que tienen la necesidad de realizar informes tanto agroclimáticos como

comerciales y para realizar los mismos lo hacen a través de la utilización de estos

métodos; hallando los pronósticos de condiciones agroclimáticas y de la situación

comercial de las empresas, teniendo en cuenta a su vez el análisis de mercado.

Pronóstico de la producción de leche, mediante modelos ARIMA.

En las investigaciones desarrolladas en la esfera agropecuaria, en Cuba,

históricamente se han analizado muchas variables, ya sea peso vivo al nacer,

producción de leche, de carne, número de hojas, el intervalo parto-parto, el

intervalo parto-gestación etc., sin embargo se han realizado pocos análisis que

muestren el comportamiento de estas variables de tal forma que sea posible

pronosticar su comportamiento en los años futuros. En este campo de estudio, los

pronósticos que se puedan realizar en base al análisis de este tipo de información

pueden emplearse para el desarrollo de nuevos planes y para el análisis correcto

de inversiones [42].

En el sector económico y financiero, los datos de las series temporales pueden ser

muy variados y usualmente son usados para evaluar el comportamiento de las

ventas de una empresa, o para evaluar el comportamiento de los índices de precio

de un país o de un tipo de producto, pero en general pueden utilizarse en

cualquier área.

Este aspecto, en Cuba, ha sido abordado en diferentes temáticas o aplicaciones,

pero en la esfera pecuaria los análisis temporales generalmente no han sido

profundos, un ejemplo, de una excepción de esta regularidad, se muestra en un

trabajo realizado por Viera en el 2006, en la Universidad Agraria de La Habana,

donde fue analizada una serie temporal del comportamiento productivo de las

granjas del Instituto de Ciencia Animal, para predecir el costo económico de

producciones futuras [67].

En los tiempos actuales, el hecho de no tener buenas predicciones de

producciones futuras, así como de ganancias productivas o económicas es una

cuestión a solucionar, de ahí que no contar con predicciones confiables de las

producciones en la esfera agropecuaria es nuestro problema de investigación.

La aplicación de los modelos de series temporales, a los resultados productivos,

en las empresas pecuarias permitirá pronosticar el comportamiento de las

producciones de las mismas y ayudar así al proceso de toma de decisiones;

logrando una planificación correcta de los sucesos futuros, debido a lo anterior es

Pronóstico de la producción de leche, mediante modelos ARIMA.

que se desarrolla este estudio, donde se define como hipótesis, que con la

aplicación de los métodos de series temporales se podrá pronosticar el

comportamiento futuro de la producción de leche en una UBPC.

De aquí que el objetivo general de este trabajo es proponer una metodología

para describir el comportamiento de la producción de leche y pronosticar dicha

producción mediante modelos ARIMA de series temporales en una UBPC y

ejemplificarla en la UBPC “Maniabo” de La Tunas.

Los objetivos específicos:

Proponer una metodología para el análisis estadístico y pronóstico de la

producción de leche a nivel de UBPC.

Caracterizar el comportamiento de la serie de producción de leche en la

UBPC “Maniabo” de Las Tunas para el período 1994-2010.

Identificar y seleccionar el modelo ARIMA adecuado para el pronóstico de la

producción de leche de la serie anterior.

Validar el modelo seleccionado y pronosticar la producción de leche para el

período 2011–2013.

La novedad y el aporte científico del presente trabajo radican en que se brindará

una metodología mediante el uso de modelos ARIMA, para analizar y pronosticar

la producción de leche en el campo agropecuario a nivel de unidad de base,

metodología que podrá ser aplicada con pocas variaciones para el análisis y

pronóstico de otras variables empleadas en la rama agropecuaria.

El documento quedará dividido en los siguientes capítulos: Introducción, donde se

realizará un bosquejo del tema agropecuario y el posible uso de los métodos

estadísticos de series temporales en el mismo y su importancia, quedando definido

Pronóstico de la producción de leche, mediante modelos ARIMA.

el objeto de investigación del trabajo. En el capítulo 1 se abordarán los aspectos

fundamentales de las series temporales y su uso, se trataran los modelos clásicos

(aditivo, multiplicativo, mixto) y los aspectos generales de los modelos AR, MA, el

ARMA y el ARIMA; se abordan los aspectos generales de las componentes que

forman parte de una serie temporal y el tratamiento de las mismas; se trataran

también los diferentes criterios de selección de un modelo específico de series

temporales. El capítulo 2 detalla las condiciones de trabajo donde se realizó el

estudio y los datos empleados para el mismo, así como los materiales utilizados

para el análisis de las series y la relación de los métodos estadísticos aplicados en

el análisis. En el capítulo 3 se recogen los resultados obtenidos y se realiza la

discusión de los mismos y a continuación se muestran las conclusiones, las

recomendaciones y la bibliografía consultada.

Pronóstico de la producción de leche, mediante modelos ARIMA.

Capítulo 1

Las Series Temporales.

1.1 Aspectos generales de las series temporales y su uso.

“Se llama serie de tiempo, temporal o cronológica a un conjunto de mediciones de

cierto fenómeno, registradas secuencialmente en instantes de tiempo

equiespaciados”, es decir la secuencia de valores que toma una variable

cuantitativa en momentos equidistantes de tiempo, durante un período

observado:

donde el subíndice representa el tiempo.

El gráfico de una serie de tiempo, que consiste en una poligonal cuyos vértices

corresponden a los puntos ( ), puede ayudar a analizar su comportamiento [2,

8].

En este trabajo se emplearán las series temporales, aplicadas como tal a la rama

ganadera, en la cual se tratan disimiles variables, como son la producción de

leche, los litros de leche por vaca, los nacimientos, los partos, las gestaciones, los

intervalos parto-parto, las muertes, intervalos parto-gestación entre otras, que

como casi todos los problemas o fenómenos de la vida, pueden ser analizadas y

modeladas matemáticamente para ayudar a comprender su comportamiento y a

tomar decisiones según la predicción futura de las mismos.

Pronóstico de la producción de leche, mediante modelos ARIMA.

En Cuba como se mencionó en la introducción, las series temporales son también

utilizadas, fundamentalmente en meteorología y en las ciencias médicas y,

ejemplo de ello es un trabajo realizado por Gladis Cabanas en el año 2005 [17],

para analizar los cambios temporales de la lluvia en el occidente de Cuba y otro

realizado en el 2007, por Gisele Coutín [27], donde utilizan específicamente los

modelos ARIMA de series temporales, para la vigilancia de enfermedades

transmisibles; pero en la rama agropecuaria, las series temporales han sido poco

utilizadas, hay algunos trabajos como por ejemplo el desarrollado por Lázara

Raquel Montes de Oca en el 2010, para predecir las propiedades de la calidad de

la guayaba [56] , pero hasta el momento, no se ha tratado específicamente la

aplicación de modelos ARIMA de series temporales en esta rama para realizar

pronósticos en el campo pecuario, en el país.

Existen dos objetivos principales del trabajo con las series:

1. Identificar la naturaleza de algún fenómeno representado por una

secuencia de observaciones.

2. La predicción de valores futuros de dicha secuencia de observaciones.

Para aplicar los métodos de series temporales, es preciso, inicialmente, conocer o

comprobar si efectivamente se está en presencia de una serie temporal o

simplemente frente a una secuencia de datos aleatorios, tomando en

consideración que una secuencia de datos completamente aleatorios en el tiempo,

también es una serie, pero esta no puede ser pronosticada.

Dentro de los modelos de series, se encuentran los llamados Modelos

Autorregresivos (AR), los modelos de Medias Móviles (MA), los Modelos

Autorregresivos de Medias Móviles (ARMA), los Modelos Autorregresivos

Integrados de Medias Móviles (ARIMA), etc.

“Con la identificación y aislamiento, de los factores determinantes en el

comportamiento de una serie temporal y teniendo en cuenta los cambios

Pronóstico de la producción de leche, mediante modelos ARIMA.

originados a través del tiempo, es posible determinar los valores futuros de la

variable en estudio” [13, 24]; esta afirmación constituye la suposición básica que

sustenta el pronóstico, mediante las series temporales. Si estos factores no son

los mismos en todo el recorrido de la serie posiblemente habrá que hacer cortes

en la misma para posibilitar su análisis.

Los modelos de series de tiempo tienen un enfoque analítico y predictivo, con ellos

los pronósticos se elaborarán en base al comportamiento pasado de la variable de

interés [26].

1.2 Generalidades de los modelos clásicos de series temporales.

El modelo clásico de series temporales supone que una

serie , estudiada de forma adecuada permite conocer las

causas de los movimientos determinísticos experimentados en la variable. Estos

movimientos son denominados componentes de la serie y son tres: las variaciones

estacionales, la tendencia y la ciclicidad. En todos los modelos de series

temporales, ya sea el aditivo, el multiplicativo o mixto, pueden estar incluidas todas

o varias de estas componentes [11, 16, 17, 19, 21, 25, 33]. En estos modelos se

plantea también la existencia de otra componente, no determinista, que es la

componente aleatoria.

Existen discrepancias entre los autores en cuanto al modelo más utilizado, si es el

aditivo o el multiplicativo, pero si se plantea que en casi todas las series con

tendencias marcadas, a mayores valores hay oscilaciones más amplias [67] y el

modelo multiplicativo es utilizado en las series cuando la variación interna del

patrón estacional tenga mayor amplitud al desplazarse hacia valores mayores de

la tendencia, si por el contrario, la variación del patrón estacional permanece

constante, se utilizará un modelo aditivo [69].

Los métodos clásicos, de series temporales, son mejor trabajados cuando se trata

de series en las cuales está presente la variación lineal de tendencia [22, 36]. En

Pronóstico de la producción de leche, mediante modelos ARIMA.

un modelo clásico de series de tiempo, se supone que la serie puede ser

expresada como suma o producto de sus componentes [38, 54].

Los correspondientes modelos son:

1. Aditivo :

2. Multiplicativo :

3. Mixto :

Donde es la serie observada en cada instante de tiempo , la es la

componente de tendencia, la es la componente estacional, la es la

componente aleatoria (accidental) y la es la componente cíclica de la serie.

1.3 Componentes de las series.

La tendencia ( ), uno de los componentes que puede estar presente en una serie

temporal, constituye aquella parte de la serie cronológica, que se caracteriza por

un movimiento suave, monótono y lento, durante un período bastante extenso de

tiempo [1] y esta puede ser creciente, decreciente o constante y se describe por

una función dependiente del tiempo ( )[40, 45].(Figura No1.1)

Pronóstico de la producción de leche, mediante modelos ARIMA.

FiguraNo 1.1: Serie temporal con tendencia creciente.

Como se planteó anteriormente, la tendencia refleja un continuo crecimiento o

decrecimiento de la serie en un largo período de tiempo, tiempo necesario para

hacer posible la caracterización del comportamiento de la variable en cuestión,

que por lo general, se describe por medio de una recta o de un tramo monótono de

alguna curva que se ajuste al comportamiento de los datos [63].

La estacionalidad ( ), otro de los componentes de las series temporales, resulta de

las fluctuaciones periódicas que se presentan regularmente en la serie durante

sub-intervalos de un período dado, generalmente un año [6, 50]. (Figura No1.2)

Pronóstico de la producción de leche, mediante modelos ARIMA.

Figura No1.2: Estacionalidad marcada en una serie temporal.

Los ciclos ( ), que también constituyen una de las componentes de una serie

temporal, no son más que movimientos regulares en amplitud y período y se

diferencian del estacional en que, este último, es tan marcado que, por lo general,

es un movimiento cuyo período se conoce previo al estudio de la serie y es único;

y en el caso de los ciclos pueden ser varios movimientos periódicos con diferentes

períodos y generalmente no son tan fuertes como el estacional [12, 62].

Los movimientos aleatorios, residuales o irregulares ( ), como también se les

llama, es otro componente que refleja aquellos movimientos esporádicos que

ocurren en la serie y que no presentan regularidad alguna, ni en intensidad, ni

periodicidad [33, 60]. Estos movimientos son motivados por acontecimientos

fortuitos, son movimientos erráticos que no siguen un patrón específico, que

obedecen a causas diversas e impredecibles [6, 26].

La estimación de los componentes de una serie es un proceso relevante en el

análisis de la misma. Por ejemplo, el conocimiento de los movimientos

estacionales contribuye a explicar si los cambios que se están observando en una

variable, en determinado momento, obedecen efectivamente a aumentos o

disminuciones en su nivel medio o bien a fenómenos estacionales [10].

De forma general la tendencia y la estacionalidad en una serie pueden ser

identificados y/o estimados, mediante varios métodos como son el método

observacional, los métodos de suavizamiento, el método exponencial de Brown, el

exponencial lineal de Hotl, entre otros, que serán explicados a continuación.

Para analizar la presencia de tendencia en una serie temporal puede utilizarse el

método observacional, al ver el movimiento del gráfico horizontal de la serie, pero

cuando la estacionalidad o la componente aleatoria, o ambas, producen

oscilaciones muy marcadas se dificulta el análisis visual haciéndose necesario

Pronóstico de la producción de leche, mediante modelos ARIMA.

aplicar previamente algún tipo de suavizamiento, para poder determinar el

movimiento a largo plazo de la serie.

La idea central de los suavizamientos es generar, a partir de la serie observada

una nueva serie, que suaviza los efectos ajenos a la tendencia (estacionalidad,

efectos aleatorios), de manera que esta se puede visualizar y estimar [24].

La obtención de la serie demedias móviles, es otro método de suavizamiento y de

hecho es uno de los más utilizados [13, 57]; consiste en fijar un número ,

preferentemente impar y calcular los promedios de todos los grupos de términos

consecutivos, comenzando cada grupo en la observación siguiente a la que se

consideró inicio del k-uplo anterior. Se obtiene una nueva serie suavizada por

medias móviles de orden que tiene términos menos que la serie original.

De este modo se tienden a anular las variaciones aleatorias [16]

La fórmula está dada por:

El suavizamiento de media móvil es muy fácil de aplicar, permite visualizar la

tendencia de la serie. Pero tiene dos inconvenientes, uno que con la aplicación de

este método no es posible obtener estimaciones de la tendencia en los extremos

de la serie y otro, que no constituye en sí un medio para hacer predicciones [25].

Si la serie presenta un efecto estacional de período , es conveniente aplicar un

suavizamiento de media móvil de orden . En tal caso se elimina el efecto

estacional, junto con la variación aleatoria, observándose solamente la tendencia

[16].

Esto permite estimar la línea de tendencia con menos error a partir de las medias

móviles ya que se aseguró la eliminación del factor que generalmente representa

Pronóstico de la producción de leche, mediante modelos ARIMA.

la mayor fuente de variabilidad en la serie y que se considera ajeno a la tendencia

que es la estacionalidad.

El método de suavizamiento exponencial, se basa en que una observación

suavizada, en el tiempo , es un promedio ponderado entre el valor actual de la

serie original y el valor de la serie suavizada, en el tiempo inmediatamente

anterior.

Si representa la serie de tiempo original y la serie de tiempo suavizada,

entonces lo anterior se puede escribir como donde

es un número entre y [13].

Si es cercano a , la serie suavizada pondera más fuertemente el valor original,

luego ambas se parecen, y en consecuencia, el suavizamiento es poco; si se

acerca a 0.5, se ponderan moderadamente la serie original y la suavizada, por lo

que el suavizamiento es moderado y si es cercano a , es cercano a , y

la serie suavizada pondera más fuertemente el valor suavizado inmediatamente

anterior, por lo que el suavizado es importante [13].

Consecuencia de la fórmula anterior es que la serie suavizada se puede expresar

como:

Es decir, cada término suavizado es un promedio ponderado de todos los términos

históricos de la serie original.

Como está entre y , estos números se van reduciendo a medida que avanzan,

o sea, que a medida que se aleja hacia el pasado, los términos van influyendo

cada vez menos en el término presente. La rapidez con que disminuye la

influencia es mayor mientras esté más cercano a , o sea, mientras mayor sea

[65].

Pronóstico de la producción de leche, mediante modelos ARIMA.

Si la serie varía lentamente, por lo general se eligen valores de cercanos a

(valor típico ). En cambio, si varía bruscamente, se eligen valores de

cercanos a 1 (valor típico ) [6, 25].

Algunos métodos empleados con fines de pronósticos, pero que pueden ser

utilizados también para detectar si una serie presenta tendencia o no, es el

suavizamiento polinomial, el método exponencial de Brown, el exponencial lineal

de Hotl y el estacional de Winter[2].

Un polinomio es una expresión de tipo:

Que para valores de describe una curva de orden o grado . Los

coeficientes son los parámetros de ajuste estimados para cada serie.

El suavizamiento polinomial, como el mismo nombre indica, es el suavizamiento

de la serie, ajustando un polinomio y con su aplicación se obtiene una curva más

plana, con menos irregularidades que la serie original. Si hay varios órdenes de

suavizamientos polinomiales que indiquen movimientos tendenciales similares en

la mayor parte del gráfico de la serie incluyendo la porción final, indica la

existencia de tendencia y se puede tomar como su estimación la curva polinomial

mejor ajustada.

Si , coincide con la media de la serie [61].

Para la detección de tendencia en una serie temporal mediante el suavizamiento

polinomial, se realiza este con polinomios de grado bajo, que pueden considerarse

desde hasta .

Cuando se indica un tipo de polinomio para el suavizamiento de una serie,

definiendo la a emplear, se pueden obtener por cualquier método de ajuste los

valores de los parámetros del polinomio más cercano, dentro de la familia de

polinomio de grado , a la serie; mientras menor sea será mayor la fuerza de

Pronóstico de la producción de leche, mediante modelos ARIMA.

aislamiento producida sobre la serie, pero también más se dejará influir por los

valores aberrantes y por la estacionalidad, con el crecimiento de el polinomio

produce curvas cada vez más sinuosas que se alejan del concepto de tendencia

[2].

El método exponencial de Brown consiste en realizar dos suavizamientos

exponenciales, a partir de los cuales se obtendrá el valor estimado, o pronóstico

que se busca realizar, mediante un cálculo realizado con una expresión sencilla.

La primera se aplica a los valores observados en la serie de tiempo y la segunda a

la serie atenuada obtenida mediante la primera atenuación.

Debido a que los valores calculados al realizar las dos primeras atenuaciones no

son los datos estimados a obtener, o sea, que no constituirán las inferencias de los

valores que se espera que tome la serie de tiempo en el futuro cercano, se emplea

una notación distinta a la de la expresión final, con la cual se calculan los valores

que constituyen en realidad el pronóstico.

El método de suavizamiento exponencial lineal de Hotl utiliza dos constantes de

suavizamiento, la primera constante, , entre y , es utilizada para la media de

la serie y la segunda, , también entre y , para la tendencia. Ambas constantes

seleccionan el peso dado a los valores en la serie para la estimación de media y

tendencia en el suavizamiento, mientras más cercanos a , más repartido el peso

entre todos los valores de la serie y mientras más cerca de , más concentrado en

los últimos valores.

El método estacional de Winter se utiliza cuando además de presentarse una

tendencia lineal en la serie de tiempo, hay también un patrón de comportamiento

de tipo estacional o periódico en los datos o valores de la serie de tiempo. Esta

técnica es una extensión del método de Holt ya que incorpora una ecuación para

calcular una estimación de la estacionalidad.

Pronóstico de la producción de leche, mediante modelos ARIMA.

Salvo en el caso de las medias móviles que no aportan una ecuación de la serie

suavizada en función del tiempo, los otros suavizamientos permiten no sólo

visualizar con mayor facilidad si existe una tendencia marcada en la serie, ya que

el gráfico tiene menos irregularidades, sino que también aportan una ecuación

mediante la cual se pueden estimar los valores de tendencia.

La estimación a partir de un suavizamiento adecuado puede mejorar el error con el

que se estima la tendencia, si esta se ajusta a partir de la serie suavizada y no a

partir de los datos originales, pero se corre el peligro de no haber tomado

adecuadamente, los parámetros del alisamiento y que esta estimación posterior de

una función más suave sea peor que la estimada a partir de los datos originales, el

caso del alisamiento por medias móviles es el ideal para este tipo de estimación

en dos pasos ya que su único parámetro corresponde al período estacional

que,casi siempre, es conocido con seguridad por el usuario.

Teniendo en cuenta el tipo de modelo representado en la serie, existen diferentes

métodos de estimación de tendencia, por ejemplo en una serie aditiva, los posibles

métodos a utilizar para estimar la tendencia son métodos de regresión[10]a partir

de algún suavizamiento; se emplean la regresión lineal, cuadrática y logística, pero

en el caso de la utilización de estos métodos existe una contradicción y es que,

uno de los supuestos de una serie temporal, plantea la presente autocorrelación

entre las observaciones y esto se contradice con el supuesto básico de la

regresión, que consiste en la independencia de las observaciones.

Para solucionar este inconveniente los paquetes estadísticos actuales, cuando

comprenden estudios de series, utilizan adaptaciones de los métodos de regresión

al caso de existencia de correlaciones entre observaciones, evitando así estas

deformaciones. Además de eliminar previamente la estacionalidad, mediante

suavizamientos adecuados generalmente con el uso de medias móviles, pues en

caso contrario puede deformar las estimaciones por ser un movimiento oscilatorio

alrededor de la línea de ajuste, que es generalmente muy fuerte.

Pronóstico de la producción de leche, mediante modelos ARIMA.

Contar con una estimación de la tendencia de la serie permite efectuar

consideraciones acerca del crecimiento subyacente de la misma. En este aspecto,

debe hacerse la aclaración de que las herramientas de descomposición de series

de tiempo, disponibles hasta este momento en la mayor parte de los sistemas de

programas estadísticos comerciales, realizan una estimación de la tendencia y del

ciclo en forma conjunta(medias móviles con correspondiente al período

estacional), es decir, se obtiene una descomposición de las series en componente

estacional, componente irregular y componente tendencia-ciclo, donde se pierde la

característica periódica del ciclo en la estimación [11].

Otro de los métodos que pueden emplearse para ajustar la tendencia ( ) en una

serie es el método de las dos medias [26, 33].

El método de las dos medias consiste en separar las observaciones en dos grupos

(preferiblemente iguales) y calcular la media aritmética de cada uno de los grupos,

obteniéndose así dos puntos [65]. La línea de tendencia se halla entonces

haciendo pasar una recta por los dos puntos hallados.

La recta que pase por los dos puntos se determinará analíticamente mediante la

expresión general:

Donde y son las coordenadas de los dos puntos,

respectivamente. Gráficamente, la línea de tendencia puede hallarse simplemente

uniendo los dos puntos por una recta. Este método es muy utilizado si no se

requiere una buena estimación de la tendencia sino sólo su signo de crecimiento

Después de detectar si una serie presenta tendencia o no y estimar la misma, es

necesario estimar la componente estacional, para lo que es necesario tener datos

de varios períodos consecutivos [69].

Para verificar la existencia de estacionalidad ( ) se puede realizar la prueba

ANOVA tomando las poblaciones como los diferentes instantes del período

Pronóstico de la producción de leche, mediante modelos ARIMA.

estacional, por ejemplo, en una serie mensual con estacionalidad anual todos los

eneros formarían una población, se debe tener en cuenta que debido a la

autocorrelación de la serie, las muestras son relacionadas y los vectores de

observaciones correlacionados, por lo que no se debe utilizar el ANOVA clásico

sino uno no paramétrico que sea más robusto.

Se demuestra que cualquier proceso periódico se puede modelar, con la precisión

deseada, mediante series de términos de funciones sinusoidales (senos y

cosenos), lo que se conoce como Series de Fourier, y se denomina espectro a la

representación de las amplitudes, en el eje de las , que constituyen los diferentes

términos de la serie (numérica) para toda la gama de frecuencias (eje de las ).

El espectro es una buena herramienta para detectar estacionalidad en una serie y

determinar su período y este está relacionado con la función de autocorrelación.

Puesto que

, obtenida la frecuencia, o frecuencias (picos en el

espectro), a partir de ésta se calcula de forma sencilla el período de las

oscilaciones en la serie de datos.

Una estimación del espectro utilizando una ventana de frecuencias que incluya la

frecuencia para la cual se obtiene el valor estimado en lugar de suavizamientos

sucesivos, la constituyen los periodogramas, la diferencia entre ellos sólo depende

de cómo se tomó y utilizó la ventana de frecuencias.

El periodograma, es un método gráfico que se asemeja a un sintonizador de un

receptor de radio, así, la serie que se observa sería la señal emitida por una radio

y el periodograma no sería más que el dial que busca en que frecuencia se

“oye”mejor la señal emitida [65].

El periodograma representa la descomposición del gráfico de la serie, considerado

como una función continua en el tiempo, en una suma de funciones periódicas y

mide las aportaciones a la varianza total de la serie, de componentes periódicos

de una frecuencia determinada. Si el periodograma presenta un “pico” en una

Pronóstico de la producción de leche, mediante modelos ARIMA.

frecuencia, indica que dicha frecuencia tiene mayor “importancia” en la serie que el

resto. (Figura No1.3)

Figura No1.3: Periodograma aplicado a una serie temporal.

En el gráfico anterior se observa que en la frecuencia 0,0833 se encuentra el pico

más alto lo que significa que el período (1/frecuencia) de longitud 12 (posiblemente

correspondiente al estacional) es el que responde al movimiento periódico más

notable en la serie, no obstante se observan también dos picos relativamente altos

en frecuencias menores (períodos mayores), que pudieran corresponder a otros

movimientos periódicos importantes.

En el caso de las frecuencias muy pequeñas es necesario ser cuidadoso, pues los

períodos tan grandes que sobrepasen la cuarta parte del tiempo de observación

de la serie, resultan poco observables y los picos en estas frecuencias se deben

más a problemas en la estimación que a movimientos reales.

Como al descomponer una función continua, en una suma de armónicos, no en

todas las frecuencias resultan aportes importantes al comportamiento generaly lo

que aporta el periodograma, es una estimación que no se sabe si es

significativamente diferente de cero, por muy distinta que sea a las de las otras

frecuencias, es importante discernir cuáles son los períodos a los cuales

responden amplitudes o intensidades significativamente mayores o notables en

este conjunto.

Pronóstico de la producción de leche, mediante modelos ARIMA.

Si la serie presenta estacionalidad,también se hace necesario conocer la

significación del movimiento períodico con período estacional en la misma, para

todo esto se emplean el periodograma y el periodograma integrado.

El periodograma integrado, que se muestra en la figura No1.4, se utiliza para ver la

significación de las ordenadas del periodograma; este no es más que una prueba

de hipótesis gráfica, para ver la significación de cada uno de los movimientos

periódicos en que se puede descomponer la serie.

Figura No

1.4: Periodograma integrado aplicado a una serie temporal.

Las frecuencias que presentan ordenadas mayores en el periodograma tienen

mayor posibilidad de resultar significativas en el periodograma integrado. Una

frecuencia es significativa, en esta prueba, si el aumento de la ordenada de la

frecuencia anterior a la estudiada (dentro de las frecuencias trabajadas en el

periodograma) es mayor que la diferencia de ordenadas entre la diagonal y uno de

los límites de la banda de confianza en esta misma frecuencia. De los tres picos

mayores del periodograma anterior (Figura No1.3) se observa que son

significativas las frecuencias 0.0833 y la 0.022, pero la menor de estas tres

frecuencias no resulta así a pesar de que ese pico era mayor que el segundo, esto

se debe a los problemas que se señalan en las estimaciones de las ordenadas del

periodograma de frecuencias muy pequeñas.

Pronóstico de la producción de leche, mediante modelos ARIMA.

Los valores de la variable en una serie generalmente dependen, en cierta forma,

de la magnitud de los valores anteriores; esta dependencia se debe disipar o

amortiguar al aumentar el tiempo entre ellos, bajo esa línea de pensamiento

intuitiva, también se espera, al haber estacionalidad en una serie, que los valores

separados entre sí por lapsos de tiempo iguales al período estacional, deben estar

correlacionados de alguna forma sin importar el atenuamiento de las correlaciones

hasta este retardo, ya que tienden a repetir un comportamiento similar en instantes

iguales correspondientes a cada período estacional.

La función de autocorrelación no es más que la correlación entre

y y la función de autocorrelación parcial , la correlación parcial de y

dado .(se verá posteriormente que para definir estas

funciones se asume que esta correlación no depende de t)

En caso de que exista estacionalidad en la serie, los coeficientes de

autocorrelación para un retardo igual al período estacional o un múltiplo pequeño

de este deben resultar positivos y significativamente diferentes de [46].

La correlación parcial con el retardo estacional también tendrá este

comportamiento; que estos valores de correlación se comporten en esta forma no

asegura que realmente se deba a la estacionalidad, ya que pudiera deberse a una

relación aleatoria, pero es un indicador fuerte de que esto puede ser así.

A las estimaciones puntuales de la componente estacional en los diferentes

instantes del período estacional se le llaman índices o patrones estacionales

según se den los valores en lo que provoca esta componente aislada, en

referencia a la tendencia, en ese instante, o como el valor promedio o

característico de ese momento del período estacional.

En el modelo multiplicativo los índices de variación estacional recogen el

incremento o la disminución porcentual que el componente estacional produce en

cada instante del período, es decir que porciento del valor que tendría la serie de

Pronóstico de la producción de leche, mediante modelos ARIMA.

no estar presente la estacionalidad representa lo predicho por el modelo si se

toman los índices de todo el período estacional su promedio siempre debe ser

igual a .

En el modelo aditivo los índices estacionales indican el valor en que aumenta o

disminuye la serie del valor de la tendencia a causa del componente estacional.

Estos índices siempre deberán sumar .

La estimación de la estacionalidad no se realiza solamente con el fin de

incorporarla al modelo para obtener predicciones, sino también con el fin de

eliminarla de la serie para visualizar otras componentes como tendencia y la

componente irregular, ya que se pueden confundir en las fluctuaciones

estacionales.

Las series generadas a partir de la original, por eliminación de la tendencia se

denominan “series de residuos de las medias móviles” y deberán contener

predominantemente las fluctuaciones estacionales. Para estimar la estacionalidad

se parte de estos residuos, pero se requiere haber decidido el modelo a utilizar,

lamentablemente esto no es siempre claro, ya sea porque no contamos con

información a priori para suponerlo o porque el gráfico no ha dejado evidencia

suficientemente clara, como para decidirnos por alguno de ellos. En tal situación

se propone calcular las series ajustadas por ambos modelos y elegir aquella cuyos

residuos sean menores.

La identificación y el análisis de la estacionalidad puede realizarse también

mediante el empleo de diferentes métodos gráficos como son el gráfico de cajas y

bigotes múltiples, característicos de la estadística descriptiva.

El gráfico de cajas y bigotes (Box-Plot) descrito por Jonh Tukey en 1977, resume

la información de cinco medidas estadísticas: el valor mínimo, el primer cuartil, la

mediana, el tercer cuartil y el valor máximo. No es más que un rectángulo (la caja),

donde los lados más largos muestran el recorrido intercuartílico, dividida por un

Pronóstico de la producción de leche, mediante modelos ARIMA.

segmento horizontal que indica la posición de la mediana y por lo tanto muestra

también su relación con los cuartiles primero y tercero. Este rectángulo tiene

además dos segmentos de recta, uno superior y otro inferior, que muestran los

valores mínimo y máximo de la variable. Este gráfico es muy útil, proporciona

información con respecto a la simetría o asimetría de la distribución de la variable,

permite identificar la presencia de valores atípicos o aberrantes y muestra la

variabilidad del conjunto de datos [27].

Para estudiar la estacionalidad de una serie se haría un Box-Plot múltiple, con

tantas cajas con bigotes, como instantes tenga el período estacional, cada una

reflejará el comportamiento del instante correspondiente, por ejemplo en datos

mensuales con estacionalidad anual, el gráfico tendrá un Box-Plot para enero, otro

para los febreros y así sucesivamente.

1.4 Enfoque a partir de procesos estocásticos. Proceso

estacionario de segundo orden.

Un proceso estocástico está definido como una sucesión de variables aleatorias

{ } . El subíndice no tiene, en principio, ninguna interpretación a priori,

aunque en el contexto de series temporales, cuando se habla proceso estocástico,

este subíndice representara el paso del tiempo [56, 68].

Cada una de las variables , que configuran un proceso estocástico, tendrá su

propia función de distribución con sus correspondientes momentos. Así mismo,

cada par de esas variables tendrán su correspondiente función de distribución

conjunta y sus funciones de distribución marginales. Esto mismo ocurrirá, ya no

para cada par de variables, sino para conjuntos más amplios de las mismas. De

esta forma, para caracterizar un proceso estocástico se deben especificar las

funciones de distribución conjunta de cualquier conjunto de variables

[12]:

Pronóstico de la producción de leche, mediante modelos ARIMA.

Un objetivo del estudio de las series de tiempos es realizar inferencias sobre el

proceso estocástico desconocido a partir de la serie temporal observada; el

problema radica en que prácticamente se desconocen todas las características

probabilísticas de las variables del proceso estocástico y, por otra parte,

únicamente se dispone de una realización muestral del proceso, o sea, una única

observación de cada variable del proceso; es por esta razón que es necesario

imponer toda una serie de condiciones o requisitos que permitan realizar las

inferencias de interés como son las condiciones de estacionaridad.

Un proceso estocástico es estacionario si las funciones de distribución conjuntas

finitas son invariantes con respecto a un desplazamiento en el tiempo (variación de

). Es decir, para todo natural ( ; ) tiene la misma distribución

conjunta para todo dado un fijo.

Esta definición de estacionaridad se conoce como estacionaridad en sentido

estricto o fuerte y puede relajarse sustancialmente utilizando la denominada

estacionaridad en sentido amplio o débil o estacionaridad de segundo orden. Se

dice que un proceso estocástico es débilmente estacionario si las esperanzas

matemáticas de las variables aleatorias no dependen del tiempo, son constantes,

si las varianzas tampoco dependen del tiempo y son finitas y si las covarianzas

entre dos variables aleatorias del proceso correspondientes a períodos distintos de

tiempo (distintos valores de ) solamente dependen del lapso de tiempo

transcurrido entre ellas [25].

En un proceso estacionario débil queda claro que se pueden definir las funciones

de autocorrelación y autocorrelación parcial de la serie que se evalúan en la

diferencia entre los instantes de tiempo en que se miden las variables (

y =

⁄ ) y que ya presentamos

someramente en el epígrafe anterior,ya que como las covarianzas sólo dependen

de la distancia en el tiempo entre las dos variables y la varianza es constante, las

correlaciones cumplen esta misma relación. Estas funciones tienen la misma

Pronóstico de la producción de leche, mediante modelos ARIMA.

interpretación que la correlación lineal y la correlación parcial utilizada en la

regresión.

Los paquetes de programas estadísticos comerciales, como los utilizados en este

trabajo, las dan mediante gráficos donde, en una secuencia horizontal alrededor

de la línea del cero, aparece una barra para cada retardo desde el uno a cierta

cantidad, según el programa, y una banda de confianza que permite considerar

significativamente distinta de cero la correlación para el retardo cuya barra salga

fuera de la banda.

Bajo este enfoque una serie de tiempo no sería más que la realización práctica de

un tramo finito de un proceso estacionario de segundo orden donde en general se

asume que las variables fueron observadas a distancias regulares de tiempo.

Tiene la característica de que cada variable se puede observar una sola vez, a

esta secuencia de observaciones de un tramo finito de un proceso se le llama

también trayectoria.

Esta definición de serie es demasiado restrictiva, ya que en la práctica las medias

de los variables cambian en el tiempo, en casi todas las series reales observadas,

por la presencia de componentes como la estacionalidad, la tendencia etc., por

eso se ha suavizado esta definición en diferentes formas, considerando en casi

todos los casos que se puede definir la serie, como un proceso con una

componente no aleatoria, dada por las medias de las variables del proceso, y un

proceso estacionario de segundo orden.

En la actualidad ya se trabajan algunos modelos que suavizan incluso estas

últimas restricciones como son los modelos de varianza variable (lo que implica

ampliar la definición de serie temporal) pero no serán objetivo de estudio en este

trabajo por lo que en lo adelante se continuara utilizando la definición anterior que

permite cambios solamente en las medias.

Pronóstico de la producción de leche, mediante modelos ARIMA.

Se verá un caso particular de serie que es muy utilizado en la definición de los

diferentes modelos de series cronológicas.

El proceso de ruido blanco es un proceso formado por una secuencia de variables

aleatorias independientes e idénticamente distribuidas, con media y varianza

finitas [69], generalmente se asumen con media cero y varianza constante. Dado

que el proceso de ruido blanco no posee estructura de dependencia, no resulta

muy útil como instrumento diagnóstico, pero se utiliza su estructura para los

requerimientos de errores de casi todos los modelos definidos sobre series ya que

forman la parte no predecible por relaciones con observaciones anteriores.

En el caso de la serie ser ruido blanco no puede ser pronosticada por ningún

modelo mejor que la propia media si por el contrario esta es predecible y se puede

construir un modelo para la misma, entonces no se considera un ruido blanco [17].

1.5 Modelos Autorregresivos (AR) y de Medias Móviles (MA).

Para las series temporales existen diferentes modelos que se han venido

desarrollando, entre estos tenemos los llamados Modelos Autorregresivos o de

autorregresión (AR) ylos modelos de Medias Móviles (MA). Es importante señalar

que estos modelos no tienen relación con el alisamiento de medias móviles a

pesar de la semejanza de nombre.

Se denomina modelo Autorregresivo (AR), a la dependencia existente de la serie

temporal con los retardos o valores pasados, de la misma. El número de retardos

de la serie temporal , que se introducen en el modelo, se denomina orden

autorregresivo del modelo y se denota mediante la letra , se denominan AR( )

La palabra autorregresivo viene de que se modela este comportamiento como una

regresión lineal múltiple (regresivo) con valores propios de la misma serie temporal

(auto) retardados un período de muestreo [46]; con la diferencia de

que existe correlación no eliminable entre las variables independientes y estas

Pronóstico de la producción de leche, mediante modelos ARIMA.

intercambian su papel de dependientes a independientes según el instante

estimado.

El modelo autorregresivo tiene la siguiente forma:

donde: es un ruido blanco

Como se esperaría dada la similitud con el modelo de regresión, al no estar en el

modelo las variables , , etc. las autocorrelaciones parciales son ceros

a partir de . Esta propiedad permite que se pueda utilizar la estimación de la

autocorrelación parcial para obtener un estimado de .

Este modelo es estacionario si las raíces del polinomio asociado

están fuera del círculo unidad.

Los modelos de medias móviles (MA), son también recomendables para series de

tiempo que no presentan patrones de tendencia, estacionalidad, o ciclicidad en los

datos [8], pues siempre responden a series estacionarias.

Los procesos MA se dice que no tienen memoria, puesto que rápidamente

(dependiendo del orden) convergen hacia la media y la varianza del proceso [22],

y tiene la siguiente forma:

donde es un ruido blanco.

La función de autocorrelación es la que se utiliza en este caso para determinar

cuál podría ser el orden del modelo de medias móviles que corresponde con el

último retardo con correlación significativa. Esto se debe a que es un ruido

blanco y por tanto y resultan incorrelacionados si , ahora bien como

está formada por una combinación de ruidos con subíndices de a

Pronóstico de la producción de leche, mediante modelos ARIMA.

, ninguno de estos ruidos coincide con los que forman y las variables

y , al estar formadas por dos combinaciones de ruidos sin ningún término

coincidente, resultan independientes.

Después de determinar el orden del modelo en cada caso se pasan a estimar los

coeficientes del mismo, en el caso del AR( ) mediante un método similar al de

regresión pero que tiene en cuenta la existencia de autocorrelaciones y que parte

precisamente de la estimación de esta función y en los modelos MA( ) por un

método numérico iterativo, estos métodos aparecen en los paquetes estadísticos

para su uso directo a partir de la declaración del órden y su estudio no va a ser

objetivo del presente trabajo.

Tanto en los modelos AR( ) como en los MA( ) generalmente se asume que el

ruido blanco es gaussiano con media cero.

1.6 Modelo Autorregresivo de Medias Móviles (ARMA).

Entre los modelos de series temporales se encuentran también los modelos ARMA

y los modelos ARIMA.

Como parte de los modelos de series temporales, los modelos ARMA

(Autorregresivo de Medias Móviles), no presentan tendencia ni estacionalidad y es

considerado un modelo lineal; esto significa que la variable que define la serie

temporal depende de una constante , linealmente de valores pasados de la

misma variable y linealmente de una ponderación de errores de ajuste realizados

en el pasado [9], es decir de una combinación de un autorregresivo con media

cero más un media móvil que puede incluir una constante (media). En este trabajo

se considerara .

Para comprobar si una serie se ajusta por un ARMA es necesario comprobar la

estacionaridad de la serie, o sea que esta tenga media y varianza constantes en el

tiempo.

Pronóstico de la producción de leche, mediante modelos ARIMA.

El esquema general del modelo es el siguiente:

El término que corresponde al ruido en el mismo momento en el que se estima

el nuevo valor de la variable [61] y representa el error del modelo a la hora de

ajustar la serie.

Al igual que en el autorregresivo la diferencia de este modelo con los modelos

clásicos de regresión está en que, en la serie, las observaciones están

correlacionadas en el tiempo y en la regresión se estima a partir de una muestra

independiente de puntos, además de que los no se observan.

El proceso de estimación de los parámetros comienza por la estimación de los

órdenes y para lo que se tiene que la función de autocorrelación de un

ARMA( ) tiene la misma característica de la de un MA( ) y su función de

autocorrelaciones parciales presenta la forma de la de un AR( )

1.7 Series no estacionarias en media. Diferencias estacionales y

no estacionales.

Cuando se habla de modelos estacionarios se refieren a aquellos que revierten a

una media, mientras que los no estacionarios, no tienen una media común para

todos los instantes, ya sea por un movimiento de tendencia, de estacionalidad u

otro. La tendencia se puede eliminar de la serie mediante la aplicación de

diferencias no estacionales, la diferencia no estacional es la serie de las

diferencias .

La serie de estas diferencias tiene un polinomio de tendencia un grado menor que

la anterior; luego si se quiere eliminar completamente esta componente, se harán

tantas diferencias como grado tenga el polinomio de tendencia original.

Pronóstico de la producción de leche, mediante modelos ARIMA.

Para eliminar la estacionalidad se utilizan las diferencias estacionales. La

diferencia estacional es la serie de las diferencias , donde es el período

estacional; esta diferencia elimina o disminuye el movimiento estacional y la serie

obtenida es un año más corta que la serie original.

El problema que se presenta al analizar series temporales con un posible

componente estacional o de tendencia es que este sea tan fuerte que implique

una variación de la media (global) en el tiempo. En este caso se requerirán

diferencias estacionales ( ) o no estacionales ( ) para que la serie resultante sea

estacionaria. En un modelo de serie temporal el objetivo de la diferenciación es

hacer que la misma se estabilice y se convierta en estacionaria.

Si se tiene una tendencia polinomial el tipo de tendencia equivale al grado u orden

del polinomio a ser ajustado a la serie, se considera tendencia lineal en la serie si

el grado de polinomio es , si el grado del polinomio es la tendencia se considera

cuadrática y si es cúbica el grado polinomial es y el grado del polinomio de

tendencia se corresponde con el número de diferencias no estacionales que hay

que hacer para eliminar esta tendencia.

En caso de existir estacionalidad se harán diferencias estacionales mientras esta

persista, otra forma de eliminar la misma es mediante la aplicación de un modelo

ARMA estacional (ARMA( )) donde la serie se considera formada por los k-

uplos de cada repetición del período estacional o por combinación de ambos

métodos.

Debe considerarse que con la aplicación de estas diferencias se producen

perdidas de secuencias de valores de la serie y que mientras mayores sean la

cantidad de diferencias o los órdenes del ARMA estacional se pierden más valores

en la serie (uno por cada diferencia no estacional y por cada diferencia

estacional o por cada unidad de la suma de los dos órdenes del ARMA estacional)

para realizar el análisis posteriormente; a pesar de este inconveniente por el hecho

de incluir este tipo de diferencias en la estimación del modelo ARIMA, como un

Pronóstico de la producción de leche, mediante modelos ARIMA.

parámetro, lo hacen ser muy empleado, ya que modela series que no son

estacionarias en media.

1.8 Autorregresivo Integrado de Medias Móviles (ARIMA).

“A comienzo de los años 70, G.E.P. Box, profesor de Estadística de la Universidad

de Wisconsin, y G.M. Jenkins, profesor de Ingeniería de Sistemas de la

Universidad de Lancaster, introdujeron una pequeña revolución en el enfoque del

análisis de series temporales, en sus trabajos sobre el comportamiento de la

contaminación en la bahía de San Francisco, con el propósito de establecer

mejores mecanismos de pronóstico y control. El libro, “Time Series Analysis,

Forecasting and Control.”, escrito por Box- Jenkins en 1976 [15], en el que

describen la metodología, se convirtió rápidamente en un clásico, y sus

procedimientos se utilizan ampliamente desde entonces, en diferentes ramas de la

ciencia, conociéndose como modelos ARIMA y también como modelos Box-

Jenkins” [47].

En un modelo ARIMA se considera que el comportamiento de la variable, en

cualquier momento del tiempo, está influenciado por las observaciones de la

propia variable (recientes o remotas), incorporadas a un modelo mediante los

términos autorregresivos (AR) y los errores o influencia de los elementos

aleatorios (recientes o remotos) que se representan con los términos de medias

móviles (MA) [16].Pero también existen componentes de tendencia y

estacionalidad que se adicionan al modelo ARMA, por eso recibe el nombre de

integrado. En su concepción más amplia concibe la unión de un arma con un arma

adicionando además tendencia y estacionalidad.

La principal ventaja de esta metodología es que proporciona predicciones

generalmente buenas en el plazo inmediato a mediano. Esto se debe a que la

metodología Box-Jenkins permite elegir entre un amplio rango de distintos

modelos según represente mejor el comportamiento de los datos [48].

Pronóstico de la producción de leche, mediante modelos ARIMA.

Los Modelos Autorregresivos Integrados de Medias Móviles (ARIMA) presentan

inconvenientes metodológicos y de orden práctico, como son la gran cantidad de

datos necesarios por fase a analizar para establecer significación estadística, Box

y Jenkins (1970) establecen un mínimo de 100 datos, mientras Glass, Wilson y

Gottman (1975) lo hacen a partir de un mínimo de 50 observaciones [20, 67].En la

práctica se evidencia que para aplicar un modelo ARIMA se debe tener un mínimo

de 10 períodos estacionales

El procesamiento de estimación en el caso del ARIMA comienza por eliminar la

tendencia por diferencias no estacionales ( ) sucesivas, como ya se vio

tantas como el orden del polinomio de tendencia, y la estacionalidad mediante

diferencias estacionales donde es la longitud del período estacional, para

obtener un proceso con las características del ARMA, que se ajusta utilizando los

estimadores del mismo [60].

El método que será planteado a continuación es una forma de trabajo alternativo,

que no es lo clásico de un modelo ARIMA y solo tiene ventajas cuando la

tendencia no se ajusta bien por un polinomio de grado bajo (hasta ) y no es objeto

de estudio en el trabajo desarrollado.

Habitualmente, cuando una serie muestra tendencia, se subdivide dicha serie en

dos componentes: una primera, la estimación de dicha tendencia y la segunda, el

residuo o error que se comete cuando se utiliza dicha tendencia como valor

estimado de la serie original. Si además presenta una estacionalidad marcada se

trabajará la estimación de la tendencia con las medias móviles.

Una vez estimada la tendencia, aproximada con una regresión lineal, parabólica,

exponencial o la que sea más conveniente; se trabaja con la serie del residuo,

que entonces no mostrara tendencia y se puede decir que es estacionaria en

media. Es sobre este residuo sobre el que se lleva a cabo la metodología de

identificación ARIMA, sumando finalmente el valor de la tendencia estimada si se

quieren dar resultados de estimación de la serie original; es decir: . La

Pronóstico de la producción de leche, mediante modelos ARIMA.

identificación del proceso ARIMA se hará sobre esta serie del residuo

estimada previamente la tendencia del modo más adecuado.

Para obtener valores estimados de la serie original, se suma el componente

tendencial al valor estimado del residuo mediante el modelo ARIMA [1,

24].

En este trabajo el método ARIMA se trabaja por diferencias para la eliminación de

ambas componentes no estacionarias, es decir, sin previo ajuste de tendencia ni

modelos ARMA estacionales.

El incumplimiento de la condición de estacionariedad sólo afecta a la componente

AR del proceso ARIMA, ya que la componente MA siempre es estacionaria.

En un modelo ARIMA se necesita identificar los órdenes y estimar los coeficientes,

el resultado de regresiones que se utilizarán y es muy sensible a la precisión con

que se determinen sus órdenes, suele expresarse como ARIMA( )( )

donde los órdenes , y son números enteros no negativos que indican el orden

de las distintas componentes del modelo no estacional, orden de la componente

autorregresiva, grado del polinomio de tendencia y orden de media móvil

respectivamente y ( ) corresponden a los parámetros del modelo estacional,

orden de la componente autorregresiva estacional, número de diferencias

estacionales y orden de media móvil estacional respectivamente y es, como

siempre, la longitud del período estacional

Para elegir los parámetros , y se debe ser muy cuidadoso, pues, como ya se

señaló, cada aumento en una unidad en alguno de los tres parámetros reduce un

año de observaciones de las que se dispondrán para estimar luego los

coeficientes del modelo, es por esto que su suma debe ser pequeña.

Generalmente el aumento en estos parámetros se plantea por la presencia

mantenida de la estacionalidad luego de la primera diferencia estacional y, como

no se acostumbra a utilizar modelos donde esta suma sea mayor de , se pueden

Pronóstico de la producción de leche, mediante modelos ARIMA.

determinar por comparación de los modelos posibles. Si la serie es muy corta (no

más de 6 períodos estacionales) no se usan sumas mayores de

Cuando se han obtenido los 6 parámetros y en aras de lograr simplicidad para

reducir errores de estimación, el ajuste del modelo se compara con el de modelos

de órdenes menores a los obtenidos en el estudio inicial.

Si se denota ARIMA( ); cuando alguno de los tres parámetros

de un ARIMA( ) es , es común omitir las letras correspondientes del

acrónimo, AR para la componente autorregresiva, la letra I para la integrada y MA

para la media móvil; de hecho muchos autores lo hacen, por ejemplo en caso de

tener un modelo ARIMA( )( ), lo tratan como ARMA( ) y un

ARIMA( )( ) como MA( ).

1.9 Criterios de selección.

Dentro de los criterios de selección de modelo se encuentra un método para la

comparación de modelos basado en la teoría de la información, este método es

conocido como criterio de selección de Akaike, llamado también , por sus

siglas en inglés.

El método permite determinar cuál modelo es el más parecido al correcto y

cuantificar su parecido.

La base teórica del método , combina la teoría de máxima verosimilitud, la de

la información y el concepto de entropía de la información.

El modelo está definido por la ecuación:

(

)

Donde es el número de datos, es el número de parámetros de la ecuación de

ajuste a la regresión más uno, porque en la regresión se estima el número de

Pronóstico de la producción de leche, mediante modelos ARIMA.

parámetros más la suma de cuadrados, y es la suma de cuadrados de las

distancias verticales de los puntos a la curva [4].

Si se analiza la ecuación del modelo se puede apreciar que su valor estará

dado en unidades relacionadas mediante un logaritmo con el cuadrado de las

unidades en las cuales los datos fueron tomados, por lo que, el no puede ser

interpretado como un valor individual. El valor final puede resultar positivo o

negativo; por tanto el criterio cobra verdadera importancia cuando se comparan los

modelos, para esto se trabaja con las diferencias entre los [5].

Cuando se está en presencia de varios modelos lo que se hace es calcular los

individuales de cada uno y se tomara como modelo correcto el de menor valor.

Otros métodos utilizados como criterios de selección es la comparación de errores

y las medidas de precisión del pronóstico, utilizadas para determinar qué tan eficaz

es un pronóstico a través del cálculo de su precisión con respecto a los valores

reales, o sea, con estas se busca obtener una medida de qué tan lejos se

encuentran los valores pronosticados de los obtenidos en la realidad. Se

seleccionará el modelo que se estime más cercano a la realidad.

Con las medidas de precisión se halla el error de pronóstico, o lo que es lo mismo,

la diferencia entre el valor real y el pronosticado del período correspondiente.

Donde es el error del pronóstico del período , es el valor real para ese

período y el valor que se había pronosticado.

Entre estas medidas se encuentran:

Error Medio ( ): ∑

Error Medio Absoluto ( ): ∑ | |

Pronóstico de la producción de leche, mediante modelos ARIMA.

Error Medio Absoluto Porcentual ( ): ∑ |

|

Error Medio Porcentual ( ): ∑

Error Cuadrático Medio ( ): ∑

Raíz del Error Cuadrático Medio ( ): √

Vale aclarar que en estas fórmulas no corresponden al largo de la serie si no sólo

a la cantidad de valores pronosticados por pronóstico de valor inmediato (Valor del

tiempo según modelo teniendo los datos hasta ) dentro de la trayectoria

observada.

Capítulo 2

Materiales y Métodos

2.1 Área de Estudio.

El estudio fue realizado en la UBPC “Maniabo”, ubicada en los 20.6º de Latitud

Norte, 76.0 º de Longitud Oeste a 86 metros sobre el nivel del mar, en el Municipio

y Provincia de Las Tunas, esta entidad perteneció a la Empresa Cuenca Lechera

Pronóstico de la producción de leche, mediante modelos ARIMA.

hasta Julio del 2009 y actualmente pertenece a la empresa agropecuaria Las

Tunas.

Figura No 2.1: Ubicación de la provincia Las Tunas dentro del territorio nacional.

Su principal objeto social es la producción de leche y durante su desarrollo ha

obtenido resultados ascendentes, que la han colocado entre las primeras

productoras del país [28]. Cuenta además con una producción variada que incluye

huevos, carne, cultivos varios, tabaco, humus, pies de cría y materia orgánica, un

reflejo claro de la diversificación de sus producciones. Del total de producción de la

entidad, la producción de leche representa el 35% de su producción mercantil.

Desde 1993 cuenta con un módulo pecuario, un centro de lombricultura, un

autoconsumo y está compuesta por siete vaquerías, tres microvaquerías, un

centro de destete y dos centros de desarrollo y el último cambio tecnológico

desarrollado en la entidad fue antes de este año.

Su masa ganadera está compuesta por 3 898 cabezas de bovinos, 43 equinos, 1

025 ovino-caprinos, 257 porcinos, 1 450 aves y 156 conejos, cuenta además con

301 cooperativistas, de los cuales el 100% de la fuerza está vinculada a los

resultados finales de la producción. Las razas predominantes son el Mestizo

Siboney, Mestizo Holstein y el Cebú Lechero.

Pronóstico de la producción de leche, mediante modelos ARIMA.

Para su desarrollo la entidad cuenta con un área total de 1 948 ha y de ellas 1 821

ha se emplean en la agricultura, a la ganadería vacuna están dedicadas 1 656, de

ellas con 399.9 ha de pastos naturales que representa un 24.1 % y 1 256.1 con

pastos artificiales que constituyen el 75.9 %; el área forrajera es de 81.8 ha, el CT-

115 y el King Grass ocupan 36.2 ha y 45.6 ha lo ocupa la caña forrajera.

El territorio donde se encuentra ubicada la UBPC es considerablemente llano, solo

con ondulaciones y cerros aislados, con una media anual de precipitaciones es de

900 mm como máximo y una temperatura anual oscilante entre los 28°C y 34°C y

su red fluvial es poco desarrollada, formada solo por ríos de poco caudal, tiene

además diferentes tipos de suelos, como son pardos grisáceos, vertisuelos y los

fersialíticos, los que presentan factores limitantes que disminuyen su fertilidad [37].

2.2 Recolección de Datos

Para el desarrollo del trabajo se realizó la investigación en la Empresa Pecuaria

Cuenca Lechera de Las Tunas, a la cual perteneció la UBPC “Maniabo” y los

datos se obtuvieron de los boletines técnicos de la UBPC, donde se reportaban un

total de 19 variables productivas relacionadas con los indicadores de producción

de leche, el rebaño, la reproducción y la situación de los pastos y forrajes. Se

obtuvieron las variables climáticas con el Instituto de Meteorología y el Instituto

Nacional de Recursos Hidráulicos (INRI) de Las Tunas.

Se creó una base de datos, organizada como una matriz y para cada uno de los

años y meses se evaluaron las variables:

1. Producción de leche en litros (l)

2. Vacas en ordeño (cabezas)

3. Nacimientos (cabezas )

4. Muertes (cabezas)

Pronóstico de la producción de leche, mediante modelos ARIMA.

5. Litros por vaca (l)

Una vez determinados estos aspectos se identifica la serie de producción de

leche, se realiza un análisis descriptivo de la misma y se aplican métodos, para su

estudio y predicción, que se explicaran en acápites posteriores del trabajo.

2.3 Métodos estadísticos.

En el desarrollo del trabajo y para lograr finalmente el pronóstico de la producción

de leche, se utilizaron varios métodos estadísticos descriptivos para analizar el

comportamiento de los datos, se calcularon los estadígrafos más importantes

(media, desviación estándar y coeficiente de variación) y se realizó un análisis de

regresión lineal múltiple con uso de componentes principales, para determinar

cuáles variables ejercían mayor influencia en la producción de leche.

Se emplearon los gráficos Box-Plot, para realizar su análisis descriptivo y para

comprobar si la serie presentaba tendencia o no, se empleó el método de

suavizamiento polinomial, para tres grados de polinomios diferentes (n=1, 3 y 5) y

también se usaron periodogramas para comprobar la existencia de estacionalidad

Posteriormente para realizar el pronóstico se aplicaron los modelos ARIMA, de

series temporales, también llamados modelos Box-Jenkins y se comprobó la

normalidad de los residuos del modelo ajustado mediante la prueba Normal

Probability Plot.

El modelo elegido mediante los modelos ARIMA, se valida contra los datos

históricos para ver si describe la serie con precisión.

Todos los resultados fueron procesados en los diferentes paquetes estadísticos,

Minitab 15, R versión 2.15.0, el STATGRAPHICS Centurión XV.II y el Microsoft

Excel 2007.

Pronóstico de la producción de leche, mediante modelos ARIMA.

Capítulo 3

Resultados y Discusión

3.1 Metodología de análisis en una UBPC.

Para realizar el estudio y pronóstico de la producción de leche en una UBPC,

mediante los modelos ARIMA se propone una metodología de trabajo compuesta

por las etapas de la figura No3.1, que aparece a continuación.

Pronóstico de la producción de leche, mediante modelos ARIMA.

Figura No3.1: Pasos de la metodología de los modelos ARIMA de series temporales.

Para llevar a cabo el desarrollo de esta metodología se debe comenzar por

analizar a partir de qué año las condiciones bajo las cuales se desarrolla la serie,

son las mismas para poder considerar estabilidad en la misma; luego de

seleccionar el tiempo del estudio se verá la existencia de información en los

indicadores que se entiendan como relacionados y la observación de presencia de

datos aberrantes que puedan considerarse errores en la información.

Se propone que para el trabajo, con esta metodología, el tiempo además de ser

estable y con información adecuada, no debe ser menor de 10 años.

A continuación se construye la base de datos mensuales colocando los mismos en

forma de matriz con los indicadores por columnas y los tiempos de observación

por filas.

Luego se realiza un estudio descriptivo la variable a pronosticar, que debe incluir

los principales estadígrafos a nivel mensual.

Analisis descriptivo general y temporal.

• Utizacion de los gráficos Box-Plot.

• Detección y estimación de tendencia y estacionalidad.

Identificación del modelo y

estimación de parámetros.

• Comparación de diferentes modelos.

Predicción de la produccion de

leche

• Validación del pronóstico realizado

Pronóstico de la producción de leche, mediante modelos ARIMA.

Posteriormente se debe realizar un estudio descriptivo temporal dentro del cual se

recomienda el uso de gráficos de los Box-Plot de los diferentes meses y otro de

los diferentes años de la producción de leche en el período como los utilizados en

el estudio de “Maniabo”, pues son muy ilustrativos del comportamiento estacional y

tendencial en el período.

Se recomienda además buscar las relaciones de la producción de leche con otras

variables ya que podrían aparecer relaciones fuertes con variables fácilmente

predecibles que permitirían modelos multivariados de pronósticos o al menos

ayudar a sugerir que medidas se pudieran tomar si los pronósticos encontrados no

son económicamente satisfactorios.

Posteriormente se continúa el estudio de la serie de producción de leche, para lo

que se sugiere comprobar el análisis inicial de la existencia de tendencia, a través

del uso de los suavizamientos polinomiales y de estacionalidad por diferentes

métodos, como son el observacional o el periodograma simple y el integrado.

En caso de comprobarse la existencia de estas componentes (tendencia y

estacionalidad) deben ser estimadas para el análisis del comportamiento de la

producción de leche de la unidad, para ello se propone utilizar los modelos

clásicos de serie incluidos en casi todos los paquetes de programas estadísticos

comerciales y en los software libres como R; en ellos se solicitarán los índices

estacionales del tipo que la observación del gráfico general de la serie sugiera

(aditivo o multiplicativo) y la tendencia podrá modelarse de acuerdo al polinomio

encontrado en el suavizamiento polinomial.

Para obtener el pronóstico en el tiempo deseado se seleccionara un modelo

ARIMA, obteniéndose primero el parámetro por el orden del polinomio de

tendencia, tomando si hay estacionalidad, si la serie tiene mucho más de 10

años se pudiera tomar una mayor en caso de que los residuos presentaran

estacionalidad.

Pronóstico de la producción de leche, mediante modelos ARIMA.

Teniendo esto se analizan los órdenes y del modelo por los valores

significativos de las funciones de autocorrelación parcial y autocorrelación de la

serie diferenciada respectivamente, y se deben tomar como 0, ya que las

series nunca serán tan largas.

Una vez determinados los parámetros ( y ) se probaran otros modelos más

simples (reduciendo el valor de los parámetros obtenidos) y se seleccionara,

dentro de todos ellos, el que tenga menores valores en los errores clásicos, sobre

todo en el medio absoluto y el medio absoluto porcentual.

Se deben comprobar los supuestos del ruido blanco en los residuos del modelo

seleccionado aplicando la prueba de las rachas y una prueba de normalidad.

La validación del pronóstico obtenido, estará dada por la importancia del monto de

estos errores desde el punto de vista de un cambio de esta magnitud en la

producción de leche en comparación con los valores obtenidos en el proceso

descriptivo inicial, además serán mostrados (puede ser de forma gráfica) los

intervalos de confianza al 95% (habitual en la rama pecuaria y la económica) para

los pronósticos obtenidos.

3.2 Estudio del caso UBPC “Maniabo”

Se presenta un análisis descriptivo de la variable producción de leche para tener

una base valorativa de los resultados posteriores del pronóstico de la misma y el

estudio de las relaciones con otras variables para valorar otras posibilidades de

modelos de predicción.

Años

N

Producción de leche

Media D.E. CV

1994 12 91550 40330.8 44.05

1995 12 58600 27666.03 47.21

1996 12 77550 35731.46 46.08

1997 12 83425 35309.9 42.33

1998 12 93175 48147.48 51.67

Pronóstico de la producción de leche, mediante modelos ARIMA.

Tabla No 3.1: Estadígrafos de la variable producción de leche(l) en la UBPC

“Maniabo” en los años 1994-2010.

Para la variable producción de leche la media de producción por mes en el año se

mantiene bastante estable en el período estudiado (generalmente algo por debajo

de los 100000 litros) y aunque se reportan en forma consecutiva tres de los

valores más bajos de la serie en los tres últimos años y los mayores valores

agrupados en la mitad central de la misma no se consideran un fenómeno notable

en esta serie donde se espera una relación con los ciclos hiperanuales de la lluvia,

que en Cuba tienen una duración que oscila entre 11 y 23 años aproximadamente

y se dividen en un semiciclo lluvioso y otro poco lluvioso de años consecutivos con

la misma naturaleza hidrológica, entre otras variables. El rango de mayor

diferencia fue de 61433 litros y correspondió a los años 1995 y 2003. (Tabla

No3.1). Por otra parte el año de mayor variabilidad en este indicador fue el 2005

con un CV=59.5%, aunque este estadígrafo siempre fue superior a 27%.

1999 12 73116.67 33958.69 46.44

2000 12 83341.67 39709.2 47.65

2001 12 105758.3 35675.19 33.73

2002 12 97616.67 41981.92 43.01

2003 12 120033.3 45443.92 37.86

2004 12 113666.7 46568.08 40.97

2005 12 83391.67 49615.27 59.5

2006 12 84291.67 43356.82 51.44

2007 12 88350 24505.31 27.74

2008 12 78016.67 29518.43 37.84

2009 12 63333.33 26529.1 41.89

2010 12 67350 35176.04 52.23

Pronóstico de la producción de leche, mediante modelos ARIMA.

A continuación se estudian algunas posibles relaciones entre los litros de leche

producidos y otros indicadores asociados al comportamiento de la unidad

productiva.

En el caso de las vacas en ordeño (Anexo No1) en el año 1994 fue donde

existieron más animales de esta categoría, aunque no es el año de mayor

producción este coincide con una de las más altas producciones de leche en el

período, la coincidencia no tiene por qué ser total pues una vaca en ordeño no

siempre da la misma cantidad de leche, de todos modos puede observarse que los

años del 2001 al 2004, período de alta productividad de leche corresponden a

valores altos de esta variable. En las unidades de esta empresa siempre hubo mas

de 400 vacas en ordeño, como promedio anual.

En la figura No 3.2 se observa que las vacas en ordeño y la producción de leche

no muestran marcadas variaciones en los años estudiados. En el período

comprendido del 2006 al 2010 se observa una disminucion de las vacas en ordeño

y una producción de leche ligeramente baja pero relativamente estable, que osciló

entre los 808200 - 1011500 litros de leche.

Figura No 3.2: Relación entre vacas en ordeño y la producción leche.

0.00

200000.00

400000.00

600000.00

800000.00

1000000.00

1200000.00

1400000.00

1600000.00

0

1000

2000

3000

4000

5000

6000

7000

8000

9000

Vacas en ordeño Producción de leche

Pronóstico de la producción de leche, mediante modelos ARIMA.

Para analizar la influencia de la variable muertes, nacimientos, vacas en ordeño y

litros por vaca, como variables independientes, en la producción de leche, se

realizó un análisis de regresión lineal múltiple; las variables altamente significativas

( ) para explicar la producción de leche fueron los litros de leche por vaca

y las vacas en ordeño (Tabla No 3.2).

Variables independientes

Coeficiente de Estimación

Error Estándar

Valor de P

Constante -83813.4 2394.74 0.00

Litros de leche por vacas

17.65 0.30 0.00

Muertes 22.16 15.70 0.16

Nacimientos 2.56 13.59 0.85

Vacas en ordeño

147.34 3.89 0.00

Tabla No 3.2: Resumen del Análisis de Regresión Lineal Múltiple.

Por la correlación existente entre estas dos variables, se obtuvo la ecuación de

regresión a partir de un análisis de componentes principales, quedando:

El coeficiente de determinación obtenido fue de 97.40%

Para obtener un buen modelo para el pronóstico de producción de leche, se

tuvieron que incluir las variables vacas en ordeño y litros por vaca, ya que se vio

que la relación con vacas en ordeño no era tan estrecha (Figura No3.2) y la

variable litros por vaca es aún más difícil de predecir que la misma producción de

leche, por lo que la ecuación obtenida no brinda un instrumento de pronóstico.

En Cuba, en las estaciones del año solo resultan contrastantes dos épocas o

períodos, el período lluvioso, que abarca desde segunda mitad del mes de mayo

hasta octubre y el período poco lluvioso desde noviembre hasta la primera mitad

de mayo. Estos factores climatológicos van a influir en la producción de leche,

pues ellos ejercen influencia sobre el comportamiento productivo de los animales.

Pronóstico de la producción de leche, mediante modelos ARIMA.

En los gráficos Box-Plot, contenidos en la figura No3.3, se muestra el

comportamiento mensual y anual de la serie de producción de leche.

Figura No3.3: Comportamiento de la producción de leche en la UBPC”Maniabo” en

el período 1994-2010 anual y mensual.

Durante la época lluviosa, donde los animales disponen de abundantes fuentes de

alimentación con un mayor rendimiento y calidad de los pastos, ocurren las

mayores manifestaciones de altas producciones de leche; no siendo así en la

época poco lluviosa, donde se cuenta con una menor disponibilidad de pastos y

esto repercute negativamente en la producción de leche, ya que los animales que

no reciben una suplementación adecuada [23, 32].

Se puede apreciar que los meses de mayor producción de leche son los del

período Julio-Octubre, con un rango de producción entre los 2113000 y 2135200

litros de leche, que como se aprecia coinciden con el período lluvioso en el país,

se puede observar también que los meses de menor producción fueron los meses

de Enero, Febrero, Marzo y Abril con un rango de producción entre los 745600 y

los960900 litros de leche, que coincide con el período poco lluvioso.(Gráfico 1 de

la figura No3.3)

Pronóstico de la producción de leche, mediante modelos ARIMA.

Desde el punto de vista climático, las precipitaciones son el elemento de mayor

variación espacio–temporal del clima de Cuba y por tanto, determina las

principales regularidades del clima local en las diferentes zonas del país. La

provincia de Las Tunas, no es una excepción de lo anterior y muestra una

marcada diferencia en la distribución de sus precipitaciones anuales [30, 63] lo que

provoca cambios en la calidad y cantidad de los pastos. Estas fluctuaciones

estacionales, que dependen de la duración del período poco lluviosa, se refleja

también en cambios drásticos en la producción de pastos, el peso vivo de los

animales y la producción de leche en los vacunos, aspecto que repercute en las

pérdidas de la masa por muertes.

La UBPC “Maniabo”, después de irse recuperando poco a poco de las bajas

producciones hasta lograr alcanzar el pico de producción de leche en el 2003, tuvo

una recaída en el año 2005 comenzando nuevamente un decrecimiento

productivo progresivo, debido a la ocurrencia de las bajas precipitaciones, los altos

valores de humedad del aire, (69% y 82% como promedio), unido a las altas

temperaturas con valores comprendidos entre 33.2 oC a 38.1oC.

El análisis de series de tiempo necesita de series consistentes y estables, lo que

incrementa la confiabilidad de los resultados. Adicionalmente, la aplicación de los

modelos de Box y Jenkins impone disponer de un gran número de observaciones

(generalmente más de 50) [55].

Para que una serie sea considerada consistente y estable, los factores externos,

que puedan afectar la misma, no deben tener diferente naturaleza en los distintos

instantes de tiempo. Los cambios en la serie temporal no siempre se deben a sus

propias leyes de comportamiento y para considerarlas estables y consistentes es

necesario que estas no cambien en el período formado por el estudiado junto con

el pronosticado.

En lafigura No 3.4 se muestra el comportamiento de serie de producción de leche,

de la UBPC “Maniabo”, correspondiente a los datos mensuales de los años del

Pronóstico de la producción de leche, mediante modelos ARIMA.

1994 al 2010, donde se evidencian los movimientos oscilatorios de la producción

previstos en los Box-Plot y desde el punto de vista observacional muestra la no

presencia de tendencia. Como sugerían los Box-Plot anuales (Gráfico 2 de la

figura No 3.3)

Pronóstico de la producción de leche, mediante modelos ARIMA.

Figura No 3.4: Comportamiento de la producción de leche en la UBPC”Maniabo” en

el período 1994-2010.

0.00

20000.00

40000.00

60000.00

80000.00

100000.00

120000.00

140000.00

160000.00

180000.00

200000.00

1 6 11 4 9 2 7 12 5 10 3 8 1 6 11 4 9 2 7 12 5 10 3 8 1 6 11 4 9 2 7 12 5 10 3 8 1 6 11 4 9

1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010

Pro

du

cció

n d

e le

che

Pronóstico de la producción de leche, mediante modelos ARIMA.

Para comprobar la no presencia de tendencia en la serie se empleó el método de

suavizamiento polinomial, el cual se ajustaron curvas de diferentes grados

(polinomios) a los valores de la variable contenidos en la serie.

Para apreciar el efecto de suavizamiento se aplicaron polinomios de grado

diferentes , , y , en los tres casos los puntos en el gráfico

representan la serie original y los puntos producidos por el polinomio para cada

momento fueron enlazados con una línea continua. Con los suavizamientos con

y el polinomio produce curvas propias de el mismo que, además de no

comportarse de forma similar en ambos casos, desaparece con la aplicación del

polinomio de , que es el más estricto, pues mientras menor es el valor de ,

la fuerza de aislamiento producida por la serie será mayor, con esto se comprueba

que la serie no presenta tendencia. (Figura No 3.5, Figura No 3.6, Figura No 3.7)

Figura No 3.5: Suavizamiemto polinomial de la serie de producción de leche con

n=5.

Pronóstico de la producción de leche, mediante modelos ARIMA.

Figura No 3.6: Suavizamiemto polinomial de la serie de producción de leche con

n=3.

Figura No 3.7: Suavizamiemto polinomial de la serie de producción de leche con

n=1.

Esta serie fue considerada consistente y estable, además de no presentar

tendencia ni valores aberrantes y estar compuesta por 504 observaciones, que

son consideradas suficientes para realizar el análisis de una serie temporal.

Es necesario entonces comprobar si en la serie hay presencia de estacionalidad,

la estacionalidad ( ) en una serie temporal, es aquella componente de

movimiento, donde la variable tiene movimientos periódicos fuertes y de períodos

generalmente conocidos.

Pronóstico de la producción de leche, mediante modelos ARIMA.

Para detectar la presencia de estacionalidad en una serie, primeramente se

analiza visualmente el gráfico de la serie original [33] (Figura No 3.4) y de haber

dudas se utilizan los periodogramas.

En el trabajo se detectó la estacionalidad mediante el método observacional, por lo

que se tienen en cuenta los resultados mostrados en el primer gráfico de la figura

No3.3, donde se observa que los meses de mayores valores de producción son de

Julio a Octubre, que también se conoce que pertenecen al período lluvioso del

país y en el período poco lluviosa, o sea los meses de Enero a Abril la producción

de leche tiende a disminuir, evidenciando esto que la serie tiene un

comportamiento similar cada cierto período de tiempo.

Con el periodograma mostrado en la figura No 3.8 se confirmó el período

estacional que presento la serie (de izquierda a derecha aumenta la frecuencia y

disminuye el período), es de 12 meses (frecuencia 0.833), como el movimiento

periódico más importante en la serie analizada.

Figura No 3.8: Periodograma de la serie de producción de leche de 1994 al 2010.

Se observan, en la tabla No 3.3,tres valores de frecuencia que corresponden a las

mayores ordenadas, con las cuales se calcularon los períodos correspondientes.

Pronóstico de la producción de leche, mediante modelos ARIMA.

Frecuencia Período

0.0049 204.0

0.024 40.8

0.0833 12 Tabla No 3.3: Frecuencias correspondientes a las mayores ordenadas del

periodograma de la serie de producción de leche.

Para valores de frecuencias de 0.0049, 0.024, 0.0833, los cálculos arrojan

resultados de períodos con mayor importancia en 204, 40.8 y 12 meses

respectivamente siendo este último el de mayor ordenada compatible con el

comportamiento del proceso de exploración inicial del gráfico de la serie el período

de 12 meses. En cuanto al período de 204 meses se puede desechar pues no hay

suficientes datos para que esta sea confiable, los períodos de 12 y 40,8 meses se

determinará su significación por el periodograma integrado.

Como la serie no presentó tendencia, se obtuvo el periodograma integrado sin

extracción de la media, en este se observa la recta diagonal central que siguen las

amplitudes relativas acumuladas de una secuencia aleatoria, a sus lados se

muestran los intervalos de confianza para la desviación de la curva muestral al

75% (interior) y 95%(exterior).

Para facilitar la lectura del gráfico de la figura No 3.9, las amplitudes relativas

acumuladas, en la serie probada, para cada frecuencia se han unido con una

línea, que es la curva irregular. Se observa, que el aumento de la función del

periodograma integrado por encima del de la diagonal es mayor que el radio de la

banda de confianza en los períodos significativos, se puede observar entonces

que el único ciclo significativo es el estacional (12 meses).

Pronóstico de la producción de leche, mediante modelos ARIMA.

Figura No 3.9: Periodograma integrado de la serie de producción de leche.

La descripción de las componentes del modelo clásico se reduce entonces a la de

la única componente determinista existente que es la estacionalidad, los índices

estacionales se reflejan en el siguiente gráfico (Figura No 3.10), respaldando el

resultado de los Box-Plot mensuales (Gráfico 1 de la figura No 3.3).

Figura No 3.10: Periodograma estacional de la serie de producción de leche.

Teniendo en cuenta que la serie presenta estacionalidad, se realiza el análisis

apoyado en los modelos ARIMA propuestos por Box-Jenkins en 1970 y previo a la

Pronóstico de la producción de leche, mediante modelos ARIMA.

utilización de su metodología se verificó que las series cumplen con los requisitos

recomendados por otros autores, como son la consistencia la estabilidad y la no

existencia de valores aberrantes [44, 54] y que la serie tuviera también un número

suficiente de observaciones.

Para determinar los órdenes y del modelo a utilizar se obtienen las funciones

de autocorrelación y autocorrelación parcial de la serie con una diferencia

estacional y sin diferencias no estacionales (se vio que la serie tiene

estacionalidad pero no tiene tendencia), Se tomó el criterio de no probar con más

de una diferencia estacional ya que la serie no es muy larga y en este tipo de

diferencias se pierde un año de observaciones con cada diferencia. (Figura No

3.11)

Figura No 3.11: Autocorrelación y Autocorrelación parcial de la serie temporal con 1

diferencia estacional.

Estos gráficos sugieren que los órdenes requeridos son ≤ 1 y ≤ 3

En el presente trabajo se probaron varios modelos para determinar cuál de ellos

se ajustaba mejor a la serie de producción de leche; todos los modelos probados

Pronóstico de la producción de leche, mediante modelos ARIMA.

incluyeron una diferencia estacional (que fue suficiente para eliminar la

estacionalidad) y ninguna no estacional.

Los modelos probados fueron:

A) ARIMA(1,0,0)(0,1,0)12 con constante

B) ARIMA(1,0,1)(0,1,0)12 con constante

C) ARIMA(1,0,3)(0,1,0)12 con constante

D) ARIMA(1,0,2)(0,1,0)12 con constante

E) ARIMA(0,0,1)(0,1,0)12 con constante

F) ARIMA(0,0,2)(0,1,0)12 con constante

G) ARIMA(0,0,3)(0,1,0)12 con constante

Para la selección del mejor modelo se realizó la comparación de estos utilizando la

tabla de errores que aparece a continuación.(Tabla No 3.4)

Modelo Raíz del Error Cuadrático

Medio

( )

Error Medio

Absoluto

( )

Error Medio Absoluto

porcentual

( )

Error Medio

( )

Error Medio porcentual

( )

A 17494,5 12218,5 18,4691 51,3397 -3,23136

B 17502,7 12129,7 18,3265 -6,22601 -3,36211

C 17546,3 12015,3 17,914 -5,11895 -3,39983

D 17526,9 12085,7 18,2672 48,7076 -3,22063

E 19462,7 13969,8 21,2032 78,9262 -4,7455

F 18495,8 13380,1 20,8417 73,123 -4,33691

G 17778,6 12235,3 18,3771 126,011 -3,59895 Tabla No 3.4: Comparación de modelos probados para la serie de producción de

leche.

Cada uno de los estadísticos empleados está basado en los errores de predicción,

que son las diferencias entre los valores de las observaciones en tiempo y la

predicción de ese valor hecha a tiempo .

Los estadísticos Raíz del Error Cuadrático Medio ( ), el Error Medio Absoluto

( ) y el Error Medio Absoluto Porcentual ( ), miden la magnitud de los

Pronóstico de la producción de leche, mediante modelos ARIMA.

errores, o sea, el mejor será el que muestre el valor más pequeño; y el Error

Medio ( ) y el Error Medio Porcentual ( ) miden el sesgo estadísticamente y

se considera que el mejor modelo dará un valor próximo a

Tomando en consideración estos criterios se concluye que el modelo mejor

ajustado es el modelo , por ser el que presenta menor valor en casi todos los

errores clásicos y en los que no responde al error mínimo está casi en el mismo

rango de este. (Tabla No.8)

Con este modelo se han predicho los valores para la serie de producción de leche

en los de los años 2011, 2012 y 2013, con un total de 504 datos (de los años

1994-2010), con la aplicación del modelo ARIMA ( ), que asume que la mejor

predicción para los datos futuros, que está dado por un modelo paramétrico que

relaciona los valores más recientes con los valores anteriores y el ruido anterior.

En la tabla No 3.5se muestran los parámetros del modelo seleccionado, se

observa que el P-valor del término AR(1), es estadísticamente significativo, con un

nivel de significación menor que 0.05 y los medias móviles aunque no llegan a ser

individualmente significativos ya se vio que marcan una diferencia en los residuos

del modelo, la desviación típica estimada de la entrada de ruido blanco es igual a

17554.2.

Parámetro Estimación Error Estándar t Valor-P

AR(1) 0.548488 0.155125 3.53579 0.000513

MA(1) -0.244145 0.159292 -1.53269 0.127044

MA(2) -0.0797912 0.128899 -0.619024 0.536654

MA(3) -0.140858 0.0918899 -1.5329 0.126991

Media -1291.3 3972.3 -0.325076 0.745487

Constante -583.036 Tabla No 3.5: Parámetros del modelos ARIMA(1,0,3)x(0,1,0)12 con constante.

En lafigura No 3.12se muestra la autocorrelación, la autocorrelación parcial de los

residuos de la serie de producción de leche, así como el periodograma y el

Pronóstico de la producción de leche, mediante modelos ARIMA.

periodograma integrado ajustado, también de los residuos de la misma serie, se

evidencian en la figura No 3.13.

Se evidencia poca correlación residual solo se observa alguna significación en

elretardo1 (aunque no es una correlación altamente significativa) (Figura No 3.12)

y los periodogramas desmienten la significación de una estacionalidad residual

(Figura No 3.13).

Figura No 3.12: Autocorelación y Autocorrelación parcial de los residuos del

modelo.

Pronóstico de la producción de leche, mediante modelos ARIMA.

Figura No 3.13: Periodograma y periodograma integrado residual del modelo

ajustado de la serie de produccion de leche.

En la figura No.3.14se muestran los residuos aparentemente incorrelacionados,

como se observó también en el gráfico de correlaciones residuales de la figura

No3.12; y se observa que no hay ciclos significativos (Figura No3.13) y son, en

general, aceptablemente estacionarios (Figura No3.14)

La prueba de normalidad, (Normal Probability Plot), de los residuos del modelo

(Figura No3.15) ofrece frecuencias siguiendo una recta teórica para frecuencias

acumuladas de una secuencia aleatoria en el rango del residuo condistribución

normal de probabilidades, evidencia la falta de normalidad de los mismos

(corroborada por los test de normalidad Anexo No3 ) lo cual puede afectar el

cálculo de los límites de confianza del pronóstico, no así los errores que se

tomaron para la selección del modelo.

Estos resultados junto a las comparaciones con otros modelos de órdenes

cercanos, indican que este es el modelo de esta familia que resulta mejor ajustado

para la serie presentada o sea que no es posible, con los elementos que se

conocen de la serie, mejorar los resultados bajo el enfoque ARIMA.

Figura No 3.14: Gráfico de aleatorización de los residuos de la serie de producción

de leche, para el modelo ajustado.

Pronóstico de la producción de leche, mediante modelos ARIMA.

Figura No3.15: Gráfico de normalidad de los residuos de la serie de producción de

leche, para el modelo ajustado.

Se procede entonces a pronosticar la producción de leche para los años 2011,

2012 y 2013, por el modelo elegido. (Figura No3.16)

Se pronostica la producción de leche con un nivel de confianza del 95%.

Figura No3.16: Pronóstico de producción de leche para el 2011-2013.

Como se evidencia en el gráfico (Figura No 3.16) los intervalos de confianza para

el pronóstico en estos años son más amplios que los del 2011 ya que el error de

estimación va creciendo según se utilicen más datos estimados en sus cálculos, si

se quiere ir rectificando los pronósticos sobre la marcha bastaría con actualizar la

Pronóstico de la producción de leche, mediante modelos ARIMA.

serie con los datos observados según se acabe cada año y volver a calcular los

pronósticos, aunque se debe señalar que en este caso de estudio el

incumplimiento d normalidad delos residuales hace poco confiable la estimación

de los límites de los intervalos de confianza. Si se va a pronosticar a más largo

plazo se debe además repetir el proceso de obtención del modelo ya que las

condiciones pueden ir cambiando en el tiempo y aunque esto no ocurra con una

mayor cantidad de datos se puede mejorar la estimación de los parámetros del

modelo.

En la tabla siguiente (Tabla No 3.6)se muestran los valores reales y pronosticados

de la producción de leche para el año 2011, con estos se evidencia que no existe

variación significativa entre el pronóstico y el comportamiento real.

Período Pronóstico L(miles)

Real L(miles) (Meses)

Enero 34346 36530

Febrero 23507 25500

Marzo 27631 29650

Abril 29759 30340

Mayo 48656 49870

Junio 78244 79170

Julio 100483 101190

Agosto 110550 111090

Septiembre 109331 106960

Octubre 106621 106960

Noviembre 78115 78390

Diciembre 53721 53940 Tabla No 3.6: Comportamiento real de la producción de leche en el 2011.

Se muestran entonces los valores pronosticados de producción de leche, en la

UBPC, para los años 2012 y 2013 en la tabla No3.7

Período Pronóstico 2012 (ML)

Pronóstico 2013 (ML)

(Meses)

Enero 32057 30766

Febrero 22216 20925

Pronóstico de la producción de leche, mediante modelos ARIMA.

Marzo 26340 25049

Abril 27469 26178

Mayo 47365 46074

Junio 76953 75662

Julio 99192 97901

Agosto 109258 107967

Septiembre 108040 106749

Octubre 105330 104038

Noviembre 76824 75533

Diciembre 52421 51130 Tabla No 3.7: Comportamiento de la producción de leche en el 2012 y 2013.

Pronóstico de la producción de leche, mediante modelos ARIMA.

Conclusiones

Se estableció una metodología para pronosticar producciones de leche que

resultó muy adecuada en el caso de estudio desarrollado.

Con el análisis descriptivo se comprobó que las variables que permiten definir

y realizar el estudio de la serie de producción de leche, bajo las condiciones

de la UBPC "Maniabo", fueron los litros de leche por vaca y las vacas en

ordeño, ambas variables poco predecibles.

La serie de producción de leche evaluada no presenta tendencia, pero sí un

comportamiento similar cada cierto período de tiempo de 12 meses, o sea un

ciclo estacional de 12 meses.

Se utilizó un modelo ARIMA para la modelación de la serie, con el que se

lograron errores aceptables (por debajo del 18% de la media) y se obtuvieron

predicciones muy cercanas a los valores reales en el año 2011.

Pronóstico de la producción de leche, mediante modelos ARIMA.

Recomendaciones

Generalizar el uso de la metodología ARIMA, para la predicción de la

producción de leche, en las unidades de base.

Profundizar en este tema para lograr predicciones, con otros indicadores

productivos, en las cuales se utilicen otros modelos de series temporales.

Deben tomarse en consideración en estudios futuros otros factores que

pudieran influir en el rendimiento de la producción de leche

Pronóstico de la producción de leche, mediante modelos ARIMA.

Bibliografía

[1] Agresti A.: “Categorical and Data Analysis.” Editorial John Wiley & Sons.

New York. (1990)

[2] Aguirre A.: “Introducción al tratamiento de series temporales.

Aplicación a las Ciencias de la Salud.” Editorial. Díaz de Santos.

Departamento de Epidemiología y Bioestadística. Escuela Nacional de

Sanidad. I.S.B.N.:84-7978-153- X. Madrid. España. (1994)

[3] Akaike H.:“A New Look at the Statistical Model Identification.” Editorial

IEEE Transactions on Automatic Control. Vol. AC-19, Núm. 6. (1974)

[4] Akaike H.: “Markovian Representation of Stochastic Processes by

Canonical Variables.” SIAM Journal of Control. Vol. 13, Núm.1. (1975)

[5] Akaike H.: “Canonical Correlation Analysis of Time Series and the Use

of an Information Criterion.” Academic Press. (1976)

[6] Anderson D., Streeney, D.& Williams, T.: “Estadística para Finanzas,

Administración y Economía.” Editorial International Thomson. Disponible

en: http://www.monografias.com/Administracion_y_Finanzas/index [en

línea] 24/11/2012. (1999)

[7] Antúnez I.C.H.: “Análisis de Series de Tiempo.” Revista Contribuciones a

la Economía, con Número Internacional Normalizado de Publicaciones

Seriadas. ISSN 1696-8360. (2003)

[8] Arellano M.: “Estadística. Introducción al Análisis Clásico de Series de

Tiempo.” Disponible en: http://ciberconta.unizar.es/cv/mireyaarellano.htm

[en línea] 13/09/2012 (2001)

[9] Arroyo J., González G. R., Maté, C.: “Forecasting with interval and

histogram data: some financial applications, en Handbook of empirical

economics and finance.” Editorial. Chapman & Hall. (2010)

[10] Bauer D. y Wagner, M.: “Estimating Cointegrated Systems Using

Subspace Algorithms.” Journal of Econometrics. Vol. 111, (2002b)

Pronóstico de la producción de leche, mediante modelos ARIMA.

[11] Bello L.: “Estadística como apoyo a la investigación.”. Editorial L. Vieco

e Hijas. 1ra ed. Medellín. (2005)

[12] Bidegain M., Díaz A. and Barreiro M.: “Análisis Estadístico de Datos

Climáticos. Series temporales II.” Doc. Universidad de la República.

Montevideo, Uruguay (2009)

[13] Blumberg C.J.: “Commnets on “A simplified time-series analysis for

evaluating treatment interventions” Journal of Applied Behavior Analysis.

Vol.17.(1984)

[14] Box, G. E. P. y Jenkins, G. M.: “Time Series Analysis, Forecasting and

Control.” Editorial Holden-Day, San Francisco. (1970)

[15] Box, G. E. P. y Jenkins, G. M.: “Time Series Analysis, Forecasting and

Control.” Editorial Holden-Day, San Francisco, 2a ed. (1976)

[16] Box, G. E. P. y Jenkins, G. M.: “Time Series Analysis, Forecasting and

Control.” Prentice Hall, Englewood Cliffs, 3ra ed.(1994)

[17] Cabanas G. et al.: “Cambios temporales de la lluvia en el occidente de

la isla de Cuba.” Investigaciones Geográficas.Núm.38, Universidad de

Alicante, España. (2005)

[18] Cañedo A.R. and Arencibia J.R.: “Bioinformática: en busca de los

secretos moleculares de la vida.” Disponible en:

http://www.scielo.cl/scielo.php [en línea] 22/11/2012. (2005)

[19] Cansado E.: “Curso de Estadística General.” Ediciones Revolucionarias.

La Habana, Cuba.(1966)

[20] Castañeda, M.O.G, Ávila D.A., Vinay V.J.C.: “Comportamiento

productivo de ganado cruzado europeo por cebú en clima tropical.” In

Memorias XVI Reunión Internacional Sobre Producción de Carne y Leche

en Clima Cálido. Baja California, México. (2006)

[21] Chatfield C.: “The Analysis of Time Series: An Introduction.” Editorial

Chapman and Hall. London. (2003)

[22] Chatfield C.: “Time Series Forecasting.” Editorial Chapman and Hall.

I.S.B.N.:1-58488-063–5. United Kingdom.(2000)

Pronóstico de la producción de leche, mediante modelos ARIMA.

[23] CITMA.: “Informe de la Delegación Provincial.”(2003)

[24] Colás M. & Lamazares et al.: “Evaluación epidemiológica de procesos

respiratorios bacterianos en gallinas ponedoras.” Revista de Salud

Animal. Vol.33. (2011)

[25] Cooper D.M. y Wood E.F.: “Identifying Multivariate Time Series Models.”

Journal of Time Series Analysis. Vol. 3. (1982)

[26] Coutín M.G.: “Las series temporales.” Trabajo de Diploma (en opción del

título de Licenciado en Contabilidad y Finanzas). Facultad de Contabilidad y

Finanzas. Universidad de La Habana. Cuba. (2003)

[27] Coutín M.G.: “Métodos para la detección de la variación estacional en

Cuba aplicados a la vigilancia en salud.” Revista Cubana Salud Pública.

Unidad Nacional de Análisis y Tendencias en Salud Nacional, MINSAP.

Cuba. (2007)

[28] Decreto Ley 142.: “Sobre las UBPC.” Dirección Nacional de la ANAP.

Cuba. (1993)

[29] Delgado A.: “Estudio de la producción de carne a base de pasto

Pangola (Digitaria decumbens Sten) con suplementación durante la

estación seca.”Tesis de Dr. en Ciencias. Instituto de Ciencia Animal. La

Habana, Cuba. (1978)

[30] Febles G. & Ruiz T.E.: “The global climatic change and its impacts in

Cuba. Actions for the future.” Cuban Journal Agriculture. (2009)

[31] Fernández P.: “Cuatro experiencias exitosas en UBPC.” Biblioteca

ACTAF. La Habana, Cuba. (2007)

[32] Funes M., Lantiga M., Van Keulen H.: “Agro‐Ecological Indicators (AEIs)

for dairy and mixed farming systems classification: Identifying

alternatives for the Cuban livestock sector.” Journal of Sustainable

Agriculture. Vol.33. Núm. 4.(2009)

[33] Granger C.: “Análisis de Series Temporales, Cointegración y

Aplicaciones.” Disponible en:

http://www.revistaasturianadeeconomia.org/raepdf/30/GRANGER.pdf [en

Pronóstico de la producción de leche, mediante modelos ARIMA.

línea] 28/04/2009. (2004)

[34] Grubb H.: “A Multivariate Time Series Analysis of Some Flour Price

Data.” Applied Statistics. Vol. 41 (1992)

[35] Helsfenstein U.: “Box Jenkins modelling in medical research.” Statistics

Methods. Vol. 5. Núm.1. (1996)

[36] Herman J., Grohn Y., Erbih E.: “Influence of milk somatic cell and age on

cheese yield.” Journal Dairy Science. Vol. 74. (1996)

[37] Hernández M.: “Los suelos ganaderos en Cuba. Curso Fundamentos

de la producción de pastos.” Programa de maestría en Pastos y Forrajes.

Estación Experimental de Pastos y Forrajes "Indio Hatuey". Matanzas.

Cuba. (2002)

[38] Hurtado C. & Gonzalo R.: “Tópicos de Minería de Datos.” Universidad de

Chile. Facultad de Ciencias Físicas y Matemáticas. Departamento de

Ciencias de la Computación. Semestre primavera. Santiago de Chile, Chile.

(2008)

[39] Huyhn H. and Feldt L.S.: “Conditions under which mean square ratios in

repeated measures designs have exact F-distributions.” Journal of the

American Statistical Association. (1970)

[40] Juez, M.P.: “Herramientas estadísticas para la investigación en

Medicina y Economía de la Salud.” Centro de Estudios Ramón Areces.

Madrid, España. (2001)

[41] Leng R.A., Preston T.R.: “Diagnostico general y tendencia en relación a

la ganadería y el medio ambiente.” Memorias del curso. Taller

internacional. Ganadería, Desarrollo Sostenible y Medio Ambiente. Ciudad

de La Habana, Cuba. (2003)

[42] Loma J.L.: “Experimentación agrícola.” Unión Tipográfica. Editorial

Hispano-americana. México, D.F.(1955)

[43] Machado R., Menéndez J.: “Descripción de gramíneas y leguminosas.

En: Los Pastos en Cuba.” Tomo l. Producción. La Habana, Cuba. (1979)

Pronóstico de la producción de leche, mediante modelos ARIMA.

[44] Marchall & Mason.: “Estadística para Administración y Economía.”

Disponible en: http://www.monografias.com/trabajos901/nuevas-

tecnologias-edicion-montaje/nuevas-tecnologias-edicion-montaje.shtml 11ª

ed. Editorial Alfa Omega. México. [en línea] 20/01/2012 (2004)

[45] Martín G., Labeaga J.M., Mochón F.: “Introducción a la Econometría.”

Prentice Hall Iberia. Madrid (1997)

[46] Maté C., Ruiz-Falcó A.: “Design for maintainability. A methodology

using statistical methods in Maintenance Management and

Optimization.” Ed. European Commission. Luxemburg. (2003)

[47] Maté C.: “A multivariate analysis approach to forecasts combination.

Application to Foreign Exchange (FX) markets.” Revista Colombiana de

Estadística. Vol. 34, Núm. 2. (2011)

[48] Maté C.: “A multivariate analysis approach to forecasts combination.

Application to Foreign Exchange (FX) markets.” Revista Colombiana de

Estadística. Vol. 34, Núm. 2. (2011)

[49] Maté C.: “Curso general sobre STATGRAPHICS. Procedimientos.

Métodos Estadísticos. Aplicaciones. Ejercicios Resueltos.” Tomo II.

Editorial Universidad Pontificia Comillas. Madrid, España.(1995)

[50] McCandless G., Florencia, M.T.: “Modelos econométricos de predicción

macroeconómicos en la Argentina.” Banco Central de la República.

(1999)

[51] MINAG.: “Manual de Normas y Procedimientos del Departamento de

Registros Pecuario.” Centro Nacional de control Pecuario, Ministerio de la

Agricultura. La Habana, Cuba. (2000)

[52] Ministerio de Finanzas y Precios.: “Precios precio de acopio de ganado

bovino en pie.” Resolución No.153-2007. (2007)

[53] Ministerio de Justicia.: “Gaceta Oficial de la República de Cuba, 2004.”

La Habana, Cuba. (2004)

Pronóstico de la producción de leche, mediante modelos ARIMA.

[54] Molinero M.L.: “Liga Española para la lucha contra la Hipertensión

Arterial.” Revista de la Asociación de la Sociedad Española de

Hipertensión, por (Alce Ingeniería). Disponible en: http://www.seh-

lelha.org/stat1.htm [en línea] 7/02/2013 (2004)

[55] Montes de Oca R.L. et al.: “Evaluación del potencial de las series

temporales para predecir las propiedades de calidad de la guayaba

(Psidium guajava L), variedad enana roja EEA 1-23, durante su

conservación a temperatura ambiente.” Revista Ciencias Técnicas

Agropecuarias. Vol.19 .Num.2 (2010)

[56] Otero M.: “Econometría, Series Temporales y predicciones.” Editorial

HG. Madrid.(1993)

[57] Peña C.J., Guillamon F.A. & Nieto V.S.: “Test de independencia en series

temporales.” Universidad Politécnica de Cartagena y Escuela Técnica

Superior de Ingeniería Industrial. Departamento de Matemática Aplicada y

Estadística. Disponible en:

http://repositorio.bib.upct.es/dspace/handle/10317/3180 [en línea]

7/03/2013. (2005)

[58] Peña, D.: “Estadística, Modelos y Métodos 2. Modelos Lineales y

Series Temporales.” Alianza Universidad, Madrid. (1989)

[59] Preston T.R. y Leng R.A.:“Matching ruminant production systems with

available resouses in the tropics and subtropics.” Penambul Books,

Armidale and CTA. Wageningen, Australia.(1987)

[60] Revilla P. and Pilar R.: “Analysis quality control from ARIMA modeling.”

Argentina. (2000)

[61] Revilla P., Rey P. and Espasa A.: “Selective editing methods based in

Time Series modelling.” Topic (iii): New methodological and technological

developments in statistical data editing. Conference of European

statisticians. Statistical commission and Working. Paper No. 22. Rome, Italy.

(1999)

Pronóstico de la producción de leche, mediante modelos ARIMA.

[62] Schaefer M., Barker, B., Taylor G. y Wallis J.: “Regional precipitation-

frequency analysis and spatial mapping for 24-hour precipitation for

Oregon.” Oregon Climate Service. (2006)

[63] Schaefer M.: “Regional precipitation-frequency analysis and spatial

mapping for 24-hour and 2-hour durations in eastern Washington.”

Oregon Climate Service. (2007)

[64] SPSS.: Software estadístico SPSS para Windows. Versión 15.0.1.

Copyright IBM Corporation 2010 IBM Corporation. Route 100 Somers. NY

10589 (2006)

[65] Suárez O.M.: “Métodos de suavizamiento y pronóstico para series de

tiempo.” Disponible en: http://www.monografias.com/trabajos87/metodos-

suavizamiento-y-pronostico-series-tiempo/metodos-suavizamiento-y-

pronostico-series-tiempo.shtml [en línea] 12/02/2013 (2012)

[66] Terceiro J.: “Estimation of Dynamics Econometric Models with Errors

in Variables.” Springer-Verlag. Berlin. (1990)

[67] Tsay R.S.: “Identifying Multivariate Time Series Models.” Journal of

Time Series Analysis. Vol. 10. Núm. 4.(1989a.)

[68] Wei W.: “Time serie analysis. Univariante and Multivariante Methods.”

Addison-Wesley. New York. EE.UU. (1990)

[69] Wold, H.O.A.: “A Study in the Analysis of Stationary Time Series.”

Almqvistand Wiksell. Uppsala.(1964)

Pronóstico de la producción de leche, mediante modelos ARIMA.

ANEXOS

Anexo No1

Tabla de estadígrafos de la variable vacas en ordeño en la UBPC “Maniabo” en los años 1994-2010.

Años N

Vacas en ordeño

Media D.E. CV

1994 12 696 58.45 8.39

1995 12 599 52.59 8.79

1996 12 468 76.8 16.4

1997 12 570 80.52 14.14

1998 12 620 98.02 15.81

1999 12 594 57.55 9.68

2000 12 555 87.8 15.81

2001 12 670 112.2 16.74

2002 12 685 51.6 7.53

2003 12 640 99.86 15.61

2004 12 678 119.12 17.56

2005 12 552 70.96 12.87

2006 12 465 127.1 27.35

2007 12 498 61.92 12.44

2008 12 464 56.08 12.09

2009 12 418 80.75 19.31

2010 12 401 102.85 25.65

Pronóstico de la producción de leche, mediante modelos ARIMA.

Anexo No2

Tabla de estadígrafos de la variable litros por vaca en la UBPC “Maniabo” en los años 1994-2010.

Años N

Litros por vaca

Media D.E. CV

1994 12 4241.67 1642.87 38.73

1995 12 3133.33 1225.73 39.12

1996 12 5333.33 1847.52 34.64

1997 12 4658.33 1454.43 31.22

1998 12 4750 1840.7 38.75

1999 12 3925 1547.51 39.43

2000 12 4700 1684.69 35.84

2001 12 5025 1016.34 20.23

2002 12 4591.67 1740.15 37.9

2003 12 5970 1687.31 28.26

2004 12 5289.17 1589.15 30.05

2005 12 4708.33 2449.66 52.03

2006 12 5491.67 1817.32 33.09

2007 12 5625 963.07 17.12

2008 12 5358.33 1655 30.89

2009 12 4966.67 1306.86 26.31

2010 12 5158.33 1617.78 31.36

Pronóstico de la producción de leche, mediante modelos ARIMA.

Anexo No.3

Test para comprobar la normalidad de los residuos del modelo ajustado.

Test aplicados P-valor

Chi-cuadrado 0.00168536

Shapiro-Wilks 2.35682E-9

Puntuación Z para asimetría 0.00410593

Puntuación Z para curtosis 3.2224E-