Análisis estadístico de la demanda de agua potable de la ... · Tema C: Agua y Ciudad 4.1...

11
Tema C: Agua y Ciudad Análisis estadístico de la demanda de agua potable de la ciudad de Valencia. Aplicación a la predicción con análisis de series temporales César Alejandro Espinoza Rodríguez (1) y Juan Bautista Marco Segura (2) (1) Ingeniero Civil; Estudiante de doctorado en Ingeniería hidráulica y medio ambiente; Universidad Politécnica de Valencia; [email protected] (2) PhD, I.C.C.P.; Catedrático y director del Departamento de Ingeniería Hidráulica y Medio Ambiente (DIHMA); Universidad Politécnica de Valencia; [email protected] Resumen La predicción de la demanda de agua potable es necesaria para el diseño, operación y gestión de sistemas urbanos de abastecimiento. En la parte correspondiente al diseño, la predicción se aplica para proyectar y planear nuevos desarrollos o expansiones, como por ejemplo tanques de almacenamiento, estaciones de bombeo y capacidad de conducción de acueductos. En cuanto a la operación y gestión, la predicción cobra especial relevancia en sistemas con déficit en sus suministros o en sistemas con demandas máximas y mínimas de corta duración que someten al sistema a un estrés muchas veces evitable. Un modelo predictivo con fundamento en el análisis de las series de demandas -actualmente son de fácil obtención ya que los sistemas de registro de datos tipo SCADA son cada vez más habituales en organismos operadores modernos- puede representar una potente herramienta para los gestores de sistemas de agua potable y resultar en beneficios como por ejemplo, una operación más eficiente que provoque una reducción de fugas y ahorro de energía, entre otras. A lo largo de este documento, haremos un análisis estadístico de la serie temporal del volumen total de agua potable demandado diariamente a lo largo de 4 años por los usuarios de la ciudad de Valencia, España. Se hará un análisis conjunto con variables climáticas (temperatura máxima, mínima y media) y sociológicas (días festivos y puentes) en busca de una mejor comprensión del comportamiento de la demanda diaria y sus patrones de variación. En este estudio se investiga el desempeño del análisis de series temporales por medio de modelos ARIMA para la predicción de la demanda de agua a corto plazo. Se presta especial atención al calendario de festividades (propio de cada ciudad y comunidad) por representar un aporte de variabilidad puntual o temporal que perturba el patrón de demandas que se reproduce a lo largo del año. 1 Introducción En un mundo en el que la población y las zonas urbanas se encuentran en constante expansión, uno de los primeros efectos en aparecer es el incremento de la demanda de recursos hídricos. En las últimas décadas las sociedades se han vuelto cada vez más conscientes de la importancia de un buen uso del agua. El uso eficiente del agua tiene no solo efectos benéficos en lo que respecta a lo económico, a su vez se refleja en beneficios ambientales y de sostenibilidad. Para poder realizar un adecuado diseño y operación de los sistemas de recursos hídricos y un uso eficiente del agua disponible, se requiere la habilidad de predecir los caudales disponibles y demandados. La modelación y la predicción de la demanda de agua urbana cobran especial relevancia en ciudades donde los recursos hídricos son limitados. De entre la variedad de metodologías que existen para modelar y predecir la demanda de agua urbana, los modelos estocásticos destacan por ser una metodología consolidada y apropiada para el tratamiento de la incertidumbre y la aleatoriedad del proceso.

Transcript of Análisis estadístico de la demanda de agua potable de la ... · Tema C: Agua y Ciudad 4.1...

Tema C: Agua y Ciudad

Análisis estadístico de la demanda de

agua potable de la ciudad de Valencia.

Aplicación a la predicción con análisis de series temporales

César Alejandro Espinoza Rodríguez (1) y Juan Bautista Marco Segura

(2)

(1)Ingeniero Civil; Estudiante de doctorado en Ingeniería hidráulica y medio ambiente;

Universidad Politécnica de Valencia; [email protected]

(2)PhD, I.C.C.P.; Catedrático y director del Departamento de Ingeniería Hidráulica y Medio

Ambiente (DIHMA); Universidad Politécnica de Valencia; [email protected]

Resumen La predicción de la demanda de agua potable es necesaria para el diseño, operación y gestión de sistemas

urbanos de abastecimiento. En la parte correspondiente al diseño, la predicción se aplica para proyectar y planear

nuevos desarrollos o expansiones, como por ejemplo tanques de almacenamiento, estaciones de bombeo y

capacidad de conducción de acueductos. En cuanto a la operación y gestión, la predicción cobra especial

relevancia en sistemas con déficit en sus suministros o en sistemas con demandas máximas y mínimas de corta

duración que someten al sistema a un estrés muchas veces evitable.

Un modelo predictivo con fundamento en el análisis de las series de demandas -actualmente son de fácil

obtención ya que los sistemas de registro de datos tipo SCADA son cada vez más habituales en organismos

operadores modernos- puede representar una potente herramienta para los gestores de sistemas de agua potable y

resultar en beneficios como por ejemplo, una operación más eficiente que provoque una reducción de fugas y

ahorro de energía, entre otras. A lo largo de este documento, haremos un análisis estadístico de la serie temporal

del volumen total de agua potable demandado diariamente a lo largo de 4 años por los usuarios de la ciudad de

Valencia, España. Se hará un análisis conjunto con variables climáticas (temperatura máxima, mínima y media)

y sociológicas (días festivos y puentes) en busca de una mejor comprensión del comportamiento de la demanda

diaria y sus patrones de variación.

En este estudio se investiga el desempeño del análisis de series temporales por medio de modelos ARIMA para

la predicción de la demanda de agua a corto plazo. Se presta especial atención al calendario de festividades

(propio de cada ciudad y comunidad) por representar un aporte de variabilidad puntual o temporal que perturba

el patrón de demandas que se reproduce a lo largo del año.

1 Introducción En un mundo en el que la población y las zonas urbanas se encuentran en constante expansión, uno de los

primeros efectos en aparecer es el incremento de la demanda de recursos hídricos. En las últimas décadas las

sociedades se han vuelto cada vez más conscientes de la importancia de un buen uso del agua. El uso eficiente

del agua tiene no solo efectos benéficos en lo que respecta a lo económico, a su vez se refleja en beneficios

ambientales y de sostenibilidad.

Para poder realizar un adecuado diseño y operación de los sistemas de recursos hídricos y un uso eficiente del

agua disponible, se requiere la habilidad de predecir los caudales disponibles y demandados. La modelación y la

predicción de la demanda de agua urbana cobran especial relevancia en ciudades donde los recursos hídricos son

limitados. De entre la variedad de metodologías que existen para modelar y predecir la demanda de agua urbana,

los modelos estocásticos destacan por ser una metodología consolidada y apropiada para el tratamiento de la

incertidumbre y la aleatoriedad del proceso.

Tema C: Agua y Ciudad

2 Área de Estudio Un problema importante en la gestión de sistemas de suministro y distribución de agua potable, es la predicción

de la demanda diaria con el fin de programar en las fuentes de captación los caudales que serán demandados,

programar los bombeos necesarios buscando minimizar los costes energéticos y evitar sobrepresiones en la red

de distribución. El caso de la ciudad de Valencia no es la excepción. El sistema de abastecimiento suministra

agua potable a 807,396 habitantes (Valencia-Ayuntamiento, 2006b1) en su zona urbana y contaba al 2005 con

417,868 abonados, de los cuales 372,580 eran domésticos y 45,288 industriales (Valencia-Ayuntamiento,

2006a2), el área metropolitana que incluye a l’horta nord, l’horta sud, l’horta oest y l’horta centro también son

abastecidas por este sistema. La ciudad es abastecida desde los sistemas hidrológicos de los ríos Júcar y Turia,

los caudales obtenidos desde el río Júcar, derivados en la presa de Tous son tratados en la ETAP Picassent-El

Realón. La ETAP La Presa-Manises trata caudales con origen en ambos ríos. En la Tabla 1 se presenta un

resumen de las capacidades de tratamiento y almacenamiento de las ETAP mencionadas. Resumen de estaciones

de tratamiento de agua potable que abastecen a Valencia.

ETAP Capacidad de

Tratamiento (m3/seg.) Capacidad de

Tratamiento (m3/día) Capacidad de

Almacenamiento (m3) La Presa 3.2 276,000 90,000

El Realón 3.0 259,000 100,000

Total 6.2 535,000 190,000

La ciudad de Valencia ha experimentado un crecimiento de población a lo largo de las últimas décadas,

reflejándose en un incremento del 16.99% en los últimos 24 años y que ha provocado un aumento de la demanda

de agua para abastecimiento urbano. El clima en Valencia es mediterráneo con temperaturas mínimas en los

meses de Enero y Febrero, temperaturas máximas en el mes de agosto y con lluvias principalmente en los meses

de octubre y noviembre.

3 Datos Se han analizado 4 años (1461 días) de datos de demanda de agua urbana (m

3/día) y temperatura del periodo

comprendido entre 2001 y 2004. Los datos de demanda analizados, corresponden a la cantidad de metros cúbicos

aportados cada día a la red de distribución de agua potable que abastece a la totalidad de la población de la

ciudad de Valencia desde las dos estaciones de tratamiento mencionadas en el punto 3 de este documento. El

volumen de agua distribuida mediante la red de baja presión –utilizada principalmente para riego de jardines– de

la ciudad no fue considerada en este estudio. Los datos de demanda fueron proporcionados por el departamento

técnico de Aguas de Valencia, las series de temperaturas fueron obtenidas en el Instituto Nacional de

Meteorología (INM) y corresponden a los datos registrados en la estación meteorológica que se localiza en las

instalaciones del INM del parque de viveros municipales.

Los tres primeros años de datos fueron utilizados para estimar los parámetros de los modelos y un año se ha

reservado para su validación.

4 Análisis preliminar El comportamiento de la demanda a lo largo del tiempo es el resultado del uso conjunto de los diferentes

consumidores de agua abonados al sistema (domésticos, comerciales, industriales, etc.), cada uno con sus

patrones característicos. El objetivo del análisis preliminar es identificar las características generales de la serie

temporal en estudio para contar con argumentos con los cuales tomar decisiones respecto al tipo de modelo

estadístico que le será ajustado posteriormente. Se realizará un análisis cualitativo y cuantitativo de la serie de

demandas, considerando la serie completa así como series individualizadas por año. Se hará un análisis

descriptivo de estadística clásica y de métodos gráficos con el fin de identificar características relevantes que nos

expliquen rasgos del comportamiento de la serie.

Tema C: Agua y Ciudad

4.1 Estadísticos básicos y patrones predominantes de la demanda

4.1.1 Tendencia

La serie de demandas de la Figura 1 presenta una clara tendencia a la alza en el periodo en estudio. Al ajustar

una línea de tendencia lineal observamos que el aumento de la demanda fue de 10,260 m3/año, aunque no se

descarta que si se contara con una serie más larga, en un futuro la tendencia pudiera ser revertida, por ejemplo

mediante programas de recuperación de perdidas por fugas en las redes, racionamiento o por una sensibilización

de la población en el uso del agua. En la misma figura se puede observar que existe un patrón estacional similar

en todos los años, con valores mínimos en los tercios de cada uno de los años y valores máximos a la mitad del

año, cada uno de estos máximos y mínimos con distinta magnitud. El valor medio de la serie oscila en los

300,000 m3 con valores mínimos en los meses de abril y agosto y máximos a finales de los meses de junio. La

Tabla 2 resume los estadísticos básicos de cada año y de la serie completa. Los valores de asimetría nos indican

que los valores tienen una distribución cercana a la normal.

Figura 1 Serie temporal de demanda de agua de la ciudad de Valencia. 2001-2004

Tabla 1 Resumen de estadísticos básicos de la serie de demandas

Estadístico 2001 2002 2003 2004 2001-04 Datos 365 365 365 366 1461

Media* 307,995 311,240 331,019 335,998 321,573

Mediana* 309,212 314,793 333,687 337,154 324,001

Desv. Est.* 24,346 23,983 22,758 22,794 26,409

Varianza 5.9E+08 5.8E+08 5.2E+08 5.2E+08 7.0E+08

Mínimo* 218,212 230,605 238,398 247,273 218,212

Máximo* 367,439 367,319 386,866 386,276 386,866

Rango* 149,227 136,714 148,468 139,002 168,654

Asimetría -0.49 -0.61 -0.54 -0.53 -0.44

Curtosis 0.31 0.49 1.23 0.05 0.36

*.Valores en m3/día

4.1.2 Estacionareidad de la serie de demandas

De la Figura 1 es evidente que la serie no es estacionaria respecto a la media. En la Tabla 2 se observa que el

valor medio de la demanda urbana en metros cúbicos por día, aumentó desde los 307,995.92 hasta los

335,998.80. Este incremento de la demanda, en la mayoría de las ocasiones, es explicado como la resultante del

crecimiento de la población abastecida de agua para satisfacer sus necesidades. Las series no estacionarias

pueden ser detectadas calculando el coeficiente de la función de autocorrelación (ACF) definido por Box y

Jenkins (1976)8.

Tema C: Agua y Ciudad

( ) ( )( )( ) ( ) ( )

( ) ( )( ) ( ) ( )( )2/1

22

2/122 11

1

−−

−−

−−•

=

∑∑∑∑

∑ ∑∑

++

++

ktkttt

kttktt

k

xkn

xxkn

x

xxkn

xx

r

Donde x es la variable, t es el tiempo y los sumatorios se realizan desde t=1 hasta t=n-k. La ecuación presentada

determina el grado de correlación entre observaciones que están separadas k unidades de tiempo. La Figura 2

representa el correlograma ó (ACF) de la serie analizada. Se observa que existe una dependencia fuerte con los

valores anteriores, o lo que es lo mismo, los coeficientes de rk no se reducen rápidamente hacia cero, el

comportamiento esperado para una serie estacionaria.

Figura 2 Autocorrelograma de la demanda de agua urbana. 2001-2004

4.1.3 Estacionalidad y periodicidad

De la inspección visual de las figuras presentadas y del cuadro de estadísticos básicos podemos observar que la

serie de demandas de agua de la ciudad de Valencia, presenta una muy marcada variación estacional influenciada

por factores climáticos y sociales como son los periodos vacacionales y el calendario de festividades. Sin

embargo, existen también componentes periódicos en la demanda que se repiten a lo largo del tiempo como es el

patrón semanal de la demanda. Es esperable por ejemplo, que cada día de la semana a lo largo del tiempo

registre valores de demanda diaria similares. La Figura 3 representa los patrones de la demanda semanal para

cada uno de los años de la serie.

Figura 3 Patrón de demanda semanal. 2001-2004

Analíticamente las periodicidades dentro de un ciclo anual pueden ser fácilmente identificadas desde los datos de

demanda registrados mediante el análisis de Fourier, definido como:

+

+= ∑

= N

mtb

N

mtaatx m

N

m

m

ππ 2sin

2cos)(

2/

1

0

Tema C: Agua y Ciudad

Donde a 0 es la media del conjunto de datos, m es el número de armónicos, N la longitud de la serie, y

t=1,2,...,N es el tiempo. Los coeficientes de la serie de Fourier am y bm se calculan usando la transformada

discreta de Fourier, cuando m≠N/2 se definen como:

∑=

=

N

m

tmN

mtx

Na

1

2cos

2 π ∑

=

=

N

m

tmN

mtx

Nb

1

2sin

2 π

Y cuando m=N/2

( )∑=

−=N

m

t

tm xN

a1

11

0=mb

La Figura 4 presenta los resultados obtenidos con el análisis y se muestra que el armónico predominante en

todas las series corresponde con el patrón semanal, es decir con el de 7 días de duración (0.14 ciclos/día). Para

los años 2001 al 2004 este armónico nos produce una varianza explicada de 26, 17, 27 y 29% respectivamente.

En la Figura 2 de la sección 5.1.2, el correlograma de la serie, se puede observar que existe un patrón repetitivo

cada 7 retardos, lo cual viene a confirmar los resultados obtenidos por el análisis de Fourier.

Figura 4 Periodograma de frecuencias de la serie de demandas de agua urbana.

4.2 Variable Exógena – Temperatura

Es muy frecuente encontrar en las publicaciones científicas relativas a la modelación y predicción de la demanda

que la temperatura del aire (entre otras variables climáticas) es utilizada para explicar el comportamiento de la

demanda de agua urbana[2,3,4,5,6]

). Es de esperar que en épocas más cálidas la demanda de agua de las ciudades

aumente. La Tabla 3 presenta los estadísticos básicos de la temperatura registrada.

Tabla 2 Resumen de estadísticos básicos de la serie de temperatura media diaria

Estadístico 2001 2002 2003 2004 2001-04 Datos 365 365 365 366 1461

Media* 19.22 18.85 19.11 17.99 18.79

Mediana* 20.00 18.80 18.00 17.40 18.50

Desv. Est.* 5.67 4.94 6.27 6.22 5.81

Varianza 32.25 24.44 39.33 38.69 33.85

Mínimo* 4.00 9.80 5.40 5.20 4.00

Máximo* 30.50 28.00 31.90 30.20 31.90

Rango* 26.50 18.20 26.50 25.00 27.90

*.Valores en ºC

Tema C: Agua y Ciudad

Figura 5 Evolución conjunta: temperatura media y demanda diaria. Año 2001 y 2001-2004

En los gráficos de la Figura 5 se presenta la evolución conjunta de la serie de demandas y la temperatura media

para la serie completa y para el año 2001, se aprecia que si bien es cierto que existe una correlación en el

comportamiento de las series, ésta no parece ser demasiado fuerte como para considerar que la temperatura guía

el proceso de demanda. Los valores máximos de las series no son contemporáneos. Existen periodos en los

cuales la relación es inversa (destacados con flecha) y durante los cuales, aparentemente otro fenómeno pasa a

gobernar el proceso o cuando menos lo perturba temporalmente. Los coeficientes de correlación de Pearson (r)

calculados para la demanda diaria y la temperatura media en el tiempo (t) y (t-1) se presentan en la Tabla 4. Los

valores de correlación obtenidos son bajos (0.1834 y 0.1722) y el proceso se explica de una mejor manera por

sus propios valores pasados, ya que se obtiene un coeficiente de correlación más alto (0.6686).

Tabla 3 Coeficientes de correlación Temperatura media-Demanda diaria

Variable r Demanda (t)

Temp. media (t) 0.1834

Temp. media (t-1) 0.1722

Demanda (t-1) 0.6686

5 Determinación del Modelo de series temporales ARIMA

5.1 Formulación básica

Los modelos de series temporales ARIMA fueron introducidos por Box y Jenkins (1976)8, y han sido

ampliamente utilizados durante las últimas décadas para modelar y predecir el comportamiento de series de

demandas con diversas características [3,4,5,6,7

]. La notación básica de los modelos Box y Jenkins con términos

no estacionales de orden (p,d,q) y términos estacionales de orden (P,D,Q) se suele abreviar como modelo

SARIMA(p, d, q)x(P, D,Q)s y puede ser escrito como

t

s

Qqt

Dsds

Pp ZBBXBBBB )()()1()1)(()( Θ=−−Φ θφ

Tema C: Agua y Ciudad

5.2 Determinación del los órdenes s, d y D

En el análisis exploratorio realizado anteriormente hemos encontrado que la serie de demandas no es estacionaria

por tener una tendencia creciente. La técnica más habitual para transformar una serie en estacionaria es la

diferenciación simple y usualmente no hacen falta más de 2 diferencias para conseguirlo, es decir que d suele

tomar valores pequeños, la misma regla se aplica para los valores de D, es decir las diferencias estaciones. La

anterior recomendación tiene el objetivo de no perder el sentido físico de la serie que estemos analizando.

Mediante el análisis de Fourier y la observación del ACF pudimos comprobar que existe un componente

periódico predominante en la serie temporal de 7 días, es decir s=7. Se probaron varias combinaciones de

órdenes de diferencia, los mejores ACF y PACF (función de autocorrelación parcial) se presentan en la Figura 6.

Ya que el ACF de la serie original nos indica que la serie no es estacionaria y presenta valores máximos cada 7

periodos, se aplicó una diferencia regular de orden 1 y una diferencia estacional de orden 7. Las

transformaciones aplicadas resultan en PACF y ACF con una apariencia que puede ser abordada con modelos

ARIMA.

Figura 6 ACF y PACF de la serie de demandas observada y diferenciada

5.3 Selección de los ordenes p, q, P y Q

Una de las propiedades de la metodología de Box y Jenkins, es la de que los órdenes AR y MA regulares y

estacionales pueden ser deducidas mediante la observación de los ACF y PACF. En nuestro caso, se observa una

leve sobrediferenciación ya que los valores de correlación se han vuelto negativos y presentan el patrón

característico que nos indica la necesidad de uno o varios componentes de media móvil (MA) no estacionales –

un corte rápido del ACR y una disminución lenta del PACF de valores negativos–. El número de valores de

PACF fuera de los límites críticos (no presentados en las figuras) nos señala que deben ser incluidos hasta dos

componentes MA no estacionales. Es evidente también el patrón característico que nos indica la necesidad de

Tema C: Agua y Ciudad

incluir un componente de media móvil estacional (SMA) ya que la autocorrelación en el periodo estacional es

negativa. En base a lo anterior, el modelo que consideraremos de inicio será un ARIMA (0,1,2)x(0,1,1)7.

5.4 Calibración y validación de los modelos

Como ya se indicó, la serie de demandas con la que contamos corresponde a 1461 datos de demanda diaria, 4

años comprendidos desde Enero de 2001 a Diciembre de 2004. Hemos dividido los datos en dos grupos, los tres

primeros años (2001, 2002 y 2003) serán utilizados para calibrar el modelo ARIMA y 1 año (2004) se utilizará

para validar el modelo y observar sus resultados. Independientemente de los datos que nos aporta la observación

del correlograma, hemos analizado 4 modelos ARIMA distintos que han sido los que mejores resultados han

aportado en un análisis preliminar. La diferencia entre ellos reside en la inclusión o no inclusión de un segundo

componente de media móvil no estacional y la temperatura como variable exógena. Se ha determinado que la

temperatura máxima (Tmax) es la variable exógena que más información nos aporta al modelo9, por lo que la

temperatura media y mínima no serán consideradas en adelante para la selección del modelo. Para evaluar el

desempeño de los modelos se han considerado estadísticos que miden la magnitud de los errores como son el

RMSE, MAE y MAPE, y los que miden el sesgo, ME y MPE. Ya que todos los estadísticos anteriores ignoran

la cantidad de términos incluidos en los modelos, y que siempre podríamos utilizar una cantidad infinita de

términos para obtener un mejor desempeño, se utilizó también el criterio de Akaike (1974)10

AIC y el BIC

(Bayesian Information Criterion) de Schwartz que penalizan por cada término adicional. Los resultados

obtenidos en la fase de validación se presentan en la Tabla 5. En todos los casos los valores obtenidos fueron

levemente más pobres en fase de validación que los obtenidos en calibración.

Tabla 4 Comparación del desempeño de los modelos en fase de validación

Modelo ARIMA RMSE MAE MAPE ME MPE Log-verosim

AIC BIC

A-(0,1,1)x(0,1,1)7 11,143.56 7,932.46 2.409 -17.65 -0.0861 -15,738.40 31,480.87 31,491.43

B-(0,1,1)x(0,1,1)7+Tmax 10,662.31 7,629.09 2.323 2.32 -0.0656 -15,696.90 31,399.77 31,415.61

C-(0,1,2)x(0,1,1)7 11,101.84 7926.92 2.413 -24.56 -0.0955 -15,723.20 31,452.44 31,468.29

D-(0,1,2)x(0,1,1)7+Tmax 10,603.67 7,553.24 2.297 -9.90 -0.0817 -15,680.70 31,369.31 31,390.43

5.5 Modelo seleccionado

Los modelos ARIMA ajustados a la serie de demandas diaria de agua urbana han obtenido valores aceptables en

su desempeño. La selección de un determinado modelo depende de varios factores, entre ellos el horizonte de

predicción así como de la disponibilidad de datos de predicción de la variable exógena. Si suponemos que

podemos contar con predicciones precisas de la temperatura, el modelo seleccionado será el D, en el caso de no

contar con las predicciones, el modelo indicado sería el C. Los ACF y PACF, periodograma y periodograma

acumulativo de los de los residuos en fase de validación del modelo D se presentan en las Figura 7 y 8. La

apariencia de los gráficos de ACF y PACF nos indica que el modelo consigue captar la estructura del modelo ya

que solamente 4 valores son significativos para el intervalo de confianza del 95%. El periodograma de los

residuos muestra que el modelo ha conseguido captar las periodicidades detectadas y el periodograma

acumulativo queda contenido dentro de los intervalos de 99 y 95% quedando muy próximo a un ruido blanco. El

modelo D obtiene un R2

de 0.79 y coeficiente de correlación r de 0.89, el modelo C obtiene R2

de 0.88 y r de

0.77, por lo que los desempeños no son muy diferentes considerando que el modelo C contiene un parámetro

menos. Los parámetros estimados para el modelo C son θ1=0.409 correspondiente al MA(1), θ2=0.167

correspondiente al MA(2) y Θ=0.874529 correspondiente al SMA(1).

Tema C: Agua y Ciudad

Figura 7 ACF y PACF de los residuos del modelo D

Figura 8 Periodograma y acumulativo de los residuos del modelo D

5.6 Comportamiento de los modelos

En la sección anterior ha quedado demostrado que los modelos del tipo ARIMA con variable exógena y sin ella,

consiguen captar adecuadamente el patrón de la demanda diaria. En la Figura 10 se puede observar una

comparación entre los valores de predicción y los observados, así como también los valores de los errores

absolutos. Los errores a un horizonte de 7 días de predicción son mayores que los de a un solo día, y se

magnifican en momentos puntuales. Haciendo un análisis de los errores se encuentra que existe una coincidencia

temporal con el calendario de festividades y de actividades de la localidad. Es decir, que los errores más grandes

en términos absolutos coinciden con las principales festividades nacionales y locales, siendo aún más grandes

cuando su efecto produce una cantidad consecutiva de días no laborables por unirse a días de fin de semana. Este

desempeño de los modelos ARIMA se entiende desde la perspectiva de que los modelos son calibrados desde los

datos para captar el comportamiento de la serie, posteriormente las predicciones se realizan tomando en cuenta

los valores del pasado de la serie, así como los errores de predicción ajustados por un factor. Un cambio

repentino del patrón de comportamiento habitual de la serie no puede ser anticipado por el modelo ya que no

cuenta con una estructura que le informe de su próxima ocurrencia. Es así que tanto en la fase de calibración

como en validación los errores máximos coinciden en fechas como semana santa, fiestas de fallas y San José, el

día del trabajo, el día de la comunidad Valenciana, entre otras.

Tema C: Agua y Ciudad

Figura 9 Validación del modelo C, año 2004. Predicción a 1 y 7 días

6 Conclusiones Se han ajustado modelos estocásticos para la predicción de la demanda de agua urbana en la ciudad de Valencia.

La parsimonia de los modelos y la evaluación su desempeño se ha considerado a la hora de seleccionar los que

ofrecieron los mejores resultados. Se ha incluido la temperatura máxima diaria como variable exógena que guía

el patrón anual de la demanda, a pesar de que las correlaciones con respecto a la demanda diaria no son

suficientemente buenas en determinados periodos del año, como ejemplo, durante toda la duración del periodo

vacacional del mes de agosto. La inclusión de la temperatura en la estructura del modelo produce mejorías leves

en los estadísticos de los residuos a coste de incluir un parámetro más a estimar para el modelo.

En lo que respecta a los errores de predicción, las predicciones se ven afectadas fuertemente y producen peores

resultados ante la ocurrencia de eventos puntuales que producen una variación brusca del patrón de demandas

registrado a lo largo del año, estas variaciones son producidas principalmente por el calendario de festividades

locales y nacionales. A su vez, es de esperar que la ignorancia de este tipo de eventos en el conjunto de datos de

calibración, introduzca un sesgo en la estimación de los parámetros y por tanto no sean los mejores estimadores

posibles para ser utilizados posteriormente en la predicción.

La metodología utilizada para ajustar modelos estocásticos del tipo ARIMA, podría ser mejorada para el caso de

Valencia mediante la utilización de modelos diferenciados para distintas épocas del año del tipo verano e

invierno. Por otra parte, la consideración del calendario de festividades como un conjunto de variables

deterministas, donde sus efectos sean previstos y caracterizados durante la fase de calibración y posteriormente

anticipados durante la predicción, tentativamente puede ser una alternativa que entregue mejores estimaciones de

parámetros de los modelos y a su vez mejores predicciones.

7 Referencias Bibliográficas

1 Valencia-Ayuntamiento (2006b). Recull estadístic. Technical report, Oficina de Estadística, Plaza del

Ayuntamiento 1, 2da planta.

2 Valencia-Ayuntamiento (2006a). Anuario estadístico de la ciudad de valencia. Technical report, Oficina de

Estadística, Plaza del Ayuntamiento 1, 2da planta.

3 Maidment, D. R. and E. Parzen (1984a, January). Cascade model of monthly municipal water use. Water

Resources Research 20, 15–23

4 Maidment, D. R., S.-P. Miaou, and M. M. Crawford (1985, April). Transfer functions models of daily urban

water use. Water Resources Research 21, 452–432

Tema C: Agua y Ciudad

5 Sastri, T. and J. B. Valdes (1989, July). Rainfall intervention analysis for online applications. Journal of Water

Resources Planning and Management 115, 397–415

6 Protopapas, A. L., S. Katchamart, and A. Platanova (2000, July). Weather effects on daily water use in new

york city. Journal of Hydrologic Engineering 5, 332–338

7 Gato, S., N. Jayasuriya, and P. Roberts (2007a, July). Forecasting residential water demand: Case study.

Journal of water resources planning and management 133, 309–319

8 Box, G., G. M. Jenkins, and G. Reinsel (1976). Time Series Analysis: Forecasting and Control. San Francisco,

California: Holden-Day. Revisión de la versión de 1970

9 Espinoza, C. (2007) Análisis estadístico de las demandas de agua potable de la ciudad de Valencia, Aplicación

a la predicción con análisis de series temporales. Trabajo de investigación para obtener el diploma de estudios

avanzados (DEA). Universidad Politécnica de Valencia

10 Akaike, H. (1974, December). A new look at statistical model identification. IEEE transaction of automatic

control 19, 716–723