Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la...

59
1 Descripción de Técnicas Estadísticas de Regionalización http://grupos.unican.es/ai/meteo Rafael Ancell Trueba (Meteorólogo) AIMet: Grupo de Meteorología Aplicada

Transcript of Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la...

Page 1: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

1

Descripción de Técnicas Estadísticas de Regionalización

http://grupos.unican.es/ai/meteo

Rafael Ancell Trueba(Meteorólogo)

AIMet: Grupo de Meteorología Aplicada

Page 2: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

2

Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente los Modelos Climáticos. Como el campo es muy extenso, se daráuna clasificación de todos los métodos y se describirán algunos de los más conocidos.

El primer aspecto que se tratará, es la justificación del uso de estas técnicas, teniendo en cuenta las enormes dificultades computacionales que entraña la simulación verosímil del clima.

En segundo lugar, una vez identificado el problema, se acotará y describirá el marco general de trabajo sobre el que es aplicable la Regionalización Estadística.

En tercer lugar se tratarán algunas de las hipótesis que es razonable considerar cuando se aplican las diferentes técnicas estadísticas al mencionado problema; haciendo énfasis en las ventajas y limitaciones que estas hipótesis llevan asociadas.

Después se mostrará una panorámica general de los diferentes tipos de métodos, separándolos en Deterministas y Probabilísticos.

Finalmente, se mostrarán algunos ejemplos prácticos donde se revisarán las virtudes y defectos de diferentes métodos de Regionalización Estadística.

contenido

Page 3: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

3

Justificación de la necesidad de utilizar métodosestadísticos de regionalización.

Page 4: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

4

Interacción Atmósfera - Suelo

En este sistema coexisten perturbaciones de todas las escalas, desde las grandes ondas planetarias de 10.000km, hasta las pequeñas perturbaciones turbulentas de 1cm.

El Sistema Climático se puede considerar como una mezcla de vida, gases y agua en movimiento dentro de un campo gravitatorio sobre una esfera heterogénea en rotación y calentada por el sol.

Componentes y procesos elementales

Page 5: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

5

Sistema de procesos acoplados

Es un error plantearse un modelo climático en el que no figuren explícta o implicitamente todos y cada uno de los procesos que lo componen

La dinámica a largo plazo de la interacción Atmósfera + Superfíciees la que determina el clima. Además el 90% del intercambio energético ocurre en la escala pequeña.

Esta interacción ocurre a muchas escalas espaciales y temporales, tanto en el aire como en el suelo; siendo las escalas temporales del aire mucho menores que las del suelo, de manera que normalmente se conoce a la atmósfera como el componente rápido y al suelo como el componente lento. La interacción entre estos dos componentes es muy compleja con ciclos en muchas escalas de tiempo desde la diurna, estacional, etc...-más propias de la atmósfera- hasta escalas de miles de años -más propias del océano-. Son particularmente interesantes las oscilaciones cuasi periódicas derivadas directamente del acoplamiento océano-atmósfera como son los patrones de teleconexión, entre los que se destacan El Nino SouthernOscillation (ENSO) y North Atlantic Oscillation (NAO) que perturban el clima no solo en la región donde aparece la perturbación.

Todo esto se complica más aún debido a las heterogeneidades superficiales que producen forzamientos locales. Las más importantes son la orografía, el tipo y uso del suelo, golfos, lagos y pantanos, contrastes tierra-mar, nieve y hielo, las corrientes oceánicas y los aerosoles.

Todas las escalas son importantes en el sistema climático: 100 millones de cúmulos cada día transportan más energía que todos los huracanes.

Page 6: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

6

vigilancia

inmediata

corto plazo

medio plazo

mensual

estacional

climática

H+0 H+3 H+6 D+1 D+3 D+10 M+1 M+3 A+1 A+100

1km

10km

100km

1000km

10000km

probabilístico

local

regional

atmosférico oceánico

determinista

Metafóricamente: La atmósfera es la cola del látigo en el sistema climático

Escalas

Los modelos climáticos ocupan el escalón más alto de complejidad, ya que han de tener en cuenta todas las escalas.

Page 7: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

7

Perspectiva de la modelización del Clima

Page 8: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

8

Estructura conceptual del modelo HadCM3

Los modelos de predicción a corto y medio plazo pueden admitir pequeños errores en las parametrizaciones pero los modelos climáticos no lo soportan, ya que al cabo de miles de pasos de integración estos errores hacen que el sistema acabe por ‘explotar’.

Un modelo global tipo T106L20 (resolución horizontal 110km y 20 niveles), ha de ser integrado cada 10-20 minutos. Para simular un año ha de realizar mas de 27000 pasos en cada uno de los 2.5 millones de puntos de rejilla. Obviamente no puede calcular explícitamente todos los procesos, por lo que la escala pequeña se aproxima en cada caja mediante parametrizaciones.

Page 9: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

9

Dado que las predicciones a estas escalas tan largas son muy difíciles de evaluar directamente, existe un gran riesgo de fallo derivado de un manejo inadecuado de la incertidumbre. Por ello es preceptivo, especialmente en predicción climática, identificar todas y cada una de las fuentes de incertidumbre; que básicamente son de tres tipos:

•Condiciones iniciales: Al ser un sistema caótico, es muy sensible a pequeñas diferencias en las condiciones iniciales, sin embargo a escalas de tiempo climáticas este efecto resulta irrelevante.

•Forzamientos: El clima es perturbado por agentes externos naturales, como pueden ser la actividad volcánica o la solar, y antropogénicos, como las emisiones de gases de efecto invernadero. Para ello se hacen simulaciones para diferentes escenarios de forzamiento.

•Modelos: Nuestra capacidad de simulación es limitada, por lo tanto cada modelo produce resultados diferentes. El mejor modelo es un conjunto de modelos.

Fuentes de incertidumbre

Page 10: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

10

Técnicas “prácticas” para tener en cuenta la incertidumbre

Page 11: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

11

Aspectos matemáticos de la modelización. Predicción por conjuntos.

http://www.meteo.unican.es/ 30

•En las condiciones iniciales: Se genera un conjunto de predicciones a partir de varias condiciones iniciales representativasde las fuentes de incertidumbre.

•En los modelos/parametrizaciones: Se genera un conjunto de predicciones perturbando las parametrizaciones, o ejecutando distintos modelos (multi-modelo).

Como resultado, se obtiene un conjunto de N predicciones que proporcionauna predicción probabilística (o una predicción determinista promedio).

Condicionesiniciales

tiempo

Predicción 18 ºC(20%)

16 ºC(50%)

14 ºC(30%)

Técnicas “prácticas” para tener en cuenta la incertidumbre

de contorno

Page 12: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

12

Para terminar, un apunte acerca de la interpretación de los resultados. La progresiva disponibilidad de diferentes modelos y métodos brinda la posibilidad de utilizar un amplio abanico de soluciones para cada problema concreto ya que dependiendo del dominio y naturaleza del predictando, se pueden combinar métodos y predictores de muchas maneras, suministrando resultados diferentes para el mismo GCM. Esta incertidumbre, presente en cada método, debe ser puesta en evidencia y añadidaa las restantes -la del GCM, la del forzamiento y la natural del SC-; tampoco hay que olvidar que la incertidumbre suele presentar una distribución espacial heterogénea. También se debe separar claramente la incertidumbre asociada al método empleado (confianza) de la asociada a resultados específicos (verosimilitud); por ejemplo, un buen método puede dar una predicción muy ambigua y un mal método dar una predicción muy concreta.

Declaración de resultados

Terminology Degree of confidence in being correct (método)Very High confidence At least 9 out of 10 chance of being correctHigh confidence About 8 out of 10 chanceMedium confidence About 5 out of 10 chanceLow confidence About 2 out of 10 chanceVery low confidence Less than 1 out of 10 chance

Terminology Likelihood of the occurrence/ outcome (resultados)Virtually certain > 99% probability of occurrenceVery likely > 90% probabilityLikely > 66% probabilityAbout as likely as not 33 to 66% probabilityUnlikely < 33% probabilityVery unlikely < 10% probabilityExceptionally unlikely < 1% probability

Page 13: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

13

Para elaborar estrategias de adaptación y mitigación, los gobiernos necesitan conocer detalles que los modelos globales no ven.

Aunque el CC es global, sus efectos son locales.

Justificación de los métodos de regionalización

Page 14: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

14

Justificación de los métodos de regionalización

Page 15: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

15

Descripción del problema de RegionalizaciónEstadística.

Page 16: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

16

Modelización numérica a corto plazo

asimilación

condiciones iniciales

predicción

Las predicciones a corto y medio plazodependen de las condiciones iniciales.

Page 17: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

17

Proyecciones regionales

Series de datos

Y = f (X;θ)

GCM

IPCC

Proyecciones globales

Modelización numérica en cambio climático

En el corto y medio plazo, se analiza y predice la dinámica ‘rápida’ del sistema (atmósfera); para plazos más largos hay que añadir los procesos ‘lentos’ (suelo y océano), por lo que la incertidumbre es muy superior: los predictandos son estadísticos (media, percentil, etc) y se predice en términos probabilísticos.

RCM

SRES

Las predicciones en CC dependendel balance energético del sistema.

Page 18: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

18

Predicción local. Downscaling

tipos de predicción y sus escalas

tipos de fenómenos y sus escalas

downscaling local

probabilístic

o

Consiste en estimar fenómenos a una escala inferior a la dada por los modelos.

Page 19: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

19

Predicción local. Downscaling

XCX = f (C)

baja resolución

alta resolución

R. Cano, F.J. López, A.S. Cofiño, J.M. Gutiérrez andM.A. Rodríguez, “Aplicación de Métodos de Clasificación al Downscaling Estadístico”. V Simposio de Predicción del Instituto Nacional de Meteorología. 235-240 (2001).

Page 20: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

20

¿Cómo se puede estimar un valor en un punto de interés?

Interpolando las predicciones

weather.yahoo.com, etc

Downscaling dinámico.

Con técnicas estadísticas.

Con técnicas híbridas(Downscaling estadístico).

Localidades muy cercanas puedes presentar climatologías muy distintas. Por ejemplo, Oviedo y Ranón están a una distancia de 25 km, pero la climatología de ambas es de influencia distinta (continental y oceanica, respectivamente).

Modelización Regional. Downscaling

Page 21: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

21

El modelo Y = f (X;θ) se obtiene estimando los parámetros θ = (θ1,...,θk) a partir de registros históricos de X e Y.

Predictandos: Y Predictores: X

Dominio

Técnica f

discretacontinuadiariamensuallocalregionalgaussiana

determinista probabilística estacional climática

varia

ble

pred

icci

ón

Proyecciones regionales (downscaling estadístico)

Page 22: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

22

Rocío

TormentasNieve

NieblaGranizoEscarcha

PrecipitaciónRacha MáximaTemperaturas extremasHoras de sol

ERA-15 T106L31ERA-40 T159L60

(1959-1999)DEMETER

ECMWF T511L60EPS T255L40

Modelos operativos

Salidas de modelos numericos:

Se han utilizado las salidas (cada 6 horas) del modelo operativo del ECMWF, hasta un plazo de 5 dias.

Reanalisis

Integracion de un mismo modelo durante un largo periodo de tiempo representativo de la climatologia.

(T(1ooo mb),..., T(500 mb); Z(1ooo mb),..., Z(500 mb),

......., H(1ooo mb),..., H(500 mb))

P=

Dimension > 6000

(cp1, ..., cpn)P=Dimension ~ 600

Componentes principales:

Registros Históricos (calibración)

Precipitación

Page 23: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

23

2 0 0 0 4 0 0 0 6 0 0 0 8 0 0 0 1 0 0 0 0 1 2 0 0 0 1 4 0 0 0 1 6 0 0 0- 4 0

- 3 0

- 2 0

- 1 0

0

1 0

2 0

3 0

4 0

2 0 0 0 4 0 0 0 6 0 0 0 8 0 0 0 1 0 0 0 0 1 2 0 0 0 1 4 0 0 0 1 6 0 0 0- 4 0

- 3 0

- 2 0

- 1 0

0

1 0

2 0

3 0

4 0

2 0 0 0 4 0 0 0 6 0 0 0 8 0 0 0 1 0 0 0 0 1 2 0 0 0 1 4 0 0 0 1 6 0 0 0- 4 0

- 3 0

- 2 0

- 1 0

0

1 0

2 0

3 0

4 0

2 0 0 0 4 0 0 0 6 0 0 0 8 0 0 0 1 0 0 0 0 1 2 0 0 0 1 4 0 0 0 1 6 0 0 0- 4 0

- 3 0

- 2 0

- 1 0

0

1 0

2 0

3 0

4 0

EOF 1

EOF 4EOF 3

EOF 2

CP1 CP2

CP3 CP4

Registros Históricos (calibración)

Page 24: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

24

PrecipitaciónRacha MáximaHoras de Sol ,

T max y T min ...

(T(1ooo mb),..., T(500 mb); Z(1ooo mb),..., Z(500 mb);

.......;

H(1ooo mb),..., H(500 mb)) = Xn

Salida del modeloen una rejilla para el día n Observaciones del día n

Dado un patrón previsto Xn+1se obtiene una estimación:

Yn+1 = WT Xn+1

Un modelo lineal Yn = WT Xn se obtiene estimando los coeficientes W = (w1,..., wk) a partir de los registros históricos en días i=1,...,N donde Xn e Yi están disponibles.

x

y

x1 x2 x3 x4 x5

Yn

Calibración (modelo lineal)

Page 25: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

25

Clasificación de los Métodos.

Page 26: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

26

Y = f (X;θ)La regionalización estadística se realiza bajo la hipótesis Perfect Prog –la alternativa MOS

contempla modificaciones en los modelos y sólo se utiliza en predicción a corto y medio plazo-; esto quiere decir que la calibración se hace una sola vez utilizando un periodo de referencia estático, sin considerar cambios en el modelo.

En segundo lugar, la regionalización estadística es estacionaria, lo cual significa que la relación predictor-predictando obtenida en el periodo de ajuste o calibración es aplicada durante el periodo de predicción, a pesar de que los forzamientos del SC son diferentes en esteperiodo.

La hipótesis de linealidad consiste en suponer que el modelo estadístico, o lo que es lo mismo, la relación entre predictor y predictando, es lineal, como ocurre entre variables cuya distribución de probabilidad (PDF) es gaussiana. Si se tiene en cuenta que los predictores generalmente son variables gaussianas, esta hipótesis sólo es apropiada para los predictandos gaussianos.

Otra hipótesis consiste en suponer que los predictandos son independientes entre sí y por tanto solo dependen de los predictores, permitiendo construir un modelo conjunto por la simple agregación de modelos individuales.

Estas hipótesis implican una enorme eficacia y robustez en las técnicas correspondientes, pero sólo deben ser utilizadas cuando la naturaleza del problema lo permita.

Hipótesis

Page 27: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

27

Para seleccionar un método de regionalización estadística hay que tener en cuenta la naturaleza de las variables y de la propia predicción:

•Los predictores y predictandos pueden ser discretos, continuos, diarios, mensuales, locales, regionales, gaussianos, no gaussianos, etc.

•La predicción puede ser local, regional, diaria, mensual, determinista, probabilística, estacional, climática, etc.

Hay varias formas de catalogar los diferentes métodos de regionalización estadística, aquí se utilizará la propuesta por el IPCC en la cual se distinguen tres categorías:

deterministasprobabilísticos

generadores de tiempo

Métodos de regionalización estadística (catálogo del IPCC)

Page 28: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

28

Clasificación de los Métodos.

Deterministas X = f (C)

Page 29: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

29

Predicción local. Downscaling

Probabilísticos p(X|C)

Discriminativos: cuando estiman directamente p(X|C) Generativos: cuando estiman primero p(X,C)

Page 30: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

30

Predicción local. Downscaling

J.M. Gutiérrez, A.S. Cofiño, R. Cano and C. Primo“Analysis and downscaling multi-model seasonal forecasts using self-organizing maps”, Tellus A(número especial del proyecto DEMETER), 2004 (in press).

R. Cano, J.M. Gutiérrez, A.S. Cofiño and M. A. Rodríguez, “Redes Neuronales y Patrones de Analogías Aplicados al DownscalingClimático”, en La Climatología Española en los Albores del Siglo XXI, 113 – 12, Edita Asociación Española de Climatología (1999).

Downscaling DEMETER seasonal ensemble precipitation forecasts in the tropics during "El Niño" episodesJ.M. Gutiérrez, R. Cano, A.S. Cofiño, C. Sordo and C. Primo [poster]Geophysical Research Abstracts, Volume 5, 14586 (2003)

Page 31: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

31

Weather generators

Predicción local. Downscaling

A.S. Cofiño, C. Primo, R. Cano, C. Sordo, and J.M. Gutiérrez“Downscaling Demeter Seasonal Ensemble Precipitation Forecasts in the Tropics during “El Niño” Episodes”, XXVIII General Assembly of the European Geophysical Society. Geophysical Research Abstracts. Vol. 5. 14586 (2003).

J.M. Gutiérrez, R. Cano, A.S. Cofiño, and C. SordoRedes Probabilísticas y Neuronales en las Ciencias AtmosféricasMinisterio de Medio Ambiente (Monografías del Instituto Nacional de Meteorología), Madrid. 350 páginas, 2004 (en prensa)LI

BR

O

Page 32: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

32

Descripción de algunos métodos de RegionalizaciónEstadística.

Page 33: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

33

Descripción de los métodos de Regresión

Page 34: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

34

Descripción de los métodos de Regresión

Dado un patrón previsto Xn+1se obtiene una estimación:

Yn+1 = WT Xn+1

Un modelo lineal Yn = WT Xn se obtiene estimando los coeficientes W = (w1,..., wk) a partir de los registros históricos en días i=1,...,N donde Xn e Yi están disponibles.

x

y

x1 x2 x3 x4 x5

Page 35: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

35

El CCA es un método para determinar la relación lineal entre dos variables multidimensionales. Consiste en obtener dos bases, una para cada variable, que resultan ser óptimas respecto a la correlación, con sus correspondientes correlaciones. Dicho de otra forma, se buscan las dos bases en las que la matriz de correlación entre las variables es diagonal y las correlaciones en la diagonal son máximas. La dimensión de estas nuevas bases es igual o menor que la menor de las dimensiones de las variables.

En la regresión múltiple: Y = W X

En CCA: y = wy Yx = wx X

La regresión entre las nuevas variables es: y = Rx

El funcionamiento de CCA es muy simple:

Cuando se tiene un nuevo Xt : xt = wx Xt

yt = Rxt

Deshaciendo la transformación: Yt= yt wy-1

Descripción de CCA

Page 36: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

36

cxe11)x(f −+

=

Cada procesador realiza una actividad muy simple: valor sigmoidal de la combinación lineal de las actividades recibidas por la neurona:

La actividad (salida) viene dada por una función de activación no lineal.

Descenso gradiente

A.S. Cofiño and J.M. Gutiérrez “Optimal Modular FeedForward Neural Networks based on Functional Networks”, Lecture Notes in Artificial Intelligence, 208, 308 - 315 (2001).

Redes modulares. Redes funcionales.

Cuando se dispone de información del problema, existen técnicas más apropiadas:

A.S. Cofiño, J.M. Gutiérrez and M.L. Ivanissevich“Evolving Modular Networks with Genetic Algorithms. Application to Nonlinear Time Series”, Expert Systems, 21, 208-216 (2004).

Descripción de Redes Neuronales

Page 37: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

37

cxe11)x(f −+

=

Modelos de regresion no lineal no parametricos.

En ocasiones, las relaciones no lineales entre las variables requieren modelos de regresion no lineales.

Dada la temperatura maxima en Santander y la temperatura dada por el modelo en punto de rejilla mas cercano :

Regresion Lineal: TMaxn = a+w T1000n

Red neuronal: TMaxn = f (T1000mbn ),

Obs

erva

ione

slo

cale

s

Predicciones en rejilla1000mb

Modelo lineal

Red neuronal

Descripción de Redes Neuronales

Page 38: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

38

Search for the closest k days in the ERA-40 to the predicted pattern as the analogensemble.

K-Nearest Neighbors knn

Pattern A Pattern B

Observations A Observations B

Analogs Hypothesis :

“Similar atmosphericpatterns produce similar meteorologicalphenomenons" Lorenz 1969

This hypothesis enables a pattern recognition basedtechnique for thedownscaling problem.

Descripción del método de Análogos

Page 39: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

39

La técnica local de k vecinos (k-NN) se denomina técnica de análogos en este campo.

CICYT REN2000-1572 (Programa Nacional del Clima) (2000/2003)Técnicas Híbridas Estadístico-Numéricas de Predicción

Meteorológica endiferentes Escalas Espacio-Temporales

Descripción del método de Análogos. Knn.

Page 40: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

40

Dado un patron (C), se calcula el grupo al que pertenece Ck

P(X|Ck)

Se particiona el espacio de patrones en un numero dado de grupos (m-medias).

Weather typing. K-means.

Page 41: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

41

Una SOM está formadapor un número arbitrariode centros c1,…,cm.

Oja E. And Kaski S., 1999: Kohonen Maps. Amsterdam, Elsevier

SOM 5 x 5

Weather typing. SOM.

En k-means, cada clase es la media de su población; mientras que en una SOM también se promedia con las clases vecinas, preservando la topología deseada.

Page 42: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

42

Weather typing. SOM.

Page 43: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

43

Dependency is more general than correlation

Correlation and dependency

True

True if linearFalse other case

Evident questions:

Independence implies no correlation?

Correlation implies dependence?Anycase? Yes.

Not so evident questions:

No correlation implies independence?

Dependence implies correlation?

Page 44: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

44

Lo esencial es que la factorización posibilita el tratamiento computacional en sistemas con muchas variables y estados pues hay que recordar que el modelo general de dependencia plantea un problema NP-hard. Por ejemplo: un sistema sencillo con 10 variables con 10 estados cada una implica 1010 parámetros para obtener la probabilidad conjunta !!!!.

¿¿QuQuéé es una Red es una Red BayesianaBayesiana??

Una Red Bayesiana es un modelo probabilístico que permite estimar la probabilidad conjunta del sistema considerando las dependencias más importantes:

Son generativos ya que estiman la probabilidad conjuntan

i=1P(X1, X2, .., Xn) ≈ Π P(Xi | πi)

Page 45: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

45

Algunos tipos de Redes Bayesianas Meteorológicas

(descriptiva no predictiva)

(predictiva & independiente)

Estado de laAtmósfera

Climatologica

Ingenua

Extendida

Estado de laAtmósfera

(predictiva & independiente)

Page 46: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

46

Paradigmas de predicción con clasificadores generativosHay tres tipos básicos de pregunta que se puede formular en un problema de predicción local, y asimismo hay tres tipos de red generativa:

A generalization of analogue downscaling methods by bayesian networksA.S. Cofiño, R. Cano, C. Sordo, and J.M. GutiérrezIn International Conference on Quatitative Precipitation Forecasting, 87–87 (2002). Reading, U.K. The World Weather Research Programme’s WWRP.

Page 47: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

47

We need to make inference of some variables (predictands) giventhe known ones (EVIDENCES or predictors).

P(P(predictandspredictands) =) = P(P(predictandspredictands | | predictorspredictors))

For instance, to get the classic LorenzAnalog method we take anindependent Bayesian Network:

Outputs of numerical models (atmospheric patterns) are plugged as evidence in the network, obtaining the corresponding conditional probabilities of the local surface variables.

MadridPrecipitation

SevillaPrecipitation

SantiagoPrecipitation

AtmosphericPattern

P(P(Sevilla Sevilla PcpPcp) =) =

P(P(Sevilla Sevilla PcpPcp | | AtmosphericAtmospheric PatternPattern))

Is a fact that each mode ofprecipitation draws some kind ofspatial dependence, so is better to...

...build a more general static BayesianNetwork with spatial dependenciesthat generates spatially consistentpredictions:

P(Sevilla Pcp) = P(Sevilla Pcp | Madrid Pcp, Santiago Pcp, Atmospheric Pattern)

Naive & Augmented: Downscaling

Page 48: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

48

Ejemplos

Page 49: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

49

Page 50: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

50

Precipitación diaria observada Precipitación diaria prevista

Precipitación decenal observada Precipitación decenal prevista

TX

Rmse=2.3 ºC

PR

Rmse=9.9 mm

previstoprevisto

obse

rvad

o

obse

rvad

o

Precipitación diaria observada Precipitación diaria prevista

Precipitación decenal observada Precipitación decenal prevista

TX

Rmse=2.3 ºC

PR

Rmse=9.9 mm

previstoprevisto

obse

rvad

o

obse

rvad

o

Predicción local. Downscaling

Algunos experimentos con métodos deterministas

Regresión múltiple

CCA sobre variable gaussiana

CCA sobre variable no gaussiana

Page 51: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

51

Page 52: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

52

Page 53: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

53

Page 54: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

54

Occasionally, the relationship among variables are no linear so that, is necessary no linear regression models.

Let us consider a simple case, the maximun temperature in Santander and the maximun temperature given by the model in the nearest grid point:

Linear regression: TMaxn = a+w T1000n

No linear regression: TMaxn = f (T1000mbn ),

Grid points predicctions

Loca

l obs

erva

tions

1000mb

linear model

neuronal network

a) Regression Methods (Linear and Nonlinear)

cxe11)x(f −+

=

Neural Network with a logistic function.

TMaxn = a Tn

This example shows how a simple linear model is not appropriate in some cases:

TMaxn = f( Tn )

Page 55: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

55

Page 56: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

56

En este apartado vamos a comparar cualitativamente la regionalización dinámica y la estadística, sopesando las prestaciones y los requerimientos de ambos. Quizás la mayor ventaja del método estadístico sea su eficiencia computacional y la facilidad para conseguir series deobservaciones casi para cualquier dominio del planeta, lo cual lo convierte en una alternativa sencilla, barata y hasta cierto punto competitiva si se compara con los métodos dinámicos. Además el método estadístico es el único capaz de obtener resultados específicos para localidades -esto estálimitado a la existencia previa de un registro histórico- evitando el problema que supone considerar datos observacionales interpolados en rejillas que pueden suavizar y hasta eliminar características regionales de los datos. Por otra parte, los métodos estadísticos que suponen independencia entre predictandos no garantizan la consistencia espacial ni física de la regionalización mientras que los dinámicos, al menos en teoría, sí. Finalmente la desventaja más clara del método estadístico es que aplica un modelo estacionario a un sistema que, a escalas de tiempo climáticas, no lo es, con el agravante de que no se puede estimar de forma directa la validez de dicha aproximación ya que el periodo de observación suele ser demasiado homogéneo en términos de forzamiento –a veces se evalúa de forma indirecta utilizando series de observaciones con forzamientos diferentes generadas de forma sintética por RCMs-.

Regionalización estadística versus dinámica

Page 57: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

57

Ins6h (56%) pattern pers06h pers24h2000-2001 test 54.55 127.35 92.30random test 54.57 126.93 88.61----------------------------------------InsR6h (56%) pattern pers06h pers24h2000-2001 test 0.15 0.35 0.26random test 0.15 0.35 0.25----------------------------------------Rad6h (71%) pattern pers06h pers24h2000-2001 test 71.77 251.24 110.58random test 70.37 246.67 105.60

Relative vorticity-925-00 V velocity-500-00 U velocity-700-00 Potential Vorticity-925-00 (2)Potential Vorticity-850-00 (3)Relative humidity-700-00-0Relative humidity-850-00-0Relative humidity-925-00-0 (2)2m Temperature-0-00-0

Dir6h (13%) pattern pers06h pers24h2000-2001 test 46.50 53.25 71.34random test 46.03 52.89 69.99----------------------------------------Speed6h (30%) pattern pers06h pers24h2000-2001 test 1.40 1.98 2.35random test 1.38 1.99 2.33----------------------------------------Gust6h (21%) pattern pers06h pers24h2000-2001 test 2.88 3.61 4.98random test 2.83 3.62 4.88

Relative vorticity-925-00 V velocity-850-00 V velocity-700-00 U velocity-850-00 U velocity-700-00 Potential Vorticity-925-00Potential Vorticity-850-00Divergence-850-00

Temperature-925-00 (2) Temperature-850-00 Temperature-700-00 Potential Vorticity-925-002m Temperature-0-00-0 (4) 2m Dew Point-0-00-0 (2)

Tn5cm6h (43%) pattern pers06h pers24h2000-2001 test 2.24 3.86 3.70random test 2.20 3.89 3.65---------------------------------------T06h (59%) pattern pers06h pers24h2000-2001 test 1.48 3.57 3.21random test 1.48 3.66 3.22---------------------------------------Tn6h (40%) pattern pers06h pers24h2000-2001 test 1.57 2.51 3.06random test 1.55 2.61 3.04---------------------------------------Tx6h (51%) pattern pers06h pers24h2000-2001 test 1.73 3.45 3.31random test 1.72 3.54 3.28

Rain6h (28%) pattern pers06h pers24h-----------------------------------------2000-2001 test 2.29 3.07 3.95random test 2.28 3.18 4.03

V velocity-700-00 U velocity-700-00 Divergence-850-00 Total Column Water Vapour-0-00-0Relative humidity-700-00-0 Relative humidity-925-00-0

Page 58: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

58

Autores (p.o. de firma): J.M. Gutiérrez, R. Cano, A.S. Cofiño, and C. SordoTítulo: Redes Probabilísticas y Neuronales en las Ciencias Atmosféricas (ISBN: 84-8320-281-6)

Fecha: 2004Editorial: Ministerio de Medio Ambiente Lugar de publicación: MadridSerie: Monografías del Instituto Nacional de Meteorología.

http://www.ipcc.chhttp://www.mma.es/portal/secciones/cambio_climatico/

Page 59: Descripción de Técnicas Estadísticas de Regionalización · 2 Esta charla se centra en la utilización de técnicas estadísticas para estimar detalles que no proporcionan directamente

59

Predicción local. Downscaling

Clustering methods for statistical downscaling in short-range weather forecastJ.M. Gutiérrez , R. Cano, A.S. Cofiño, and M.A. RodríguezMonthly Weather Review, 132(9), 2169 - 2183 (2004).

Probabilistic Networks for Statistical Downscaling and Spationalization of Meteorological Data.J.M. Gutiérrez, R. Cano, A.S. Cofiño and C.SordoGeophysical Research Abstracts, Volume 4 (2002)