Asociación EURATOM-CIEMAT Para Fusión 1 Curso básico de física computacional B.Ph. van Milligen...

18
Asociación EURATOM-CIEMAT Para Fusión 1 Curso básico de física computacional B.Ph. van Milligen II. Análisis de Datos • En este apartado del curso trataremos métodos de análisis de señales experimentales provenientes de un experimento de fusión. • Considerar que las aplicaciones de estos métodos son muy generales y que son relevantes en muchas situaciones experimentales y de computación. • Los datos sujetos del análisis no sólo provienen de experimentos, sino también, en su caso, de modelos de ordenador (por ejemplo, de turbulencia) que producen grandes cantidades de datos que deben ser sometidos a tratamientos estadísticos que nos permiten

Transcript of Asociación EURATOM-CIEMAT Para Fusión 1 Curso básico de física computacional B.Ph. van Milligen...

Page 1: Asociación EURATOM-CIEMAT Para Fusión 1 Curso básico de física computacional B.Ph. van Milligen II. Análisis de Datos En este apartado del curso trataremos.

Asociación EURATOM-CIEMAT Para Fusión

1

Curso básico de física computacional

B.Ph. van Milligen

II. Análisis de Datos

• En este apartado del curso trataremos métodos de análisis de señales experimentales provenientes de un experimento de fusión.

• Considerar que las aplicaciones de estos métodos son muy generales y que son relevantes en muchas situaciones experimentales y de computación.

• Los datos sujetos del análisis no sólo provienen de experimentos, sino también, en su caso, de modelos de ordenador (por ejemplo, de turbulencia) que producen grandes cantidades de datos que deben ser sometidos a tratamientos estadísticos que nos permiten comprenderlos.

Page 2: Asociación EURATOM-CIEMAT Para Fusión 1 Curso básico de física computacional B.Ph. van Milligen II. Análisis de Datos En este apartado del curso trataremos.

Asociación EURATOM-CIEMAT Para Fusión

2

Tipos de datos

• Centrándonos en datos experimentales: ¿qué tipos de datos produce un experimento de fusión?

• Datos espaciales• Cero-dimensional (punto)• Uni-dimensional (línea / cuerda)• Bi-dimensional (plano / superficie)• Etc. (en fusión, hasta la fecha no hay datos tri-dimensionales)

• Datos temporales• Un canal• Múltiples canales (correspondiendo, por ejemplo, a varias posiciones)

• Datos espacio-temporales• Combinaciones de los dos tipos de arriba

Page 3: Asociación EURATOM-CIEMAT Para Fusión 1 Curso básico de física computacional B.Ph. van Milligen II. Análisis de Datos En este apartado del curso trataremos.

Asociación EURATOM-CIEMAT Para Fusión

3

Datos espaciales: ejemplo

• Ejemplo de una línea de datos (en un único instante temporal): ThomsonScattering.

0

0.1

0.2

0.3

0.4

0.5

0

0.2

0.4

0.6

0.8

1

-0.4 0.0 0.4reff

Te

(keV)

ne

(x 10

19 m

-3)

Page 4: Asociación EURATOM-CIEMAT Para Fusión 1 Curso básico de física computacional B.Ph. van Milligen II. Análisis de Datos En este apartado del curso trataremos.

Asociación EURATOM-CIEMAT Para Fusión

4

Datos espacio-temporales: ejemplo

• Ejemplo de múltiples canales de datos (en una serie de instantes temporales): Tomografía de Rayos X.

Las líneas de visión cruzadas permiten reconstruir, con cierta aproximación, la emisión local de rayos X en el plasma en un plano (mediante un proceso numérico conocido como “inversión de Abel”): cada línea proporciona información sobre la integral de la emisión a lo largo de la línea.(Ver curso “Diagnósticos de plasmas”)

Page 5: Asociación EURATOM-CIEMAT Para Fusión 1 Curso básico de física computacional B.Ph. van Milligen II. Análisis de Datos En este apartado del curso trataremos.

Asociación EURATOM-CIEMAT Para Fusión

5

Datos temporales: ejemplos

• Sin embargo, el tipo de datos más común es la serie temporal:

• Campo magnético en un punto (Mirnov coils)• Corriente en ciertas bobinas• Integral de la densidad (densidad de línea, interferometría)• Potencial flotante de una sonda de Langmuir• Etc.

• Nos concentraremos en este tipo de datos, por ser el más común

-0.015

-0.01

-0.005

0

0.005

0.01

0.015

451 452 453 454 455

Value

Time (ms)

Flujo de partículas calculado a partirde señales medidas con una sonda de Langmuir

Page 6: Asociación EURATOM-CIEMAT Para Fusión 1 Curso básico de física computacional B.Ph. van Milligen II. Análisis de Datos En este apartado del curso trataremos.

Asociación EURATOM-CIEMAT Para Fusión

6

Datos temporales: análisis

-0.015

-0.01

-0.005

0

0.005

0.01

0.015

452 452.03 452.05 452.08 452.1

Value

Time (ms)

Discretización en el tiempo

Discretización del valor medido

• A la derecha, una ampliación de laseñal anterior.• Hay una doble discretización (tiempo y valor)• Ambas tienen consecuencias para los cálculos posteriores basados en estos datos.• El registro de señales contínuas es posible pero no se abordará aquí por ser poco común; en todo caso para poder tratar señales contínuas por medio de cálculos de ordenador se requiere su digitalización.• La discretización se puede tomar en cuenta considerando que las medidas tienen(al menos) un error t en tiempo y un error y en valor. Las consecuencias de estos “errores” se pueden estimar cuando la estadística es Gaussiana (normal), peroes muy difícil cuando la estadística no es Guassiana (por ej., fractal).

Page 7: Asociación EURATOM-CIEMAT Para Fusión 1 Curso básico de física computacional B.Ph. van Milligen II. Análisis de Datos En este apartado del curso trataremos.

Asociación EURATOM-CIEMAT Para Fusión

7

Análisis básico: distribución de probabilidad

• La función de distribución se obtiene dividiendo el rango de valores [ymin,ymax] en un número N de intervalos y contando cuántos elementos hay en cadaintervalo.

-1.5 10-2

-1 10-2

-5 10-3

0 100

5 10-3

1 10-2

1.5 10-2

451 451.2 451.4 451.6 451.8 452

Signal

Time (ms)

0

100

200

300

400500

600700

Counts

Se pierde toda información sobrela correlación temporal.

Page 8: Asociación EURATOM-CIEMAT Para Fusión 1 Curso básico de física computacional B.Ph. van Milligen II. Análisis de Datos En este apartado del curso trataremos.

Asociación EURATOM-CIEMAT Para Fusión

8

Análisis básico: distribución de probabilidad

• La función de distribución de probabilidad (PDF) es la función de distribución(de los valores) dividida entre el número total de valores.• Para una señal y(t), la probabilidad de que el valor y(t) esté entre y y y+dyestá dado por: p(y) dy, donde p(y) es la función de probabilidad.• p(y) está normalizado tal que su integral es 1.• Ejemplo: y(t) = y0 sin (t) p(y) = 1/[√(y0

2 – y2)] • Muchos procesos físicos tienen un ingrediente “aleatorio”. Consideramos queun proceso es verdaderamente aleatorio cuando no hay correlación alguna entreun valor y(t) y el siguiente y(t+) (se discutirá más adelante). El proceso “no tienememoria”. Un ejemplo de un proceso así es el “random walk” (tomar un pasohacia adelante o hacia atrás según lo decide una moneda echada), o la mociónBrowniana. Para estos procesos, la distribución de probabilidad es una Gaussianao “normal”:

p(y) =

1

2π σexp−

(y −y )2

2σ 2

⎣ ⎢ ⎢

⎦ ⎥ ⎥

Page 9: Asociación EURATOM-CIEMAT Para Fusión 1 Curso básico de física computacional B.Ph. van Milligen II. Análisis de Datos En este apartado del curso trataremos.

Asociación EURATOM-CIEMAT Para Fusión

9

Momentos de la función de distribución de probabilidad

• Los momentos de la función de probabilidad contienen mucha información:• El momento n es:

• Es también el “expectation value” (valor más probable) de yn • Momento 1: el promedio• Momento 2: define la desviación estándar mediante

• Momento 3: el “skewness”

• Momento 4: la “kurtosis”

y

Mn = ynp(y) dy

−∞

∫ =E yn[ ]

σ2 =E y−E y[ ]( )

2⎡ ⎣ ⎢

⎤ ⎦ ⎥ =E y2

[ ]− E y[ ]( )2

=M2 −M02

S=E y−E y[ ]( )

3⎡ ⎣ ⎢

⎤ ⎦ ⎥ σ 3

K =E y −E y[ ]( )

4⎡ ⎣ ⎢

⎤ ⎦ ⎥ σ 4

Page 10: Asociación EURATOM-CIEMAT Para Fusión 1 Curso básico de física computacional B.Ph. van Milligen II. Análisis de Datos En este apartado del curso trataremos.

Asociación EURATOM-CIEMAT Para Fusión

10

Momentos: utilidad

• Los momentos permiten distinguir entre variables con una distribuciónGaussiana (aleatorias) y otras.

• Si la distribución p(y) es la función de Gauss, entonces:S = 0 y K = 3.

Esto es un primer paso para la identificación de una señal como Gaussiana.

• Sin embargo, ni la función de probabilidad misma ni todos sus momentospueden por sí solos identificar una señal como Gaussiana; para ello, es necesarioconsiderar correlaciones temporales. (Hay que establecer que están ausentes.)Esto se discutirá más adelante.

• Por contra, si la función de probabilidad no es una función de Gauss (y susmomentos difieren significativamente del valor para una Gaussiana), entonces la señal no es Gaussiana.

Page 11: Asociación EURATOM-CIEMAT Para Fusión 1 Curso básico de física computacional B.Ph. van Milligen II. Análisis de Datos En este apartado del curso trataremos.

Asociación EURATOM-CIEMAT Para Fusión

11

Momentos estadísticos

1

10

100

1000

10000

0.05 0.1 0.15 0.2 0.25 0.3

Number

Amplitude

Average = 0.1644960 Standard deviation = 2.6556466E-02 Skewness = 0.3216717 Kurtosis = 2.805307

Gaussian fit

• En la práctica, a menudo una señal es casi Gaussiana; y es difícil establecer suno-Gaussianidad porque la desviación de la curva de Gauss se produce en lascolas de la distribución, donde la estadística es mala (pocos datos).

• A la derecha, un ejemplo muy claro.

Page 12: Asociación EURATOM-CIEMAT Para Fusión 1 Curso básico de física computacional B.Ph. van Milligen II. Análisis de Datos En este apartado del curso trataremos.

Asociación EURATOM-CIEMAT Para Fusión

12

PDF bi-dimensional

• Lo anterior es fácilmente generalizable a 2 (o más) dimensiones

• Para señales x(t) e y(t), la probabilidad de que el valor x(t) está entre x y x+dx Y el valor y(t) está entre y y y+dy está dado por: p(x,y) dx dy, donde p(x,y) es la función de probabilidad bidimensional.

• La probabilidad unidimensional sigue de la bidimensional:

• (=la probabilidad de obtener un y, no importa cual sea el valor de x)

• Si x e y son independientes, entonces p(x,y) = p(x)p(y)Esto proporciona un interesante método para determinar la independenciaestadística de 2 variables. Se pospone la discusión para más adelante.

p(y) = p(x,y)dx−∞

Page 13: Asociación EURATOM-CIEMAT Para Fusión 1 Curso básico de física computacional B.Ph. van Milligen II. Análisis de Datos En este apartado del curso trataremos.

Asociación EURATOM-CIEMAT Para Fusión

13

Probabilidad condicional

• En el caso de tener 2 señales xe y, uno puede preguntarse cual es la probabilidadde obtener x cuando y tenga un valor dado (y = y0). Esta es laprobabilidad condicional p(x|y0).

• La probabilidad condicional p(x|y0) es igual a la probabilidad p(x,y0), normalizadapor la probabilidad de obtener y0 (porque ponemos como condición que y= y0).

p(x|y0) = p(x,y0)/p(y0)

Page 14: Asociación EURATOM-CIEMAT Para Fusión 1 Curso básico de física computacional B.Ph. van Milligen II. Análisis de Datos En este apartado del curso trataremos.

Asociación EURATOM-CIEMAT Para Fusión

14

Correlación temporal

• Para establecer la naturaleza aleatoria si/no de una señal, no basta con la PDF yes necesario estudiar su correlación temporal.

• Básicamente, existe correlación cuando se puede predecir de algún modo(mediante modelos) cuál va a ser el comportamiento futuro de una señal,conociendo su comportamiento pasado.

• Este es un tema que nos ocupará durante gran parte del curso debido a sucomplejidad y a su importancia para entender la relación entre los modelos de sistemas físicos y medidas, especialmente cuando el sistema es complejo (no-lineal y/o caótico).

• Si se puede predecir algo (aún si es con error o sólo en sentido estadístico) del comportamiento futuro de una señal, es indicativo que se ha avananzado en elentendimiento del sistema que se está estudiando.

Page 15: Asociación EURATOM-CIEMAT Para Fusión 1 Curso básico de física computacional B.Ph. van Milligen II. Análisis de Datos En este apartado del curso trataremos.

Asociación EURATOM-CIEMAT Para Fusión

15

Correlación lineal

• La función de correlación lineal es la herramienta más sencilla para obtener información del comportamiento temporal.• Definición:

• Las aparecen para normalizar C tal que su valor está en el rango [-1,1].• De esta correlación cruzada se obtiene la auto-correlación poniendo x = y.

Rxy(τ) = x(t)y(t +τ) dt

−∞

Cxy(τ) =1

σ xσ y

x(t) −x [ ] y(t+τ)−y [ ]dt−∞

Page 16: Asociación EURATOM-CIEMAT Para Fusión 1 Curso básico de física computacional B.Ph. van Milligen II. Análisis de Datos En este apartado del curso trataremos.

Asociación EURATOM-CIEMAT Para Fusión

16

-1

-0.5

0

0.5

1

-1 -0.5 0 0.5 1

R(τ)

τ

Correlación cruzada

• Estructura típica de Rxy(τ) • Envolvente decae exponencialmentey da el Tiempo de correlación(cuando cae a 1/e)

• Máximo igual a

• Mínimo igual a

• Valor para τ :

• Posición del máximo da la desfaseτ (=0 para la autocorrelación)

• A menudo conviene “simetrizar” la autocorrelación restando el promediode las señales x(t) e y(t) antes de analizarlas.

τ

x y +σ xσ y

x y −σ xσ y

x y

Page 17: Asociación EURATOM-CIEMAT Para Fusión 1 Curso básico de física computacional B.Ph. van Milligen II. Análisis de Datos En este apartado del curso trataremos.

Asociación EURATOM-CIEMAT Para Fusión

17

Autocorrelación lineal: ejemplo (seno)

-1.5

-1

-0.5

0

0.5

1

1.5

0 1 2 3 4 5

y(t)

t

T

-1.5

-1

-0.5

0

0.5

1

1.5

-1 -0.5 0 0.5 1

C(τ)

τ

T

-5

-2.5

0

2.5

5

0 1 2 3 4 5

y(t)

t

-1

-0.5

0

0.5

1

-1 -0.5 0 0.5 1

C(τ)

τ

Seno puro Autocorrelación del seno

Seno + ruido blanco (misma amplitud) AutocorrelaciónCaídarápida delruido

Identifica-ciónperfecta delseno

Page 18: Asociación EURATOM-CIEMAT Para Fusión 1 Curso básico de física computacional B.Ph. van Milligen II. Análisis de Datos En este apartado del curso trataremos.

Asociación EURATOM-CIEMAT Para Fusión

18

Autocorrelación lineal

• Como pudimos observar en el ejemplo anterior, la correlación lineal sirve para detectar procesos periódicos en el tiempo, al eliminar todo lo que no sea periódico en la integral.• Contiene la misma información que el espectro (ver más delante), pero tiene mejor resolución para las frecuencias bajas.• Para señales no-periódicas, la correlación lineal sólo proporciona una información interesante: el tiempo de decorrelación (y el desfaseen el caso de la correlación cruzada).

0

0.2

0.4

0.6

0.8

1

1.2

-0.08 -0.06 -0.04 -0.02 0 0.02 0.04 0.06 0.08

C(τ)

τ

1/e

τcorr

Típica señal de turbulencia