Asociación EURATOM-CIEMAT Para Fusión 1 Curso básico de física computacional B.Ph. van Milligen...
-
Upload
eulalia-pupo -
Category
Documents
-
view
6 -
download
0
Transcript of Asociación EURATOM-CIEMAT Para Fusión 1 Curso básico de física computacional B.Ph. van Milligen...
Asociación EURATOM-CIEMAT Para Fusión
1
Curso básico de física computacional
B.Ph. van Milligen
II. Análisis de Datos
• En este apartado del curso trataremos métodos de análisis de señales experimentales provenientes de un experimento de fusión.
• Considerar que las aplicaciones de estos métodos son muy generales y que son relevantes en muchas situaciones experimentales y de computación.
• Los datos sujetos del análisis no sólo provienen de experimentos, sino también, en su caso, de modelos de ordenador (por ejemplo, de turbulencia) que producen grandes cantidades de datos que deben ser sometidos a tratamientos estadísticos que nos permiten comprenderlos.
Asociación EURATOM-CIEMAT Para Fusión
2
Tipos de datos
• Centrándonos en datos experimentales: ¿qué tipos de datos produce un experimento de fusión?
• Datos espaciales• Cero-dimensional (punto)• Uni-dimensional (línea / cuerda)• Bi-dimensional (plano / superficie)• Etc. (en fusión, hasta la fecha no hay datos tri-dimensionales)
• Datos temporales• Un canal• Múltiples canales (correspondiendo, por ejemplo, a varias posiciones)
• Datos espacio-temporales• Combinaciones de los dos tipos de arriba
Asociación EURATOM-CIEMAT Para Fusión
3
Datos espaciales: ejemplo
• Ejemplo de una línea de datos (en un único instante temporal): ThomsonScattering.
0
0.1
0.2
0.3
0.4
0.5
0
0.2
0.4
0.6
0.8
1
-0.4 0.0 0.4reff
Te
(keV)
ne
(x 10
19 m
-3)
Asociación EURATOM-CIEMAT Para Fusión
4
Datos espacio-temporales: ejemplo
• Ejemplo de múltiples canales de datos (en una serie de instantes temporales): Tomografía de Rayos X.
Las líneas de visión cruzadas permiten reconstruir, con cierta aproximación, la emisión local de rayos X en el plasma en un plano (mediante un proceso numérico conocido como “inversión de Abel”): cada línea proporciona información sobre la integral de la emisión a lo largo de la línea.(Ver curso “Diagnósticos de plasmas”)
Asociación EURATOM-CIEMAT Para Fusión
5
Datos temporales: ejemplos
• Sin embargo, el tipo de datos más común es la serie temporal:
• Campo magnético en un punto (Mirnov coils)• Corriente en ciertas bobinas• Integral de la densidad (densidad de línea, interferometría)• Potencial flotante de una sonda de Langmuir• Etc.
• Nos concentraremos en este tipo de datos, por ser el más común
-0.015
-0.01
-0.005
0
0.005
0.01
0.015
451 452 453 454 455
Value
Time (ms)
Flujo de partículas calculado a partirde señales medidas con una sonda de Langmuir
Asociación EURATOM-CIEMAT Para Fusión
6
Datos temporales: análisis
-0.015
-0.01
-0.005
0
0.005
0.01
0.015
452 452.03 452.05 452.08 452.1
Value
Time (ms)
Discretización en el tiempo
Discretización del valor medido
• A la derecha, una ampliación de laseñal anterior.• Hay una doble discretización (tiempo y valor)• Ambas tienen consecuencias para los cálculos posteriores basados en estos datos.• El registro de señales contínuas es posible pero no se abordará aquí por ser poco común; en todo caso para poder tratar señales contínuas por medio de cálculos de ordenador se requiere su digitalización.• La discretización se puede tomar en cuenta considerando que las medidas tienen(al menos) un error t en tiempo y un error y en valor. Las consecuencias de estos “errores” se pueden estimar cuando la estadística es Gaussiana (normal), peroes muy difícil cuando la estadística no es Guassiana (por ej., fractal).
Asociación EURATOM-CIEMAT Para Fusión
7
Análisis básico: distribución de probabilidad
• La función de distribución se obtiene dividiendo el rango de valores [ymin,ymax] en un número N de intervalos y contando cuántos elementos hay en cadaintervalo.
-1.5 10-2
-1 10-2
-5 10-3
0 100
5 10-3
1 10-2
1.5 10-2
451 451.2 451.4 451.6 451.8 452
Signal
Time (ms)
0
100
200
300
400500
600700
Counts
Se pierde toda información sobrela correlación temporal.
Asociación EURATOM-CIEMAT Para Fusión
8
Análisis básico: distribución de probabilidad
• La función de distribución de probabilidad (PDF) es la función de distribución(de los valores) dividida entre el número total de valores.• Para una señal y(t), la probabilidad de que el valor y(t) esté entre y y y+dyestá dado por: p(y) dy, donde p(y) es la función de probabilidad.• p(y) está normalizado tal que su integral es 1.• Ejemplo: y(t) = y0 sin (t) p(y) = 1/[√(y0
2 – y2)] • Muchos procesos físicos tienen un ingrediente “aleatorio”. Consideramos queun proceso es verdaderamente aleatorio cuando no hay correlación alguna entreun valor y(t) y el siguiente y(t+) (se discutirá más adelante). El proceso “no tienememoria”. Un ejemplo de un proceso así es el “random walk” (tomar un pasohacia adelante o hacia atrás según lo decide una moneda echada), o la mociónBrowniana. Para estos procesos, la distribución de probabilidad es una Gaussianao “normal”:
p(y) =
1
2π σexp−
(y −y )2
2σ 2
⎡
⎣ ⎢ ⎢
⎤
⎦ ⎥ ⎥
Asociación EURATOM-CIEMAT Para Fusión
9
Momentos de la función de distribución de probabilidad
• Los momentos de la función de probabilidad contienen mucha información:• El momento n es:
• Es también el “expectation value” (valor más probable) de yn • Momento 1: el promedio• Momento 2: define la desviación estándar mediante
• Momento 3: el “skewness”
• Momento 4: la “kurtosis”
y
Mn = ynp(y) dy
−∞
∞
∫ =E yn[ ]
σ2 =E y−E y[ ]( )
2⎡ ⎣ ⎢
⎤ ⎦ ⎥ =E y2
[ ]− E y[ ]( )2
=M2 −M02
S=E y−E y[ ]( )
3⎡ ⎣ ⎢
⎤ ⎦ ⎥ σ 3
K =E y −E y[ ]( )
4⎡ ⎣ ⎢
⎤ ⎦ ⎥ σ 4
Asociación EURATOM-CIEMAT Para Fusión
10
Momentos: utilidad
• Los momentos permiten distinguir entre variables con una distribuciónGaussiana (aleatorias) y otras.
• Si la distribución p(y) es la función de Gauss, entonces:S = 0 y K = 3.
Esto es un primer paso para la identificación de una señal como Gaussiana.
• Sin embargo, ni la función de probabilidad misma ni todos sus momentospueden por sí solos identificar una señal como Gaussiana; para ello, es necesarioconsiderar correlaciones temporales. (Hay que establecer que están ausentes.)Esto se discutirá más adelante.
• Por contra, si la función de probabilidad no es una función de Gauss (y susmomentos difieren significativamente del valor para una Gaussiana), entonces la señal no es Gaussiana.
Asociación EURATOM-CIEMAT Para Fusión
11
Momentos estadísticos
1
10
100
1000
10000
0.05 0.1 0.15 0.2 0.25 0.3
Number
Amplitude
Average = 0.1644960 Standard deviation = 2.6556466E-02 Skewness = 0.3216717 Kurtosis = 2.805307
Gaussian fit
• En la práctica, a menudo una señal es casi Gaussiana; y es difícil establecer suno-Gaussianidad porque la desviación de la curva de Gauss se produce en lascolas de la distribución, donde la estadística es mala (pocos datos).
• A la derecha, un ejemplo muy claro.
Asociación EURATOM-CIEMAT Para Fusión
12
PDF bi-dimensional
• Lo anterior es fácilmente generalizable a 2 (o más) dimensiones
• Para señales x(t) e y(t), la probabilidad de que el valor x(t) está entre x y x+dx Y el valor y(t) está entre y y y+dy está dado por: p(x,y) dx dy, donde p(x,y) es la función de probabilidad bidimensional.
• La probabilidad unidimensional sigue de la bidimensional:
• (=la probabilidad de obtener un y, no importa cual sea el valor de x)
• Si x e y son independientes, entonces p(x,y) = p(x)p(y)Esto proporciona un interesante método para determinar la independenciaestadística de 2 variables. Se pospone la discusión para más adelante.
p(y) = p(x,y)dx−∞
∞
∫
Asociación EURATOM-CIEMAT Para Fusión
13
Probabilidad condicional
• En el caso de tener 2 señales xe y, uno puede preguntarse cual es la probabilidadde obtener x cuando y tenga un valor dado (y = y0). Esta es laprobabilidad condicional p(x|y0).
• La probabilidad condicional p(x|y0) es igual a la probabilidad p(x,y0), normalizadapor la probabilidad de obtener y0 (porque ponemos como condición que y= y0).
p(x|y0) = p(x,y0)/p(y0)
Asociación EURATOM-CIEMAT Para Fusión
14
Correlación temporal
• Para establecer la naturaleza aleatoria si/no de una señal, no basta con la PDF yes necesario estudiar su correlación temporal.
• Básicamente, existe correlación cuando se puede predecir de algún modo(mediante modelos) cuál va a ser el comportamiento futuro de una señal,conociendo su comportamiento pasado.
• Este es un tema que nos ocupará durante gran parte del curso debido a sucomplejidad y a su importancia para entender la relación entre los modelos de sistemas físicos y medidas, especialmente cuando el sistema es complejo (no-lineal y/o caótico).
• Si se puede predecir algo (aún si es con error o sólo en sentido estadístico) del comportamiento futuro de una señal, es indicativo que se ha avananzado en elentendimiento del sistema que se está estudiando.
Asociación EURATOM-CIEMAT Para Fusión
15
Correlación lineal
• La función de correlación lineal es la herramienta más sencilla para obtener información del comportamiento temporal.• Definición:
• Las aparecen para normalizar C tal que su valor está en el rango [-1,1].• De esta correlación cruzada se obtiene la auto-correlación poniendo x = y.
Rxy(τ) = x(t)y(t +τ) dt
−∞
∞
∫
Cxy(τ) =1
σ xσ y
x(t) −x [ ] y(t+τ)−y [ ]dt−∞
∞
∫
Asociación EURATOM-CIEMAT Para Fusión
16
-1
-0.5
0
0.5
1
-1 -0.5 0 0.5 1
R(τ)
τ
Correlación cruzada
• Estructura típica de Rxy(τ) • Envolvente decae exponencialmentey da el Tiempo de correlación(cuando cae a 1/e)
• Máximo igual a
• Mínimo igual a
• Valor para τ :
• Posición del máximo da la desfaseτ (=0 para la autocorrelación)
• A menudo conviene “simetrizar” la autocorrelación restando el promediode las señales x(t) e y(t) antes de analizarlas.
τ
x y +σ xσ y
x y −σ xσ y
x y
Asociación EURATOM-CIEMAT Para Fusión
17
Autocorrelación lineal: ejemplo (seno)
-1.5
-1
-0.5
0
0.5
1
1.5
0 1 2 3 4 5
y(t)
t
T
-1.5
-1
-0.5
0
0.5
1
1.5
-1 -0.5 0 0.5 1
C(τ)
τ
T
-5
-2.5
0
2.5
5
0 1 2 3 4 5
y(t)
t
-1
-0.5
0
0.5
1
-1 -0.5 0 0.5 1
C(τ)
τ
Seno puro Autocorrelación del seno
Seno + ruido blanco (misma amplitud) AutocorrelaciónCaídarápida delruido
Identifica-ciónperfecta delseno
Asociación EURATOM-CIEMAT Para Fusión
18
Autocorrelación lineal
• Como pudimos observar en el ejemplo anterior, la correlación lineal sirve para detectar procesos periódicos en el tiempo, al eliminar todo lo que no sea periódico en la integral.• Contiene la misma información que el espectro (ver más delante), pero tiene mejor resolución para las frecuencias bajas.• Para señales no-periódicas, la correlación lineal sólo proporciona una información interesante: el tiempo de decorrelación (y el desfaseen el caso de la correlación cruzada).
0
0.2
0.4
0.6
0.8
1
1.2
-0.08 -0.06 -0.04 -0.02 0 0.02 0.04 0.06 0.08
C(τ)
τ
1/e
τcorr
Típica señal de turbulencia