Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas...

28
Roberto Díaz Morales Febrero 3, 2013 Métodos Numéricos Probabilísticos DTSC, Universidad Carlos III de Madrid

Transcript of Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas...

Page 1: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

Roberto Díaz Morales

Febrero 3, 2013

Métodos Numéricos

Probabilísticos

DTSC, Universidad Carlos III de Madrid

Page 2: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

1/27

Índice

1. Introducción

2. Cuadratura

3. Muestreo

4. Cuadratura Bayesiana

5. Aprendizaje activo de la evidencia usando

cuadratura bayesiana.

6. Conclusiones

Febrero 3, 2013

Page 3: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

Una de las tareas del aprendizaje máquina consiste en

la inferencia sobre datos complejos.

Dicha tarea incluye el desarrollo y análisis de métods

numéricos basados en teoría probabilística.

Muchas de estas tareas se pueden ver como problemas

de aprendizaje.

Dos de las tareas más importantes son:

Cuadratura

Muestreo

Febrero 3, 2013 2/27

Page 4: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

Muchos modelos complejos requieren integrales computacionalmente intratables, con lo que han de ser aproximadas.

En particular, muchos problemas de inferencia requieren integrar sobre funciones de probabilidad. ◦ p(x) podría ser un “posterior” y f(x) las etiquetas de nuestras muestras. ◦ p(x) podría ser un “prior” y f(x) una verosimilitud. ◦ …

Es complicado cuando se trabaja con grandes conjuntos de datos donde evaluar la verosimilitud sobre todo el conjunto de datos es muy costoso computacionalmente.

Febrero 3, 2013 3/27

Page 5: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

Índice

1. Introducción

2. Cuadratura

3. Muestreo

4. Cuadratura Bayesiana

5. Aprendizaje activo de la evidencia usando

cuadratura bayesiana.

6. Conclusiones

Febrero 3, 2013 4/27

Page 6: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

Si p(x) es una función de densidad de probabilidad y podemos obtener muestras de ella tenemos la aproximación de Monte Carlo:

Su varianza decae en un orden O(1/R)

La principal objección es que tener muestras que representen bien P(x) no garantiza que representen bien Φ(x)

Febrero 3, 2013 5/27

Page 7: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

Índice

1. Introducción

2. Cuadratura

3. Muestreo

4. Cuadratura Bayesiana

5. Aprendizaje activo de la evidencia usando

cuadratura bayesiana.

6. Conclusiones

Febrero 3, 2013 6/27

Page 8: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

Existen multitud de métodos de muestreo cuando podemos evaluar p(x):

◦ Rejection Sampling:

Se conoce cQ(x)>P(x)

Se genera xi muestra de cQ(x)

Se genera u~U(0,cQ(xi))

Si u<P(x) guardamos xi

Si u>P(x) descartamos xi

Eficiencia según el parecido de cQ(x) con P(x)

Febrero 3, 2013 7/27

Page 9: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

◦ Importance Sampling:

Febrero 3, 2013 8/27

Page 10: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

Markov Chain Monte Carlo: ◦ Son técnicas de muestreo en los que la siguiente muestra depende de la muestra

actual (estado) y de unas probabilidades de transición.

• Metropolis-Hasting: – Se utiliza una función Q(x) que

depende de la muestra actual.

– Se evalua a:

– Si a>1 la muestra se acepta.

– Si a<1 se acepta con probabilidad a.

– Si se acepta es el nuevo estado.

– Se debe dejar correr

Febrero 3, 2013 9/27

Page 11: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

• Gibbs-Sampling:

• La siguiente muestra se obtiene con la distribución conjunta para cada una de las dimensiones.

Febrero 3, 2013 10/27

Page 12: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

• Slice-Sampling:

Febrero 3, 2013 11/27

Page 13: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

Índice

1. Introducción

2. Cuadratura

3. Muestreo

4. Cuadratura Bayesiana

5. Aprendizaje activo de la evidencia usando

cuadratura bayesiana.

6. Conclusiones

Febrero 3, 2013 12/27

Page 14: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

Rasmussen, C. E., & Ghahramani, Z.

Bayesian monte carlo. Advances in neural information

processing systems, 15, 489-496.

Dado un conjunto de muestras D y realizando

inferencia sobre f con D, la media sobre funciones es

la esperanza de f(x) media.

Febrero 3, 2013 13/27

Page 15: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

Se agrupan los términos para un GP:

Febrero 3, 2013 14/27

Page 16: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

En el caso general, introducir la formulación de los GP en la

integral lleva a expresiones que son dificiles de evaluar, pero

hay casos especiales:

Si p(x) y la función de covarianza son ambas

gaussianas, se obtienen expresiones analíticas

(utilizando la cuadratura Bayes-Hermite):

Febrero 3, 2013 15/27

Page 17: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

Febrero 3, 2013 16/27

Page 18: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

Febrero 3, 2013 17/27

Page 19: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

Febrero 3, 2013 18/27

Page 20: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

Febrero 3, 2013 19/27

Page 21: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

20/

47

Índice

1. Introducción

2. Cuadratura

3. Muestreo

4. Cuadratura Bayesiana

5. Aprendizaje activo de la evidencia usando

cuadratura bayesiana.

6. Conclusiones

Febrero 3, 2013

Page 22: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

21/27

Osborne, M. A., Duvenaud, D., Garnett, R., Rasmussen, C.

E., Roberts, S. J., & Ghahramani, Z. Active Learning of

Model Evidence Using Bayesian Quadrature. NIPS 2012

Se desea realizar una integral sobre una verosimilitud no

negativa:

Febrero 3, 2013

Page 23: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

22/27

Para poder tratar la integral, “lineariza” el problema.

Quedando como problema a resolver:

Febrero 3, 2013

Page 24: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

23/27

Como L0 utiliza un GP estándar.

L0=mL|s

Prior con media 0

Covarianza Gaussiana

Utiliza el conjunto de datos XS

Utiliza un GP diferente para modelar Δlog L|s

Utiliza prior con media 0

Covarianza Gaussiana

Para entrenar utiliza XS y datos aleatorios en hyper-

elipses alrededor de los puntos XS

Febrero 3, 2013

Page 25: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

24/27

Quedando finalmente la media compuesta por dos términos

analíticos.

Y una varianza que puede emplearse como diagnóstico de

convergencia:

Febrero 3, 2013

Page 26: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

25/27

Aprendizaje activo:

Ya no es necesario coger muestras que pertenezcan a p(x).

Cuando se han fijado los hyperparámetros, la varianza depende

de la posición de las muestras escogidas.

Selecciona muestras que minimizan la varianza esperada:

Febrero 3, 2013

Page 27: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

26/27

Resultados:

Febrero 3, 2013

Page 28: Métodos Numéricos Probabilísticos - UC3Mmiguel/MLG/adjuntos/Numerics.pdf · Una de las tareas del aprendizaje máquina consiste en la inferencia sobre datos complejos. Dicha tarea

27/27

www.probabilistic-numerics.org

MacKay, D. J. (2003). Information theory, inference and

learning algorithms. Cambridge university press.

Rasmussen, C. E., & Ghahramani, Z. Bayesian monte

carlo. Advances in neural information processing

systems, 15, 489-496.

Osborne, M. A., Duvenaud, D., Garnett, R., Rasmussen, C.

E., Roberts, S. J., & Ghahramani, Z. Active Learning of Model

Evidence Using Bayesian Quadrature. NIPS 2012

Febrero 3, 2013