Algoritmo de Gradiente Conjugado CGBP

Noviembre 2002 ESCOM IPN 1

Algoritmo de Gradiente Algoritmo de Gradiente Conjugado (CGBP)Conjugado (CGBP)

CGBP converge a un mínimo de una función cuadrática en un numero finito de iteraciones.

El procedimiento general para localizar un mínimo de una función en una dirección requiere:

Localizar el intervalo donde se encuentra

Reducir el intervalo

Algoritmo deAlgoritmo de

Gradiente Gradiente

ConjugadoConjugado

1. La primera dirección de búsqueda es el gradiente descendente

2. Tomar un paso y escoger una razón de aprendizaje para minimizar la función a lo largo de la dirección búsqueda.

00 gP kXXk xFg |)(

kkkk pXX 1

3. Seleccione la siguiente dirección de búsqueda de acuerdo a:

Donde:

k pAppg

1 kkkk pgp

k gggg

Si el algoritmo no ha convergido regrese al paso 2.

Ejemplos Ejemplos Método del Método del Gradiente Gradiente ConjugadoConjugado

Ejemplo: 1Aplique el algoritmo de Gradiente

Conjugado a la siguiente función.

Los valores iniciales son:

A) Realice 2 iteraciones.B) Dibuje la superficie de error en 2D.C) Grafique los punto obtenidos.

21 25)( xxxF

Solución

Método de Gradiente conjugado para la solución

de Ecuaciones Normales

1.- Inicialice los componentes del vector de pesos con valores arbitrarios pequeños.

2.- Ajustar k=0, Calcular la dirección inicial del conjugado d0 y el vector de ganancia g0.

)0()()()(00

ssi WCpgd

3.- Determine el coeficiente del vector conjugado. Donde

4.- Actualice el vector de pesos.

k dCddg

)( )()()( )( si

sk pkWCg

i dkWkW )()1( )()(

5.- Determine el nuevo vector de ganancia.

6.- Determine la nueva dirección del gradiente conjugado.

)()()(1 )1( s

k pkWCg

kkkk dgd 11

dCg )(1

Ajuste :

y pruebe la condición de salida.Si ,

ir al paso 3, de otra forma detener

Inconvenientes del CGBP.

El algoritmo GC nos puede aplicar directamente al entrenamiento de RNA, dado que el índice de desempeño de las mismas no es cuadrático.

No se puede usar k para minimizar la función a lo largo de una línea.

No se alcanzara un mínimo exacto en un numero finito de iteraciones.

Para localizar un mínimo de una función en una dirección especificada se requiere: a) Localización del intervalo. b) Reducción del intervalo.

El propósito del paso de localización del intervalo es encontrar un intervalo inicial que contenga un mínimo local.

El paso de la reducción del intervalo, reduce el tamaño del intervalo hasta que el mínimo es localizado en la precisión deseada.

Para lo anterior se propuso: “El método de búsqueda de la

Sección de Oro”

A) Localización del IntervaloA) Localización del Intervalo

Búsqueda de la sección de oroBúsqueda de la sección de oro

B) Reducción delB) Reducción del Intervalo Intervalo

Búsqueda de la Búsqueda de la sección de orosección de oro

=0.618Set c1 = a1 + (1-)(b1-a1), Fc=F(c1)

d1 = b1 - (1-)(b1-a1), Fd=F(d1)

For k=1,2, ... repeatIf Fc < Fd then

Set ak+1 = ak ; bk+1 = dk ; dk+1 = ck

c k+1 = a k+1 + (1-)(b k+1 -a k+1 )

Fd= Fc; Fc=F(c k+1 )

elseSet ak+1 = ck ; bk+1 = bk ; ck+1 = dk

d k+1 = b k+1 - (1-)(b k+1 -a k+1 )

Fc= Fd; Fd=F(d k+1 )

endend until bk+1 - ak+1 < tol

Ejemplo: 2Realice una iteración del algoritmo de

Gradiente Conjugado para la función:

Para la minimización lineal use la localización del intervalo mediante la evaluación de la función F(x); y para la reducción del intervalo por medio de Búsqueda de la Sección de Oro.

21)( xxxxxF

Algoritmo CGBP Pasos Intermedios

-5 0 5 10 15-5

Trayectoria Completa

-5 0 5 10 15-5

Algoritmo de Gradiente Conjugado para entrenar MLP NN

Paso 1. Inicializar los pesos de la red con valores aleatorios pequeños.

Paso 2. Propague el q-esimo patrón de entrenamiento, a través de la red calculando la salida en cada nodo.

Paso 3. Calcule el error local en cada nodo de la red. Para los nodos de salida el error local se calcula por:

Donde g(.) es la derivada de la funcion de activación f(.). Para cada nodo de la capa oculta el error se calcula como:

)( )()(,

)( siq

siqoutiq

siq vgxd

)( )(1

)1()1()( siq

siq vgW

Paso 4. Cada combinador lineal estima la salida deseada, dado por:

Paso 5. Actualice el estimado de la matriz de covarianza en cada capa.

Actualice el estimado del vector de correlación cruzado para cada nodo.

)(1)( siq

siq dfv )()(

iqouts

Tsqout

ss xxkbCkC )1(,

)()( )1()(

Donde k es el índice de presentación del patrón.

Paso 6.Actualice el vector de pesos para cada nodo en la red, como sigue.

(a) En cada nodo calcule sino,

Si ,no actualice el vector de pesos para el nodo y vaya al paso 7; sino realice los siguientes pasos.

)()()( )1()( sqout

si xvkbpkp

)()()()( )()()()( kpkWkCkg si

0)( sig

(b) Encuentre la direccion d(k). Si el numero de iteración es un entero múltiplo del numero de pesos en el nodo , entonces:

)()( )()( kgkd si

)1()()( )()()()( kdkgkd si

)1()()1(

)1()()( )()()(

)()()()(

kdkCkd

kdkCkg s

(c) Calcule el tamaño del paso

(d) Modifique el vector de pesos de acuerdo a

Paso 7. Si la red no ha convergido vaya al paso 2.

)()()()()()()()(

)()()(

kdkCkdkdkg

)()()1()( )()()()( kdkkWkW si

Simulación en Matlab / NNT

Algoritmos de Gradiente Conjugado

Fletcher-Reeves (traincgf). Tiene los requerimientos mas pequeños de almacenaje de todos los algoritmos de Gradiente conjugado.

Polak-Riviére (traincgp). Tiene los requerimientos de almacenaje ligeramente mas grandes que el de Fletcher-Reeves. Tiene una mayor velocidad de convergencia en algunos problemas

Algoritmos de Gradiente Conjugado (2)

Powell-Beale (traincgb). Tiene los requerimientos de almacenaje ligeramente mas grandes que el de Polak-Riviére. Tiene generalmente una mayor velocidad de convergencia.

Gradiente Conjugado Escalado (trainscg). Es el único algoritmo de este tipo que no requiere línea de búsqueda. Es un algoritmo de entrenamiento de propósito general muy bueno.

trainscgEs una funcion que entrena redes

multicapa con retropropagación, actualizando W y b de acuerdo al método de gradiente conjugado escalado.

Sintaxis[net, tr] = trainscg (net,

P,T,A,Q,Ts,VV)

Algoritmo de BP con Gradiente

Conjugado Escalado (SCGBP)

Donde:net = Define la red neuronalnet = netff([0 5 ], [3 1] ,{´tansig´,

´logsig ´}, trainscg)P patrones de entradaT valores objetivoAi Condiciones inicialesQ Tamaño del loteTs Tamaño del pasoVV Matriz vacía o vectores de validación

Valores por omisiónValores por omisión

net.trainParam.epochs= 100net. trainParam.show= 25net.trainParam.goal= 0net. trainParam.time= inf net.trainParam.min_grad= 1e-6

Valores por omisión (2)Valores por omisión (2)

net.trainParam.max_fail= 5net.trainParam.sigma= 5e-5net. trainParam.lambda= 5e-7

traincgfEs una funcion que entrena redes

multicapa con retropropagación, actualizando W y b de acuerdo al método de gradiente conjugado de Fletcher-Reeves .

Sintaxis[net, tr] = traincgf (net,

P,T,Ai,Q,Ts,VV)

Conjugado. Fletcher-Reeves

Donde:net = Define la red neuronalnet = netff([0 5 ], [3 1] ,{´tansig´,

´logsig ´}, traincgf)P patrones de entradaT valores objetivoAi Condiciones inicialesQ Tamaño del loteTs Tamaño del pasoVV Matriz vacía o vectores de validación

net.trainParam.max_fail= 5net.trainParam.searchFcn=

Nombre de la rutina de linea de busqueda usar ´srchcha´.

traincgpEs una funcion que entrena redes

multicapa con retropropagación, actualizando W y b de acuerdo al método de gradiente conjugado de Polak-Ribiére .

Sintaxis[net, tr] = traincgp (net,

P,T,A,Q,Ts,VV,TV)

Conjugado Polak-Ribiére

Donde:net = Define la red neuronalnet = netff([0 5 ], [3 1] ,{´tansig´, ´logsig

´}, traincgp)P patrones de entradaT valores objetivoAi Condiciones inicialesQ Tamaño del loteTs Tamaño del pasoVV Matriz vacía o vectores de validaciónTV Matriz vacía o vectores de prueba

traincgbEs una funcion que entrena redes

multicapa con retropropagación, actualizando W y b de acuerdo al método de gradiente conjugado de Powell-Beale.

Sintaxis[net, tr] = traincgb (net,

P,T,A,Q,Ts,VV,TV)

Conjugado Powell-Beale

Donde:net = Define la red neuronalnet = netff([0 5 ], [3 1] ,{´tansig´, ´logsig

´}, traincgb)P patrones de entradaT valores objetivoAi Condiciones inicialesQ Tamaño del loteTs Tamaño del pasoVV Matriz vacía o vectores de validaciónTV Matriz vacía o vectores de prueba

Dudas ???

Hasta la próxima !!!

Algoritmo de Gradiente Conjugado CGBP

Education

Transcript of Algoritmo de Gradiente Conjugado CGBP

PROBLEMAS DE NUMEROS COMPLEJOS Conjugado, opuesto ...

Gradiente de presion

Linea de gradiente

Estudio Ácido Linoleico Conjugado

Actividades Académicas Optativas Campo de conocimiento de ... · 1.4 Método de Gradiente Conjugado. Propiedades de convergencia. Propiedades de regularización en el caso de matrices

Amortización mediante gradiente

Teoría de brönsted lowry y par conjugado

UNIVERSIDAD NACIONAL DE ASUNCION Facultad Polit ecnicacschaer/Tesis-Elias Maciel.pdf · 2017. 12. 21. · 1 Resumen Evaluaci on de Gradiente Conjugado por Bloques para un Lado Derecho

Gradiente conjugado

gradiente termico

Estima˘c~ao de M axima Verossimilhan˘ca Utilizando M ...mbranco/Presenta_NR.pdf · I Gradiente conjugado I Simulated annealing Outra classe de algoritmos s~ao os da familia EM (Expectation-Maximization).

Linea Gradiente

Trazo de Gradiente

Enunciado y verbo conjugado

Gradiente Alveolo Arterial

GRADIENTE CONJUGADO - medellin.unal.edu.cocemejia/doc/nla/proyectos/METODO GRADIENTE... · Gradiente Conjugado Un m etodo basado en el subespacio de Krylov no accede directamente

Benemérita Universidad Autónoma de Puebla Vicerrectoría de … · 2017-08-11 · 3.1.2 Método de Direcciones conjugadas 3.1.3 Método de gradiente conjugado. 3.2. Las superficies

(Modelo de Gradiente Reducido de la Burbuja) RGBM “Un Algoritmo de Descompresión Moderno” Daniel Millikovsky, NAUI Course Director – NAUITEC Trimix II.

INFORMACION Y... · 2013. 2. 4. · 246- 240- 255 - 146- borde superior gradiente interior gradiente exterior borde superior gradiente interior gradiente exterior — 194 117 31 -

gradiente hidraulico