Analisis de Imagen Gabor-Function-libre

download Analisis de Imagen Gabor-Function-libre

of 29

Transcript of Analisis de Imagen Gabor-Function-libre

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    1/29

    1

    Análisis multi-escala y multi-orientación de imágenes mediante un bancode filtros de Gabor-2D

    José Antonio Aznar-CasanovaDepto. de Psicología Básica

    Facultad de PsicologíaUniversidad de Barcelona

    Dirigir lacorrespondencia a:

    Dr. J.A. Aznar CasanovaDepto. de Psicología BásicaFacultad de PsicologíaUniversidad de BarcelonaPasseig de la Vall d'Hebron, 171.08035-Barcelona (Spain)

    Tfno.: 93 -312 5038Fax: 93 -402 1363e-mail: [email protected]

    Citación como:Aznar-Casanova, J.A. (2000). Análisis multiescala y multiorientación de imágenesmediante un banco de filtros de Gabor-2D.Cognitiva, 12 (2), 223-246.

    mailto:[email protected]:[email protected]:[email protected]:[email protected]

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    2/29

    2

    ResumenEn este trabajo se revisan las evidencias neurofisiológicas y psicofísicas que han conducido a afirmar que lasfunciones de Gabor son las que mejor ajustan al tipo de transformación que producen las células simples delcórtex visual. Estas células parecen ser el soporte fisiológico de los detectores de frecuencias espacialesorientadas y aquí esbozamos un modelo computacional simplificado (basado en los datos evidenciados por losneurofisiólogos al estudiar el córtex visual del macaco), que mimetiza el análisis de la imagen que estosmecanismos aplican.Para poner de relieve las propiedades de estos paquetes de ondas con envolvente gaussiana, y mostrar lasventajas que ofrece su utilización en el ámbito de la percepción de la forma, realizamos dos simulaciones

    experimentales. En la primera se aplica un banco de 24 filtros Gabor (4 canales de frecuencia× 6 canales deorientación) a una imagen, obteniendo una representación (análisis) que sigue un esquema piramidalmultiescala y multiorientado. La posterior reconstrucción de la imagen (síntesis) revela la irrelevanteincompletitud de la señal (error de reconstrucción). En la segunda simulación, elaboramos un conjunto de seis

    máscaras (filtros Gabor) de convolución, sintonizadas a diferentes orientaciones y mostramos los resultadosde aplicar un análisis multiescala en el dominio espacial.Finalmente, señalamos cuatro ventajas derivadas del uso de la Transformada Gabor con ondículas y que aquíse ilustran: a) óptimo empaquetamiento de la información; b) fácil implementación computacional; c)robustez ante la pérdida de información y d) gran plausibilidad fisiológica en la modelización del SVH.Palabras clave: Psicofísica visual, Modelos computacionales de la visión, Funciones de Gabor, ondículas,Filtros paso-banda.

    Abstract

    In this paper we revise the psychophysical and neurophysiological evidence which has allowed us to affirmthat the Gabor functions ajust better than other functions to the kind of transformation produced by simplecells. Probably, these cells are the physiological support of the orientation and spatial frequency detectors andwe sketch a single computational model (based in evidences about the macaque visual cortex), which imitatethe image analysis. In order to emphasize the properties of these wavelets and to show the advantages derivedfrom their use on the shape perception scope, we carried out two experimental simulations.

    In the first, we applied a 24 Gabor filter bank (4 frequency channels× 6 orientation channels) to an image,obtaining a representation (analysis) following a multiorientated and multiscale pyramidal scheme. Laterreconstruction of the image (synthesis) informs us (reconstruction error) of slight incompleteness of thesignal. In a second simulation, we elaborated a set of six convolution masks (Gabor filters), tuned to differentorientations and we show the results of applying other multiscale analysis in the spatial domain.Finaly, we point out four advantages obtained by using the Gabor Transform, which this paper shows: a) thevery best packing of information; b) easy computational implementation; c) robustness under informationlosses; and d) neurophysiological plausibility to modelize the HVS.

    Keywords : Visual psychophysics; Computer vision; Gabor functions; Wavelets; Bandpass filters.

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    3/29

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    4/29

    4

    Maffei y Fiorentini (1973) sugirieron que las células simples eran el soporte fisiológico de losdetectores de la frecuencia espacial, por lo que la corteza visual primaria operaba como unanalizador de frecuencias espaciales.Hubel y Wiesel (1962) habían observado que los perfiles unidimensionales (1D) de los CR de las

    células simples eran de dos tipos. a) células simples de campo simétrico, y b) células simples decampo asimétrico, pudiendo caracterizarse como funciones simétricas (even o fase seno) oasimétricas (odd o fase coseno), respectivamente. Robson (1975) sugirió que el análisis de la forma(frecuencia espacial), podía efectuarse, mediante células simples, por regiones ( patch-by-patch ) ypropuso un modelo de distribución de los CR retinianos, según el cual las células simplessintonizadas a las altas frecuencias espaciales tendrían más ciclos dentro del 'parche' que lassintonizadas a las bajas frecuencias espaciales. Por tanto, la anchura de banda radial (en frecuencia)de una célula simple sería inversamente proporcional a su frecuencia espacial de sintonía.

    Kulikowski et al. (1982) también consideran que el tamaño de los CR era inversamenteproporcional a la frecuencia de sintonía, aunque discreparon al considerar que la anchura de bandaradial relativa, en octavas, debía ser constante, independientemente de la frecuencia espacial desintonía.

    Desde el enfoque del tratamiento de señales se había planteado el problema relativo a larepresentación de la señal. Un problema difícil de resolver y que, no obstante, parece que lo habíanresuelto ciertos sistemas sensoriales biológicos, tales como el SV. En este contexto, el principio de

    incertidumbre de la transformada de Fourier (TF) viene a decir que si un objeto se representa congran precisión en el dominio frecuencial, inexorablemente tendrá una representación de bajaprecisión en el dominio espacial, y viceversa. En otras palabras, la localización espacial de un filtroy la determinación de la escala (frecuencias espaciales a las que es selectivo) no son procesosindependientes entre sí. Este problema ya fue abordado por Gabor (1946), concluyendo que lasseñales gaussianas proporcionaban la mejor solución de compromiso posible, ya que la TF de unafunción gaussiana localizada en (x0,y0) es otra función gaussiana, si bien cambia la localizaciónsobre el plano espectral (u,v). Según este autor, es posible representar una señal, descomponiéndola

    en un conjunto dequantos elementales de información ologones o paquetes de onda. Así, lasolución al problema de las representaciones de la imagen en el SV, se concreta en que el productode la extensión (incertidumbre) en la localización frecuencial del filtro y el de su localizaciónespacial produce un valor mínimo cuando utilizamos una función resultante de multiplicar unamodulación de la luminancia sinusoidal por una gaussiana envolvente de dicha modulación, esdecir, un filtro de Gabor. Aunque Gabor (1946) se centró en señales unidimensionales, Daugman(1985) estudió esta inexorable relación de incertidumbre en el caso de los filtros de Gabor-2D.Este problema tiene un gran interés en el ámbito del procesamiento visual espacial, dado que el

    cómputo realizado por el SV de primates y humanos parece utilizar representaciones de la imagen

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    5/29

    5

    espaciales y espectrales, locales y globales. En síntesis, estos SV han hallado una solución queparece aplicar un análisis bidimensional en el dominio frecuencial a cada CR (dominio espacial)retiniano, codificando la imagen en función de las respuestas a una población de células simples,susceptibles de modelizarse mediante un banco de filtros de Gabor-2D.

    Marcelja (1980) tras observar los perfiles de los CR y las frecuencias de sintonía de las célulassimples corticales, llegó a la conclusión de que la representación cortical de una imagen debecontener tanto parámetros espaciales como frecuenciales. También mostró que las funciones quemejor ajustan (minimizan la suma de los errores cuadráticos) los perfiles de las células simples,registrados por Movshon, Thompson y Tolhurst (1978) son las funciones de Gabor. Daugman(1980) se ocupó del estudio de perfiles bidimensionales.Daugman (1984), utilizando el paradigma de enmascaramiento, determinó las características de loscanales psicofísicos como sistemas bidimensionales de procesamiento.

    Pollen y Ronner (1981) estudiaron pares de células simples adyacentes en el córtex visual del gato yobservaron que, generalmente, estaban sintonizadas a la misma frecuencia espacial y a la mismaorientación, pero sus respuestas diferían, en cuanto a fase, en 90º, es decir, se hallan en cuadraturafásica. Esto les sugirió que las células simples, sintonizadas a la misma frecuencia espacial yorientación, podían modelizarse mediante filtros Gabor simétricos y asimétricos.Jones y Palmer (1987) señalaron que en el SVH, cada célula simple tiene asociados dos CRretinianos. Por ser las funciones de Gabor funciones complejas, constan de parte real (even filter ofase coseno,φ=0º) y parte imaginaria (odd filter o fase seno,φ=90º), que pueden descomponerse en

    dos partes, la parte que tiene un perfil simétrico (véase Figura 1) emulará a un detector de barras yla que tiene un perfil asimétrico a un detector de líneas.La investigación neurofisiológica (Movshon et al. 1978) también nos ha proporcionado datos sobrela anchura de banda angular o en orientación (Ba) de los CR de las células simples. En promedio,ésta es de unos 35º, aunque en el caso del macaco es de 33,8º (De Valois et al.; 1982b). De acuerdocon Wilson y Bergen (1979), en el SVH, los canales sintonizados a la frecuencia espacial estándistribuidos aproximadamente en octavas y con una anchura de banda radial (Br) proporcional a sufrecuencia pico (o de sintonía). Los distintos investigadores han obtenido estimaciones de Br entre

    0,7 y 2,5 octavas, siendo el promedio general de 1,4 octavas y de 1,45 octavas en el macaco (DeValois et al.; 1982a). Por tanto, el cociente entre ambas anchuras de banda (Br/Ba) de los CRasociados a las células simples sería de 1,5. Ello implica que la forma de la gaussiana envolvente eselongada.

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    6/29

    6

    FIGURA 1.- a) Panel superior: parte real de la función de Gabor-2D y su perfil simétrico (even filter ), dicho perfil muestra que el filtro actúa como un detector de barras. b) Panel inferior: parteimaginaria de la función de Gabor-2D y su perfil asimétrico (odd filter ), este otro perfil muestra queel filtro actúa como un detector de líneas.

    De la observación, abundantemente constatada (Campbell y Kulikowski, 1966; De Valois, Albrecht

    y Thorrel, 1982a), de que las células simples del córtex visual están sintonizadas a estrechas bandasde frecuencias espaciales y estrechas franjas de orientaciones, se infiere que elSVH practica un análisis de la imagen multirresolución y multiorientado, susceptible demodelizarse mediante un esquema piramidal que descomponga la imagen de entrada al sistema enmúltiples escalas (frecuencias espaciales) y orientaciones. Desde el enfoque del tratamiento deseñales, recientemente se han derivado varios modelos de codificación de la imagen basados en losprincipios debatidos por Gabor (1946), que fragmentan la señal en múltiples escalas y orientaciones(Bastiaans, 1981; Porat y Zevi, 1988; Field, 1987; Daugman, 1988; Navarro y Tabernero, 1991;etc.). Hasta la fecha, ninguno de éstos diferentes esquemas de codificación de la imagen han

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    7/29

    7

    mostrado mayor eficiencia o plausibilidad fisiológica sobre los otros, lo que refleja la situaciónactual de un problema todavía no resuelto. El modelo, que aquí describimos, está basado en elpropuesto por Navarro y Tabernero (1991), el cual permite variar los dos principales parámetrosespectrales de la función de Gabor-2D, que son la anchura de banda en frecuencia espacial (banda

    radial) y la anchura de banda en orientación (banda angular) de los hipotéticos canales de frecuenciaespacial y orientación modelizados. Estos dos parámetros, a su vez, se relacionan con el número deescalas en que se descompone la imagen y el número de canales de orientación, así como con elgrado de redundancia informativa (solapamiento) entre estos canales. Por tanto, nosotrosdefiniremos el filtro de Gabor a partir de la frecuencia espacial preferente o de sintonía y laorientación óptima a la que responde el filtro. Estos autores, en aras de una mayor simplicidad delmodelo, definen la función de Gabor-2D con simetría circular, en lugar de la forma elongadadescrita por los neurofisiólogos, también definen cuatro canales de frecuencia espacial; la mayoría

    de los modelos existentes definen entre cuatro y ocho (cuatro según Wilson y Bergen, 1979; seissegún Wilson et al., 1983 y ocho según Watson, 1983). Sin embargo, aquí tratamos de modelizar elS.V. del macaco y no el humano, por lo que de modo coherente con los datos neurofisiológicosobtenidos por De Valois y colaboradores sugieren que la anchura de banda en frecuencia espacial esde 1,45 octavas (De Valois, Albrecht y Thorrell, 1982) y la anchura de banda en orientación es de33,8º (De Valois, Yund y Hepler, 1982). También consideraremos, de modo acorde con lasevidencias neurofisiológicas, que la forma de los campos receptivos es elongada y,consecuentemente, nuestras funciones de abor no mostrarán simetría radial. Además, nosotros

    estableceremos seis canales de orientación sintonizados a 0º, 30º, 60º, 90º, 120º y 150º y no loscuatro propuestos por estos autores, sintonizados a 0º, 45º, 90º y 135º. Complementariamente, y alobjeto de poder implementar el modelo de análisis de la imagen en el dominio espacial, mediante laoperación de convolución, proponemos un banco de seis máscaras (filtros orientados), así como unalgoritmo de análisis piramidal que opera sobre sucesivos sub-muestreos de la imagen comoestrategia para variar la resolución o máximo grado de detalle que es susceptible de serrepresentado.En este trabajo se muestra el resultado de implementar este tipo de análisis de la imagen, tanto en el

    dominio frecuencial como en el dominio espacial. En la sección 2 se describen con más detalles losparámetros del esquema multiescala y multiorientación que hemos adoptado y que permitenmodelizar el procesamiento de la imagen por un hipotético sistema que emula al SV del macaco(anatómica y morfológicamente, similar al humano). En la sección 3 se aplica el anterior esquema alanálisis de una imagen en el dominio frecuencial. En la sección 4 se aplica un filtrado (en eldominio espacial) basado en regiones, haciendo uso de la operación de convolución de una imagencon un juego de seis máscaras 11x11 elementos que hemos elaborado, sub-muestreando seis filtrosGabor-2D sintonizados a otras tantas orientaciones. También se analiza (en el dominio espacial) la

    imagen en un esquema piramidal multiescala, aunque en una sola orientación (a modo de

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    8/29

    8

    ilustración). En la sección 5 se discuten los resultados experimentales de los análisis precedentes,los cuales ilustran las ventajas, para la codificación de imágenes, que ofrece el uso de laTransformada de Gabor con ondículas y que han sido señaladas por numerosos autores

    2. ESQUEMA GABOR MULTIESCALA Y MULTIORIENTACIONLas funciones de Gabor-2D quedan determinadas por cuatro parámetros, dos que expresan sulocalización en el dominio espacial (x,y), es decir las coordenadas del centro de la envolventegaussiana y otros dos (frecuencia espacial de sintonía= f 0 y orientación=θ; o, alternativamente, encoordenadas cartesianas, frecuencia espacial en dirección horizontal= u y vertical= v) que indicanla localización en el dominio frecuencial. La señal elemental de Gabor-2D espacial, localizadaespacialmente en (x=0,y=0) y en el dominio frecuencial sintonizada a f 0 y θ (coordenadas polares),puede expresarse analíticamente mediante la ecuación::

    0 0 0 0 0 00 0 0 0 x y f

    x y W f g g x y x x y y, , , , , ,( , ) ( , ) ( , )θ θ δ

    = • ∗ − − [1]

    Donde

    00 0 02 2 2 2

    02, , , ( , ) ( ) f e e eg x y a x T y i f x iθ

    π π φ = − +

    siendoa un coeficiente que determina la anchura de banda radial (rango de frecuencias espacialesen torno a la frecuencia de sintonía f 0), T (razón de aspecto) es un factor que determina la forma dela envoltura gaussiana (simetría circular, siT =1 y elongada, en otro caso),φ es la fase de lamodulación sinusoidal. En nuestro modelo, al tener la gaussiana forma elongada, la orientación deleje menor de la gaussiana (en el dominio espacial) sigue la dirección ortogonal a la onda sinusoidal(θo)

    Al aplicar a esta señal elemental de Gabor bidimensional una rotación de un ánguloθ θ=

    0 seobtiene la ecuación que sigue más abajo, la cual resulta de sustituir x e y en la ecuación [1]:

    x= ( cos ) x y sin⋅ + ⋅θ θ 0 0 ;

    y= ( cos )− ⋅ + ⋅ x sin yθ θ 0 0 ,

    g x y e e ea x ysin T xsin y i f x ysin i( , ) (( cos ) ( cos ) ) ( cos )= − + + − + +π θ θ θ θ π θ θ φ2 0 0 2 2 0 0 2 0 0 02 [2]

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    9/29

    9

    No obstante, si se desea saber cuales son las coordenadas cartesianas (u o,v o) de las frecuenciasespaciales de sintonía de estos filtros, pueden calcularse mediante:

    u0 = f o cos( θ o)v0 = f o sin( θ o) [3]

    Esta señal elemental de Gabor-2D está situada en el origen espacial, coordenadas (0,0). De este

    modo, definimos la respuesta de un CR (Gx0,y0,f 0,θ0) como la salida del canal sintonizado a (f 0,θ0),evaluado en el punto (x0,y0). Por tanto, (x0,y0) no son etiquetas de los canales, sino coordenadas quedeterminan el punto en el que se aplica el CR y en el que se calcula la salida del canal. Nosotros, deacuerdo con los datos de Wilson y Bergen (1979), asumiremos que el S.V. aquí modelizado disponede cuatro canales, cada uno sintonizado a un estrecho rango de frecuencias espaciales. Lasfrecuencias de sintonía (f 0), para estos cuatro canales, establecidos en nuestro conjunto de filtros

    (modelo), tienen las siguientes frecuencias pico (f 0) distribuidas en octavas: f N/2, f N/4, f N/8 y f N/16 (dondeN son las frecuencias Nyquist de muestreo), es decir: 1/32, 1/16, 1/8 y ¼ ciclos/imagen. Losseis canales de orientación, se sintonizan a 0º, 30º, 60º, 90º, 120º y 150º. En definitiva, nosotrosespecificamos la localización, en el dominio frecuencial, en coordenadas polares (f 0, θ), y no encoordenadas cartesianas, mediante (u,v).

    FIGURA 2.- Ilustración de los conceptos de: frecuencia espacial de sintonía o frecuencia pico (f 0),anchura de banda radial (Br), anchura de banda angular (Ba), frecuencias espaciales (u,v) del planode Fourier (plano espectral).

    El rango de frecuencias espaciales al que responde el filtro oanchura de banda radial (Br) a lamitad de altura, la obtenemos antes de rotarθº la función de Gabor (véase Figura 2), tomando la

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    10/29

    10

    anchura a media altura a lo largo del eje de las frecuencias en x (u en el dominio frecuencial). Sinembargo, en la práctica es habitual medir este ancho de banda radial en octavas (en una octava lafrecuencia superior es el doble de la inferior, en la franja que medimos la anchura), por ellotransformamos las frecuencias a una escala logarítmica de base 2 y medimos la anchura a la altura

    mitad.

    Br octavas f a f a f a

    f a

    ( ) log ln

    log ln

    log

    ln

    ln= +

    − −

    =+

    2 0 2 0 2

    0

    0

    2 22

    2π π π

    π

    [4]

    La Figura 3 ilustra, en el dominio frecuencial, como en función de la anchura de banda de los cuatrocanales sintonizados a f 0 recubren buena parte del plano de Fourier. Debemos advertir1 que, talcomo se ha definido la señal de Gabor, los cuatro picos máximos serían diferentes entre sí y de

    desigual altura sobre el eje de ordenadas.

    FIGURA 3.- Ilustración de cómo las cuatro anchuras de banda en frecuencia seleccionadas(centradas en las frecuencias: 1/32, 1/16, 1/8 y 1/4 ciclos/img) recubren el plano de Fourier sobre eleje u. Obsérvese el solapamiento entre curvas relativas a filtros (gaussianas) adyacentes.

    El valor dea en la ecuación 1, junto con el valor de T, también determinan la denominada anchurade banda angular (Ba) o rango de orientaciones al que es sensible (o está sintonizado) el filtro. Se

    calcula a partir de la siguiente fórmula:

    Ba tanT a

    f =

    −2

    21

    0

    . ln

    π [5]

    1 Puesto que existen otras posibles definiciones formales de la función de Gabor-2D, acordes conesta figura, se ha creído conveniente mantenerla con el fin de ilustrar, del modo más simple, el

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    11/29

    11

    En suma, de acuerdo con los datos aportados por De Valois et al (1982a), tratamos de lograr que, ennuestro banco de filtros, la Br sea constante en una escala logarítmica e igual a 1,45 octava y la Basea de 33,8º, lo que produce un solapamiento, entre el conjunto base de funciones de Gabor de,aproximadamente, el 56%, que compensa la no ortogonalidad de estas funciones de base. Una vez

    fijadas Br y Ba, averiguaremos el valor de una constante (k, llamada razón de forma) tal que seaproporcional, en cada caso, a la frecuencia pico: a= k · f 0.Así, podemos calcular k, fijando el ancho de banda en octavas, mediante la fórmula:

    k Br

    Br= −

    ln 22 12 1

    [6]

    En nuestro caso, como deseamos que el ancho de banda radial fuera de 1,45 octava, sustituyendo

    Br=1,45 en la ecuación anterior se obtiene el valor de k=0,988 que usaremos para nuestrasfunciones.Ahora, podemos calcular el parámetro T (razón de aspecto) a partir de la ecuación que sigue:

    T k tan Ba=

    π

    ln ( / )21

    2 [7]

    lo que, fijando Ba= 33,8º (0,59 radianes) y k= 0,988, produce una T= 0,65. Este parámetro T, serelaciona indirectamente con el número de canales de orientación establecidos en el modelo, ya que

    cuanto mayor sea el número de canales orientación, menor debería ser el ancho de banda angular(Ba) para evitar un excesivo solapamiento (redundancia informativa) entre las funciones de Gabor.Una vez establecidas las anchuras de banda (Br y Ba), generamos las funciones de Gabor 2D. Unaimplementación en lenguaje de programación C, que genera dichos filtros se muestra en el Anexo-1.Recuérdese que las funciones de Gabor son funciones que operan en el conjunto de los númeroscomplejos, y que la parte real es la función de Gabor simétrica (even filter o fase coseno). En elconjunto de los reales, este filtro puede calcularse asignando a la fase de la modulación de la

    luminancia el valorφ= 0º (ó 0 radianes), con lo que resulta una modulación senoidal. La parteimaginaria es la función de Gabor asimétrica (odd filter o fase seno), que podemos calcular en elconjunto de los reales asignando a la fase de la modulación de la luminancia el valorφ= 90º (óπ /2radianes), con lo que resulta una modulación cosenoidal.No obstante, podemos concebir la información aportada por este par en cuadratura fásica como unvector bidimensional cuya magnitud informa del contraste de energía en un punto dado y cuya

    diferente recubrimiento del plano espectral, por parte de los cuatro canales sintonizados a diferentesfrecuencias espaciales.

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    12/29

    12

    dirección especifica la fase de tal energía. Es decir, las respuestas del par de filtros en cuadraturaaplicados sobre la imagen serán las mismas (el contraste de energía no varía), pero si cambiará ladirección de la variación de dicho contraste de energía.El contraste de energía E(x,y) de un par en cuadratura se obtiene mediante la ecuación:

    E x y even x y odd x y( , ) ( , ) ( , )= +2 2 [8]

    Donde even(x,y) corresponde al even-filter (filtro simétrico o parte real con fase coseno) de lafunción compleja de Gabor-2D yodd(x,y) al odd-filter (filtro asimétrico o parte imaginaria con faseseno). Este contraste de energía llamado por Bracewell (1978)amplitud de la señal , al representarloen niveles de gris, muestra la respuesta de la imagen al par en cuadratura en función de la posiciónespacial, que es independiente de la fase. De modo similar, el espectro de amplitud (dominioespectral) representa la respuesta en función de la frecuencia, independientemente de la fase. Estafunción E(x,y) presenta una gran similitud con el comportamiento de las células complejas yproporciona una medida de la respuesta del canal, que es independiente del cambio de fase local.

    2.1 CARACTERÍSTICAS DEL MODELO DE ANÁLISIS DE LA IMAGEN Las principales características del modelo que aquí se propone son:1. La Br determina, en el dominio frecuencial, la distancia entre canales vecinos sintonizados a

    diferentes frecuencias espaciales. Al mismo tiempo, determina (dominio espacial) la anchura decada sensor y su espaciamiento. En nuestro modelo del córtex visual del macaco hemosestablecido cuatro canales de frecuencia espacial sintonizados a 1/32, 1/16, 1/8 y 1/4 c/img.

    2. La Ba determina, en el dominio frecuencial, la distancia entre canales vecinos sintonizados adiferentes orientaciones. Esto, a su vez, determina (en el dominio espacial) la longitud de cadasensor, así como la separación entre ellos. En nuestro modelo hemos establecido seis canales deorientación, cuyas sintonizaciones preferentes son: 0º, 30º, 60º, 90º, 120º y 150º.

    3. Las anchuras de banda en frecuencia espacial (Br’s) son constantes en escala logarítmica e iguala 1,45 octavas.

    4. Las anchuras de banda en orientación (Ba’s) son constantes en grados sexagesimales, e igualesa 33,8º.

    5. En cada posición espacial actúan dos sensores ortogonales, cuyas fases están en cuadratura(dierencia fásica de 90º). La amplitud de la respuesta de la señal analítica se determina, paracada par de sensores, calculando E(x,y) .

    6. El número total de sensores es independiente de la particular elección de Br y Ba, siendoconstante e igual al número de parámetros libres de la señal de entrada, es decir, del número depixels de la imagen.

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    13/29

    13

    La respuesta ( R) que se genera cuando el centro (xo,yo) de la imagen f(x,y) incide sobre un CRasociado a un canal psicofísico sintonizado a (f o,θ o) vendrá dada por la ecuación:

    0 0 0 0 0 0 0 0 x y f f x y x y f x y R g dx dy, , , , , ,*

    ( , ) ( , )θ θ = • •−∞

    +∞

    −∞

    +∞

    ∫ ∫ [9]Dondeg* indica el conjugado complejo del filtro de Gabor.Por lo que, teniendo en cuenta el teorema de la convolución, es posible calcular la respuesta de uncanal psicofísico, tanto en el dominio espacial (mediante la convolución de la imagen con unamáscara-filtro) como en el dominio de la frecuencia espacial (filtrando la imagen con una funciónde Gabor-2D).En resumen, cuando un canal (asociado a un CR retiniano) se aplica a una imagen, la respuesta deeste codifica cada punto (x,y) de la imagen f(x,y) en función de la frecuencia espacial y laorientación preferida a la que está sintonizado ese canal.

    3. ANALISIS MULTIESCALA Y MULTIORIENTACION (DOMINIO FRECUENCIAL)El conjunto de 24 funciones de Gabor, antes descrito, se adapta perfectamente a un esquemapiramidal con multirresolución (y multiorientación). Sin embargo este conjunto no permite unacompleta reconstrucción de la imagen original, como se ilustra en la Figura 4. Por tanto, queda claroque estas 24 funciones de Gabor no constituyen una base ortogonal y, en sentido estricto, tampocoson filtros paso-banda puros (lo cual implica que no satisface el requerimiento de admisibilidadcomo ondícula owavelet ), pero su componente DC ( zero frequency ) es muy pequeño (menor que0.003 para una función de Gabor-2D con anchura de banda de 1,5 octavas). Sin embargo, han sidopropuestos otros modelos de codificación de la imagen (Bastiaans, 1981; Daugman, 1988; Porat yZeevi, 1988; etc.) que permiten una completa transformación basada en las funciones de Gabor y,por tanto, una reconstrucción exacta.

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    14/29

    14

    FIGURA 4.- Representación del recubrimiento del plano de Fourier (dominio frecuencial) a partirde un esquema piramidal multiescala y multirresolución constituido por nuestro conjunto defunciones de Gabor-2D.

    También, es preciso enfatizar que los campos receptivos de una cierta escala tiene un solapamiento

    del 56%, aproximadamente. Esta representación tan redundante muestra una gran robustez.

    FIGURA 5.- Conjunto de 24 filtros simétricos o funciones de Gabor-2D resultantes de combinar 4escalas (o canales de frecuencia espacial) con 6 orientaciones.

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    15/29

    15

    En este trabajo, trataremos de mimetizar el procesamiento visual humano, aplicando un conjunto defunciones de base (banco de 24 filtros de Gabor). En la Figura 5, puede observarse la.representación 2D de los 24even-filter (parte real de la función de Gabor) en niveles de gris. En ellapuede observarse la forma de la función bidimensional de Gabor y sus niveles de gris ilustran la fpp

    (función de pesos del punto) típicas de las células simples, donde los valores de luminancia (nivelesde gris) de cada función de Gabor indican los pesos con que resultan ponderados cada estímulopuntual (pixel de la imagen) al incidir sobre esa localización. En otras palabras, viene a indicar laimportancia con que cada punto del CR contribuye a la salida del trozo de la imagen procesado porla célula simple asociada a tal CR.

    3.1 RESULTADOS EXPERIMENTALES DEL ANALISIS DE LA IMAGENAl aplicar este conjunto de 24 filtros (even-filter ) a una imagen digital, ésta resulta analizada,

    produciendo una representación multiescala y multiorientación que puede organizarse en unesquema piramidal y, a partir del cual será posible una reconstrucción casi completa de la imagen deentrada en el sistema.

    FIGURA 6.- Descomposición de la imagen en un esquema piramidal multiescala (4 canales defrecuencia) y multiorientación (6 canales de orientación). Cada una de las cuatro filas de imágenesrepresenta un canal de frecuencia y cada una de las seis columnas de imágenes representa un canalde orientación.

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    16/29

    16

    La Figura 6 muestra este análisis, en el que las frecuencias espaciales de sintonía aumentan dearriba abajo (1/32 < 1/16 < 1/8 < 1/4 c./img) en las distintas filas (de ahí el término pirámide). Cadauna de las seis columnas resalta los bordes de una cierta orientación en las diferentes escalas(frecuencias espaciales).

    FIGURA 7.- Arriba-izquierda: imagen original. Arriba-centro:even-filter y arriba-derecha:odd-

    filter , ambos sintonizados a una f o= 1/4 c/img y a una orientación deθ= 90º.Abajo-izquierda:amplitud de respuesta producida al ser analizada la imagen por un canal psicofísico, definido por unpar de CR asociados a una célula simple en cuadratura fásica, sintonizado a una f o= 1/4 c/img y auna orientación deθ= 90º. Abajo-centro y abajo-derecha: respuestas del filtrado de la imagenoriginal ante eleven-filter y el odd-filter , respectivamente (componentes del par en cuadraturafásica).

    Complementariamente a lo anterior, al aplicar el otro conjunto de 24odd-filters (parte imaginaria de

    la función de Gabor) se obtienen otras tantas representaciones de la escala, siendo cada una de ellasel correspondiente par en cuadratura (desfase de 90º) del anterior (even-filter ).La Figura 7, arriba, contiene laamplitud de respuesta correspondiente a la salida de uno de los 24canales psicofísicos modelizados mediante un par en cuadratura (Figura 7, arriba-centro:even-filtery arriba-derecha:odd-filter ). Concretamente, el par cuya frecuencia espacial de sintonía es de f o=1/4 c/img y cuya orientación sintoniza de modo preferente aθ= 90º. De manera análoga alprocesamiento aplicado en este canal, actúan los otros 23 canales psicofísicos.

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    17/29

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    18/29

    18

    de la parte central de esta figura se representan, en niveles de gris, los espectros de amplitudcorrespondientes a la TGO, pudiéndose observar cómo cada escala es selectiva a un estrecho rangode frecuencias espaciales en todas las orientaciones del espacio.En la franja inferior de la Figura 8, igualmente ordenadas por columnas, se hallan los resultados de

    la reconstrucción de la señal, en cada escala. La reconstrucción en una cierta escala, viene dada porla ecuación:

    f x y R g dx dy df c x y f x y f x y( , ) , , , , , , ( , )= • • •−∞

    +∞

    −∞

    +∞

    ∫ ∫ 0

    0 0 0 0 0 0 0 0 0θ θ θ [10]

    Siendo Rx,y,f,θ la respuesta (TGO) de la célula simple ante la imagenf(x,y) y gx,y,f,θ el filtro de

    Gabor, localizado espacialmente en (x,y) y espectralmente en (f,θ).Si se comparan las imágenes de arriba y de abajo, de cada columna, ya sea visualmente, ya seahallando la diferencia entre ambas, obtendremos elerror de reconstrucción de la imagen de entrada.El pequeño error obtenido revela que, aunque nuestro banco de filtros de Gabor no recubre todo elplano de Fourier (espectral), dado el elevado solapamiento existente entre los filtros que en nuestroesquema adoptamos (56%), constituye una robusta representacióncuasi completa, que minimiza larelación de incertidumbre de la TF.

    FIGURA 9- Panel izq.: espectro de amplitud de la Transformada de Fourier de la imagen original.Panel central: espectro de amplitud de la reconstrucción de la imagen de entrada en las cuatroescalas o canales de frecuencia. Panel dcho.: diferencia entre los dos espectros de amplitudanteriores (error de reconstrucción).

    Análogamente, en el dominio espectral, si calculamos la diferencia entre el espectro de fase de laTF de la imagen y los espectros de amplitud correspondientes a la TGO en todas las escalas,obtenemos una medida delerror de reconstrucción de la imagen (véase Figura 9).

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    19/29

    19

    4. FILTRADO EN EL DOMINIO ESPACIALExisten numerosas evidencias (Robson, 1975; Graham, 1981) de que el SVH analiza lainformación de la imagen que incide en cada 'región ' del mosaico retiniano aplicando algo así comoun análisis de Fourier fragmentado. Este análisis espectral por regiones es el que resulta plausible,

    neurofisiológicamente, modelizar mediante las funciones elementales de Gabor, ya que ningunaoperación del procesamiento inicial espacial opera, globalmente, sobre toda la imagen.

    FIGURA 10.- Izquierda: perfil 1D deleven filter (parte real de la función compleja de Gabor).Derecha: perfil 1D delodd filter (parte imaginaria de la función compleja de Gabor). Los puntosnegros marcados sobre las funciones indican las posiciones espaciales de las columnas muestreadaspara construir las máscaras (filtro Gabor) de 11x11 elementos.

    El filtrado por regiones, en el dominio espacial, se realiza mediante la operación deconvolución dela imagen de entrada con una máscara o filtro de menor dimensión que la imagen. Para construiruna máscara de 11x11 elementos, detectora de barras (fase coseno oφ= 0º) y sintonizada a unaorientación de 0º, seleccionamos sobre una función de Gabor-2Deven filter (128 x128 pixels) lascolumnas de mayor relevancia informativa (véase Figura 10-izquierda), las cuales se utilizaron paratomar 11 muestras por cada una de otras 11 filas. Un muestreo logarítmico que, simétricamente,partía de la fila 64 (N/2) hacia las filas 1 y 128 (N), nos permitió seleccionar las 11 filas de la

    máscara de convolución. En la Figura 11, panel superior derecho, se muestra esta máscara (θ= 0º yφ= 0º)).De modo análogo, pero adecuando el muestreo de columnas al perfil de unodd filter (fase seno oφ= 90º)mostrado en la Figura 10-derecha, podría permitirnos seleccionar las columnas paraconstruir la máscara de convolución de un detector de líneas.

    Rotando 90º la máscara sintonizada aθ= 0º, se obtuvo la máscara sintonizada aθ= 90º.

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    20/29

    20

    θ= 90º; φ= 90º

    0 0 0 0 0 0 0 0 0 0 00 1 4 4 5 5 5 4 4 1 00 0 0 0 0 0 0 0 0 0 00 -3 -10 -12 -14 -14 -14 -12 -10 -3 0

    0 0 0 0 0 0 0 0 0 0 01 6 16 19 21 22 21 19 16 6 10 0 0 0 0 0 0 0 0 0 00 -3 -10 -12 -14 -14 -14 -12 -10 -3 00 0 0 0 0 0 0 0 0 0 00 1 4 4 5 5 5 4 4 1 00 0 0 0 0 0 0 0 0 0 0

    θ= 120º; φ= 90º

    0 0 0 0 0 0 0 1 0 0 00 0 0 0 0 5 0 0 0 -5 00 0 0 1 0 0 0 -10 0 0 00 1 0 0 0 -15 0 0 0 9 00 0 0 -10 0 0 0 18 0 0 00 -5 0 0 0 25 0 0 0 -5 00 0 0 18 0 0 0 -10 0 0 00 9 0 0 0 -15 0 0 0 1 00 0 0 -10 0 0 0 3 0 0 00 -5 0 0 0 5 0 0 0 0 00 0 0 1 0 0 0 0 0 0 0

    θ= 150º; φ= 90º

    0 0 0 0 0 0 0 0 0 0 00 0 0 1 0 -5 0 9 0 -5 00 0 0 0 0 0 0 0 0 0 00 0 2 0 -11 0 18 0 -11 0 30 0 0 0 0 0 0 0 0 0 00 5 0 -15 0 25 0 -15 0 5 00 0 0 0 0 0 0 0 0 0 02 0 -11 0 18 0 -11 0 3 0 00 0 0 0 0 0 0 0 0 0 00 -5 0 9 0 -5 0 1 0 0 00 0 0 0 0 0 0 0 0 0 0

    θ= 0º; φ= 90º

    0 0 0 0 0 1 0 0 0 0 00 1 0 -3 0 6 0 -3 0 1 00 4 0 -10 0 16 0 -10 0 4 00 4 0 -12 0 19 0 -12 0 4 0

    0 5 0 -14 0 21 0 -14 0 5 00 5 0 -14 0 22 0 -14 0 5 00 5 0 -14 0 21 0 -14 0 5 00 4 0 -12 0 19 0 -12 0 4 00 4 0 -10 0 16 0 -10 0 4 00 1 0 -3 0 6 0 -3 0 1 00 0 0 0 0 1 0 0 0 0 0

    θ= 30º; φ= 90º

    0 0 0 0 0 0 0 0 0 0 00 -5 0 9 0 -5 0 1 0 0 00 0 0 0 0 0 0 0 0 0 03 0 -11 0 18 0 -11 0 2 0 00 0 0 0 0 0 0 0 0 0 00 5 0 -15 0 25 0 -15 0 5 00 0 0 0 0 0 0 0 0 0 00 0 3 0 -11 0 18 0 -11 0 20 0 0 0 0 0 0 0 0 0 00 0 0 1 0 -5 0 9 0 -5 00 0 0 0 0 0 0 0 0 0 0

    θ= 60º; φ= 90º

    0 0 0 3 0 0 0 0 0 0 00 -5 0 0 0 5 0 0 0 0 00 0 0 -11 0 0 0 3 0 0 00 9 0 0 0 -15 0 0 0 1 00 0 0 18 0 0 0 -11 0 0 00 -5 0 0 0 25 0 0 0 -5 00 0 0 -11 0 0 0 18 0 0 00 1 0 0 0 -15 0 0 0 9 00 0 0 2 0 0 0 -11 0 0 00 0 0 0 0 5 0 0 0 -5 00 0 0 0 0 0 0 2 0 0 0

    FIGURA 11.- Máscaras 11x11 elementos paraaplicar el filtrado Gabor-2D en el dominio espacial.Las máscaras sintonizadas a orientaciones de 0º y30º han sido generadas mediante muestreo

    selectivo sobre las pertinentes funciones Gabor-2D even filter (fase coseno). Las máscarassintonizadas a las demás orientaciones se hanobtenido por rotación, simetría axial, otransposición de una de las dos matricesanteriores.

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    21/29

    21

    Trazando una recta ortogonal a una Gabor-2D (even filter ) sintonizada aθ= 30º, de modoanálogo al anteriormente descrito, el perfil a lo largo de dicha línea nos proporciona lascolumnas que deben muestrearse para componer una máscara sensible a rasgos con una

    orientación de 30º. Hallando la matriz transpuesta de la máscara sintonizada aθ= 30º, se obtuvo

    la máscara sintonizada aθ= 60º. Finalmente, la máscara sintonizada aθ= 150º se obtuvo como

    la simetría especular de la máscara sintonizada aθ= 30º y la sintonizada aθ= 120º, a partir de

    la simetría de la sintonizada aθ= 60º. En la Figura 11 pueden observarse este conjunto demáscaras (banco de filtros) que nos permitieron implementar el filtrado en el dominio espacial.

    FIGURA 12.- Izquierda.: malla 3D correspondiente a la máscara de convolución que aproximaun even filter Gabor-2D sintonizado a una orientación de 0º. Centro: representación en niveles

    de gris deleven filter Gabor-2D sintonizado aθ= 0º. Derecha: representación 3D renderizadadel citado filtro.

    La Figura 12 permite comparar la función de Gabor-2D con fase coseno (φ= 0º)even filter delpanel central y derecho con la representación en malla 3D de la máscara de convolución de

    11x11 elementos todas ellas sintonizadas aθ= 0º. A pesar de haber submuestreado una imagen(conteniendo la función de Gabor-2D) de 128x128 pixel a otra imagen de 11x11 pixels, la

    aproximación es bastante fidedigna, lo cual sugiere que los pixels seleccionados son los másrepresentativos de la función bidimensional.

    4.1 RESULTADOS EXPERIMENTALES(FILTRADO ESPACIAL Por ser la TF una operación global, que actúa sobre toda la imagen, no es posible aplicar esteanálisis sobre una cierta región de dicha imagen, aunque si puede aplicarse sobre una subimageno 'ventana' de la original. Sin embargo, en el dominio espacial, es posible aplicar un filtradoselectivo que opere (convolución) solo sobre una porción de la imagen que satisfaga ciertas

    condiciones. A modo de ejemplo, se ha aplicado a una imagen un detector de barras verticales(máscara o filtro simétrico de Gabor), pero no a toda la imagen, sino sólo a aquellos pixels que

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    22/29

    22

    se hallen a una distancia menor que un radio= 36 pixels y con centro en el pixel de coordenadas

    espaciales (i= 38, j=96). Al aplicar la máscara sintonizadaθ= 30º obtenemos los resultadosexpuestos en la Figura 13. Este filtrado selectivo, si bien no tiene relevancia fisiológica nipsicológica, nos permite mostrar como es posible desarrollar aplicaciones de estas técnicas,surgidas en el enfoque del procesamiento de imágenes digitales, por parte de la ingeniería.

    FIGURA 13.- Izq.: imagen de trabajo. Derecha: resultado de aplicar un filtrado local sobre unentorno de vecindad definido por un círculo de radio 36 pixels y centro en el pixel decoordenadas espaciales ( 38, 96). Sólo se aplicó la máscara sintonizada a 30º.

    Volviendo al análisis multiescala y multiorientado de la imagen, veamos cómo también esposible, en el dominio espacial, obtener una pirámide multiescala y multiorientación aplicandoel banco de máscaras que hemos elaborado (véase Figura 11). Como ilustración, en la Figura 14

    mostramos una pirámide multiescala que contiene sólo rasgos verticales (orientaciónθ= 0º),resultante de aplicar a la imagen la máscara de convolución .(even-filter ) sintonizada a dichaorientación.

    FIGURA 14.- Panel superior: imagen de trabajo descompuesta en 4 escalas mediante tressubmuestreos sucesivos de N a N/2. Panel inferior: resultado de aplicar un filtro Gabor medianteconvolución de la máscara sintonizada aθ= 0º con la imagen de trabajo, ya sea la original o unsubmuestreo de ésta.

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    23/29

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    24/29

    24

    enfoque del Procesamiento de señales, podría resolverse este problema de un modo artificial,adhoc , añadiendo un filtro residual paso-bajas, para recubrir el componente central y otro filtroresidual paso-altas, para recubrir las esquinas del plano de Fourier (véase Figura 4), lo quetambién produciría una reconstrucción completa. No obstante, si bien el objetivo del análisis de

    señales es el de lograr una codificación completa de la señal, los SV biológicos tienen como finel reconocimiento de objetos y escenas, por lo que el hecho de no ser completa, tal vez supongauna ventaja, más que un inconveniente para simplificar y economizar el tiempo deprocesamiento.Sin embargo, la Transformada Gabor ofrece la ventaja de ser la mejor solución posible alproblema de la relación de incertidumbre de la Transformada de Fourier (TF). Esto es, alresultar que la TF de una distribución gaussiana es otra gaussiana, aunque desplazada a otralocalización en el plano de Fourier, se produce que las funciones de Gabor proporcionan lamáxima localización tanto en el dominio espacial como en el dominio frecuencial, minimizando

    la relación de incertidumbre:∆x ·∆y·∆u·∆v= 1/16π2 (Daugman, 1985). Por esta razón se diceque la Transformada Gabor es una representación conjunta espacio-frecuencia espacial [véaseSierra-Vazquez (2000), para una mejor comprensión de los fundamentos de las representacionesconjuntas), dando a entender con ello que, al filtrar la imagen con las funciones de Gabor-2D,quedan determinadas tanto la posición espacial como la frecuencia espacial y orientación de losrasgos componentes de dicha imagen en un dominio denominado espacio-espectral.Por otra parte, la distribución en octavas de los canales de frecuencia espacial parece revelarsecomo la óptima, puesto que la energía existente en cada canal de frecuencia tiende a mantenerseconstante (Navarro, Santamaría y Gómez, 1987).También, es preciso recalcar que nosotros, de acuerdo con las observaciones de ciertosneurofisiologos (De Valois et al.,1 982a y De Valois et al., 1982b) hemos utilizado en nuestro

    banco de 24 filtros de Gabor (4 canales de frec. esp.× 6 canales de orient.) envolventesgaussianas-2D elongadas, con una Br igual a 1,45 octavas y una Ba igual a 33,8º, por lo que larazón (Br/Ba) daba lugar a un gran solapamiento (del 56%) en el área del plano de Fourier que

    ocupan, lo que produce una reconstrucción más robusta.Para terminar, recapitularemos las principales ventajas derivadas del uso de la TransformadaGabor (wavelets ), que ciertos autores han señalado y que en este trabajo hemos tratado demostrar. Estas se pueden sintetizar en cuatro:a) Las funciones de Gabor proporcionan un óptimo empaquetamiento de la información, ya

    que minimizan la relación de incertidumbre.b) La aplicación de filtros Gabor es fácilmente implementable computacionalmente, tanto en el

    dominio espacial (convolución) como en el dominio frecuencial (producto de dos Transfor_

    madas de Fourier).

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    25/29

    25

    c) La Transformada Gabor, aquí propuesta presenta gran robustez ante la pérdida deinformación, dada la redundancia existente (56%) en el recubrimiento del plano de Fourier.

    d) Estos quantos de información empaquetados gaussianamente han demostrado granplausibilidad neurofisiológica en la modelización de las células simples del córtex visual.

    Por estas razones, las funciones de Gabor han cobrado un creciente auge en la década de los 90y han sido aplicadas, con más que satisfactorios resultados, a una variedad de ámbitos en losque opera la visión, tales como análisis de texturas, detección del movimiento, estereopsisvisual, detección de bordes y compresión de la información sobre la imagen, entre otros.

    AGRADECIMIENTOSEste trabajo ha sido financiado por el proyecto PB95-0266 concedido por la DGES delMinisterio de Educación y Cultura (España).Agradezco a Oscar Nestares, Gabriel Cristobal y Raul Navarro (CSIC) sus aclaraciones.También agradezco a Vicente Sierra-Vazquez (UCM) sus sugerencias, valoraciones y críticas,así como por su interés en el trabajo y el tiempo que me ha dedicado. No obstante, laresponsabilidad de los posibles desaciertos es solo mía.

    ANEXO-1: Codigo fuente en Lenguaje C, que implementa la Función de Gabor-2D:x0=(size)/2; //Tamaño de la imagen que contiene la función.y0=(size)/2;

    for (i=0; i

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    26/29

    26

    EXTENDED SUMMARYIn the sixties, the neurophysiological research found that simple cells of the visual cortex actedas line or edge or slit detectors. And these cells are tuned to a narrow range of orientation.In the same years, psychophysical researches allowed us to conclude that HVS is composed of aset of psychophysical channels, each one tuned to a narrow range of spatial frequencies andorientations. These channels act lineally and in paralell, being independent each of them.According to Pollen and Ronner (1981), the response of adjacent simple cells, tuned to the samespatial frequency and orientation differ en their phase response to drifting sine-wave gratings byaproximately either 90º or 180º. From this evidence it was possible to infer that the HVS appliesa multirresolution and multiorientation analysis to the image. This analysis can be modelized bya pyramidal scheme. It splits the input image at the visual system on several scales (spatialfrequencies) and orientations. Here we sketch a single computational model (based in evidenceabout the macaque visual cortex), which imitates a image analysis.In this paper we also revise the psychophysical and neurophysiological evidence which hasallowed to several authors to affirm that the 2D Gabor functions ajust better than other functionsto the kind of transformation produced by simple cells. Since Gabor function are complexfunction, they have a real component (even filter or symmetrical profile) and a imaginarycomponent (odd filter or asymmetrical profile). Therefore, is possible to modelize a quadrature

    pair (or 90º phase difference) corresponding to an adjacent simple cells by a 2D Gabor complexfunction.In order to emphasize the properties of these wavelets and to show the advantages derived fromtheir use on the shape perception scope, we carried out two experimental simulations. In thefirst, we applied (in the frequency domain) a Wavelet Gabor Transform composed by (4

    frequency channels× 6 orientation channels, en two phases) to an image, obtaining arepresentation (analysis) following a multiorientated and multiscale pyramidal scheme. We alsoshow here how to generate these filter bank from theirs parameters, such as standard desviation

    of the gaussian envelope, phase, orientation and spatial frequency of the luminance modulationor sine-wave grating, which determinate the scale (size), resolution, spatial-frequencybandwidth and orientation bandwidth). Beside, we show their computational implementation.Later reconstruction of the image (synthesis), from the response to 24 Gabor functions, informsus (reconstruction error) of slight incompleteness of the signal. In a second simulation, weelaborated a set of six convolution masks (Gabor filters), tuned to different orientations. Each ofthese mask has 11x11 elements and have been generates by a careful undersampling of a 2DGabor function with the same preferred spatial frequency, the same orientation and phase. We

    show the results of applying a selective filtering by regions in the spatial domain. Finally, we

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    27/29

    27

    apply, to the same image, other pyramidal multirresolution scheme, in the spatial domain, andwe describe the algorithm that we have designed for produced this scheme.As a recapitulation, we point out four advantages obtained by using the Gabor Transform: a) thevery best packing of information; b) easy computational implementation; c) robustness under

    information losses; and d) neurophysiological plausibility to modelize the HVS.

    * * *

    ReferenciasBARLOW , H.B. (1972). Single units and sensation: A neuron doctrine for perceptual

    psychology.Perception, 1 , pp 371-394.

    BASTIAANS, M.J. (1980). Gabor's expansion of a signal into gaussian elementary signals.Proceedings of de IEEE , 68, 538-539.

    BASTIAANS, M.J. (1981). A sampling theorem for the complex spectogram, and Gabor'sexpansion of a signal in Gaussian elementary signals.Optical Engineering, 4 , pp 594-598.

    BLAKEMORE, C. y CAMPBELL, F.W. (1969). On the existence of neurons in the human visualsystem selectively sensitive to the orientation and size of the retinal image. Journal ofPsychology, 203 , 237-260.

    BRACEWELL, R. N. (1978).The Fourier Transform and its Applications . New York:

    McGraw-Hill.CAMPBELL, F. W. & ROBSON, J. G. (1964). Application of Fourier analysis to the

    modulation response of the eye. Journal of the Optical Society of America , 54, 581.

    CAMPBELL, F. W. & ROBSON, J. G. (1968). Application of Fourier analysis to thevisibility of gratings. Journal of Physiology , 197, 551-566.

    CAMPBELL, F.W. y KULIKOWSKI, J.J. (1966). Orientacional selectivity of the human visualsystem. Journal Physiol., London , 187, 437-445.

    DAUGMAN, J. G. (1980). Two-dimensional spectral analysis of cortical receptive fieldprofiles. Vision Research, 20, 847-856.

    DAUGMAN, J. G. (1988). Complete discrete 2-D Gabor transforms by neural networks forimage analysis and compression. IEEE Transactions on Acoustics, Speech and SignalProcessing , 36, 1169-1179.

    DAUGMAN, J.G. (1984). Spatial visual channels in the Fourier plane.Vision Research , 24, 9,pp. 891-910.

    DAUGMAN, J.G. (1985). Uncertainty relation for resolution in space, spatial frequency, andorientation optimized by two-dimensional visual cortical filters. Journal of the OpticalSociety of America , A, 2, pp. 1160-1169.

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    28/29

    28

    DE VALOIS, R.L.; ALBRECHT, D.A. y TORREL, L. (1982a). Spatial frequency selectivity ofcells in macaque visual cortex.Vision Research, 22 , pp. 545-559.

    DE VALOIS, R.L.; YUND, E.W. y HEPLER, N. (1982b). The orientation and directionselectivity of cells in macaque visual cortex.Vision Research, 22 , pp. 531-544

    DE VALOIS; ALBRECHT, D.G. y THORELL, L.G. (1982). Spatial Frequency selectivity of cellsin macaque visual cortex.Visión Research, 22, pp. 545-559.

    FIELD, D.J. (1987). Relations between the statistics of natural images and the responseproperties of cortical cells. Journal of the Optical Society of America, Vol. 4 , Nº 12,pp2379-2394.

    GABOR, D. (1946). Theory of communication. Journal of the Institute of Electrical Engineering , 93, 429-457.

    GRAHAM, N (1981). The Visual System does a crude Fourier Analysis of patterns. En

    GROSSBERG (Ed.): Mathematical Psychology and psychophisiology. Providence, R.I:AMS-SIAM Symposium Series, Vol. 13, pp. 1-16.

    HUBEL, D.H. y WIESEL, T.N.(1959). Receptive Fields of Single Neurones in the Cat's StriateCortex. Journal of Psychology, 148 , 574-591.

    HUBEL, D.H. y WIESEL, T.N.(1962). Receptive fields, binocular interactions and functionalarchitecture in the Cat's Visual Cortex. Journal of Physiology, 160, pp. 106-154.

    HUBEL, D.H. y WIESEL, T.N.(1968). Receptive fields and functional architecture of monkeystriate cortex. Journal of Physiology, 195, pp. 215-243.

    JONES, J. P. & PALMER, L. A. (1987). An evaluation of the two-dimensional Gabor filtermodel of simple receptive fields in cat striate cortex. Journal of Neurophysiology , 58,1233-1258.

    KULIKOWSKI, J.J. ¸MARCELJA, S. y BISHOP, P.O. (1982). Theory of spatial position andspatial frequency relations in the recptive fiels of simple cells in the visual cortex. BiologicalCybernetics, 43 , pp. 187-198.

    MAFFEI, L. y FIORENTINI, F. (1973). The visual cortex as a spatial frequency analyser.Vision Research, 13 , pp 1255-1267.

    MARCELJA, S. (1980). Mathematical description of the responses of simple cortical cells. Journal of the Optical Society of America , 70, 1297-1300.

    MOVSHON, J.A; THOMPSON, J.D. y TOLHURST, D.J. (1978). Spatial summation in thereceptive fields of simple cells in the cat's striate cortex. Journal of Physiology, 283, pp.53-77.

    NAVARRO, R. y TABERNERO, A. (1991). Gaussian wavelet Transform: two alternative FastImplementation for images. Multidimensional Systems and Signal Processing, 2 , 421-436.

    NAVARRO, R.; SANTAMARÍA, J. y GÓMEZ, R. (1987). Automatic log spectrum restorationof atmospheric seeing. Astronomy and Astrophysics, 174 , pp. 334-351.

  • 8/18/2019 Analisis de Imagen Gabor-Function-libre

    29/29

    POLLEN, D.A. y RONNER, S.F.(1981). Phase relationships between adjacents simple cells inthe visual cortex.Science, 212 , pp. 1409-1411.

    POLLEN, D.A. y RONNER, S.F.(1983). Visual Cortical Neurons as Localized SpatialFrequency Filters. IEEE Transactions on Systems, Man, and Cybernetics, Vol SMC-13,Nº 5, pp. 907-916.

    PORAT, M. Y ZEVI, Y.Y. (1988). The Generalized Gabor Scheme for Image Representation inBiological and Machine Vision. IEEE Transactions on Pattern Analysis and MachineIntelligence, PAMI-10, Nº 4, pp. 452-468.

    ROBSON, J.G. (1975). Receptive fields: Neural representation of the spatial and intensiveattributes of the visual image. En CARTERETTE y FRIEDMAN (Eds.): Handbook ofPerception. Vol. V: Seeing . New York: Academic Press, pp 81-116.

    SIERRA-VAZQUEZ, V. (1992). Procesamiento visual inicial. En J. Mayor y J.L. Pinillos (Eds.): Atención y percepción . Madrid: Alhambra Universidad. pp. 163-312.

    SIERRA-VAZQUEZ, V. (2000). Representaciones conjuntas espacio-frecuencia en PsicofísicaVisual. Parte I: Fundamentos 1D. Cognitiva, Nº X, pp xx-xx.

    STORK, D.G. y WILSON, H.R. (1990). Do Gabor functions provide appropiate description ofvisual cortical receptive fields?. Journal of the Optical Society of America , A/vol. 7, Nº 8,pp 1362-1373.

    WATSON, A.B.(1983). Detection and recognition of simple spatial forms. En O.J. BRADDICKy A.C. SLEIGH (Eds.):Physical and Biological Processing of Images , pp. 100-114.Berlin, Springer Verlag.

    WATSON, A.B.(1987). The Cortex Transform: Rapid Computation of Simulated NeuralImages.Computer Vision, Graphics and Image Processing, vol. 39 , pp. 311-327.

    WILSON, H.R. y BERGEN, J.R. (1979). A four mechanism model for threshold spatial vision.Vision Research, 19 , pp. 19-32.

    WILSON, H.R.; McFARLANE, D.K. y PHILLIPS, G.C. (1983). Spatial frequency tunning oforientation selective units estimated by oblique masking.Vision Research, 23 , pp. 873-882.

    YOUNG, R.A. (1986). Simulation of Human Retinal Function with the Gaussian DerivativeModel. IEEEProc. Conference on Computer Vision and Pattern Recognition , pp. 564-569.