Trabajo de Fin de Grado - Universidad de...

Índice de Tablas

i

Equation Chapter 1 Section 1

Trabajo de Fin de Grado

Grado en Ingeniería Electrónica, Robótica y

Mecatrónica

Identificación de texturas en imágenes

Autor: Daniel Gómez Aguilera

Tutor: Manuel Ruiz Arahal

Dep. Ingeniería de Sistemas y Automática

Escuela Técnica Superior de Ingeniería

Universidad de Sevilla

Sevilla, 2017

Trabajo de Fin de Grado

Grado en Ingeniería Electrónica, Robótica y Mecatrónica

Identificación de texturas en imágenes

Autor:

Daniel Gómez Aguilera

Tutor:

Manuel Ruiz Arahal

Catedrático de Universidad

Dep. Ingeniería de Sistemas y Automática

Escuela Técnica Superior de Ingeniería

Universidad de Sevilla

Sevilla, 2017

Trabajo de Fin de Grado: Identificación de texturas en imágenes

Autor: Daniel Gómez Aguilera

Tutor: Manuel Ruiz Arahal

El tribunal nombrado para juzgar el Proyecto arriba indicado, compuesto por los siguientes miembros:

Presidente:

Vocales:

Secretario:

Acuerdan otorgarle la calificación de:

Sevilla, 2017

El Secretario del Tribunal

A mi familia

A mis amigos

A mis compañeros y profesores

Agradecimientos

Quisiera expresar mi más sincero agradecimiento a todas aquellas personas que han hecho posible la

consecución de este proyecto. A mi familia, que me ha ofrecido su apoyo incondicional desde el primer

momento, y sin cuyo esfuerzo no podría haber llegado tan lejos. A mis amigos, por esos despropósitos capaces

de relajar los momentos de mayor presión. A mi pareja, sostén fundamental, por soportarme en mis peores

momentos y aguantarme en los mejores. A mi tutor, por la paciencia que ha demostrado conmigo. A mis

profesores, por compartir sus conocimientos.

A Sara, por su asistencia en aquellas labores más tediosas. A Adrián, por ceder su potencia computacional. A

Guillermo, Christian y Karolina, por ayudarme a mejorar con sus revisiones. A Ana, por su contribución en

todas estas tareas, y por auxiliarme con su percepción.

A Jose, Ana, Víctor, Sergio, Nico, Carlos, Joaquín y Pablo, por haber aparecido aquellos primeros días de

universidad y ayudarme a encontrar mi lugar. A Gonzalo y Julio, por su afecto y por su competitividad, que han

engrosado mi esfuerzo y ayudado a mi crecimiento. A Tino, Valentín, Noelia, y todos los demás, por haberme

hecho un hueco.

Daniel Gómez Aguilera

Sevilla, 2017

Resumen

Este proyecto trata de evaluar, mediante un proceso de clasificación, el rendimiento de algunos de los métodos

que se han propuesto a lo largo de los años para resolver el problema de la caracterización de texturas, y

compararlos entre sí. De modo que, para realizar la descripción de las distintas texturas, se han utilizado: los

momentos invariantes de Hu; estadísticos de primer y segundo orden, basados en el histograma de intensidades

y en la matriz de co-ocurrencia de niveles de gris (GLCM); los descriptores propuestos por Laws para tratar de

determinar la energía de una textura; características fundamentadas en imágenes de gradientes, como los

histogramas de módulo y fase, o HOG (Histogram of Oriented Gradients); y el descriptor LBP (Local Binary

Pattern), que viene ofreciendo muy buenos resultados ante este problema.

En cuanto al problema de clasificación, se tratará de identificar y distinguir un conjunto de muestras, previamente

caracterizadas por los métodos ya comentados, empleando un clasificador por distancia que atiende al prototipo

más cercano, utilizando el PCI (Porcentaje de Clasificaciones Incorrectas) como indicador de bondad.

Abstract

This project tries to evaluate, through a classification process, the performance of some methods that have been

proposed over the years for solving description texture problem, and comparing them to each other. Thus, to

describe the different textures, we will apply: Hu invariant moments; first and second order statistics features,

based on intensity histogram and Gray Level Co-Ocurrence Matrix (GLCM); the energy features proposed by

Laws; features based on gradient images, like magnitude and phase histogram or HOG (Histogram of Oriented

Gradients); and LBP (Local Binary Pattern), that is achieving good results for this problem.

In regard to the classification problem, we will identify a set of samples, previously labeled by the comented

methods. It will be achieved by using a distance algorithm attending to the nearest model neighbor, employing

the incorrect classifications percent as a kindness indicator.

Índice

Agradecimientos ........................................................................................................................................... ix

Resumen ....................................................................................................................................................... xi

Abstract ...................................................................................................................................................... xiii

Índice ........................................................................................................................................................... xv

Índice de Tablas ......................................................................................................................................... xvii

Índice de Figuras ......................................................................................................................................... xix

Notación ..................................................................................................................................................... xxi

1 Introducción .......................................................................................................................................... 1 1.1 Motivación y objetivo .................................................................................................................................. 1 1.2 Estado del arte ............................................................................................................................................. 2 1.3 Estructura de este documento .................................................................................................................... 2

2 Metodología .......................................................................................................................................... 3 2.1 Software ....................................................................................................................................................... 4 2.2 Conjuntos de muestras ................................................................................................................................ 4

3 Marco Teórico ........................................................................................................................................ 7 3.1 Conceptos generales .................................................................................................................................... 7

3.1.1 Muestreo y Cuantificación .................................................................................................................. 8 3.1.2 Color...................................................................................................................................................... 9 3.1.3 Histograma ......................................................................................................................................... 10 3.1.4 Brillo .................................................................................................................................................... 10 3.1.5 Contraste ............................................................................................................................................ 11 3.1.6 Gradiente............................................................................................................................................ 12

3.2 Características para la descripción de texturas ....................................................................................... 14 3.2.1 Métodos estadísticos ........................................................................................................................ 14

3.2.1.1 Descriptores estadísticos de primer orden .............................................................................. 15 3.2.1.2 Momentos de Hu ....................................................................................................................... 17 3.2.1.3 Descriptores estadísticos de segundo orden (GLCM) ............................................................. 18

3.2.2 Descriptores de Laws ......................................................................................................................... 21 3.2.3 Local Binary Pattern (LBP) ................................................................................................................. 22 3.2.4 Métodos basados en el gradiente .................................................................................................... 24

3.2.4.1 Histogram of Oriented Gradients (HOG) ................................................................................. 24 3.3 Clasificadores ............................................................................................................................................. 25

3.3.1 Clasificadores lineales ........................................................................................................................ 26 3.3.2 Clasificadores por vecino más cercano (NN) ................................................................................... 26

4 Experimentación .................................................................................................................................. 29 4.1 Consideraciones previas ............................................................................................................................ 29

4.1.1 Proyección .......................................................................................................................................... 29

4.1.2 Normalización .................................................................................................................................... 30 4.1.3 Procedimiento ................................................................................................................................... 30

4.2 Pruebas realizadas .................................................................................................................................... 31 4.2.1 Métodos estadísticos ........................................................................................................................ 31 4.2.2 Descriptores de Laws ........................................................................................................................ 41 4.2.3 LBP ...................................................................................................................................................... 41 4.2.4 Descriptores basados en gradiente.................................................................................................. 45

4.3 Preprocesamiento ..................................................................................................................................... 52

5 Conclusiones y trabajo futuro .............................................................................................................. 57

Referencias.................................................................................................................................................. 61

Anexo A. Muestras de textura..................................................................................................................... 63

Anexo B. Resultados experimentales .......................................................................................................... 67 B.i Métodos estadísticos ................................................................................................................................ 67 B.ii Descriptores de Laws ................................................................................................................................. 78 B.iii LBP .............................................................................................................................................................. 79 B.iv Métodos basados en gradiente ................................................................................................................ 80

Anexo C. Manual de la GUI .......................................................................................................................... 93 C.i Introducción ............................................................................................................................................... 93 C.ii Pantalla de procesamiento básico ........................................................................................................... 93

C.ii.i Panel de control .................................................................................................................................... 94

C.ii.i.i ① Reducción de resolución .......................................................................................................... 94

C.ii.i.ii ② Modificación del nombre ........................................................................................................ 95

C.ii.i.iii ③ Cuantizar en masa .................................................................................................................... 95

C.ii.i.iv ④ Submuestreo ............................................................................................................................ 96

C.ii.i.v ⑤ Supresión de efectos de iluminación ...................................................................................... 96

C.ii.i.vi ⑥ Cargar imagen .......................................................................................................................... 97

C.ii.i.vii ⑦ Guardar imagen .................................................................................................................... 97

C.ii.i.viii ⑧ Limpiar resultados ................................................................................................................ 97

C.ii.i.ix ⑨ Conversión a escala de grises .................................................................................................. 97

C.ii.i.x ⑩ Separación de canales.............................................................................................................. 97

C.ii.i.xi ⑪ LBP ............................................................................................................................................. 97

C.ii.i.xii ⑫ Modificación del brillo ......................................................................................................... 97

C.ii.i.xiii ⑬ Modificación del contraste .................................................................................................. 98

C.ii.i.xiv ⑭ Cuantización ......................................................................................................................... 98

C.ii.i.xv ⑮ Detección de bordes ............................................................................................................ 98

C.ii.i.xvi ⑯ Añadir Ruido ......................................................................................................................... 98

C.ii.i.xvii ⑰ Filtrar Ruido .......................................................................................................................... 98

C.ii.i.xviii ⑱ Test RGB ................................................................................................................................ 99 C.iii Test de descriptores................................................................................................................................... 99 C.iv Clasificación ............................................................................................................................................. 100

C.iv.i ① Selección de método y directorio ............................................................................................. 100

C.iv.ii ② Panel de progreso ...................................................................................................................... 101

C.iv.iii ③ Descriptores estadísticos ........................................................................................................... 101

C.iv.iv ④ Descriptores de Laws ................................................................................................................. 101

C.iv.v ⑤ Proyecciones ............................................................................................................................... 101

C.iv.vi ⑥ Saturaciones ............................................................................................................................... 102

C.iv.vii ⑦ Descriptores basados en gradiente .......................................................................................... 102

C.iv.viii ⑧ LBP ........................................................................................................................................... 102

C.iv.ix ⑨ Prototipos ................................................................................................................................... 102

C.iv.x ⑩ Clasificación ................................................................................................................................ 102

C.iv.xi ⑪ Resultados .................................................................................................................................. 102

ÍNDICE DE TABLAS

Tabla 3-1. Combinaciones RGB. 9

Tabla 3-2. Vecindad 9 o entorno 3x3 de un píxel. 13

Tabla 3-3. Comparación de los momentos de Hu aplicados a una imagen (01A). 18

Tabla 3-4. Ejemplo de cálculo de GLCM. 20

Tabla 3-5. Comparación de descriptores de Laws para muestras 01A, 11A y 21A. 22

Tabla 4-1. Prototipos con 80 muestras para 3 clases con momentos de Hu. 38

Tabla 5-1. PCI promedio de todos los métodos. 58

Tabla B - 1. Resultados ofrecidos por estadísticos de primer orden para el banco A. 67

Tabla B - 2. Resultados ofrecidos por estadísticos de primer orden para el banco B. 68

Tabla B - 3. Combinaciones de estadísticos de 1er orden con pocas clases para el banco A. 69

Tabla B - 4. Combinaciones de estadísticos de 1er orden con pocas clases para el banco B. 70

Tabla B - 5. Combinaciones de estadísticos de 2o orden con pocas clases para el banco A. 71

Tabla B - 6. Combinaciones de estadísticos de 2o orden con pocas clases para el banco B. 72

Tabla B - 7. Mejores combinaciones de estadísticos obtenidas para a pocas clases. 73

Tabla B - 8. Análisis de distancia y dirección en estadísticos de 2º orden (I). 74

Tabla B - 9. Análisis de distancia y dirección en estadísticos de 2º orden (II). 75

Tabla B - 10. Resultados ofrecidos por momentos de Hu para el banco A. 75

Tabla B - 11. Resultados ofrecidos por momentos de Hu para el banco B. 76

Tabla B - 12. Resultados ofrecidos por estadísticos de 2º orden para el banco A. 76

Tabla B - 13. Resultados ofrecidos por estadísticos de 2º orden para el banco B. 77

Tabla B - 14. Resultados ofrecidos por descriptores de Laws para el banco A. 78

Tabla B - 15. Resultados ofrecidos por descriptores de Laws para el banco B. 78

Tabla B - 16. Resultados ofrecidos por LBP para el banco A. 79

Tabla B - 17. Resultados ofrecidos por LBP para el banco B. 79

Tabla B - 18. Resultados ofrecidos por métodos basados en gradiente para banco A (I). 80

Tabla B - 19. Resultados ofrecidos por métodos basados en gradiente para banco A (II). 81

Tabla B - 20. Resultados ofrecidos por métodos basados en gradiente para banco A (III). 82

Tabla B - 21. Resultados ofrecidos por métodos basados en gradiente para banco A (IV). 83

Tabla B - 22. Resultados ofrecidos por métodos basados en gradiente para banco A (V). 84

Tabla B - 23. Resultados ofrecidos por métodos basados en gradiente para banco A (VI). 85

Tabla B - 24. Resultados ofrecidos por métodos basados en gradiente para banco B (I). 86

Tabla B - 25. Resultados ofrecidos por métodos basados en gradiente para banco B (II). 87

Tabla B - 26. Resultados ofrecidos por métodos basados en gradiente para banco B (III). 88

Tabla B - 27. Resultados ofrecidos por métodos basados en gradiente para banco B (IV). 89

Tabla B - 28. Resultados ofrecidos por métodos basados en gradiente para banco B (V). 90

Tabla B - 29. Resultados ofrecidos por métodos basados en gradiente para banco B (VI). 91

Tabla B - 30. Resultados ofrecidos por HOG36 con interpolación angular para banco A. 92

Tabla B - 31. Resultados ofrecidos por HOG36 con interpolación angular para banco B. 92

Tabla C - 1. Ejemplos de renombramiento. 96

ÍNDICE DE FIGURAS

Figura 2-1. Esquema general de un proceso de clasificación de imágenes digitales. 3

Figura 2-2. Logo de MATLAB, extraído de [13]. 4

Figura 2-3. Diagrama del proceso de ampliación de muestras. 5

Figura 2-4. Ejemplo de obtención de nueva muestra (11B). 5

Figura 3-1. Imagen digital (01A) en escala de grises, subventana ampliada y valores de intensidad. 7

Figura 3-2. Reducción del muestreo de una imagen (01A), reescaladas para comparación. 8

Figura 3-3. Modelo de reducción de cuantificación desde 8 bits hasta 1 bit de información por píxel. 8

Figura 3-4. Variación de cuantificación desde 1 hasta 8 bits por píxel sobre una imagen (01A). 8

Figura 3-5. Modelos de color RGB, CMY y HSV. 9

Figura 3-6. Imagen RGB (57B) separada en canales. 9

Figura 3-7. Transformación a escala de grises de una imagen (57B) RGB. 10

Figura 3-8. Histograma de una imagen (01A, de la Figura 3-1). 10

Figura 3-9. Variación de brillo de una imagen (01A). 10

Figura 3-10. Traslación del histograma tras modificar el brillo (imágenes laterales de la Figura 3-9). 11

Figura 3-11. Variación de contraste de una imagen (01A). 11

Figura 3-12. Ejemplo de curvas tonales para modificar el brillo o el contraste. 11

Figura 3-13. Modificación del histograma tras variar el contraste (imágenes laterales de Figura 3-11). 12

Figura 3-14. Gx, Gy y módulo de una imagen (A01) con Prewitt. 13

Figura 3-15. Problema de los bordes en el análisis de una imagen. 14

Figura 3-16. IBC con distinto umbral obtenida a partir del módulo de Figura 3-14. 14

Figura 3-17. Ejemplos de asimetría (a) y curtosis (k) en diferentes histogramas. 15

Figura 3-18. Posibles operadores de dirección en la GLCM. 19

Figura 3-19.Ejemplo de pérdida de borde tras seleccionar el operador distancia. 19

Figura 3-20. Cálculo de uniformidad para U-LBP. 23

Figura 3-21. Ejemplo de proceso LBP. 23

Figura 3-22. Imagen LBP y U-LBP de muestra 01A. 23

Figura 3-23. Histogramas de Figura 3-22. 23

Figura 3-24. Comparación de histogramas. 24

Figura 3-25. Proceso HOG con imagen generada aleatoriamente. 25

Figura 3-26. Variabilidad (izquierda) frente a Invariavilidad (derecha) interclase. 25

Figura 3-27. Ejemplos de fronteras lineales. 26

Figura 3-28. Ejemplo de funcionamiento de clasificador NN y variantes. 27

Figura 4-1. Proyecciones de una representación tridimensional. 29

Figura 4-2. PCI ofrecido por clasificador aleatorio. 30

Figura 4-3. Proyección s-R. 31

Figura 4-4. Mejores combinaciones de estadísticos de 1er orden para un análisis con pocas clases. 32

Figura 4-5. Gráficas relativas a las pruebas de estadísticos de primer orden. 34

Figura 4-6. Proyecciones de estadísticos de 1er orden ‘sae’ para 3 y 61 clases. 35

Figura 4-7. Variación del histograma ante la reducción de niveles de gris. 36

Figura 4-8. Variación del histograma ante la reducción de escala. 36

Figura 4-9. Gráficas relativas a las pruebas de los momentos de Hu. 37

Figura 4-10. Mejores combinaciones de estadísticos de 2º orden para un análisis con pocas clases. 38

Figura 4-11. Gráficas relativas a las pruebas de estadísticos de segundo orden. 40

Figura 4-12. Gráficas relativas a las pruebas de los descriptores de Laws. 43

Figura 4-13. Gráficas relativas a las pruebas del descriptor LBP. 44

Figura 4-14. Gráficas referentes a las pruebas con descriptores basados en gradiente. 51

Figura 4-15. Sustracción de intensidad media para distintas subventanas (14A). 52

Figura 4-16. Módulos de muestra original frente a muestra a muestra preprocesada (14A). 52

Figura 4-17. Gráficas relativas a las pruebas con muestras preprocesadas. 56

Figura 5-1. Tiempo medio de cómputo por muestra para descriptores. 57

Figura 5-2. Comparación del PCI de los métodos de caracterización estudiados. 60

Figura C - 1. Pantalla principal. 93

Figura C - 2. Panel de Procesamiento Básico. 94

Figura C - 3. Panel de Control. 94

Figura C - 4. Panel de opciones para renombrar. 95

Figura C - 5. Panel de submuestreo. 96

Figura C - 6. Panel de guardado. 97

Figura C - 7. Panel auxiliar de detección de bordes. 98

Figura C - 8. Paneles auxiliares para el modelo de color RGB. 99

Figura C - 9. Panel de testeo de descriptores. 99

Figura C - 10. Panel de clasificación. 100

Figura C - 11. Diferencias entre estilos de proyección, tres clases vs seis clases. 101

Figura C - 12. Adición de muestra analizada a la proyección. 103

Notación

∇2 Operador laplaciano

𝜂𝑝𝑞 Momento geométrico central normalizado de orden (p+q)

𝜇𝑛 Momento n-ésimo respecto a la intensidad media de una imagen

𝜇𝑝𝑞 Momento geométrico central de orden (p+q)

𝜙𝑛 Momento de Hu de orden n

∂/∂x Derivada respecto a x

∂/∂y Derivada respecto a y

∇g Gradiente de g

∆ Incremento

a Coeficiente de asimetría, descriptor estadístico de primer orden

A ASM (Angular Second Moment), descriptor estadístico de segundo orden

c Contraste, descriptor estadístico de segundo orden

C Correlación, descriptor estadístico de segundo orden

CMY Modelo de color sustractivo basado en pigmentos primarios

d Operador distancia para GLCM

D Operador dirección para GLCM

e Entropía, descriptor estadístico de primer orden

E Entropía, descriptor estadístico de segundo orden

GLCM Grey Level Co-ocurrence Matrix

GUI Graphical User Interface

Gx Componente horizontal del gradiente g

Gy Componente vertical del gradiente g

h Homogeneidad, descriptor estadístico de segundo orden

HOG Histogram of Oriented Gradient

HSV Modelo de color determinado por parámetros ‘Hue’, ‘Saturation’ y ‘Value’

i Índice que recorre la dimensión vertical de una imagen

IBC Imagen Binaria de Contornos

j Índice que recorre la dimensión horizontal de una imagen

k Curtosis, descriptor estadístico de primer orden

k-NN k-Nearest Neighbor

LBP Local Binary Pattern

M Dimensión vertical de una imagen

m Intensidad media

M Máxima probabilidad, descriptor estadístico de segundo orden

mpq Momento geométrico de orden (p+q)

N Dimensión horizontal de una imagen

NG Niveles de Gris

NN Nearest Neighbor

PCI Porcentaje de Clasificaciones Incorrectas

PPC Porcentaje de Puntos de Contorno

R Coeficiente de suavidad relativa, descriptor estadístico de primer orden

RGB Modelo de color aditivo basado en haces de luz primarios

s Varianza, descriptor estadístico de primer orden

SVM Support Vector Machine

u Uniformidad, descriptor estadístico de primer orden

U Uniformidad, descriptor estadístico de segundo orden

U-LBP Uniform Local Binary Pattern

1 INTRODUCCIÓN

n la actualidad el tratamiento de imágenes y, en especial, la descripción de regiones, es una tarea

imprescindible en innumerables ámbitos científicos, ayudando en el desarrollo de un sinfín de aplicaciones

en cualquier campo, ya sea, por ejemplo, en la detección de células y tejidos perniciosos para la salud en

medicina, en el análisis del terreno que conforma la superficie de otros planetas en alguna rama de la astronomía,

en facilitar la navegación de cualquier entidad robótica móvil mediante la localización e identificación de

posibles obstáculos gracias al reconocimiento de personas, animales u objetos, o en la verificación y el control

de calidad de todo tipo de productos.

Tratar de caracterizar las diferentes texturas que aparezcan en una imagen es uno de los métodos más utilizados

para la descripción de regiones. Si bien la definición de la palabra textura puede dar lugar a interpretaciones

ambiguas por tener connotaciones asociadas al sentido del tacto, en este contexto se trata de cuantificar las

sensaciones que transmite el área exterior de un objeto a nivel visual, teniendo en cuenta características como la

rugosidad, la homogeneidad, la regularidad, etc.

Por otro lado, la clasificación consiste en asignar una clase a un objeto determinado, etiquetándolo en función

de un conjunto de características o rasgos medidos sobre dicho objeto, comúnmente denominados descriptores.

Así, en concreto, el objetivo de un clasificador de texturas es el de etiquetar regiones en función de las texturas

visuales que estas presenten. De este modo, se pretende reconocer objetos en función de dichas texturas y

asignarlos a los grupos a los que deberían pertenecer. Evidentemente, cuanto mayor sea el número de clases para

elegir, mayor será, en principio, la dificultad del problema.

1.1 Motivación y objetivo

Uno de los objetivos principales de la ingeniería es la automatización de tareas. Un clasificador de texturas

automático podría tener todo tipo de aplicaciones industriales importantes; sin embargo, no es fácil mecanizar

este tipo de procesos debido a la dificultad de encontrar descriptores adecuados e independientes a las

particularidades de cada textura, es decir, es frecuente que el método escogido para identificar una textura

concreta obtenga un resultado poco representativo para cuantificar cualquier otra, lo que reduce la mecanización

a aplicaciones muy concretas, con algoritmos de clasificación específicos, o bien hace necesario un factor

humano que orqueste todo el proceso. Entre esas particularidades están las grandes variaciones estocásticas que

sufren la mayoría de texturas y que, junto con las alteraciones de apareciencia producidas por los posibles

cambios de iluminación en el entorno o por la variación de la posición de la cámara a la hora de tomar las

muestras, hacen que dichas texturas sean difíciles de modelar adecuadamente.

En este trabajo de fin de grado se utilizan varios de los métodos que se han propuesto a lo largo de las últimas

décadas para realizar un análisis exhaustivo de un par de bancos de imágenes con el objetivo de compararlos

entre sí. Con esto se pretende buscar un procedimiento capaz de realizar una clasificación por textura, de un

modo aceptable, e independientemente del conjunto de datos utilizado, establenciendo así el inicio de un estudio

que trate de alcanzar la automaticación del proceso de clasificación.

E

Introducción

2

2

1.2 Estado del arte

Para resolver el problema de la descripción de texturas se han propuesto diversas soluciones desde la segunda

mitad del siglo XX, y sería una difícil tarea mencionarlas todas. Existen varios libros de visión por computador

y tratamiento de imágenes que contienen información sobre el análisis de texturas y que recopilan algunos de

estos métodos con su propia taxonomía, como [1], [2] o [3], así como recursos audiovisuales, como [4] y [5],

en los que se apoya principalmente este proyecto.

Así, en 1962, Hu sugirió [6] un conjunto de momentos, para tratar de reconocer patrones sobre la imagen, que

presentan buena invarianza ante la traslación, la rotación y la modificación de escala de las muestras, propiedades

muy importantes a la hora de realizar una buena caracterización y que, idealmente, se han de buscar en cualquier

descriptor. En 1973, Haralick [7] propuso, junto con otros autores, un conjunto de descriptores estadísticos

basados en la intensidad de los píxeles de las muestras que consiguieron buenos resultados y que, a día de hoy,

siguen siendo ampliamente utilizados. Más tarde, en 1979, Laws planteó [8] otro enfoque intentando cauntificar

la variación de energía de cada textura. Ya en la década de los 90 apareció un nuevo modelo para el análisis de

este tipo de imágenes que, simplificado en [9] por Ojala y otros autores, da lugar al descriptor LBP, aún hoy

muy importante. Por último, si bien se había desarrollado antes, no es hasta 2005 cuando el descriptor basado

en el gradiente, HOG, comienza a tener importancia, concretamente a raíz del estudio para el reconocimiento de

personas realizado en [10]. También hay estudios que combinan varios de estos métodos, como LBP-HOG en

[11], que consiguen mejorar el rendimiento.

Por otra parte, un ejemplo concreto de la utilidad de la clasificación de texturas puede verse en [12], donde se

trata de monitorizar y predecir la radiación solar mediante la identificación de nubes.

1.3 Estructura de este documento

En cuanto a la estructura de esta memoria, veremos en el capítulo 2 la metodología utilizada, incluyendo las

herramientas y los datasets empleados; en el capítulo 3 se comentarán, de un modo general, los conceptos

teóricos que se han ido utilizando, incluyendo una explicación un poco más amplia del estado del arte comentado

en la sección anterior; en el capítulo 4 veremos los resultados obtenidos tras la experimentación con los distintos

métodos de caracterización empleados; y, por último, en el capítulo 5 se expondrán las conclusiones obtenidas

y se realizarán algunas propuestas para continuar con el desarrollo del proyecto en un futuro.

Se adjuntan además varios anexos que complementan a este trabajo: en el primero de ellos, podremos ver una

muestra de cada una de las texturas que intervienen en el desarrollo del mismo; en el segundo, aparecerán

plasmadas las tablas que contienen los resultados de todas y cada una de las pruebas realizadas; y, en el tercero,

habrá un manual de la interfaz gráfica diseñada. Todo el código software desarrollado, incluida la interfaz

gráfica, se adjuntará, con sendos comentarios para facilitar su comprensión, en un CD que incluye, además, un

archivo de instrucciones donde se indica como poner en marcha la GUI.

2 METODOLOGÍA

n diagrama típico de un proceso de clasificación de imágenes por computador podría ser el que aparece

en la Figura 2-1. Así, el primer paso consiste en adquirir un conjunto de muestras con las propiedades

que nos interesen para trabajar. En este caso concreto debería contener un buen número de ejemplares

de clases diferentes de textura, a ser posible con variabilidad elevada (esto es, que puedan distinguirse bien).

Después, opcionalmente, es posible realizar un tratamiento a esas imágenes con el objetivo de eliminar

elementos indeseables, como ruido o defectos de iluminación o de contraste.

Acto seguido llega el momento se separar las muestras en dos

partes, la primera de ellas será utilizada para tratar de identificar

cada textura, es decir, para entrenar al sistema y enseñarle qué

valores de qué parámetros debería asociar con cada clase;

mientras que, la segunda, se utilizará para probar la capacidad

de reconocimiento que, se supone, el sistema habrá adquirido.

En cuanto a la división de muestras, parece lógico pensar que

lo adecuado es que haya una cantidad más o menos similar en

ambas secciones, siempre y cuando el número inicial fuese

razonable: un entrenamiento con muestras insuficientes puede

que no lograse representar adecuadamente a sus

correspondientes clases, mientras que probar el sistema con

pocas muestras no tendría resultados indicativos para usos

futuros. Por otra parte, tampoco tendría mucho sentido irse al

extremo opuesto: con demasiadas muestras el sistema tendería

a sobrecalcular, ya que los resultados, tanto de caracterización

como de clasificación, no mejorarían llegados a un cierto

punto. Así, el primer problema que aparece es la elección de un

número adecuado de muestras; no obstante, en general se

necesita una gran cantidad (varios cientos, o miles) de muestras

para que el sistema sobrecalcule.

Con ambas divisiones del conjunto debemos proceder igual. Si

la imagen es una composición de elementos, habrá que realizar

una etapa de segmentación que trate de dividir las distintas

regiones que aparecen, con el objetivo de seleccionar aquellas

de interés. En este caso particular, resulta que las muestras

deberán ser enteramente de una misma textura, por lo que la

segmentación carece se sentido (distinto sería si se tratase de

un problema de detección de objetos, donde habría que

localizar los posibles elementos de interés, en lugar de

caracterizar toda la imagen). Se procede, entonces, a tratar de

describir las muestras empleando esa variedad de métodos ya

mencionados en el capítulo 1 de introducción.

U

Adquisición de

muestras

Etapa de

preprocesamiento

Etapa de

entrenamiento Etapa de

reconocimiento

Etapa de

clasificación

Evaluación de

resultados

Extracción de

características

Etapa de

segmentación

Extracción de

características

Etapa de

segmentación

Figura 2-1. Esquema general de un proceso de

clasificación de imágenes digitales.

Metodología

4

4

Una vez finalizada la etapa de entrenamiento, se trata de intentar asignar la etiqueta correcta a cada muestra del

subconjunto de prueba, es decir, de comprobar si el sistema es capaz de reconocer las texturas que, se supone,

ha aprendido a identificar. Por último, mediante algún indicador de bondad, se deberá proceder a evaluar los

resultados, estableciendo así qué método los ha proporcionado mejores.

Así, una vez conocido el procedimiento a seguir, queda seleccionar las herramientas necesarias con las que llevar

a cabo el desarrollo del trabajo, que veremos el las siguientes secciones.

2.1 Software

Para el desarrollo de todos los elementos que componen la parte software de este TFG, se ha empleado la

aplicación MATLAB de MathWorks [13] (logo visible en la Figura 2-2) en su versión R2015a1. MATLAB es

una herramienta matemática, con un lenguaje de programación propio (lenguaje M), ampliamente utilizada en

el ámbito científico, particularmente en el marco de la ingeniería.

El lenguaje M está orientado a matrices y, dado que, como

se indicará más adelante, las imágenes digitales pueden

considerarse matemáticamente como tales, se facilita

sobremanera tratar con este tipo de elementos. Además, el

potencial de MATLAB radica en que se puede

complementar con numerosos toolboxes especializados

que se han ido desarrollando a lo largo de los años. En

concreto, el Image Processing Toolbox [14] está enfocado al tratamiento de imágenes y contiene una gran

cantidad de funciones predefinidas para tal fin. MATLAB también dispone de herramientas que permiten el

desarrollo de interfaces gráficas de usuario (generalmente conocidas como GUI, del inglés Graphical User

Interface) sin demasiada dificultad.

Un manual de la GUI desarrollada se adjunta en el Anexo C, al final de este documento. No obstante, se

prescindirá de cualquier tipo de explicación referente al funcionamiento del software en lo relativo a las

funciones predefinidas, tanto de la aplicación principal como del toolbox especializado, más allá de los propios

comentarios desarrollados que complementan al código, dado que no es ese el objetivo del proyecto.

2.2 Conjuntos de muestras

Si bien una posibilidad sería fabricar nuestros propios bancos de imágenes, existen disponibles en la red

numerosos conjuntos de muestras de textura. En este proyecto se han decido utilizar los empleados en [15] y

[16] (disponibles, respectivamente, en [17] y [18]): el primero de ellos, en adelante banco de imágenes A,

dispone de un total de 1000 muestras en escala de grises, divididas en 25 texturas distintas con 40 ejemplares de

cada una, en formato JPG, y con un tamaño 640x480 píxeles; mientras que el segundo, banco de imágenes B,

cuenta con 5612 imágenes en escala de grises, divididas en 61 texturas con 92 muestras cada una, en formato

PNG, y con un tamaño de 200x200 píxeles.

En el Anexo A, adjunto al final de este documento, puede encontrarse una muestra de ejemplo de cada una de

las clases que componen ambos conjuntos. A priori, las texturas parecen lo suficientemente distintas (desde

cortezas de árbol, madera tratada, agua, ladrillos, cristal, diferentes tipos de suelo…, hasta plumas o pelaje) como

para asegurar una separabilidad aceptable. Algunas de las muestras están tomadas desde diferentes ángulos y

otras presentan cambios de iluminación o de contraste, lo que hace que el proceso de modelado sea, por un lado,

más realista, pues se contemplan más casos posibles para poder identificar esas texturas, pero, en contraposición,

la búsqueda de descriptores que aúnen el conjunto de muestras se complica, dificultándose así la tarea de

clasificación.

1 Esta herramienta está en continua evolución, desarrollando un par de actualizaciones anuales, por lo que no se asegura la compatibilidad de las funciones realizadas para el presente documento en versiones anteriores a la utilizada en el desarrollo del proyecto, R2015a.

Figura 2-2. Logo de MATLAB, extraído de [13].

Por otro lado, un factor que puede limitar un análisis

adecuado es la falta de un número suficiente de

muestras que permitan identificar adecuadamente

una textura ya que, como es lógico, cuanto mayor

sea el número de ejemplares, más representativa

será la caracterización. Dado que el número de

muestras en ambos conjuntos no es idealmente

grande, se ha decido obtener subventanas de tamaño

100x100 para aumentar artificialmente el número

total de las mismas, generándo así un total de 17200

muestras (5000 para el banco A y 12200 para el B),

200 por cada clase.

El procedimiento empleado puede verse en el

diagrama de la Figura 2-3. Además, se puede

observar un ejemplo concreto en la Figura 2-4: sea

una muestra al azar de una clase concreta, se escoge

un píxel aleatoriamente (marcado en verde) dentro

de la zona válida (en azul), extrayéndose una nueva

ventana del tamaño deseado (en amarillo). Escoger

un píxel fuera de los límites haría imposible extraer

una ventana de las dimensiones especificadas, pues

se alcanzaría antes algún borde de la imagen.

El tamaño artificial escogido de las nuevas muestras

es más que suficiente para no perder la esencia de

cada textura y, como ventaja adicional, el balance

total de píxeles ha disminuido respecto a los bancos

originales, lo que se traduce en un decremento del gasto computacional empleado, permitiéndose así realizar un

mayor número de pruebas para el mismo tiempo utilizado.

A lo largo de este documento se utilizan algunas de las muestras obtenidas para ejemplificar la mayor parte de

los conceptos teóricos o de interés. Para hacer referencia a qué muestras se utilizan en cada caso, se añadirá al

título de la figura un código alfanumérico. De modo que, por ejemplo, la muestra 11B usada en la Figura 2-4

pertenece a la clase 11 del banco de imágenes B.

Nmuestras ++

¿Quedan

Clases?

Abrir muestra

aleatoria de la

clase actual

Escoger un píxel

válido al azar

Extraer y guardar

subventana

Nclases ++

¿Nmuestras

== 200?

Nclases = 0

Fin

Inicio

No Sí

Sí No

Nmuestras = 0

Figura 2-3. Diagrama del proceso de ampliación de muestras.

Figura 2-4. Ejemplo de obtención de

nueva muestra (11B).

3 MARCO TEÓRICO

n este capítulo se expondrán de forma reducida los conceptos teóricos necesarios para el desarrollo de este

proyecto. Así, se mostrarán algunos conceptos generales imprescindibles, se continuará con un desarrollo

del estado del arte del problema de caracterización de texturas; y, por último, se hablará un poco sobre

algunos modelos simples de clasificación.

3.1 Conceptos generales

Una imagen digital puede considerarse como una matriz de tamaño MxN en la que cada elemento, denominado

píxel, discretiza una región del espacio. Para hacer referencia a cada punto de una imagen, se suele nombrar i al

índice que recorrerá las filas de la matriz y j al que recorrerá las columnas. Así, cada píxel de una imagen img

cualquiera se puede expresar como 𝑖𝑚𝑔(𝑖, 𝑗).

Generalmente se acostumbra a trabajar con un rango de 8 bits (1 byte) de información por cada punto, lo que

equivale a un total de 28 valores distintos que podrán representar el nivel de intensidad de un píxel en el intervalo

[0, 255]. El valor 0 representa la ausencia de intensidad (lo que se correspondería con un píxel negro en la

imagen) y, a medida que lo vamos aumentando, van apareciendo tonos de gris cada vez más claros hasta llegar

a 255, la mayor intensidad posible (píxel blanco). Se verá en la siguiente subsección que esta cantidad de

información es más que suficiente para el ojo humano.

Así, en la Figura 3-1 podemos ver un ejemplo de imagen digital. Si hacemos un zoom en alguna sección de la

misma, seremos capaces de identificar cada uno de los píxeles que, como se ha comentando, se pueden

representar por valores numéricos.

E

115 71

149 154

M

N

i

j

Figura 3-1. Imagen digital (01A) en escala de grises, subventana ampliada y valores de intensidad.

Marco Teórico

8

8

3.1.1 Muestreo y Cuantificación

Cuando se captura una escena del mundo real nos encontramos con una

señal continua, esto es, analógica, que debemos discretizar en dos

sentidos a la hora de digitalizar la imagen: el muestreo y la cuantificación.

Lo primero hace referencia al número de píxeles en los que se dividirá la

escena, de modo que, cuanto mayor sea este número, más detalles de la

misma se podrán captar, y viceversa. Lo segundo hace referencia a la

amplitud de la señal, estableciendo más niveles de gris cuanto mayor sea

el número de divisiones establecidas sobre la misma.

En cuanto al muestreo, las cámaras actuales cuentan con la potencia

necesaria para dividir la escena en millones de píxeles, por lo que la

resolución alcanzada puede ser enorme. Sin embargo, desde el punto de

vista de proyectos como el que nos ocupa, tratar de analizar patrones y

propiedades con una resolución tan elevada conllevaría un gasto

computacional tremendo, además de que las variaciones observables

disminuirían su frecuencia de aparición (no es lo mismo que aparezcan

cambios interpretables a uno o dos píxeles de distancia que a varias

decenas), pudiendo perjudicar los resultados de caracterización. Por este

motivo, para la mayoría de aplicaciones que

conlleven el análisis de un número muy elevado

de muestras, se recurre a reducir la resolución de

las muestras. Un ejemplo de esto puede verse en

la Figura 3-2.

Respecto a la cuantificación, ya habíamos

comentado que lo usual es trabajar con 8 bits de

información por píxel, consiguiendo así

diferenciar entre 256 niveles de gris distintos. Es

posible reducir la cuantificación modificando

los valores de la matriz original siguiendo un

proceso similar al que se recoge en la Figura

3-3, donde para mejor visualización se van

asignando los nuevos grises con el mayor

contraste posible. Si aplicamos esto a una

imagen, como se puede ver en la Figura 3-4,

observamos que prácticamente a partir de 32

grises las diferencias son imperceptibles (si bien

es verdad que el redudido tamaño

de las muestras al plasmarlas

sobre el documento ayuda a la

consagración de este efecto). Es

por esto que, en la práctica, a pesar

de que se pueda realizar un

proceso de cuantificación más

preciso, 8 bits son más que

suficientes para la mayor parte de

las aplicaciones.

28 = 256

27 = 128

26 = 64

25 = 32

24 = 16

23 = 8

22 = 4

21 = 2

Figura 3-3. Modelo de reducción de cuantificación desde 8 bits

hasta 1 bit de información por píxel.

Figura 3-2. Reducción del muestreo de

una imagen (01A), reescaladas para

comparación.

100x100 75x75

50x50 25x25

Figura 3-4. Variación de cuantificación desde 1 hasta 8 bits por píxel sobre una

imagen (01A).

2 4 8 16

32 64 128 256

3.1.2 Color

Para la representación del color se pueden usar varios modelos normalizados, siendo los más conocidos el RGB,

el CMY y el HSV, que podemos ver en la Figura 3-5.

El CMY (del inglés Cyan, Magenta, Yellow, que son, respectivamente, los colores primarios en pigmentos, cian,

magenta y amarillo) es un modelo sustractivo, es decir, que se basa en la mezcla de pigmentos para crear nuevos

colores, y se utiliza principalmente en funciones de impresión. El HSV (del inglés Hue, Saturation, Value) se

basa en tres parámetros modificables para la representación del color: el tono o matiz, que indica qué color

(verde, rojo, etc.) se quiere conseguir; la saturación, que establece la pureza del color (a menor saturación más

se diluye el color, volviéndose cada vez más grisáceo hasta llegar a blanco); y el brillo o valor, que constituye la

variación entre negro y blanco (o cualquier otro tono, dependiendo

de la saturación). El RGB (del inglés, Red, Green, Blue, que son,

respectivamente, los colores primarios de luz, rojo, verde y azul)

es un modelo aditivo que consigue nuevas tonalidades a partir de

la mezcla de los haces primarios de luz y es la representación más

habitual, por lo que nos centraremos en ella.

La idea es utilizar tres imágenes complementarias de intensidades

diferentes, una por cada matiz primario, de modo que cuando se

combinen posteriormente se reproduzca el color de cada píxel. En

lugar de trabajar con tres matrices distintas es más habitual, por

comodidad, utilizar una única matriz a la que se le añade una

tercera dimensión que indique el canal de color.

Así, si dedicamos, como habíamos dicho, 1 byte de información

por canal a cada píxel, podremos obtener un total de 224 combinaciones diferentes (es decir, casi 17 millones

de colores distintos), más que suficiente para la mayoría de aplicaciones. Un ejemplo de algunas de estas

combinaciones, en concreto las necesarias para generar los colores primarios y secundarios, puede observarse

en la Tabla 3-1.

Podemos ver estos conceptos aplicados sobre una imagen digital en la Figura 3-6, donde se ha separado una

muestra (clase 57-B, versión a color,

también disponible en [18]) en sus

canales RGB. Puede observarse

como la parte central, azul, presenta

una mayor intensidad (es decir, más

cercano a blanco) en su canal

correspondiente, B, mientras que la

parte exterior, verde, lo hace en el G.

Sin embargo, si bien es verdad que discriminar por colores podría ayudar enormemente en la tarea de

identificación y clasificación (por ejemplo, sería mucho más fácil distinguir directamente el césped verde de una

pared de ladrillos rojos, sin necesidad de atender a las demás características), en este proyecto se trata

expresamente con texturas, terreno donde, por definición, el color no es un descriptor válido.

C

M Y R G

B

H

S

V

Modelo RGB Modelo CMY Modelo HSV

Figura 3-5. Modelos de color RGB, CMY y HSV.

Canal R Canal G Canal B Color

Obtenido

0 0 0 NEGRO

255 0 0 ROJO

0 255 0 VERDE

0 0 255 AZUL

255 255 0 AMARILLO

0 255 255 CIAN

255 0 255 MAGENTA

255 255 255 BLANCO

Tabla 3-1. Combinaciones RGB.

Figura 3-6. Imagen RGB (57B) separada en canales.

Marco Teórico

10

10

Por lo tanto, si alguna de las imágenes de las bases de

datos disponibles fuese a color, habría que reducirlas a

escala de grises para poder trabajar con ellas. Para

realizar esta transformación hay diversos métodos

dependiendo del uso que se vaya a hacer de las

imágenes. Así, por ejemplo, se podría tener en cuenta

que el ojo humano es mucho más sensible al color

verde que al rojo y al azul (aproximadamente 59%,

30% y 11%, respectivamente) si un factor importante

fuese obtener un buen equivalente visual. En la Figura

3-7 podemos ver un ejemplo de ambos tipos de transformación, si bien la diferencia es prácticamente

imperceptible. De cualquier forma, ya existían versiones en escala de grises de ambos conjuntos utilizados, por

lo que no es necesario realizar esta transformación.

3.1.3 Histograma

Una forma usual de representar la frecuencia

con la que aparece cada tono de gris en la

imagen es mediante su histograma, que no es

más que un gráfico donde se representa cada

nivel de intensidad frente al número de

píxeles que tienen dicha intensidad. Los

histogramas pueden ser muy útiles porque

proporcionan información general de la

imagen sin necesidad de tenerla presente,

permitiendo identificar algún posible

inconveniente global como problemas de

brillo o de contraste, de los que hablaremos

en las siguientes subsecciones. También es

posible analizar su forma para extraer

información de más alto nivel o para

solucionar el problema de la separación de

regiones. En la Figura 3-8 puede observarse

un ejemplo de este tipo de gráfico.

3.1.4 Brillo

Parece evidente que cuanto mayor sea el número de

píxeles con niveles de intensidad cercanos a cero, es

decir, cuanto más hacia la izquierda esté desplazado

el histograma, más oscura será la imagen y, en

consecuencia, su brillo será menor. Del mismo modo,

cuanto más desplazado esté el histograma hacia la

derecha mayor será el brillo de la imagen

correspondiente.

Las modificaciones de brillo se pueden realizar sin más que sumar o restar un valor fijo a todos los elementos

de la matriz que representa a la imagen, consiguiendo así el desplazamiento global deseado del histograma.

Únicamente habrá que tener en cuenta la saturación de aquellos valores que se salgan del intervalo [0, 255].

Un ejemplo de esto puede verse en la Figura 3-9, donde se ha sustraído y añadido un valor de 50 a la matriz

original para reducir y aumentar el brillo respectivamente. Además, en la Figura 3-10 puede observarse el

correspondiente desplazamiento del histograma respecto al de la Figura 3-8.

Figura 3-8. Histograma de una imagen (01A, de la Figura 3-1).

Figura 3-9. Variación de brillo de una imagen (01A).

Figura 3-7. Transformación a escala de grises de una

imagen (57B) RGB.

media sensibilidad

3.1.5 Contraste

Otro concepto importante es el de contraste, es decir, el grado de concentración de los distintos niveles de

intensidad entre sí: si todas las intensidades que

aparecen en la imagen son de un nivel parecido,

entonces la imagen tendrá poco contraste; por el

contrario, si los tonos de gris están dispersos entre sí,

el contraste será más elevado, lo que se traduce en

una mejor visibilidad de las distintas regiones de la

imagen.

Para modificar el contraste habría que contraer o expandir el

histograma por medio de alguna función de transformación,

comúnmente denominada curva tonal. Podría usarse, por ejemplo,

la expresión de la ecuación (3-1), obtenida de [19]. Las curvas

tonales para modificar el contraste obtenidas de dicha expresión,

así como las empleadas en la subsección anterior para cambiar el

brillo, pueden verse en la Figura 3-12.

De un modo similiar, podrían establecerse todo tipo de curvas

destinadas a realizar un gran abanico de modificaciones sobre la

imagen original, como modificar únicamente alguna zona concreta

de la misma.

Así, en la Figura 3-11 podemos ver el efecto conseguido al variar

el contraste de una imagen, mientras que en la Figura 3-13

podemos ver la modificación conseguida en el histograma tras

aplicar a una imagen las curvas tonales de contraste ya comentadas:

se contrae o expande cuando el contraste disminuye o aumenta,

respectivamente, respecto al histograma de la Figura 3-8.

𝑛𝐼𝑚(𝑖, 𝑗) = 255 (1

1 + 𝑒−𝑣𝑎𝑙𝑜𝑟 (𝑖𝑚(𝑖,𝑗)−127)) (3-1)

Figura 3-10. Traslación del histograma tras modificar el brillo (imágenes laterales de la Figura 3-9).

Figura 3-11. Variación de contraste de una imagen (01A).

Figura 3-12. Ejemplo de curvas tonales para

modificar el brillo o el contraste.

Marco Teórico

12

12

3.1.6 Gradiente

El gradiente, ∇𝑔, de cada píxel de una imagen es un vector de dos componentes, horizontal y vertical, cuya

dirección será la de la máxima variación de intensidad entre un determinado píxel y sus vecinos. Cuanto mayor

sea el módulo del gradiente, mayor será el contraste entre los píxeles bajo estudio. Es por esto que el gradiente

se puede utilizar para detectar los contornos de una imagen con relativa facilidad.

La definición formal de gradiente viene dada por la expresión (3-2), aunque para el caso de una imagen discreta

puede simplificarse por la (3-3); de modo que el gradiente para un punto (𝑖, 𝑗) de una imagen 𝑓 cualquiera

resulta de la expresión (3-4). El módulo del gradiente viene dado por la ecuación (3-5) aunque es común

simplificarlo por la (3-6), ya que el resultado cualitativo es similar y se calcula más rápidamente. En cuanto al

argumento del gradiente, se calcula con (3-7).

∇𝑔 = (𝐺𝑥

𝐺𝑦) = (

𝜕𝑔𝜕𝑥𝜕𝑔𝜕𝑦

) (3-2)

G = (𝐺𝑥

𝐺𝑦) = (

∆𝑔∆𝑥∆𝑔∆𝑦

) (3-3)

𝐺𝑖𝑗 = (𝑓𝑖,𝑗 − 𝑓𝑖,𝑗−1

𝑓𝑖,𝑗− 𝑓𝑖−1,𝑗) (3-4)

|∇𝑔| = √(𝐺𝑥)2 + (𝐺𝑦)

2 (3-5)

|∇𝑔| = |𝐺𝑥| + |𝐺𝑦| (3-6)

arg(∇𝑔) = arctan (𝐺𝑦

𝐺𝑥) (3-7)

Figura 3-13. Modificación del histograma tras variar el contraste (imágenes laterales de Figura 3-11).

No obstante, es habitual calcular cada elemento 𝐺𝑖𝑗 mediante una plantilla, 𝑃,

que no es más que una matriz con la que se puede realizar una operación de

convolución sobre la imagen mediante la expresión (3-8). Si tomamos la

vecindad de orden 9 de un píxel, esto es, aquella región en la que intervienen

el propio píxel y los 8 vecinos que lo rodean, tal y como se puede ver en la

Tabla 3-2, tendremos que usar plantillas de tamaño 3𝑥3.

Así, en la definición inicial de 𝐺𝑖𝑗 de la expresión (3-4) se usaron las plantillas

de (3-9) para calcular 𝐺𝑥 y 𝐺𝑦 respectivamente. Otras plantillas, también

llamadas operadores, muy utilizadas en la práctica son las de Roberts (3-10),

Prewitt (3-11) y Sobel (3-12). Escoger una u otra plantilla dependerá en cierta

medida de la imagen que estemos tratando. A diferencia de la plantilla

definición o del operador Roberts, el operador Prewitt es ya de 3x3,

permitiendo hacer frente de un modo más adecuado al posible ruido de la

imagen. Además de esto, el operador Sobel pone más énfasis en los píxeles centrales, realizando así un efecto

de suavizado que permite reducir este ruido. Otra diferencia es que cualquiera de las dos plantillas Roberts

detecta mejor las variaciones diagonales, pudiendo aportar ya información de cambios en ambas direcciones por

sí solas; en cambio, con Prewitt o Sobel, se puede ver que 𝑃𝑥 es buena detectando bordes verticales mientras que

𝑃𝑦 lo es con la detección de bordes

horizontales, y es necesario que se

complementen en el módulo para

detectar ambos tipos de variación.

En la Figura 3-14 podemos ver un

ejemplo de cálculo de gradiente y

módulo usando el operador Prewitt.

𝐺𝑖𝑗 = ∑ ∑ 𝑝𝑟𝑠 · 𝑓𝑖−𝑟,𝑗−𝑠

∞

𝑠=−∞

∞

𝑟=−∞

𝑐𝑜𝑛 𝑟, 𝑠 ∈ 𝕂 (3-8)

𝐷𝑒𝑓𝑖𝑛𝑖𝑐𝑖ó𝑛: 𝑃𝑥 = [0 0 00 1 −10 0 0

] , 𝑃𝑦 = [0 0 00 1 00 −1 0

] (3-9)

𝑅𝑜𝑏𝑒𝑟𝑡𝑠: 𝑃𝑥 = [0 0 00 1 00 0 −1

] , 𝑃𝑦 = [0 0 −10 1 00 0 0

] (3-10)

𝑃𝑟𝑒𝑤𝑖𝑡𝑡: 𝑃𝑥 = [−1 0 1−1 0 1−1 0 1

] , 𝑃𝑦 = [−1 −1 −10 0 01 1 1

] (3-11)

𝑆𝑜𝑏𝑒𝑙: 𝑃𝑥 = [−1 0 1−2 0 2−1 0 1

] , 𝑃𝑦 = [−1 −2 −10 0 01 2 1

] (3-12)

∇2𝑔 =𝜕2𝑔

𝜕𝑥2+

𝜕2𝑔

𝜕𝑦2 (3-13)

𝐿𝑎𝑃𝑙𝑎𝑐𝑖𝑎𝑛𝑎 = [0 −1 0−1 4 −10 −1 0

] (3-14)

𝑓𝑖−1,𝑗−1 𝑓𝑖−1,𝑗 𝑓𝑖−1,𝑗+1

𝑓𝑖,𝑗−1 𝑓𝑖,𝑗 𝑓𝑖,𝑗+1

𝑓𝑖+1,𝑗−1 𝑓𝑖+1,𝑗 𝑓𝑖+1,𝑗+1

Tabla 3-2. Vecindad 9 o entorno

3x3 de un píxel.

Figura 3-14. Gx, Gy y módulo de una imagen (A01) con Prewitt.

Marco Teórico

14

14

Por otro lado, a la hora de calcular el gradiente o, en general, cualquier valor

mediante plantillas, surge un problema relacionado con los extremos de la

imagen: como se puede observar en la Figura 3-15, no existe el concepto de

vecindad de orden 9 en los bordes. Si bien se han contemplado diferentes

simplificaciones, como sustituir el borde por un marco negro o por un valor

similar al del píxel adyacente, lo más habitual es eliminarlo directamente ya que,

normalmente, el tamaño de la imagen es suficientemente grande para que la

información perdida sea una nimiedad y, de todos modos, con los otros arreglos

mencionados la información era igualmente alterada.

De un modo similar, también sería posible trabajar con la derivada de segundo

orden aprovechando la propiedad de que esta se hace cero cuando el gradiente es

máximo (es decir, cuando más probable es que haya un contorno). Si hablamos

de una imagen digital, que está en dos dimensiones, podríamos utilizar el

operador laplaciano, que da lugar a un escalar y que se define según la expresión (3-13). Y, al igual que con los

gradientes, también se puede usar una plantilla para calcular la laplaciana mediante convolución. Una muy

utilizada es la de (3-14).

Así, si pasamos el módulo del gradiente o la laplaciana obtenida por un valor umbral que permita eliminar los

valores pequeños, de modo que todo elemento que no

pase ese umbral se vuelva negro y el que sí lo haga sea

blanco (por tener un mejor contraste) habremos

creado una imagen binaria de contornos (IBC), como

se puede ver en la Figura 3-16, donde, idealmente,

sólo se resaltarán los contornos de la imagen. El

problema en este tipo de tareas consiste en localizar un

valor adecuado para el umbral.

3.2 Características para la descripción de texturas

Como se adelantó en la introducción, lo ideal para cualquier descriptor es que presente el mismo tipo de

comportamiento ante las posibles variaciones de la imagen, tanto en presencia de cualquier transformación

geométrica, debidas a movimientos de traslación, de rotación o a cambios de escala, como frente a alteraciones

de iluminación en el entorno e, incluso, ante el posible ruido.

Además, otra cualidad imprescindible para el problema de clasificación es que el descriptor sea lo

suficientemente discriminativo entre clases, de modo que permita distinguirlas de un modo adecuado. Si dos o

más clases presentan una caracterización similar, entonces el sistema no será capaz de diferenciarlas, pasando el

etiquetado de las muestras a ser un proceso con un gran grado de aleatoriedad.

Se comentarán, a continuación, algunos de los descriptores que han tratado de solucionar el problema de la

caracterización de texturas, como son los obtenidos mediante métodos estadísticos, mediante el gradiente, los

de Laws y el descriptor LBP.

3.2.1 Métodos estadísticos

Los métodos estadísticos se basan en la geometría de la distribución intensidades de los píxeles de una imagen,

es decir, en el histograma de sus niveles de gris. Así, los descriptores estadísticos de primer orden cuantifican,

por ejemplo, la simetría o la forma del histograma, indicando de esta forma si predominan algunos valores

concretos o se presentan determinadas tendencias.

Figura 3-15. Problema de los

bordes en el análisis de una

imagen.

Figura 3-16. IBC con distinto umbral obtenida a partir del

módulo de Figura 3-14.

Sin embargo, si se utilizan únicamente los histogramas estaremos limitando los resultados ya que estaremos

ignorando la información disponible referente a la localización de

los píxeles. Los descriptores estadísticos de segundo orden,

además de usar la distribución espacial de intensidades, tratan de

establecer una relación de co-ocurrencia entre un píxel y otro

vecino que se encuentra a una distancia concreta en una dirección

determinada.

De este modo, se podría seguir subiendo el orden de estadísticos

relacionando 3 o más píxeles, pero en la práctica no se suele hacer

debido a que los resultados obtenidos no serían fácilmente

interpretables, además de que el gasto computacional se

incrementaría considerablemente.

El hándicap de este tipo de métodos es que obliga a restringir, o a

cuidar, las condiciones de iluminación adquiriendo las muestras en

un entorno muy controlado, pues cualquier cambio puede

provocar que los histogramas sean bien distintos para muestras de

la misma textura y, con ellos, también los descriptores; si bien es

verdad que, conforme el orden de los estadísticos aumenta, estos

problemas se mitigan un poco al entrar en juego las relaciones de

un píxel con su entorno.

3.2.1.1 Descriptores estadísticos de primer orden

Estos descriptores son relativamente fáciles de calcular y apenas

requieren gasto computacional. Para obtenerlos se utilizan los

momentos del histograma respecto a la intensidad media de una

imagen.

La intensidad media, o nivel de gris medio, 𝑚, se calcula a partir

de la expresión (3-15), donde 𝑧 es un vector que contiene las 𝐿

intensidades o niveles de gris distintos de la imagen y 𝑝 es otro

vector, también de tamaño 𝐿, que contiene la probabilidad de que

las correspondientes intensidades aparezcan en la imagen.

Por otro lado, el momento n-ésimo, 𝜇𝑛, respecto a la media de una

imagen se calcula según (3-16). Tanto 𝑚 como 𝜇𝑛 podrían, tras un

proceso de normalización, usarse ya como descriptores válidos de

una imagen. Si bien 𝑚 no es un descriptor de textura como tal,

proporciona información importante respecto al nivel de gris y

sería capaz de discriminar por sí mismo en casos simples. En

cuanto a los momentos, la normalización se hace necesaria ya que

estos crecen de manera exponencial conforme el orden aumenta,

lo que se traduce en que la diferencia entre los momentos de menor

orden, que además son los más utilizados, es nimia en

comparación con la diferencia entre los de mayor orden, haciendo

que los primeros sean completamente inútiles. Se hablará del

proceso de normalización más adelante, en el capítulo 4.

Ahora bien, comúnmente se calculan de manera previa un

conjunto de coeficientes utilizando los momentos de hasta orden

cuatro que permiten una interpretación más sencilla de los

resultados.

Al momento de segundo orden se le llama también varianza, y se puede usar directamente como descriptor ya

que es un modo de cuantificar el contraste de intensidad de la imagen. Se suele representar según la expresión

(3-17). No obstante, también se usa para calcular el coeficiente de suavidad relativa, 𝑅, que está acotado en el

intervalo [0, 1] de modo que para imágenes con nivel de gris constante será nulo (porque el contraste será cero),

mientras que para imágenes con contraste elevado tenderá a la unidad. La expresión de 𝑅 viene dada por (3-18).

a: 0.0110

k: 0.0018

a: -0.3106

k: -0.6095

a: -0.5154

k: 0.2486

a: 1.0538

k: 2.6951

Figura 3-17. Ejemplos de asimetría (a) y

curtosis (k) en diferentes histogramas.

Marco Teórico

16

16

El momento de tercer orden cuantifica la desviación que adopta el histograma respecto al valor medio de

intesidad y se suele normalizar empleando el coeficiente de asimetría, a, que será nulo si el histograma es

simétrico (es decir, no presenta desviación), negativo si está desviado hacia la derecha y positivo si lo está hacia

la izquierda. Cuanto mayor valor absoluto, mayor desviación. Este coeficiente se calcula siguiendo la ecuación

(3-19).

Por último, el momento de orden cuatro es una medida de la monotonía relativa del histograma y se suele

normalizar empleando el coeficiente de curtosis, k. Este coeficiente está centrado en tres, es decir, que tres es el

resultado que se obtiene si la distribución es normal. Por este motivo se le suele restar esta cantidad a la expresión

para centrarla en cero, así si el coeficiente es positivo se tendría un histograma más esbelto de lo normal, mientras

que si es negativo será más achatado. Cuanto mayor valor absoluto, mayor deformación. De modo que la

expresión del coeficiente de curtosis resultaría de (3-20).

Un ejemplo de asimetría y curtosis calculada sobre algunas de las distintas muestras de las que se disponen en

este proyecto pueden verse en la Figura 3-17.

Otros descriptores muy utilizados son la uniformidad, u, y la entropía, e, que se obtienen empleando únicamente

el vector de probabilidades de niveles de gris, 𝑝, que ya comentamos en el cálculo de la intensidad media (𝑚),

y que proporcionan, respectivamente, una medida de la uniformidad, propiamente dicha, y de la aleatoriedad de

las intensidades de la imagen. De este modo, cuanto más se acerque la distribución de la imagen a una

distribución normal, mayor será la uniformidad y menor la aleatoriedad (y, por tanto, la entropía). Las

expresiones para calcularlas son (3-21) y (3-22).

𝑖𝑛𝑡𝑒𝑛𝑠𝑖𝑑𝑎𝑑 𝑚𝑒𝑑𝑖𝑎 (𝑚) = ∑𝑧𝑖 𝑝(𝑧𝑖)

𝐿

𝑖=1

(3-15)

𝑚𝑜𝑚𝑒𝑛𝑡𝑜 𝑛 − é𝑠𝑖𝑚𝑜, 𝜇𝑛(𝑧) = ∑(𝑧𝑖 − 𝑚)𝑛 𝑝(𝑧𝑖)

𝐿

𝑖=1

(3-16)

𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎, 𝜎2(𝑧) = 𝜇2(𝑧) (3-17)

𝑠𝑢𝑎𝑣𝑖𝑑𝑎𝑑 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 (𝑅) = 1 − 1

1 + 𝜎2(𝑧) (3-18)

𝑎𝑠𝑖𝑚𝑒𝑡𝑟í𝑎 (𝑎) = 𝜇3(𝑧)

𝜇23 2⁄ (𝑧)

(3-19)

𝑐𝑢𝑟𝑡𝑜𝑠𝑖𝑠 (𝑘) =𝜇4(𝑧)

𝜇22(𝑧)

− 3 (3-20)

𝑢𝑛𝑖𝑓𝑜𝑟𝑚𝑖𝑑𝑎𝑑 (𝑢) = ∑𝑝2(𝑧𝑖)

𝐿

𝑖=1

(3-21)

𝑒𝑛𝑡𝑟𝑜𝑝í𝑎 (𝑒) = −∑𝑝(𝑧𝑖) ln (𝑝(𝑧𝑖))

𝐿

𝑖=1

(3-22)

3.2.1.2 Momentos de Hu

Los momentos de una imagen son medidas que tratan de describir la geometría de alguna región utilizando los

píxeles que intervengan en la misma. Así, los momentos invariantes de Hu son un conjunto de siete expresiones

cuyo resultado permanece razonablemente invariante ante cambios de rotación, traslación o escala en una

imagen. Esto lleva a pensar que podrían ayudar a reducir los cambios de aspecto producidos por la toma de

muestras desde distintos ángulos a la hora de modelar una textura, consiguiendo disminuir la dispersión de dichas

muestras. Por lo tanto, podría considerarse su uso como descriptores de textura.

Para obtener los momentos invariantes de Hu partimos desde la expresión de momento de orden (𝑝 + 𝑞) para

una función continua y bidimensional 𝑓(𝑥, 𝑦), en la expresión (3-23), que para una imagen digital de tamaño

𝑀𝑥𝑁 queda reducida a (3-24), donde 𝑖 representa la fila y 𝑗 la columna.

𝑚𝑝𝑞 = ∫ ∫ 𝑥𝑝𝑦𝑞𝑓(𝑥, 𝑦) 𝑑𝑥 𝑑𝑦∞

−∞

∞

−∞

(3-23)

𝑚𝑝𝑞 = ∑∑𝑖𝑝𝑗𝑞 𝑓(𝑖, 𝑗)

𝑁

𝑗=1

𝑀

𝑖=1

(3-24)

Así, se pueden expresar los momentos centrales de orden (𝑝 + 𝑞) siguiendo la ecuación (3-25), donde las

coordenadas centrales se han obtenido con (3-26). A continuación, los momentos centrales normalizados pueden

hallarse con la expresión (3-27), donde el exponente 𝛾 resulta de (3-28).

𝜇𝑝𝑞 = ∑∑(𝑖 − 𝑖)̅𝑝 (𝑗 − 𝑗)̅𝑞 𝑓𝑖𝑗

𝑁

𝑗=1

𝑀

𝑖=1

(3-25)

𝑖̅ = 𝑚10

𝑚00 , 𝑗̅ =

𝑚01

𝑚00 (3-26)

𝜂𝑝𝑞 =𝜇𝑝𝑞

𝜇00𝛾

(3-27)

𝛾 =𝑝+𝑞

2+ 1 para (𝑝 + 𝑞) ∈ ℕ\{0,1} (3-28)

Utilizando los momentos centrales normalizados de segundo y tercer orden (esto es, 𝜂20, 𝜂02, 𝜂21, 𝜂12,𝜂30 𝑦 𝜂03), se pueden obtener las expresiones de los siete momentos invariantes de Hu, desde (3-29) hasta

(3-35). Como generalmente estas expresiones ofrecen valores muy pequeños, se suele tomar el módulo del

logaritmo natural o neperiano del resultado.

𝜙1 = 𝜂20 + 𝜂02 (3-29)

𝜙2 = (𝜂20 − 𝜂02)2 + 4𝜂11

2 (3-30)

𝜙3 = (𝜂30 + 3𝜂12)2 + (3𝜂21 − 𝜂03)

2 (3-31)

𝜙4 = (𝜂30 + 𝜂12)2 + (𝜂21 + 𝜂03)

2 (3-32)

𝜙5 = (𝜂30 − 3𝜂12)(𝜂30 + 𝜂12)[(𝜂30 + 𝜂12)2 − 3(𝜂21 + 𝜂03)

2]

+ (3𝜂21 − 𝜂03)(𝜂21 + 𝜂03)[3(𝜂30 + 𝜂12)2 − (𝜂21 + 𝜂03)

2] (3-33)

Marco Teórico

18

18

𝜙6 = (𝜂20 − 𝜂02)[(𝜂30 + 𝜂12)2 − (𝜂21 + 𝜂03)

2]

+ 4𝜂11(𝜂30 + 𝜂12)(𝜂21 + 𝜂03) (3-34)

𝜙7 = (3𝜂21 − 𝜂30)(𝜂30 + 𝜂12)[(𝜂30 + 𝜂12)2 − 3(𝜂21 + 𝜂03)

2]+ (3𝜂12 − 𝜂30)(𝜂21 + 𝜂03)[3(𝜂30 + 𝜂12)

2 − (𝜂21 + 𝜂03)2]

(3-35)

Puede verse el resultado que ofrecen estos momentos en una imagen rotada y reescalada en la Tabla 3-3.

3.2.1.3 Descriptores estadísticos de segundo orden (GLCM)

El análisis de texturas usando la matriz de co-ocurrencia de los niveles de gris, también conocida como GLCM

(por sus siglas en inglés, Gray-Level Co-occurrence Matrix), debe ofrecer un mejor resultado que los estadísticos

de primer orden pues utiliza información relativa a la posición de los píxeles de una imagen aunque, como

contrapartida, el coste computacional se incremente.

La matriz de co-ocurrencia establece la relación entre cada píxel de la imagen con otro píxel de su entorno a una

distancia 𝑑 (en píxeles) en una dirección 𝐷. De un modo más concreto, especifica cuántas veces se cumplen

todas las relaciones de intensidades entre dos píxeles en una imagen, facilitando la manifestación de ciertas

tendencias en la distribución espacial de los niveles de gris.

Original Escala 75% Rotación 45º

𝝓𝟏 6.5774 6.5774 6.5785

𝝓𝟐 17.7404 17.7389 17.7344

𝝓𝟑 24.6472 24.6492 24.6621

𝝓𝟒 25.1743 25.1765 25.1935

𝝓𝟓 50.4861 50.4918 50.5622

𝝓𝟔 34.4350 34.4366 34.4459

𝝓𝟕 50.8519 50.8599 50.5430

Tabla 3-3. Comparación de los momentos de Hu aplicados a una imagen (01A).

Respecto al operador de dirección, 𝐷, se puede emplear cualquiera

de las ocho direcciones principales del espacio, comúnmente

también representadas con grados, tal y como se muestra en la

imagen de la Figura 3-18. Si se quiere realizar un estudio

exhaustivo, en lugar de tomar una por una todas las direcciones

posibles para calcular las GLCM de forma independiente, basta

con tomar cuatro de ellas (normalmente 𝑁𝑂,𝑁,𝑁𝐸 𝑦 𝐸) ya que se

cumple lo siguiente: la GLCM calculada al tomar una dirección

cualquiera es igual a la traspuesta de la calculada al tomar la

dirección opuesta (por ejemplo 𝐺𝐿𝐶𝑀𝐸 = 𝐺𝐿𝐶𝑀𝑂𝑇). También es

usual, en aquellas ocasiones en las que, a priori, no se conoce qué

dirección es más representativa en las muestras bajo estudio,

obtener la GLCM invariante en el espacio, que viene dada por el

promedio de las matrices de co-ocurrencia obtenidas en las cuatro

direcciones empleadas usualmente.

En cuanto al operador de distancia, 𝑑, es posible emplear cualquier valor siempre que la imagen lo permita,

teniendo en cuenta que cuanto mayor sea la distancia escogida mayor será la ventana que modela el entorno del

píxel bajo estudio y, en consecuencia, mayor la cantidad de borde de la imagen que podemos perder. Si el borde

es insignificante el problema se puede suponer despreciable, pero si el borde

representa una gran parte de la imagen hay que tener en cuenta que estamos

perdiendo información y que los resultados pueden verse comprometidos.

Puede verse un ejemplo de esto en la Figura 3-19: en la parte superior

avanzamos un píxel hacia la derecha por lo que al ir recorriendo la imagen píxel

a píxel perderemos la información de la columna derecha al no tener, dichos

puntos, vecinos en esa dirección; mientras que en la inferior avanzamos dos

píxeles en dirección sureste, con lo cual perderemos las dos últimas filas y las

dos últimas columnas. Los bordes rojos indican un píxel de origen al azar y los

azules el píxel vecino correspondiente. La zona sombreada representa el borde

perdido, donde los píxeles no pueden acceder a ningún píxel vecino bajo las

condiciones dadas. Por otro lado, tampoco interesan demasiado las relaciones

de contraste que suceden a muchos píxeles de distancia, por eso no es común

tomar distancias mayores de 4 o 5 píxeles. De hecho, si la imagen es muy

detallada, se tiende a simplificarla mediante procesos de cuantificación y

escalado para acentuar dichas relaciones de contraste.

Así, para calcular la matriz de co-ocurrencia, se debe obtener el vector 𝑧 (similar

al de la expresión (3-15)) con las 𝐿 intensidades que aparecen en la imagen

y calcular las veces que el nivel de gris en un píxel es igual al del que sea su

vecino según las especificaciones dadas. Para ello se usará la matriz intermedia

A, que se puede ver en (3-36), donde el elemento 𝑎𝑖𝑗 representa las veces que

el píxel bajo estudio tiene intensidad 𝑧𝑖 y el píxel que hace de vecino la

intensidad 𝑧𝑗.

A continuación, para poder operar con ellas posteriormente, necesitamos que estas matrices sean simétricas, es

decir, que los elementos de índices opuestos (por ejemplo, 𝑎12 y 𝑎21) tengan el mismo valor. Una forma fácil

de conseguir esto es obtener la matriz 𝐵 con (3-37). Debe tenerse en cuenta que esta nueva matriz

conceptualmente ya no representa de forma directa las relaciones entre los niveles de gris de la imagen, debido

a que estas no pueden repetirse un número no natural de veces, sino que se trata de una matriz simétrica

equivalente.

Ahora sólo nos queda normalizar esta última matriz 𝐵 para que represente la probabilidad de que se den las

relaciones de intensidad, de manera que al sumar todos sus elementos obtengamos la unidad (recordemos que

la probabilidad trabaja con valores recogidos en el intervalo [0,1]). Para ello, únicamente hay que dividir la

matriz por el número de píxeles de la imagen que cumplen las especificaciones, es decir, que tienen un vecino a

distancia 𝑑 en dirección 𝐷. En definitiva, la matriz de co-ocurrencia de niveles de gris de una imagen se calcula

según la expresión (3-38). Así se podría completar la Tabla 3-4, de ejemplo. Puede verse, como ya se adelantó,

que tomar direcciones opuestas da como resultado matrices traspuestas.

Figura 3-18. Posibles operadores de dirección

en la GLCM.

Figura 3-19.Ejemplo de pérdida

de borde tras seleccionar el

operador distancia.

Marco Teórico

20

20

Una vez obtenida la 𝐺𝐿𝐶𝑀, de elementos 𝑐𝑖𝑗,

pueden evaluarse a partir de ella un conjunto

de expresiones correspondientes a los

descriptores estadísticos de segundo orden. Si

bien Haralick propuso un total de 14

descriptores distintos, se trabajará

únicamente con los más comúnmente

utilizados.

Un primer descriptor a tener en cuenta es el

elemento con valor más alto, que se

corresponde con la máxima probabilidad, M

(3-39), con la que se da una relación de

intensidades, ya que puede ofrecer una idea

de la tendencia principal de los grises.

Otros descriptores ampliamente utilizados

son los denominados contraste, c, y

homogeneidad, h, que representan la

variación local (o la no variación,

respectivamente) de intensidades en una

imagen, y que se obtienen mediante las

expresiones (3-40) y (3-41). Se observa que

estos dos descriptores son inversos: la

homogeneidad tiende a valores elevados

cuando los elementos de mayor valor de la

𝐺𝐿𝐶𝑀 están cerca de su diagonal principal,

que es donde (𝑖 − 𝑗)2 se hace mínimo, lo que

significaría que el cambio en el nivel de gris

es menos pronunciado (si recordamos la

matriz 𝑖𝑚𝑎𝑔𝑒𝑛 del ejemplo anterior, en la

Tabla 3-4, no es lo mismo pasar de 1 a 3 que

de 1 a 8; habría menor variación de intensidad

en el primer caso) y, por ende, la

homogeneidad propiamente dicha será

mayor. Por otro lado, si esto pasa, el contraste

tiende a valores pequeños.

Análogamente a los estadísticos de primer

orden, el segundo momento angular (ASM, de

sus siglas en ingles Angular Second Moment)

y la entropía, E, también inversos, informan

de la similitud o la aleatoriedad de las

relaciones de intensidades en la imagen

respectivamente. Si bien hay variaciones de

nomenclatura en las distintas publicaciones

sobre el tema, en este proyecto se seguirán las

ecuaciones que se pueden ver desde (3-42)

hasta (3-44), considerando la uniformidad, U,

como la raíz cuadrada del ASM.

También es frecuente usar la correlación que,

con un resultado comprendido en el rango [−1,1], da una idea de la dependencia lineal

entre los niveles de intensidad de una imagen,

siendo ésta mayor cuanto mayor sea el resultado del descriptor. Este descriptor resulta de (3-45), donde las

medias, 𝜇, y las desviaciones típicas, 𝜎, se obtienen de (3-46) y (3-47), respectivamente.

imagen intensidades

𝑖𝑚𝑎𝑔𝑒𝑛 = 83

85

55

35

5 1 1 8

𝑧 = [1 3 5 8]

𝐿 = 4

matriz intermedia, 𝐴𝐿𝑥𝐿

𝐴 =

𝑎00 𝑎01

𝑎10 𝑎11

𝑎02 𝑎03

𝑎12 𝑎13𝑎20 𝑎21

𝑎30 𝑎31

𝑎22 𝑎23

𝑎32 𝑎33

Operador distancia 𝑑 = 1 píxel

Dirección 𝑁𝑂 Dirección 𝑁 Dirección 𝑁𝐸 Dirección 𝐸

0 10 0

1 00 0

0 00 0

1 21 0

0 00 0

2 00 1

0 20 0

1 11 0

0 00 0

2 00 1

0 10 0

2 00 0

1 00 0

0 11 0

1 10 0

2 01 1

Dirección 𝑆𝐸 Dirección 𝑆 Dirección 𝑆𝑂 Dirección 𝑂

0 01 0

0 00 0

1 00 0

1 12 0

0 00 0

0 02 0

2 00 1

1 11 0

0 00 0

0 01 0

2 00 1

2 00 0

1 00 0

1 01 0

0 11 0

2 10 1

Operador distancia 𝑑 = 2 píxeles

Dirección 𝑁𝑂 Dirección 𝑁 Dirección 𝑁𝐸 Dirección 𝐸

0 00 0

0 10 0

0 00 0

0 00 1

0 00 0

1 10 0

0 00 1

0 10 0

0 10 0

0 00 0

0 00 0

1 00 0

0 00 0

0 11 0

1 00 1

1 01 0

Dirección 𝑆𝐸 Dirección 𝑆 Dirección 𝑆𝑂 Dirección 𝑂

0 00 0

0 00 0

0 01 0

0 00 1

0 00 0

0 00 1

1 01 0

0 01 0

0 01 0

0 00 0

0 00 0

1 00 0

0 00 0

1 00 1

0 11 0

1 10 0

𝑀𝑎𝑡𝑟𝑖𝑧 𝑠𝑖𝑚é𝑡𝑟𝑖𝑐𝑎 𝑒𝑞𝑢𝑖𝑣𝑎𝑙𝑒𝑛𝑡𝑒, 𝐵 (𝑑 = 1, 𝐷 = 𝑁𝑂)

𝐵 =

0 0.50.5 0

0.5 00 0

0.5 00 0

1 1.5

1.5 0

𝐺𝐿𝐶𝑀 (𝑑 = 1, 𝐷 = 𝑁𝑂)

𝐺𝐿𝐶𝑀 =

0 0.083

0.083 0 0.083

00 0

0.083 00 0

0.16 0.25

0.25 0

Tabla 3-4. Ejemplo de cálculo de GLCM.

𝐴 = [

𝑎00 ⋯ 𝑎0𝐿

⋮ ⋱ ⋮𝑎𝐿0 ⋯ 𝑎𝐿𝐿

] (3-36)

𝐵 =𝐴 + 𝐴𝑇

2 (3-37)

𝐺𝐿𝐶𝑀 =𝐵

∑ ∑ 𝐴(𝑖, 𝑗)𝐿𝑗=1

𝐿𝑖=1

(3-38)

𝑀á𝑥𝑖𝑚𝑎 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 (𝑀) = 𝑚á𝑥(𝑐𝑖𝑗) (3-39)

𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒 (𝑐) = ∑∑(𝑖 − 𝑗)2 𝑐𝑖𝑗

𝐿

𝑗=1

𝐿

𝑖=1

(3-40)

𝐻𝑜𝑚𝑜𝑔𝑒𝑛𝑒𝑖𝑑𝑎𝑑 (ℎ) = ∑∑𝑐𝑖𝑗

(𝑖 − 𝑗)2

𝐿

𝑗=1

𝐿

𝑖=1

, 𝑝𝑎𝑟𝑎 𝑖 ≠ 𝑗 (3-41)

𝐴𝑆𝑀 (𝐴) = ∑∑𝑐𝑖𝑗2

𝐿

𝑗=1

𝐿

𝑖=1

(3-42)

𝑈𝑛𝑖𝑓𝑜𝑟𝑚𝑖𝑑𝑎𝑑/𝐸𝑛𝑒𝑟𝑔í𝑎 (𝑈) = √𝐴𝑆𝑀 (3-43)

𝐸𝑛𝑡𝑟𝑜𝑝í𝑎 (𝐸) = −∑∑𝑐𝑖𝑗ln (𝑐𝑖𝑗)

𝐿

𝑗=1

𝐿

𝑖=1

(3-44)

𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 (𝐶) = ∑∑(𝑖 − 𝜇𝑥)(𝑗 − 𝜇𝑦)

𝜎𝑥𝜎𝑦𝑐𝑖𝑗

𝐿

𝑗=1

𝐿

𝑖=1

(3-45)

𝜇𝑥 = ∑ ∑ 𝑖𝑐𝑖𝑗𝐿𝑗=1

𝐿𝑖=1 , 𝜇𝑦 = ∑ ∑ 𝑗𝑐𝑖𝑗

𝐿𝑗=1

𝐿𝑖=1 (3-46)

𝜎𝑥2 = ∑∑(𝑖 − 𝜇𝑥)

2𝑐𝑖𝑗 ,

𝐿

𝑗=1

𝐿

𝑖=1

𝜎𝑦2 = ∑∑(𝑗 − 𝜇𝑦)

2𝑐𝑖𝑗

𝐿

𝑗=1

𝐿

𝑖=1

(3-47)

3.2.2 Descriptores de Laws

Laws propuso una serie de vectores característicos que, combinados entre sí, dan lugar a un conjunto de plantillas

destinadas a calcular la energía de una textura, obteniendo un espacio considerable de descriptores sobre la

imagen. Los vectores, nombrados por la inicial del efecto que detectan en inglés (Level, Edge, Spot y Ripple),

pueden definirse para cualquier dimensión impar (de este modo siempre queda un píxel central), si bien las más

habituales son tres o cinco, tal como se ve en (3-48) y (3-49).

Las plantillas surgen tras multiplicar pares de estos vectores. Dado que el objetivo de estas plantillas es

cuantificar variaciones, es decir, que realizan operaciones derivativas, en todas ellas la suma de sus elementos

es igual a cero, de modo que ante una región constante se obtenga una respuesta nula, a excepción de 𝐿 consigo

mismo (esto es, 𝐿3𝐿3 o 𝐿5𝐿5, que equivaldrían a una media local ponderada), razón por la que no se suele

Marco Teórico

22

22

emplear como elemento descriptivo. Una vez obtenidas las

características de cada píxel tras aplicar todas las plantillas,

se realiza un promedio entre aquellas que sean del mismo

tipo pero en direcciones ortogonales (por citar un caso, 𝐿3𝐸3

detectaría los bordes verticales y 𝐸3𝐿3 los horizontales),

resultando así un conjunto de cinco imágenes de energía para

la dimensión tres y de nueve para dimensión cinco. Por

último, se realiza una media entre todos los píxeles de estas

imágenes para obtener un vector de cinco características, o

nueve, dependiendo de la dimensión utilizada, que

represente a cada muestra.

En ocasiones es útil disminuir la escala de las muestras a fin

de aumentar la frecuencia espacial con la que se dan estos efectos (E-S-R), lo que puede ayudar a conseguir

valores más descriptivos. En la Tabla 3-5 puede verse un ejemplo del resultado de los descriptores de Laws

obtenido para muestras de distintas clases.

Muestra de clase 01A Muestra de clase 11A Muestra de clase 21A

Dimensiones 100x100 25x25 100x100 25x25 100x100 25x25

E3E3 25.7277 34.3092 12.3856 25.9661 8.4777 16.3763

S3S3 40.1135 69.6203 12.8984 37.5510 9.3754 22.1184

L3E3_E3L3 73.8806 88.3972 41.4472 64.1415 27.9889 36.9186

L3S3_S3L3 85.2706 110.4397 42.3995 69.3513 29.2726 40.6325

E3S3_S3E3 31.0467 48.1294 11.9852 29.9557 8.4719 18.7385

Tabla 3-5. Comparación de descriptores de Laws para muestras 01A, 11A y 21A.

3.2.3 Local Binary Pattern (LBP)

LBP (del inglés Local Binary Pattern) es de los métodos más empleados en la caracterización de texturas, y

consiste en convertir la imagen original en otra que contenga información de alto nivel, en tanto que cada píxel

incluirá implícitamente la relación con su entorno, por mediación de la transformación de la vecindad de cada

elemento de dicha imagen en un tren binario. Si bien existen diferentes opciones a la hora de seleccionar dicha

vecindad, se usará la de orden 9, que es la más sencilla y, además, la que se ha venido utilizando a lo largo de

proyecto.

El funcionamiento es el siguiente: para cada región 3x3, si la intensidad de un vecino es mayor o igual que la

del píxel central, entonces ese elemento se transformará en uno y, en caso contrario, en cero; una vez que el

entorno esté en formato de bit, se escogerá un orden aleatorio (que después se mantendrá para el resto de píxeles)

para crear una cadena; por último, se pasará ese número binario a decimal, que será la nueva intensidad del píxel

central. Un ejemplo de este proceso puede verse en la Figura 3-21. El descriptor que caracterizará la textura será

𝐿3 = [1 2 1]

𝐸3 = [−1 0 1]

𝑆3 = [−1 2 −1]

(3-48)

𝐿5 = [1 4 6 4 1]

𝐸5 = [−1 −2 0 2 1]

𝑆5 = [−1 0 2 0 −1]

𝑅5 = [1 −4 6 −4 1]

(3-49)

el histograma de la nueva imagen calculada, es decir, un vector de dimensión 256.

Una modalidad muy utilizada dentro de este método es el LBP uniforme (U-LBP), principalmente porque

simplifica la dimensión del descriptor. La uniformidad de un tren binario se define como el número de veces

que ocurre una transición de nivel alto a nivel bajo o viceversa. Así, el

cálculo de la uniformidad de la cadena establecida en el ejemplo anterior

puede verse en la Figura 3-20. En la práctica, se ha observado que un gran

porcentaje de los píxeles que conforman una imagen tienen un entorno

con uniformidad cero o dos. U-LBP consiste en asignar un código

numérico particular a aquellos trenes que tengan este tipo de uniformidad,

mientras que para el resto se establece uno único que los agrupa. De este

modo, quedaría un histograma de dimensión 59 (2 cadenas de

uniformidad cero, 56 de uniformidad dos y 1 para el resto).

Como el tren binario obtenido es de 8 bits, la imagen

resultante se puede visualizar directamente al estar

los nuevos niveles de gris también en el intervalo

[0, 255]. Un ejemplo de imágenes LBP y U-LBP

puede verse en la Figura 3-22, mientras que sus

correspondientes histogramas se encuentran en la

Figura 3-23.

Una particularidad importante del LBP es que es

invariante a las variaciones de brillo. Esto se puede deducir fácilmente ya que en este método comparamos cada

píxel con su entorno y, aunque el brillo cambie, la relación para la transformación binaria seguirá siendo la

misma. De un modo similar, también se puede deducir su invariancia ante posibles traslaciones en la imagen

original, que conllevaría simplemente idénticas traslaciones en la imagen transformada.

208 233 71

231 161 139

32 25 244

1 1 0

1 161 0

0 0 1

1 1 0 0 1 0 0 1

- - -

- 201 -

- - -

Imagen Original Transformación Tren binario Paso a decimal

Figura 3-21. Ejemplo de proceso LBP.

1 1 0 0 1 0 0 1

U = 1

Figura 3-20. Cálculo de uniformidad

para U-LBP.

U = 2

U = 3 U = 4

Figura 3-22. Imagen LBP y U-LBP de muestra 01A.

Figura 3-23. Histogramas de Figura 3-22.

Marco Teórico

24

24

3.2.4 Métodos basados en el gradiente

Este método trata de encontrar características o descriptores a partir del gradiente (ver subsección 3.1.6) de una

imagen. Uno de los más simples que se pueden calcular es el porcentaje de píxeles de contorno (PPC), que viene

dado por la expresión (3-50). Como ya se ha comentado, cuanto mayor sea el módulo del gradiente mayor será

el cambio de contraste entre un píxel y su

entorno, es decir, mayor el cambio de

intensidad y, por lo tanto, mayor será la

posibilidad de que estemos ante un contorno

dentro de la imagen. Lo usual es filtrar la

matriz módulo a través de un valor umbral

que elimine los valores pequeños o, de otro

modo, que sólo los valores del módulo que

superen el umbral establecido se considerarán

parte de algún contorno de la imagen. Así, si

el número de píxeles de los contornos de cada

clase son lo suficientemente desiguales,

tendremos un PPC más o menos característico

de cada textura.

También es común utilizar algún descriptor

basado en los histogramas de módulo y de

fase del gradiente de la imagen. Si bien hay

muchas formas de comparar dos histogramas

para evaluar su similitud, comúnmente mediante medidas de distancia, usaremos una de las más simples, que

resulta de la ecuación (3-51), donde 𝑁 es el número total de valores distintos con los que trabajamos (de módulo,

de argumento…) y ℎ representa al histograma. Así, por ejemplo, el resultado de comparar los histogramas

normalizados ℎ1 y ℎ2 de la Figura 3-24, resulta en 𝐷 ≈ 0.22.

𝑃𝑃𝐶 =𝑃í𝑥𝑒𝑙𝑒𝑠 𝑞𝑢𝑒 𝑝𝑒𝑟𝑡𝑒𝑛𝑒𝑐𝑒𝑛 𝑎𝑙 𝑐𝑜𝑛𝑡𝑜𝑟𝑛𝑜

𝑃í𝑥𝑒𝑙𝑒𝑠 𝑡𝑜𝑡𝑎𝑙𝑒𝑠· 100 (%) (3-50)

𝐷 = ∑|ℎ1(𝑖) − ℎ2(𝑖)|

𝑁

𝑖=0

(3-51)

3.2.4.1 Histogram of Oriented Gradients (HOG)

Por último, otro descriptor ampliamente utilizado es el histograma de gradientes orientados, más conocido como

𝐻𝑂𝐺 por sus siglas en inglés. La idea es, a grandes rasgos, separar el rango angular de orientaciones en un

número determinado de secciones y, posteriormente, unir los módulos que estén orientados dentro de la misma

sección, construyendo un histograma que, una vez normalizado, funcionará como descriptor.

En la Figura 3-25 puede verse un ejemplo del proceso a seguir. El primer paso es seleccionar la imagen de

trabajo, que para este caso se ha generado de forma aleatoria, y dividir el rango angular, para este ejemplo en 4

secciones. Después, deberemos proceder a calcular el gradiente de cada píxel de la imagen, aquí se ha empleado

el operador Prewitt (3-11), y a obtener su correspondiente módulo (3-6) y fase (3-7) (esta se transformará a

grados y, en este ejemplo, se redondeará por comodidad). A continuación, asignamos las fases a su respectiva

sección y creamos un histograma sumando todos los módulos cuyas fases correspondienes pertenezcan a la

misma sección. Por último, se normaliza el histograma dividiendo entre la suma total de los módulos.

Un problema que surge en este método deriva de la sensibilidad ante las posibles pequeñas variaciones del

argumento del gradiente, es decir, dos valores muy parecidos podrían caer en secciones diferentes (así, en el

ejemplo anterior, 89o caería en la sección verde mientras que 91o en la azul). Una posible solución a esto sería

asignar las fases a las dos secciones más cercanas, pero ponderándolas de manera que los módulos tengan más

importancia según la distancia al centro de las zonas en las que se encuentren.

Figura 3-24. Comparación de histogramas.

3.3 Clasificadores

Un clasificador se encarga de tomar muestras, analizarlas y catalogarlas por clases. Para ello será necesaria una

fase previa donde se extraigan un conjunto de características o descriptores de una serie de muestras a fin de

conseguir capacidad discriminativa entre todas las clases implicadas. Evidentemente, seleccionar un conjunto

representativo de muestras para esta primera fase será beneficioso para que el clasificador pueda distinguir mejor

entre las distintas clases.

Por otro lado, la variabilidad entre las diferentes clases es fundamental para realizar un buen proceso de

clasificación. Por muy bien que el conjunto de muestras tomado represente a sus correspondientes clases, si

dichas clases son similares entre sí o bien si los descriptores escogidos para caracterizarlas no son lo

suficientemente discriminativos ante las mismas, no será posible realizar una distinción adecuada, como puede

observarse en la Figura 3-26.

Figura 3-26. Variabilidad (izquierda) frente a Invariavilidad (derecha) interclase.

11 115 175 21 114

43 139 47 237 78

166 76 94 198 130

187 190 160 124 130

165 48 199 111 208

Módulo

131 183 118

403 205 89

141 129 111

Fase

20 24 87

107 18 55

131 355 81

Figura 3-25. Proceso HOG con imagen generada aleatoriamente.

0º

90º

180º

270º

Marco Teórico

26

26

En la bibliografía actual hay una gran variedad de modelos de clasificación, como los clasificadores estadísticos

(por ejemplo los discriminantes bayesianos o los de mínima distancia), los clasificadores basados en redes

neuronales o los clasificadores lineales, basados en la creación de hiperplanos de separación entre clases.

Por otro lado será necesario cuantificar cómo de buenos han sido los resultados tras utilizar un clasificador. Así,

un indicador de bondad muy simple que se suele utilizar es el porcentaje de clasificaciones incorrectas (PCI),

que se obtiene mediante la expresión (3-52). Evidentemente, cuanto menor sea el PCI mejor habrá sido el

resultado de la clasificación.

𝑃𝐶𝐼 =𝐶𝑙𝑎𝑠𝑖𝑓𝑖𝑐𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑖𝑛𝑐𝑜𝑟𝑟𝑒𝑐𝑡𝑎𝑠

𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 𝑐𝑙𝑎𝑠𝑖𝑓𝑖𝑐𝑎𝑑𝑎𝑠 𝑥 100 (3-52)

3.3.1 Clasificadores lineales

Si simplificamos el problema a uno binario donde únicamente hay que distinguir entre dos clases, y esas clases

presentan además una gran variabilidad, el modelo más intuitivo de clasificador es quizá el lineal, que trata de

crear una frontera (una línea en el caso bidimensional) a partir del conjunto de entrenamiento dado, de modo

que a un lado de la misma estarían las muestras

pertenecientes a una clase y al otro lado las demás.

Así, las nuevas muestras quedan clasificadas según

el lado de la frontera a la que pertenecen.

Dependiendo del tipo de clasificador escogido esta

frontera será de una forma o de otra. En la Figura

3-27 pueden apreciarse varios ejemplos de frontera

en distintos colores. Uno de los clasificadores

lineales más conocidos es SVM (de sus siglas en

inglés, Support Vector Machine) que, a grandes

rasgos, trata de escoger la frontera de modo que el

margen entre ambas clases sea el mayor posible (en

la figura estaría cerca de la de color amarillo).

Sin embargo, en la práctica esta variabilidad no suele

ser tan evidente, teniendo que relajar las condiciones

para calcular la frontera (permitiendo que caigan

muestras contrarias en sendos lados) o aumentando

la dimensión del problema de modo que las clases sean totalmente separables por un hiperplano (quizá en tres o

más dimensiones el problema de invariabilidad de la Figura 3-26 quedaría solucionado).

Además, como es evidente, el problema se complica a medida que se van añadiendo nuevas clases a discernir,

teniendo que calcular un mayor número de fronteras, comúnmente mediante algún proceso iterativo. A veces

será necesario recurrir a modelos no lineales más complejos que permitan separar mejor las diferentes clases.

3.3.2 Clasificadores por vecino más cercano (NN)

El clasificador por vecino más cercano (o NN por sus siglas en inglés, Nearest Neighbor) es de los más simples

que se pueden construir ya que no requiere una frontera explícita y, por lo tanto, no es necesario un proceso

iterativo de aprendizaje. Se basa en utilizar la mínima distancia: la idea es que, tras haber establecido el análisis

de un primer conjunto de muestras de cada clase, las nuevas muestras se clasifiquen con la misma etiqueta de

aquella que se encuentre más cerca. Esto conllevaría un gran gasto computacional en tanto que el número de

muestras iniciales fuese considerable (necesario para caracterizar adecuadamente una clase).

Figura 3-27. Ejemplos de fronteras lineales.

Por otra parte, si existe solapamiento entre las muestras, o haya algunas que, de forma inusual, debido a

problemas de caracterización o a algún fallo de captura, invadan o caigan cerca del conjunto de muestras que

represente a otra clase, se podrían dar etiquetados erróneos en cuanto aparezca alguna otra muestra cercana a

ellas. Por ello se suele recurrir a una variable denominada K-NN, que consiste en comparar las nuevas muestras

con sus K vecinas más cercanas, estableciendo la clase final como aquella que más se repite y, por tanto, haciendo

el etiquetado más robusto.

No obstante, lo más habitual es calcular un prototipo de cada clase a partir del conjunto inicial, de modo que las

nuevas muestras sólo tengan que compararse con todos los prototipos existentes (con lo que se reduciría

enormemente el gasto computacional), asignándosele la clase del más cercano.

El problema recae entonces en la selección de un prototipo adecuado para cada clase, y lo más habitual es utilizar

la media de todas las muestras del conjunto inicial, de manera que cualquier muestra esporádica alejada del resto

perdiera peso. De este modo si los descriptores entre muestras de la misma clase son más o menos similares, el

prototipo sería una buena caracterización de ésta. No obstante, si el número de clases comienza a incrementarse,

es difícil que se mantenga una buena variabilidad y los prototipos tenderían a amontonarse.

En la Figura 3-28 se puede observar el funcionamiento del clasificador por vecino más cercano de las tres formas

que se han expuesto, de modo que la nueva muestra (de color verde) sería de clase 2 según NN, ya que de esa

clase es la muestra más cercana (rodeados en negro), de clase 1 según K-NN con K igual a tres, ya que hay dos

muestras de esa clase y sólo una de la otra (rodeados en naranja) y también de clase 1 según la mínima distancia

a los prototipos, pues se observa que la línea cian es de menor tamaño que la magenta.

Figura 3-28. Ejemplo de funcionamiento de clasificador NN y variantes.

4 EXPERIMENTACIÓN

n este capítulo hablaremos sobre el conjunto de pruebas realizado, comentando los resultados obtenidos

por cada método utilizado de manera individual, tratando de afinarlo lo mejor posible para posteriormente,

en el siguiente capítulo, extraer conclusiones globales al respecto. Si bien no se han tratado todas las

opciones posibles, principalmente por el elevado coste computacional que dicha tarea conllevaría, se ha

intentado seguir un sistema suficientemente exhaustivo como para poder sacar conclusiones adecuadas.

4.1 Consideraciones previas

Antes de pasar al análisis de las pruebas, merece la pena comentar un par de aspectos de interés que se han

mencionado en capítulos previos pero que no se han desarrollado.

4.1.1 Proyección

A la hora de comparar descriptores o características, parece buena idea tratar de hacerlo mediante una

representación gráfica, acomodando los datos para extraer información de un solo vistazo. Pero cuando el vector

de características del que disponemos, obtenido a partir de alguno de los métodos ya comentados, contiene un

número elevado de elementos, surge la

imposibilidad de representarlos todos en un

mismo espacio (todavía con únicamente tres

características se podría tratar de interpretar

una representación tridimensional). Así,

deberemos aplicar el concepto de proyección,

que no es más que una representación

bidimensional de un par de características que

pertenecen al conjunto. La idea es proyectar en

gráficas de dos dimensiones todas las posibles

combinaciones (obviando las relaciones

simétricas, por proporcionar el mismo

resultado, o las de un elemento consigo

mismo, por carecer de sentido) del vector de

características, tal como se ve en la Figura 4-1,

donde se muestran las tres posibles

proyecciones (A-B, azul; A-C, rojo; y B-C,

negro) que corresponden a la representación

tridimensional de una muestra con una terna

de características. Del mismo modo, por proponer otro ejemplo, si nuestro vector de características contiene los

7 momentos invariantes de Hu, no resultaría nada fácil representarlos en un espacio de siete dimensiones; sería

más sencillo, así como más fácil de interpretar, plasmar las 21 proyecciones correspondientes.

E

Figura 4-1. Proyecciones de una representación tridimensional.

Experimentación

30

30

4.1.2 Normalización

Por otro lado, surge la necesidad de normalizar los descriptores, ya que nuestra intención es que todos ellos

tengan el mismo peso a la hora de aportar información para la caracterización de una textura. No tiene sentido

usar varios descriptores y que alguno de ellos deje de aportar información porque su rango de variación sea

demasiado pequeño en comparación con los demás o, por el contrario, que un descriptor monopolice el proceso

de caracterización engullendo al resto. Una opción sería reducir todos los descriptores al intervalo [0,1]. Para el

caso de los histogramas, esto se consigue dividiendo entre el número total de píxeles o elementos que

intervengan en él (para el caso del HOG es distinto, ya que no acumula valores en una posición determinada

sino que va sumando módulos, es por esto que, como se dijo, para normalizarlo es necesario dividir entre la

suma total de módulos). Para el resto de descriptores se puede usar la expresión (4-1), en la que 𝑥 representa el

valor a normalizar, [𝑋𝑚, 𝑋𝑀] es el rango de entrada y [𝑋𝑚𝑛𝑜𝑟𝑚, 𝑋𝑀

𝑛𝑜𝑟𝑚] el de salida. El intervalo de salida ya

hemos comentado que será [0,1]. Para el de entrada, una posible opción es seleccionar los valores extremos de

cada descriptor (esto es, mínimo y máximo) que surjan de entre todas las muestras en la primera fase del proceso

(entrenamiento).

𝑋𝑛𝑜𝑟𝑚 =(𝑋𝑚

𝑛𝑜𝑟𝑚 − 𝑋𝑀𝑛𝑜𝑟𝑚)

(𝑋𝑚 − 𝑋𝑀)(𝑥 − 𝑋𝑚) + 𝑋𝑚

𝑛𝑜𝑟𝑚 (4-1)

Al usar este método, podría aparecer un problema si el número de muestras utilizadas en la etapa de

entrenamiento es pequeño, ya que entonces puede que para los nuevos ejemplares en la etapa de reconocimiento

se obtengan resultados en los descriptores que excedan los valores extremos con los que estamos trabajando.

Para ayudar a solventar esto, se suelen multiplicar el intervalo inicial por un coeficiente de mayoración a fin de

aumentar el margen (generalmente se ensancha en torno a un 10% o un 20%).

Sin embargo, puede que a pesar de esto el problema persista. Es común que se añada otro segundo margen que

permita desbordar el intervalo normalizado pero que, en caso de que los nuevos valores vuelvan a superarlo, se

saturen al valor extremo más cercano. Por ejemplo, si se toleran desbordamientos del 10% tras haber

normalizado, en realidad nuestro intervalo de salida sería [−0.1, 1.1]. Si entra un valor 𝑋𝑛𝑜𝑟𝑚 = 1.5 al intentar

reconocer una nueva muestra, simplemente se satura haciendo 𝑋𝑛𝑜𝑟𝑚 = 1 o bien 𝑋𝑛𝑜𝑟𝑚 = 1.1. Añadir este

margen de saturación es posible en esta clase de aplicaciones puesto que el desbordamiento no suele afectar

significativamente al resultado; además, si una muestra desborda el intervalo es, probablemente, debido a algún

tipo de anomalía, ya sea en la obtención de la muestra en sí o en su caracterización, que la aleja de los valores

normales.

4.1.3 Procedimiento

Las condiciones iniciales y globales que se han escogido, así como el procedimiento que se ha seguido para

realizar pruebas, son de la siguiente forma: en primer

lugar, para aquellos casos en los que se necesite usar

la expresión de normalización, tanto el coeficiente de

mayoración como el margen de saturación serán del

10%; en segundo lugar, el clasificador empleado será

un clasificador por vecino más cercano con

prototipo, donde se ha decidido utilizar un 40% de

las muestras disponibles para la creación del mismo

(esto es, 80 por cada clase) y el resto (120) para la

fase de reconocimiento; y, en tercer lugar, se utilizará

el PCI como indicador de bondad.

Como ya se comentó, cuanto menor sea este

indicador de bondad, mejor será el resultado

obtenido, pues mayor será el número de muestras

clasificadas correctamente, como se deduce

fácilmente de la expresión (3-52). Si bien no hay PCI

objetivo marcado a priori, es decir, en este proyecto Figura 4-2. PCI ofrecido por clasificador aleatorio.

únicamente se trata de aplicar algunos métodos de caracterización y de comparar los resultados que ofrecen, lo

mínimo es obtener mejor rendimiento que un sistema basado enteramente en la aleatoriedad. Por ejemplo, a

discernir entre dos clases distinas, un clasificador aleatorio ofrecería un PCI del 50% y, a medida que se aumenta

el número de clases, este número iría subiendo según se ve en la Figura 4-2. De nada sirve un método que ofrezca

un resultado peor del que se conseguiría al clasificar las muestras de forma aleatoria, ya que hacer esto último

seria muchísimo más sencillo (ni siquiera haría falta caracterizar las muestras).

Se realizarán también comparaciones de resultados reduciendo la escala de las muestras y sus niveles de gris.

Como se dijo, si bien estas operaciones reducen la calidad de las muestras, no sólo pueden variar la frecuencia

espacial de los píxeles característicos sino que, además, reducen el cómputo considerablemente, por lo que

podrían ser simplificaciones a tener en cuenta. Toda la relación de pruebas realizadas puede encontrarse

dispuesta en forma de tablas en el Anexo B.

4.2 Pruebas realizadas

Se expondrán, a continuación, las pruebas más representativas de todas las que se han realizado, método a

método, y se comentará lo más relevante o significativo de las mismas. Para ver la relación completa de pruebas

puede consultarse el Anexo B.

4.2.1 Métodos estadísticos

Realizar un análisis exhaustivo contemplando todas las

posibles combinaciones de descriptores estadísticos, tanto de

primer como de segundo orden, pasando por simplificaciones

de escala y de cuantificación, conllevaría mucho tiempo,

especialmente cuando se trata del segundo orden, donde,

además de tener más gasto computacional ya de por sí, entran

en juego nuevos parámetros como son los operadores de

distancia y de dirección.

Así, lo primero que trataremos de hacer será seleccionar

algunas combinaciones de estos descriptores que,

presumiblemente, obtendrán buenos resultados para realizar

con ellos el resto de pruebas. Para ello estudiaremos todas las

posibles combinaciones para pocas clases y trataremos de

extrapolar los resultados.

De este modo, para los estadísticos de primer orden, tenemos

la Tabla B - 3 y la Tabla B - 4, en las que se muestra el PCI

obtenido para las 127 combinaciones posibles para 3, 6 y 9 clases de ambos bancos de imágenes. Si

seleccionamos los diez mejores resultados en cada caso resulta la Tabla B - 7. Como regla general, no parece

buena idea combinar descriptores que aporten el mismo tipo de información al derivarse de manera directa unos

de otros, como bien pudieran ser la varianza (3-17), s, y el coeficiente de suavidad relativa (3-18), R, en los

descriptores de primer orden, o el ASM (3-42), A, y la uniformidad (3-43), U, en los de segundo, debido a que,

en lugar de ayudar a discriminar, esto suele tender a empeorar los resultados. Así, respecto al primer orden, se

deduce experimentalmente de la tabla de mejores resultados que R no es útil ya que en combinación con otros

conjuntos de descriptores, no es capaz, en la inmensa mayoría de los casos, de modificar el resultado, es decir,

da lo mismo utilizarlo que no hacerlo, ya que no tiene capacidad discriminativa suficiente. Esto es debido a que,

como se muestra en la Figura 4-3, este coeficiente sólo sufre un cambio aceptable para un intervalo aproximado

[5, 40] de la varianza, manteniéndose prácticamente constante para el resto de valores. Lo usual es que las

muestras tengan un contraste adecuado y, por ende, que la varianza tenga un valor elevado, por lo que en la

mayoría de las muestras caracterizadas, R contará con valores muy similares entre sí, cercanos a la unidad.

Podemos, entonces, prescindir de este descriptor.

Así, una vez eliminadas las combinaciones repetidas que contenían R, si simplemente contamos cuantas veces

aparece cada descriptor en los mejores resultados (sin asignar mayor peso a las primeras posiciones, ya que

realmente el porcentaje de variación de PCI nunca llega a exceder el 2% de diferencia), obtendremos las gráficas

de la Figura 4-4, en la que podemos observar que la combinación de cuatro de estos descriptores es la más

Figura 4-3. Proyección s-R.

Experimentación

32

32

exitosa en la mayoría de los casos, seguida de tres y de cinco, destacándose las combinaciones ‘sae’, ‘sake’ y

‘msake’ (en realidad para esta última había varias opciones, pero había que escoger alguna).

Una vez seleccionados los descriptores de primer orden que utilizaremos, ya podemos pasar a calcular el PCI

correspondiente para ambos bancos de imágenes, aumentando progresivamente el número de clases y variando la escala y

el nivel de gris, que pueden verse en la Tabla B - 1 y en la Tabla B - 2, y de la que se extraen las gráficas de la Figura 4-5.

0 2 4 6 8 10 12

23456

Nº de apariciones

Nº

Des

crip

tore

s

Estadísticos 1er orden combinados en los mejores resultados para 3/6/9 clases

0

2

4

6

8

10

12

m s a k u eN

º d

e ap

aric

ion

esDescriptores

Frecuencia de estadísticos 1er orden en los mejores resultados para 3/6/9 clases

2 3 4 5 6

Figura 4-4. Mejores combinaciones de estadísticos de 1er orden para un análisis con pocas clases.

3 6 9 12 15 18 21 25

sae 33,89 38,33 45,37 53,61 60,11 59,49 60,52 65,23

sake 33,89 37,78 45,09 51,32 58 58,56 60 64,27

msake 33,33 38,47 44,91 50,49 57,17 57,27 57,86 60,83

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco A - Estadísticos 1er orden. Muestras a E100/256NG.

3 6 9 12 15 18 21 25

256 NG 33,33 38,47 44,91 50,49 57,17 57,27 57,86 60,83

32 NG 33,33 39,31 46,02 51,18 57,89 57,31 57,50 60,43

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco A - 'msake' E100. Comparación NG.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

256 NG 21,4 35,8 43,5 56,9 52,4 56,3 61,4 65 70,9 73,5 76,4 78,8 80,8 80,8

32 NG 21,7 37,2 44 57,5 52,2 56 61,2 65,3 71,1 74 77 79,3 81,2 81,1

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco B - 'msake' E100. Comparación NG.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

sae 18,33 31,39 35,56 50,35 49,56 57,78 61,51 66,43 72,58 74,44 77,42 80,61 82,29 82,83

sake 19,44 31,39 35,65 50,42 49,72 57,59 61,55 66,37 72,42 74,21 77,31 80,54 82,17 82,62

msake 21,39 35,83 43,52 56,88 52,39 56,34 61,39 65,03 70,86 73,49 76,4 78,84 80,79 80,77

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00 96,77 97,30 97,67 97,96 98,18 98,36

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco B - Estadísticos 1er orden. E100/256NG.

Experimentación

34

34

3 6 9 12 15 18 21 25

100% 33,33 38,47 44,91 50,49 57,17 57,27 57,86 60,83

50% 35,83 38,19 44,72 48,89 55,78 55,79 56,94 59,67

25% 40 45,42 50,93 51,94 57,5 58,89 60,44 62,43

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco A - 'msake' 256NG. Comparación E.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

100% 21,4 35,8 43,5 56,9 52,4 56,3 61,4 65 70,9 73,5 76,4 78,8 80,8 80,8

50% 21,1 43,2 46 58,1 53,2 57,8 62 65,1 70,8 73,3 75,7 78,6 80,6 80,9

25% 21,1 44,9 49,9 59,4 56,8 58,6 59,6 64,8 70,8 71,7 75 77,2 79,5 80

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco B - 'msake' 256NG. Comparación E.

Figura 4-5. Gráficas relativas a las pruebas de estadísticos de primer orden.

La primera conclusión que podemos extraer respecto a los descriptores utilizados es que, si bien en ambos bancos

no se termina de imponer ninguna combinación para pocas clases, a medida que el número de las mismas

aumenta, la combinación de mayor número de elementos acaba por ofrecer mejor PCI, lo cual hace planteable

que tal vez la extrapolación directa de los resultados obtenidos para pocas clases no haya sido buena idea y quizá

la combinación del máximo número de elementos hubiese sido mejor discriminante. No obstante, esperaremos

a obtener los resultados de los estadísticos de segundo orden para reafirmar esta observación. De momento,

extraeremos información únicamente de esta combinación, ‘msake’ (pueden consultarse los demás resultados

en el Anexo B).

Figura 4-6. Proyecciones de estadísticos de 1er orden ‘sae’ para 3 y 61 clases.

Experimentación

36

36

En cuanto al propio resultado, queda en general bastante lejos del límite marcado (clasificación aleatoria), con

lo cual podríamos decir que son buenos para pocas clases. No obstante, como es lógico, a medida que el número

de clases aumenta, en especial en el banco B, que dispone de muchas más, el PCI va empeorando

considerablemente pues el problema se complica y los prototipos se amontontan, como puede verse en las

proyecciones de la Figura 4-6, por comodidad para la combinación ‘sae’, de tres elementos, con un espacio más

reducido y, por lo tanto, con menor número de proyecciones. Para tres clases la separabilidad parece bastante

evidente, mientras que para el máximo número de las mismas (donde se ha prescindido de las muestras para

mejor visualización) no lo es en absoluto, pareciendo muy complicado distinguir algo.

Respecto a la disminución de los niveles de gris, no se aprecia un cambio significativo en el resultado (menos

de un 2% en el peor de los casos). Así, podemos deducir que el resultado de este método podría ser válido aun

en imágenes con limitada cuantificación. Esto se debe a que, a pesar de que el número de grises sea menor, la

forma del histograma se mantiene relativamente bien, como se puede ver en la Figura 4-7, por lo que la

descripción, basada precisamente en este tipo de distribución, no variará demasiado.

Algo similar se podría decir también acerca de la escala. Pese a que el número de píxeles quede reducido, es de

suponer que la forma del histograma tampoco cambiará radicalmente, como se puede comprobar en la Figura

4-8 (a comparar con la ilustración anterior, donde la escala era 100%), por lo que el resultado no se ve

drásticamente empobrecido (de hecho, hasta mejora ligeramente en algunos casos). No obstante, pese a que el

gasto computacional se vería considerablemente reducido, no era ya de por sí muy elevado, por lo que tal vez

no merezca la pena realizar esta reducción (en tanto que en el peor de los casos el PCI sube un 10%).

Figura 4-7. Variación del histograma ante la reducción de niveles de gris.

Figura 4-8. Variación del histograma ante la reducción de escala.

3 6 9 12 15 18 21 25

256 NG 57,22 72,5 80 83,89 85,72 85,65 84,09 85,8

32 NG 57,50 72,36 80,65 84,24 85,94 85,83 84,09 85,73

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco A - Hu E100. Comparación NG.

3 6 9 12 15 18 21 25

100% 57,22 72,5 80 83,89 85,72 85,65 84,09 85,8

50% 57,5 71,81 80,56 83,89 85,67 85,51 84,09 85,9

25% 56,67 71,53 80,46 83,75 86,11 86,2 84,48 86,3

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco A - Hu 256NG. Comparación E.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

256 NG 58,1 79,2 76,6 80,6 75,8 79,9 82,2 83,5 85,2 87,3 89 90,2 90,9 91,2

32 NG 57,5 79,4 76,5 80,9 76,3 79,9 82 83,5 85,5 87,3 89,3 90,5 91,3 91,6

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco B - Hu E100. Comparación NG.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

100% 58,1 79,2 76,6 80,6 75,8 79,9 82,2 83,5 85,2 87,3 89 90,2 90,9 91,2

50% 58,1 78,2 76,2 80,6 75,7 79,8 81,9 83,3 85,1 87,1 88,8 90,2 91 91,2

25% 57,8 78,3 75,9 80,6 75,7 79,9 81,8 83,1 85,1 87,2 89 90,2 91 91,2

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco B - Hu 256NG. Comparación E.

Figura 4-9. Gráficas relativas a las pruebas de los momentos de Hu.

Experimentación

38

38

En otro orden de cosas, las pruebas realizadas para los momentos

invariantes de Hu pueden consultarse en la Tabla B - 10 y en la Tabla

B - 11, de donde se han extraído las gráficas de la Figura 4-9.

Podemos observar que los resultados proporcionados no son

demasiado buenos, ya que se acercan bastante al límite propuesto

como objetivo. Parece ser que estos momentos no ofrecen

descripciones demasiado separables, es decir, si bien es verdad que

se mantienen prácticamente invariantes ante la escala, como se puede

observar en los resultados, ofrecen valores muy similares para las

distintas clases. Podemos ver un ejemplo de los prototipos obtenidos

para las tres primeras clases en la Tabla 4-1, (si bien las proyecciones

son visualmente más cómodas, añadir las 21 necesarias para

completar el espacio de características no es demasiado manejable,

razón por la que se ha preferido exponer los prototipos en forma de

tabla).

Pasando a los estadísticos de segundo orden, procederemos de un

modo similar al que utilizamos con los de orden uno. Lo primero será

obtener una combinación adecuada de los descriptores. Para ello, se

ha vuelto a realizar un análisis con las 127 posibles combinaciones

para 3, 6 y 9 clases distintas en ambos bancos, obteniéndose la Tabla

B - 5 y la Tabla B - 6, que ordenada según los mejores resultados deriva en la Tabla B - 7. También aquí podemos

observar, aunque en menor medida, cómo en prácticamente todos los casos en los que se añade el descriptor A

a un conjunto donde ya esté U, o viceversa, el resultado no varía o empeora ligeramente. No obstante, se podrían

seguir usando por separado. Vemos en las gráficas de la Figura 4-10 como, de nuevo, son más frecuentes las

combinaciones de 4 elementos, seguidos, igual que antes, de las de tres y de las de cinco. Así, nos quedaremos

con las combinaciones ‘McC’, ‘McEC’ y ‘McEAC’ (que también se podría haber sustituido por ‘McEUC’).

Una vez escogidos los descriptores, se procede a realizar un análisis, también con pocas clases, modificando el

resto de parámetros, obteniéndose de este modo la Tabla B - 8 y la Tabla B - 9. Se observa en las gráficas

extraídas de dichas tablas, en la parte superior de la Figura 4-11, que, como se predijo, parece buena idea utilizar

como operador de dirección la media de las cuatro direcciones pues, si bien no siempre proporciona el mejor

resultado (aunque lo hace generalmente), se suele acercar bastante y, en cualquier caso, no es el peor de todos.

En cuanto al operador distancia, no parece que se pueda extraer ninguna conclusión ya que, para el banco A, el

PCI tiende a mejorar ligeramente al aumentar la distancia mientras que, para el B, ocurre lo contrario. En

cualquier caso, no parece muy recomendable alejarse demasiado por lo que ya se comentó: en primer lugar, las

relaciones de interés no suelen estar a muchos píxeles de distancia y, en segundo lugar, cuanto mayor sea esta

distancia mayor será la cantidad de infomación que estaremos perdiendo en tanto que el borde se habrá de

suprimir. De este modo, haremos las pruebas con la GLCM invariante en el espacio y operador distancia igual

uno.

Prot1 Prot2 Prot3

𝝓𝟏 6.6123 6.6958 6.7323

𝝓𝟐 19.0585 20.1469 19.8180

𝝓𝟑 25.7369 25.8475 26.0245

𝝓𝟒 26.3879 26.5983 26.6188

𝝓𝟓 53.2425 53.7015 53.6842

𝝓𝟔 36.6564 37.2723 37.5664

𝝓𝟕 53.1752 53.8532 53.9584

Tabla 4-1. Prototipos con 80 muestras para

3 clases con momentos de Hu.

0 2 4 6 8 10 12 14 16 18

1

2

3

4

5

6

Nº de apariciones

Nº

Des

crip

tore

s

Número de descriptores combinados en los mejores resultados para 3/6/9

clases

02468

1012141618

M c h U E A C

Nº

apar

icio

nes

Descriptores

Frecuencia de estadísticos de 2o en los mejores resultdos para 3/6/9 clases

1 2 3 4 5 6

Figura 4-10. Mejores combinaciones de estadísticos de 2º orden para un análisis con pocas clases.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

McC 7,5 22,1 27 32,4 35,6 39,5 44,2 53,4 59,5 60,6 63,5 65,7 69 71,7

McEC 6,67 17,6 22,4 31 33,7 38,8 43,7 50,4 57,3 58,8 61,7 64 66,9 69,8

McEAC 11,7 21 23 30,9 33,9 38,8 43,8 50,8 57,7 59 61,8 64,2 67,1 70

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco B - Estadísticos 2o orden. Muestras a E100/256NG.

0

10

20

30

40

50

60

70

1 2 3 4 5 6

PC

I (%

)

Operador Distancia

Banco A - 'McEAC' - Variación de operadores distancia y dirección (9 clases-E100/256NG).

E NE N NO M

0

5

10

15

20

25

30

35

40

45

1 2 3 4 5 6

PC

I (%

)

Operador Distancia

Banco B - 'McEAC' - Variación de operadores distancia y dirección (9 clases-E100/256NG).

E NE N NO M

3 6 9 12 15 18 21 25

McC 41,39 46,67 56,3 64,93 69 70,37 74,88 77,73

McEC 39,72 47,5 56,94 65,69 69,17 69,72 73,53 77,03

McEAC 40,83 47,36 56,76 65,69 69,39 70,05 73,69 76,57

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco A - Estadísticos 2o orden. Muestras a E100/256NG.

Experimentación

40

40

3 6 9 12 15 18 21 25

100% 40,83 47,36 56,76 65,69 69,39 70,05 73,69 76,57

50% 34,17 43,75 52,13 61,88 65,22 66,44 69,8 74,53

25% 36,11 44,31 55 63,68 68,11 69,07 71,39 75,13

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco A - 'McEAC' 256NG. Comparación E.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

100% 11,7 21 23 30,9 33,9 38,8 43,8 50,8 57,7 59 61,8 64,2 67,1 70

50% 5,56 33,8 27,4 37,5 42,2 47,4 52 55,4 58,8 63,3 66,7 68,5 70,3 72,2

25% 16,7 44,3 28,9 42,1 45,6 50,8 55 58,3 61,7 65 68,4 71,8 74 75,7

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco B - 'McEAC' 256NG. Comparación E.

3 6 9 12 15 18 21 25

256 NG 40,83 47,36 56,76 65,69 69,39 70,05 73,69 76,57

32 NG 39,72 47,78 58,52 65,42 68,28 69,58 73,02 75,57

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco A - 'McEAC' E100. Comparación NG.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

256 NG 11,7 21 23 30,9 33,9 38,8 43,8 50,8 57,7 59 61,8 64,2 67,1 70

32 NG 11,7 23,6 28,6 34,8 38,7 43,2 47,8 54,1 60,1 60,9 65,7 68,3 70,9 73,4

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco B - 'McEAC' E100. Comparación NG.

Figura 4-11. Gráficas relativas a las pruebas de estadísticos de segundo orden.

Así, se obtienen las relaciones de la Tabla B - 12 y la Tabla B - 13, de las que podemos extraer el resto de gráficas de la

Figura 4-11. Se puede ver que los resultados son también razonables, alejándose alrededor de un 20% del azar en el peor de

los casos. En cuanto a los descriptores, la observación que hicimos para estadísticos de primer orden se observa también

aquí aunque no de manera tan acentuada, pues es verdad que la tétrada de descriptores ofrece resultados ligeramente mejores

que la combinación de cinco elementos en muchos casos. De todas formas seguiremos trabajando con esta última por

similitud con el primer orden (de nuevo, pueden consultarse todas las pruebas en el Anexo B).

En cuanto a la disminución de niveles de gris, tampoco aquí se observa una variación radical. No obstante,

parece ofrecer por lo general un resultado levemente peor (hasta casi un 6% en el peor de los casos). En cuanto

a la escala, parece que el banco A es capaz de soportar este tipo de simplificaciones, mejorando levemente el

resultado, sin embargo, en el banco B, el PCI es considerablemente mayor para pocas clases, suavizándose la

diferencia a medida que las aumentamos.

4.2.2 Descriptores de Laws

Podemos encontrar las pruebas realizadas con los descriptores propuestos por Laws en la Tabla B - 14 y en la

Tabla B - 15. Los gráficos generados a partir de esos datos, dispuestos en la Figura 4-12, muestran que los

resultados obtenidos no han sido nada buenos. Es más, contra todo pronóstico, las plantillas de orden cinco han

ofrecido un PCI más elevado en la práctica totalidad de los casos, cuando cabía pensar que al ser descriptores

que trabajan con un entorno mayor por píxel debía ocurrir lo contrario.

Respecto a los niveles de gris, obtenemos unas conclusiones similares que en los métodos estadísticos. Pese a

que el número de posibles intensidades se haya reducido de 256 a 32, no es suficiente como para estropear los

motivos de la textura que se utilizan para obtener su energía, ni tampoco la frecuencia con la que aparecen. Por

lo tanto, se puede observar como el resultado es muy similar para ambos niveles de gris. En cuanto a la escala,

precisamente por aumentar la frecuencia espacial de las características de la imagen, era de esperar que el

resultado mejorase pero, en contraposición, empeora levemente.

4.2.3 LBP

La relación de pruebas usando el descriptor LBP puede encontrarse en la Tabla B - 16 y en la Tabla B - 17.

Vemos en los gráficos extraídos de ellas, en la Figura 4-13, que los resultados son buenos, en especial para el

banco B. En cuanto al uso de U-LBP, podemos observar que no es una mala aproximación (en el peor de los

casos difiere en torno al 3%). No obstante, esa pequeña diferencia no está suficientemente compensada pues el

ahorro computacional es nimio.

En cuanto a los niveles de gris y a la escala, no se pueden extraer conclusiones en tanto que el comportamiento

es opuesto para ambos bancos de imágenes: para el A se mejora levemente mientras que para el B se empeora.

Experimentación

42

42

3 6 9 12 15 18 21 25

3x3 52,22 69,58 78,61 81,32 83,61 84,44 82,62 82,77

5x5 54,17 74,58 83,15 87,29 89,72 91,02 89,92 91,07

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0

10

20

30

40

50

60

70

80

90

100P

CI (

%)

Número de clases

Banco A - Descriptores de Laws. Muestras a E100/256NG.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

3x3 61,9 79,3 79,7 84,5 80,9 85,1 87 89,3 91,3 92,7 93,7 94,1 94,7 95

5x5 63,1 78,6 83,7 86,7 84,3 87 88,9 90,8 92,6 94 94,8 95 95,2 95,4

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco B - Descriptores de Laws. Muestras E100/256NG.

3 6 9 12 15 18 21 25

256 NG 52,22 69,58 78,61 81,32 83,61 84,44 82,62 82,77

32 NG 51,11 69,72 78,52 81,04 83,44 84,07 82,66 82,73

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco A - Laws 3x3 E100. Comparación NG.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

256 NG 61,9 79,3 79,7 84,5 80,9 85,1 87 89,3 91,3 92,7 93,7 94,1 94,7 95

32 NG 60,8 81,7 81,7 86,3 84,8 87,9 88,3 90,3 92,3 93,4 94,3 94,6 95 95,5

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco B - Laws 3x3 E100. Comparación NG.

3 6 9 12 15 18 21 25

100% 52,22 69,58 78,61 81,32 83,61 84,44 82,62 82,77

50% 54,17 72,5 80,19 82,15 83,56 84,81 83,25 83,27

25% 55,83 74,72 82,41 84,79 85,5 84,86 83,33 83,47

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco A - Laws 3x3 256NG. Comparación E.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

100% 61,9 79,3 79,7 84,5 80,9 85,1 87 89,3 91,3 92,7 93,7 94,1 94,7 95

50% 60,8 81,7 81,7 86,3 84,8 87,9 88,3 90,3 92,3 93,4 94,3 94,6 95 95,5

25% 61,1 83,2 82,8 86,7 85,6 88 88,5 90,4 92,2 93,6 94,6 95,1 95,4 95,8

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco B - Laws 3x3 256NG. Comparación E.

Figura 4-12. Gráficas relativas a las pruebas de los descriptores de Laws.

3 6 9 12 15 18 21 25

LBP 47,22 67,36 64,81 69,65 67,83 69,86 72,1 74,6

U-LBP 46,39 66,81 65,83 71,67 70,94 72,59 74,72 77,13

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco A - Comparación LBP / U-LBP. Muestras a E100/256NG

3 6 9 12 15 18 21 25 31 37 43 49 55 61

LBP 15,3 23,9 19,8 26,9 25,4 26,8 28,7 34,3 41,2 40,8 38,4 40,8 41,9 44,3

U-LBP 15,6 24,4 21 29,8 27,1 28,1 30,4 36,1 44 42,7 40,1 42,8 43,7 45,8

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco B - Comparación LBP / U-LBP. Muestras a E100/256NG.

Experimentación

44

44

3 6 9 12 15 18 21 25

256 NG 47,22 67,36 64,81 69,65 67,83 69,86 72,1 74,6

32 NG 41,67 57,22 57,31 63,82 62,39 62,08 65,16 68,37

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco A - LBP E100. Comparación NG.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

256 NG 15,3 23,9 19,8 26,9 25,4 26,8 28,7 34,3 41,2 40,8 38,4 40,8 41,9 44,3

32 NG 10,8 18,9 20,7 30,6 31,5 34,2 34,9 39,6 45,3 47,5 46,2 47,9 48,9 51,2

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco B - LBP E100. Comparación NG.

3 6 9 12 15 18 21 25

100% 47,22 67,36 64,81 69,65 67,83 69,86 72,1 74,6

50% 35,56 59,58 61,11 63,19 65,83 66,85 68,06 73,23

25% 34,72 58,61 59,54 64,86 68,11 67,55 68,89 73,53

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco A - LBP 256NG. Comparación E.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

100% 15,3 23,9 19,8 26,9 25,4 26,8 28,7 34,3 41,2 40,8 38,4 40,8 41,9 44,3

50% 2,5 21,4 21,1 29,4 29,4 31,8 32 36,7 41,6 40,5 39,2 40,4 41,8 44

25% 6,67 26,4 24,2 30,4 34,2 35,5 37,5 41 48,7 47,8 46 48,7 49,7 51,4

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco B - LBP 256NG. Comparación E.

Figura 4-13. Gráficas relativas a las pruebas del descriptor LBP.

4.2.4 Descriptores basados en gradiente

Podemos encontrar las pruebas realizadas con los descriptores basados en gradiente desde la Tabla B - 18 hasta

la Tabla B - 31. Durante estos análisis, en aquellas ocasiones en las que se haya utilizado un valor umbral para

separar los valores más importantes del módulo, dicho umbral será 1.75 veces la media de dicho módulo, que

variará con cada muestra (de este modo, al tener un umbral dinámico, superior a la media, nos aseguramos de

que se sólo se tengan en cuentan los valores más característicos de cada muestra). En las gráficas obtenidas a

partir de esas pruebas, en la Figura 4-14, lo primero que observamos es que cuando el número de clases es

pequeño (tres), el PPC es un descriptor bastante bueno (del orden del 20%-30%, mejor que cualquier estadístico,

tanto de primer como de segundo orden, por sí mismo). No obstante, se vuelve incapaz de identificar

correctamente relativamente pronto. En cuanto a los histogramas de módulo y fase del gradiente, ofrecen

también un resultado más que aceptable, no aumentando drásticamente al elevar el número de clases.

Para esos dos descriptores, se observa como, en líneas generales, el operador 2x2, Roberts, queda peor

posicionado que los otros dos, 3x3, que hacen que los descriptores ofrezcan resultados similares. En cuanto al

intento de combinar el PPC con los histogramas, sólo se consigue empeorar el buen PCI que ya ofrecían los

histogramas por sí mismos.

En cuanto a los niveles de gris y a la escala, podemos concluir algo similar a lo que viene ocurriendo: ese tipo

de cambios no provocan, en general, alteraciones significativas en la imagen de gradientes, por lo que el

resultado no varía demasiado.

Con respecto al descriptor HOG, tomar el umbral parece proporcionar mejores resultados, posiblemente porque

de ese modo sólo se usan los valores más importantes del módulo. En cuanto al operador, esta vez es Roberts el

que ofrece un PCI más bajo, es más, lo hace con bastante diferencia, cosa que, a priori, no parecía muy probable.

En cuanto al número de divisiones del rango angular, parece que el resultado mejora en tanto que este aumenta.

Cuanto mayor número de divisiones hay, mayor dimensión tendrá el histograma y por lo tanto mejor

caracterizada estará cada clase. En relación con los niveles de gris, el PCI mejora ligeramente al reducirlos. Sin

embargo, ante el cambio de escala el resultado del banco B cae abruptamente.

Por último, se dijo que uno de los posibles problemas de HOG es que existía la posibilidad de que para pequeñas

variaciones de la fase del gradiente, se sumasen módulos a secciones distintas. Se implementó el sistema de

interpolación angular que se comentó, asignando el módulo a las dos zonas más cercanas, con un peso en función

de lo cerca que estuviese la fase del centro de dichas zonas. No obstante, el resultado no sólo no mejora, sino

que empeora muy ligeramente en la mayor parte de los casos, además de conllevar un pequeño coste

computacional adicional.

Experimentación

46

46

3 6 9 12 15 18 21 25

Roberts 28,06 57,36 69,81 77,78 82 84,91 86,07 88,73

Prewitt 23,89 55,56 66,11 72,01 79 82,55 82,78 85,57

Sobel 21,94 55,28 66,3 72,99 79,56 82,82 83,41 86

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0102030405060708090

100

PC

I (%

)

Número de clases

Banco A - PPC E100/256NG. Comparación operadores.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

Roberts 28,3 51,4 67,3 75 75,3 79,6 82,7 85,9 89,4 91,3 92,4 93,6 94 94,3

Prewitt 17,5 51,4 69,4 78,1 76,6 78,6 81,6 84 86,7 88,7 90,7 92 92,7 93,3

Sobel 18,3 51,9 71,5 79,3 77,7 80,1 82,5 84,8 88 89,3 90,8 92,5 93,2 93,9

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0102030405060708090

100

PC

I (%

)

Número de clases

Banco B - PPC E100/256NG. Comparación operadores.

3 6 9 12 15 18 21 25

Roberts 36,67 54,17 63,43 71,04 71,28 70,6 73,73 77,07

Prewitt 28,33 44,44 53,15 60 61,83 62,08 66,79 71,6

Sobel 28,61 44,31 53,06 60 61,56 62,18 67,3 71,77

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0102030405060708090

100

PC

I (%

)

Número de clases

Banco A - Hist E100/256NG. Comparación operadores.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

Roberts 16,9 36 39 49,4 50,6 56,8 62,1 66,6 72,3 71,9 72 75,1 77,5 78,2

Prewitt 13,6 36 36,7 46,6 47,1 56 60,6 65 69,3 68 66,7 69,9 72,3 73,7

Sobel 11,1 36,3 36,9 46,6 46,9 56,1 60,7 64,9 69,2 67,9 66,6 70 72,4 73,7

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0102030405060708090

100

PC

I (%

)

Número de clases

Banco B - Hist E100/256NG. Comparación operadores.

3 6 9 12 15 18 21 25

PPC 23,89 55,56 66,11 72,01 79 82,55 82,78 85,57

Hist 28,33 44,44 53,15 60 61,83 62,08 66,79 71,6

HistPPC 37,5 53,47 61,02 68,4 71,17 71,76 74,48 77,9

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0102030405060708090

100

PC

I (%

)

Número de clases

Banco A - Prewitt E100/256NG. Comparación descriptores.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

PPC 17,5 51,4 69,4 78,1 76,6 78,6 81,6 84 86,7 88,7 90,7 92 92,7 93,3

Hist 13,6 36 36,7 46,6 47,1 56 60,6 65 69,3 68 66,7 69,9 72,3 73,7

HistPPC 15,6 32,8 36 46,7 46,3 54,9 59,3 63,8 69 70,7 70,3 72,8 74,6 76,1

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0102030405060708090

100

PC

I (%

)

Número de clases

Banco B - Prewitt E100/256NG. Comparación descriptores.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

256NG 13,6 36 36,7 46,6 47,1 56 60,6 65 69,3 68 66,7 69,9 72,3 73,7

32NG 10,3 33,3 34 43,8 44,2 50,9 56 60,9 66,5 67,6 65,7 68,7 70,3 71,7

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco B - Hist Prewitt E100. Comparación NG.

3 6 9 12 15 18 21 25

256NG 28,33 44,44 53,15 60 61,83 62,08 66,79 71,6

32NG 28,33 44,72 53,33 60,83 62 62,22 66,83 71,5

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco A - Hist Prewitt E100. Comparación NG.

Experimentación

48

48

3 6 9 12 15 18 21 25

100% 28,33 44,44 53,15 60 61,83 62,08 66,79 71,6

50% 28,61 42,08 48,89 54,44 57,17 56,34 61,94 66,7

25% 40 49,86 56,3 64,03 64,33 68,47 70,56 73,33

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0102030405060708090

100

PC

I (%

)

Número de clases

Banco A - Hist Prewitt 256NG. Comparación E.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

100% 13,6 36 36,7 46,6 47,1 56 60,6 65 69,3 68 66,7 69,9 72,3 73,7

50% 13,1 31 33,5 45,4 45,6 53,4 58,7 64,9 68,9 68,7 67 71,1 73 74,4

25% 10 35,7 39,4 46 47,4 52,9 56,6 61,1 67,7 68,8 67,2 70,8 72,1 73,5

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0102030405060708090

100

PC

I (%

)

Número de clases

Banco B - Hist Prewitt 256NG. Comparación E.

3 6 9 12 15 18 21 25

0 40 67,22 67,31 76,88 80,11 83,84 86,31 88,87

1.75m 43,33 69,03 69,26 76,39 80 81,62 84,56 88,03

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco A - HOG9 Prewitt E100/256NG. Comparación umbral.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

0 53,9 60,4 60,9 67,4 70,4 73,6 74 78,3 83 81,8 79,2 81,3 82,5 83,6

1.75m 51,1 56,3 54,5 58,6 60,3 64,1 63,3 69,8 75,6 73,5 71,1 74,4 75,3 77,1

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco B - HOG9 Prewitt E100/256NG. Comparación umbral.

3 6 9 12 15 18 21 25

Roberts 46,94 69,31 68,7 74,44 78,17 80,69 83,17 85,87

Prewitt 43,33 69,03 69,26 76,39 80 81,62 84,56 88,03

Sobel 43,61 70 69,54 77,22 80,61 82,18 85,24 88,5

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0102030405060708090

100

PC

I (%

)

Número de clases

Banco A - HOG9 E100/256NG u1,75m. Comparación operadores.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

Roberts 6,94 35,6 37,1 50,4 49,7 53,8 55,2 60,8 66,4 66,6 65,2 67,4 69,8 70,9

Prewitt 51,1 56,3 54,5 58,6 60,3 64,1 63,3 69,8 75,6 73,5 71,1 74,4 75,3 77,1

Sobel 50 57,2 51,4 56 57,9 61,9 61,2 68 74,1 71,9 69,7 73 74,3 76,4

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0102030405060708090

100

PC

I (%

)

Número de clases

Banco B - HOG9 E100/256NG u1,75m. Comparación operadores.

3 6 9 12 15 18 21 25

9 46,94 69,31 68,7 74,44 78,17 80,69 83,17 85,87

18 44,72 67,22 67,87 74,24 77,11 79,86 81,75 84,33

36 44,44 65,56 66,2 72,43 76 78,52 80,48 82,93

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0102030405060708090

100

PC

I (%

)

Número de clases

Banco A - HOG opR E100/256NG uM. Comparación divisiones.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

9 6,94 35,6 37,1 50,4 49,7 53,8 55,2 60,8 66,4 66,6 65,2 67,4 69,8 70,9

18 5,83 31,1 30,7 45 43,5 48 49,3 55 61,7 62,4 61,7 63,5 66,2 67,1

36 5,83 30,7 31,3 44,8 42,8 47,3 48,5 53,7 60,3 60,1 59,6 61,8 63,8 65

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0102030405060708090

100

PC

I (%

)

Número de clases

Banco B - HOG opR E100/256NG uM. Comparación divisiones.

Experimentación

50

50

3 6 9 12 15 18 21 25

256NG 44,44 65,56 66,2 72,43 76 78,52 80,48 82,93

32NG 44,17 65 66,39 72,71 75,72 78,38 80,36 83,07

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco A - HOG36 Roberts E100 uM. Comparación NG.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

256NG 5,83 30,7 31,3 44,8 42,8 47,3 48,5 53,7 60,3 60,1 59,6 61,8 63,8 65

32NG 6,39 25 24,1 39,6 37,7 41,9 43,1 47,4 53,7 54,9 55,5 57,5 60,3 60,4

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco B - HOG36 Roberts E100 uM. Comparación NG.

3 6 9 12 15 18 21 25

100% 44,44 65,56 66,2 72,43 76 78,52 80,48 82,93

50% 37,78 65,83 68,98 75 78,61 79,58 80,71 82,9

25% 42,78 69,72 72,31 75,97 80 79,44 79,8 82,63

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0102030405060708090

100

PC

I (%

)

Número de clases

Banco A - HOG36 Roberts 256NG uM. Comparación E.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

100% 5,83 30,7 31,3 44,8 42,8 47,3 48,5 53,7 60,3 60,1 59,6 61,8 63,8 65

50% 20 44,7 46,5 55,8 54,4 59,2 59,9 65,2 69,5 68,2 67,3 69 69,9 70,2

25% 40,3 56,1 56,9 65,8 68,9 71,6 71,2 74,2 77,8 77,1 77,5 78,7 79,7 79,9

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0102030405060708090

100

PC

I (%

)

Número de clases

Banco B - HOG36 Roberts 256NG uM. Comparación E.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

HOG u0 11,7 30,1 31,6 43,3 42,7 47,4 49,7 54 61,8 61,9 59,8 63 65,3 66

HOG intr u0 12,2 35 35,9 48,4 47,4 52,5 54,3 58,5 65,9 65,9 64,6 67,2 69,1 69,4

HOG uM 5,83 30,7 31,3 44,8 42,8 47,3 48,5 53,7 60,3 60,1 59,6 61,8 63,8 65

HOG intr uM 5,83 31,5 30 44,2 42,6 46,3 47,9 53,7 60,3 60,3 59,7 61,6 63,7 64,7

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0102030405060708090

100

PC

I (%

)

Número de clases

Banco B - HOG36 opR E100/256NG. Comparación HOG/HOGintr.

3 6 9 12 15 18 21 25

HOG u0 47,5 68,75 69,35 75,69 78,56 80,69 82,42 86,07

HOGintr u0 47,78 68,89 69,63 75,63 78,5 80,93 82,58 86,2

HOG uM 44,44 65,56 66,2 72,43 76 78,52 80,48 82,93

HOGIntr uM 44,72 66,25 66,85 73,06 75,94 78,47 80,44 83,13

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0102030405060708090

100

PC

I (%

)

Número de clases

Banco A - HOG36 opR E100/256NG. Comparación HOG/HOGintr.

Figura 4-14. Gráficas referentes a las pruebas con descriptores basados en gradiente.

Experimentación

52

52

4.3 Preprocesamiento

Esta subsección surge a raíz de los malos resultados obtenidos con los descriptores de Laws. Es posible que uno

de los factores que originen ese mal rendimiento sea la dispersión de las muestras motivada por las condiciones

de iluminación. Por este motivo, una práctica muy habitual al utilizar este método es el de realizar una etapa

previa de procesamiento en el que se intente corregir este problema. Una

técnica habitual es escoger una ventana que recorra la imagen y vaya

quitando la media de intensidad a todos los píxeles, de manera que

resulten cercanos a cero. Si se realiza una sustracción de intensidad

global, es decir, se escoge una ventana del tamaño de toda la imagen, se

conseguiría unificar el brillo de todas las muestras pero se estarían

ignorando aquellas posibles manchas o defectos de iluminación

focalizados en alguna sección concreta de la imagen. Por este motivo, se

prefiere trabajar con una subventana que vaya sustrayendo la media de

entornos locales de la imagen. Sin embargo, si la ventana es demasiado

pequeña los motivos de la textura que compone la imagen podrían

cambiar radicalmente, por lo que hay que alcanzar un compromiso.

Pueden verse estos efectos en la Figura 4-15. Una ventana ampliamente

utilizada es un cuadrado de 15 píxeles de lado.

Se aplicarán también el resto de métodos al conjunto de imágenes

preprocesadas para corroborar su comportamiento pero, cómo

únicamente queremos una idea rápida del resultado, se realizarán con las

imágenes escaladas al 25% ya que de este modo el gasto computacional es nimio. Dado que con esa escala el

tamaño de las muestras será 25x25 píxeles, quizás utilizar un tamaño de ventana de lado 15 sea demasiado

grande, así que las usaremos 5x5.

Así, esta relación de pruebas puede encontrarse directamente en forma

de gráficos en la Figura 4-17. Dado que el banco A posee muestras de

mayor calidad, con unas condiciones de captura más cuidadas y, muy

probablemente, obtenidas con algún dispositivo de mayor categoría,

podemos observar que, en general, se ve menos afectado por el

preprocesamiento que el banco B, cuyas muestras poseen mayores

variaciones de iluminación.

Podemos ver cómo, efectivamente, el PCI obtenido utilizando los

descriptores de Laws mejora de forma considerable. Lo mismo ocurre,

aunque en menor medida, con los momentos invariantes de Hu. En

cuanto a los descriptores estadísticos se puede observar que, para el

banco A, se ven negativamente afectados, más en los de primer orden

que en los de segundo, probablemente debido a que el histograma se verá

drásticamente modificado, y la dependiencia al mismo es menor en éstos

últimos debido a que se establecen relaciones entre píxeles vecinos;

mientras que para el banco B los resultados también mejoran. En cuanto

a LBP, del mismo modo, los resultados son peores, levemente para el banco A y considerablemente para el B.

Respecto a los métodos basados en gradiente, era de suponer, como ocurre en la mayoría de casos de HOG, que

los resultados empeorarían pues la imagen de gradientes puede verse significativamente distorsionada si la media

local obtenida a cada paso de la subventana es relativamente distinto (que ocurrirá muy probablemente si su

tamaño es reducido), como puede verse en la Figura 4-16. A pesar de esto, cuando se usan los histogramas de

módulo y fase como descriptores, el PCI mejora ligeramente.

Original 100x100

25x25 5x5

Figura 4-15. Sustracción de intensidad

media para distintas subventanas (14A).

Figura 4-16. Módulos de muestra

original frente a muestra a muestra

preprocesada (14A).

3 6 9 12 15 18 21 25

n/a 60,83 80,14 86,76 90,14 92,39 93,61 92,98 93,6

5x5 55,83 65,14 69,54 75,14 76,89 76,3 78,25 78,2

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco A - Laws 5x5 - 25E/256NG. Comparación PreProc.

3 6 9 12 15 18 21 25

n/a 62,2 79,7 84,5 88,5 88,1 90,5 91,9 93,2 94,5 95,5 96,1 96,6 96,8 97,1

5x5 28,1 37,5 45,3 56,2 59,7 67,2 72,4 75,9 78,4 80,2 82,5 84 84,9 85,2

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco B - Laws 5x5 - 25E/256NG. Comparación PreProc.

3 6 9 12 15 18 21 25

n/a 55,83 74,72 82,41 84,79 85,5 84,86 83,33 83,47

5x5 53,61 61,81 70,56 77,57 81,61 83,38 84,68 83,87

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco A - Laws 3x3 - 25E/256NG. Comparación PreProc.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

n/a 61,1 83,2 82,8 86,7 85,6 88 88,5 90,4 92,2 93,6 94,6 95,1 95,4 95,8

5x5 26,7 37,6 49,7 58,2 62,3 69,7 75,8 78,9 81,5 83,7 85,9 87,3 88,6 89,4

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco B - Laws 3x3 - 25E/256NG. Comparación PreProc.

Experimentación

54

54

3 6 9 12 15 18 21 25

n/a 40 45,42 50,93 51,94 57,5 58,89 60,44 62,43

5x5 52,5 54,17 61,3 67,78 73,44 75,88 75,44 75,77

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco A - msake 25E/256NG. Comparación PreProc.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

n/a 21,1 44,9 49,9 59,4 56,8 58,6 59,6 64,8 70,8 71,7 75 77,2 79,5 80

5x5 26,9 39,9 40,9 50,1 49,4 51,9 56,7 62,9 67,3 70,2 72,3 75,2 76,9 77,8

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco B - msake - 25E/256NG. Comparación PreProc.

3 6 9 12 15 18 21 25

n/a 36,11 44,31 55 63,68 68,11 69,07 71,39 75,13

5x5 47,5 52,92 59,81 67,43 70,44 71,57 74,64 75,77

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco A - McEAC 25E/256NG. Comparación PreProc.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

n/a 16,7 44,3 28,9 42,1 45,6 50,8 55 58,3 61,7 65 68,4 71,8 74 75,7

5x5 2,78 24,7 22,9 34,4 35,1 38,5 39,9 44,8 50,5 54,8 59,1 62,9 66,5 68,5

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco B - McEAC 25E/256NG. Comparación PreProc.

3 6 9 12 15 18 21 25

n/a 56,67 71,53 80,46 83,75 86,11 86,2 84,48 86,3

5x5 59,17 68,89 74,63 80,49 82,94 82,96 84,29 85,2

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco A - Hu 25E/256NG. Comparación PreProc.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

n/a 57,8 78,3 75,9 80,6 75,7 79,9 81,8 83,1 85,1 87,2 89 90,2 91 91,2

5x5 30,3 43,9 50,3 59,7 65 69,7 72,8 76,7 80 81,5 84,3 86,1 87,2 88,2

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco B - Hu 25E/256NG. Comparación PreProc.

3 6 9 12 15 18 21 25

n/a 42,78 69,72 72,31 75,97 80 79,44 79,8 82,63

5x5 46,39 72,22 77,13 81,6 83,72 83,43 83,29 86,53

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco A - HOG36 opR uM 25E/256NG. Comparación PreProc.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

n/a 40,3 56,1 56,9 65,8 68,9 71,6 71,2 74,2 77,8 77,1 77,5 78,7 79,7 79,9

5x5 31,9 48,9 48 58,6 61,6 67,5 70,8 74,7 78,7 79 77,8 79,9 80,6 81,4

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco B - HOG36 opR uM 25E/256NG. Comparación PreProc.

Experimentación

56

56

3 6 9 12 15 18 21 25

n/a 34,72 58,61 59,54 64,86 68,11 67,55 68,89 73,53

5x5 43,33 59,31 61,48 67,64 68,72 68,43 69,17 73,33

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco A - LBP 25E/256NG. Comparación PreProc.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

n/a 6,67 26,4 24,2 30,4 34,2 35,5 37,5 41 48,7 47,8 46 48,7 49,7 51,4

5x5 14,4 36,4 37,2 47,5 50,7 53,6 56,7 60,2 64,3 64,1 61,3 64,5 66 67,9

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco B - LBP 25E/256NG. Comparación PreProc.

3 6 9 12 15 18 21 25

n/a 40 49,86 56,3 64,03 64,33 68,47 70,56 73,33

5x5 47,78 52,64 56,85 64,86 65,17 68,01 69,68 71,57

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco A - Hist opP 25E/256NG. Comparación PreProc.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

n/a 10 35,7 39,4 46 47,4 52,9 56,6 61,1 67,7 68,8 67,2 70,8 72,1 73,5

5x5 12,5 27,4 35,6 44,2 45,7 51 54,1 58,9 63,9 64,9 63,6 67,2 68,2 69,3

aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco B - Hist opP 25E/256NG. Comparación PreProc.

Figura 4-17. Gráficas relativas a las pruebas con muestras preprocesadas.

5 CONCLUSIONES Y TRABAJO FUTURO

n este capítulo aunaremos los resultados experimentales obtenidos y trataremos se extraer una conclusión

global seleccionando el método más adecuado. Hablaremos además de las posibles líneas futuras que se

podrían escoger para continuar el estudio realizado en este TFG.

Así, si unimos el resultado obtenido ante los distintos procedimientos empleados con las muestras en sus

condiciones iniciales, esto es al 100% de escala, con 256 niveles de gris y sin procesamiento previo,

obtendríamos los gráficos presentes en la Figura 5-2. Es de esperar que, cuanto mayor sea el número de clases,

peor PCI, por lo general, se obtendrá. Si inicialmente estamos trabajando con tres clases y en la siguiente prueba

pasamos a trabajar con seis, aquellas muestras mal clasificadas en el primer experimento lo seguirán estando en

el segundo (pues hay algún prototipo incorrecto cerca de ellas, y por muchos que aparezcan otros nuevos no van

a conseguir que se acerquen al correcto),

mientras que las que sí que estaban bien

clasificadas podrían sucumbir ante la

aparición de un nuevo modelo más cercano

a ellas pero incorrecto. Por este motivo, lo

normal es que el PCI tienda a emporar. No

obstante, que mejore en algunos casos

significa que las nuevas clases añadidas

tenían una buena variabilidad,

clasificándose la mayoría de sus muestras

correctamente y sin estropear las que ya

estaban bien.

En relación a los métodos estudiados, sin

duda los descriptores que han ofrecido el

peor resultado han sido los de Laws y los

momentos invariantes de Hu, con

porcentajes de clasificación muy cercanos a

los que se obtendrían al realizar el proceso

de forma aleatoria, incluso trabajando

únicamente con tres clases.

En cuanto al resto de métodos, su rendimiento no ha coincidido en ambos bancos de imágenes. En el B

podríamos decir que el comportamiento ha sido el esperado a priori: los estadísticos de primer orden no terminan

de ofrecer buenos resultados, pero se pueden usar para realizar un primer esbozo del problema pues son intuitivos

y se calculan muy rápidamente, y, si se quiere reducir el PCI, basta con aumentar el orden de los estadísticos a

costa de un incremento del cómputo; lo mismo podemos decir de los métodos basados en gradiente, utilizar los

histogramas de módulo y fase es igual de intuitivo y casi tan rápido coomo los estadísticos de primer orden y, si

se quiere mejorar el PCI, basta con combinar ambos elementos en un descriptor que contenga información de

más alto nivel como el HOG, que ofrece resultados comparables a los estadísticos de segundo orden; y, por

último, era de esperar que el descriptor LBP, que actualmente es de los más empleados para caracterizar texturas

con éxito, y que fue diseñado para resolver este tipo de problemas, ofreciese los mejores resultados (un 44.3%

de clasificaciones incorrectas puede no parecer lo suficientemente pequeño como para considerarse un éxito si

E

7,19

17,94

22,77

34,25

46,74

61,12

114,04

262,24

295,23

548,29

0 50 100 150 200 250 300 350 400 450 500 550 600

ME1

Hist

HOG

HOGint

Hu

Laws3x3

ME2

Laws5x5

ME2 (M)

LBP

Tiempo (ms)

Comparación de tiempo promedio de cómputo por muestra de 100 x 100 píxeles

Figura 5-1. Tiempo medio de cómputo por muestra para descriptores.

Conclusiones y trabajo futuro

58

58

estuviésemos hablando de pocas clases, pero hay que tener en cuenta que el sistema trata de distinguir 61 clases

distintas). En cambio, el comportamiento del banco A no es así en absoluto. De hecho, ocurre lo contrario que

en el B: estadísticos de segundo orden y HOG ofrecen peores resultados que estadísticos de primer orden e

histogramas simples, mientras que LBP mantiene un resultado intermedio entre ambas vertientes.

Teniendo eso en cuenta, podemos decir que no hay un método que destaque

unilateralmente sobre los demás, y que deba ser siempre utilizado. Será necesario

conocer y estudiar el conjunto de muestras para determinar que método será más

adecuado. No obstante, a juzgar por los resultados y por el tiempo promedio que

necesita cada tipo de descriptor para caracterizar una muestra, que podemos ver en la

Figura 5-1, en un problema a ciegas no parece mala idea decantarse por los

histogramas de módulo y fase, para realizar un análisis rápido, y por LBP para un

análisis más profundo, que son los que han ofrecido mejor rendimiento en promedio,

como se observa en la Tabla 5-1 (si bien los estadísticos de segundo orden presentan

un mejor resultado, su tiempo de cómputo es elevado y no merecen para un análisis

rápido, mientras que para uno exhaustivo es mejor LBP).

En cuanto a la forma de continuar este proyecto, hay muchísimas opciones posibles.

Una primera posibilidad sería seleccionar un nuevo conjunto de descriptores a evaluar, siguiendo, por ejemplo,

métodos estructurales, basados en la determinación de patrones primitivos, o métodos que trabajen en el dominio

de la frecuencia, como el filtro de Gabor.

Otra posibilidad pasa por complementar este proyecto combinando entre sí los descriptores aquí empleados. En

[11] el tándem HOG-LBP tuvo un considerable éxito. Es más, se podría también explorar de manera más

profunda los métodos desarrollados en este documento. Hemos hablado de U-LBP, pero se han desarrollado

numerosas variantes del método LBP que parecen recogidas en [20]. Más aún, también se podrían utilizar

entornos de píxel distintos, en lugar de utilizar siempre la vecindad de orden 9.

Otra idea adicional, que podría resultar muy interesante, sería intentar el desarrollo eficiente de estadísticos de

orden superior, que relacionaban cada punto de la imagen con más de un píxel vecino, ya que podría mejorar

notablemente el proceso de clasificación.

Por otro lado, se ha visto levemente algún enfoque de procesamiento previo que parece mejorar el resultado en

algunos casos. Podría ser útil investigar y estudiar otras técnicas de preprocesamiento que pudiesen ayudar a

preparar el conjunto de datos ante algún método concreto, como filtrar el ruido o mejorar el contraste.

También es importante recordar que el otro pilar fundamental de este tipo de tareas es el clasificador. Tratar de

implementar otro tipo de clasificador, como el SVM, o algún modelo no lineal, podría ayudar a conseguir una

mayor separabilidad entre clases. Aún más atrayente parece la idea de implementar algún sistema de inteligencia

artificial basado en redes neuronales convolucionales, muy en auge en la actualidad.

PCI promedio

Laws 3 82,93

Hu 81,11

Me1 57,01

HOG 56,42

Hist 55,89

Me2 51,55

LBP 44,63

Tabla 5-1. PCI

promedio de todos

los métodos.

3 6 9 12 15 18 21 25

Hu 57,22 72,5 80 83,89 85,72 85,65 84,09 85,8

Laws 3x3 52,22 69,58 78,61 81,32 83,61 84,44 82,62 82,77

HOG36 44,44 65,56 66,2 72,43 76 78,52 80,48 82,93

McEAC 40,83 47,36 56,76 65,69 69,39 70,05 73,69 76,57

LBP 47,22 67,36 64,81 69,65 67,83 69,86 72,1 74,6

Hist 28,33 44,44 53,15 60 61,83 62,08 66,79 71,6

msake 33,33 38,47 44,91 50,49 57,17 57,27 57,86 60,83

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco A - Comparación descriptores. E100/256NG.

Conclusiones y trabajo futuro

60

60

Figura 5-2. Comparación del PCI de los métodos de caracterización estudiados.

3 6 9 12 15 18 21 25 31 37 43 49 55 61

Hu 58,06 79,17 76,57 80,56 75,78 79,86 82,18 83,53 85,24 87,25 88,97 90,19 90,92 91,2

Laws 3x3 61,94 79,31 79,72 84,51 80,94 85,09 86,98 89,27 91,29 92,66 93,74 94,13 94,71 95

HOG36 5,83 30,69 31,3 44,79 42,83 47,27 48,45 53,67 60,32 60,14 59,63 61,77 63,79 64,95

McEAC 11,67 20,97 22,96 30,9 33,94 38,84 43,81 50,8 57,66 59,03 61,82 64,22 67,08 70,01

LBP 15,28 23,89 19,81 26,88 25,39 26,81 28,65 34,3 41,21 40,83 38,41 40,77 41,91 44,29

Hist 13,61 35,97 36,67 46,6 47,06 56,02 60,56 65 69,3 68,04 66,67 69,88 72,29 73,73

msake 21,39 35,83 43,52 56,88 52,39 56,34 61,39 65,03 70,86 73,49 76,4 78,84 80,79 80,77

aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00 96,77 97,30 97,67 97,96 98,18 98,36

0

10

20

30

40

50

60

70

80

90

100

PC

I (%

)

Número de clases

Banco B - Comparación descriptores. E100/256NG.

REFERENCIAS

[1] R. C. Gonzalez y R.E.Woods, Digital Image Processing, Massachusetts: Adison-Wesley, 1992.

[2] L. Shapiro y G. C. Stockman, Computer vision, Prentice Hall, 2001.

[3] M. Tuceryan, A. K. Jain y otros, Handbook of Pattern Recognition and Computer Vision, 1993.

[4] E. Valveny, J. G. Sabaté y R. B. Caselles, «Clasificación de Imágenes,» Coursera - Universitat Autònoma

de Barcelona, [En línea]. Available: https://www.coursera.org/learn/clasificacion-imagenes/.

[5] A. L. Peña, E. Valveny y M. Vanrell, «Detección de Objetos,» Coursera - Universitat Autònoma de

Barcelona, [En línea]. Available: https://www.coursera.org/learn/deteccion-objetos.

[6] M.-K. Hu, «Visual pattern recognition by moment invariants,» IRE transactions on information theory,

vol. 8, nº 2, pp. 179-187, 1962.

[7] R. M. Haralick, K. Shanmugam y otros, «Textural features for image classification,» IEEE Transactions

on systems, man, and cybernetics, nº 6, pp. 610-621, 1973.

[8] K. I. Laws, «Texture energy measures,» Proc. Image understanding workshop, pp. 47-51, 1979.

[9] T. Ojala, M. Pietikinen y D. Harwood, «A comparative study of texture measures with classification based

on featured distributions,» Pattern recognition, vol. 29, nº 1, pp. 51-59, 1996.

[10] N. Dalal y B. Triggs, «Histograms of oriented gradients for human detection,» Computer Vision and

Pattern Recognition, vol. 1, pp. 886-893, 2005.

[11] X. Wang, T. X. Han y S. Yan, «An HOG-LBP human detector with partial occlusion handling,» Computer

Vision, 2009 IEEE 12th International Conference on, pp. 32-39, 2009.

[12] A. Hormigo, F. Rubio y M. Arahal, «Monitorización y Predicción de la Radiación Solar mediante Visión

del Paso de Nubes,» XXXVI Jornadas de Automática, 2015.

[13] «MATLAB - El lenguaje del cálculo técnico,» [En línea]. Available:

https://es.mathworks.com/products/matlab.html.

[14] «Image Processing Toolbox,» [En línea]. Available: https://es.mathworks.com/products/image.html.

Referencias

62

62

[15] S. Lazebnik, C. Schmid y J. Ponce, «A Sparse Texture Representation Using Local Affine Regions,» IEEE

Transactions on Pattern Analysis and Machine Intelligence, vol. 27, nº 8, pp. 1265-1278, 2005.

[16] M. a. Z. A. Varma, «A statistical approach to texture classification from single images,» International

Journal of Computer Vision: Special Issue on Texture Analysis and Synthesis, 2005.

[17] «Www-cvr.ai.uiuc.edu,» Datasets, Ponce Research Group, [En línea]. Available: http://www-

cvr.ai.uiuc.edu/ponce_grp/data/#texture.

[18] «Robots.ox.ac.uk,» Classification, Visual Geometry Group - Texture, [En línea]. Available:

http://www.robots.ox.ac.uk/~vgg/research/texclass/index.html.

[19] M. R. Arahal, Apuntes de Sistemas de Percepción.

[20] T. Bouwmans y otros, «On the Role and the Importance of Features for Background Modeling and

Foreground Detection,» arXiv preprint arXiv:1611.09099, 2016.

[21] R. Rodríguez Morales y S. A. J. Humberto, Procesamiento y Análisis Digital de Imágenes, Madrid: Ra-

Ma, 2011.

ANEXO A. MUESTRAS DE TEXTURA

Banco de imágenes A

01 - Bark (I) 02 - Bark (II) 03 - Bark (III) 04 - Wood (I) 05 - Wood (II)

06 - Wood (III) 07 - Water 08 - Granite 09 - Marble 10 - Floor (I)

11 - Floor (II) 12 - Pebbles 13 - Wall 14 - Brick (I) 15 - Brick (II)

16 - Glass (I) 17 - Glass (II) 18 - Carpet (I) 19 - Carpet (II) 20 - Upholstery

21 - Wallpaper 22 - Fur 23 - Knit 24 - Corduroy 25 - Plaid

Anexo A. Muestras de textura

64

64

Banco de imágenes B

01 - Felt 02 - Polyester 03 - Terrycloth 04 - Rough Plastic 05 - Leather

06 - Sandpaper 07 - Velvet 08 - Pebbles 09 - Frosted Glass 10 - Plaster (I)

11 - Plaster (II) 12 - Rough Paper 13 - Artificial Grass 14 - Roof Shingle 15 - Aluminum Foil

16 - Cork 17 - Rough Tile 18 - Rug (I) 19 - Rug (I) 20 - Styrofoam

21 - Sponge 22 - Lambswool 23 - Lettuce Leaf 24 Rabbit Fur 25 - Quarry Tile

26 - Loofa 27 - Insulation 28 - Crumpled Paper 29 - (02) Zoomed 30 - (11) Zoomed

31 - (12) Zoomed 32 - (14) Zoomed 33 - Slate (I) 34 - Slate (b) 35 - Painted Spheres

36 - Limestone 37 - Brick (I) 38 - Ribbed Paper 39 - Human Skin 40 - Straw

41 - Brick (II) 42 - Corduroy 43 - Salt Crystals 44 - Linen 45 - Concrete (I)

46 - Cotton 47 - Stones 48 - Brown Bread 49 - Concrete (II) 50 - Concrete (III)

51 - Corn Husk 52 - White Bread 53 - Soleirolia Plant 54 - Wood (I) 55 - Orange Peel

56 - Wood (II) 57 - Peacock Feather 58 - Tree Bark 59 - Cracker (I) 60 - Cracker (II)

61 - Moss

ANEXO B. RESULTADOS EXPERIMENTALES

n este anexo se expondrá, dispuesto en forma de tabla, el PCI obtenido para todas las pruebas que se han

realizado, utilizando ambos bancos de imágenes, con todos los métodos estudiados, para tres escalas

distintas y dos números diferentes de niveles de gris. Todo ello repetido para un número de clases cada

vez mayor hasta alcanzar el total de cada banco.

B.i Métodos estadísticos

Banco A Número de clases

Escala NG Descr 3 6 9 12 15 18 21 25

100 256 sae 33,89 38,33 45,37 53,61 60,11 59,49 60,52 65,23

100 256 sake 33,89 37,78 45,09 51,32 58,00 58,56 60,00 64,27

100 256 msake 33,33 38,47 44,91 50,49 57,17 57,27 57,86 60,83

100 32 sae 33,89 39,31 45,74 53,13 59,17 59,07 60,08 65,00

100 32 sake 33,61 38,61 45,74 51,67 57,44 58,29 59,56 63,57

100 32 msake 33,33 39,31 46,02 51,18 57,89 57,31 57,50 60,43

50 256 sae 37,50 40,42 47,78 52,85 59,83 60,83 62,62 66,67

50 256 sake 35,83 37,92 46,76 50,14 57,11 58,29 60,08 64,47

50 256 msake 35,83 38,19 44,72 48,89 55,78 55,79 56,94 59,67

50 32 sae 37,50 40,28 47,50 53,13 59,89 61,06 62,82 66,70

50 32 sake 36,11 38,06 46,30 49,86 56,83 58,43 60,44 64,43

50 32 msake 36,11 38,47 45,00 49,38 55,72 56,20 57,26 60,03

25 256 sae 40,83 45,83 53,24 57,64 62,83 65,88 68,81 71,73

25 256 sake 41,39 45,28 52,04 53,82 60,00 63,56 64,92 68,33

25 256 msake 40,00 45,42 50,93 51,94 57,50 58,89 60,44 62,43

25 32 sae 41,39 46,25 53,52 57,92 62,67 65,88 68,73 71,47

25 32 sake 41,94 45,42 52,31 53,54 59,72 63,84 64,92 68,50

25 32 msake 40,83 45,28 50,83 52,64 58,33 59,58 60,63 62,57

Tabla B - 1. Resultados ofrecidos por estadísticos de primer orden para el banco A.

E

Anexo B. Resultados experimentales

68

68

Tabla B - 2. Resultados ofrecidos por estadísticos de primer orden para el banco B.

Banco B Número de clases

Escala NG Descr 3 6 9 12 15 18 21 25 31 37 43 49 55 61

100 256 sae 18,33 31,39 35,56 50,35 49,56 57,78 61,51 66,43 72,58 74,44 77,42 80,61 82,29 82,83

100 256 sake 19,44 31,39 35,65 50,42 49,72 57,59 61,55 66,37 72,42 74,21 77,31 80,54 82,17 82,62

100 256 msake 21,39 35,83 43,52 56,88 52,39 56,34 61,39 65,03 70,86 73,49 76,40 78,84 80,79 80,77

100 32 sae 18,33 31,25 34,63 50,35 49,56 57,92 61,83 66,67 72,12 75,11 78,12 81,26 82,95 83,46

100 32 sake 19,72 30,69 35,00 50,63 49,72 57,82 61,47 66,53 71,91 74,64 77,79 81,00 82,64 83,25

100 32 msake 21,67 37,22 43,98 57,50 52,17 56,02 61,19 65,27 71,13 74,01 77,00 79,25 81,17 81,11

50 256 sae 17,78 33,75 34,81 47,50 47,39 54,21 56,35 63,37 67,39 69,64 74,40 77,72 80,02 80,51

50 256 sake 17,50 32,50 35,00 47,78 47,44 54,12 56,15 63,43 67,47 69,32 73,70 77,14 79,47 80,08

50 256 msake 21,11 43,19 46,02 58,13 53,17 57,82 61,98 65,07 70,75 73,27 75,74 78,64 80,64 80,85

50 32 sae 17,22 33,61 40,46 50,90 48,72 55,65 57,22 63,43 67,61 70,16 74,79 78,01 80,18 80,67

50 32 sake 17,22 32,08 43,61 53,06 50,39 56,90 58,61 64,07 67,85 70,63 74,61 77,81 79,94 80,44

50 32 msake 20,56 41,67 51,67 61,94 55,56 60,09 63,10 65,20 71,10 74,53 76,76 79,42 81,36 81,22

25 256 sae 18,33 35,14 37,41 48,26 49,17 54,03 54,96 61,20 66,37 70,68 74,84 76,92 79,05 79,59

25 256 sake 16,67 36,39 37,78 48,33 48,61 52,96 54,60 60,80 65,89 70,02 73,82 75,99 78,08 78,73

25 256 msake 21,11 44,86 49,91 59,38 56,83 58,56 59,56 64,77 70,75 71,73 74,96 77,19 79,52 79,95

25 32 sae 19,72 37,08 50,37 58,75 59,39 64,63 64,29 69,57 72,96 76,01 79,03 81,28 82,38 82,72

25 32 sake 19,44 39,44 50,09 59,38 59,67 64,68 64,60 70,37 73,12 76,24 79,05 81,29 82,42 82,65

25 32 msake 20,83 48,89 55,74 64,31 60,83 64,54 66,19 70,93 75,86 76,67 79,34 81,22 83,09 83,37

Banco A Número de clases Banco A Número de clases Banco A Número de clases Banco A Número de clases

Descrip. 3 6 9 Descrip. 3 6 9 Descrip. 3 6 9 Descrip. 3 6 9

m 56,11 79,17 84,81 mse 43,06 49,86 61,30 Rkue 40,83 52,50 66,11 msRk 41,94 47,78 60,56

s 52,22 61,25 72,04 mRa 42,50 59,72 64,63 Raue 35,00 44,86 54,26 msRa 33,61 39,44 45,65

R 55,28 66,81 77,87 mRk 48,89 65,83 76,57 Rake 35,83 42,22 49,35 Rakue 37,22 44,58 53,43

a 43,33 63,33 63,80 mRu 47,78 62,22 70,19 Raku 38,89 47,36 53,15 sakue 33,89 40,14 48,43

k 42,78 66,94 76,85 mRe 46,39 60,42 69,35 skue 38,33 44,86 60,56 sRkue 38,33 44,86 60,56

u 41,39 61,94 74,07 mak 43,89 56,67 59,72 saue 33,33 40,56 48,06 sRaue 33,33 40,56 48,06

e 48,61 63,47 74,72 mau 41,11 48,61 54,63 sake 33,89 37,78 45,09 sRake 33,89 37,78 45,09

ms 48,89 57,78 67,13 mae 38,89 45,28 51,57 saku 33,33 39,03 47,13 sRaku 33,33 39,03 47,13

mR 56,11 79,03 84,72 mku 47,78 60,42 68,80 sRue 40,83 49,72 64,17 makue 37,50 45,69 53,61

ma 42,50 59,86 64,72 mke 45,56 55,69 66,76 sRke 42,22 43,47 60,46 mRkue 42,78 55,56 67,13

mk 48,89 65,83 76,76 mue 42,50 57,64 68,61 sRku 40,00 44,44 60,65 mRaue 36,11 46,11 54,26

mu 47,78 62,22 70,19 sue 40,83 49,72 64,17 sRae 33,89 38,33 45,37 mRake 38,89 45,56 51,76

me 46,39 60,42 69,35 ske 42,22 43,47 60,46 sRau 33,61 40,00 47,41 mRaku 42,22 49,17 54,63

sR 52,22 61,25 72,04 sku 40,00 44,44 60,65 sRak 33,06 37,50 46,02 mskue 36,39 45,56 58,70

sa 33,89 38,47 47,04 sae 33,89 38,33 45,37 mkue 42,78 55,56 67,13 msaue 31,94 39,72 47,31

sk 45,28 46,25 62,78 sau 33,61 40,00 47,41 maue 36,11 46,11 54,26 msake 33,33 38,47 44,91

su 42,22 49,17 63,43 sak 33,06 37,50 46,02 make 38,89 45,56 51,76 msaku 32,22 38,47 47,50

se 46,11 50,97 65,28 sRe 46,11 50,97 65,28 maku 42,22 49,17 54,63 msRue 38,33 46,53 59,81

Ra 43,33 62,50 63,61 sRu 42,22 49,31 63,43 mRue 42,50 57,64 68,61 msRke 39,44 45,97 58,15

Rk 42,78 66,25 76,76 sRk 45,28 46,25 62,78 mRke 45,56 55,69 66,76 msRku 37,78 45,56 58,80

Ru 41,39 61,94 74,07 sRa 33,89 38,47 47,04 mRku 47,78 60,28 68,80 msRae 32,50 38,89 45,56

Re 48,61 62,92 74,54 Rue 43,06 58,33 71,20 mRae 38,89 45,28 51,57 msRau 31,67 38,61 47,13

ak 41,94 60,56 60,56 Rke 40,56 48,33 64,63 mRau 41,11 48,47 54,63 msRak 33,33 38,61 44,26

au 38,61 48,19 54,81 Rku 40,83 55,42 67,87 mRak 43,89 56,67 59,72 msRaku 32,22 38,47 47,50

ae 35,28 41,81 49,91 Rae 35,28 41,81 49,91 msue 38,33 46,53 59,81 msRake 33,33 38,47 44,91

ku 40,83 55,42 67,87 Rau 38,61 48,19 54,81 mske 39,44 45,97 58,06 msRaue 31,94 39,72 47,31

ke 40,56 48,33 64,63 Rak 41,94 60,00 60,46 msku 37,78 45,56 58,80 msRkue 36,39 45,56 58,70

ue 43,06 58,33 71,20 aku 38,89 47,36 53,15 msae 32,50 38,89 45,46 msakue 32,78 39,58 47,31

msR 49,17 57,78 67,13 ake 35,83 42,22 49,26 msau 31,67 38,61 47,13 mRakue 37,50 45,69 53,61

msa 33,61 39,44 45,65 aue 35,00 44,86 54,26 msak 33,33 38,61 44,26 sRakue 33,89 40,14 48,43

msk 41,94 47,78 60,56 kue 40,83 52,50 66,11 msRe 43,06 49,86 61,30 msRakue 32,78 39,58 47,41

msu 38,89 47,64 60,28 akue 37,22 44,58 53,43 msRu 38,89 47,64 60,28

Tabla B - 3. Combinaciones de estadísticos de 1er orden con pocas clases para el banco A.


70

70

Banco B Número de clases Banco B Número de clases Banco B Número de clases Banco B Número de clases


m 59,17 78,75 76,20 mse 33,33 47,64 44,72 Rkue 21,67 43,06 48,89 msRk 27,50 56,53 52,78

s 35,56 48,47 54,35 mRa 41,67 62,08 65,28 Raue 19,17 37,36 42,31 msRa 26,94 42,64 51,30

R 46,39 47,22 52,04 mRk 47,50 70,28 67,41 Rake 21,11 34,72 40,93 Rakue 19,72 36,81 42,41

a 34,44 65,42 69,07 mRu 36,11 54,03 62,13 Raku 20,83 40,00 42,50 sakue 18,33 32,64 36,85

k 30,28 64,58 71,76 mRe 36,11 54,44 53,24 skue 20,28 38,47 42,96 sRkue 20,28 38,47 43,06

u 34,44 51,25 52,78 mak 30,28 55,56 70,65 saue 16,94 33,89 36,94 sRaue 16,94 33,89 37,13

e 35,28 48,47 53,89 mau 29,72 44,58 59,26 sake 19,44 31,39 35,65 sRake 19,44 31,39 35,83

ms 33,89 62,50 59,26 mae 27,78 39,17 49,63 saku 18,33 30,97 33,80 sRaku 18,33 30,97 34,07

mR 59,17 77,50 67,22 mku 29,44 49,72 60,74 sRue 25,83 41,53 45,56 makue 22,78 34,86 49,54

ma 41,67 62,92 69,72 mke 29,44 50,00 51,67 sRke 21,94 39,31 41,57 mRkue 27,50 45,97 52,69

mk 47,50 71,39 74,81 mue 33,89 49,03 54,17 sRku 20,56 37,36 40,56 mRaue 27,78 37,50 49,63

mu 36,39 54,03 62,22 sue 25,83 41,53 46,02 sRae 18,33 31,39 35,56 mRake 21,67 34,72 49,17

me 36,11 54,44 53,15 ske 21,94 39,31 41,20 sRau 17,50 32,92 34,17 mRaku 23,33 40,83 58,98

sR 35,56 44,86 48,98 sku 20,83 37,36 40,65 sRak 22,22 39,44 33,80 mskue 25,83 40,56 45,28

sa 20,83 44,72 38,61 sae 18,33 31,39 35,56 mkue 27,50 45,97 52,78 msaue 25,28 38,06 43,80

sk 25,00 47,50 45,19 sau 17,50 32,92 34,07 maue 27,78 37,50 49,81 msake 21,39 35,83 43,52

su 23,61 41,53 43,80 sak 22,22 42,64 39,44 make 21,67 34,58 49,54 msaku 21,39 34,72 47,13

se 27,78 42,92 48,33 sRe 27,78 43,06 46,94 maku 23,33 40,83 59,26 msRue 32,22 44,31 46,48

Ra 34,44 58,75 49,63 sRu 23,61 41,53 42,96 mRue 34,17 49,03 53,80 msRke 26,94 44,03 43,24

Rk 30,00 57,92 42,59 sRk 25,00 41,81 39,35 mRke 29,44 49,86 51,67 msRku 26,11 39,86 50,19

Ru 34,44 51,25 51,85 sRa 20,83 40,56 32,78 mRku 29,44 49,72 60,65 msRae 26,39 38,89 43,43

Re 35,00 48,47 52,69 Rue 33,61 46,94 51,39 mRae 27,78 39,17 49,17 msRau 26,11 37,64 47,04

ak 29,72 55,14 68,52 Rke 22,22 43,75 47,31 mRau 29,72 44,58 58,98 msRak 22,22 42,22 50,93

au 18,89 41,53 42,41 Rku 23,89 45,69 48,43 mRak 30,28 54,44 65,28 msRaku 21,39 34,72 46,94

ae 19,44 35,97 40,65 Rae 19,44 35,97 40,74 msue 32,22 44,44 46,67 msRake 21,39 35,83 43,33

ku 23,89 45,69 48,61 Rau 18,89 41,53 42,59 mske 26,94 43,89 43,15 msRaue 25,28 38,06 43,70

ke 22,22 43,89 46,85 Rak 29,44 50,97 50,00 msku 26,11 39,86 50,19 msRkue 25,83 40,56 45,28

ue 33,61 46,94 51,85 aku 20,83 40,00 42,04 msae 26,39 38,75 43,61 msakue 20,28 36,53 43,61

msR 33,89 62,22 53,06 ake 21,11 34,72 40,65 msau 26,11 37,64 47,22 mRakue 22,78 34,86 49,63

msa 26,94 42,78 52,50 aue 19,17 37,36 42,13 msak 22,22 42,64 53,43 sRakue 18,33 32,64 37,13

msk 27,50 57,08 57,59 kue 21,67 43,06 48,80 msRe 33,33 47,64 44,91 msRakue 20,28 36,53 43,80

msu 32,22 43,75 51,76 akue 19,72 36,81 42,13 msRu 32,22 43,75 51,57

Tabla B - 4. Combinaciones de estadísticos de 1er orden con pocas clases para el banco B.

Banco A Número de clases Banco A Número de clases Banco A Número de clases Banco A Número de clases


M 47,50 68,89 79,72 McC 45,28 50,56 61,85 hEAC 50,83 63,47 70,46 MchE 43,06 62,50 72,13

c 57,50 73,89 78,80 MhU 48,61 64,58 73,24 hUAC 49,72 64,86 70,46 MchU 43,33 63,75 71,94

h 51,39 75,14 79,72 MhE 47,22 61,39 71,76 hUEC 49,44 62,22 69,72 hUEAC 48,89 61,53 69,72

U 45,28 67,78 78,24 MhA 48,06 65,00 74,26 hUEA 48,61 66,25 73,33 cUEAC 44,44 52,64 63,61

E 50,83 69,58 79,35 MhC 48,33 62,36 68,52 cEAC 46,94 54,17 64,07 chEAC 46,94 54,86 65,46

A 44,44 69,31 78,89 MUE 42,78 62,22 75,56 cUAC 45,56 52,92 63,80 chUAC 46,11 54,17 64,91

C 65,00 74,17 76,94 MUA 41,94 60,97 76,94 cUEC 44,44 53,19 63,33 chUEC 45,56 54,17 64,26

Mc 45,28 63,19 73,61 MUC 46,67 58,61 69,44 cUEA 42,78 62,78 75,00 chUEA 44,17 63,19 72,41

Mh 48,33 66,39 75,37 MEA 41,94 62,22 75,83 chAC 47,50 56,53 66,11 MUEAC 43,89 54,86 67,96

MU 41,94 60,69 76,39 MEC 45,00 51,67 65,46 chEC 46,11 55,56 65,74 MhEAC 47,78 56,25 67,13

ME 42,22 59,44 74,44 MAC 50,28 62,36 72,41 chEA 46,39 65,14 73,52 MhUAC 48,61 60,56 68,33

MA 45,00 65,83 76,39 cAC 50,00 56,53 64,63 chUC 46,67 55,28 65,28 MhUEC 46,39 56,53 66,67

MC 49,72 63,06 71,57 cEC 52,22 55,56 65,09 chUA 45,56 65,69 73,15 MhUEA 46,67 63,89 71,57

ch 47,22 69,44 75,46 cEA 44,72 62,78 73,70 chUE 44,17 63,06 72,50 McEAC 44,44 51,39 61,48

cU 44,72 62,36 73,06 cUC 46,11 53,47 63,52 MEAC 45,56 52,36 66,76 McUAC 44,72 51,11 61,48

cE 49,17 59,86 69,91 cUA 43,89 63,89 75,37 MUAC 46,67 57,78 70,19 McUEC 43,61 51,11 61,48

cA 48,06 64,17 73,06 cUE 42,78 62,92 73,98 MUEC 44,44 54,31 66,48 McUEA 41,39 61,39 73,70

cC 57,22 62,64 67,31 chC 46,39 57,78 67,04 MUEA 42,50 62,64 75,83 MchAC 45,00 51,81 63,80

hU 49,72 70,14 75,37 chA 46,67 68,19 74,81 MhAC 48,89 61,25 68,06 MchEC 44,44 52,36 63,98

hE 49,44 67,92 74,63 chE 46,11 64,72 73,15 MhEC 47,22 55,00 66,85 MchEA 43,33 63,33 72,04

hA 51,39 71,25 76,57 chU 45,56 65,28 72,96 MhEA 47,22 63,19 72,22 MchUC 44,72 52,36 63,61

hC 52,78 67,78 71,85 hAC 51,67 68,89 72,13 MhUC 47,78 59,31 67,50 MchUA 43,33 63,75 71,85

UE 46,67 64,86 76,85 hEC 51,39 62,22 69,81 MhUA 48,61 65,56 72,87 MchUE 41,94 62,36 71,39

UA 45,00 67,64 77,78 hEA 49,72 66,94 74,07 MhUE 46,39 63,19 71,48 MchUEA 41,39 62,08 71,67

UC 50,83 65,00 72,69 hUC 50,00 66,25 71,20 McAC 45,28 49,58 61,11 MchUEC 43,33 52,78 63,33

EA 46,94 65,00 76,57 hUA 49,44 70,56 75,65 McEC 44,44 51,11 61,39 MchUAC 43,89 52,92 64,35

EC 53,06 61,81 68,52 hUE 48,61 66,53 73,70 McEA 42,22 61,53 73,52 MchEAC 44,72 52,50 63,52

AC 55,56 68,61 73,15 UEA 45,56 65,42 76,94 McUC 44,44 50,83 61,48 McUEAC 43,89 51,11 62,13

Mch 44,44 65,97 73,89 UEC 47,50 60,97 68,98 McUA 42,50 62,50 74,07 MhUEAC 46,67 58,19 67,50

McU 42,50 62,50 73,52 UAC 49,72 63,47 72,87 McUE 41,39 60,42 73,52 chUEAC 46,11 54,58 65,00

McE 41,94 61,81 73,06 EAC 50,28 60,69 70,00 MchC 45,28 52,08 64,26 MchUEAC 43,89 53,06 64,26

McA 44,44 63,75 74,91 UEAC 46,11 59,72 70,00 MchA 44,17 66,25 73,61

Tabla B - 5. Combinaciones de estadísticos de 2o orden con pocas clases para el banco A.


72

72

Banco B Número de clases Banco B Número de clases Banco B Número de clases Banco B Número de clases


M 53,06 57,64 64,17 McC 2,78 35,42 33,33 hEAC 15,00 28,33 33,06 MchE 17,50 39,72 42,04

c 19,44 47,92 59,54 MhU 25,83 43,75 46,39 hUAC 15,83 29,86 32,22 MchU 18,89 42,50 42,41

h 18,61 52,64 52,59 MhE 20,00 41,11 44,91 hUEC 15,00 29,58 30,37 hUEAC 15,00 30,00 30,65

U 31,67 55,00 58,15 MhA 27,50 43,47 47,13 hUEA 23,06 45,42 49,26 cUEAC 14,44 30,28 30,46

E 23,33 52,92 59,26 MhC 10,28 30,28 31,11 cEAC 12,22 28,19 30,09 chEAC 13,33 29,17 29,72

A 39,17 59,31 62,04 MUE 29,17 44,58 49,26 cUAC 14,17 30,42 31,30 chUAC 15,00 30,83 28,89

C 8,61 46,94 61,94 MUA 37,78 49,17 50,28 cUEC 12,22 29,17 29,63 chUEC 13,06 30,28 29,44

Mc 19,44 39,03 43,43 MUC 12,22 31,81 35,83 cUEA 19,44 45,28 48,61 chUEA 18,61 42,78 44,72

Mh 22,78 42,64 46,30 MEA 31,67 45,83 49,26 chAC 12,78 28,61 28,98 MUEAC 15,00 29,72 31,57

MU 35,83 48,33 49,91 MEC 8,33 28,33 29,35 chEC 11,11 29,44 29,17 MhEAC 15,00 29,31 30,09

ME 27,22 45,00 49,26 MAC 12,78 31,11 45,37 chEA 18,61 40,14 44,26 MhUAC 16,39 31,25 32,50

MA 43,89 50,00 53,89 cAC 8,06 27,92 36,30 chUC 13,06 30,00 27,87 MhUEC 15,00 29,58 30,19

MC 9,72 41,67 48,98 cEC 7,22 28,33 28,61 chUA 19,44 44,31 43,80 MhUEA 25,56 42,50 46,48

ch 17,78 42,36 42,78 cEA 19,17 43,75 51,02 chUE 18,61 42,08 43,98 McEAC 11,39 28,06 29,17

cU 19,17 45,83 44,91 cUC 9,17 29,44 29,81 MEAC 13,06 29,03 31,11 McUAC 14,17 29,86 30,46

cE 18,06 43,61 51,85 cUA 19,44 46,81 45,28 MUAC 16,39 33,75 36,67 McUEC 12,22 29,03 28,52

cA 20,00 43,89 48,61 cUE 18,61 44,44 48,89 MUEC 13,89 29,58 30,65 McUEA 19,44 43,19 44,63

cC 1,67 39,03 47,13 chC 7,78 28,06 27,87 MUEA 30,83 45,56 49,44 MchAC 13,33 28,75 27,59

hU 21,67 46,53 49,81 chA 18,89 41,53 43,89 MhAC 16,11 31,25 32,31 MchEC 10,83 28,47 27,41

hE 18,06 46,11 49,54 chE 17,22 40,97 43,52 MhEC 11,94 28,33 29,17 MchEA 18,61 40,56 42,69

hA 23,61 47,36 52,41 chU 18,89 43,19 43,52 MhEA 22,78 41,81 45,56 MchUC 13,33 29,17 27,22

hC 8,89 29,17 33,06 hAC 15,83 30,14 34,17 MhUC 15,28 30,56 31,48 MchUA 19,44 42,36 42,96

UE 26,11 48,06 53,70 hEC 11,94 27,92 32,69 MhUA 29,72 44,17 47,04 MchUE 18,33 41,11 43,15

UA 35,00 56,25 58,52 hEA 20,83 45,00 50,19 MhUE 22,50 42,36 46,30 MchUEA 18,61 40,97 43,61

UC 11,94 35,83 37,78 hUC 14,72 29,31 31,39 McAC 9,44 27,78 33,24 MchUEC 13,61 29,58 28,33

EA 26,94 50,14 55,46 hUA 26,39 47,64 50,19 McEC 8,33 27,50 27,41 MchUAC 15,00 30,00 28,24

EC 7,22 28,33 32,59 hUE 20,83 45,14 48,61 McEA 18,89 43,61 43,98 MchEAC 14,17 28,33 28,15

AC 10,83 35,83 45,93 UEA 28,61 48,19 53,33 McUC 9,44 28,61 29,54 McUEAC 14,44 29,58 29,35

Mch 17,50 40,97 42,31 UEC 13,89 28,61 30,83 McUA 20,28 45,00 42,69 MhUEAC 15,00 29,31 31,02

McU 18,89 43,89 42,41 UAC 15,56 36,25 39,17 McUE 18,89 43,33 44,44 chUEAC 15,00 30,56 29,91

McE 17,78 41,11 44,07 EAC 13,61 28,06 33,98 MchC 8,33 28,06 26,30 MchUEAC 15,00 29,72 29,07

McA 20,00 44,31 42,31 UEAC 15,00 29,03 31,57 MchA 19,17 42,22 43,15

Tabla B - 6. Combinaciones de estadísticos de 2o orden con pocas clases para el banco B.

ME1 3 Clases 6 Clases 9 Clases ME2 3 Clases 6 Clases 9 Clases

Descr. PCI Descr. PCI Descr. PCI Descr. PCI Descr. PCI Descr. PCI

Ban

co A

msau 31,67 sak 37,5 msak 44,26

Ban

co A

McUE 41,39 McAC 49,58 McAC 61,11

msRau 31,67 sRak 37,5 msRak 44,26 McUEA 41,39 McC 50,56 McEC 61,39

msaue 31,94 sake 37,78 msake 44,91 MchUEA 41,39 McUC 50,83 McUC 61,48

msRaue 31,94 sRake 37,78 msRake 44,91 MU 41,94 McEC 51,11 McEAC 61,48

msaku 32,22 sae 38,33 sake 45,09 McE 41,94 McUAC 51,11 McUAC 61,48

msRaku 32,22 sRae 38,33 sRake 45,09 MUA 41,94 McUEC 51,11 McUEC 61,48

msae 32,5 sa 38,47 sae 45,37 MEA 41,94 McUEAC 51,11 McC 61,85

msRae 32,5 sRa 38,47 sRae 45,37 MchUE 41,94 McEAC 51,39 McUEAC 62,13

msakue 32,78 msake 38,47 msae 45,46 ME 42,22 MEC 51,67 cUEC 63,33

msRakue 32,78 msaku 38,47 msRae 45,56 McEA 42,22 MchAC 51,81 MchUEC 63,33

Descr. PCI Descr. PCI Descr. PCI Descr. PCI Descr. PCI Descr. PCI

Ban

co B

saue 16,94 saku 30,97 sRa 32,78

Ban

co B

cC 1,67 McEC 27,5 MchC 26,3

sRaue 16,94 sRaku 30,97 saku 33,8 McC 2,78 McAC 27,78 MchUC 27,22

sau 17,5 sae 31,39 sRak 33,8 EC 7,22 cAC 27,92 McEC 27,41

sRau 17,5 sake 31,39 sau 34,07 cEC 7,22 hEC 27,92 MchEC 27,41

sae 18,33 sRae 31,39 sRaku 34,07 chC 7,78 chC 28,06 MchAC 27,59

saku 18,33 sRake 31,39 sRau 34,17 cAC 8,06 EAC 28,06 chC 27,87

sRae 18,33 sakue 32,64 sae 35,56 MEC 8,33 MchC 28,06 chUC 27,87

sakue 18,33 sRakue 32,64 sRae 35,56 McEC 8,33 McEAC 28,06 MchEAC 28,15

sRaku 18,33 sau 32,92 sake 35,65 MchC 8,33 cEAC 28,19 MchUAC 28,24

sRakue 18,33 sRau 32,92 sRake 35,83 C 8,61 EC 28,33 MchUEC 28,33

Tabla B - 7. Mejores combinaciones de estadísticos obtenidas para a pocas clases.

Con R: No cambia Mejora Empeora

Con U+A: No cambia Mejora Empeora


74

74

E100 - 256NG Número de clases - JPG Número de clases - PNG E100 - 256NG Número de clases - JPG Número de clases - PNG

Op dis Op D Descr 3 6 9 3 6 9 dis Op D Descr 3 6 9 3 6 9

1 E McC 45,28 51,53 62,41 2,78 35,69 33,33 4 E McC 39,17 53,33 57,04 13,89 28,06 36,94

1 E McEC 44,44 51,11 61,76 8,33 28,06 27,22 4 E McEC 36,39 51,39 56,11 12,50 28,33 31,94

1 E McEAC 44,44 51,39 61,57 11,39 30,28 28,98 4 E McEAC 37,22 49,17 56,30 14,17 29,72 32,50

1 NE McC 36,11 53,19 61,48 9,17 27,78 33,24 4 NE McC 36,67 48,61 58,61 15,28 33,19 37,31

1 NE McEC 39,17 50,56 61,48 12,78 22,08 26,94 4 NE McEC 32,50 45,97 57,69 17,78 32,64 33,06

1 NE McEAC 39,44 50,28 61,30 14,44 26,11 27,78 4 NE McEAC 33,61 45,42 57,78 19,72 34,17 33,33

1 N McC 33,33 50,00 61,30 15,56 24,62 31,11 4 N McC 35,83 52,64 61,57 8,33 28,47 32,78

1 N McEC 36,67 49,86 60,65 10,56 18,61 26,39 4 N McEC 35,00 46,53 60,65 10,83 27,22 27,22

1 N McEAC 37,22 52,64 62,04 14,44 24,31 27,41 4 N McEAC 35,28 47,92 60,19 11,94 30,28 28,43

1 NO McC 39,44 49,17 58,33 8,33 25,83 30,37 4 NO McC 36,67 49,03 53,15 13,61 31,94 37,22

1 NO McEC 38,33 47,08 57,69 5,56 21,67 25,65 4 NO McEC 35,28 46,25 52,87 13,61 30,28 31,48

1 NO McEAC 39,44 49,03 59,91 9,72 23,89 26,30 4 NO McEAC 34,44 45,97 54,54 15,00 31,94 31,48

1 M McC 41,39 46,67 56,30 7,50 22,08 27,04 4 M McC 35,28 46,11 51,94 5,83 28,89 34,54

1 M McEC 39,72 47,50 56,94 6,67 17,64 22,41 4 M McEC 33,89 44,31 51,48 7,50 26,25 26,02

1 M McEAC 40,83 47,36 56,76 11,67 20,97 22,96 4 M McEAC 34,44 42,22 50,37 10,56 28,47 26,94

2 E McC 42,78 54,03 59,91 3,33 34,72 39,35 5 E McC 38,33 51,39 55,93 15,28 38,89 42,78

2 E McEC 40,00 51,81 59,91 6,94 27,92 30,93 5 E McEC 36,11 48,47 54,26 15,28 33,61 32,87

2 E McEAC 40,00 51,25 59,72 8,89 27,92 30,83 5 E McEAC 34,72 47,50 53,98 15,83 35,14 32,69

2 NE McC 31,11 51,39 59,26 6,11 29,72 40,09 5 NE McC 33,67 47,78 58,89 27,22 37,50 44,26

2 NE McEC 33,06 49,86 59,07 8,33 29,03 32,78 5 NE McEC 33,89 45,69 57,87 29,72 36,94 38,70

2 NE McEAC 34,17 50,56 58,43 10,83 30,56 33,43 5 NE McEAC 34,17 45,28 57,22 29,44 38,33 37,87

2 N McC 33,89 47,36 60,74 10,28 35,28 35,00 5 N McC 37,78 53,89 62,78 11,39 29,72 37,41

2 N McEC 36,11 45,42 60,00 11,67 24,17 26,02 5 N McEC 35,00 47,78 61,48 13,06 28,19 30,93

2 N McEAC 36,39 47,92 60,28 13,89 26,53 26,94 5 N McEAC 35,00 47,22 59,81 13,89 31,11 30,65

2 NO McC 39,17 54,86 59,26 3,89 30,83 34,07 5 NO McC 37,50 49,17 53,80 14,44 33,89 44,35

2 NO McEC 35,83 50,42 57,87 5,83 24,86 26,57 5 NO McEC 36,67 46,39 53,61 15,00 31,53 37,50

2 NO McEAC 35,83 50,69 58,61 8,61 27,50 26,85 5 NO McEAC 35,56 45,97 54,72 15,56 32,64 36,67

2 M McC 37,50 46,94 52,13 4,44 35,83 38,52 5 M McC 34,72 44,86 50,09 22,22 39,61 39,17

2 M McEC 35,56 45,28 52,04 6,11 25,42 26,85 5 M McEC 31,94 42,08 49,91 23,89 32,08 32,50

2 M McEAC 36,39 46,11 50,93 8,06 25,00 27,69 5 M McEAC 31,94 39,31 48,89 25,00 35,00 31,39

Tabla B - 8. Análisis de distancia y dirección en estadísticos de 2º orden (I).

E100 - 256NG Número de clases - JPG Número de clases - PNG E100 - 256NG Número de clases - JPG Número de clases - PNG

Op dis Op D Descr 3 6 9 3 6 9 Op dis Op D Descr 3 6 9 3 6 9

3 E McC 41,67 52,08 57,41 5,00 32,92 39,44 6 E McC 39,17 50,83 54,81 16,39 39,62 45,09

3 E McEC 40,00 50,69 57,69 6,94 29,03 32,50 6 E McEC 35,28 47,78 53,98 15,56 31,94 37,04

3 E McEAC 40,00 50,28 57,41 8,61 29,58 33,43 6 E McEAC 34,72 46,53 52,78 15,28 32,36 36,94

3 NE McC 36,39 50,97 59,17 8,06 32,64 41,85 6 NE McC 36,39 46,81 58,24 26,67 39,31 48,43

3 NE McEC 34,44 49,17 58,61 8,61 30,69 33,33 6 NE McEC 35,00 45,56 57,69 26,67 35,97 40,93

3 NE McEAC 34,17 48,89 58,70 11,11 32,22 33,24 6 NE McEAC 34,72 45,14 57,31 26,39 38,06 40,65

3 N McC 34,72 50,00 61,76 8,06 24,31 30,28 6 N McC 40,28 52,92 62,22 11,39 33,89 39,44

3 N McEC 34,72 46,53 60,93 10,28 26,25 27,22 6 N McEC 38,06 48,19 60,93 14,44 30,14 32,69

3 N McEAC 35,28 45,69 60,46 11,94 27,78 27,96 6 N McEAC 37,22 48,75 60,56 17,50 33,47 33,70

3 NO McC 40,83 53,89 56,30 10,83 29,86 36,48 6 NO McC 36,94 48,47 55,74 18,06 38,47 46,67

3 NO McEC 37,50 50,14 55,56 11,94 28,75 31,39 6 NO McEC 35,83 45,97 55,46 19,17 32,92 39,81

3 NO McEAC 35,00 47,92 55,28 14,17 30,97 31,94 6 NO McEAC 33,89 46,39 57,04 20,56 34,31 39,07

3 M McC 35,83 45,42 51,67 5,00 29,17 36,02 6 M McC 36,11 44,86 51,11 27,22 37,22 44,44

3 M McEC 34,72 44,17 51,30 7,50 26,39 29,44 6 M McEC 32,78 41,94 48,89 26,11 34,44 38,33

3 M McEAC 35,00 42,08 50,19 9,44 28,06 30,19 6 M McEAC 33,06 39,31 47,96 26,94 36,81 37,87

Tabla B - 9. Análisis de distancia y dirección en estadísticos de 2º orden (II).


Escala NG Descr. 3 6 9 12 15 18 21 25

100 256 Hu 57,22 72,50 80,00 83,89 85,72 85,65 84,09 85,80

100 32 Hu 57,50 72,36 80,65 84,24 85,94 85,83 84,09 85,73

50 256 Hu 57,50 71,81 80,56 83,89 85,67 85,51 84,09 85,90

50 32 Hu 57,22 72,50 79,81 83,61 85,94 85,79 84,25 85,83

25 256 Hu 56,67 71,53 80,46 83,75 86,11 86,20 84,48 86,30

25 32 Hu 56,67 71,81 80,19 83,96 86,00 85,88 84,25 85,93

Tabla B - 10. Resultados ofrecidos por momentos de Hu para el banco A.


76

76


Escala NG Descr. 3 6 9 12 15 18 21 25 31 37 43 49 55 61

100 256 Hu 58,06 79,17 76,57 80,56 75,78 79,86 82,18 83,53 85,24 87,25 88,97 90,19 90,92 91,20

100 32 Hu 57,50 79,44 76,48 80,90 76,28 79,91 81,98 83,53 85,51 87,32 89,28 90,54 91,29 91,60

50 256 Hu 58,06 78,19 76,20 80,56 75,72 79,81 81,87 83,33 85,05 87,07 88,84 90,17 90,98 91,22

50 32 Hu 58,06 78,06 77,59 81,94 77,22 80,88 82,58 84,27 85,94 88,02 89,84 90,94 91,65 91,79

25 256 Hu 57,78 78,33 75,93 80,63 75,72 79,91 81,83 83,13 85,11 87,18 88,99 90,19 90,95 91,17

25 32 Hu 57,50 78,61 79,07 82,78 77,89 80,88 82,62 84,57 86,26 88,04 89,84 90,85 91,68 91,89

Tabla B - 11. Resultados ofrecidos por momentos de Hu para el banco B.

Banco A - 81M Número de clases

Escala NG Descr 3 6 9 12 15 18 21 25

100 256 McC 41,39 46,67 56,30 64,93 69,00 70,37 74,88 77,73

100 256 McEC 39,72 47,50 56,94 65,69 69,17 69,72 73,53 77,03

100 256 McEAC 40,83 47,36 56,76 65,69 69,39 70,05 73,69 76,57

100 32 McC 41,11 45,42 55,37 62,15 66,78 67,73 72,14 75,63

100 32 McEC 39,44 46,94 56,3 63,33 67,94 67,87 71,47 74,77

100 32 McEAC 39,72 47,78 58,52 65,42 68,28 69,58 73,02 75,57

50 256 McC 36,39 44,17 52,78 62,71 64,89 66,57 69,52 74,37

50 256 McEC 33,89 43,33 51,02 61,74 63,78 66,39 69,21 73,33

50 256 McEAC 34,17 43,75 52,13 61,88 65,22 66,44 69,80 74,53

50 32 McC 38,33 45,14 54,63 64,72 67,50 69,21 72,10 75,67

50 32 McEC 33,89 42,92 53,06 63,82 67,06 67,96 70,56 74,53

50 32 McEAC 34,44 43,33 52,41 63,26 66,11 67,59 70,24 74,53

25 256 McC 39,17 45,69 55,46 64,79 68,17 69,58 72,46 75,53

25 256 McEC 37,78 44,72 54,72 64,03 67,78 69,21 71,67 75,03

25 256 McEAC 36,11 44,31 55,00 63,68 68,11 69,07 71,39 75,13

25 32 McC 40,00 47,92 57,41 66,53 70,50 70,42 72,78 75,40

25 32 McEC 38,33 46,39 56,02 66,25 69,67 69,12 70,99 74,13

25 32 McEAC 35,56 45,00 54,35 65,07 68,83 69,35 70,95 74,13

Tabla B - 12. Resultados ofrecidos por estadísticos de 2º orden para el banco A.

Tabla B - 13. Resultados ofrecidos por estadísticos de 2º orden para el banco B.

Banco B - 81M Número de clases

Escala NG Descr 3 6 9 12 15 18 21 25 31 37 43 49 55 61

100 256 McC 7,50 22,08 27,04 32,36 35,61 39,49 44,17 53,37 59,49 60,61 63,53 65,71 68,97 71,67

100 256 McEC 6,67 17,64 22,41 31,04 33,72 38,84 43,69 50,37 57,34 58,81 61,69 64,00 66,91 69,84

100 256 McEAC 11,67 20,97 22,96 30,90 33,94 38,84 43,81 50,80 57,66 59,03 61,82 64,22 67,08 70,01

100 32 McC 6,67 22,08 29,07 34,17 35,33 38,61 43,25 51,03 57,72 58,74 64,50 66,50 69,06 71,79

100 32 McEC 10,28 22,22 28,06 34,51 38,33 42,92 47,54 53,83 59,62 60,59 65,19 67,86 70,45 73,02

100 32 McEAC 11,67 23,61 28,61 34,79 38,72 43,15 47,78 54,07 60,05 60,92 65,74 68,32 70,85 73,36

50 256 McC 5,00 28,06 31,11 41,67 44,56 49,63 54,21 58,07 62,34 66,87 69,38 71,09 73,29 75,85

50 256 McEC 5,00 27,22 26,94 37,57 42,22 47,45 52,02 54,93 58,47 63,04 66,61 68,38 70,23 72,24

50 256 McEAC 5,56 33,75 27,41 37,50 42,22 47,41 52,02 55,40 58,79 63,31 66,65 68,49 70,29 72,21

50 32 McC 4,44 29,72 32,87 41,25 44,28 49,12 53,89 57,43 61,75 65,36 68,82 70,31 72,20 74,17

50 32 McEC 5,00 27,08 29,63 37,99 41,61 47,41 51,71 55,50 59,25 63,27 67,83 69,88 71,89 73,11

50 32 McEAC 5,56 28,06 29,44 37,99 41,94 48,06 52,18 55,90 59,65 63,45 68,45 70,49 72,32 73,62

25 256 McC 16,11 45,97 32,87 47,08 50,06 55,32 59,33 63,17 66,02 68,78 70,97 73,91 76,33 78,01

25 256 McEC 16,94 45,42 28,15 41,67 45,33 50,74 54,96 58,60 61,83 65,02 68,33 71,79 74,03 75,72

25 256 McEAC 16,67 44,31 28,89 42,08 45,56 50,79 54,96 58,27 61,69 64,95 68,37 71,82 73,98 75,72

25 32 McC 16,67 37,50 35,28 46,94 50,39 54,49 58,02 61,03 64,25 67,77 71,16 74,12 75,82 77,79

25 32 McEC 16,11 35,56 33,98 46,18 48,06 54,21 57,54 60,30 62,63 65,29 69,21 72,72 74,65 76,15

25 32 McEAC 17,22 45,97 32,50 45,14 47,06 53,47 56,55 59,87 62,04 65,09 69,07 72,31 74,27 75,75


78

78

B.ii Descriptores de Laws


Escala NG Dim 3 6 9 12 15 18 21 25

100 256 3x3 52,22 69,58 78,61 81,32 83,61 84,44 82,62 82,77

100 256 5x5 54,17 74,58 83,15 87,29 89,72 91,02 89,92 91,07

100 32 3x3 51,11 69,72 78,52 81,04 83,44 84,07 82,66 82,73

100 32 5x5 52,5 72,5 81,85 86,11 89 90,37 89,21 90,27

50 256 3x3 54,17 72,50 80,19 82,15 83,56 84,81 83,25 83,27

50 256 5x5 57,78 78,19 85,00 88,75 91,17 92,73 91,75 92,50

50 32 3x3 53,89 72,64 80,00 81,88 83,50 84,77 83,17 83,33

50 32 5x5 57,50 77,78 85,09 88,61 91,56 92,96 91,87 91,90

25 256 3x3 55,83 74,72 82,41 84,79 85,50 84,86 83,33 83,47

25 256 5x5 60,83 80,14 86,76 90,14 92,39 93,61 92,98 93,60

25 32 3x3 55,83 74,31 82,22 84,44 85,22 84,49 82,98 83,30

25 32 5x5 60,83 80,28 86,85 90,00 92,22 93,47 92,62 93,37

Tabla B - 14. Resultados ofrecidos por descriptores de Laws para el banco A.


Escala NG Dim 3 6 9 12 15 18 21 25 31 37 43 49 55 61

100 256 3x3 61,94 79,31 79,72 84,51 80,94 85,09 86,98 89,27 91,29 92,66 93,74 94,13 94,71 95,00

100 256 5x5 63,06 78,61 83,70 86,67 84,33 86,99 88,89 90,77 92,61 93,96 94,75 95,00 95,21 95,36

100 32 3x3 61,11 79,44 79,07 84,72 81,11 85,19 87,14 89,40 91,40 92,86 93,86 94,25 94,83 95,11

100 32 5x5 62,50 76,81 82,31 85,76 81,78 84,58 86,75 89,03 91,16 92,84 93,72 94,35 94,77 94,85

50 256 3x3 60,83 81,67 81,67 86,25 84,83 87,92 88,25 90,30 92,31 93,36 94,32 94,59 94,98 95,45

50 256 5x5 62,22 81,67 85,37 88,61 87,61 89,77 91,11 92,53 94,09 95,18 95,60 95,95 96,08 96,34

50 32 3x3 60,56 80,97 81,76 86,46 85,28 88,19 88,37 90,27 92,34 93,49 94,44 94,63 95,00 95,49

50 32 5x5 66,11 81,53 85,09 88,06 87,11 89,40 90,95 92,20 93,79 94,66 95,06 95,65 95,86 95,93

25 256 3x3 61,11 83,19 82,78 86,67 85,56 88,01 88,49 90,40 92,23 93,63 94,57 95,07 95,41 95,83

25 256 5x5 62,22 79,72 84,54 88,54 88,11 90,46 91,87 93,17 94,49 95,45 96,12 96,63 96,82 97,08

25 32 3x3 60,56 83,06 83,06 87,29 86,33 88,43 88,73 90,53 92,45 93,83 94,67 95,10 95,45 95,82

25 32 5x5 63,06 81,11 85,19 88,89 88,33 90,23 91,71 93,27 94,60 95,47 96,05 96,55 96,76 96,60

Tabla B - 15. Resultados ofrecidos por descriptores de Laws para el banco B.

B.iii LBP


Escala NG Modo 3 6 9 12 15 18 21 25

100 256 LBP 47,22 67,36 64,81 69,65 67,83 69,86 72,10 74,60

100 256 U-LBP 46,39 66,81 65,83 71,67 70,94 72,59 74,72 77,13

100 32 LBP 41,67 57,22 57,31 63,82 62,39 62,08 65,16 68,37

100 32 U-LBP 43,33 59,86 59,44 65,49 63,17 63,84 67,14 70,17

50 256 LBP 35,56 59,58 61,11 63,19 65,83 66,85 68,06 73,23

50 256 U-LBP 37,78 59,31 63,70 65,28 68,17 67,96 69,48 74,13

50 32 LBP 36,94 59,17 60,83 63,68 66,22 66,90 67,90 73,00

50 32 U-LBP 38,61 59,58 63,70 65,21 67,94 67,59 69,40 74,07

25 256 LBP 34,72 58,61 59,54 64,86 68,11 67,55 68,89 73,53

25 256 U-LBP 31,39 57,92 61,76 68,40 70,94 72,27 73,10 77,30

25 32 LBP 35,56 58,89 58,98 64,58 67,67 67,31 68,97 73,27

25 32 U-LBP 33,61 59,17 62,13 68,13 70,44 71,85 72,62 76,90

Tabla B - 16. Resultados ofrecidos por LBP para el banco A.


Escala NG Modo 3 6 9 12 15 18 21 25 31 37 43 49 55 61

100 256 LBP 15,28 23,89 19,81 26,88 25,39 26,81 28,65 34,30 41,21 40,83 38,41 40,77 41,91 44,29

100 256 U-LBP 15,56 24,44 21,02 29,79 27,11 28,06 30,36 36,10 44,03 42,70 40,12 42,79 43,65 45,82

100 32 LBP 10,83 18,89 20,65 30,56 31,50 34,21 34,92 39,57 45,30 47,52 46,18 47,89 48,85 51,15

100 32 U-LBP 8,89 17,36 19,91 30,90 30,78 34,95 36,67 41,13 47,28 49,35 47,87 49,52 50,73 52,98

50 256 LBP 2,50 21,39 21,11 29,38 29,39 31,81 31,98 36,70 41,61 40,47 39,15 40,44 41,83 43,95

50 256 U-LBP 5,83 20,42 22,22 30,21 31,22 33,94 34,88 39,97 44,81 42,79 41,74 44,05 45,44 47,75

50 32 LBP 1,67 16,11 22,04 29,72 31,06 34,77 35,52 40,50 43,44 45,74 43,82 44,29 45,85 47,90

50 32 U-LBP 1,11 19,17 28,43 35,56 37,50 40,09 40,91 45,73 48,60 49,46 47,89 49,39 50,65 52,91

25 256 LBP 6,67 26,39 24,17 30,42 34,22 35,51 37,54 40,97 48,74 47,84 45,97 48,71 49,73 51,39

25 256 U-LBP 8,61 27,36 27,31 36,46 41,94 44,40 46,07 48,63 55,51 54,50 52,44 55,75 56,76 58,65

25 32 LBP 4,44 22,08 27,96 35,28 36,11 39,26 41,98 47,17 50,51 50,59 49,46 52,23 54,18 55,75

25 32 U-LBP 6,11 22,92 28,06 40,49 43,44 46,71 48,81 53,80 57,31 57,70 56,61 59,85 62,17 63,70

Tabla B - 17. Resultados ofrecidos por LBP para el banco B.


80

80

B.iv Métodos basados en gradiente


Escala NG Descr Op Umbral 3 6 9 12 15 18 21 25

100 256 PPC Robert 1.75m 28,06 57,36 69,81 77,78 82,00 84,91 86,07 88,73

100 256 PPC Prewitt 1.75m 23,89 55,56 66,11 72,01 79,00 82,55 82,78 85,57

100 256 PPC Sobel 1.75m 21,94 55,28 66,30 72,99 79,56 82,82 83,41 86,00

100 256 Hist Robert 0 36,67 54,17 63,43 71,04 71,28 70,60 73,73 77,07

100 256 HisPpc Robert 1.75m 41,94 62,36 67,22 74,86 76,61 77,18 78,65 81,73

100 256 Hist Prewitt 0 28,33 44,44 53,15 60,00 61,83 62,08 66,79 71,60

100 256 HisPpc Prewitt 1.75m 37,50 53,47 61,02 68,40 71,17 71,76 74,48 77,90

100 256 Hist Sobel 0 28,61 44,31 53,06 60,00 61,56 62,18 67,30 71,77

100 256 HisPpc Sobel 1.75m 37,78 53,75 62,13 68,82 70,72 71,85 74,21 77,93

100 256 hog9 Robert 0 48,33 69,86 70,46 77,43 81,56 84,35 85,99 88,60

100 256 hog9 Robert 1.75m 46,94 69,31 68,70 74,44 78,17 80,69 83,17 85,87

100 256 hog9 Prewitt 0 40,00 67,22 67,31 76,88 80,11 83,84 86,31 88,87

100 256 hog9 Prewitt 1.75m 43,33 69,03 69,26 76,39 80,00 81,62 84,56 88,03

100 256 hog9 Sobel 0 41,39 67,08 67,87 77,08 80,39 84,26 86,59 89,07

100 256 hog9 Sobel 1.75m 43,61 70,00 69,54 77,22 80,61 82,18 85,24 88,50

100 256 hog18 Robert 0 46,11 68,75 69,81 76,04 79,44 81,94 83,73 86,50

100 256 hog18 Robert 1.75m 44,72 67,22 67,87 74,24 77,11 79,86 81,75 84,33

100 256 hog18 Prewitt 0 42,22 67,92 67,69 76,11 79,67 83,84 86,27 89,20

100 256 hog18 Prewitt 1.75m 44,72 69,72 69,54 76,53 79,89 81,76 84,44 87,40

100 256 hog18 Sobel 0 41,94 66,81 67,22 76,53 79,94 83,66 86,11 88,93

100 256 hog18 Sobel 1.75m 45,56 70,56 69,44 76,18 79,89 81,76 84,80 87,80

100 256 hog36 Robert 0 47,50 68,75 69,35 75,69 78,56 80,69 82,42 86,07

100 256 hog36 Robert 1.75m 44,44 65,56 66,20 72,43 76,00 78,52 80,48 82,93

100 256 hog36 Prewitt 0 41,39 67,92 67,96 76,39 79,72 83,84 86,27 88,63

100 256 hog36 Prewitt 1.75m 45,28 70,14 69,81 76,39 79,78 81,06 84,01 87,13

100 256 hog36 Sobel 0 41,94 67,22 68,24 76,46 80,11 84,03 86,43 88,97

100 256 hog36 Sobel 1.75m 45,56 70,14 70,09 77,15 80,28 81,53 84,17 87,37

Tabla B - 18. Resultados ofrecidos por métodos basados en gradiente para banco A (I).



100 32 PPC Robert 1.75m 29,17 58,89 71,20 78,06 83,00 85,97 86,98 89,73

100 32 PPC Prewitt 1.75m 23,33 55,56 65,65 72,08 79,17 82,45 83,17 86,33

100 32 PPC Sobel 1.75m 23,61 55,97 66,76 72,64 79,17 82,50 83,41 86,50

100 32 Hist Robert 0 36,94 54,58 63,33 70,69 71,00 70,42 73,41 76,90

100 32 HisPpc Robert 1.75m 42,78 63,06 68,15 75,69 76,50 76,90 78,45 81,70

100 32 Hist Prewitt 0 28,33 44,72 53,33 60,83 62,00 62,22 66,83 71,50

100 32 HisPpc Prewitt 1.75m 37,22 53,06 61,02 68,54 71,28 71,94 74,40 78,07

100 32 Hist Sobel 0 28,89 45,14 53,43 59,93 61,89 62,41 67,34 72,07

100 32 HisPpc Sobel 1.75m 37,22 52,92 62,41 68,75 70,83 71,90 74,29 77,83

100 32 hog9 Robert 0 48,33 70,14 70,09 76,81 81,06 84,03 85,83 88,60

100 32 hog9 Robert 1.75m 46,67 68,75 68,33 74,51 78,28 80,83 82,94 85,50

100 32 hog9 Prewitt 0 40,00 67,92 67,78 76,53 80,06 84,07 86,51 89,10

100 32 hog9 Prewitt 1.75m 43,06 68,61 69,44 76,74 80,00 81,62 84,52 88,10

100 32 hog9 Sobel 0 41,39 67,36 68,24 76,94 80,22 84,17 86,51 89,10

100 32 hog9 Sobel 1.75m 43,89 70,14 69,26 77,29 80,61 82,04 85,12 88,73

100 32 hog18 Robert 0 45,56 69,03 69,81 76,18 79,33 81,53 83,41 86,37

100 32 hog18 Robert 1.75m 45,00 67,64 67,87 74,51 77,44 79,68 81,71 84,23

100 32 hog18 Prewitt 0 41,11 68,19 68,06 76,81 80,11 84,03 86,39 89,20

100 32 hog18 Prewitt 1.75m 44,72 70,00 70,09 76,32 79,83 81,85 84,44 87,33

100 32 hog18 Sobel 0 41,11 66,53 67,59 76,81 80,17 84,26 86,55 89,20

100 32 hog18 Sobel 1.75m 44,44 70,42 69,44 76,46 79,94 81,85 84,60 87,77

100 32 hog36 Robert 0 46,67 67,64 68,70 74,79 77,67 80,19 81,94 85,67

100 32 hog36 Robert 1.75m 44,17 65,00 66,39 72,71 75,72 78,38 80,36 83,07

100 32 hog36 Prewitt 0 41,67 68,19 68,52 76,74 80,28 84,03 86,43 88,90

100 32 hog36 Prewitt 1.75m 44,72 70,14 70,46 76,60 80,28 81,25 84,13 87,30

100 32 hog36 Sobel 0 41,94 66,94 67,87 76,32 80,00 84,03 86,31 88,80

100 32 hog36 Sobel 1.75m 44,44 70,28 70,46 77,36 80,56 81,94 84,68 87,90

Tabla B - 19. Resultados ofrecidos por métodos basados en gradiente para banco A (II).


82

82



50 256 PPC Robert 1.75m 29,44 58,89 69,81 76,74 81,94 84,49 86,98 89,53

50 256 PPC Prewitt 1.75m 22,78 59,72 70,56 76,53 82,56 84,58 86,59 88,83

50 256 PPC Sobel 1.75m 20,83 57,78 69,72 75,28 81,17 84,07 85,75 88,53

50 256 Hist Robert 0 26,39 45,56 58,15 63,82 64,50 62,73 65,87 70,90

50 256 HisPpc Robert 1.75m 35,83 52,64 62,96 69,51 75,17 74,95 75,36 78,83

50 256 Hist Prewitt 0 28,61 42,08 48,89 54,44 57,17 56,34 61,94 66,70

50 256 HisPpc Prewitt 1.75m 36,94 48,75 54,44 63,06 67,06 68,52 71,39 75,27

50 256 Hist Sobel 0 27,50 43,06 49,81 54,51 57,22 56,20 61,67 66,57

50 256 HisPpc Sobel 1.75m 35,83 47,50 53,70 62,71 66,28 66,90 70,24 74,83

50 256 hog9 Robert 0 38,06 68,33 72,69 77,78 83,28 85,32 85,63 88,87

50 256 hog9 Robert 1.75m 40,56 69,72 70,83 75,83 80,44 81,99 82,86 85,87

50 256 hog9 Prewitt 0 37,50 67,22 69,63 76,53 80,06 83,33 85,56 88,00

50 256 hog9 Prewitt 1.75m 42,78 69,86 72,22 78,40 81,33 82,87 85,12 88,00

50 256 hog9 Sobel 0 36,39 66,81 69,72 77,22 80,67 83,66 85,83 88,13

50 256 hog9 Sobel 1.75m 43,06 69,86 70,83 77,85 81,00 82,50 85,16 88,20

50 256 hog18 Robert 0 35,83 67,08 71,85 76,46 81,00 83,24 84,25 87,30

50 256 hog18 Robert 1.75m 41,11 68,47 69,81 75,69 79,67 80,60 81,23 83,73

50 256 hog18 Prewitt 0 39,17 66,53 69,63 76,60 78,94 82,27 84,44 87,53

50 256 hog18 Prewitt 1.75m 45,83 67,92 70,56 78,13 80,78 82,13 84,37 87,10

50 256 hog18 Sobel 0 38,89 67,22 70,00 77,78 80,11 83,38 85,44 87,93

50 256 hog18 Sobel 1.75m 43,33 67,22 71,11 77,64 80,17 81,76 84,48 87,33

50 256 hog36 Robert 0 36,11 65,00 70,93 76,53 80,56 82,64 83,81 87,30

50 256 hog36 Robert 1.75m 37,78 65,83 68,98 75,00 78,61 79,58 80,71 82,90

50 256 hog36 Prewitt 0 40,00 67,64 69,63 77,08 79,39 82,41 84,64 87,77

50 256 hog36 Prewitt 1.75m 44,44 67,50 70,93 77,15 79,94 81,48 83,69 86,70

50 256 hog36 Sobel 0 37,78 66,53 69,26 77,36 79,61 82,64 84,96 87,80

50 256 hog36 Sobel 1.75m 43,89 67,78 71,94 77,85 79,39 81,02 83,61 86,83

Tabla B - 20. Resultados ofrecidos por métodos basados en gradiente para banco A (III).



50 32 PPC Robert 1.75m 29,44 60,97 70,65 77,85 83,28 85,32 87,82 89,97

50 32 PPC Prewitt 1.75m 23,89 60,14 70,93 77,08 83,22 85,46 87,46 89,57

50 32 PPC Sobel 1.75m 20,56 58,19 68,33 74,31 79,78 82,87 84,92 88,23

50 32 Hist Robert 0 26,11 45,56 58,06 63,75 63,89 62,04 65,56 70,63

50 32 HisPpc Robert 1.75m 34,17 52,08 62,50 68,96 75,22 74,77 75,28 78,83

50 32 Hist Prewitt 0 28,89 43,06 48,98 54,17 57,06 56,02 61,63 66,83

50 32 HisPpc Prewitt 1.75m 36,94 48,89 54,63 63,54 67,44 68,61 71,59 75,50

50 32 Hist Sobel 0 27,50 43,19 48,98 53,96 56,78 55,56 61,19 66,57

50 32 HisPpc Sobel 1.75m 35,83 46,94 53,61 62,29 66,00 66,57 70,00 74,93

50 32 hog9 Robert 0 39,17 67,50 72,87 77,22 82,78 85,28 85,60 88,73

50 32 hog9 Robert 1.75m 43,33 70,00 70,56 75,90 80,67 81,81 82,66 85,47

50 32 hog9 Prewitt 0 38,06 68,19 70,00 77,15 80,56 83,33 85,63 88,17

50 32 hog9 Prewitt 1.75m 42,50 69,72 72,41 79,10 81,72 83,15 85,20 88,27

50 32 hog9 Sobel 0 36,67 66,53 70,09 77,57 80,94 83,80 85,91 88,20

50 32 hog9 Sobel 1.75m 42,50 69,58 71,02 78,13 81,06 82,55 85,20 88,20

50 32 hog18 Robert 0 36,11 67,22 72,04 77,36 81,61 83,75 84,60 87,47

50 32 hog18 Robert 1.75m 41,94 69,86 70,00 75,90 80,00 80,46 81,35 83,63

50 32 hog18 Prewitt 0 39,44 67,22 69,72 76,88 79,22 82,45 84,76 87,63

50 32 hog18 Prewitt 1.75m 45,83 67,92 71,11 77,64 80,00 81,90 84,40 86,90

50 32 hog18 Sobel 0 38,33 66,81 69,81 78,13 80,28 83,52 85,44 87,73

50 32 hog18 Sobel 1.75m 42,78 67,22 70,28 77,22 79,50 81,25 83,97 87,00

50 32 hog36 Robert 0 37,50 65,97 70,93 75,56 80,00 82,73 83,73 86,83

50 32 hog36 Robert 1.75m 38,89 68,33 68,98 74,79 78,78 79,31 80,52 82,50

50 32 hog36 Prewitt 0 39,44 67,78 69,72 77,43 79,61 82,45 84,60 87,87

50 32 hog36 Prewitt 1.75m 43,89 67,50 70,93 77,22 79,83 81,71 84,09 87,07

50 32 hog36 Sobel 0 37,50 67,22 70,09 77,99 80,00 83,19 85,36 87,87

50 32 hog36 Sobel 1.75m 44,44 68,61 71,67 77,71 79,78 81,11 83,65 86,53

Tabla B - 21. Resultados ofrecidos por métodos basados en gradiente para banco A (IV).


84

84



25 256 PPC Robert 1.75m 37,22 69,58 79,44 83,61 84,94 87,87 89,72 88,33

25 256 PPC Prewitt 1.75m 38,61 71,25 78,61 83,19 83,94 84,44 86,79 85,97

25 256 PPC Sobel 1.75m 36,94 70,00 78,15 82,85 83,39 84,03 86,03 85,70

25 256 Hist Robert 0 31,67 50,56 59,63 66,94 68,11 68,84 71,23 73,27

25 256 HisPpc Robert 1.75m 38,61 53,47 64,07 71,67 77,11 79,21 80,24 81,60

25 256 Hist Prewitt 0 40,00 49,86 56,30 64,03 64,33 68,47 70,56 73,33

25 256 HisPpc Prewitt 1.75m 44,17 52,36 59,44 68,54 71,44 74,54 77,22 78,37

25 256 Hist Sobel 0 36,11 47,22 53,15 62,08 63,17 66,71 69,33 71,87

25 256 HisPpc Sobel 1.75m 43,33 52,64 60,37 69,03 71,61 74,91 77,46 78,73

25 256 hog9 Robert 0 37,78 66,25 72,22 78,06 82,56 84,12 84,13 86,80

25 256 hog9 Robert 1.75m 43,33 73,47 75,37 78,96 82,83 81,99 83,02 85,30

25 256 hog9 Prewitt 0 42,22 69,86 72,41 79,10 80,50 82,92 84,33 87,50

25 256 hog9 Prewitt 1.75m 45,28 70,14 73,15 78,47 79,72 83,56 84,88 88,10

25 256 hog9 Sobel 0 40,56 69,58 72,96 78,13 80,11 83,29 84,76 88,20

25 256 hog9 Sobel 1.75m 45,56 69,31 73,52 79,65 81,00 84,07 85,36 88,23

25 256 hog18 Robert 0 38,06 65,56 72,31 77,01 81,44 81,99 82,26 85,67

25 256 hog18 Robert 1.75m 42,50 73,06 73,33 76,74 81,00 81,20 81,67 83,70

25 256 hog18 Prewitt 0 43,89 69,58 72,31 78,40 79,72 82,31 83,89 87,53

25 256 hog18 Prewitt 1.75m 44,72 68,06 73,61 80,07 81,22 84,63 85,87 88,50

25 256 hog18 Sobel 0 40,83 68,61 72,59 78,19 79,11 82,36 84,01 87,87

25 256 hog18 Sobel 1.75m 47,22 67,92 73,61 79,58 80,17 83,38 84,84 87,87

25 256 hog36 Robert 0 38,89 64,58 71,76 76,88 80,06 81,67 81,87 84,97

25 256 hog36 Robert 1.75m 42,78 69,72 72,31 75,97 80,00 79,44 79,80 82,63

25 256 hog36 Prewitt 0 42,22 68,47 72,31 78,33 79,78 82,82 84,33 87,57

25 256 hog36 Prewitt 1.75m 45,00 68,75 74,07 79,86 80,56 83,98 85,04 88,03

25 256 hog36 Sobel 0 41,67 68,75 72,50 78,33 79,17 82,04 83,85 87,33

25 256 hog36 Sobel 1.75m 44,44 68,19 72,69 79,38 80,39 83,06 84,64 87,63

Tabla B - 22. Resultados ofrecidos por métodos basados en gradiente para banco A (V).



25 32 PPC Robert 1.75m 38,61 69,72 78,06 83,26 85,56 87,55 89,33 88,23

25 32 PPC Prewitt 1.75m 36,94 72,5 79,63 83,96 84,11 84,95 87,42 87,17

25 32 PPC Sobel 1.75m 35,56 69,58 79,07 83,47 84,72 85,23 87,62 87,03

25 32 Hist Robert 0 31,94 50,69 59,26 65,63 66,94 68,15 71,27 73,73

25 32 HisPpc Robert 1.75m 39,44 53,19 64,35 71,88 77,28 79,35 80,00 81,47

25 32 Hist Prewitt 0 39,44 50,28 56,48 63,96 64,72 68,94 70,48 72,97

25 32 HisPpc Prewitt 1.75m 43,89 52,08 58,70 67,57 70,00 73,06 76,23 78,03

25 32 Hist Sobel 0 35,83 47,92 55,00 62,36 63,44 68,01 70,08 72,60

25 32 HisPpc Sobel 1.75m 45,00 54,03 60,93 69,58 72,11 75,00 77,50 78,67

25 32 hog9 Robert 0 38,33 66,81 72,59 77,78 82,11 83,29 83,65 86,50

25 32 hog9 Robert 1.75m 45,28 74,72 74,44 79,03 82,94 82,64 83,57 85,80

25 32 hog9 Prewitt 0 41,94 70,14 73,33 78,82 80,17 83,15 84,92 88,13

25 32 hog9 Prewitt 1.75m 46,67 70,14 73,89 79,24 80,83 84,21 85,60 88,80

25 32 hog9 Sobel 0 40,00 68,89 72,04 78,06 80,11 83,15 84,64 87,93

25 32 hog9 Sobel 1.75m 44,17 68,47 73,33 79,93 80,83 83,84 85,75 88,67

25 32 hog18 Robert 0 38,89 64,86 71,48 77,29 81,00 81,85 81,87 85,33

25 32 hog18 Robert 1.75m 44,72 72,78 73,89 77,36 80,94 80,88 81,31 83,90

25 32 hog18 Prewitt 0 43,33 69,72 72,31 78,33 79,72 82,27 83,97 87,47

25 32 hog18 Prewitt 1.75m 46,11 69,03 73,43 79,72 80,72 84,21 85,71 88,37

25 32 hog18 Sobel 0 40,83 68,06 72,22 78,06 79,22 82,31 84,01 87,73

25 32 hog18 Sobel 1.75m 46,94 68,06 72,31 79,10 80,39 83,61 84,96 87,93

25 32 hog36 Robert 0 38,33 63,75 70,83 76,46 80,06 80,97 81,71 85,03

25 32 hog36 Robert 1.75m 42,50 71,11 72,78 76,94 80,11 80,37 80,83 83,30

25 32 hog36 Prewitt 0 43,06 69,58 73,24 78,75 79,94 82,69 84,40 87,67

25 32 hog36 Prewitt 1.75m 45,00 67,78 73,15 79,93 80,50 83,33 85,12 88,03

25 32 hog36 Sobel 0 41,94 69,17 72,96 78,96 80,06 83,06 84,40 87,87

25 32 hog36 Sobel 1.75m 45,28 68,89 73,06 78,96 79,94 82,73 84,80 87,80

Tabla B - 23. Resultados ofrecidos por métodos basados en gradiente para banco A (VI).


86

86


Escala NG Descr Op Umbral 3 6 9 12 15 18 21 25 31 37 43 49 55 61

100 256 PPC Robert 1.75m 28,33 51,39 67,31 75,00 75,33 79,63 82,74 85,87 89,35 91,33 92,44 93,55 93,95 94,28

100 256 PPC Prewitt 1.75m 17,50 51,39 69,35 78,06 76,56 78,56 81,55 84,03 86,69 88,72 90,66 92,02 92,74 93,32

100 256 PPC Sobel 1.75m 18,33 51,94 71,48 79,31 77,72 80,14 82,50 84,80 87,96 89,32 90,79 92,47 93,24 93,85

100 256 Hist Robert 0 16,94 35,97 38,98 49,38 50,61 56,81 62,06 66,63 72,26 71,85 72,02 75,05 77,45 78,18

100 256 HisPpc Robert 1.75m 13,06 37,64 37,59 49,86 46,72 52,69 57,74 61,97 67,90 69,28 71,07 74,71 76,41 77,62

100 256 Hist Prewitt 0 13,61 35,97 36,67 46,60 47,06 56,02 60,56 65,00 69,30 68,04 66,67 69,88 72,29 73,73

100 256 HisPpc Prewitt 1.75m 15,56 32,78 36,02 46,67 46,28 54,86 59,33 63,80 69,01 70,74 70,27 72,76 74,64 76,08

100 256 Hist Sobel 0 11,11 36,25 36,85 46,60 46,94 56,11 60,71 64,87 69,22 67,93 66,55 69,95 72,35 73,66

100 256 HisPpc Sobel 1.75m 14,17 32,36 35,56 46,32 45,83 53,75 58,29 62,93 68,58 69,91 69,84 72,62 74,53 75,74

100 256 hog9 Robert 0 11,67 38,75 41,85 53,75 53,22 58,61 60,60 64,10 71,99 72,52 70,14 72,72 74,83 75,23

100 256 hog9 Robert 1.75m 6,94 35,56 37,13 50,35 49,67 53,84 55,20 60,83 66,37 66,62 65,21 67,35 69,80 70,94

100 256 hog9 Prewitt 0 53,89 60,42 60,93 67,43 70,44 73,56 73,97 78,30 82,98 81,82 79,15 81,31 82,53 83,59

100 256 hog9 Prewitt 1.75m 51,11 56,25 54,54 58,61 60,28 64,12 63,33 69,83 75,59 73,54 71,05 74,42 75,26 77,14

100 256 hog9 Sobel 0 50,56 59,31 56,67 64,17 68,22 71,71 72,02 76,90 81,72 81,04 78,88 81,19 82,02 82,83

100 256 hog9 Sobel 1.75m 50,00 57,22 51,39 55,97 57,94 61,90 61,15 68,00 74,11 71,89 69,65 72,96 74,26 76,38

100 256 hog18 Robert 0 11,67 34,44 35,37 48,75 48,17 53,61 55,44 59,13 66,45 66,76 65,29 67,81 70,09 70,52

100 256 hog18 Robert 1.75m 5,83 31,11 30,65 45,00 43,50 48,01 49,25 55,00 61,72 62,39 61,74 63,47 66,21 67,09

100 256 hog18 Prewitt 0 53,06 60,83 60,74 67,36 69,06 72,41 72,58 76,83 81,56 80,09 77,07 78,95 80,15 81,34

100 256 hog18 Prewitt 1.75m 51,94 55,97 54,07 58,54 58,78 62,13 61,15 68,17 74,11 71,76 69,42 72,60 73,80 75,72

100 256 hog18 Sobel 0 51,67 60,42 56,85 64,65 67,89 71,20 70,71 75,67 80,48 79,64 77,00 79,20 80,45 81,50

100 256 hog18 Sobel 1.75m 48,89 56,25 48,98 55,14 57,22 60,88 60,00 66,67 72,58 70,27 68,24 71,29 72,79 74,84

100 256 hog36 Robert 0 11,67 30,14 31,57 43,26 42,72 47,41 49,72 54,00 61,80 61,91 59,83 63,03 65,27 66,02

100 256 hog36 Robert 1.75m 5,83 30,69 31,30 44,79 42,83 47,27 48,45 53,67 60,32 60,14 59,63 61,77 63,79 64,95

100 256 hog36 Prewitt 0 53,06 60,56 58,98 66,04 68,22 71,44 71,47 75,57 80,70 79,12 76,36 78,10 79,52 80,86

100 256 hog36 Prewitt 1.75m 52,22 55,83 53,89 58,06 58,44 61,94 60,83 67,87 73,47 70,77 68,64 71,84 72,89 74,86

100 256 hog36 Sobel 0 51,94 59,72 55,74 63,54 67,06 70,19 69,64 74,53 79,44 78,87 76,26 78,16 79,33 80,52

100 256 hog36 Sobel 1.75m 47,78 55,42 48,89 55,07 56,28 60,23 59,52 66,60 71,96 69,46 67,48 70,66 72,14 74,11

Tabla B - 24. Resultados ofrecidos por métodos basados en gradiente para banco B (I).



100 32 PPC Robert 1.75m 39,44 67,78 73,33 80,35 81,50 84,17 85,99 88,60 90,54 92,41 93,60 94,29 94,73 95,14

100 32 PPC Prewitt 1.75m 20,00 57,36 66,67 75,35 77,17 79,12 81,79 83,83 86,80 88,65 90,21 91,51 92,50 93,09

100 32 PPC Sobel 1.75m 27,78 59,86 70,65 78,96 81,11 82,78 84,68 86,53 88,79 90,36 91,94 93,01 93,65 94,02

100 32 Hist Robert 0 14,17 35,56 38,89 49,86 51,56 57,18 62,58 65,97 71,40 72,45 72,79 75,61 77,03 78,25

100 32 HisPpc Robert 1.75m 13,61 39,03 41,39 52,57 49,33 54,63 58,81 63,10 68,20 71,06 73,60 76,72 78,18 78,84

100 32 Hist Prewitt 0 10,28 33,33 33,98 43,82 44,17 50,93 55,95 60,87 66,53 67,59 65,72 68,67 70,32 71,67

100 32 HisPpc Prewitt 1.75m 14,17 31,25 35,19 45,83 45,11 52,73 57,58 62,30 67,26 68,22 68,16 71,14 72,95 74,21

100 32 Hist Sobel 0 10,83 34,72 35,74 45,14 45,78 52,59 57,46 61,93 67,23 68,49 66,84 69,98 71,55 72,91

100 32 HisPpc Sobel 1.75m 13,61 31,67 35,37 46,11 45,33 53,19 57,90 63,27 68,15 69,03 68,93 71,85 73,85 74,82

100 32 hog9 Robert 0 12,78 31,39 33,98 46,94 47,83 51,02 52,74 57,70 66,37 67,41 64,83 67,67 69,71 71,27

100 32 hog9 Robert 1.75m 7,78 34,58 37,41 53,68 53,00 56,62 57,26 61,07 66,64 67,48 66,10 67,57 70,70 71,31

100 32 hog9 Prewitt 0 53,89 59,72 56,67 62,43 65,89 69,35 70,67 74,63 80,16 79,75 77,60 79,56 80,73 82,24

100 32 hog9 Prewitt 1.75m 52,22 57,22 56,11 60,00 61,28 65,00 64,01 69,93 75,40 73,29 71,09 74,23 75,27 77,14

100 32 hog9 Sobel 0 51,39 57,64 51,57 58,47 63,61 66,94 68,29 72,87 78,60 78,31 75,08 77,26 78,26 79,60

100 32 hog9 Sobel 1.75m 49,72 56,81 51,94 57,01 58,89 62,50 61,59 68,17 74,09 71,98 69,90 73,44 74,61 76,53

100 32 hog18 Robert 0 11,67 27,22 29,26 41,04 41,33 44,72 45,36 50,67 58,74 60,74 59,73 62,35 64,29 64,97

100 32 hog18 Robert 1.75m 6,11 31,81 28,15 45,56 43,33 47,50 48,41 53,67 60,05 60,59 59,90 62,04 65,33 65,71

100 32 hog18 Prewitt 0 52,50 57,78 52,87 59,79 62,78 66,62 67,10 70,70 75,86 74,75 72,34 74,51 75,95 77,68

100 32 hog18 Prewitt 1.75m 51,39 56,53 55,56 60,00 59,94 62,96 61,75 67,53 73,04 70,41 68,64 71,90 73,15 74,92

100 32 hog18 Sobel 0 50,00 54,03 49,54 56,88 61,33 64,63 65,04 68,57 74,38 73,31 70,06 72,74 74,32 76,07

100 32 hog18 Sobel 1.75m 48,89 56,81 49,54 55,49 56,83 60,60 59,68 66,03 71,83 69,32 67,52 70,92 72,42 74,43

100 32 hog36 Robert 0 11,67 30,42 28,24 40,14 37,67 41,48 43,37 48,10 55,19 57,27 56,65 59,17 61,53 61,67

100 32 hog36 Robert 1.75m 6,39 25,00 24,07 39,58 37,72 41,85 43,10 47,37 53,68 54,91 55,47 57,52 60,32 60,37

100 32 hog36 Prewitt 0 50,83 51,25 49,72 56,18 59,06 62,27 63,49 67,13 72,93 72,23 69,34 72,09 73,64 75,64

100 32 hog36 Prewitt 1.75m 51,67 55,14 50,46 55,00 55,72 59,81 58,61 64,60 70,27 68,87 67,33 70,15 71,50 73,83

100 32 hog36 Sobel 0 48,33 46,94 46,30 54,24 59,22 62,41 62,70 66,27 71,83 70,92 67,91 71,02 72,44 74,54

100 32 hog36 Sobel 1.75m 49,17 55,28 47,69 53,26 54,89 58,89 57,82 63,63 69,81 68,36 66,96 69,76 71,09 73,31

Tabla B - 25. Resultados ofrecidos por métodos basados en gradiente para banco B (II).


88

88



50 256 PPC Robert 1.75m 48,06 70,69 78,24 84,24 84,33 86,71 88,53 89,83 90,73 91,73 92,83 93,98 94,74 94,93

50 256 PPC Prewitt 1.75m 48,89 75,28 83,80 87,43 85,39 86,76 87,50 89,47 91,67 92,36 91,38 92,55 93,32 93,69

50 256 PPC Sobel 1.75m 47,22 73,89 83,06 85,97 84,67 84,77 86,23 87,80 88,87 90,09 89,75 91,55 92,71 93,05

50 256 Hist Robert 0 21,67 36,39 37,31 48,96 51,83 57,08 62,82 68,97 72,34 72,48 72,69 75,37 77,29 78,63

50 256 HisPpc Robert 1.75m 22,50 35,28 34,44 47,50 47,61 53,94 57,90 63,53 70,03 72,48 73,78 76,00 77,26 78,95

50 256 Hist Prewitt 0 13,06 30,97 33,52 45,35 45,61 53,43 58,73 64,87 68,87 68,69 67,02 71,11 73,00 74,37

50 256 HisPpc Prewitt 1.75m 13,61 29,86 30,56 43,26 45,78 53,70 59,17 63,63 69,25 71,28 70,31 73,28 75,06 77,46

50 256 Hist Sobel 0 13,06 30,42 32,69 45,21 46,39 53,84 60,28 65,73 69,70 69,12 67,54 71,46 73,15 74,23

50 256 HisPpc Sobel 1.75m 12,78 29,58 30,00 43,75 46,61 54,77 60,12 64,07 69,70 71,60 70,62 73,20 74,97 77,27

50 256 hog9 Robert 0 27,22 50,69 51,67 59,10 60,78 65,23 67,98 71,97 76,69 76,08 72,36 74,63 76,91 77,66

50 256 hog9 Robert 1.75m 23,61 45,28 48,52 57,50 57,89 63,01 65,56 71,40 75,65 73,85 72,38 73,62 74,41 74,88

50 256 hog9 Prewitt 0 40,00 61,67 62,31 68,40 68,39 70,56 71,07 75,37 80,46 79,17 75,02 78,01 78,91 79,97

50 256 hog9 Prewitt 1.75m 46,11 56,53 58,15 65,35 66,17 68,66 70,91 75,10 79,38 77,61 73,51 75,92 77,03 77,86

50 256 hog9 Sobel 0 44,44 60,56 60,74 68,13 68,44 72,31 73,73 77,30 81,80 80,43 76,74 79,57 80,26 81,22

50 256 hog9 Sobel 1.75m 44,17 53,33 53,98 62,15 63,56 67,73 68,93 73,93 78,58 76,67 73,22 75,70 76,86 78,14

50 256 hog18 Robert 0 23,33 46,53 45,93 54,31 53,39 58,47 61,79 66,17 71,91 70,86 67,98 70,58 73,15 73,81

50 256 hog18 Robert 1.75m 21,11 44,03 45,46 54,86 54,22 58,89 60,20 66,57 71,45 70,25 68,88 70,68 71,50 72,20

50 256 hog18 Prewitt 0 39,17 59,44 60,46 66,67 66,50 68,06 68,81 72,93 77,69 76,17 72,42 75,65 76,89 78,52

50 256 hog18 Prewitt 1.75m 36,94 56,53 58,24 65,35 64,28 66,44 67,22 72,40 76,59 75,20 71,32 73,42 74,35 75,41

50 256 hog18 Sobel 0 41,67 59,31 58,61 66,46 67,39 70,65 71,19 75,60 79,87 78,45 74,84 77,72 78,70 79,71

50 256 hog18 Sobel 1.75m 43,89 52,92 51,94 61,25 63,11 66,71 66,63 71,77 76,75 74,89 71,36 73,50 74,76 76,28

50 256 hog36 Robert 0 21,67 41,67 42,13 50,83 49,78 54,07 57,14 61,53 67,20 66,42 64,21 66,85 69,08 70,01

50 256 hog36 Robert 1.75m 20,00 44,72 46,48 55,76 54,39 59,17 59,92 65,17 69,46 68,15 67,29 68,95 69,89 70,19

50 256 hog36 Prewitt 0 37,50 59,03 57,41 63,82 64,06 65,97 66,71 70,37 75,81 74,77 71,03 74,12 75,39 77,04

50 256 hog36 Prewitt 1.75m 33,61 56,53 55,93 63,19 63,06 65,46 66,39 70,73 75,30 73,99 70,17 72,04 72,68 74,43

50 256 hog36 Sobel 0 45,00 58,61 57,22 65,28 66,33 68,89 69,40 73,33 77,96 77,18 73,49 76,28 76,97 78,20

50 256 hog36 Sobel 1.75m 43,33 53,33 50,83 60,69 61,72 65,23 65,16 70,57 75,38 74,05 70,99 73,30 74,32 75,68

Tabla B - 26. Resultados ofrecidos por métodos basados en gradiente para banco B (III).



50 32 PPC Robert 1.75m 55,83 65,69 75,00 80,42 82,72 85,28 87,54 88,83 90,22 91,89 93,26 94,22 94,65 94,96

50 32 PPC Prewitt 1.75m 53,61 73,06 77,04 80,90 81,22 84,07 85,60 87,83 90,03 90,77 90,27 91,60 92,79 93,28

50 32 PPC Sobel 1.75m 55,00 76,25 79,54 83,75 83,00 84,12 85,91 88,23 91,02 91,73 91,36 92,82 93,64 93,92

50 32 Hist Robert 0 21,67 36,81 40,65 51,53 53,94 59,17 63,69 69,43 72,07 72,95 73,33 76,09 77,50 78,57

50 32 HisPpc Robert 1.75m 23,33 36,25 39,17 52,15 50,06 55,56 59,56 65,67 70,40 72,64 74,42 76,39 77,47 79,13

50 32 Hist Prewitt 0 11,11 27,78 35,56 46,81 48,11 54,17 60,24 64,77 68,28 70,25 68,16 71,36 72,65 73,99

50 32 HisPpc Prewitt 1.75m 13,61 30,28 32,13 45,42 46,94 53,98 58,61 64,47 69,44 70,99 70,04 72,65 74,48 76,57

50 32 Hist Sobel 0 12,78 29,31 36,57 47,50 49,22 55,19 61,55 65,63 69,30 70,99 68,97 72,16 73,50 74,56

50 32 HisPpc Sobel 1.75m 12,78 30,69 32,31 45,90 48,11 54,91 59,88 65,37 70,19 71,15 70,16 72,60 74,48 76,49

50 32 hog9 Robert 0 20,28 40,69 48,80 55,56 56,50 59,77 62,26 67,93 74,54 74,46 71,32 73,35 75,32 76,24

50 32 hog9 Robert 1.75m 28,06 39,58 46,57 59,17 60,83 63,98 64,92 71,10 75,65 75,43 73,74 75,14 76,64 76,98

50 32 hog9 Prewitt 0 39,17 57,92 55,09 62,43 64,22 67,13 68,89 72,90 78,63 77,61 73,43 76,00 77,53 78,87

50 32 hog9 Prewitt 1.75m 39,17 57,08 53,80 61,74 63,22 65,97 68,41 73,60 78,68 77,39 74,15 76,04 77,24 78,36

50 32 hog9 Sobel 0 36,67 50,14 53,06 60,28 62,44 66,67 68,93 72,50 78,09 77,50 73,53 76,45 77,33 78,44

50 32 hog9 Sobel 1.75m 45,28 49,31 49,81 58,68 60,00 64,31 66,19 72,63 78,04 76,33 73,20 75,48 76,73 77,81

50 32 hog18 Robert 0 10,28 34,72 41,20 49,86 49,28 50,97 52,86 59,67 66,42 66,06 64,77 67,30 69,62 70,03

50 32 hog18 Robert 1.75m 22,78 36,67 43,06 56,74 54,94 58,24 59,09 64,83 70,51 69,68 68,47 70,44 72,11 72,31

50 32 hog18 Prewitt 0 36,67 50,83 51,02 58,33 61,17 62,08 62,98 66,53 73,47 72,55 68,47 71,58 73,44 74,96

50 32 hog18 Prewitt 1.75m 37,50 55,28 54,17 61,32 62,61 64,91 66,71 71,40 75,99 75,02 71,61 73,50 74,41 75,63

50 32 hog18 Sobel 0 33,33 48,33 49,26 57,29 61,44 63,80 64,64 68,13 74,35 73,67 69,50 72,67 74,03 75,29

50 32 hog18 Sobel 1.75m 42,22 46,67 47,13 58,47 59,94 63,89 64,76 70,60 75,83 74,46 71,43 73,38 74,64 75,83

50 32 hog36 Robert 0 9,72 32,08 37,87 48,13 45,94 48,29 51,07 57,40 64,14 63,76 62,66 65,15 66,86 67,24

50 32 hog36 Robert 1.75m 26,11 39,31 44,63 52,22 50,17 52,64 53,41 58,60 63,58 64,30 64,26 66,46 67,95 67,75

50 32 hog36 Prewitt 0 33,06 48,75 48,52 55,56 58,28 60,09 60,28 64,03 71,02 71,13 67,02 70,48 72,23 73,54

50 32 hog36 Prewitt 1.75m 35,28 49,86 49,35 57,92 58,67 60,83 63,02 67,67 72,72 72,39 68,88 70,99 71,79 73,58

50 32 hog36 Sobel 0 28,61 45,42 47,96 56,18 59,56 62,08 62,18 65,50 72,26 71,73 67,66 70,73 72,15 73,13

50 32 hog36 Sobel 1.75m 40,56 44,44 45,56 55,90 58,39 62,45 62,74 68,23 73,95 73,45 70,29 72,84 73,89 74,96

Tabla B - 27. Resultados ofrecidos por métodos basados en gradiente para banco B (IV).


90

90



25 256 PPC Robert 1.75m 64,44 69,17 72,50 79,65 83,11 86,25 87,58 89,77 91,67 92,91 91,28 92,35 93,17 93,40

25 256 PPC Prewitt 1.75m 67,78 83,06 82,41 86,32 87,39 89,12 90,67 91,90 92,85 93,92 93,90 94,51 95,21 95,07

25 256 PPC Sobel 1.75m 63,33 79,58 83,98 88,47 87,17 88,52 89,72 91,13 92,53 93,67 93,95 94,63 95,42 95,33

25 256 Hist Robert 0 34,72 38,89 39,81 50,69 52,61 57,96 60,32 65,23 69,78 71,31 73,35 76,04 77,00 77,98

25 256 HisPpc Robert 1.75m 35,00 38,47 38,80 50,83 54,78 60,37 63,13 68,40 74,03 77,05 78,51 80,53 81,77 83,51

25 256 Hist Prewitt 0 10,00 35,69 39,35 45,97 47,39 52,87 56,55 61,13 67,74 68,81 67,19 70,75 72,14 73,51

25 256 HisPpc Prewitt 1.75m 8,89 32,08 41,39 48,96 49,11 54,95 60,24 63,80 70,43 71,96 70,62 72,96 74,58 76,68

25 256 Hist Sobel 0 9,72 30,14 36,20 44,17 45,33 51,02 55,16 60,27 66,77 67,25 65,95 69,46 70,94 71,76

25 256 HisPpc Sobel 1.75m 6,67 27,92 38,70 47,64 48,11 54,07 60,00 63,90 70,73 72,43 71,07 73,30 75,02 76,68

25 256 hog9 Robert 0 30,83 47,78 56,48 65,76 68,28 69,17 69,29 71,47 76,77 76,53 75,37 77,19 78,59 79,18

25 256 hog9 Robert 1.75m 38,33 54,72 61,30 70,69 73,89 76,90 76,43 79,73 82,18 80,47 81,71 82,94 83,58 83,59

25 256 hog9 Prewitt 0 43,61 55,28 60,74 67,36 69,17 69,63 70,08 73,23 78,15 76,98 74,28 77,11 78,18 78,52

25 256 hog9 Prewitt 1.75m 36,94 59,44 60,00 67,99 71,61 73,33 74,56 76,73 81,21 79,71 78,04 79,46 80,33 80,57

25 256 hog9 Sobel 0 41,11 56,25 61,94 68,82 70,22 70,88 70,99 73,70 79,11 77,34 73,95 76,89 77,92 78,55

25 256 hog9 Sobel 1.75m 37,78 59,86 60,09 67,71 71,89 73,61 74,25 77,93 82,34 80,11 77,91 79,93 80,71 80,86

25 256 hog18 Robert 0 30,00 45,28 47,31 57,85 59,78 61,30 61,94 65,47 71,16 71,89 71,10 73,84 75,77 76,27

25 256 hog18 Robert 1.75m 35,28 54,17 62,31 69,72 71,94 73,29 73,13 76,43 79,73 78,33 79,15 80,61 81,38 80,89

25 256 hog18 Prewitt 0 42,22 55,83 58,98 65,69 66,56 66,34 66,43 70,00 75,59 74,44 72,00 75,03 76,27 76,57

25 256 hog18 Prewitt 1.75m 34,72 56,25 58,89 67,29 70,06 71,06 72,58 75,33 79,92 78,13 75,97 78,11 78,97 79,32

25 256 hog18 Sobel 0 39,17 56,11 58,80 66,88 68,72 68,43 69,21 71,17 76,64 74,59 71,45 74,66 75,88 76,60

25 256 hog18 Sobel 1.75m 33,33 56,53 59,17 66,04 69,33 70,88 72,14 76,10 80,89 78,76 76,30 78,59 79,39 79,55

25 256 hog36 Robert 0 30,56 42,36 43,61 55,14 56,72 58,66 59,33 62,43 68,41 68,94 68,41 70,95 72,52 73,17

25 256 hog36 Robert 1.75m 40,28 56,11 56,94 65,83 68,94 71,62 71,15 74,23 77,80 77,07 77,48 78,72 79,68 79,92

25 256 hog36 Prewitt 0 41,67 55,00 56,02 62,43 63,61 64,68 65,28 68,20 74,27 73,49 70,43 73,52 74,55 75,20

25 256 hog36 Prewitt 1.75m 36,94 56,25 57,31 66,60 70,00 71,34 72,86 75,37 79,33 77,79 75,27 77,35 77,92 78,39

25 256 hog36 Sobel 0 39,17 55,97 55,46 63,61 65,11 65,65 65,99 69,10 75,13 73,29 70,21 73,59 74,79 75,45

25 256 hog36 Sobel 1.75m 36,11 56,11 57,41 65,97 69,00 70,69 71,43 75,77 80,48 78,33 76,01 78,11 79,08 79,22

Tabla B - 28. Resultados ofrecidos por métodos basados en gradiente para banco B (V).



25 32 PPC Robert 1.75m 59,17 62,08 72,78 79,79 83,33 86,9 88,13 90,17 91,61 92,79 92,21 93,45 94,14 94,67

25 32 PPC Prewitt 1.75m 66,11 70,83 75,09 80,35 83,11 86,44 88,81 90,27 91,45 92,82 93,14 94,01 94,76 94,93

25 32 PPC Sobel 1.75m 65,28 70,14 75,56 82,15 84,17 86,94 87,66 90,07 91,45 93,31 93,82 94,56 94,94 95,34

25 32 Hist Robert 0 33,33 40,14 44,81 55,69 56,11 61,85 65,04 70,73 74,22 75,34 76,63 79,52 80,36 81,12

25 32 HisPpc Robert 1.75m 32,22 37,36 43,80 57,01 57,83 62,13 63,25 68,70 74,22 77,14 78,72 80,48 81,70 82,87

25 32 Hist Prewitt 0 12,22 36,11 41,20 48,19 47,44 53,84 58,65 63,17 67,39 68,87 67,54 71,67 73,26 74,07

25 32 HisPpc Prewitt 1.75m 8,89 32,64 44,26 49,93 50,11 56,16 60,40 66,20 71,53 73,42 72,42 74,69 76,05 78,01

25 32 Hist Sobel 0 11,67 29,44 37,59 46,60 46,06 52,87 58,02 63,13 68,01 68,94 67,69 71,80 73,48 73,85

25 32 HisPpc Sobel 1.75m 8,61 28,19 40,37 47,36 48,78 55,46 60,48 66,17 71,29 73,06 72,19 74,61 76,09 77,81

25 32 hog9 Robert 0 27,78 39,58 46,67 57,36 58,39 59,86 61,98 67,27 73,09 74,05 73,55 75,90 77,48 78,02

25 32 hog9 Robert 1.75m 38,06 51,53 60,00 69,44 71,28 74,12 73,97 77,27 81,53 81,60 82,87 84,56 85,17 85,48

25 32 hog9 Prewitt 0 49,44 57,36 57,31 66,32 66,33 66,11 67,62 69,87 75,78 75,72 72,73 75,49 76,55 77,16

25 32 hog9 Prewitt 1.75m 38,06 55,69 59,17 67,99 70,94 72,78 74,72 76,43 81,32 80,63 78,66 80,27 80,97 81,02

25 32 hog9 Sobel 0 44,72 55,97 56,48 65,07 65,78 66,11 67,34 69,83 76,05 75,43 72,05 75,05 76,36 77,04

25 32 hog9 Sobel 1.75m 38,33 54,44 58,61 67,99 69,89 72,41 74,17 76,50 80,83 79,44 77,69 79,61 80,29 80,41

25 32 hog18 Robert 0 25,00 34,17 42,50 54,03 53,56 55,83 55,60 61,27 66,32 67,23 67,33 70,49 72,41 73,01

25 32 hog18 Robert 1.75m 36,39 44,31 51,76 65,00 64,11 66,06 65,67 70,03 76,16 76,58 77,81 80,09 80,79 80,41

25 32 hog18 Prewitt 0 41,67 50,14 50,93 59,58 60,39 59,72 60,83 64,73 71,40 71,82 69,15 72,35 73,45 74,14

25 32 hog18 Prewitt 1.75m 38,33 54,44 56,57 66,04 68,00 69,63 71,43 74,20 79,46 78,60 76,32 78,23 79,17 79,11

25 32 hog18 Sobel 0 27,50 41,53 45,37 55,14 58,83 58,94 59,13 62,27 68,98 68,74 66,12 69,64 71,47 72,39

25 32 hog18 Sobel 1.75m 37,78 53,33 57,41 65,97 68,50 70,14 71,59 73,53 78,49 77,21 74,83 77,01 77,89 77,83

25 32 hog36 Robert 0 28,33 35,69 42,78 54,58 51,94 55,46 55,32 60,03 64,44 65,36 66,05 69,51 71,47 71,73

25 32 hog36 Robert 1.75m 35,56 42,92 50,74 59,93 60,56 63,06 62,58 66,97 71,51 72,39 73,60 76,00 77,00 77,06

25 32 hog36 Prewitt 0 22,22 36,25 42,87 53,40 56,11 56,02 57,02 60,47 66,91 67,48 65,45 69,22 70,42 71,34

25 32 hog36 Prewitt 1.75m 38,33 47,78 52,69 61,74 63,28 64,91 67,50 69,83 75,65 75,97 73,66 75,71 76,58 76,64

25 32 hog36 Sobel 0 20,00 33,75 40,28 50,35 55,11 56,06 57,30 60,53 67,20 66,91 64,86 68,50 70,26 71,15

25 32 hog36 Sobel 1.75m 37,78 47,36 50,65 60,00 63,78 66,44 68,77 71,33 76,80 75,97 73,82 75,92 76,73 76,76

Tabla B - 29. Resultados ofrecidos por métodos basados en gradiente para banco B (VI).


92

92



100 256 hogI36 Robert 0 47,78 68,89 69,63 75,63 78,50 80,93 82,58 86,20

100 256 hogI36 Robert 1.75m 44,72 66,25 66,85 73,06 75,94 78,47 80,44 83,13

100 256 hogI36 Prewitt 0 41,39 67,78 68,33 76,67 80,06 83,94 86,47 88,80

100 256 hogI36 Prewitt 1.75m 45,00 70,56 70,28 77,22 80,56 81,34 84,21 87,30

100 256 hogI36 Sobel 0 41,67 67,08 68,52 76,94 80,33 84,26 86,63 89,13

100 256 hogI36 Sobel 1.75m 46,11 70,83 70,37 77,22 80,44 81,57 84,37 87,80

Tabla B - 30. Resultados ofrecidos por HOG36 con interpolación angular para banco A.



100 256 hogI36 Robert 0 12,22 35,00 35,93 48,40 47,44 52,45 54,25 58,50 65,89 65,86 64,55 67,23 69,08 69,43

100 256 hogI36 Robert 1.75m 5,83 31,53 30,00 44,24 42,56 46,34 47,86 53,67 60,32 60,25 59,67 61,63 63,65 64,70

100 256 hogI36 Prewitt 0 53,61 60,83 60,56 67,57 69,33 72,59 72,18 76,93 81,53 80,25 77,50 79,40 80,62 81,76

100 256 hogI36 Prewitt 1.75m 51,39 55,14 53,61 57,71 57,94 61,53 60,36 67,57 73,20 70,79 68,80 71,89 73,00 75,07

100 256 hogI36 Sobel 0 51,67 59,86 56,11 64,10 67,61 71,02 70,24 75,47 80,46 79,53 77,03 78,83 79,97 81,01

100 256 hogI36 Sobel 1.75m 49,72 56,11 49,07 55,49 56,61 60,23 59,44 66,40 71,77 69,41 67,50 70,75 72,12 74,21

Tabla B - 31. Resultados ofrecidos por HOG36 con interpolación angular para banco B.

Ta

ANEXO C. MANUAL DE LA GUI

C.i Introducción

La interfaz gráfica de usuario Clasificador de Texturas se ha

desarrollado como un complemento que proporciona resultados

prácticos a la mayor parte de las ideas teóricas expuestas en este

trabajo de fin de grado de una manera cómoda y compacta. Consta,

como se puede observar en la Figura C - 1, donde se muestra una

representación de la pantalla principal de la aplicación, de tres

posibles opciones: en primer lugar se ofrece un conglomerado

general de operaciones básicas de procesamiento de imágenes

tales como la modificación del brillo o del contraste, la detección

de bordes y la adición o el filtrado elemental de ruido; en segundo

lugar, se brinda el cálculo de todos los descriptores comentados en

este proyecto sobre una imagen seleccionada por el usuario, a fin

de comprobar de un vistazo las posibles diferencias o variaciones

entre métodos, así como entre distintas muestras; y, como tercera

y última opción, la funcionalidad principal, un clasificador donde

se permite elegir el número de muestras o de texturas con los que

trabajar, el tipo de descriptor a utilizar, los márgenes de

normalización, la aparición o no de posibles proyecciones, etc., y

que ofrece el PCI como indicador de bondad.

Para el desarrollo de la GUI, al igual que para el resto de las funciones que componen la parte software del

proyecto, se ha utilizado la aplicación MATLAB de MathWorks en su versión R2015a.

C.ii Pantalla de procesamiento básico

En esta pantalla de la GUI, donde se podrá realizar un tratamiento general de las imágenes, se distinguen tres

zonas, tal y como se muestra en la Figura C - 2. Sin embargo, dos de ellas (marcadas en verde y en naranja en

la ilustración) están únicamente destinadas a exhibir la imagen que se quiera analizar y el resultado de las

operaciones realizadas sobre la misma, por lo tanto, la única sección de interés para el usuario es el panel de

control, que contiene los recursos que permiten activar dichas operaciones. No obstante, cabe señalar que la zona

naranja está dividida en seis partes estructuradas en dos filas por tres columnas, de modo que, generalmente, las

imágenes ya tratadas aparecerán en la fila de arriba mientras que, si se muestra algún histograma, se hará en la

de abajo, bajo la imagen a la que haga referencia.

Figura C - 1. Pantalla principal.

Anexo C. Manual de la GUI

94

94

C.ii.i Panel de control

El panel de control incluye líneas discontinuas que

dividen visualmente unas operaciones de otras, tal y

como se puede observar en la Figura C - 3, donde, para

fortalecer este efecto, se han numerado los botones con

distinto color dependiendo de la sección a la que

pertenezcan. Así, las primeras opciones, en rojo, están

orientadas a la modificación de imágenes en masa; en

la segunda sección, numerada en azul, se permite

principalmente cargar una imagen concreta, procesarla

de diversas formas y visualizar el resultado obtenido en

pantalla; y la última, en naranja, contiene una función

aislada que permite generar un modelo RGB

modificable en pantalla. El botón “←” de color

amarillo, sin numerar en la ilustración, no es más que

un botón de retorno que permite volver a la pantalla

inicial de la GUI (Figura C - 1).

A continuación se irán detallando y ejemplificando

todas las opciones. En los sucesivos subapartados se

utilizará la numeración utilizada en la Figura C - 3 para

hacer alusión a las funciones y, por comodidad, se

omitirá la referencia a esta figura de forma reiterada.

C.ii.i.i ① Reducción de resolución

La operación ① permite reducir la resolución de una o varias imágenes seleccionadas. Antes de pulsar el botón,

es necesario introducir el valor de reducción en porcentaje en el cuadro de texto adyacente. Las imágenes

modificadas se almacenarán en una carpeta que, si no existe, se creará en el mismo directorio donde se hayan

seleccionado dichas imágenes, y que se denominará ImgEscaladas_x%, donde en lugar de “x” aparecerá el

porcentaje de reducción.

3. Imágenes tratadas y/o

histogramas.

1. Panel

de

control.

2. Imagen

original a

manipular.

Figura C - 2. Panel de Procesamiento Básico.

Figura C - 3. Panel de Control.

Esta función se ha implementado debido a que en este proyecto la escala de las muestras es un factor que se ha

tenido en cuenta en los experimentos realizados, evaluando el decremento de cómputo y la variación frecuencial

de las características de la imagen frente a la pérdida de información producida por la reducción de píxeles.

C.ii.i.ii ② Modificación del nombre

Al pulsar el botón ② se desplegará el panel que se muestra en la Figura C - 4. En él puede verse un conjunto

de elementos que permitirán modificar el nombre de una2 o varias imágenes, y que puede utilizarse del siguiente

modo:

i. Si se introduce una cadena de caracteres en el cuadro de texto “Nuevo Nombre” pero no se marca

ninguna de las opciones de adición al principio o al final, entonces esa cadena será el nombre principal.

ii. En cambio, si se marca alguna de las dos opciones mencionadas, se mantendrá el nombre original como

principal y la cadena introducida se añadirá al principio y/o al final de éste.

iii. Si se introduce un prefijo o un sufijo (exclusivamente numérico), éstos se añadirán al nombre que haya

resultado de las operaciones anteriores.

iv. Si se activan las casillas de incremento (“++”), entonces el elemento numérico correspondiente

(prefijo, sufijo o ambos) se incrementará en la cantidad introducida en el cuadro de texto “Incremento”

entre una imagen y otra.

v. Mientras sea posible, se mantendrá el número de cifras introducido en el prefijo o en el sufijo, por lo

tanto no es lo mismo poner “1”, “01” o “001”.

vi. Si, tras seleccionar múltiples imágenes, las opciones introducidas por el usuario pudieran ocasionar que

el nombre final no variase para cada imagen, resultando un mismo nombre para todos ellos, no se podrá

continuar con la operación, previa aparición de un mensaje de advertencia.

Algunos ejemplos del resultado proporcionado al marcar distintas opciones en el panel de renombramiento

pueden verse en la Tabla C - 1. Para este TFG se ha decidido reconocer la clase de las diversas muestras

añadiendo un número identificativo al final de su nombre, para lo cual se ha utilizado esta función (algo similar

a la última columna de la tabla de ejemplo).

C.ii.i.iii ③ Cuantizar en masa

La operación ③ permite reducir el número de niveles de intensidad de varias imágenes. Antes de pulsar el botón

es necesario introducir el valor de reducción, comprendido entre 1 y 8 (correspondiéndose ese número a la

potencia a la que hay que elevar dos) en el cuadro adyacente. Las imágenes modificadas se almacenarán en una

carpeta que, si no existe, se creará en el mismo directorio donde se hayan seleccionado dichas imágenes, y que

se denominará ImgCuantizadas_xNG, donde en lugar de “x” aparecerá el número de niveles de gris.

2 Es factible modificar el nombre de una sola imagen pero para ese caso particular sería más rápido y sencillo

utilizar el sistema de archivos del propio sistema operativo. Esta función está pensada para renombrar imágenes

en masa.

Figura C - 4. Panel de opciones para renombrar.


96

96

Esta función se ha implementado debido a que en este proyecto el número de niveles de gris ha sido un factor

que se ha tenido en cuenta en los experimentos realizados, evaluando la calidad de los métodos ante la pérdida

de calidad de las muestras.

C.ii.i.iv ④ Submuestreo

④ despliega el panel de la Figura C - 5, donde se habrá de

introducir tanto el número de submuestras por cada clase que

se quieren conseguir como el tamaño de dichas muestras. Una

vez se inicie la función se deberá escoger una carpeta y

automáticamente se procederá según se vio en el diagrama de

la Figura 2-3. Como consideraciones generales, hay que tener

en cuenta que esta función busca dos elementos específicos de

este proyecto: que el nombre de cada muestra termine con dos

dígitos que indiquen la clase a la que pertenecen, y que la

carpeta seleccionada contenga imágenes jpg (banco A) y png

(banco B), ya que, en caso contrario, se interrumpirá sin ofrecer ningún resultado. Lo mismo ocurrirá si el

tamaño escogido no es consistente.

Las nuevas muestras se almacenarán en una carpeta que, si no existe, se creará en el directorio seleccionado, y

que se denominará ImgSubmuestreadas_x, donde en lugar de “x” aparecerá el número de muestras de cada clase.

Esta función se ha implementado debido a que, en este proyecto, el número inicial de muestras no era

suficientemente grande, tal y como se comentó en el segundo capítulo del TFG.

C.ii.i.v ⑤ Supresión de efectos de iluminación

El botón ⑤ despliega un panel similar al de la Figura C - 5, en el que habrá que seleccionar el tamaño de la

subventana que irá recorriendo cada muestra para, posteriormente, restarle la media de iluminación a cada píxel

de la misma (aunque la forma de la ventana puede variar, tanto en las últimas columnas como en las últimas

filas, para ajustarse al tamaño de la imagen). Las nuevas muestras se almacenarán en una carpeta que, si no

existe, se creará en el directorio seleccionado, y que se denominará ImgPreProc_AxB, donde en lugar de “A” y

“B” aparecerá el tamaño de la subventana elegido.

Esta función se ha implementado para intentar mejorar los resultados obtenidos con los descriptores de Laws.

Imágenes seleccionadas

a.jpg, b.jpg, c.jpg, d.jpg.

Nuevo Nombre Im Im _

Añadir al principio ✘ ✔ ✘

Añadir al final ✘ ✔ ✔

Prefijo 1

Sufijo 01 03 01

++ (Pref) ✘ ✘ ✘

++ (Suf) ✔ ✔ ✘ Incremento 1 5

Resultado

1Im01.jpg, 1Im02.jpg, 1Im03.jpg, 1Im04.jpg.

ImaIm03.jpg, ImbIm08.jpg, ImcIm13.jpg, ImdIm18.jpg.

a_01.jpg, b_01.jpg, c_01.jpg, d_01.jpg.

Tabla C - 1. Ejemplos de renombramiento.

Figura C - 5. Panel de submuestreo.

C.ii.i.vi ⑥ Cargar imagen

Tras pulsar el botón ⑥ se abrirá el sistema de archivos permitiendo elegir una imagen que se utilizará como

muestra modificable sobre la que aplicar las operaciones de la sección azul de la Figura C - 3. La imagen

seleccionada aparecerá siempre como referencia en la zona 2 (verde) de la Figura C - 2, de este modo se podrán

apreciar cómodamente los cambios realizados.

En este TFG se ha trabajado con imágenes de extensión “.png” y “.jpg”. No obstante, también se permiten cargar

los tipos “.tiff” y “.bmp”.

C.ii.i.vii ⑦ Guardar imagen

El botón ⑦ permanecerá inactivo mientras no haya ninguna

imagen que poder salvar. No obstante, si suponemos que ya

hemos cargado una imagen con ⑥, entonces el panel que se

despliega tras presionarlo será como el de la Figura C - 6. Los

nuevos pulsadores que aparecen hacen referencia a la zona

verde y a las distintas partes de la zona naranja de la Figura C -

2, estando disponible sólo aquellas en las que exista algo que

salvar (en este caso concreto únicamente la imagen original

cargada). Antes de presionar sobre estos nuevos botones, será

necesario introducir un nombre para el archivo y seleccionar la

extensión. Las imágenes se almacenarán en la carpeta

ImgGuardadas que se creará en caso de no existir en el directorio actual de trabajo de MATLAB.

Una vez salvada la imagen, si se quiere usar cualquier otra operación oculta bajo el panel, será necesario quitarlo

pulsando ⑧.

C.ii.i.viii ⑧ Limpiar resultados

Si se pulsa el botón ⑧ se eliminarán los parámetros introducidos y los resultados obtenidos, además de cerrarse

los paneles auxiliares que se hayan abierto, retornándose así al panel por defecto con la salvedad de que, si había

una imagen cargada, ésta se mantendrá.

C.ii.i.ix ⑨ Conversión a escala de grises

Si se ha cargado una imagen RGB, ⑨ obtiene la imagen equivalente en escala de grises y calcula el histograma

de la misma. En caso de que la imagen cargada ya esté en escala de grises pero se quiera ver su histograma, un

mensaje de advertencia indicará al usuario que puede hacerlo pulsando sobre ⑫.

C.ii.i.x ⑩ Separación de canales

⑩, si la imagen cargada es RGB, muestra los canales separados en imágenes independientes, así como sus

histogramas correspondientes.

C.ii.i.xi ⑪ LBP

El objetivo de la función ⑪ es calcular la imagen LBP, tanto básica como uniforme, correspondiente a la imagen

cargada, además de sus histogramas. Para ello, si esta última es RGB, es necesario realizar el paso previo de

pasar a escala de grises que, por comodidad, también se mostrará en pantalla. Esta operación puede ser costosa

si las dimensiones de la imagen son considerables.

C.ii.i.xii ⑫ Modificación del brillo

El conjunto ⑫ permite modificar el brillo, no sólo de la imagen cargada, sino también de su transformación a

escala de grises (si es posible), que se muestra junto con su histograma correspondiente. Tras pulsar el botón

podremos cambiar el brillo, bien unidad a unidad, pulsando sobre las flechas a ambos extremos del deslizador,

bien bruscamente, introduciendo el valor en el cuadro de texto y presionando la tecla “Intro” del teclado, o

arrastrando directamente el deslizador.

Figura C - 6. Panel de guardado.


98

98

Se ha saturado la adición o la sustracción de gris al rango [−127, 128], que se ha considerado suficiente para

mostrar adecuadamente las variaciones de brillo.

C.ii.i.xiii ⑬ Modificación del contraste

El grupo ⑬ funciona de un modo similar al ⑫, con la diferencia de que se modifica el contraste en lugar del

brillo. Para ello se ha usado, en cada píxel de la imagen, la curva tonal mencionada en la parte teórica del TFG,

que aparece de nuevo en la siguiente expresión:

𝑛𝐼𝑚 = 255 (1

1 + 𝑒−𝑣𝑎𝑙𝑜𝑟 (𝑖𝑚−127)) , 𝑣𝑎𝑙𝑜𝑟 ∈ [0.007, 0.04]

C.ii.i.xiv ⑭ Cuantización

Para visualizar la disminución de los niveles de gris de la imagen cargada y, si es posible, de su correspondiente

transformación a escala de grises (que se mostrará junto con su histograma), el usuario deberá introducir un valor

comprendido entre uno y ocho en el cuadro de texto del conjunto ⑭ y presionar el botón adyacente.

C.ii.i.xv ⑮ Detección de bordes

Tras pulsar ⑮ se despliega el panel que se muestra en la Figura C - 7, donde se podrá seleccionar uno de los

cuatro operadores correspondientes (acción que rellenará las plantillas Px y Py automáticamente) e incluir un

valor umbral en el cuadro específico. Una vez introducidos todos los parámetros y, tras presionar el botón

“Comenzar”, se mostrará la transformación a escala de grises (si es que ha sido necesario este paso previo),

gradiente y módulo, o laplaciana (dependiendo del operador) y la imagen binaria de contornos obtenida a partir

del umbral.

C.ii.i.xvi ⑯ Añadir Ruido

El conjunto ⑯ permite introducir dos tipos de ruido, de forma independiente, a la imagen cargada: ruido sal y

pimienta, y ruido gaussiano. Antes de pulsar el botón de añadir, será necesario indicar la cantidad a aplicar de

cada uno de ellos, el primero mediante un porcentaje y el segundo mediante un valor de varianza adecuado.

C.ii.i.xvii ⑰ Filtrar Ruido

Al presionar ⑰ se pasará la imagen cargada por una serie de filtros básicos, como son los llamados de la media,

de la mediana, de la moda, del mínimo y del máximo. Esta operación puede resultar costosa si las dimensiones

de la imagen son considerables.

Figura C - 7. Panel auxiliar de detección de bordes.

C.ii.i.xviii ⑱ Test RGB

El botón ⑱ sustituye la imagen cargada por un modelo RGB construido con hexágonos superpuestos, y ofrece

tres deslizadores además de tres cuadros de texto, uno por cada color, que permiten modificar la intensidad

correspondiente, tal y como se muestra en la Figura C - 8.

C.iii Test de descriptores

La finalidad de este panel, como ya se mencionó, es calcular todos los descriptores nombrados en el proyecto

sobre una imagen seleccionada. En la Figura C - 9 puede apreciarse que el funcionamiento es bastante intuitivo:

únicamente hay que cargar una imagen con el botón correspondiente (mostrándose ya directamente su

histograma correspondiente), seleccionar algunos parámetros necesarios (aunque siempre hay alguno por

defecto) mediante los menús desplegables de la izquierda, y pulsar el botón verde para iniciar el cálculo, tras lo

cual aparecerán los resultados y las figuras correspondientes. El botón azul es para resetear el panel, mientras

que el amarillo es para volver a la pantalla principal del programa.

Figura C - 8. Paneles auxiliares para el modelo de color RGB.

Figura C - 9. Panel de testeo de descriptores.


100

100

C.iv Clasificación

Aquí podremos establecer un prototipo para cada clase y tratar de clasificar el resto de las muestras disponibles.

En la Figura C - 10 podemos ver el panel completo, donde se han numerado las distintas secciones.

Como conceptos generales, podemos hablar de los tres botones de mando. Como hasta ahora, el botón amarillo

sirve para volver al panel principal de la GUI. El verde se debe utilizar para iniciar los cálculos una vez que los

argumentos deseados estén seleccionados. Por último, el botón rojo se habilita cuando la ejecución está en

marcha y sirve para cancelarla. El flag de cancelación se evalúa muestra por muestra por lo que, en el peor de

los casos, el tiempo de parada será lo que tarde la caracterización de una muestra, que dependerá a su vez del

método escogido.

Además, existen algunos cuadros de texto (en la gran mayoría de los casos, adyacentes por la derecha a su

elemento correspondiente) cuya función es únicamente informar de cuáles fueron los parámetros utilizados en

ejecuciones anteriores, si es que las hubo. Razón por la cual estos cuadros de texto aparecerán siempre

inhabilitados.

C.iv.i ① Selección de método y directorio

En esta zona podemos seleccionar uno de los cuatro métodos de caracterización estudiados en el panel

desplegable, lo que habilitará o deshabilitará respectivamente los paneles del ③ al ⑧ en función del escogido.

Así mismo, también podremos seleccionar el directorio donde se encuentra el conjunto de muestras con las

características que nos interesen. En este proyecto se ha trabajado con tres escalas distintas (25%, 50% y 100%)

y con dos números distintos de intensidades (32 y 256 niveles de gris), que deben encontrarse en el directorio

correspondiente, en parte creado con las funciones en masa ya mencionadas en la sección anterior. En concreto,

las opciones pasan por las rutas del siguiente esquema:

Donde, las muestras con 256 niveles de gris se encuentran directamente dentro de la carpeta que indica la escala,

mientras que si se quieren las de 32 hay que seguir avanzando.

Figura C - 10. Panel de clasificación.

C.iv.ii ② Panel de progreso

En este subpanel podemos habilitar o deshabilitar las barras de progreso que emergerán en el proceso de cálculo.

Se podrá elegir entre mostrar el progreso clase por clase, muestra por muestra, o, como aparece por defecto,

ambas (si bien tener que sobrescribir continuamente las barras consume cómputo, cuando el número de muestras

y clases es elevado es cómodo conocer el progreso).

C.iv.iii ③ Descriptores estadísticos

Este subpanel se habilitará si el método escogido en ① es el estadístico. En primer lugar deberemos seleccionar

el orden de estadísticos, con lo que se ocultarán o mostrarán los descriptores correspondientes. Se podrán marcar

tantos descriptores como haya, en cualquier combinación, con la salvedad de que los momentos de Hu y el resto

de estadísticos de primer orden se consideran aislados.

C.iv.iv ④ Descriptores de Laws

Esta sección aparece si el método escogido en ① es Laws. Lo único que se podrá elegir es si se quieren usar las

plantillas de dimensión 3x3 o las de 5x5 mediante el panel desplegable. Si bien es posible realizar las

combinaciones de los vectores propuestos por Laws para ver las plantillas resultantes, a la hora de iniciar el

cálculo se utilizarán todas ellas, por lo tanto esa funcionalidad es únicamente de carácter informativo.

C.iv.v ⑤ Proyecciones

En caso de que el método escogido sea cualquiera de los dos anteriores, que esté marcada la opción de crear los

prototipos en ⑨ (y que, en el caso de los estadísticos, haya al menos dos descriptores seleccionados) se habilitará

la opción de mostrar las proyecciones. Además, si la marcamos, podremos también elegir si queremos salvar o

no las figuras en el espacio de trabajo. Hay que tener en cuenta que el nombre con el que se guardan las figuras

será figure1, figure2, etc., y que, en ejecuciones consecutivas, éstas se sobrescribirán.

Esta funcionalidad se ha omitido para los otros dos métodos, gradiente y LBP, debido a que trabajan con

histogramas y por tanto el número de proyecciones (comparar cada elemento con todos los demás) sería enorme.

Un par de peculiaridades a tener en cuenta son las siguientes: cuando se escogen tres clases, o menos, los colores

asignados serán, sucesivamente, azul, rojo y negro ya que proporcionan un buen contraste. En cambio, si el

número de clases es mayor, entonces el color de todas ellas se escogerá aleatoriamente, ya que sería un engorro

seleccionar colores adecuados uno a uno. Por otro lado, si el número de clases es cinco o menos, y el número de

muestras menor a cuarenta, entonces el símbolo utilizado en el gráfico para la representación será “x” mientras

que en caso contrario será “·”, ya que de este modo se facilita la visualización cuando comienza a haber un

elevado número de elementos sobre la gráfica. En cualquier caso, “□” representa a los prototipos. Unos ejemplos

de proyecciones pueden verse en la Figura C - 11.

Figura C - 11. Diferencias entre estilos de proyección, tres clases vs seis clases.


102

102

C.iv.vi ⑥ Saturaciones

De nuevo, en el caso de que el método escogido sea el estadístico o el de Laws, podremos activar las funciones

de saturación. Si lo hacemos, aquellas muestras que presenten saturación se irán apilando en la caja de mensajes

correspondiente, pudiendo navegar por ella mediante las flechas del extremo derecho. Además, una vez termine

la ejecución, si se pulsa el botón Mostrar, aparecerán todos los mensajes expuestos en ventanas emergentes que

permiten una mejor visualización.

Por comodidad y, principalmente, por falta de espacio, el descriptor que provoque la saturación aparecerá

únicamente con la letra “c” (de característica) seguido de un número que indique la posición del vector de

características en la que se encuentra. Por ello, para poder entender los mensajes adecuadamente, es importante

conocer el orden en el que se calculan los descriptores.

C.iv.vii ⑦ Descriptores basados en gradiente

Este subpanel aparece si el método escogido en ① es Gradiente. Se podrán seleccionar tanto los descriptores

como los argumentos necesarios relacionados con los mismos, al igual que ocurría con ③.

C.iv.viii ⑧ LBP

Si se escoge el método LBP, podremos en esta sección elegir entre LBP básico o LBP uniforme.

C.iv.ix ⑨ Prototipos

Si se activa la opción de crear los prototipos, se habilitarán los argumentos necesarios para que así sea. Esto es,

el número de clases, el de muestras, el banco donde éstas se encuentran y, si es necesario, el margen de

normalización (de nuevo para los métodos estadístico y de Laws, los otros dos ya trabajan con histogramas

normalizados). Una de las limitaciones de este proyecto es que no permite seleccionar las clases de manera

independiente, es decir, que si se introduce un cuatro serán las cuatro primeras, no cuatro de libre elección. Lo

mismo ocurre con las muestras. Recordemos también que en este TFG las texturas se han diferenciado además

por extensión y que, por tanto, la “xxx_01.jpg” no es la misma que la “xxx_01.png”.

Por otro lado, si no cambia ningún parámetro, no es necesario volver a calcular de nuevo la estructura de

prototipos, acción que puede conllevar un considerable gasto computacional. Cuando la estructura se crea, se

almacena en el espacio de trabajo principal de MATLAB, de modo que se recoge de ahí si queremos realizar

más análisis con ella.

Además, si se quiere hacer otro tipo de pruebas pero únicamente se modifica el número de clases, entonces, de

nuevo, se puede aprovechar la estructura anterior, ya que los prototipos de las clases anteriores serán idénticos,

calculándose únicamente los de las clases nuevas.

C.iv.x ⑩ Clasificación

Si se activa la opción de seguir analizando muestras para su reconocimiento, se podrá elegir entre una muestra

a escoger por el usuario o todas las que queden en el directorio correspondiente. Además, para aquellos casos

en los que sea posible la saturación, deberemos establecer el margen en porcentaje.

Si se escoge analizar una única muestra, y además existen proyecciones abiertas (por haber creado los prototipos

anteriormente), se añadirá esta nueva muestra bajo estudio representada con el símbolo ◊ en color verde (tal y

como se ve en la Figura C - 12), además de una línea discontinua que la unirá con el prototipo más cercano (que

puede ser o no correcto).

C.iv.xi ⑪ Resultados

En este subpanel se muestran los resultados obtenidos en el caso de que se haya realizado algún tipo de análisis.

Si se ha clasificado una única muestra, aparecerá en la parte de arriba la clase asignada y si el resultado ha sido

correcto o no. En caso de haber analizado todas las restantes, aparecerá en la parte de abajo el PCI

correspondiente en porcentaje.

Figura C - 12. Adición de muestra analizada a la proyección.

Trabajo de Fin de Grado - Universidad de...

Documents

Transcript of Trabajo de Fin de Grado - Universidad de...