Trabajo de Fin de Grado - Universidad de...
Transcript of Trabajo de Fin de Grado - Universidad de...
Índice de Tablas
i
Equation Chapter 1 Section 1
Trabajo de Fin de Grado
Grado en Ingeniería Electrónica, Robótica y
Mecatrónica
Identificación de texturas en imágenes
Autor: Daniel Gómez Aguilera
Tutor: Manuel Ruiz Arahal
Dep. Ingeniería de Sistemas y Automática
Escuela Técnica Superior de Ingeniería
Universidad de Sevilla
Sevilla, 2017
Trabajo de Fin de Grado
Grado en Ingeniería Electrónica, Robótica y Mecatrónica
Identificación de texturas en imágenes
Autor:
Daniel Gómez Aguilera
Tutor:
Manuel Ruiz Arahal
Catedrático de Universidad
Dep. Ingeniería de Sistemas y Automática
Escuela Técnica Superior de Ingeniería
Universidad de Sevilla
Sevilla, 2017
Trabajo de Fin de Grado: Identificación de texturas en imágenes
Autor: Daniel Gómez Aguilera
Tutor: Manuel Ruiz Arahal
El tribunal nombrado para juzgar el Proyecto arriba indicado, compuesto por los siguientes miembros:
Presidente:
Vocales:
Secretario:
Acuerdan otorgarle la calificación de:
Sevilla, 2017
El Secretario del Tribunal
A mi familia
A mis amigos
A mis compañeros y profesores
Agradecimientos
Quisiera expresar mi más sincero agradecimiento a todas aquellas personas que han hecho posible la
consecución de este proyecto. A mi familia, que me ha ofrecido su apoyo incondicional desde el primer
momento, y sin cuyo esfuerzo no podría haber llegado tan lejos. A mis amigos, por esos despropósitos capaces
de relajar los momentos de mayor presión. A mi pareja, sostén fundamental, por soportarme en mis peores
momentos y aguantarme en los mejores. A mi tutor, por la paciencia que ha demostrado conmigo. A mis
profesores, por compartir sus conocimientos.
A Sara, por su asistencia en aquellas labores más tediosas. A Adrián, por ceder su potencia computacional. A
Guillermo, Christian y Karolina, por ayudarme a mejorar con sus revisiones. A Ana, por su contribución en
todas estas tareas, y por auxiliarme con su percepción.
A Jose, Ana, Víctor, Sergio, Nico, Carlos, Joaquín y Pablo, por haber aparecido aquellos primeros días de
universidad y ayudarme a encontrar mi lugar. A Gonzalo y Julio, por su afecto y por su competitividad, que han
engrosado mi esfuerzo y ayudado a mi crecimiento. A Tino, Valentín, Noelia, y todos los demás, por haberme
hecho un hueco.
Daniel Gómez Aguilera
Sevilla, 2017
Resumen
Este proyecto trata de evaluar, mediante un proceso de clasificación, el rendimiento de algunos de los métodos
que se han propuesto a lo largo de los años para resolver el problema de la caracterización de texturas, y
compararlos entre sí. De modo que, para realizar la descripción de las distintas texturas, se han utilizado: los
momentos invariantes de Hu; estadísticos de primer y segundo orden, basados en el histograma de intensidades
y en la matriz de co-ocurrencia de niveles de gris (GLCM); los descriptores propuestos por Laws para tratar de
determinar la energía de una textura; características fundamentadas en imágenes de gradientes, como los
histogramas de módulo y fase, o HOG (Histogram of Oriented Gradients); y el descriptor LBP (Local Binary
Pattern), que viene ofreciendo muy buenos resultados ante este problema.
En cuanto al problema de clasificación, se tratará de identificar y distinguir un conjunto de muestras, previamente
caracterizadas por los métodos ya comentados, empleando un clasificador por distancia que atiende al prototipo
más cercano, utilizando el PCI (Porcentaje de Clasificaciones Incorrectas) como indicador de bondad.
Abstract
This project tries to evaluate, through a classification process, the performance of some methods that have been
proposed over the years for solving description texture problem, and comparing them to each other. Thus, to
describe the different textures, we will apply: Hu invariant moments; first and second order statistics features,
based on intensity histogram and Gray Level Co-Ocurrence Matrix (GLCM); the energy features proposed by
Laws; features based on gradient images, like magnitude and phase histogram or HOG (Histogram of Oriented
Gradients); and LBP (Local Binary Pattern), that is achieving good results for this problem.
In regard to the classification problem, we will identify a set of samples, previously labeled by the comented
methods. It will be achieved by using a distance algorithm attending to the nearest model neighbor, employing
the incorrect classifications percent as a kindness indicator.
Índice
Agradecimientos ........................................................................................................................................... ix
Resumen ....................................................................................................................................................... xi
Abstract ...................................................................................................................................................... xiii
Índice ........................................................................................................................................................... xv
Índice de Tablas ......................................................................................................................................... xvii
Índice de Figuras ......................................................................................................................................... xix
Notación ..................................................................................................................................................... xxi
1 Introducción .......................................................................................................................................... 1 1.1 Motivación y objetivo .................................................................................................................................. 1 1.2 Estado del arte ............................................................................................................................................. 2 1.3 Estructura de este documento .................................................................................................................... 2
2 Metodología .......................................................................................................................................... 3 2.1 Software ....................................................................................................................................................... 4 2.2 Conjuntos de muestras ................................................................................................................................ 4
3 Marco Teórico ........................................................................................................................................ 7 3.1 Conceptos generales .................................................................................................................................... 7
3.1.1 Muestreo y Cuantificación .................................................................................................................. 8 3.1.2 Color...................................................................................................................................................... 9 3.1.3 Histograma ......................................................................................................................................... 10 3.1.4 Brillo .................................................................................................................................................... 10 3.1.5 Contraste ............................................................................................................................................ 11 3.1.6 Gradiente............................................................................................................................................ 12
3.2 Características para la descripción de texturas ....................................................................................... 14 3.2.1 Métodos estadísticos ........................................................................................................................ 14
3.2.1.1 Descriptores estadísticos de primer orden .............................................................................. 15 3.2.1.2 Momentos de Hu ....................................................................................................................... 17 3.2.1.3 Descriptores estadísticos de segundo orden (GLCM) ............................................................. 18
3.2.2 Descriptores de Laws ......................................................................................................................... 21 3.2.3 Local Binary Pattern (LBP) ................................................................................................................. 22 3.2.4 Métodos basados en el gradiente .................................................................................................... 24
3.2.4.1 Histogram of Oriented Gradients (HOG) ................................................................................. 24 3.3 Clasificadores ............................................................................................................................................. 25
3.3.1 Clasificadores lineales ........................................................................................................................ 26 3.3.2 Clasificadores por vecino más cercano (NN) ................................................................................... 26
4 Experimentación .................................................................................................................................. 29 4.1 Consideraciones previas ............................................................................................................................ 29
4.1.1 Proyección .......................................................................................................................................... 29
4.1.2 Normalización .................................................................................................................................... 30 4.1.3 Procedimiento ................................................................................................................................... 30
4.2 Pruebas realizadas .................................................................................................................................... 31 4.2.1 Métodos estadísticos ........................................................................................................................ 31 4.2.2 Descriptores de Laws ........................................................................................................................ 41 4.2.3 LBP ...................................................................................................................................................... 41 4.2.4 Descriptores basados en gradiente.................................................................................................. 45
4.3 Preprocesamiento ..................................................................................................................................... 52
5 Conclusiones y trabajo futuro .............................................................................................................. 57
Referencias.................................................................................................................................................. 61
Anexo A. Muestras de textura..................................................................................................................... 63
Anexo B. Resultados experimentales .......................................................................................................... 67 B.i Métodos estadísticos ................................................................................................................................ 67 B.ii Descriptores de Laws ................................................................................................................................. 78 B.iii LBP .............................................................................................................................................................. 79 B.iv Métodos basados en gradiente ................................................................................................................ 80
Anexo C. Manual de la GUI .......................................................................................................................... 93 C.i Introducción ............................................................................................................................................... 93 C.ii Pantalla de procesamiento básico ........................................................................................................... 93
C.ii.i Panel de control .................................................................................................................................... 94
C.ii.i.i ① Reducción de resolución .......................................................................................................... 94
C.ii.i.ii ② Modificación del nombre ........................................................................................................ 95
C.ii.i.iii ③ Cuantizar en masa .................................................................................................................... 95
C.ii.i.iv ④ Submuestreo ............................................................................................................................ 96
C.ii.i.v ⑤ Supresión de efectos de iluminación ...................................................................................... 96
C.ii.i.vi ⑥ Cargar imagen .......................................................................................................................... 97
C.ii.i.vii ⑦ Guardar imagen .................................................................................................................... 97
C.ii.i.viii ⑧ Limpiar resultados ................................................................................................................ 97
C.ii.i.ix ⑨ Conversión a escala de grises .................................................................................................. 97
C.ii.i.x ⑩ Separación de canales.............................................................................................................. 97
C.ii.i.xi ⑪ LBP ............................................................................................................................................. 97
C.ii.i.xii ⑫ Modificación del brillo ......................................................................................................... 97
C.ii.i.xiii ⑬ Modificación del contraste .................................................................................................. 98
C.ii.i.xiv ⑭ Cuantización ......................................................................................................................... 98
C.ii.i.xv ⑮ Detección de bordes ............................................................................................................ 98
C.ii.i.xvi ⑯ Añadir Ruido ......................................................................................................................... 98
C.ii.i.xvii ⑰ Filtrar Ruido .......................................................................................................................... 98
C.ii.i.xviii ⑱ Test RGB ................................................................................................................................ 99 C.iii Test de descriptores................................................................................................................................... 99 C.iv Clasificación ............................................................................................................................................. 100
C.iv.i ① Selección de método y directorio ............................................................................................. 100
C.iv.ii ② Panel de progreso ...................................................................................................................... 101
C.iv.iii ③ Descriptores estadísticos ........................................................................................................... 101
C.iv.iv ④ Descriptores de Laws ................................................................................................................. 101
C.iv.v ⑤ Proyecciones ............................................................................................................................... 101
C.iv.vi ⑥ Saturaciones ............................................................................................................................... 102
C.iv.vii ⑦ Descriptores basados en gradiente .......................................................................................... 102
C.iv.viii ⑧ LBP ........................................................................................................................................... 102
C.iv.ix ⑨ Prototipos ................................................................................................................................... 102
C.iv.x ⑩ Clasificación ................................................................................................................................ 102
C.iv.xi ⑪ Resultados .................................................................................................................................. 102
ÍNDICE DE TABLAS
Tabla 3-1. Combinaciones RGB. 9
Tabla 3-2. Vecindad 9 o entorno 3x3 de un píxel. 13
Tabla 3-3. Comparación de los momentos de Hu aplicados a una imagen (01A). 18
Tabla 3-4. Ejemplo de cálculo de GLCM. 20
Tabla 3-5. Comparación de descriptores de Laws para muestras 01A, 11A y 21A. 22
Tabla 4-1. Prototipos con 80 muestras para 3 clases con momentos de Hu. 38
Tabla 5-1. PCI promedio de todos los métodos. 58
Tabla B - 1. Resultados ofrecidos por estadísticos de primer orden para el banco A. 67
Tabla B - 2. Resultados ofrecidos por estadísticos de primer orden para el banco B. 68
Tabla B - 3. Combinaciones de estadísticos de 1er orden con pocas clases para el banco A. 69
Tabla B - 4. Combinaciones de estadísticos de 1er orden con pocas clases para el banco B. 70
Tabla B - 5. Combinaciones de estadísticos de 2o orden con pocas clases para el banco A. 71
Tabla B - 6. Combinaciones de estadísticos de 2o orden con pocas clases para el banco B. 72
Tabla B - 7. Mejores combinaciones de estadísticos obtenidas para a pocas clases. 73
Tabla B - 8. Análisis de distancia y dirección en estadísticos de 2º orden (I). 74
Tabla B - 9. Análisis de distancia y dirección en estadísticos de 2º orden (II). 75
Tabla B - 10. Resultados ofrecidos por momentos de Hu para el banco A. 75
Tabla B - 11. Resultados ofrecidos por momentos de Hu para el banco B. 76
Tabla B - 12. Resultados ofrecidos por estadísticos de 2º orden para el banco A. 76
Tabla B - 13. Resultados ofrecidos por estadísticos de 2º orden para el banco B. 77
Tabla B - 14. Resultados ofrecidos por descriptores de Laws para el banco A. 78
Tabla B - 15. Resultados ofrecidos por descriptores de Laws para el banco B. 78
Tabla B - 16. Resultados ofrecidos por LBP para el banco A. 79
Tabla B - 17. Resultados ofrecidos por LBP para el banco B. 79
Tabla B - 18. Resultados ofrecidos por métodos basados en gradiente para banco A (I). 80
Tabla B - 19. Resultados ofrecidos por métodos basados en gradiente para banco A (II). 81
Tabla B - 20. Resultados ofrecidos por métodos basados en gradiente para banco A (III). 82
Tabla B - 21. Resultados ofrecidos por métodos basados en gradiente para banco A (IV). 83
Tabla B - 22. Resultados ofrecidos por métodos basados en gradiente para banco A (V). 84
Tabla B - 23. Resultados ofrecidos por métodos basados en gradiente para banco A (VI). 85
Tabla B - 24. Resultados ofrecidos por métodos basados en gradiente para banco B (I). 86
Tabla B - 25. Resultados ofrecidos por métodos basados en gradiente para banco B (II). 87
Tabla B - 26. Resultados ofrecidos por métodos basados en gradiente para banco B (III). 88
Tabla B - 27. Resultados ofrecidos por métodos basados en gradiente para banco B (IV). 89
Tabla B - 28. Resultados ofrecidos por métodos basados en gradiente para banco B (V). 90
Tabla B - 29. Resultados ofrecidos por métodos basados en gradiente para banco B (VI). 91
Tabla B - 30. Resultados ofrecidos por HOG36 con interpolación angular para banco A. 92
Tabla B - 31. Resultados ofrecidos por HOG36 con interpolación angular para banco B. 92
Tabla C - 1. Ejemplos de renombramiento. 96
ÍNDICE DE FIGURAS
Figura 2-1. Esquema general de un proceso de clasificación de imágenes digitales. 3
Figura 2-2. Logo de MATLAB, extraído de [13]. 4
Figura 2-3. Diagrama del proceso de ampliación de muestras. 5
Figura 2-4. Ejemplo de obtención de nueva muestra (11B). 5
Figura 3-1. Imagen digital (01A) en escala de grises, subventana ampliada y valores de intensidad. 7
Figura 3-2. Reducción del muestreo de una imagen (01A), reescaladas para comparación. 8
Figura 3-3. Modelo de reducción de cuantificación desde 8 bits hasta 1 bit de información por píxel. 8
Figura 3-4. Variación de cuantificación desde 1 hasta 8 bits por píxel sobre una imagen (01A). 8
Figura 3-5. Modelos de color RGB, CMY y HSV. 9
Figura 3-6. Imagen RGB (57B) separada en canales. 9
Figura 3-7. Transformación a escala de grises de una imagen (57B) RGB. 10
Figura 3-8. Histograma de una imagen (01A, de la Figura 3-1). 10
Figura 3-9. Variación de brillo de una imagen (01A). 10
Figura 3-10. Traslación del histograma tras modificar el brillo (imágenes laterales de la Figura 3-9). 11
Figura 3-11. Variación de contraste de una imagen (01A). 11
Figura 3-12. Ejemplo de curvas tonales para modificar el brillo o el contraste. 11
Figura 3-13. Modificación del histograma tras variar el contraste (imágenes laterales de Figura 3-11). 12
Figura 3-14. Gx, Gy y módulo de una imagen (A01) con Prewitt. 13
Figura 3-15. Problema de los bordes en el análisis de una imagen. 14
Figura 3-16. IBC con distinto umbral obtenida a partir del módulo de Figura 3-14. 14
Figura 3-17. Ejemplos de asimetría (a) y curtosis (k) en diferentes histogramas. 15
Figura 3-18. Posibles operadores de dirección en la GLCM. 19
Figura 3-19.Ejemplo de pérdida de borde tras seleccionar el operador distancia. 19
Figura 3-20. Cálculo de uniformidad para U-LBP. 23
Figura 3-21. Ejemplo de proceso LBP. 23
Figura 3-22. Imagen LBP y U-LBP de muestra 01A. 23
Figura 3-23. Histogramas de Figura 3-22. 23
Figura 3-24. Comparación de histogramas. 24
Figura 3-25. Proceso HOG con imagen generada aleatoriamente. 25
Figura 3-26. Variabilidad (izquierda) frente a Invariavilidad (derecha) interclase. 25
Figura 3-27. Ejemplos de fronteras lineales. 26
Figura 3-28. Ejemplo de funcionamiento de clasificador NN y variantes. 27
Figura 4-1. Proyecciones de una representación tridimensional. 29
Figura 4-2. PCI ofrecido por clasificador aleatorio. 30
Figura 4-3. Proyección s-R. 31
Figura 4-4. Mejores combinaciones de estadísticos de 1er orden para un análisis con pocas clases. 32
Figura 4-5. Gráficas relativas a las pruebas de estadísticos de primer orden. 34
Figura 4-6. Proyecciones de estadísticos de 1er orden ‘sae’ para 3 y 61 clases. 35
Figura 4-7. Variación del histograma ante la reducción de niveles de gris. 36
Figura 4-8. Variación del histograma ante la reducción de escala. 36
Figura 4-9. Gráficas relativas a las pruebas de los momentos de Hu. 37
Figura 4-10. Mejores combinaciones de estadísticos de 2º orden para un análisis con pocas clases. 38
Figura 4-11. Gráficas relativas a las pruebas de estadísticos de segundo orden. 40
Figura 4-12. Gráficas relativas a las pruebas de los descriptores de Laws. 43
Figura 4-13. Gráficas relativas a las pruebas del descriptor LBP. 44
Figura 4-14. Gráficas referentes a las pruebas con descriptores basados en gradiente. 51
Figura 4-15. Sustracción de intensidad media para distintas subventanas (14A). 52
Figura 4-16. Módulos de muestra original frente a muestra a muestra preprocesada (14A). 52
Figura 4-17. Gráficas relativas a las pruebas con muestras preprocesadas. 56
Figura 5-1. Tiempo medio de cómputo por muestra para descriptores. 57
Figura 5-2. Comparación del PCI de los métodos de caracterización estudiados. 60
Figura C - 1. Pantalla principal. 93
Figura C - 2. Panel de Procesamiento Básico. 94
Figura C - 3. Panel de Control. 94
Figura C - 4. Panel de opciones para renombrar. 95
Figura C - 5. Panel de submuestreo. 96
Figura C - 6. Panel de guardado. 97
Figura C - 7. Panel auxiliar de detección de bordes. 98
Figura C - 8. Paneles auxiliares para el modelo de color RGB. 99
Figura C - 9. Panel de testeo de descriptores. 99
Figura C - 10. Panel de clasificación. 100
Figura C - 11. Diferencias entre estilos de proyección, tres clases vs seis clases. 101
Figura C - 12. Adición de muestra analizada a la proyección. 103
Notación
∇2 Operador laplaciano
𝜂𝑝𝑞 Momento geométrico central normalizado de orden (p+q)
𝜇𝑛 Momento n-ésimo respecto a la intensidad media de una imagen
𝜇𝑝𝑞 Momento geométrico central de orden (p+q)
𝜙𝑛 Momento de Hu de orden n
∂/∂x Derivada respecto a x
∂/∂y Derivada respecto a y
∇g Gradiente de g
∆ Incremento
a Coeficiente de asimetría, descriptor estadístico de primer orden
A ASM (Angular Second Moment), descriptor estadístico de segundo orden
c Contraste, descriptor estadístico de segundo orden
C Correlación, descriptor estadístico de segundo orden
CMY Modelo de color sustractivo basado en pigmentos primarios
d Operador distancia para GLCM
D Operador dirección para GLCM
e Entropía, descriptor estadístico de primer orden
E Entropía, descriptor estadístico de segundo orden
GLCM Grey Level Co-ocurrence Matrix
GUI Graphical User Interface
Gx Componente horizontal del gradiente g
Gy Componente vertical del gradiente g
h Homogeneidad, descriptor estadístico de segundo orden
HOG Histogram of Oriented Gradient
HSV Modelo de color determinado por parámetros ‘Hue’, ‘Saturation’ y ‘Value’
i Índice que recorre la dimensión vertical de una imagen
IBC Imagen Binaria de Contornos
j Índice que recorre la dimensión horizontal de una imagen
k Curtosis, descriptor estadístico de primer orden
k-NN k-Nearest Neighbor
LBP Local Binary Pattern
M Dimensión vertical de una imagen
m Intensidad media
M Máxima probabilidad, descriptor estadístico de segundo orden
mpq Momento geométrico de orden (p+q)
N Dimensión horizontal de una imagen
NG Niveles de Gris
NN Nearest Neighbor
PCI Porcentaje de Clasificaciones Incorrectas
PPC Porcentaje de Puntos de Contorno
R Coeficiente de suavidad relativa, descriptor estadístico de primer orden
RGB Modelo de color aditivo basado en haces de luz primarios
s Varianza, descriptor estadístico de primer orden
SVM Support Vector Machine
u Uniformidad, descriptor estadístico de primer orden
U Uniformidad, descriptor estadístico de segundo orden
U-LBP Uniform Local Binary Pattern
1 INTRODUCCIÓN
n la actualidad el tratamiento de imágenes y, en especial, la descripción de regiones, es una tarea
imprescindible en innumerables ámbitos científicos, ayudando en el desarrollo de un sinfín de aplicaciones
en cualquier campo, ya sea, por ejemplo, en la detección de células y tejidos perniciosos para la salud en
medicina, en el análisis del terreno que conforma la superficie de otros planetas en alguna rama de la astronomía,
en facilitar la navegación de cualquier entidad robótica móvil mediante la localización e identificación de
posibles obstáculos gracias al reconocimiento de personas, animales u objetos, o en la verificación y el control
de calidad de todo tipo de productos.
Tratar de caracterizar las diferentes texturas que aparezcan en una imagen es uno de los métodos más utilizados
para la descripción de regiones. Si bien la definición de la palabra textura puede dar lugar a interpretaciones
ambiguas por tener connotaciones asociadas al sentido del tacto, en este contexto se trata de cuantificar las
sensaciones que transmite el área exterior de un objeto a nivel visual, teniendo en cuenta características como la
rugosidad, la homogeneidad, la regularidad, etc.
Por otro lado, la clasificación consiste en asignar una clase a un objeto determinado, etiquetándolo en función
de un conjunto de características o rasgos medidos sobre dicho objeto, comúnmente denominados descriptores.
Así, en concreto, el objetivo de un clasificador de texturas es el de etiquetar regiones en función de las texturas
visuales que estas presenten. De este modo, se pretende reconocer objetos en función de dichas texturas y
asignarlos a los grupos a los que deberían pertenecer. Evidentemente, cuanto mayor sea el número de clases para
elegir, mayor será, en principio, la dificultad del problema.
1.1 Motivación y objetivo
Uno de los objetivos principales de la ingeniería es la automatización de tareas. Un clasificador de texturas
automático podría tener todo tipo de aplicaciones industriales importantes; sin embargo, no es fácil mecanizar
este tipo de procesos debido a la dificultad de encontrar descriptores adecuados e independientes a las
particularidades de cada textura, es decir, es frecuente que el método escogido para identificar una textura
concreta obtenga un resultado poco representativo para cuantificar cualquier otra, lo que reduce la mecanización
a aplicaciones muy concretas, con algoritmos de clasificación específicos, o bien hace necesario un factor
humano que orqueste todo el proceso. Entre esas particularidades están las grandes variaciones estocásticas que
sufren la mayoría de texturas y que, junto con las alteraciones de apareciencia producidas por los posibles
cambios de iluminación en el entorno o por la variación de la posición de la cámara a la hora de tomar las
muestras, hacen que dichas texturas sean difíciles de modelar adecuadamente.
En este trabajo de fin de grado se utilizan varios de los métodos que se han propuesto a lo largo de las últimas
décadas para realizar un análisis exhaustivo de un par de bancos de imágenes con el objetivo de compararlos
entre sí. Con esto se pretende buscar un procedimiento capaz de realizar una clasificación por textura, de un
modo aceptable, e independientemente del conjunto de datos utilizado, establenciendo así el inicio de un estudio
que trate de alcanzar la automaticación del proceso de clasificación.
E
Introducción
2
2
1.2 Estado del arte
Para resolver el problema de la descripción de texturas se han propuesto diversas soluciones desde la segunda
mitad del siglo XX, y sería una difícil tarea mencionarlas todas. Existen varios libros de visión por computador
y tratamiento de imágenes que contienen información sobre el análisis de texturas y que recopilan algunos de
estos métodos con su propia taxonomía, como [1], [2] o [3], así como recursos audiovisuales, como [4] y [5],
en los que se apoya principalmente este proyecto.
Así, en 1962, Hu sugirió [6] un conjunto de momentos, para tratar de reconocer patrones sobre la imagen, que
presentan buena invarianza ante la traslación, la rotación y la modificación de escala de las muestras, propiedades
muy importantes a la hora de realizar una buena caracterización y que, idealmente, se han de buscar en cualquier
descriptor. En 1973, Haralick [7] propuso, junto con otros autores, un conjunto de descriptores estadísticos
basados en la intensidad de los píxeles de las muestras que consiguieron buenos resultados y que, a día de hoy,
siguen siendo ampliamente utilizados. Más tarde, en 1979, Laws planteó [8] otro enfoque intentando cauntificar
la variación de energía de cada textura. Ya en la década de los 90 apareció un nuevo modelo para el análisis de
este tipo de imágenes que, simplificado en [9] por Ojala y otros autores, da lugar al descriptor LBP, aún hoy
muy importante. Por último, si bien se había desarrollado antes, no es hasta 2005 cuando el descriptor basado
en el gradiente, HOG, comienza a tener importancia, concretamente a raíz del estudio para el reconocimiento de
personas realizado en [10]. También hay estudios que combinan varios de estos métodos, como LBP-HOG en
[11], que consiguen mejorar el rendimiento.
Por otra parte, un ejemplo concreto de la utilidad de la clasificación de texturas puede verse en [12], donde se
trata de monitorizar y predecir la radiación solar mediante la identificación de nubes.
1.3 Estructura de este documento
En cuanto a la estructura de esta memoria, veremos en el capítulo 2 la metodología utilizada, incluyendo las
herramientas y los datasets empleados; en el capítulo 3 se comentarán, de un modo general, los conceptos
teóricos que se han ido utilizando, incluyendo una explicación un poco más amplia del estado del arte comentado
en la sección anterior; en el capítulo 4 veremos los resultados obtenidos tras la experimentación con los distintos
métodos de caracterización empleados; y, por último, en el capítulo 5 se expondrán las conclusiones obtenidas
y se realizarán algunas propuestas para continuar con el desarrollo del proyecto en un futuro.
Se adjuntan además varios anexos que complementan a este trabajo: en el primero de ellos, podremos ver una
muestra de cada una de las texturas que intervienen en el desarrollo del mismo; en el segundo, aparecerán
plasmadas las tablas que contienen los resultados de todas y cada una de las pruebas realizadas; y, en el tercero,
habrá un manual de la interfaz gráfica diseñada. Todo el código software desarrollado, incluida la interfaz
gráfica, se adjuntará, con sendos comentarios para facilitar su comprensión, en un CD que incluye, además, un
archivo de instrucciones donde se indica como poner en marcha la GUI.
2 METODOLOGÍA
n diagrama típico de un proceso de clasificación de imágenes por computador podría ser el que aparece
en la Figura 2-1. Así, el primer paso consiste en adquirir un conjunto de muestras con las propiedades
que nos interesen para trabajar. En este caso concreto debería contener un buen número de ejemplares
de clases diferentes de textura, a ser posible con variabilidad elevada (esto es, que puedan distinguirse bien).
Después, opcionalmente, es posible realizar un tratamiento a esas imágenes con el objetivo de eliminar
elementos indeseables, como ruido o defectos de iluminación o de contraste.
Acto seguido llega el momento se separar las muestras en dos
partes, la primera de ellas será utilizada para tratar de identificar
cada textura, es decir, para entrenar al sistema y enseñarle qué
valores de qué parámetros debería asociar con cada clase;
mientras que, la segunda, se utilizará para probar la capacidad
de reconocimiento que, se supone, el sistema habrá adquirido.
En cuanto a la división de muestras, parece lógico pensar que
lo adecuado es que haya una cantidad más o menos similar en
ambas secciones, siempre y cuando el número inicial fuese
razonable: un entrenamiento con muestras insuficientes puede
que no lograse representar adecuadamente a sus
correspondientes clases, mientras que probar el sistema con
pocas muestras no tendría resultados indicativos para usos
futuros. Por otra parte, tampoco tendría mucho sentido irse al
extremo opuesto: con demasiadas muestras el sistema tendería
a sobrecalcular, ya que los resultados, tanto de caracterización
como de clasificación, no mejorarían llegados a un cierto
punto. Así, el primer problema que aparece es la elección de un
número adecuado de muestras; no obstante, en general se
necesita una gran cantidad (varios cientos, o miles) de muestras
para que el sistema sobrecalcule.
Con ambas divisiones del conjunto debemos proceder igual. Si
la imagen es una composición de elementos, habrá que realizar
una etapa de segmentación que trate de dividir las distintas
regiones que aparecen, con el objetivo de seleccionar aquellas
de interés. En este caso particular, resulta que las muestras
deberán ser enteramente de una misma textura, por lo que la
segmentación carece se sentido (distinto sería si se tratase de
un problema de detección de objetos, donde habría que
localizar los posibles elementos de interés, en lugar de
caracterizar toda la imagen). Se procede, entonces, a tratar de
describir las muestras empleando esa variedad de métodos ya
mencionados en el capítulo 1 de introducción.
U
Adquisición de
muestras
Etapa de
preprocesamiento
Etapa de
entrenamiento Etapa de
reconocimiento
Etapa de
clasificación
Evaluación de
resultados
Extracción de
características
Etapa de
segmentación
Extracción de
características
Etapa de
segmentación
Figura 2-1. Esquema general de un proceso de
clasificación de imágenes digitales.
Metodología
4
4
Una vez finalizada la etapa de entrenamiento, se trata de intentar asignar la etiqueta correcta a cada muestra del
subconjunto de prueba, es decir, de comprobar si el sistema es capaz de reconocer las texturas que, se supone,
ha aprendido a identificar. Por último, mediante algún indicador de bondad, se deberá proceder a evaluar los
resultados, estableciendo así qué método los ha proporcionado mejores.
Así, una vez conocido el procedimiento a seguir, queda seleccionar las herramientas necesarias con las que llevar
a cabo el desarrollo del trabajo, que veremos el las siguientes secciones.
2.1 Software
Para el desarrollo de todos los elementos que componen la parte software de este TFG, se ha empleado la
aplicación MATLAB de MathWorks [13] (logo visible en la Figura 2-2) en su versión R2015a1. MATLAB es
una herramienta matemática, con un lenguaje de programación propio (lenguaje M), ampliamente utilizada en
el ámbito científico, particularmente en el marco de la ingeniería.
El lenguaje M está orientado a matrices y, dado que, como
se indicará más adelante, las imágenes digitales pueden
considerarse matemáticamente como tales, se facilita
sobremanera tratar con este tipo de elementos. Además, el
potencial de MATLAB radica en que se puede
complementar con numerosos toolboxes especializados
que se han ido desarrollando a lo largo de los años. En
concreto, el Image Processing Toolbox [14] está enfocado al tratamiento de imágenes y contiene una gran
cantidad de funciones predefinidas para tal fin. MATLAB también dispone de herramientas que permiten el
desarrollo de interfaces gráficas de usuario (generalmente conocidas como GUI, del inglés Graphical User
Interface) sin demasiada dificultad.
Un manual de la GUI desarrollada se adjunta en el Anexo C, al final de este documento. No obstante, se
prescindirá de cualquier tipo de explicación referente al funcionamiento del software en lo relativo a las
funciones predefinidas, tanto de la aplicación principal como del toolbox especializado, más allá de los propios
comentarios desarrollados que complementan al código, dado que no es ese el objetivo del proyecto.
2.2 Conjuntos de muestras
Si bien una posibilidad sería fabricar nuestros propios bancos de imágenes, existen disponibles en la red
numerosos conjuntos de muestras de textura. En este proyecto se han decido utilizar los empleados en [15] y
[16] (disponibles, respectivamente, en [17] y [18]): el primero de ellos, en adelante banco de imágenes A,
dispone de un total de 1000 muestras en escala de grises, divididas en 25 texturas distintas con 40 ejemplares de
cada una, en formato JPG, y con un tamaño 640x480 píxeles; mientras que el segundo, banco de imágenes B,
cuenta con 5612 imágenes en escala de grises, divididas en 61 texturas con 92 muestras cada una, en formato
PNG, y con un tamaño de 200x200 píxeles.
En el Anexo A, adjunto al final de este documento, puede encontrarse una muestra de ejemplo de cada una de
las clases que componen ambos conjuntos. A priori, las texturas parecen lo suficientemente distintas (desde
cortezas de árbol, madera tratada, agua, ladrillos, cristal, diferentes tipos de suelo…, hasta plumas o pelaje) como
para asegurar una separabilidad aceptable. Algunas de las muestras están tomadas desde diferentes ángulos y
otras presentan cambios de iluminación o de contraste, lo que hace que el proceso de modelado sea, por un lado,
más realista, pues se contemplan más casos posibles para poder identificar esas texturas, pero, en contraposición,
la búsqueda de descriptores que aúnen el conjunto de muestras se complica, dificultándose así la tarea de
clasificación.
1 Esta herramienta está en continua evolución, desarrollando un par de actualizaciones anuales, por lo que no se asegura la compatibilidad de las funciones realizadas para el presente documento en versiones anteriores a la utilizada en el desarrollo del proyecto, R2015a.
Figura 2-2. Logo de MATLAB, extraído de [13].
Por otro lado, un factor que puede limitar un análisis
adecuado es la falta de un número suficiente de
muestras que permitan identificar adecuadamente
una textura ya que, como es lógico, cuanto mayor
sea el número de ejemplares, más representativa
será la caracterización. Dado que el número de
muestras en ambos conjuntos no es idealmente
grande, se ha decido obtener subventanas de tamaño
100x100 para aumentar artificialmente el número
total de las mismas, generándo así un total de 17200
muestras (5000 para el banco A y 12200 para el B),
200 por cada clase.
El procedimiento empleado puede verse en el
diagrama de la Figura 2-3. Además, se puede
observar un ejemplo concreto en la Figura 2-4: sea
una muestra al azar de una clase concreta, se escoge
un píxel aleatoriamente (marcado en verde) dentro
de la zona válida (en azul), extrayéndose una nueva
ventana del tamaño deseado (en amarillo). Escoger
un píxel fuera de los límites haría imposible extraer
una ventana de las dimensiones especificadas, pues
se alcanzaría antes algún borde de la imagen.
El tamaño artificial escogido de las nuevas muestras
es más que suficiente para no perder la esencia de
cada textura y, como ventaja adicional, el balance
total de píxeles ha disminuido respecto a los bancos
originales, lo que se traduce en un decremento del gasto computacional empleado, permitiéndose así realizar un
mayor número de pruebas para el mismo tiempo utilizado.
A lo largo de este documento se utilizan algunas de las muestras obtenidas para ejemplificar la mayor parte de
los conceptos teóricos o de interés. Para hacer referencia a qué muestras se utilizan en cada caso, se añadirá al
título de la figura un código alfanumérico. De modo que, por ejemplo, la muestra 11B usada en la Figura 2-4
pertenece a la clase 11 del banco de imágenes B.
Nmuestras ++
¿Quedan
Clases?
Abrir muestra
aleatoria de la
clase actual
Escoger un píxel
válido al azar
Extraer y guardar
subventana
Nclases ++
¿Nmuestras
== 200?
Nclases = 0
Fin
Inicio
No Sí
Sí No
Nmuestras = 0
Figura 2-3. Diagrama del proceso de ampliación de muestras.
Figura 2-4. Ejemplo de obtención de
nueva muestra (11B).
3 MARCO TEÓRICO
n este capítulo se expondrán de forma reducida los conceptos teóricos necesarios para el desarrollo de este
proyecto. Así, se mostrarán algunos conceptos generales imprescindibles, se continuará con un desarrollo
del estado del arte del problema de caracterización de texturas; y, por último, se hablará un poco sobre
algunos modelos simples de clasificación.
3.1 Conceptos generales
Una imagen digital puede considerarse como una matriz de tamaño MxN en la que cada elemento, denominado
píxel, discretiza una región del espacio. Para hacer referencia a cada punto de una imagen, se suele nombrar i al
índice que recorrerá las filas de la matriz y j al que recorrerá las columnas. Así, cada píxel de una imagen img
cualquiera se puede expresar como 𝑖𝑚𝑔(𝑖, 𝑗).
Generalmente se acostumbra a trabajar con un rango de 8 bits (1 byte) de información por cada punto, lo que
equivale a un total de 28 valores distintos que podrán representar el nivel de intensidad de un píxel en el intervalo
[0, 255]. El valor 0 representa la ausencia de intensidad (lo que se correspondería con un píxel negro en la
imagen) y, a medida que lo vamos aumentando, van apareciendo tonos de gris cada vez más claros hasta llegar
a 255, la mayor intensidad posible (píxel blanco). Se verá en la siguiente subsección que esta cantidad de
información es más que suficiente para el ojo humano.
Así, en la Figura 3-1 podemos ver un ejemplo de imagen digital. Si hacemos un zoom en alguna sección de la
misma, seremos capaces de identificar cada uno de los píxeles que, como se ha comentando, se pueden
representar por valores numéricos.
E
115 71
149 154
M
N
i
j
Figura 3-1. Imagen digital (01A) en escala de grises, subventana ampliada y valores de intensidad.
Marco Teórico
8
8
3.1.1 Muestreo y Cuantificación
Cuando se captura una escena del mundo real nos encontramos con una
señal continua, esto es, analógica, que debemos discretizar en dos
sentidos a la hora de digitalizar la imagen: el muestreo y la cuantificación.
Lo primero hace referencia al número de píxeles en los que se dividirá la
escena, de modo que, cuanto mayor sea este número, más detalles de la
misma se podrán captar, y viceversa. Lo segundo hace referencia a la
amplitud de la señal, estableciendo más niveles de gris cuanto mayor sea
el número de divisiones establecidas sobre la misma.
En cuanto al muestreo, las cámaras actuales cuentan con la potencia
necesaria para dividir la escena en millones de píxeles, por lo que la
resolución alcanzada puede ser enorme. Sin embargo, desde el punto de
vista de proyectos como el que nos ocupa, tratar de analizar patrones y
propiedades con una resolución tan elevada conllevaría un gasto
computacional tremendo, además de que las variaciones observables
disminuirían su frecuencia de aparición (no es lo mismo que aparezcan
cambios interpretables a uno o dos píxeles de distancia que a varias
decenas), pudiendo perjudicar los resultados de caracterización. Por este
motivo, para la mayoría de aplicaciones que
conlleven el análisis de un número muy elevado
de muestras, se recurre a reducir la resolución de
las muestras. Un ejemplo de esto puede verse en
la Figura 3-2.
Respecto a la cuantificación, ya habíamos
comentado que lo usual es trabajar con 8 bits de
información por píxel, consiguiendo así
diferenciar entre 256 niveles de gris distintos. Es
posible reducir la cuantificación modificando
los valores de la matriz original siguiendo un
proceso similar al que se recoge en la Figura
3-3, donde para mejor visualización se van
asignando los nuevos grises con el mayor
contraste posible. Si aplicamos esto a una
imagen, como se puede ver en la Figura 3-4,
observamos que prácticamente a partir de 32
grises las diferencias son imperceptibles (si bien
es verdad que el redudido tamaño
de las muestras al plasmarlas
sobre el documento ayuda a la
consagración de este efecto). Es
por esto que, en la práctica, a pesar
de que se pueda realizar un
proceso de cuantificación más
preciso, 8 bits son más que
suficientes para la mayor parte de
las aplicaciones.
28 = 256
27 = 128
26 = 64
25 = 32
24 = 16
23 = 8
22 = 4
21 = 2
Figura 3-3. Modelo de reducción de cuantificación desde 8 bits
hasta 1 bit de información por píxel.
Figura 3-2. Reducción del muestreo de
una imagen (01A), reescaladas para
comparación.
100x100 75x75
50x50 25x25
Figura 3-4. Variación de cuantificación desde 1 hasta 8 bits por píxel sobre una
imagen (01A).
2 4 8 16
32 64 128 256
3.1.2 Color
Para la representación del color se pueden usar varios modelos normalizados, siendo los más conocidos el RGB,
el CMY y el HSV, que podemos ver en la Figura 3-5.
El CMY (del inglés Cyan, Magenta, Yellow, que son, respectivamente, los colores primarios en pigmentos, cian,
magenta y amarillo) es un modelo sustractivo, es decir, que se basa en la mezcla de pigmentos para crear nuevos
colores, y se utiliza principalmente en funciones de impresión. El HSV (del inglés Hue, Saturation, Value) se
basa en tres parámetros modificables para la representación del color: el tono o matiz, que indica qué color
(verde, rojo, etc.) se quiere conseguir; la saturación, que establece la pureza del color (a menor saturación más
se diluye el color, volviéndose cada vez más grisáceo hasta llegar a blanco); y el brillo o valor, que constituye la
variación entre negro y blanco (o cualquier otro tono, dependiendo
de la saturación). El RGB (del inglés, Red, Green, Blue, que son,
respectivamente, los colores primarios de luz, rojo, verde y azul)
es un modelo aditivo que consigue nuevas tonalidades a partir de
la mezcla de los haces primarios de luz y es la representación más
habitual, por lo que nos centraremos en ella.
La idea es utilizar tres imágenes complementarias de intensidades
diferentes, una por cada matiz primario, de modo que cuando se
combinen posteriormente se reproduzca el color de cada píxel. En
lugar de trabajar con tres matrices distintas es más habitual, por
comodidad, utilizar una única matriz a la que se le añade una
tercera dimensión que indique el canal de color.
Así, si dedicamos, como habíamos dicho, 1 byte de información
por canal a cada píxel, podremos obtener un total de 224 combinaciones diferentes (es decir, casi 17 millones
de colores distintos), más que suficiente para la mayoría de aplicaciones. Un ejemplo de algunas de estas
combinaciones, en concreto las necesarias para generar los colores primarios y secundarios, puede observarse
en la Tabla 3-1.
Podemos ver estos conceptos aplicados sobre una imagen digital en la Figura 3-6, donde se ha separado una
muestra (clase 57-B, versión a color,
también disponible en [18]) en sus
canales RGB. Puede observarse
como la parte central, azul, presenta
una mayor intensidad (es decir, más
cercano a blanco) en su canal
correspondiente, B, mientras que la
parte exterior, verde, lo hace en el G.
Sin embargo, si bien es verdad que discriminar por colores podría ayudar enormemente en la tarea de
identificación y clasificación (por ejemplo, sería mucho más fácil distinguir directamente el césped verde de una
pared de ladrillos rojos, sin necesidad de atender a las demás características), en este proyecto se trata
expresamente con texturas, terreno donde, por definición, el color no es un descriptor válido.
C
M Y R G
B
H
S
V
Modelo RGB Modelo CMY Modelo HSV
Figura 3-5. Modelos de color RGB, CMY y HSV.
Canal R Canal G Canal B Color
Obtenido
0 0 0 NEGRO
255 0 0 ROJO
0 255 0 VERDE
0 0 255 AZUL
255 255 0 AMARILLO
0 255 255 CIAN
255 0 255 MAGENTA
255 255 255 BLANCO
Tabla 3-1. Combinaciones RGB.
Figura 3-6. Imagen RGB (57B) separada en canales.
Marco Teórico
10
10
Por lo tanto, si alguna de las imágenes de las bases de
datos disponibles fuese a color, habría que reducirlas a
escala de grises para poder trabajar con ellas. Para
realizar esta transformación hay diversos métodos
dependiendo del uso que se vaya a hacer de las
imágenes. Así, por ejemplo, se podría tener en cuenta
que el ojo humano es mucho más sensible al color
verde que al rojo y al azul (aproximadamente 59%,
30% y 11%, respectivamente) si un factor importante
fuese obtener un buen equivalente visual. En la Figura
3-7 podemos ver un ejemplo de ambos tipos de transformación, si bien la diferencia es prácticamente
imperceptible. De cualquier forma, ya existían versiones en escala de grises de ambos conjuntos utilizados, por
lo que no es necesario realizar esta transformación.
3.1.3 Histograma
Una forma usual de representar la frecuencia
con la que aparece cada tono de gris en la
imagen es mediante su histograma, que no es
más que un gráfico donde se representa cada
nivel de intensidad frente al número de
píxeles que tienen dicha intensidad. Los
histogramas pueden ser muy útiles porque
proporcionan información general de la
imagen sin necesidad de tenerla presente,
permitiendo identificar algún posible
inconveniente global como problemas de
brillo o de contraste, de los que hablaremos
en las siguientes subsecciones. También es
posible analizar su forma para extraer
información de más alto nivel o para
solucionar el problema de la separación de
regiones. En la Figura 3-8 puede observarse
un ejemplo de este tipo de gráfico.
3.1.4 Brillo
Parece evidente que cuanto mayor sea el número de
píxeles con niveles de intensidad cercanos a cero, es
decir, cuanto más hacia la izquierda esté desplazado
el histograma, más oscura será la imagen y, en
consecuencia, su brillo será menor. Del mismo modo,
cuanto más desplazado esté el histograma hacia la
derecha mayor será el brillo de la imagen
correspondiente.
Las modificaciones de brillo se pueden realizar sin más que sumar o restar un valor fijo a todos los elementos
de la matriz que representa a la imagen, consiguiendo así el desplazamiento global deseado del histograma.
Únicamente habrá que tener en cuenta la saturación de aquellos valores que se salgan del intervalo [0, 255].
Un ejemplo de esto puede verse en la Figura 3-9, donde se ha sustraído y añadido un valor de 50 a la matriz
original para reducir y aumentar el brillo respectivamente. Además, en la Figura 3-10 puede observarse el
correspondiente desplazamiento del histograma respecto al de la Figura 3-8.
Figura 3-8. Histograma de una imagen (01A, de la Figura 3-1).
Figura 3-9. Variación de brillo de una imagen (01A).
Figura 3-7. Transformación a escala de grises de una
imagen (57B) RGB.
media sensibilidad
3.1.5 Contraste
Otro concepto importante es el de contraste, es decir, el grado de concentración de los distintos niveles de
intensidad entre sí: si todas las intensidades que
aparecen en la imagen son de un nivel parecido,
entonces la imagen tendrá poco contraste; por el
contrario, si los tonos de gris están dispersos entre sí,
el contraste será más elevado, lo que se traduce en
una mejor visibilidad de las distintas regiones de la
imagen.
Para modificar el contraste habría que contraer o expandir el
histograma por medio de alguna función de transformación,
comúnmente denominada curva tonal. Podría usarse, por ejemplo,
la expresión de la ecuación (3-1), obtenida de [19]. Las curvas
tonales para modificar el contraste obtenidas de dicha expresión,
así como las empleadas en la subsección anterior para cambiar el
brillo, pueden verse en la Figura 3-12.
De un modo similiar, podrían establecerse todo tipo de curvas
destinadas a realizar un gran abanico de modificaciones sobre la
imagen original, como modificar únicamente alguna zona concreta
de la misma.
Así, en la Figura 3-11 podemos ver el efecto conseguido al variar
el contraste de una imagen, mientras que en la Figura 3-13
podemos ver la modificación conseguida en el histograma tras
aplicar a una imagen las curvas tonales de contraste ya comentadas:
se contrae o expande cuando el contraste disminuye o aumenta,
respectivamente, respecto al histograma de la Figura 3-8.
𝑛𝐼𝑚(𝑖, 𝑗) = 255 (1
1 + 𝑒−𝑣𝑎𝑙𝑜𝑟 (𝑖𝑚(𝑖,𝑗)−127)) (3-1)
Figura 3-10. Traslación del histograma tras modificar el brillo (imágenes laterales de la Figura 3-9).
Figura 3-11. Variación de contraste de una imagen (01A).
Figura 3-12. Ejemplo de curvas tonales para
modificar el brillo o el contraste.
Marco Teórico
12
12
3.1.6 Gradiente
El gradiente, ∇𝑔, de cada píxel de una imagen es un vector de dos componentes, horizontal y vertical, cuya
dirección será la de la máxima variación de intensidad entre un determinado píxel y sus vecinos. Cuanto mayor
sea el módulo del gradiente, mayor será el contraste entre los píxeles bajo estudio. Es por esto que el gradiente
se puede utilizar para detectar los contornos de una imagen con relativa facilidad.
La definición formal de gradiente viene dada por la expresión (3-2), aunque para el caso de una imagen discreta
puede simplificarse por la (3-3); de modo que el gradiente para un punto (𝑖, 𝑗) de una imagen 𝑓 cualquiera
resulta de la expresión (3-4). El módulo del gradiente viene dado por la ecuación (3-5) aunque es común
simplificarlo por la (3-6), ya que el resultado cualitativo es similar y se calcula más rápidamente. En cuanto al
argumento del gradiente, se calcula con (3-7).
∇𝑔 = (𝐺𝑥
𝐺𝑦) = (
𝜕𝑔𝜕𝑥𝜕𝑔𝜕𝑦
) (3-2)
G = (𝐺𝑥
𝐺𝑦) = (
∆𝑔∆𝑥∆𝑔∆𝑦
) (3-3)
𝐺𝑖𝑗 = (𝑓𝑖,𝑗 − 𝑓𝑖,𝑗−1
𝑓𝑖,𝑗− 𝑓𝑖−1,𝑗) (3-4)
|∇𝑔| = √(𝐺𝑥)2 + (𝐺𝑦)
2 (3-5)
|∇𝑔| = |𝐺𝑥| + |𝐺𝑦| (3-6)
arg(∇𝑔) = arctan (𝐺𝑦
𝐺𝑥) (3-7)
Figura 3-13. Modificación del histograma tras variar el contraste (imágenes laterales de Figura 3-11).
No obstante, es habitual calcular cada elemento 𝐺𝑖𝑗 mediante una plantilla, 𝑃,
que no es más que una matriz con la que se puede realizar una operación de
convolución sobre la imagen mediante la expresión (3-8). Si tomamos la
vecindad de orden 9 de un píxel, esto es, aquella región en la que intervienen
el propio píxel y los 8 vecinos que lo rodean, tal y como se puede ver en la
Tabla 3-2, tendremos que usar plantillas de tamaño 3𝑥3.
Así, en la definición inicial de 𝐺𝑖𝑗 de la expresión (3-4) se usaron las plantillas
de (3-9) para calcular 𝐺𝑥 y 𝐺𝑦 respectivamente. Otras plantillas, también
llamadas operadores, muy utilizadas en la práctica son las de Roberts (3-10),
Prewitt (3-11) y Sobel (3-12). Escoger una u otra plantilla dependerá en cierta
medida de la imagen que estemos tratando. A diferencia de la plantilla
definición o del operador Roberts, el operador Prewitt es ya de 3x3,
permitiendo hacer frente de un modo más adecuado al posible ruido de la
imagen. Además de esto, el operador Sobel pone más énfasis en los píxeles centrales, realizando así un efecto
de suavizado que permite reducir este ruido. Otra diferencia es que cualquiera de las dos plantillas Roberts
detecta mejor las variaciones diagonales, pudiendo aportar ya información de cambios en ambas direcciones por
sí solas; en cambio, con Prewitt o Sobel, se puede ver que 𝑃𝑥 es buena detectando bordes verticales mientras que
𝑃𝑦 lo es con la detección de bordes
horizontales, y es necesario que se
complementen en el módulo para
detectar ambos tipos de variación.
En la Figura 3-14 podemos ver un
ejemplo de cálculo de gradiente y
módulo usando el operador Prewitt.
𝐺𝑖𝑗 = ∑ ∑ 𝑝𝑟𝑠 · 𝑓𝑖−𝑟,𝑗−𝑠
∞
𝑠=−∞
∞
𝑟=−∞
𝑐𝑜𝑛 𝑟, 𝑠 ∈ 𝕂 (3-8)
𝐷𝑒𝑓𝑖𝑛𝑖𝑐𝑖ó𝑛: 𝑃𝑥 = [0 0 00 1 −10 0 0
] , 𝑃𝑦 = [0 0 00 1 00 −1 0
] (3-9)
𝑅𝑜𝑏𝑒𝑟𝑡𝑠: 𝑃𝑥 = [0 0 00 1 00 0 −1
] , 𝑃𝑦 = [0 0 −10 1 00 0 0
] (3-10)
𝑃𝑟𝑒𝑤𝑖𝑡𝑡: 𝑃𝑥 = [−1 0 1−1 0 1−1 0 1
] , 𝑃𝑦 = [−1 −1 −10 0 01 1 1
] (3-11)
𝑆𝑜𝑏𝑒𝑙: 𝑃𝑥 = [−1 0 1−2 0 2−1 0 1
] , 𝑃𝑦 = [−1 −2 −10 0 01 2 1
] (3-12)
∇2𝑔 =𝜕2𝑔
𝜕𝑥2+
𝜕2𝑔
𝜕𝑦2 (3-13)
𝐿𝑎𝑃𝑙𝑎𝑐𝑖𝑎𝑛𝑎 = [0 −1 0−1 4 −10 −1 0
] (3-14)
𝑓𝑖−1,𝑗−1 𝑓𝑖−1,𝑗 𝑓𝑖−1,𝑗+1
𝑓𝑖,𝑗−1 𝑓𝑖,𝑗 𝑓𝑖,𝑗+1
𝑓𝑖+1,𝑗−1 𝑓𝑖+1,𝑗 𝑓𝑖+1,𝑗+1
Tabla 3-2. Vecindad 9 o entorno
3x3 de un píxel.
Figura 3-14. Gx, Gy y módulo de una imagen (A01) con Prewitt.
Marco Teórico
14
14
Por otro lado, a la hora de calcular el gradiente o, en general, cualquier valor
mediante plantillas, surge un problema relacionado con los extremos de la
imagen: como se puede observar en la Figura 3-15, no existe el concepto de
vecindad de orden 9 en los bordes. Si bien se han contemplado diferentes
simplificaciones, como sustituir el borde por un marco negro o por un valor
similar al del píxel adyacente, lo más habitual es eliminarlo directamente ya que,
normalmente, el tamaño de la imagen es suficientemente grande para que la
información perdida sea una nimiedad y, de todos modos, con los otros arreglos
mencionados la información era igualmente alterada.
De un modo similar, también sería posible trabajar con la derivada de segundo
orden aprovechando la propiedad de que esta se hace cero cuando el gradiente es
máximo (es decir, cuando más probable es que haya un contorno). Si hablamos
de una imagen digital, que está en dos dimensiones, podríamos utilizar el
operador laplaciano, que da lugar a un escalar y que se define según la expresión (3-13). Y, al igual que con los
gradientes, también se puede usar una plantilla para calcular la laplaciana mediante convolución. Una muy
utilizada es la de (3-14).
Así, si pasamos el módulo del gradiente o la laplaciana obtenida por un valor umbral que permita eliminar los
valores pequeños, de modo que todo elemento que no
pase ese umbral se vuelva negro y el que sí lo haga sea
blanco (por tener un mejor contraste) habremos
creado una imagen binaria de contornos (IBC), como
se puede ver en la Figura 3-16, donde, idealmente,
sólo se resaltarán los contornos de la imagen. El
problema en este tipo de tareas consiste en localizar un
valor adecuado para el umbral.
3.2 Características para la descripción de texturas
Como se adelantó en la introducción, lo ideal para cualquier descriptor es que presente el mismo tipo de
comportamiento ante las posibles variaciones de la imagen, tanto en presencia de cualquier transformación
geométrica, debidas a movimientos de traslación, de rotación o a cambios de escala, como frente a alteraciones
de iluminación en el entorno e, incluso, ante el posible ruido.
Además, otra cualidad imprescindible para el problema de clasificación es que el descriptor sea lo
suficientemente discriminativo entre clases, de modo que permita distinguirlas de un modo adecuado. Si dos o
más clases presentan una caracterización similar, entonces el sistema no será capaz de diferenciarlas, pasando el
etiquetado de las muestras a ser un proceso con un gran grado de aleatoriedad.
Se comentarán, a continuación, algunos de los descriptores que han tratado de solucionar el problema de la
caracterización de texturas, como son los obtenidos mediante métodos estadísticos, mediante el gradiente, los
de Laws y el descriptor LBP.
3.2.1 Métodos estadísticos
Los métodos estadísticos se basan en la geometría de la distribución intensidades de los píxeles de una imagen,
es decir, en el histograma de sus niveles de gris. Así, los descriptores estadísticos de primer orden cuantifican,
por ejemplo, la simetría o la forma del histograma, indicando de esta forma si predominan algunos valores
concretos o se presentan determinadas tendencias.
Figura 3-15. Problema de los
bordes en el análisis de una
imagen.
Figura 3-16. IBC con distinto umbral obtenida a partir del
módulo de Figura 3-14.
Sin embargo, si se utilizan únicamente los histogramas estaremos limitando los resultados ya que estaremos
ignorando la información disponible referente a la localización de
los píxeles. Los descriptores estadísticos de segundo orden,
además de usar la distribución espacial de intensidades, tratan de
establecer una relación de co-ocurrencia entre un píxel y otro
vecino que se encuentra a una distancia concreta en una dirección
determinada.
De este modo, se podría seguir subiendo el orden de estadísticos
relacionando 3 o más píxeles, pero en la práctica no se suele hacer
debido a que los resultados obtenidos no serían fácilmente
interpretables, además de que el gasto computacional se
incrementaría considerablemente.
El hándicap de este tipo de métodos es que obliga a restringir, o a
cuidar, las condiciones de iluminación adquiriendo las muestras en
un entorno muy controlado, pues cualquier cambio puede
provocar que los histogramas sean bien distintos para muestras de
la misma textura y, con ellos, también los descriptores; si bien es
verdad que, conforme el orden de los estadísticos aumenta, estos
problemas se mitigan un poco al entrar en juego las relaciones de
un píxel con su entorno.
3.2.1.1 Descriptores estadísticos de primer orden
Estos descriptores son relativamente fáciles de calcular y apenas
requieren gasto computacional. Para obtenerlos se utilizan los
momentos del histograma respecto a la intensidad media de una
imagen.
La intensidad media, o nivel de gris medio, 𝑚, se calcula a partir
de la expresión (3-15), donde 𝑧 es un vector que contiene las 𝐿
intensidades o niveles de gris distintos de la imagen y 𝑝 es otro
vector, también de tamaño 𝐿, que contiene la probabilidad de que
las correspondientes intensidades aparezcan en la imagen.
Por otro lado, el momento n-ésimo, 𝜇𝑛, respecto a la media de una
imagen se calcula según (3-16). Tanto 𝑚 como 𝜇𝑛 podrían, tras un
proceso de normalización, usarse ya como descriptores válidos de
una imagen. Si bien 𝑚 no es un descriptor de textura como tal,
proporciona información importante respecto al nivel de gris y
sería capaz de discriminar por sí mismo en casos simples. En
cuanto a los momentos, la normalización se hace necesaria ya que
estos crecen de manera exponencial conforme el orden aumenta,
lo que se traduce en que la diferencia entre los momentos de menor
orden, que además son los más utilizados, es nimia en
comparación con la diferencia entre los de mayor orden, haciendo
que los primeros sean completamente inútiles. Se hablará del
proceso de normalización más adelante, en el capítulo 4.
Ahora bien, comúnmente se calculan de manera previa un
conjunto de coeficientes utilizando los momentos de hasta orden
cuatro que permiten una interpretación más sencilla de los
resultados.
Al momento de segundo orden se le llama también varianza, y se puede usar directamente como descriptor ya
que es un modo de cuantificar el contraste de intensidad de la imagen. Se suele representar según la expresión
(3-17). No obstante, también se usa para calcular el coeficiente de suavidad relativa, 𝑅, que está acotado en el
intervalo [0, 1] de modo que para imágenes con nivel de gris constante será nulo (porque el contraste será cero),
mientras que para imágenes con contraste elevado tenderá a la unidad. La expresión de 𝑅 viene dada por (3-18).
a: 0.0110
k: 0.0018
a: -0.3106
k: -0.6095
a: -0.5154
k: 0.2486
a: 1.0538
k: 2.6951
Figura 3-17. Ejemplos de asimetría (a) y
curtosis (k) en diferentes histogramas.
Marco Teórico
16
16
El momento de tercer orden cuantifica la desviación que adopta el histograma respecto al valor medio de
intesidad y se suele normalizar empleando el coeficiente de asimetría, a, que será nulo si el histograma es
simétrico (es decir, no presenta desviación), negativo si está desviado hacia la derecha y positivo si lo está hacia
la izquierda. Cuanto mayor valor absoluto, mayor desviación. Este coeficiente se calcula siguiendo la ecuación
(3-19).
Por último, el momento de orden cuatro es una medida de la monotonía relativa del histograma y se suele
normalizar empleando el coeficiente de curtosis, k. Este coeficiente está centrado en tres, es decir, que tres es el
resultado que se obtiene si la distribución es normal. Por este motivo se le suele restar esta cantidad a la expresión
para centrarla en cero, así si el coeficiente es positivo se tendría un histograma más esbelto de lo normal, mientras
que si es negativo será más achatado. Cuanto mayor valor absoluto, mayor deformación. De modo que la
expresión del coeficiente de curtosis resultaría de (3-20).
Un ejemplo de asimetría y curtosis calculada sobre algunas de las distintas muestras de las que se disponen en
este proyecto pueden verse en la Figura 3-17.
Otros descriptores muy utilizados son la uniformidad, u, y la entropía, e, que se obtienen empleando únicamente
el vector de probabilidades de niveles de gris, 𝑝, que ya comentamos en el cálculo de la intensidad media (𝑚),
y que proporcionan, respectivamente, una medida de la uniformidad, propiamente dicha, y de la aleatoriedad de
las intensidades de la imagen. De este modo, cuanto más se acerque la distribución de la imagen a una
distribución normal, mayor será la uniformidad y menor la aleatoriedad (y, por tanto, la entropía). Las
expresiones para calcularlas son (3-21) y (3-22).
𝑖𝑛𝑡𝑒𝑛𝑠𝑖𝑑𝑎𝑑 𝑚𝑒𝑑𝑖𝑎 (𝑚) = ∑𝑧𝑖 𝑝(𝑧𝑖)
𝐿
𝑖=1
(3-15)
𝑚𝑜𝑚𝑒𝑛𝑡𝑜 𝑛 − é𝑠𝑖𝑚𝑜, 𝜇𝑛(𝑧) = ∑(𝑧𝑖 − 𝑚)𝑛 𝑝(𝑧𝑖)
𝐿
𝑖=1
(3-16)
𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎, 𝜎2(𝑧) = 𝜇2(𝑧) (3-17)
𝑠𝑢𝑎𝑣𝑖𝑑𝑎𝑑 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 (𝑅) = 1 − 1
1 + 𝜎2(𝑧) (3-18)
𝑎𝑠𝑖𝑚𝑒𝑡𝑟í𝑎 (𝑎) = 𝜇3(𝑧)
𝜇23 2⁄ (𝑧)
(3-19)
𝑐𝑢𝑟𝑡𝑜𝑠𝑖𝑠 (𝑘) =𝜇4(𝑧)
𝜇22(𝑧)
− 3 (3-20)
𝑢𝑛𝑖𝑓𝑜𝑟𝑚𝑖𝑑𝑎𝑑 (𝑢) = ∑𝑝2(𝑧𝑖)
𝐿
𝑖=1
(3-21)
𝑒𝑛𝑡𝑟𝑜𝑝í𝑎 (𝑒) = −∑𝑝(𝑧𝑖) ln (𝑝(𝑧𝑖))
𝐿
𝑖=1
(3-22)
3.2.1.2 Momentos de Hu
Los momentos de una imagen son medidas que tratan de describir la geometría de alguna región utilizando los
píxeles que intervengan en la misma. Así, los momentos invariantes de Hu son un conjunto de siete expresiones
cuyo resultado permanece razonablemente invariante ante cambios de rotación, traslación o escala en una
imagen. Esto lleva a pensar que podrían ayudar a reducir los cambios de aspecto producidos por la toma de
muestras desde distintos ángulos a la hora de modelar una textura, consiguiendo disminuir la dispersión de dichas
muestras. Por lo tanto, podría considerarse su uso como descriptores de textura.
Para obtener los momentos invariantes de Hu partimos desde la expresión de momento de orden (𝑝 + 𝑞) para
una función continua y bidimensional 𝑓(𝑥, 𝑦), en la expresión (3-23), que para una imagen digital de tamaño
𝑀𝑥𝑁 queda reducida a (3-24), donde 𝑖 representa la fila y 𝑗 la columna.
𝑚𝑝𝑞 = ∫ ∫ 𝑥𝑝𝑦𝑞𝑓(𝑥, 𝑦) 𝑑𝑥 𝑑𝑦∞
−∞
∞
−∞
(3-23)
𝑚𝑝𝑞 = ∑∑𝑖𝑝𝑗𝑞 𝑓(𝑖, 𝑗)
𝑁
𝑗=1
𝑀
𝑖=1
(3-24)
Así, se pueden expresar los momentos centrales de orden (𝑝 + 𝑞) siguiendo la ecuación (3-25), donde las
coordenadas centrales se han obtenido con (3-26). A continuación, los momentos centrales normalizados pueden
hallarse con la expresión (3-27), donde el exponente 𝛾 resulta de (3-28).
𝜇𝑝𝑞 = ∑∑(𝑖 − 𝑖)̅𝑝 (𝑗 − 𝑗)̅𝑞 𝑓𝑖𝑗
𝑁
𝑗=1
𝑀
𝑖=1
(3-25)
𝑖̅ = 𝑚10
𝑚00 , 𝑗̅ =
𝑚01
𝑚00 (3-26)
𝜂𝑝𝑞 =𝜇𝑝𝑞
𝜇00𝛾
(3-27)
𝛾 =𝑝+𝑞
2+ 1 para (𝑝 + 𝑞) ∈ ℕ\{0,1} (3-28)
Utilizando los momentos centrales normalizados de segundo y tercer orden (esto es, 𝜂20, 𝜂02, 𝜂21, 𝜂12,𝜂30 𝑦 𝜂03), se pueden obtener las expresiones de los siete momentos invariantes de Hu, desde (3-29) hasta
(3-35). Como generalmente estas expresiones ofrecen valores muy pequeños, se suele tomar el módulo del
logaritmo natural o neperiano del resultado.
𝜙1 = 𝜂20 + 𝜂02 (3-29)
𝜙2 = (𝜂20 − 𝜂02)2 + 4𝜂11
2 (3-30)
𝜙3 = (𝜂30 + 3𝜂12)2 + (3𝜂21 − 𝜂03)
2 (3-31)
𝜙4 = (𝜂30 + 𝜂12)2 + (𝜂21 + 𝜂03)
2 (3-32)
𝜙5 = (𝜂30 − 3𝜂12)(𝜂30 + 𝜂12)[(𝜂30 + 𝜂12)2 − 3(𝜂21 + 𝜂03)
2]
+ (3𝜂21 − 𝜂03)(𝜂21 + 𝜂03)[3(𝜂30 + 𝜂12)2 − (𝜂21 + 𝜂03)
2] (3-33)
Marco Teórico
18
18
𝜙6 = (𝜂20 − 𝜂02)[(𝜂30 + 𝜂12)2 − (𝜂21 + 𝜂03)
2]
+ 4𝜂11(𝜂30 + 𝜂12)(𝜂21 + 𝜂03) (3-34)
𝜙7 = (3𝜂21 − 𝜂30)(𝜂30 + 𝜂12)[(𝜂30 + 𝜂12)2 − 3(𝜂21 + 𝜂03)
2]+ (3𝜂12 − 𝜂30)(𝜂21 + 𝜂03)[3(𝜂30 + 𝜂12)
2 − (𝜂21 + 𝜂03)2]
(3-35)
Puede verse el resultado que ofrecen estos momentos en una imagen rotada y reescalada en la Tabla 3-3.
3.2.1.3 Descriptores estadísticos de segundo orden (GLCM)
El análisis de texturas usando la matriz de co-ocurrencia de los niveles de gris, también conocida como GLCM
(por sus siglas en inglés, Gray-Level Co-occurrence Matrix), debe ofrecer un mejor resultado que los estadísticos
de primer orden pues utiliza información relativa a la posición de los píxeles de una imagen aunque, como
contrapartida, el coste computacional se incremente.
La matriz de co-ocurrencia establece la relación entre cada píxel de la imagen con otro píxel de su entorno a una
distancia 𝑑 (en píxeles) en una dirección 𝐷. De un modo más concreto, especifica cuántas veces se cumplen
todas las relaciones de intensidades entre dos píxeles en una imagen, facilitando la manifestación de ciertas
tendencias en la distribución espacial de los niveles de gris.
Original Escala 75% Rotación 45º
𝝓𝟏 6.5774 6.5774 6.5785
𝝓𝟐 17.7404 17.7389 17.7344
𝝓𝟑 24.6472 24.6492 24.6621
𝝓𝟒 25.1743 25.1765 25.1935
𝝓𝟓 50.4861 50.4918 50.5622
𝝓𝟔 34.4350 34.4366 34.4459
𝝓𝟕 50.8519 50.8599 50.5430
Tabla 3-3. Comparación de los momentos de Hu aplicados a una imagen (01A).
Respecto al operador de dirección, 𝐷, se puede emplear cualquiera
de las ocho direcciones principales del espacio, comúnmente
también representadas con grados, tal y como se muestra en la
imagen de la Figura 3-18. Si se quiere realizar un estudio
exhaustivo, en lugar de tomar una por una todas las direcciones
posibles para calcular las GLCM de forma independiente, basta
con tomar cuatro de ellas (normalmente 𝑁𝑂,𝑁,𝑁𝐸 𝑦 𝐸) ya que se
cumple lo siguiente: la GLCM calculada al tomar una dirección
cualquiera es igual a la traspuesta de la calculada al tomar la
dirección opuesta (por ejemplo 𝐺𝐿𝐶𝑀𝐸 = 𝐺𝐿𝐶𝑀𝑂𝑇). También es
usual, en aquellas ocasiones en las que, a priori, no se conoce qué
dirección es más representativa en las muestras bajo estudio,
obtener la GLCM invariante en el espacio, que viene dada por el
promedio de las matrices de co-ocurrencia obtenidas en las cuatro
direcciones empleadas usualmente.
En cuanto al operador de distancia, 𝑑, es posible emplear cualquier valor siempre que la imagen lo permita,
teniendo en cuenta que cuanto mayor sea la distancia escogida mayor será la ventana que modela el entorno del
píxel bajo estudio y, en consecuencia, mayor la cantidad de borde de la imagen que podemos perder. Si el borde
es insignificante el problema se puede suponer despreciable, pero si el borde
representa una gran parte de la imagen hay que tener en cuenta que estamos
perdiendo información y que los resultados pueden verse comprometidos.
Puede verse un ejemplo de esto en la Figura 3-19: en la parte superior
avanzamos un píxel hacia la derecha por lo que al ir recorriendo la imagen píxel
a píxel perderemos la información de la columna derecha al no tener, dichos
puntos, vecinos en esa dirección; mientras que en la inferior avanzamos dos
píxeles en dirección sureste, con lo cual perderemos las dos últimas filas y las
dos últimas columnas. Los bordes rojos indican un píxel de origen al azar y los
azules el píxel vecino correspondiente. La zona sombreada representa el borde
perdido, donde los píxeles no pueden acceder a ningún píxel vecino bajo las
condiciones dadas. Por otro lado, tampoco interesan demasiado las relaciones
de contraste que suceden a muchos píxeles de distancia, por eso no es común
tomar distancias mayores de 4 o 5 píxeles. De hecho, si la imagen es muy
detallada, se tiende a simplificarla mediante procesos de cuantificación y
escalado para acentuar dichas relaciones de contraste.
Así, para calcular la matriz de co-ocurrencia, se debe obtener el vector 𝑧 (similar
al de la expresión (3-15)) con las 𝐿 intensidades que aparecen en la imagen
y calcular las veces que el nivel de gris en un píxel es igual al del que sea su
vecino según las especificaciones dadas. Para ello se usará la matriz intermedia
A, que se puede ver en (3-36), donde el elemento 𝑎𝑖𝑗 representa las veces que
el píxel bajo estudio tiene intensidad 𝑧𝑖 y el píxel que hace de vecino la
intensidad 𝑧𝑗.
A continuación, para poder operar con ellas posteriormente, necesitamos que estas matrices sean simétricas, es
decir, que los elementos de índices opuestos (por ejemplo, 𝑎12 y 𝑎21) tengan el mismo valor. Una forma fácil
de conseguir esto es obtener la matriz 𝐵 con (3-37). Debe tenerse en cuenta que esta nueva matriz
conceptualmente ya no representa de forma directa las relaciones entre los niveles de gris de la imagen, debido
a que estas no pueden repetirse un número no natural de veces, sino que se trata de una matriz simétrica
equivalente.
Ahora sólo nos queda normalizar esta última matriz 𝐵 para que represente la probabilidad de que se den las
relaciones de intensidad, de manera que al sumar todos sus elementos obtengamos la unidad (recordemos que
la probabilidad trabaja con valores recogidos en el intervalo [0,1]). Para ello, únicamente hay que dividir la
matriz por el número de píxeles de la imagen que cumplen las especificaciones, es decir, que tienen un vecino a
distancia 𝑑 en dirección 𝐷. En definitiva, la matriz de co-ocurrencia de niveles de gris de una imagen se calcula
según la expresión (3-38). Así se podría completar la Tabla 3-4, de ejemplo. Puede verse, como ya se adelantó,
que tomar direcciones opuestas da como resultado matrices traspuestas.
Figura 3-18. Posibles operadores de dirección
en la GLCM.
Figura 3-19.Ejemplo de pérdida
de borde tras seleccionar el
operador distancia.
Marco Teórico
20
20
Una vez obtenida la 𝐺𝐿𝐶𝑀, de elementos 𝑐𝑖𝑗,
pueden evaluarse a partir de ella un conjunto
de expresiones correspondientes a los
descriptores estadísticos de segundo orden. Si
bien Haralick propuso un total de 14
descriptores distintos, se trabajará
únicamente con los más comúnmente
utilizados.
Un primer descriptor a tener en cuenta es el
elemento con valor más alto, que se
corresponde con la máxima probabilidad, M
(3-39), con la que se da una relación de
intensidades, ya que puede ofrecer una idea
de la tendencia principal de los grises.
Otros descriptores ampliamente utilizados
son los denominados contraste, c, y
homogeneidad, h, que representan la
variación local (o la no variación,
respectivamente) de intensidades en una
imagen, y que se obtienen mediante las
expresiones (3-40) y (3-41). Se observa que
estos dos descriptores son inversos: la
homogeneidad tiende a valores elevados
cuando los elementos de mayor valor de la
𝐺𝐿𝐶𝑀 están cerca de su diagonal principal,
que es donde (𝑖 − 𝑗)2 se hace mínimo, lo que
significaría que el cambio en el nivel de gris
es menos pronunciado (si recordamos la
matriz 𝑖𝑚𝑎𝑔𝑒𝑛 del ejemplo anterior, en la
Tabla 3-4, no es lo mismo pasar de 1 a 3 que
de 1 a 8; habría menor variación de intensidad
en el primer caso) y, por ende, la
homogeneidad propiamente dicha será
mayor. Por otro lado, si esto pasa, el contraste
tiende a valores pequeños.
Análogamente a los estadísticos de primer
orden, el segundo momento angular (ASM, de
sus siglas en ingles Angular Second Moment)
y la entropía, E, también inversos, informan
de la similitud o la aleatoriedad de las
relaciones de intensidades en la imagen
respectivamente. Si bien hay variaciones de
nomenclatura en las distintas publicaciones
sobre el tema, en este proyecto se seguirán las
ecuaciones que se pueden ver desde (3-42)
hasta (3-44), considerando la uniformidad, U,
como la raíz cuadrada del ASM.
También es frecuente usar la correlación que,
con un resultado comprendido en el rango [−1,1], da una idea de la dependencia lineal
entre los niveles de intensidad de una imagen,
siendo ésta mayor cuanto mayor sea el resultado del descriptor. Este descriptor resulta de (3-45), donde las
medias, 𝜇, y las desviaciones típicas, 𝜎, se obtienen de (3-46) y (3-47), respectivamente.
imagen intensidades
𝑖𝑚𝑎𝑔𝑒𝑛 = 83
85
55
35
5 1 1 8
𝑧 = [1 3 5 8]
𝐿 = 4
matriz intermedia, 𝐴𝐿𝑥𝐿
𝐴 =
𝑎00 𝑎01
𝑎10 𝑎11
𝑎02 𝑎03
𝑎12 𝑎13𝑎20 𝑎21
𝑎30 𝑎31
𝑎22 𝑎23
𝑎32 𝑎33
Operador distancia 𝑑 = 1 píxel
Dirección 𝑁𝑂 Dirección 𝑁 Dirección 𝑁𝐸 Dirección 𝐸
0 10 0
1 00 0
0 00 0
1 21 0
0 00 0
2 00 1
0 20 0
1 11 0
0 00 0
2 00 1
0 10 0
2 00 0
1 00 0
0 11 0
1 10 0
2 01 1
Dirección 𝑆𝐸 Dirección 𝑆 Dirección 𝑆𝑂 Dirección 𝑂
0 01 0
0 00 0
1 00 0
1 12 0
0 00 0
0 02 0
2 00 1
1 11 0
0 00 0
0 01 0
2 00 1
2 00 0
1 00 0
1 01 0
0 11 0
2 10 1
Operador distancia 𝑑 = 2 píxeles
Dirección 𝑁𝑂 Dirección 𝑁 Dirección 𝑁𝐸 Dirección 𝐸
0 00 0
0 10 0
0 00 0
0 00 1
0 00 0
1 10 0
0 00 1
0 10 0
0 10 0
0 00 0
0 00 0
1 00 0
0 00 0
0 11 0
1 00 1
1 01 0
Dirección 𝑆𝐸 Dirección 𝑆 Dirección 𝑆𝑂 Dirección 𝑂
0 00 0
0 00 0
0 01 0
0 00 1
0 00 0
0 00 1
1 01 0
0 01 0
0 01 0
0 00 0
0 00 0
1 00 0
0 00 0
1 00 1
0 11 0
1 10 0
𝑀𝑎𝑡𝑟𝑖𝑧 𝑠𝑖𝑚é𝑡𝑟𝑖𝑐𝑎 𝑒𝑞𝑢𝑖𝑣𝑎𝑙𝑒𝑛𝑡𝑒, 𝐵 (𝑑 = 1, 𝐷 = 𝑁𝑂)
𝐵 =
0 0.50.5 0
0.5 00 0
0.5 00 0
1 1.5
1.5 0
𝐺𝐿𝐶𝑀 (𝑑 = 1, 𝐷 = 𝑁𝑂)
𝐺𝐿𝐶𝑀 =
0 0.083
0.083 0 0.083
00 0
0.083 00 0
0.16 0.25
0.25 0
Tabla 3-4. Ejemplo de cálculo de GLCM.
𝐴 = [
𝑎00 ⋯ 𝑎0𝐿
⋮ ⋱ ⋮𝑎𝐿0 ⋯ 𝑎𝐿𝐿
] (3-36)
𝐵 =𝐴 + 𝐴𝑇
2 (3-37)
𝐺𝐿𝐶𝑀 =𝐵
∑ ∑ 𝐴(𝑖, 𝑗)𝐿𝑗=1
𝐿𝑖=1
(3-38)
𝑀á𝑥𝑖𝑚𝑎 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 (𝑀) = 𝑚á𝑥(𝑐𝑖𝑗) (3-39)
𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒 (𝑐) = ∑∑(𝑖 − 𝑗)2 𝑐𝑖𝑗
𝐿
𝑗=1
𝐿
𝑖=1
(3-40)
𝐻𝑜𝑚𝑜𝑔𝑒𝑛𝑒𝑖𝑑𝑎𝑑 (ℎ) = ∑∑𝑐𝑖𝑗
(𝑖 − 𝑗)2
𝐿
𝑗=1
𝐿
𝑖=1
, 𝑝𝑎𝑟𝑎 𝑖 ≠ 𝑗 (3-41)
𝐴𝑆𝑀 (𝐴) = ∑∑𝑐𝑖𝑗2
𝐿
𝑗=1
𝐿
𝑖=1
(3-42)
𝑈𝑛𝑖𝑓𝑜𝑟𝑚𝑖𝑑𝑎𝑑/𝐸𝑛𝑒𝑟𝑔í𝑎 (𝑈) = √𝐴𝑆𝑀 (3-43)
𝐸𝑛𝑡𝑟𝑜𝑝í𝑎 (𝐸) = −∑∑𝑐𝑖𝑗ln (𝑐𝑖𝑗)
𝐿
𝑗=1
𝐿
𝑖=1
(3-44)
𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 (𝐶) = ∑∑(𝑖 − 𝜇𝑥)(𝑗 − 𝜇𝑦)
𝜎𝑥𝜎𝑦𝑐𝑖𝑗
𝐿
𝑗=1
𝐿
𝑖=1
(3-45)
𝜇𝑥 = ∑ ∑ 𝑖𝑐𝑖𝑗𝐿𝑗=1
𝐿𝑖=1 , 𝜇𝑦 = ∑ ∑ 𝑗𝑐𝑖𝑗
𝐿𝑗=1
𝐿𝑖=1 (3-46)
𝜎𝑥2 = ∑∑(𝑖 − 𝜇𝑥)
2𝑐𝑖𝑗 ,
𝐿
𝑗=1
𝐿
𝑖=1
𝜎𝑦2 = ∑∑(𝑗 − 𝜇𝑦)
2𝑐𝑖𝑗
𝐿
𝑗=1
𝐿
𝑖=1
(3-47)
3.2.2 Descriptores de Laws
Laws propuso una serie de vectores característicos que, combinados entre sí, dan lugar a un conjunto de plantillas
destinadas a calcular la energía de una textura, obteniendo un espacio considerable de descriptores sobre la
imagen. Los vectores, nombrados por la inicial del efecto que detectan en inglés (Level, Edge, Spot y Ripple),
pueden definirse para cualquier dimensión impar (de este modo siempre queda un píxel central), si bien las más
habituales son tres o cinco, tal como se ve en (3-48) y (3-49).
Las plantillas surgen tras multiplicar pares de estos vectores. Dado que el objetivo de estas plantillas es
cuantificar variaciones, es decir, que realizan operaciones derivativas, en todas ellas la suma de sus elementos
es igual a cero, de modo que ante una región constante se obtenga una respuesta nula, a excepción de 𝐿 consigo
mismo (esto es, 𝐿3𝐿3 o 𝐿5𝐿5, que equivaldrían a una media local ponderada), razón por la que no se suele
Marco Teórico
22
22
emplear como elemento descriptivo. Una vez obtenidas las
características de cada píxel tras aplicar todas las plantillas,
se realiza un promedio entre aquellas que sean del mismo
tipo pero en direcciones ortogonales (por citar un caso, 𝐿3𝐸3
detectaría los bordes verticales y 𝐸3𝐿3 los horizontales),
resultando así un conjunto de cinco imágenes de energía para
la dimensión tres y de nueve para dimensión cinco. Por
último, se realiza una media entre todos los píxeles de estas
imágenes para obtener un vector de cinco características, o
nueve, dependiendo de la dimensión utilizada, que
represente a cada muestra.
En ocasiones es útil disminuir la escala de las muestras a fin
de aumentar la frecuencia espacial con la que se dan estos efectos (E-S-R), lo que puede ayudar a conseguir
valores más descriptivos. En la Tabla 3-5 puede verse un ejemplo del resultado de los descriptores de Laws
obtenido para muestras de distintas clases.
Muestra de clase 01A Muestra de clase 11A Muestra de clase 21A
Dimensiones 100x100 25x25 100x100 25x25 100x100 25x25
E3E3 25.7277 34.3092 12.3856 25.9661 8.4777 16.3763
S3S3 40.1135 69.6203 12.8984 37.5510 9.3754 22.1184
L3E3_E3L3 73.8806 88.3972 41.4472 64.1415 27.9889 36.9186
L3S3_S3L3 85.2706 110.4397 42.3995 69.3513 29.2726 40.6325
E3S3_S3E3 31.0467 48.1294 11.9852 29.9557 8.4719 18.7385
Tabla 3-5. Comparación de descriptores de Laws para muestras 01A, 11A y 21A.
3.2.3 Local Binary Pattern (LBP)
LBP (del inglés Local Binary Pattern) es de los métodos más empleados en la caracterización de texturas, y
consiste en convertir la imagen original en otra que contenga información de alto nivel, en tanto que cada píxel
incluirá implícitamente la relación con su entorno, por mediación de la transformación de la vecindad de cada
elemento de dicha imagen en un tren binario. Si bien existen diferentes opciones a la hora de seleccionar dicha
vecindad, se usará la de orden 9, que es la más sencilla y, además, la que se ha venido utilizando a lo largo de
proyecto.
El funcionamiento es el siguiente: para cada región 3x3, si la intensidad de un vecino es mayor o igual que la
del píxel central, entonces ese elemento se transformará en uno y, en caso contrario, en cero; una vez que el
entorno esté en formato de bit, se escogerá un orden aleatorio (que después se mantendrá para el resto de píxeles)
para crear una cadena; por último, se pasará ese número binario a decimal, que será la nueva intensidad del píxel
central. Un ejemplo de este proceso puede verse en la Figura 3-21. El descriptor que caracterizará la textura será
𝐿3 = [1 2 1]
𝐸3 = [−1 0 1]
𝑆3 = [−1 2 −1]
(3-48)
𝐿5 = [1 4 6 4 1]
𝐸5 = [−1 −2 0 2 1]
𝑆5 = [−1 0 2 0 −1]
𝑅5 = [1 −4 6 −4 1]
(3-49)
el histograma de la nueva imagen calculada, es decir, un vector de dimensión 256.
Una modalidad muy utilizada dentro de este método es el LBP uniforme (U-LBP), principalmente porque
simplifica la dimensión del descriptor. La uniformidad de un tren binario se define como el número de veces
que ocurre una transición de nivel alto a nivel bajo o viceversa. Así, el
cálculo de la uniformidad de la cadena establecida en el ejemplo anterior
puede verse en la Figura 3-20. En la práctica, se ha observado que un gran
porcentaje de los píxeles que conforman una imagen tienen un entorno
con uniformidad cero o dos. U-LBP consiste en asignar un código
numérico particular a aquellos trenes que tengan este tipo de uniformidad,
mientras que para el resto se establece uno único que los agrupa. De este
modo, quedaría un histograma de dimensión 59 (2 cadenas de
uniformidad cero, 56 de uniformidad dos y 1 para el resto).
Como el tren binario obtenido es de 8 bits, la imagen
resultante se puede visualizar directamente al estar
los nuevos niveles de gris también en el intervalo
[0, 255]. Un ejemplo de imágenes LBP y U-LBP
puede verse en la Figura 3-22, mientras que sus
correspondientes histogramas se encuentran en la
Figura 3-23.
Una particularidad importante del LBP es que es
invariante a las variaciones de brillo. Esto se puede deducir fácilmente ya que en este método comparamos cada
píxel con su entorno y, aunque el brillo cambie, la relación para la transformación binaria seguirá siendo la
misma. De un modo similar, también se puede deducir su invariancia ante posibles traslaciones en la imagen
original, que conllevaría simplemente idénticas traslaciones en la imagen transformada.
208 233 71
231 161 139
32 25 244
1 1 0
1 161 0
0 0 1
1 1 0 0 1 0 0 1
- - -
- 201 -
- - -
Imagen Original Transformación Tren binario Paso a decimal
Figura 3-21. Ejemplo de proceso LBP.
1 1 0 0 1 0 0 1
U = 1
Figura 3-20. Cálculo de uniformidad
para U-LBP.
U = 2
U = 3 U = 4
Figura 3-22. Imagen LBP y U-LBP de muestra 01A.
Figura 3-23. Histogramas de Figura 3-22.
Marco Teórico
24
24
3.2.4 Métodos basados en el gradiente
Este método trata de encontrar características o descriptores a partir del gradiente (ver subsección 3.1.6) de una
imagen. Uno de los más simples que se pueden calcular es el porcentaje de píxeles de contorno (PPC), que viene
dado por la expresión (3-50). Como ya se ha comentado, cuanto mayor sea el módulo del gradiente mayor será
el cambio de contraste entre un píxel y su
entorno, es decir, mayor el cambio de
intensidad y, por lo tanto, mayor será la
posibilidad de que estemos ante un contorno
dentro de la imagen. Lo usual es filtrar la
matriz módulo a través de un valor umbral
que elimine los valores pequeños o, de otro
modo, que sólo los valores del módulo que
superen el umbral establecido se considerarán
parte de algún contorno de la imagen. Así, si
el número de píxeles de los contornos de cada
clase son lo suficientemente desiguales,
tendremos un PPC más o menos característico
de cada textura.
También es común utilizar algún descriptor
basado en los histogramas de módulo y de
fase del gradiente de la imagen. Si bien hay
muchas formas de comparar dos histogramas
para evaluar su similitud, comúnmente mediante medidas de distancia, usaremos una de las más simples, que
resulta de la ecuación (3-51), donde 𝑁 es el número total de valores distintos con los que trabajamos (de módulo,
de argumento…) y ℎ representa al histograma. Así, por ejemplo, el resultado de comparar los histogramas
normalizados ℎ1 y ℎ2 de la Figura 3-24, resulta en 𝐷 ≈ 0.22.
𝑃𝑃𝐶 =𝑃í𝑥𝑒𝑙𝑒𝑠 𝑞𝑢𝑒 𝑝𝑒𝑟𝑡𝑒𝑛𝑒𝑐𝑒𝑛 𝑎𝑙 𝑐𝑜𝑛𝑡𝑜𝑟𝑛𝑜
𝑃í𝑥𝑒𝑙𝑒𝑠 𝑡𝑜𝑡𝑎𝑙𝑒𝑠· 100 (%) (3-50)
𝐷 = ∑|ℎ1(𝑖) − ℎ2(𝑖)|
𝑁
𝑖=0
(3-51)
3.2.4.1 Histogram of Oriented Gradients (HOG)
Por último, otro descriptor ampliamente utilizado es el histograma de gradientes orientados, más conocido como
𝐻𝑂𝐺 por sus siglas en inglés. La idea es, a grandes rasgos, separar el rango angular de orientaciones en un
número determinado de secciones y, posteriormente, unir los módulos que estén orientados dentro de la misma
sección, construyendo un histograma que, una vez normalizado, funcionará como descriptor.
En la Figura 3-25 puede verse un ejemplo del proceso a seguir. El primer paso es seleccionar la imagen de
trabajo, que para este caso se ha generado de forma aleatoria, y dividir el rango angular, para este ejemplo en 4
secciones. Después, deberemos proceder a calcular el gradiente de cada píxel de la imagen, aquí se ha empleado
el operador Prewitt (3-11), y a obtener su correspondiente módulo (3-6) y fase (3-7) (esta se transformará a
grados y, en este ejemplo, se redondeará por comodidad). A continuación, asignamos las fases a su respectiva
sección y creamos un histograma sumando todos los módulos cuyas fases correspondienes pertenezcan a la
misma sección. Por último, se normaliza el histograma dividiendo entre la suma total de los módulos.
Un problema que surge en este método deriva de la sensibilidad ante las posibles pequeñas variaciones del
argumento del gradiente, es decir, dos valores muy parecidos podrían caer en secciones diferentes (así, en el
ejemplo anterior, 89o caería en la sección verde mientras que 91o en la azul). Una posible solución a esto sería
asignar las fases a las dos secciones más cercanas, pero ponderándolas de manera que los módulos tengan más
importancia según la distancia al centro de las zonas en las que se encuentren.
Figura 3-24. Comparación de histogramas.
3.3 Clasificadores
Un clasificador se encarga de tomar muestras, analizarlas y catalogarlas por clases. Para ello será necesaria una
fase previa donde se extraigan un conjunto de características o descriptores de una serie de muestras a fin de
conseguir capacidad discriminativa entre todas las clases implicadas. Evidentemente, seleccionar un conjunto
representativo de muestras para esta primera fase será beneficioso para que el clasificador pueda distinguir mejor
entre las distintas clases.
Por otro lado, la variabilidad entre las diferentes clases es fundamental para realizar un buen proceso de
clasificación. Por muy bien que el conjunto de muestras tomado represente a sus correspondientes clases, si
dichas clases son similares entre sí o bien si los descriptores escogidos para caracterizarlas no son lo
suficientemente discriminativos ante las mismas, no será posible realizar una distinción adecuada, como puede
observarse en la Figura 3-26.
Figura 3-26. Variabilidad (izquierda) frente a Invariavilidad (derecha) interclase.
11 115 175 21 114
43 139 47 237 78
166 76 94 198 130
187 190 160 124 130
165 48 199 111 208
Módulo
131 183 118
403 205 89
141 129 111
Fase
20 24 87
107 18 55
131 355 81
Figura 3-25. Proceso HOG con imagen generada aleatoriamente.
0º
90º
180º
270º
Marco Teórico
26
26
En la bibliografía actual hay una gran variedad de modelos de clasificación, como los clasificadores estadísticos
(por ejemplo los discriminantes bayesianos o los de mínima distancia), los clasificadores basados en redes
neuronales o los clasificadores lineales, basados en la creación de hiperplanos de separación entre clases.
Por otro lado será necesario cuantificar cómo de buenos han sido los resultados tras utilizar un clasificador. Así,
un indicador de bondad muy simple que se suele utilizar es el porcentaje de clasificaciones incorrectas (PCI),
que se obtiene mediante la expresión (3-52). Evidentemente, cuanto menor sea el PCI mejor habrá sido el
resultado de la clasificación.
𝑃𝐶𝐼 =𝐶𝑙𝑎𝑠𝑖𝑓𝑖𝑐𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑖𝑛𝑐𝑜𝑟𝑟𝑒𝑐𝑡𝑎𝑠
𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 𝑐𝑙𝑎𝑠𝑖𝑓𝑖𝑐𝑎𝑑𝑎𝑠 𝑥 100 (3-52)
3.3.1 Clasificadores lineales
Si simplificamos el problema a uno binario donde únicamente hay que distinguir entre dos clases, y esas clases
presentan además una gran variabilidad, el modelo más intuitivo de clasificador es quizá el lineal, que trata de
crear una frontera (una línea en el caso bidimensional) a partir del conjunto de entrenamiento dado, de modo
que a un lado de la misma estarían las muestras
pertenecientes a una clase y al otro lado las demás.
Así, las nuevas muestras quedan clasificadas según
el lado de la frontera a la que pertenecen.
Dependiendo del tipo de clasificador escogido esta
frontera será de una forma o de otra. En la Figura
3-27 pueden apreciarse varios ejemplos de frontera
en distintos colores. Uno de los clasificadores
lineales más conocidos es SVM (de sus siglas en
inglés, Support Vector Machine) que, a grandes
rasgos, trata de escoger la frontera de modo que el
margen entre ambas clases sea el mayor posible (en
la figura estaría cerca de la de color amarillo).
Sin embargo, en la práctica esta variabilidad no suele
ser tan evidente, teniendo que relajar las condiciones
para calcular la frontera (permitiendo que caigan
muestras contrarias en sendos lados) o aumentando
la dimensión del problema de modo que las clases sean totalmente separables por un hiperplano (quizá en tres o
más dimensiones el problema de invariabilidad de la Figura 3-26 quedaría solucionado).
Además, como es evidente, el problema se complica a medida que se van añadiendo nuevas clases a discernir,
teniendo que calcular un mayor número de fronteras, comúnmente mediante algún proceso iterativo. A veces
será necesario recurrir a modelos no lineales más complejos que permitan separar mejor las diferentes clases.
3.3.2 Clasificadores por vecino más cercano (NN)
El clasificador por vecino más cercano (o NN por sus siglas en inglés, Nearest Neighbor) es de los más simples
que se pueden construir ya que no requiere una frontera explícita y, por lo tanto, no es necesario un proceso
iterativo de aprendizaje. Se basa en utilizar la mínima distancia: la idea es que, tras haber establecido el análisis
de un primer conjunto de muestras de cada clase, las nuevas muestras se clasifiquen con la misma etiqueta de
aquella que se encuentre más cerca. Esto conllevaría un gran gasto computacional en tanto que el número de
muestras iniciales fuese considerable (necesario para caracterizar adecuadamente una clase).
Figura 3-27. Ejemplos de fronteras lineales.
Por otra parte, si existe solapamiento entre las muestras, o haya algunas que, de forma inusual, debido a
problemas de caracterización o a algún fallo de captura, invadan o caigan cerca del conjunto de muestras que
represente a otra clase, se podrían dar etiquetados erróneos en cuanto aparezca alguna otra muestra cercana a
ellas. Por ello se suele recurrir a una variable denominada K-NN, que consiste en comparar las nuevas muestras
con sus K vecinas más cercanas, estableciendo la clase final como aquella que más se repite y, por tanto, haciendo
el etiquetado más robusto.
No obstante, lo más habitual es calcular un prototipo de cada clase a partir del conjunto inicial, de modo que las
nuevas muestras sólo tengan que compararse con todos los prototipos existentes (con lo que se reduciría
enormemente el gasto computacional), asignándosele la clase del más cercano.
El problema recae entonces en la selección de un prototipo adecuado para cada clase, y lo más habitual es utilizar
la media de todas las muestras del conjunto inicial, de manera que cualquier muestra esporádica alejada del resto
perdiera peso. De este modo si los descriptores entre muestras de la misma clase son más o menos similares, el
prototipo sería una buena caracterización de ésta. No obstante, si el número de clases comienza a incrementarse,
es difícil que se mantenga una buena variabilidad y los prototipos tenderían a amontonarse.
En la Figura 3-28 se puede observar el funcionamiento del clasificador por vecino más cercano de las tres formas
que se han expuesto, de modo que la nueva muestra (de color verde) sería de clase 2 según NN, ya que de esa
clase es la muestra más cercana (rodeados en negro), de clase 1 según K-NN con K igual a tres, ya que hay dos
muestras de esa clase y sólo una de la otra (rodeados en naranja) y también de clase 1 según la mínima distancia
a los prototipos, pues se observa que la línea cian es de menor tamaño que la magenta.
Figura 3-28. Ejemplo de funcionamiento de clasificador NN y variantes.
4 EXPERIMENTACIÓN
n este capítulo hablaremos sobre el conjunto de pruebas realizado, comentando los resultados obtenidos
por cada método utilizado de manera individual, tratando de afinarlo lo mejor posible para posteriormente,
en el siguiente capítulo, extraer conclusiones globales al respecto. Si bien no se han tratado todas las
opciones posibles, principalmente por el elevado coste computacional que dicha tarea conllevaría, se ha
intentado seguir un sistema suficientemente exhaustivo como para poder sacar conclusiones adecuadas.
4.1 Consideraciones previas
Antes de pasar al análisis de las pruebas, merece la pena comentar un par de aspectos de interés que se han
mencionado en capítulos previos pero que no se han desarrollado.
4.1.1 Proyección
A la hora de comparar descriptores o características, parece buena idea tratar de hacerlo mediante una
representación gráfica, acomodando los datos para extraer información de un solo vistazo. Pero cuando el vector
de características del que disponemos, obtenido a partir de alguno de los métodos ya comentados, contiene un
número elevado de elementos, surge la
imposibilidad de representarlos todos en un
mismo espacio (todavía con únicamente tres
características se podría tratar de interpretar
una representación tridimensional). Así,
deberemos aplicar el concepto de proyección,
que no es más que una representación
bidimensional de un par de características que
pertenecen al conjunto. La idea es proyectar en
gráficas de dos dimensiones todas las posibles
combinaciones (obviando las relaciones
simétricas, por proporcionar el mismo
resultado, o las de un elemento consigo
mismo, por carecer de sentido) del vector de
características, tal como se ve en la Figura 4-1,
donde se muestran las tres posibles
proyecciones (A-B, azul; A-C, rojo; y B-C,
negro) que corresponden a la representación
tridimensional de una muestra con una terna
de características. Del mismo modo, por proponer otro ejemplo, si nuestro vector de características contiene los
7 momentos invariantes de Hu, no resultaría nada fácil representarlos en un espacio de siete dimensiones; sería
más sencillo, así como más fácil de interpretar, plasmar las 21 proyecciones correspondientes.
E
Figura 4-1. Proyecciones de una representación tridimensional.
Experimentación
30
30
4.1.2 Normalización
Por otro lado, surge la necesidad de normalizar los descriptores, ya que nuestra intención es que todos ellos
tengan el mismo peso a la hora de aportar información para la caracterización de una textura. No tiene sentido
usar varios descriptores y que alguno de ellos deje de aportar información porque su rango de variación sea
demasiado pequeño en comparación con los demás o, por el contrario, que un descriptor monopolice el proceso
de caracterización engullendo al resto. Una opción sería reducir todos los descriptores al intervalo [0,1]. Para el
caso de los histogramas, esto se consigue dividiendo entre el número total de píxeles o elementos que
intervengan en él (para el caso del HOG es distinto, ya que no acumula valores en una posición determinada
sino que va sumando módulos, es por esto que, como se dijo, para normalizarlo es necesario dividir entre la
suma total de módulos). Para el resto de descriptores se puede usar la expresión (4-1), en la que 𝑥 representa el
valor a normalizar, [𝑋𝑚, 𝑋𝑀] es el rango de entrada y [𝑋𝑚𝑛𝑜𝑟𝑚, 𝑋𝑀
𝑛𝑜𝑟𝑚] el de salida. El intervalo de salida ya
hemos comentado que será [0,1]. Para el de entrada, una posible opción es seleccionar los valores extremos de
cada descriptor (esto es, mínimo y máximo) que surjan de entre todas las muestras en la primera fase del proceso
(entrenamiento).
𝑋𝑛𝑜𝑟𝑚 =(𝑋𝑚
𝑛𝑜𝑟𝑚 − 𝑋𝑀𝑛𝑜𝑟𝑚)
(𝑋𝑚 − 𝑋𝑀)(𝑥 − 𝑋𝑚) + 𝑋𝑚
𝑛𝑜𝑟𝑚 (4-1)
Al usar este método, podría aparecer un problema si el número de muestras utilizadas en la etapa de
entrenamiento es pequeño, ya que entonces puede que para los nuevos ejemplares en la etapa de reconocimiento
se obtengan resultados en los descriptores que excedan los valores extremos con los que estamos trabajando.
Para ayudar a solventar esto, se suelen multiplicar el intervalo inicial por un coeficiente de mayoración a fin de
aumentar el margen (generalmente se ensancha en torno a un 10% o un 20%).
Sin embargo, puede que a pesar de esto el problema persista. Es común que se añada otro segundo margen que
permita desbordar el intervalo normalizado pero que, en caso de que los nuevos valores vuelvan a superarlo, se
saturen al valor extremo más cercano. Por ejemplo, si se toleran desbordamientos del 10% tras haber
normalizado, en realidad nuestro intervalo de salida sería [−0.1, 1.1]. Si entra un valor 𝑋𝑛𝑜𝑟𝑚 = 1.5 al intentar
reconocer una nueva muestra, simplemente se satura haciendo 𝑋𝑛𝑜𝑟𝑚 = 1 o bien 𝑋𝑛𝑜𝑟𝑚 = 1.1. Añadir este
margen de saturación es posible en esta clase de aplicaciones puesto que el desbordamiento no suele afectar
significativamente al resultado; además, si una muestra desborda el intervalo es, probablemente, debido a algún
tipo de anomalía, ya sea en la obtención de la muestra en sí o en su caracterización, que la aleja de los valores
normales.
4.1.3 Procedimiento
Las condiciones iniciales y globales que se han escogido, así como el procedimiento que se ha seguido para
realizar pruebas, son de la siguiente forma: en primer
lugar, para aquellos casos en los que se necesite usar
la expresión de normalización, tanto el coeficiente de
mayoración como el margen de saturación serán del
10%; en segundo lugar, el clasificador empleado será
un clasificador por vecino más cercano con
prototipo, donde se ha decidido utilizar un 40% de
las muestras disponibles para la creación del mismo
(esto es, 80 por cada clase) y el resto (120) para la
fase de reconocimiento; y, en tercer lugar, se utilizará
el PCI como indicador de bondad.
Como ya se comentó, cuanto menor sea este
indicador de bondad, mejor será el resultado
obtenido, pues mayor será el número de muestras
clasificadas correctamente, como se deduce
fácilmente de la expresión (3-52). Si bien no hay PCI
objetivo marcado a priori, es decir, en este proyecto Figura 4-2. PCI ofrecido por clasificador aleatorio.
únicamente se trata de aplicar algunos métodos de caracterización y de comparar los resultados que ofrecen, lo
mínimo es obtener mejor rendimiento que un sistema basado enteramente en la aleatoriedad. Por ejemplo, a
discernir entre dos clases distinas, un clasificador aleatorio ofrecería un PCI del 50% y, a medida que se aumenta
el número de clases, este número iría subiendo según se ve en la Figura 4-2. De nada sirve un método que ofrezca
un resultado peor del que se conseguiría al clasificar las muestras de forma aleatoria, ya que hacer esto último
seria muchísimo más sencillo (ni siquiera haría falta caracterizar las muestras).
Se realizarán también comparaciones de resultados reduciendo la escala de las muestras y sus niveles de gris.
Como se dijo, si bien estas operaciones reducen la calidad de las muestras, no sólo pueden variar la frecuencia
espacial de los píxeles característicos sino que, además, reducen el cómputo considerablemente, por lo que
podrían ser simplificaciones a tener en cuenta. Toda la relación de pruebas realizadas puede encontrarse
dispuesta en forma de tablas en el Anexo B.
4.2 Pruebas realizadas
Se expondrán, a continuación, las pruebas más representativas de todas las que se han realizado, método a
método, y se comentará lo más relevante o significativo de las mismas. Para ver la relación completa de pruebas
puede consultarse el Anexo B.
4.2.1 Métodos estadísticos
Realizar un análisis exhaustivo contemplando todas las
posibles combinaciones de descriptores estadísticos, tanto de
primer como de segundo orden, pasando por simplificaciones
de escala y de cuantificación, conllevaría mucho tiempo,
especialmente cuando se trata del segundo orden, donde,
además de tener más gasto computacional ya de por sí, entran
en juego nuevos parámetros como son los operadores de
distancia y de dirección.
Así, lo primero que trataremos de hacer será seleccionar
algunas combinaciones de estos descriptores que,
presumiblemente, obtendrán buenos resultados para realizar
con ellos el resto de pruebas. Para ello estudiaremos todas las
posibles combinaciones para pocas clases y trataremos de
extrapolar los resultados.
De este modo, para los estadísticos de primer orden, tenemos
la Tabla B - 3 y la Tabla B - 4, en las que se muestra el PCI
obtenido para las 127 combinaciones posibles para 3, 6 y 9 clases de ambos bancos de imágenes. Si
seleccionamos los diez mejores resultados en cada caso resulta la Tabla B - 7. Como regla general, no parece
buena idea combinar descriptores que aporten el mismo tipo de información al derivarse de manera directa unos
de otros, como bien pudieran ser la varianza (3-17), s, y el coeficiente de suavidad relativa (3-18), R, en los
descriptores de primer orden, o el ASM (3-42), A, y la uniformidad (3-43), U, en los de segundo, debido a que,
en lugar de ayudar a discriminar, esto suele tender a empeorar los resultados. Así, respecto al primer orden, se
deduce experimentalmente de la tabla de mejores resultados que R no es útil ya que en combinación con otros
conjuntos de descriptores, no es capaz, en la inmensa mayoría de los casos, de modificar el resultado, es decir,
da lo mismo utilizarlo que no hacerlo, ya que no tiene capacidad discriminativa suficiente. Esto es debido a que,
como se muestra en la Figura 4-3, este coeficiente sólo sufre un cambio aceptable para un intervalo aproximado
[5, 40] de la varianza, manteniéndose prácticamente constante para el resto de valores. Lo usual es que las
muestras tengan un contraste adecuado y, por ende, que la varianza tenga un valor elevado, por lo que en la
mayoría de las muestras caracterizadas, R contará con valores muy similares entre sí, cercanos a la unidad.
Podemos, entonces, prescindir de este descriptor.
Así, una vez eliminadas las combinaciones repetidas que contenían R, si simplemente contamos cuantas veces
aparece cada descriptor en los mejores resultados (sin asignar mayor peso a las primeras posiciones, ya que
realmente el porcentaje de variación de PCI nunca llega a exceder el 2% de diferencia), obtendremos las gráficas
de la Figura 4-4, en la que podemos observar que la combinación de cuatro de estos descriptores es la más
Figura 4-3. Proyección s-R.
Experimentación
32
32
exitosa en la mayoría de los casos, seguida de tres y de cinco, destacándose las combinaciones ‘sae’, ‘sake’ y
‘msake’ (en realidad para esta última había varias opciones, pero había que escoger alguna).
Una vez seleccionados los descriptores de primer orden que utilizaremos, ya podemos pasar a calcular el PCI
correspondiente para ambos bancos de imágenes, aumentando progresivamente el número de clases y variando la escala y
el nivel de gris, que pueden verse en la Tabla B - 1 y en la Tabla B - 2, y de la que se extraen las gráficas de la Figura 4-5.
0 2 4 6 8 10 12
23456
Nº de apariciones
Nº
Des
crip
tore
s
Estadísticos 1er orden combinados en los mejores resultados para 3/6/9 clases
0
2
4
6
8
10
12
m s a k u eN
º d
e ap
aric
ion
esDescriptores
Frecuencia de estadísticos 1er orden en los mejores resultados para 3/6/9 clases
2 3 4 5 6
Figura 4-4. Mejores combinaciones de estadísticos de 1er orden para un análisis con pocas clases.
3 6 9 12 15 18 21 25
sae 33,89 38,33 45,37 53,61 60,11 59,49 60,52 65,23
sake 33,89 37,78 45,09 51,32 58 58,56 60 64,27
msake 33,33 38,47 44,91 50,49 57,17 57,27 57,86 60,83
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco A - Estadísticos 1er orden. Muestras a E100/256NG.
3 6 9 12 15 18 21 25
256 NG 33,33 38,47 44,91 50,49 57,17 57,27 57,86 60,83
32 NG 33,33 39,31 46,02 51,18 57,89 57,31 57,50 60,43
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco A - 'msake' E100. Comparación NG.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
256 NG 21,4 35,8 43,5 56,9 52,4 56,3 61,4 65 70,9 73,5 76,4 78,8 80,8 80,8
32 NG 21,7 37,2 44 57,5 52,2 56 61,2 65,3 71,1 74 77 79,3 81,2 81,1
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco B - 'msake' E100. Comparación NG.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
sae 18,33 31,39 35,56 50,35 49,56 57,78 61,51 66,43 72,58 74,44 77,42 80,61 82,29 82,83
sake 19,44 31,39 35,65 50,42 49,72 57,59 61,55 66,37 72,42 74,21 77,31 80,54 82,17 82,62
msake 21,39 35,83 43,52 56,88 52,39 56,34 61,39 65,03 70,86 73,49 76,4 78,84 80,79 80,77
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00 96,77 97,30 97,67 97,96 98,18 98,36
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco B - Estadísticos 1er orden. E100/256NG.
Experimentación
34
34
3 6 9 12 15 18 21 25
100% 33,33 38,47 44,91 50,49 57,17 57,27 57,86 60,83
50% 35,83 38,19 44,72 48,89 55,78 55,79 56,94 59,67
25% 40 45,42 50,93 51,94 57,5 58,89 60,44 62,43
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco A - 'msake' 256NG. Comparación E.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
100% 21,4 35,8 43,5 56,9 52,4 56,3 61,4 65 70,9 73,5 76,4 78,8 80,8 80,8
50% 21,1 43,2 46 58,1 53,2 57,8 62 65,1 70,8 73,3 75,7 78,6 80,6 80,9
25% 21,1 44,9 49,9 59,4 56,8 58,6 59,6 64,8 70,8 71,7 75 77,2 79,5 80
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco B - 'msake' 256NG. Comparación E.
Figura 4-5. Gráficas relativas a las pruebas de estadísticos de primer orden.
La primera conclusión que podemos extraer respecto a los descriptores utilizados es que, si bien en ambos bancos
no se termina de imponer ninguna combinación para pocas clases, a medida que el número de las mismas
aumenta, la combinación de mayor número de elementos acaba por ofrecer mejor PCI, lo cual hace planteable
que tal vez la extrapolación directa de los resultados obtenidos para pocas clases no haya sido buena idea y quizá
la combinación del máximo número de elementos hubiese sido mejor discriminante. No obstante, esperaremos
a obtener los resultados de los estadísticos de segundo orden para reafirmar esta observación. De momento,
extraeremos información únicamente de esta combinación, ‘msake’ (pueden consultarse los demás resultados
en el Anexo B).
Figura 4-6. Proyecciones de estadísticos de 1er orden ‘sae’ para 3 y 61 clases.
Experimentación
36
36
En cuanto al propio resultado, queda en general bastante lejos del límite marcado (clasificación aleatoria), con
lo cual podríamos decir que son buenos para pocas clases. No obstante, como es lógico, a medida que el número
de clases aumenta, en especial en el banco B, que dispone de muchas más, el PCI va empeorando
considerablemente pues el problema se complica y los prototipos se amontontan, como puede verse en las
proyecciones de la Figura 4-6, por comodidad para la combinación ‘sae’, de tres elementos, con un espacio más
reducido y, por lo tanto, con menor número de proyecciones. Para tres clases la separabilidad parece bastante
evidente, mientras que para el máximo número de las mismas (donde se ha prescindido de las muestras para
mejor visualización) no lo es en absoluto, pareciendo muy complicado distinguir algo.
Respecto a la disminución de los niveles de gris, no se aprecia un cambio significativo en el resultado (menos
de un 2% en el peor de los casos). Así, podemos deducir que el resultado de este método podría ser válido aun
en imágenes con limitada cuantificación. Esto se debe a que, a pesar de que el número de grises sea menor, la
forma del histograma se mantiene relativamente bien, como se puede ver en la Figura 4-7, por lo que la
descripción, basada precisamente en este tipo de distribución, no variará demasiado.
Algo similar se podría decir también acerca de la escala. Pese a que el número de píxeles quede reducido, es de
suponer que la forma del histograma tampoco cambiará radicalmente, como se puede comprobar en la Figura
4-8 (a comparar con la ilustración anterior, donde la escala era 100%), por lo que el resultado no se ve
drásticamente empobrecido (de hecho, hasta mejora ligeramente en algunos casos). No obstante, pese a que el
gasto computacional se vería considerablemente reducido, no era ya de por sí muy elevado, por lo que tal vez
no merezca la pena realizar esta reducción (en tanto que en el peor de los casos el PCI sube un 10%).
Figura 4-7. Variación del histograma ante la reducción de niveles de gris.
Figura 4-8. Variación del histograma ante la reducción de escala.
3 6 9 12 15 18 21 25
256 NG 57,22 72,5 80 83,89 85,72 85,65 84,09 85,8
32 NG 57,50 72,36 80,65 84,24 85,94 85,83 84,09 85,73
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco A - Hu E100. Comparación NG.
3 6 9 12 15 18 21 25
100% 57,22 72,5 80 83,89 85,72 85,65 84,09 85,8
50% 57,5 71,81 80,56 83,89 85,67 85,51 84,09 85,9
25% 56,67 71,53 80,46 83,75 86,11 86,2 84,48 86,3
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco A - Hu 256NG. Comparación E.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
256 NG 58,1 79,2 76,6 80,6 75,8 79,9 82,2 83,5 85,2 87,3 89 90,2 90,9 91,2
32 NG 57,5 79,4 76,5 80,9 76,3 79,9 82 83,5 85,5 87,3 89,3 90,5 91,3 91,6
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco B - Hu E100. Comparación NG.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
100% 58,1 79,2 76,6 80,6 75,8 79,9 82,2 83,5 85,2 87,3 89 90,2 90,9 91,2
50% 58,1 78,2 76,2 80,6 75,7 79,8 81,9 83,3 85,1 87,1 88,8 90,2 91 91,2
25% 57,8 78,3 75,9 80,6 75,7 79,9 81,8 83,1 85,1 87,2 89 90,2 91 91,2
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco B - Hu 256NG. Comparación E.
Figura 4-9. Gráficas relativas a las pruebas de los momentos de Hu.
Experimentación
38
38
En otro orden de cosas, las pruebas realizadas para los momentos
invariantes de Hu pueden consultarse en la Tabla B - 10 y en la Tabla
B - 11, de donde se han extraído las gráficas de la Figura 4-9.
Podemos observar que los resultados proporcionados no son
demasiado buenos, ya que se acercan bastante al límite propuesto
como objetivo. Parece ser que estos momentos no ofrecen
descripciones demasiado separables, es decir, si bien es verdad que
se mantienen prácticamente invariantes ante la escala, como se puede
observar en los resultados, ofrecen valores muy similares para las
distintas clases. Podemos ver un ejemplo de los prototipos obtenidos
para las tres primeras clases en la Tabla 4-1, (si bien las proyecciones
son visualmente más cómodas, añadir las 21 necesarias para
completar el espacio de características no es demasiado manejable,
razón por la que se ha preferido exponer los prototipos en forma de
tabla).
Pasando a los estadísticos de segundo orden, procederemos de un
modo similar al que utilizamos con los de orden uno. Lo primero será
obtener una combinación adecuada de los descriptores. Para ello, se
ha vuelto a realizar un análisis con las 127 posibles combinaciones
para 3, 6 y 9 clases distintas en ambos bancos, obteniéndose la Tabla
B - 5 y la Tabla B - 6, que ordenada según los mejores resultados deriva en la Tabla B - 7. También aquí podemos
observar, aunque en menor medida, cómo en prácticamente todos los casos en los que se añade el descriptor A
a un conjunto donde ya esté U, o viceversa, el resultado no varía o empeora ligeramente. No obstante, se podrían
seguir usando por separado. Vemos en las gráficas de la Figura 4-10 como, de nuevo, son más frecuentes las
combinaciones de 4 elementos, seguidos, igual que antes, de las de tres y de las de cinco. Así, nos quedaremos
con las combinaciones ‘McC’, ‘McEC’ y ‘McEAC’ (que también se podría haber sustituido por ‘McEUC’).
Una vez escogidos los descriptores, se procede a realizar un análisis, también con pocas clases, modificando el
resto de parámetros, obteniéndose de este modo la Tabla B - 8 y la Tabla B - 9. Se observa en las gráficas
extraídas de dichas tablas, en la parte superior de la Figura 4-11, que, como se predijo, parece buena idea utilizar
como operador de dirección la media de las cuatro direcciones pues, si bien no siempre proporciona el mejor
resultado (aunque lo hace generalmente), se suele acercar bastante y, en cualquier caso, no es el peor de todos.
En cuanto al operador distancia, no parece que se pueda extraer ninguna conclusión ya que, para el banco A, el
PCI tiende a mejorar ligeramente al aumentar la distancia mientras que, para el B, ocurre lo contrario. En
cualquier caso, no parece muy recomendable alejarse demasiado por lo que ya se comentó: en primer lugar, las
relaciones de interés no suelen estar a muchos píxeles de distancia y, en segundo lugar, cuanto mayor sea esta
distancia mayor será la cantidad de infomación que estaremos perdiendo en tanto que el borde se habrá de
suprimir. De este modo, haremos las pruebas con la GLCM invariante en el espacio y operador distancia igual
uno.
Prot1 Prot2 Prot3
𝝓𝟏 6.6123 6.6958 6.7323
𝝓𝟐 19.0585 20.1469 19.8180
𝝓𝟑 25.7369 25.8475 26.0245
𝝓𝟒 26.3879 26.5983 26.6188
𝝓𝟓 53.2425 53.7015 53.6842
𝝓𝟔 36.6564 37.2723 37.5664
𝝓𝟕 53.1752 53.8532 53.9584
Tabla 4-1. Prototipos con 80 muestras para
3 clases con momentos de Hu.
0 2 4 6 8 10 12 14 16 18
1
2
3
4
5
6
Nº de apariciones
Nº
Des
crip
tore
s
Número de descriptores combinados en los mejores resultados para 3/6/9
clases
02468
1012141618
M c h U E A C
Nº
apar
icio
nes
Descriptores
Frecuencia de estadísticos de 2o en los mejores resultdos para 3/6/9 clases
1 2 3 4 5 6
Figura 4-10. Mejores combinaciones de estadísticos de 2º orden para un análisis con pocas clases.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
McC 7,5 22,1 27 32,4 35,6 39,5 44,2 53,4 59,5 60,6 63,5 65,7 69 71,7
McEC 6,67 17,6 22,4 31 33,7 38,8 43,7 50,4 57,3 58,8 61,7 64 66,9 69,8
McEAC 11,7 21 23 30,9 33,9 38,8 43,8 50,8 57,7 59 61,8 64,2 67,1 70
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco B - Estadísticos 2o orden. Muestras a E100/256NG.
0
10
20
30
40
50
60
70
1 2 3 4 5 6
PC
I (%
)
Operador Distancia
Banco A - 'McEAC' - Variación de operadores distancia y dirección (9 clases-E100/256NG).
E NE N NO M
0
5
10
15
20
25
30
35
40
45
1 2 3 4 5 6
PC
I (%
)
Operador Distancia
Banco B - 'McEAC' - Variación de operadores distancia y dirección (9 clases-E100/256NG).
E NE N NO M
3 6 9 12 15 18 21 25
McC 41,39 46,67 56,3 64,93 69 70,37 74,88 77,73
McEC 39,72 47,5 56,94 65,69 69,17 69,72 73,53 77,03
McEAC 40,83 47,36 56,76 65,69 69,39 70,05 73,69 76,57
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco A - Estadísticos 2o orden. Muestras a E100/256NG.
Experimentación
40
40
3 6 9 12 15 18 21 25
100% 40,83 47,36 56,76 65,69 69,39 70,05 73,69 76,57
50% 34,17 43,75 52,13 61,88 65,22 66,44 69,8 74,53
25% 36,11 44,31 55 63,68 68,11 69,07 71,39 75,13
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco A - 'McEAC' 256NG. Comparación E.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
100% 11,7 21 23 30,9 33,9 38,8 43,8 50,8 57,7 59 61,8 64,2 67,1 70
50% 5,56 33,8 27,4 37,5 42,2 47,4 52 55,4 58,8 63,3 66,7 68,5 70,3 72,2
25% 16,7 44,3 28,9 42,1 45,6 50,8 55 58,3 61,7 65 68,4 71,8 74 75,7
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco B - 'McEAC' 256NG. Comparación E.
3 6 9 12 15 18 21 25
256 NG 40,83 47,36 56,76 65,69 69,39 70,05 73,69 76,57
32 NG 39,72 47,78 58,52 65,42 68,28 69,58 73,02 75,57
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco A - 'McEAC' E100. Comparación NG.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
256 NG 11,7 21 23 30,9 33,9 38,8 43,8 50,8 57,7 59 61,8 64,2 67,1 70
32 NG 11,7 23,6 28,6 34,8 38,7 43,2 47,8 54,1 60,1 60,9 65,7 68,3 70,9 73,4
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco B - 'McEAC' E100. Comparación NG.
Figura 4-11. Gráficas relativas a las pruebas de estadísticos de segundo orden.
Así, se obtienen las relaciones de la Tabla B - 12 y la Tabla B - 13, de las que podemos extraer el resto de gráficas de la
Figura 4-11. Se puede ver que los resultados son también razonables, alejándose alrededor de un 20% del azar en el peor de
los casos. En cuanto a los descriptores, la observación que hicimos para estadísticos de primer orden se observa también
aquí aunque no de manera tan acentuada, pues es verdad que la tétrada de descriptores ofrece resultados ligeramente mejores
que la combinación de cinco elementos en muchos casos. De todas formas seguiremos trabajando con esta última por
similitud con el primer orden (de nuevo, pueden consultarse todas las pruebas en el Anexo B).
En cuanto a la disminución de niveles de gris, tampoco aquí se observa una variación radical. No obstante,
parece ofrecer por lo general un resultado levemente peor (hasta casi un 6% en el peor de los casos). En cuanto
a la escala, parece que el banco A es capaz de soportar este tipo de simplificaciones, mejorando levemente el
resultado, sin embargo, en el banco B, el PCI es considerablemente mayor para pocas clases, suavizándose la
diferencia a medida que las aumentamos.
4.2.2 Descriptores de Laws
Podemos encontrar las pruebas realizadas con los descriptores propuestos por Laws en la Tabla B - 14 y en la
Tabla B - 15. Los gráficos generados a partir de esos datos, dispuestos en la Figura 4-12, muestran que los
resultados obtenidos no han sido nada buenos. Es más, contra todo pronóstico, las plantillas de orden cinco han
ofrecido un PCI más elevado en la práctica totalidad de los casos, cuando cabía pensar que al ser descriptores
que trabajan con un entorno mayor por píxel debía ocurrir lo contrario.
Respecto a los niveles de gris, obtenemos unas conclusiones similares que en los métodos estadísticos. Pese a
que el número de posibles intensidades se haya reducido de 256 a 32, no es suficiente como para estropear los
motivos de la textura que se utilizan para obtener su energía, ni tampoco la frecuencia con la que aparecen. Por
lo tanto, se puede observar como el resultado es muy similar para ambos niveles de gris. En cuanto a la escala,
precisamente por aumentar la frecuencia espacial de las características de la imagen, era de esperar que el
resultado mejorase pero, en contraposición, empeora levemente.
4.2.3 LBP
La relación de pruebas usando el descriptor LBP puede encontrarse en la Tabla B - 16 y en la Tabla B - 17.
Vemos en los gráficos extraídos de ellas, en la Figura 4-13, que los resultados son buenos, en especial para el
banco B. En cuanto al uso de U-LBP, podemos observar que no es una mala aproximación (en el peor de los
casos difiere en torno al 3%). No obstante, esa pequeña diferencia no está suficientemente compensada pues el
ahorro computacional es nimio.
En cuanto a los niveles de gris y a la escala, no se pueden extraer conclusiones en tanto que el comportamiento
es opuesto para ambos bancos de imágenes: para el A se mejora levemente mientras que para el B se empeora.
Experimentación
42
42
3 6 9 12 15 18 21 25
3x3 52,22 69,58 78,61 81,32 83,61 84,44 82,62 82,77
5x5 54,17 74,58 83,15 87,29 89,72 91,02 89,92 91,07
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0
10
20
30
40
50
60
70
80
90
100P
CI (
%)
Número de clases
Banco A - Descriptores de Laws. Muestras a E100/256NG.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
3x3 61,9 79,3 79,7 84,5 80,9 85,1 87 89,3 91,3 92,7 93,7 94,1 94,7 95
5x5 63,1 78,6 83,7 86,7 84,3 87 88,9 90,8 92,6 94 94,8 95 95,2 95,4
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco B - Descriptores de Laws. Muestras E100/256NG.
3 6 9 12 15 18 21 25
256 NG 52,22 69,58 78,61 81,32 83,61 84,44 82,62 82,77
32 NG 51,11 69,72 78,52 81,04 83,44 84,07 82,66 82,73
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco A - Laws 3x3 E100. Comparación NG.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
256 NG 61,9 79,3 79,7 84,5 80,9 85,1 87 89,3 91,3 92,7 93,7 94,1 94,7 95
32 NG 60,8 81,7 81,7 86,3 84,8 87,9 88,3 90,3 92,3 93,4 94,3 94,6 95 95,5
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco B - Laws 3x3 E100. Comparación NG.
3 6 9 12 15 18 21 25
100% 52,22 69,58 78,61 81,32 83,61 84,44 82,62 82,77
50% 54,17 72,5 80,19 82,15 83,56 84,81 83,25 83,27
25% 55,83 74,72 82,41 84,79 85,5 84,86 83,33 83,47
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco A - Laws 3x3 256NG. Comparación E.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
100% 61,9 79,3 79,7 84,5 80,9 85,1 87 89,3 91,3 92,7 93,7 94,1 94,7 95
50% 60,8 81,7 81,7 86,3 84,8 87,9 88,3 90,3 92,3 93,4 94,3 94,6 95 95,5
25% 61,1 83,2 82,8 86,7 85,6 88 88,5 90,4 92,2 93,6 94,6 95,1 95,4 95,8
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco B - Laws 3x3 256NG. Comparación E.
Figura 4-12. Gráficas relativas a las pruebas de los descriptores de Laws.
3 6 9 12 15 18 21 25
LBP 47,22 67,36 64,81 69,65 67,83 69,86 72,1 74,6
U-LBP 46,39 66,81 65,83 71,67 70,94 72,59 74,72 77,13
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco A - Comparación LBP / U-LBP. Muestras a E100/256NG
3 6 9 12 15 18 21 25 31 37 43 49 55 61
LBP 15,3 23,9 19,8 26,9 25,4 26,8 28,7 34,3 41,2 40,8 38,4 40,8 41,9 44,3
U-LBP 15,6 24,4 21 29,8 27,1 28,1 30,4 36,1 44 42,7 40,1 42,8 43,7 45,8
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco B - Comparación LBP / U-LBP. Muestras a E100/256NG.
Experimentación
44
44
3 6 9 12 15 18 21 25
256 NG 47,22 67,36 64,81 69,65 67,83 69,86 72,1 74,6
32 NG 41,67 57,22 57,31 63,82 62,39 62,08 65,16 68,37
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco A - LBP E100. Comparación NG.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
256 NG 15,3 23,9 19,8 26,9 25,4 26,8 28,7 34,3 41,2 40,8 38,4 40,8 41,9 44,3
32 NG 10,8 18,9 20,7 30,6 31,5 34,2 34,9 39,6 45,3 47,5 46,2 47,9 48,9 51,2
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco B - LBP E100. Comparación NG.
3 6 9 12 15 18 21 25
100% 47,22 67,36 64,81 69,65 67,83 69,86 72,1 74,6
50% 35,56 59,58 61,11 63,19 65,83 66,85 68,06 73,23
25% 34,72 58,61 59,54 64,86 68,11 67,55 68,89 73,53
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco A - LBP 256NG. Comparación E.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
100% 15,3 23,9 19,8 26,9 25,4 26,8 28,7 34,3 41,2 40,8 38,4 40,8 41,9 44,3
50% 2,5 21,4 21,1 29,4 29,4 31,8 32 36,7 41,6 40,5 39,2 40,4 41,8 44
25% 6,67 26,4 24,2 30,4 34,2 35,5 37,5 41 48,7 47,8 46 48,7 49,7 51,4
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco B - LBP 256NG. Comparación E.
Figura 4-13. Gráficas relativas a las pruebas del descriptor LBP.
4.2.4 Descriptores basados en gradiente
Podemos encontrar las pruebas realizadas con los descriptores basados en gradiente desde la Tabla B - 18 hasta
la Tabla B - 31. Durante estos análisis, en aquellas ocasiones en las que se haya utilizado un valor umbral para
separar los valores más importantes del módulo, dicho umbral será 1.75 veces la media de dicho módulo, que
variará con cada muestra (de este modo, al tener un umbral dinámico, superior a la media, nos aseguramos de
que se sólo se tengan en cuentan los valores más característicos de cada muestra). En las gráficas obtenidas a
partir de esas pruebas, en la Figura 4-14, lo primero que observamos es que cuando el número de clases es
pequeño (tres), el PPC es un descriptor bastante bueno (del orden del 20%-30%, mejor que cualquier estadístico,
tanto de primer como de segundo orden, por sí mismo). No obstante, se vuelve incapaz de identificar
correctamente relativamente pronto. En cuanto a los histogramas de módulo y fase del gradiente, ofrecen
también un resultado más que aceptable, no aumentando drásticamente al elevar el número de clases.
Para esos dos descriptores, se observa como, en líneas generales, el operador 2x2, Roberts, queda peor
posicionado que los otros dos, 3x3, que hacen que los descriptores ofrezcan resultados similares. En cuanto al
intento de combinar el PPC con los histogramas, sólo se consigue empeorar el buen PCI que ya ofrecían los
histogramas por sí mismos.
En cuanto a los niveles de gris y a la escala, podemos concluir algo similar a lo que viene ocurriendo: ese tipo
de cambios no provocan, en general, alteraciones significativas en la imagen de gradientes, por lo que el
resultado no varía demasiado.
Con respecto al descriptor HOG, tomar el umbral parece proporcionar mejores resultados, posiblemente porque
de ese modo sólo se usan los valores más importantes del módulo. En cuanto al operador, esta vez es Roberts el
que ofrece un PCI más bajo, es más, lo hace con bastante diferencia, cosa que, a priori, no parecía muy probable.
En cuanto al número de divisiones del rango angular, parece que el resultado mejora en tanto que este aumenta.
Cuanto mayor número de divisiones hay, mayor dimensión tendrá el histograma y por lo tanto mejor
caracterizada estará cada clase. En relación con los niveles de gris, el PCI mejora ligeramente al reducirlos. Sin
embargo, ante el cambio de escala el resultado del banco B cae abruptamente.
Por último, se dijo que uno de los posibles problemas de HOG es que existía la posibilidad de que para pequeñas
variaciones de la fase del gradiente, se sumasen módulos a secciones distintas. Se implementó el sistema de
interpolación angular que se comentó, asignando el módulo a las dos zonas más cercanas, con un peso en función
de lo cerca que estuviese la fase del centro de dichas zonas. No obstante, el resultado no sólo no mejora, sino
que empeora muy ligeramente en la mayor parte de los casos, además de conllevar un pequeño coste
computacional adicional.
Experimentación
46
46
3 6 9 12 15 18 21 25
Roberts 28,06 57,36 69,81 77,78 82 84,91 86,07 88,73
Prewitt 23,89 55,56 66,11 72,01 79 82,55 82,78 85,57
Sobel 21,94 55,28 66,3 72,99 79,56 82,82 83,41 86
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0102030405060708090
100
PC
I (%
)
Número de clases
Banco A - PPC E100/256NG. Comparación operadores.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
Roberts 28,3 51,4 67,3 75 75,3 79,6 82,7 85,9 89,4 91,3 92,4 93,6 94 94,3
Prewitt 17,5 51,4 69,4 78,1 76,6 78,6 81,6 84 86,7 88,7 90,7 92 92,7 93,3
Sobel 18,3 51,9 71,5 79,3 77,7 80,1 82,5 84,8 88 89,3 90,8 92,5 93,2 93,9
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0102030405060708090
100
PC
I (%
)
Número de clases
Banco B - PPC E100/256NG. Comparación operadores.
3 6 9 12 15 18 21 25
Roberts 36,67 54,17 63,43 71,04 71,28 70,6 73,73 77,07
Prewitt 28,33 44,44 53,15 60 61,83 62,08 66,79 71,6
Sobel 28,61 44,31 53,06 60 61,56 62,18 67,3 71,77
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0102030405060708090
100
PC
I (%
)
Número de clases
Banco A - Hist E100/256NG. Comparación operadores.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
Roberts 16,9 36 39 49,4 50,6 56,8 62,1 66,6 72,3 71,9 72 75,1 77,5 78,2
Prewitt 13,6 36 36,7 46,6 47,1 56 60,6 65 69,3 68 66,7 69,9 72,3 73,7
Sobel 11,1 36,3 36,9 46,6 46,9 56,1 60,7 64,9 69,2 67,9 66,6 70 72,4 73,7
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0102030405060708090
100
PC
I (%
)
Número de clases
Banco B - Hist E100/256NG. Comparación operadores.
3 6 9 12 15 18 21 25
PPC 23,89 55,56 66,11 72,01 79 82,55 82,78 85,57
Hist 28,33 44,44 53,15 60 61,83 62,08 66,79 71,6
HistPPC 37,5 53,47 61,02 68,4 71,17 71,76 74,48 77,9
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0102030405060708090
100
PC
I (%
)
Número de clases
Banco A - Prewitt E100/256NG. Comparación descriptores.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
PPC 17,5 51,4 69,4 78,1 76,6 78,6 81,6 84 86,7 88,7 90,7 92 92,7 93,3
Hist 13,6 36 36,7 46,6 47,1 56 60,6 65 69,3 68 66,7 69,9 72,3 73,7
HistPPC 15,6 32,8 36 46,7 46,3 54,9 59,3 63,8 69 70,7 70,3 72,8 74,6 76,1
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0102030405060708090
100
PC
I (%
)
Número de clases
Banco B - Prewitt E100/256NG. Comparación descriptores.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
256NG 13,6 36 36,7 46,6 47,1 56 60,6 65 69,3 68 66,7 69,9 72,3 73,7
32NG 10,3 33,3 34 43,8 44,2 50,9 56 60,9 66,5 67,6 65,7 68,7 70,3 71,7
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco B - Hist Prewitt E100. Comparación NG.
3 6 9 12 15 18 21 25
256NG 28,33 44,44 53,15 60 61,83 62,08 66,79 71,6
32NG 28,33 44,72 53,33 60,83 62 62,22 66,83 71,5
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco A - Hist Prewitt E100. Comparación NG.
Experimentación
48
48
3 6 9 12 15 18 21 25
100% 28,33 44,44 53,15 60 61,83 62,08 66,79 71,6
50% 28,61 42,08 48,89 54,44 57,17 56,34 61,94 66,7
25% 40 49,86 56,3 64,03 64,33 68,47 70,56 73,33
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0102030405060708090
100
PC
I (%
)
Número de clases
Banco A - Hist Prewitt 256NG. Comparación E.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
100% 13,6 36 36,7 46,6 47,1 56 60,6 65 69,3 68 66,7 69,9 72,3 73,7
50% 13,1 31 33,5 45,4 45,6 53,4 58,7 64,9 68,9 68,7 67 71,1 73 74,4
25% 10 35,7 39,4 46 47,4 52,9 56,6 61,1 67,7 68,8 67,2 70,8 72,1 73,5
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0102030405060708090
100
PC
I (%
)
Número de clases
Banco B - Hist Prewitt 256NG. Comparación E.
3 6 9 12 15 18 21 25
0 40 67,22 67,31 76,88 80,11 83,84 86,31 88,87
1.75m 43,33 69,03 69,26 76,39 80 81,62 84,56 88,03
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco A - HOG9 Prewitt E100/256NG. Comparación umbral.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
0 53,9 60,4 60,9 67,4 70,4 73,6 74 78,3 83 81,8 79,2 81,3 82,5 83,6
1.75m 51,1 56,3 54,5 58,6 60,3 64,1 63,3 69,8 75,6 73,5 71,1 74,4 75,3 77,1
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco B - HOG9 Prewitt E100/256NG. Comparación umbral.
3 6 9 12 15 18 21 25
Roberts 46,94 69,31 68,7 74,44 78,17 80,69 83,17 85,87
Prewitt 43,33 69,03 69,26 76,39 80 81,62 84,56 88,03
Sobel 43,61 70 69,54 77,22 80,61 82,18 85,24 88,5
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0102030405060708090
100
PC
I (%
)
Número de clases
Banco A - HOG9 E100/256NG u1,75m. Comparación operadores.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
Roberts 6,94 35,6 37,1 50,4 49,7 53,8 55,2 60,8 66,4 66,6 65,2 67,4 69,8 70,9
Prewitt 51,1 56,3 54,5 58,6 60,3 64,1 63,3 69,8 75,6 73,5 71,1 74,4 75,3 77,1
Sobel 50 57,2 51,4 56 57,9 61,9 61,2 68 74,1 71,9 69,7 73 74,3 76,4
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0102030405060708090
100
PC
I (%
)
Número de clases
Banco B - HOG9 E100/256NG u1,75m. Comparación operadores.
3 6 9 12 15 18 21 25
9 46,94 69,31 68,7 74,44 78,17 80,69 83,17 85,87
18 44,72 67,22 67,87 74,24 77,11 79,86 81,75 84,33
36 44,44 65,56 66,2 72,43 76 78,52 80,48 82,93
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0102030405060708090
100
PC
I (%
)
Número de clases
Banco A - HOG opR E100/256NG uM. Comparación divisiones.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
9 6,94 35,6 37,1 50,4 49,7 53,8 55,2 60,8 66,4 66,6 65,2 67,4 69,8 70,9
18 5,83 31,1 30,7 45 43,5 48 49,3 55 61,7 62,4 61,7 63,5 66,2 67,1
36 5,83 30,7 31,3 44,8 42,8 47,3 48,5 53,7 60,3 60,1 59,6 61,8 63,8 65
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0102030405060708090
100
PC
I (%
)
Número de clases
Banco B - HOG opR E100/256NG uM. Comparación divisiones.
Experimentación
50
50
3 6 9 12 15 18 21 25
256NG 44,44 65,56 66,2 72,43 76 78,52 80,48 82,93
32NG 44,17 65 66,39 72,71 75,72 78,38 80,36 83,07
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco A - HOG36 Roberts E100 uM. Comparación NG.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
256NG 5,83 30,7 31,3 44,8 42,8 47,3 48,5 53,7 60,3 60,1 59,6 61,8 63,8 65
32NG 6,39 25 24,1 39,6 37,7 41,9 43,1 47,4 53,7 54,9 55,5 57,5 60,3 60,4
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco B - HOG36 Roberts E100 uM. Comparación NG.
3 6 9 12 15 18 21 25
100% 44,44 65,56 66,2 72,43 76 78,52 80,48 82,93
50% 37,78 65,83 68,98 75 78,61 79,58 80,71 82,9
25% 42,78 69,72 72,31 75,97 80 79,44 79,8 82,63
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0102030405060708090
100
PC
I (%
)
Número de clases
Banco A - HOG36 Roberts 256NG uM. Comparación E.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
100% 5,83 30,7 31,3 44,8 42,8 47,3 48,5 53,7 60,3 60,1 59,6 61,8 63,8 65
50% 20 44,7 46,5 55,8 54,4 59,2 59,9 65,2 69,5 68,2 67,3 69 69,9 70,2
25% 40,3 56,1 56,9 65,8 68,9 71,6 71,2 74,2 77,8 77,1 77,5 78,7 79,7 79,9
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0102030405060708090
100
PC
I (%
)
Número de clases
Banco B - HOG36 Roberts 256NG uM. Comparación E.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
HOG u0 11,7 30,1 31,6 43,3 42,7 47,4 49,7 54 61,8 61,9 59,8 63 65,3 66
HOG intr u0 12,2 35 35,9 48,4 47,4 52,5 54,3 58,5 65,9 65,9 64,6 67,2 69,1 69,4
HOG uM 5,83 30,7 31,3 44,8 42,8 47,3 48,5 53,7 60,3 60,1 59,6 61,8 63,8 65
HOG intr uM 5,83 31,5 30 44,2 42,6 46,3 47,9 53,7 60,3 60,3 59,7 61,6 63,7 64,7
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0102030405060708090
100
PC
I (%
)
Número de clases
Banco B - HOG36 opR E100/256NG. Comparación HOG/HOGintr.
3 6 9 12 15 18 21 25
HOG u0 47,5 68,75 69,35 75,69 78,56 80,69 82,42 86,07
HOGintr u0 47,78 68,89 69,63 75,63 78,5 80,93 82,58 86,2
HOG uM 44,44 65,56 66,2 72,43 76 78,52 80,48 82,93
HOGIntr uM 44,72 66,25 66,85 73,06 75,94 78,47 80,44 83,13
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0102030405060708090
100
PC
I (%
)
Número de clases
Banco A - HOG36 opR E100/256NG. Comparación HOG/HOGintr.
Figura 4-14. Gráficas referentes a las pruebas con descriptores basados en gradiente.
Experimentación
52
52
4.3 Preprocesamiento
Esta subsección surge a raíz de los malos resultados obtenidos con los descriptores de Laws. Es posible que uno
de los factores que originen ese mal rendimiento sea la dispersión de las muestras motivada por las condiciones
de iluminación. Por este motivo, una práctica muy habitual al utilizar este método es el de realizar una etapa
previa de procesamiento en el que se intente corregir este problema. Una
técnica habitual es escoger una ventana que recorra la imagen y vaya
quitando la media de intensidad a todos los píxeles, de manera que
resulten cercanos a cero. Si se realiza una sustracción de intensidad
global, es decir, se escoge una ventana del tamaño de toda la imagen, se
conseguiría unificar el brillo de todas las muestras pero se estarían
ignorando aquellas posibles manchas o defectos de iluminación
focalizados en alguna sección concreta de la imagen. Por este motivo, se
prefiere trabajar con una subventana que vaya sustrayendo la media de
entornos locales de la imagen. Sin embargo, si la ventana es demasiado
pequeña los motivos de la textura que compone la imagen podrían
cambiar radicalmente, por lo que hay que alcanzar un compromiso.
Pueden verse estos efectos en la Figura 4-15. Una ventana ampliamente
utilizada es un cuadrado de 15 píxeles de lado.
Se aplicarán también el resto de métodos al conjunto de imágenes
preprocesadas para corroborar su comportamiento pero, cómo
únicamente queremos una idea rápida del resultado, se realizarán con las
imágenes escaladas al 25% ya que de este modo el gasto computacional es nimio. Dado que con esa escala el
tamaño de las muestras será 25x25 píxeles, quizás utilizar un tamaño de ventana de lado 15 sea demasiado
grande, así que las usaremos 5x5.
Así, esta relación de pruebas puede encontrarse directamente en forma
de gráficos en la Figura 4-17. Dado que el banco A posee muestras de
mayor calidad, con unas condiciones de captura más cuidadas y, muy
probablemente, obtenidas con algún dispositivo de mayor categoría,
podemos observar que, en general, se ve menos afectado por el
preprocesamiento que el banco B, cuyas muestras poseen mayores
variaciones de iluminación.
Podemos ver cómo, efectivamente, el PCI obtenido utilizando los
descriptores de Laws mejora de forma considerable. Lo mismo ocurre,
aunque en menor medida, con los momentos invariantes de Hu. En
cuanto a los descriptores estadísticos se puede observar que, para el
banco A, se ven negativamente afectados, más en los de primer orden
que en los de segundo, probablemente debido a que el histograma se verá
drásticamente modificado, y la dependiencia al mismo es menor en éstos
últimos debido a que se establecen relaciones entre píxeles vecinos;
mientras que para el banco B los resultados también mejoran. En cuanto
a LBP, del mismo modo, los resultados son peores, levemente para el banco A y considerablemente para el B.
Respecto a los métodos basados en gradiente, era de suponer, como ocurre en la mayoría de casos de HOG, que
los resultados empeorarían pues la imagen de gradientes puede verse significativamente distorsionada si la media
local obtenida a cada paso de la subventana es relativamente distinto (que ocurrirá muy probablemente si su
tamaño es reducido), como puede verse en la Figura 4-16. A pesar de esto, cuando se usan los histogramas de
módulo y fase como descriptores, el PCI mejora ligeramente.
Original 100x100
25x25 5x5
Figura 4-15. Sustracción de intensidad
media para distintas subventanas (14A).
Figura 4-16. Módulos de muestra
original frente a muestra a muestra
preprocesada (14A).
3 6 9 12 15 18 21 25
n/a 60,83 80,14 86,76 90,14 92,39 93,61 92,98 93,6
5x5 55,83 65,14 69,54 75,14 76,89 76,3 78,25 78,2
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco A - Laws 5x5 - 25E/256NG. Comparación PreProc.
3 6 9 12 15 18 21 25
n/a 62,2 79,7 84,5 88,5 88,1 90,5 91,9 93,2 94,5 95,5 96,1 96,6 96,8 97,1
5x5 28,1 37,5 45,3 56,2 59,7 67,2 72,4 75,9 78,4 80,2 82,5 84 84,9 85,2
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco B - Laws 5x5 - 25E/256NG. Comparación PreProc.
3 6 9 12 15 18 21 25
n/a 55,83 74,72 82,41 84,79 85,5 84,86 83,33 83,47
5x5 53,61 61,81 70,56 77,57 81,61 83,38 84,68 83,87
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco A - Laws 3x3 - 25E/256NG. Comparación PreProc.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
n/a 61,1 83,2 82,8 86,7 85,6 88 88,5 90,4 92,2 93,6 94,6 95,1 95,4 95,8
5x5 26,7 37,6 49,7 58,2 62,3 69,7 75,8 78,9 81,5 83,7 85,9 87,3 88,6 89,4
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco B - Laws 3x3 - 25E/256NG. Comparación PreProc.
Experimentación
54
54
3 6 9 12 15 18 21 25
n/a 40 45,42 50,93 51,94 57,5 58,89 60,44 62,43
5x5 52,5 54,17 61,3 67,78 73,44 75,88 75,44 75,77
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco A - msake 25E/256NG. Comparación PreProc.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
n/a 21,1 44,9 49,9 59,4 56,8 58,6 59,6 64,8 70,8 71,7 75 77,2 79,5 80
5x5 26,9 39,9 40,9 50,1 49,4 51,9 56,7 62,9 67,3 70,2 72,3 75,2 76,9 77,8
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco B - msake - 25E/256NG. Comparación PreProc.
3 6 9 12 15 18 21 25
n/a 36,11 44,31 55 63,68 68,11 69,07 71,39 75,13
5x5 47,5 52,92 59,81 67,43 70,44 71,57 74,64 75,77
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco A - McEAC 25E/256NG. Comparación PreProc.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
n/a 16,7 44,3 28,9 42,1 45,6 50,8 55 58,3 61,7 65 68,4 71,8 74 75,7
5x5 2,78 24,7 22,9 34,4 35,1 38,5 39,9 44,8 50,5 54,8 59,1 62,9 66,5 68,5
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco B - McEAC 25E/256NG. Comparación PreProc.
3 6 9 12 15 18 21 25
n/a 56,67 71,53 80,46 83,75 86,11 86,2 84,48 86,3
5x5 59,17 68,89 74,63 80,49 82,94 82,96 84,29 85,2
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco A - Hu 25E/256NG. Comparación PreProc.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
n/a 57,8 78,3 75,9 80,6 75,7 79,9 81,8 83,1 85,1 87,2 89 90,2 91 91,2
5x5 30,3 43,9 50,3 59,7 65 69,7 72,8 76,7 80 81,5 84,3 86,1 87,2 88,2
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco B - Hu 25E/256NG. Comparación PreProc.
3 6 9 12 15 18 21 25
n/a 42,78 69,72 72,31 75,97 80 79,44 79,8 82,63
5x5 46,39 72,22 77,13 81,6 83,72 83,43 83,29 86,53
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco A - HOG36 opR uM 25E/256NG. Comparación PreProc.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
n/a 40,3 56,1 56,9 65,8 68,9 71,6 71,2 74,2 77,8 77,1 77,5 78,7 79,7 79,9
5x5 31,9 48,9 48 58,6 61,6 67,5 70,8 74,7 78,7 79 77,8 79,9 80,6 81,4
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco B - HOG36 opR uM 25E/256NG. Comparación PreProc.
Experimentación
56
56
3 6 9 12 15 18 21 25
n/a 34,72 58,61 59,54 64,86 68,11 67,55 68,89 73,53
5x5 43,33 59,31 61,48 67,64 68,72 68,43 69,17 73,33
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco A - LBP 25E/256NG. Comparación PreProc.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
n/a 6,67 26,4 24,2 30,4 34,2 35,5 37,5 41 48,7 47,8 46 48,7 49,7 51,4
5x5 14,4 36,4 37,2 47,5 50,7 53,6 56,7 60,2 64,3 64,1 61,3 64,5 66 67,9
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco B - LBP 25E/256NG. Comparación PreProc.
3 6 9 12 15 18 21 25
n/a 40 49,86 56,3 64,03 64,33 68,47 70,56 73,33
5x5 47,78 52,64 56,85 64,86 65,17 68,01 69,68 71,57
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco A - Hist opP 25E/256NG. Comparación PreProc.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
n/a 10 35,7 39,4 46 47,4 52,9 56,6 61,1 67,7 68,8 67,2 70,8 72,1 73,5
5x5 12,5 27,4 35,6 44,2 45,7 51 54,1 58,9 63,9 64,9 63,6 67,2 68,2 69,3
aleatorio 66,6 83,3 88,8 91,6 93,3 94,4 95,2 96,0 96,7 97,3 97,6 97,9 98,1 98,3
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco B - Hist opP 25E/256NG. Comparación PreProc.
Figura 4-17. Gráficas relativas a las pruebas con muestras preprocesadas.
5 CONCLUSIONES Y TRABAJO FUTURO
n este capítulo aunaremos los resultados experimentales obtenidos y trataremos se extraer una conclusión
global seleccionando el método más adecuado. Hablaremos además de las posibles líneas futuras que se
podrían escoger para continuar el estudio realizado en este TFG.
Así, si unimos el resultado obtenido ante los distintos procedimientos empleados con las muestras en sus
condiciones iniciales, esto es al 100% de escala, con 256 niveles de gris y sin procesamiento previo,
obtendríamos los gráficos presentes en la Figura 5-2. Es de esperar que, cuanto mayor sea el número de clases,
peor PCI, por lo general, se obtendrá. Si inicialmente estamos trabajando con tres clases y en la siguiente prueba
pasamos a trabajar con seis, aquellas muestras mal clasificadas en el primer experimento lo seguirán estando en
el segundo (pues hay algún prototipo incorrecto cerca de ellas, y por muchos que aparezcan otros nuevos no van
a conseguir que se acerquen al correcto),
mientras que las que sí que estaban bien
clasificadas podrían sucumbir ante la
aparición de un nuevo modelo más cercano
a ellas pero incorrecto. Por este motivo, lo
normal es que el PCI tienda a emporar. No
obstante, que mejore en algunos casos
significa que las nuevas clases añadidas
tenían una buena variabilidad,
clasificándose la mayoría de sus muestras
correctamente y sin estropear las que ya
estaban bien.
En relación a los métodos estudiados, sin
duda los descriptores que han ofrecido el
peor resultado han sido los de Laws y los
momentos invariantes de Hu, con
porcentajes de clasificación muy cercanos a
los que se obtendrían al realizar el proceso
de forma aleatoria, incluso trabajando
únicamente con tres clases.
En cuanto al resto de métodos, su rendimiento no ha coincidido en ambos bancos de imágenes. En el B
podríamos decir que el comportamiento ha sido el esperado a priori: los estadísticos de primer orden no terminan
de ofrecer buenos resultados, pero se pueden usar para realizar un primer esbozo del problema pues son intuitivos
y se calculan muy rápidamente, y, si se quiere reducir el PCI, basta con aumentar el orden de los estadísticos a
costa de un incremento del cómputo; lo mismo podemos decir de los métodos basados en gradiente, utilizar los
histogramas de módulo y fase es igual de intuitivo y casi tan rápido coomo los estadísticos de primer orden y, si
se quiere mejorar el PCI, basta con combinar ambos elementos en un descriptor que contenga información de
más alto nivel como el HOG, que ofrece resultados comparables a los estadísticos de segundo orden; y, por
último, era de esperar que el descriptor LBP, que actualmente es de los más empleados para caracterizar texturas
con éxito, y que fue diseñado para resolver este tipo de problemas, ofreciese los mejores resultados (un 44.3%
de clasificaciones incorrectas puede no parecer lo suficientemente pequeño como para considerarse un éxito si
E
7,19
17,94
22,77
34,25
46,74
61,12
114,04
262,24
295,23
548,29
0 50 100 150 200 250 300 350 400 450 500 550 600
ME1
Hist
HOG
HOGint
Hu
Laws3x3
ME2
Laws5x5
ME2 (M)
LBP
Tiempo (ms)
Comparación de tiempo promedio de cómputo por muestra de 100 x 100 píxeles
Figura 5-1. Tiempo medio de cómputo por muestra para descriptores.
Conclusiones y trabajo futuro
58
58
estuviésemos hablando de pocas clases, pero hay que tener en cuenta que el sistema trata de distinguir 61 clases
distintas). En cambio, el comportamiento del banco A no es así en absoluto. De hecho, ocurre lo contrario que
en el B: estadísticos de segundo orden y HOG ofrecen peores resultados que estadísticos de primer orden e
histogramas simples, mientras que LBP mantiene un resultado intermedio entre ambas vertientes.
Teniendo eso en cuenta, podemos decir que no hay un método que destaque
unilateralmente sobre los demás, y que deba ser siempre utilizado. Será necesario
conocer y estudiar el conjunto de muestras para determinar que método será más
adecuado. No obstante, a juzgar por los resultados y por el tiempo promedio que
necesita cada tipo de descriptor para caracterizar una muestra, que podemos ver en la
Figura 5-1, en un problema a ciegas no parece mala idea decantarse por los
histogramas de módulo y fase, para realizar un análisis rápido, y por LBP para un
análisis más profundo, que son los que han ofrecido mejor rendimiento en promedio,
como se observa en la Tabla 5-1 (si bien los estadísticos de segundo orden presentan
un mejor resultado, su tiempo de cómputo es elevado y no merecen para un análisis
rápido, mientras que para uno exhaustivo es mejor LBP).
En cuanto a la forma de continuar este proyecto, hay muchísimas opciones posibles.
Una primera posibilidad sería seleccionar un nuevo conjunto de descriptores a evaluar, siguiendo, por ejemplo,
métodos estructurales, basados en la determinación de patrones primitivos, o métodos que trabajen en el dominio
de la frecuencia, como el filtro de Gabor.
Otra posibilidad pasa por complementar este proyecto combinando entre sí los descriptores aquí empleados. En
[11] el tándem HOG-LBP tuvo un considerable éxito. Es más, se podría también explorar de manera más
profunda los métodos desarrollados en este documento. Hemos hablado de U-LBP, pero se han desarrollado
numerosas variantes del método LBP que parecen recogidas en [20]. Más aún, también se podrían utilizar
entornos de píxel distintos, en lugar de utilizar siempre la vecindad de orden 9.
Otra idea adicional, que podría resultar muy interesante, sería intentar el desarrollo eficiente de estadísticos de
orden superior, que relacionaban cada punto de la imagen con más de un píxel vecino, ya que podría mejorar
notablemente el proceso de clasificación.
Por otro lado, se ha visto levemente algún enfoque de procesamiento previo que parece mejorar el resultado en
algunos casos. Podría ser útil investigar y estudiar otras técnicas de preprocesamiento que pudiesen ayudar a
preparar el conjunto de datos ante algún método concreto, como filtrar el ruido o mejorar el contraste.
También es importante recordar que el otro pilar fundamental de este tipo de tareas es el clasificador. Tratar de
implementar otro tipo de clasificador, como el SVM, o algún modelo no lineal, podría ayudar a conseguir una
mayor separabilidad entre clases. Aún más atrayente parece la idea de implementar algún sistema de inteligencia
artificial basado en redes neuronales convolucionales, muy en auge en la actualidad.
PCI promedio
Laws 3 82,93
Hu 81,11
Me1 57,01
HOG 56,42
Hist 55,89
Me2 51,55
LBP 44,63
Tabla 5-1. PCI
promedio de todos
los métodos.
3 6 9 12 15 18 21 25
Hu 57,22 72,5 80 83,89 85,72 85,65 84,09 85,8
Laws 3x3 52,22 69,58 78,61 81,32 83,61 84,44 82,62 82,77
HOG36 44,44 65,56 66,2 72,43 76 78,52 80,48 82,93
McEAC 40,83 47,36 56,76 65,69 69,39 70,05 73,69 76,57
LBP 47,22 67,36 64,81 69,65 67,83 69,86 72,1 74,6
Hist 28,33 44,44 53,15 60 61,83 62,08 66,79 71,6
msake 33,33 38,47 44,91 50,49 57,17 57,27 57,86 60,83
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco A - Comparación descriptores. E100/256NG.
Conclusiones y trabajo futuro
60
60
Figura 5-2. Comparación del PCI de los métodos de caracterización estudiados.
3 6 9 12 15 18 21 25 31 37 43 49 55 61
Hu 58,06 79,17 76,57 80,56 75,78 79,86 82,18 83,53 85,24 87,25 88,97 90,19 90,92 91,2
Laws 3x3 61,94 79,31 79,72 84,51 80,94 85,09 86,98 89,27 91,29 92,66 93,74 94,13 94,71 95
HOG36 5,83 30,69 31,3 44,79 42,83 47,27 48,45 53,67 60,32 60,14 59,63 61,77 63,79 64,95
McEAC 11,67 20,97 22,96 30,9 33,94 38,84 43,81 50,8 57,66 59,03 61,82 64,22 67,08 70,01
LBP 15,28 23,89 19,81 26,88 25,39 26,81 28,65 34,3 41,21 40,83 38,41 40,77 41,91 44,29
Hist 13,61 35,97 36,67 46,6 47,06 56,02 60,56 65 69,3 68,04 66,67 69,88 72,29 73,73
msake 21,39 35,83 43,52 56,88 52,39 56,34 61,39 65,03 70,86 73,49 76,4 78,84 80,79 80,77
aleatorio 66,67 83,33 88,89 91,67 93,33 94,44 95,24 96,00 96,77 97,30 97,67 97,96 98,18 98,36
0
10
20
30
40
50
60
70
80
90
100
PC
I (%
)
Número de clases
Banco B - Comparación descriptores. E100/256NG.
REFERENCIAS
[1] R. C. Gonzalez y R.E.Woods, Digital Image Processing, Massachusetts: Adison-Wesley, 1992.
[2] L. Shapiro y G. C. Stockman, Computer vision, Prentice Hall, 2001.
[3] M. Tuceryan, A. K. Jain y otros, Handbook of Pattern Recognition and Computer Vision, 1993.
[4] E. Valveny, J. G. Sabaté y R. B. Caselles, «Clasificación de Imágenes,» Coursera - Universitat Autònoma
de Barcelona, [En línea]. Available: https://www.coursera.org/learn/clasificacion-imagenes/.
[5] A. L. Peña, E. Valveny y M. Vanrell, «Detección de Objetos,» Coursera - Universitat Autònoma de
Barcelona, [En línea]. Available: https://www.coursera.org/learn/deteccion-objetos.
[6] M.-K. Hu, «Visual pattern recognition by moment invariants,» IRE transactions on information theory,
vol. 8, nº 2, pp. 179-187, 1962.
[7] R. M. Haralick, K. Shanmugam y otros, «Textural features for image classification,» IEEE Transactions
on systems, man, and cybernetics, nº 6, pp. 610-621, 1973.
[8] K. I. Laws, «Texture energy measures,» Proc. Image understanding workshop, pp. 47-51, 1979.
[9] T. Ojala, M. Pietikinen y D. Harwood, «A comparative study of texture measures with classification based
on featured distributions,» Pattern recognition, vol. 29, nº 1, pp. 51-59, 1996.
[10] N. Dalal y B. Triggs, «Histograms of oriented gradients for human detection,» Computer Vision and
Pattern Recognition, vol. 1, pp. 886-893, 2005.
[11] X. Wang, T. X. Han y S. Yan, «An HOG-LBP human detector with partial occlusion handling,» Computer
Vision, 2009 IEEE 12th International Conference on, pp. 32-39, 2009.
[12] A. Hormigo, F. Rubio y M. Arahal, «Monitorización y Predicción de la Radiación Solar mediante Visión
del Paso de Nubes,» XXXVI Jornadas de Automática, 2015.
[13] «MATLAB - El lenguaje del cálculo técnico,» [En línea]. Available:
https://es.mathworks.com/products/matlab.html.
[14] «Image Processing Toolbox,» [En línea]. Available: https://es.mathworks.com/products/image.html.
Referencias
62
62
[15] S. Lazebnik, C. Schmid y J. Ponce, «A Sparse Texture Representation Using Local Affine Regions,» IEEE
Transactions on Pattern Analysis and Machine Intelligence, vol. 27, nº 8, pp. 1265-1278, 2005.
[16] M. a. Z. A. Varma, «A statistical approach to texture classification from single images,» International
Journal of Computer Vision: Special Issue on Texture Analysis and Synthesis, 2005.
[17] «Www-cvr.ai.uiuc.edu,» Datasets, Ponce Research Group, [En línea]. Available: http://www-
cvr.ai.uiuc.edu/ponce_grp/data/#texture.
[18] «Robots.ox.ac.uk,» Classification, Visual Geometry Group - Texture, [En línea]. Available:
http://www.robots.ox.ac.uk/~vgg/research/texclass/index.html.
[19] M. R. Arahal, Apuntes de Sistemas de Percepción.
[20] T. Bouwmans y otros, «On the Role and the Importance of Features for Background Modeling and
Foreground Detection,» arXiv preprint arXiv:1611.09099, 2016.
[21] R. Rodríguez Morales y S. A. J. Humberto, Procesamiento y Análisis Digital de Imágenes, Madrid: Ra-
Ma, 2011.
ANEXO A. MUESTRAS DE TEXTURA
Banco de imágenes A
01 - Bark (I) 02 - Bark (II) 03 - Bark (III) 04 - Wood (I) 05 - Wood (II)
06 - Wood (III) 07 - Water 08 - Granite 09 - Marble 10 - Floor (I)
11 - Floor (II) 12 - Pebbles 13 - Wall 14 - Brick (I) 15 - Brick (II)
16 - Glass (I) 17 - Glass (II) 18 - Carpet (I) 19 - Carpet (II) 20 - Upholstery
21 - Wallpaper 22 - Fur 23 - Knit 24 - Corduroy 25 - Plaid
Anexo A. Muestras de textura
64
64
Banco de imágenes B
01 - Felt 02 - Polyester 03 - Terrycloth 04 - Rough Plastic 05 - Leather
06 - Sandpaper 07 - Velvet 08 - Pebbles 09 - Frosted Glass 10 - Plaster (I)
11 - Plaster (II) 12 - Rough Paper 13 - Artificial Grass 14 - Roof Shingle 15 - Aluminum Foil
16 - Cork 17 - Rough Tile 18 - Rug (I) 19 - Rug (I) 20 - Styrofoam
21 - Sponge 22 - Lambswool 23 - Lettuce Leaf 24 Rabbit Fur 25 - Quarry Tile
26 - Loofa 27 - Insulation 28 - Crumpled Paper 29 - (02) Zoomed 30 - (11) Zoomed
31 - (12) Zoomed 32 - (14) Zoomed 33 - Slate (I) 34 - Slate (b) 35 - Painted Spheres
36 - Limestone 37 - Brick (I) 38 - Ribbed Paper 39 - Human Skin 40 - Straw
41 - Brick (II) 42 - Corduroy 43 - Salt Crystals 44 - Linen 45 - Concrete (I)
46 - Cotton 47 - Stones 48 - Brown Bread 49 - Concrete (II) 50 - Concrete (III)
51 - Corn Husk 52 - White Bread 53 - Soleirolia Plant 54 - Wood (I) 55 - Orange Peel
56 - Wood (II) 57 - Peacock Feather 58 - Tree Bark 59 - Cracker (I) 60 - Cracker (II)
61 - Moss
ANEXO B. RESULTADOS EXPERIMENTALES
n este anexo se expondrá, dispuesto en forma de tabla, el PCI obtenido para todas las pruebas que se han
realizado, utilizando ambos bancos de imágenes, con todos los métodos estudiados, para tres escalas
distintas y dos números diferentes de niveles de gris. Todo ello repetido para un número de clases cada
vez mayor hasta alcanzar el total de cada banco.
B.i Métodos estadísticos
Banco A Número de clases
Escala NG Descr 3 6 9 12 15 18 21 25
100 256 sae 33,89 38,33 45,37 53,61 60,11 59,49 60,52 65,23
100 256 sake 33,89 37,78 45,09 51,32 58,00 58,56 60,00 64,27
100 256 msake 33,33 38,47 44,91 50,49 57,17 57,27 57,86 60,83
100 32 sae 33,89 39,31 45,74 53,13 59,17 59,07 60,08 65,00
100 32 sake 33,61 38,61 45,74 51,67 57,44 58,29 59,56 63,57
100 32 msake 33,33 39,31 46,02 51,18 57,89 57,31 57,50 60,43
50 256 sae 37,50 40,42 47,78 52,85 59,83 60,83 62,62 66,67
50 256 sake 35,83 37,92 46,76 50,14 57,11 58,29 60,08 64,47
50 256 msake 35,83 38,19 44,72 48,89 55,78 55,79 56,94 59,67
50 32 sae 37,50 40,28 47,50 53,13 59,89 61,06 62,82 66,70
50 32 sake 36,11 38,06 46,30 49,86 56,83 58,43 60,44 64,43
50 32 msake 36,11 38,47 45,00 49,38 55,72 56,20 57,26 60,03
25 256 sae 40,83 45,83 53,24 57,64 62,83 65,88 68,81 71,73
25 256 sake 41,39 45,28 52,04 53,82 60,00 63,56 64,92 68,33
25 256 msake 40,00 45,42 50,93 51,94 57,50 58,89 60,44 62,43
25 32 sae 41,39 46,25 53,52 57,92 62,67 65,88 68,73 71,47
25 32 sake 41,94 45,42 52,31 53,54 59,72 63,84 64,92 68,50
25 32 msake 40,83 45,28 50,83 52,64 58,33 59,58 60,63 62,57
Tabla B - 1. Resultados ofrecidos por estadísticos de primer orden para el banco A.
E
Anexo B. Resultados experimentales
68
68
Tabla B - 2. Resultados ofrecidos por estadísticos de primer orden para el banco B.
Banco B Número de clases
Escala NG Descr 3 6 9 12 15 18 21 25 31 37 43 49 55 61
100 256 sae 18,33 31,39 35,56 50,35 49,56 57,78 61,51 66,43 72,58 74,44 77,42 80,61 82,29 82,83
100 256 sake 19,44 31,39 35,65 50,42 49,72 57,59 61,55 66,37 72,42 74,21 77,31 80,54 82,17 82,62
100 256 msake 21,39 35,83 43,52 56,88 52,39 56,34 61,39 65,03 70,86 73,49 76,40 78,84 80,79 80,77
100 32 sae 18,33 31,25 34,63 50,35 49,56 57,92 61,83 66,67 72,12 75,11 78,12 81,26 82,95 83,46
100 32 sake 19,72 30,69 35,00 50,63 49,72 57,82 61,47 66,53 71,91 74,64 77,79 81,00 82,64 83,25
100 32 msake 21,67 37,22 43,98 57,50 52,17 56,02 61,19 65,27 71,13 74,01 77,00 79,25 81,17 81,11
50 256 sae 17,78 33,75 34,81 47,50 47,39 54,21 56,35 63,37 67,39 69,64 74,40 77,72 80,02 80,51
50 256 sake 17,50 32,50 35,00 47,78 47,44 54,12 56,15 63,43 67,47 69,32 73,70 77,14 79,47 80,08
50 256 msake 21,11 43,19 46,02 58,13 53,17 57,82 61,98 65,07 70,75 73,27 75,74 78,64 80,64 80,85
50 32 sae 17,22 33,61 40,46 50,90 48,72 55,65 57,22 63,43 67,61 70,16 74,79 78,01 80,18 80,67
50 32 sake 17,22 32,08 43,61 53,06 50,39 56,90 58,61 64,07 67,85 70,63 74,61 77,81 79,94 80,44
50 32 msake 20,56 41,67 51,67 61,94 55,56 60,09 63,10 65,20 71,10 74,53 76,76 79,42 81,36 81,22
25 256 sae 18,33 35,14 37,41 48,26 49,17 54,03 54,96 61,20 66,37 70,68 74,84 76,92 79,05 79,59
25 256 sake 16,67 36,39 37,78 48,33 48,61 52,96 54,60 60,80 65,89 70,02 73,82 75,99 78,08 78,73
25 256 msake 21,11 44,86 49,91 59,38 56,83 58,56 59,56 64,77 70,75 71,73 74,96 77,19 79,52 79,95
25 32 sae 19,72 37,08 50,37 58,75 59,39 64,63 64,29 69,57 72,96 76,01 79,03 81,28 82,38 82,72
25 32 sake 19,44 39,44 50,09 59,38 59,67 64,68 64,60 70,37 73,12 76,24 79,05 81,29 82,42 82,65
25 32 msake 20,83 48,89 55,74 64,31 60,83 64,54 66,19 70,93 75,86 76,67 79,34 81,22 83,09 83,37
Banco A Número de clases Banco A Número de clases Banco A Número de clases Banco A Número de clases
Descrip. 3 6 9 Descrip. 3 6 9 Descrip. 3 6 9 Descrip. 3 6 9
m 56,11 79,17 84,81 mse 43,06 49,86 61,30 Rkue 40,83 52,50 66,11 msRk 41,94 47,78 60,56
s 52,22 61,25 72,04 mRa 42,50 59,72 64,63 Raue 35,00 44,86 54,26 msRa 33,61 39,44 45,65
R 55,28 66,81 77,87 mRk 48,89 65,83 76,57 Rake 35,83 42,22 49,35 Rakue 37,22 44,58 53,43
a 43,33 63,33 63,80 mRu 47,78 62,22 70,19 Raku 38,89 47,36 53,15 sakue 33,89 40,14 48,43
k 42,78 66,94 76,85 mRe 46,39 60,42 69,35 skue 38,33 44,86 60,56 sRkue 38,33 44,86 60,56
u 41,39 61,94 74,07 mak 43,89 56,67 59,72 saue 33,33 40,56 48,06 sRaue 33,33 40,56 48,06
e 48,61 63,47 74,72 mau 41,11 48,61 54,63 sake 33,89 37,78 45,09 sRake 33,89 37,78 45,09
ms 48,89 57,78 67,13 mae 38,89 45,28 51,57 saku 33,33 39,03 47,13 sRaku 33,33 39,03 47,13
mR 56,11 79,03 84,72 mku 47,78 60,42 68,80 sRue 40,83 49,72 64,17 makue 37,50 45,69 53,61
ma 42,50 59,86 64,72 mke 45,56 55,69 66,76 sRke 42,22 43,47 60,46 mRkue 42,78 55,56 67,13
mk 48,89 65,83 76,76 mue 42,50 57,64 68,61 sRku 40,00 44,44 60,65 mRaue 36,11 46,11 54,26
mu 47,78 62,22 70,19 sue 40,83 49,72 64,17 sRae 33,89 38,33 45,37 mRake 38,89 45,56 51,76
me 46,39 60,42 69,35 ske 42,22 43,47 60,46 sRau 33,61 40,00 47,41 mRaku 42,22 49,17 54,63
sR 52,22 61,25 72,04 sku 40,00 44,44 60,65 sRak 33,06 37,50 46,02 mskue 36,39 45,56 58,70
sa 33,89 38,47 47,04 sae 33,89 38,33 45,37 mkue 42,78 55,56 67,13 msaue 31,94 39,72 47,31
sk 45,28 46,25 62,78 sau 33,61 40,00 47,41 maue 36,11 46,11 54,26 msake 33,33 38,47 44,91
su 42,22 49,17 63,43 sak 33,06 37,50 46,02 make 38,89 45,56 51,76 msaku 32,22 38,47 47,50
se 46,11 50,97 65,28 sRe 46,11 50,97 65,28 maku 42,22 49,17 54,63 msRue 38,33 46,53 59,81
Ra 43,33 62,50 63,61 sRu 42,22 49,31 63,43 mRue 42,50 57,64 68,61 msRke 39,44 45,97 58,15
Rk 42,78 66,25 76,76 sRk 45,28 46,25 62,78 mRke 45,56 55,69 66,76 msRku 37,78 45,56 58,80
Ru 41,39 61,94 74,07 sRa 33,89 38,47 47,04 mRku 47,78 60,28 68,80 msRae 32,50 38,89 45,56
Re 48,61 62,92 74,54 Rue 43,06 58,33 71,20 mRae 38,89 45,28 51,57 msRau 31,67 38,61 47,13
ak 41,94 60,56 60,56 Rke 40,56 48,33 64,63 mRau 41,11 48,47 54,63 msRak 33,33 38,61 44,26
au 38,61 48,19 54,81 Rku 40,83 55,42 67,87 mRak 43,89 56,67 59,72 msRaku 32,22 38,47 47,50
ae 35,28 41,81 49,91 Rae 35,28 41,81 49,91 msue 38,33 46,53 59,81 msRake 33,33 38,47 44,91
ku 40,83 55,42 67,87 Rau 38,61 48,19 54,81 mske 39,44 45,97 58,06 msRaue 31,94 39,72 47,31
ke 40,56 48,33 64,63 Rak 41,94 60,00 60,46 msku 37,78 45,56 58,80 msRkue 36,39 45,56 58,70
ue 43,06 58,33 71,20 aku 38,89 47,36 53,15 msae 32,50 38,89 45,46 msakue 32,78 39,58 47,31
msR 49,17 57,78 67,13 ake 35,83 42,22 49,26 msau 31,67 38,61 47,13 mRakue 37,50 45,69 53,61
msa 33,61 39,44 45,65 aue 35,00 44,86 54,26 msak 33,33 38,61 44,26 sRakue 33,89 40,14 48,43
msk 41,94 47,78 60,56 kue 40,83 52,50 66,11 msRe 43,06 49,86 61,30 msRakue 32,78 39,58 47,41
msu 38,89 47,64 60,28 akue 37,22 44,58 53,43 msRu 38,89 47,64 60,28
Tabla B - 3. Combinaciones de estadísticos de 1er orden con pocas clases para el banco A.
Anexo B. Resultados experimentales
70
70
Banco B Número de clases Banco B Número de clases Banco B Número de clases Banco B Número de clases
Descrip. 3 6 9 Descrip. 3 6 9 Descrip. 3 6 9 Descrip. 3 6 9
m 59,17 78,75 76,20 mse 33,33 47,64 44,72 Rkue 21,67 43,06 48,89 msRk 27,50 56,53 52,78
s 35,56 48,47 54,35 mRa 41,67 62,08 65,28 Raue 19,17 37,36 42,31 msRa 26,94 42,64 51,30
R 46,39 47,22 52,04 mRk 47,50 70,28 67,41 Rake 21,11 34,72 40,93 Rakue 19,72 36,81 42,41
a 34,44 65,42 69,07 mRu 36,11 54,03 62,13 Raku 20,83 40,00 42,50 sakue 18,33 32,64 36,85
k 30,28 64,58 71,76 mRe 36,11 54,44 53,24 skue 20,28 38,47 42,96 sRkue 20,28 38,47 43,06
u 34,44 51,25 52,78 mak 30,28 55,56 70,65 saue 16,94 33,89 36,94 sRaue 16,94 33,89 37,13
e 35,28 48,47 53,89 mau 29,72 44,58 59,26 sake 19,44 31,39 35,65 sRake 19,44 31,39 35,83
ms 33,89 62,50 59,26 mae 27,78 39,17 49,63 saku 18,33 30,97 33,80 sRaku 18,33 30,97 34,07
mR 59,17 77,50 67,22 mku 29,44 49,72 60,74 sRue 25,83 41,53 45,56 makue 22,78 34,86 49,54
ma 41,67 62,92 69,72 mke 29,44 50,00 51,67 sRke 21,94 39,31 41,57 mRkue 27,50 45,97 52,69
mk 47,50 71,39 74,81 mue 33,89 49,03 54,17 sRku 20,56 37,36 40,56 mRaue 27,78 37,50 49,63
mu 36,39 54,03 62,22 sue 25,83 41,53 46,02 sRae 18,33 31,39 35,56 mRake 21,67 34,72 49,17
me 36,11 54,44 53,15 ske 21,94 39,31 41,20 sRau 17,50 32,92 34,17 mRaku 23,33 40,83 58,98
sR 35,56 44,86 48,98 sku 20,83 37,36 40,65 sRak 22,22 39,44 33,80 mskue 25,83 40,56 45,28
sa 20,83 44,72 38,61 sae 18,33 31,39 35,56 mkue 27,50 45,97 52,78 msaue 25,28 38,06 43,80
sk 25,00 47,50 45,19 sau 17,50 32,92 34,07 maue 27,78 37,50 49,81 msake 21,39 35,83 43,52
su 23,61 41,53 43,80 sak 22,22 42,64 39,44 make 21,67 34,58 49,54 msaku 21,39 34,72 47,13
se 27,78 42,92 48,33 sRe 27,78 43,06 46,94 maku 23,33 40,83 59,26 msRue 32,22 44,31 46,48
Ra 34,44 58,75 49,63 sRu 23,61 41,53 42,96 mRue 34,17 49,03 53,80 msRke 26,94 44,03 43,24
Rk 30,00 57,92 42,59 sRk 25,00 41,81 39,35 mRke 29,44 49,86 51,67 msRku 26,11 39,86 50,19
Ru 34,44 51,25 51,85 sRa 20,83 40,56 32,78 mRku 29,44 49,72 60,65 msRae 26,39 38,89 43,43
Re 35,00 48,47 52,69 Rue 33,61 46,94 51,39 mRae 27,78 39,17 49,17 msRau 26,11 37,64 47,04
ak 29,72 55,14 68,52 Rke 22,22 43,75 47,31 mRau 29,72 44,58 58,98 msRak 22,22 42,22 50,93
au 18,89 41,53 42,41 Rku 23,89 45,69 48,43 mRak 30,28 54,44 65,28 msRaku 21,39 34,72 46,94
ae 19,44 35,97 40,65 Rae 19,44 35,97 40,74 msue 32,22 44,44 46,67 msRake 21,39 35,83 43,33
ku 23,89 45,69 48,61 Rau 18,89 41,53 42,59 mske 26,94 43,89 43,15 msRaue 25,28 38,06 43,70
ke 22,22 43,89 46,85 Rak 29,44 50,97 50,00 msku 26,11 39,86 50,19 msRkue 25,83 40,56 45,28
ue 33,61 46,94 51,85 aku 20,83 40,00 42,04 msae 26,39 38,75 43,61 msakue 20,28 36,53 43,61
msR 33,89 62,22 53,06 ake 21,11 34,72 40,65 msau 26,11 37,64 47,22 mRakue 22,78 34,86 49,63
msa 26,94 42,78 52,50 aue 19,17 37,36 42,13 msak 22,22 42,64 53,43 sRakue 18,33 32,64 37,13
msk 27,50 57,08 57,59 kue 21,67 43,06 48,80 msRe 33,33 47,64 44,91 msRakue 20,28 36,53 43,80
msu 32,22 43,75 51,76 akue 19,72 36,81 42,13 msRu 32,22 43,75 51,57
Tabla B - 4. Combinaciones de estadísticos de 1er orden con pocas clases para el banco B.
Banco A Número de clases Banco A Número de clases Banco A Número de clases Banco A Número de clases
Descrip. 3 6 9 Descrip. 3 6 9 Descrip. 3 6 9 Descrip. 3 6 9
M 47,50 68,89 79,72 McC 45,28 50,56 61,85 hEAC 50,83 63,47 70,46 MchE 43,06 62,50 72,13
c 57,50 73,89 78,80 MhU 48,61 64,58 73,24 hUAC 49,72 64,86 70,46 MchU 43,33 63,75 71,94
h 51,39 75,14 79,72 MhE 47,22 61,39 71,76 hUEC 49,44 62,22 69,72 hUEAC 48,89 61,53 69,72
U 45,28 67,78 78,24 MhA 48,06 65,00 74,26 hUEA 48,61 66,25 73,33 cUEAC 44,44 52,64 63,61
E 50,83 69,58 79,35 MhC 48,33 62,36 68,52 cEAC 46,94 54,17 64,07 chEAC 46,94 54,86 65,46
A 44,44 69,31 78,89 MUE 42,78 62,22 75,56 cUAC 45,56 52,92 63,80 chUAC 46,11 54,17 64,91
C 65,00 74,17 76,94 MUA 41,94 60,97 76,94 cUEC 44,44 53,19 63,33 chUEC 45,56 54,17 64,26
Mc 45,28 63,19 73,61 MUC 46,67 58,61 69,44 cUEA 42,78 62,78 75,00 chUEA 44,17 63,19 72,41
Mh 48,33 66,39 75,37 MEA 41,94 62,22 75,83 chAC 47,50 56,53 66,11 MUEAC 43,89 54,86 67,96
MU 41,94 60,69 76,39 MEC 45,00 51,67 65,46 chEC 46,11 55,56 65,74 MhEAC 47,78 56,25 67,13
ME 42,22 59,44 74,44 MAC 50,28 62,36 72,41 chEA 46,39 65,14 73,52 MhUAC 48,61 60,56 68,33
MA 45,00 65,83 76,39 cAC 50,00 56,53 64,63 chUC 46,67 55,28 65,28 MhUEC 46,39 56,53 66,67
MC 49,72 63,06 71,57 cEC 52,22 55,56 65,09 chUA 45,56 65,69 73,15 MhUEA 46,67 63,89 71,57
ch 47,22 69,44 75,46 cEA 44,72 62,78 73,70 chUE 44,17 63,06 72,50 McEAC 44,44 51,39 61,48
cU 44,72 62,36 73,06 cUC 46,11 53,47 63,52 MEAC 45,56 52,36 66,76 McUAC 44,72 51,11 61,48
cE 49,17 59,86 69,91 cUA 43,89 63,89 75,37 MUAC 46,67 57,78 70,19 McUEC 43,61 51,11 61,48
cA 48,06 64,17 73,06 cUE 42,78 62,92 73,98 MUEC 44,44 54,31 66,48 McUEA 41,39 61,39 73,70
cC 57,22 62,64 67,31 chC 46,39 57,78 67,04 MUEA 42,50 62,64 75,83 MchAC 45,00 51,81 63,80
hU 49,72 70,14 75,37 chA 46,67 68,19 74,81 MhAC 48,89 61,25 68,06 MchEC 44,44 52,36 63,98
hE 49,44 67,92 74,63 chE 46,11 64,72 73,15 MhEC 47,22 55,00 66,85 MchEA 43,33 63,33 72,04
hA 51,39 71,25 76,57 chU 45,56 65,28 72,96 MhEA 47,22 63,19 72,22 MchUC 44,72 52,36 63,61
hC 52,78 67,78 71,85 hAC 51,67 68,89 72,13 MhUC 47,78 59,31 67,50 MchUA 43,33 63,75 71,85
UE 46,67 64,86 76,85 hEC 51,39 62,22 69,81 MhUA 48,61 65,56 72,87 MchUE 41,94 62,36 71,39
UA 45,00 67,64 77,78 hEA 49,72 66,94 74,07 MhUE 46,39 63,19 71,48 MchUEA 41,39 62,08 71,67
UC 50,83 65,00 72,69 hUC 50,00 66,25 71,20 McAC 45,28 49,58 61,11 MchUEC 43,33 52,78 63,33
EA 46,94 65,00 76,57 hUA 49,44 70,56 75,65 McEC 44,44 51,11 61,39 MchUAC 43,89 52,92 64,35
EC 53,06 61,81 68,52 hUE 48,61 66,53 73,70 McEA 42,22 61,53 73,52 MchEAC 44,72 52,50 63,52
AC 55,56 68,61 73,15 UEA 45,56 65,42 76,94 McUC 44,44 50,83 61,48 McUEAC 43,89 51,11 62,13
Mch 44,44 65,97 73,89 UEC 47,50 60,97 68,98 McUA 42,50 62,50 74,07 MhUEAC 46,67 58,19 67,50
McU 42,50 62,50 73,52 UAC 49,72 63,47 72,87 McUE 41,39 60,42 73,52 chUEAC 46,11 54,58 65,00
McE 41,94 61,81 73,06 EAC 50,28 60,69 70,00 MchC 45,28 52,08 64,26 MchUEAC 43,89 53,06 64,26
McA 44,44 63,75 74,91 UEAC 46,11 59,72 70,00 MchA 44,17 66,25 73,61
Tabla B - 5. Combinaciones de estadísticos de 2o orden con pocas clases para el banco A.
Anexo B. Resultados experimentales
72
72
Banco B Número de clases Banco B Número de clases Banco B Número de clases Banco B Número de clases
Descrip. 3 6 9 Descrip. 3 6 9 Descrip. 3 6 9 Descrip. 3 6 9
M 53,06 57,64 64,17 McC 2,78 35,42 33,33 hEAC 15,00 28,33 33,06 MchE 17,50 39,72 42,04
c 19,44 47,92 59,54 MhU 25,83 43,75 46,39 hUAC 15,83 29,86 32,22 MchU 18,89 42,50 42,41
h 18,61 52,64 52,59 MhE 20,00 41,11 44,91 hUEC 15,00 29,58 30,37 hUEAC 15,00 30,00 30,65
U 31,67 55,00 58,15 MhA 27,50 43,47 47,13 hUEA 23,06 45,42 49,26 cUEAC 14,44 30,28 30,46
E 23,33 52,92 59,26 MhC 10,28 30,28 31,11 cEAC 12,22 28,19 30,09 chEAC 13,33 29,17 29,72
A 39,17 59,31 62,04 MUE 29,17 44,58 49,26 cUAC 14,17 30,42 31,30 chUAC 15,00 30,83 28,89
C 8,61 46,94 61,94 MUA 37,78 49,17 50,28 cUEC 12,22 29,17 29,63 chUEC 13,06 30,28 29,44
Mc 19,44 39,03 43,43 MUC 12,22 31,81 35,83 cUEA 19,44 45,28 48,61 chUEA 18,61 42,78 44,72
Mh 22,78 42,64 46,30 MEA 31,67 45,83 49,26 chAC 12,78 28,61 28,98 MUEAC 15,00 29,72 31,57
MU 35,83 48,33 49,91 MEC 8,33 28,33 29,35 chEC 11,11 29,44 29,17 MhEAC 15,00 29,31 30,09
ME 27,22 45,00 49,26 MAC 12,78 31,11 45,37 chEA 18,61 40,14 44,26 MhUAC 16,39 31,25 32,50
MA 43,89 50,00 53,89 cAC 8,06 27,92 36,30 chUC 13,06 30,00 27,87 MhUEC 15,00 29,58 30,19
MC 9,72 41,67 48,98 cEC 7,22 28,33 28,61 chUA 19,44 44,31 43,80 MhUEA 25,56 42,50 46,48
ch 17,78 42,36 42,78 cEA 19,17 43,75 51,02 chUE 18,61 42,08 43,98 McEAC 11,39 28,06 29,17
cU 19,17 45,83 44,91 cUC 9,17 29,44 29,81 MEAC 13,06 29,03 31,11 McUAC 14,17 29,86 30,46
cE 18,06 43,61 51,85 cUA 19,44 46,81 45,28 MUAC 16,39 33,75 36,67 McUEC 12,22 29,03 28,52
cA 20,00 43,89 48,61 cUE 18,61 44,44 48,89 MUEC 13,89 29,58 30,65 McUEA 19,44 43,19 44,63
cC 1,67 39,03 47,13 chC 7,78 28,06 27,87 MUEA 30,83 45,56 49,44 MchAC 13,33 28,75 27,59
hU 21,67 46,53 49,81 chA 18,89 41,53 43,89 MhAC 16,11 31,25 32,31 MchEC 10,83 28,47 27,41
hE 18,06 46,11 49,54 chE 17,22 40,97 43,52 MhEC 11,94 28,33 29,17 MchEA 18,61 40,56 42,69
hA 23,61 47,36 52,41 chU 18,89 43,19 43,52 MhEA 22,78 41,81 45,56 MchUC 13,33 29,17 27,22
hC 8,89 29,17 33,06 hAC 15,83 30,14 34,17 MhUC 15,28 30,56 31,48 MchUA 19,44 42,36 42,96
UE 26,11 48,06 53,70 hEC 11,94 27,92 32,69 MhUA 29,72 44,17 47,04 MchUE 18,33 41,11 43,15
UA 35,00 56,25 58,52 hEA 20,83 45,00 50,19 MhUE 22,50 42,36 46,30 MchUEA 18,61 40,97 43,61
UC 11,94 35,83 37,78 hUC 14,72 29,31 31,39 McAC 9,44 27,78 33,24 MchUEC 13,61 29,58 28,33
EA 26,94 50,14 55,46 hUA 26,39 47,64 50,19 McEC 8,33 27,50 27,41 MchUAC 15,00 30,00 28,24
EC 7,22 28,33 32,59 hUE 20,83 45,14 48,61 McEA 18,89 43,61 43,98 MchEAC 14,17 28,33 28,15
AC 10,83 35,83 45,93 UEA 28,61 48,19 53,33 McUC 9,44 28,61 29,54 McUEAC 14,44 29,58 29,35
Mch 17,50 40,97 42,31 UEC 13,89 28,61 30,83 McUA 20,28 45,00 42,69 MhUEAC 15,00 29,31 31,02
McU 18,89 43,89 42,41 UAC 15,56 36,25 39,17 McUE 18,89 43,33 44,44 chUEAC 15,00 30,56 29,91
McE 17,78 41,11 44,07 EAC 13,61 28,06 33,98 MchC 8,33 28,06 26,30 MchUEAC 15,00 29,72 29,07
McA 20,00 44,31 42,31 UEAC 15,00 29,03 31,57 MchA 19,17 42,22 43,15
Tabla B - 6. Combinaciones de estadísticos de 2o orden con pocas clases para el banco B.
ME1 3 Clases 6 Clases 9 Clases ME2 3 Clases 6 Clases 9 Clases
Descr. PCI Descr. PCI Descr. PCI Descr. PCI Descr. PCI Descr. PCI
Ban
co A
msau 31,67 sak 37,5 msak 44,26
Ban
co A
McUE 41,39 McAC 49,58 McAC 61,11
msRau 31,67 sRak 37,5 msRak 44,26 McUEA 41,39 McC 50,56 McEC 61,39
msaue 31,94 sake 37,78 msake 44,91 MchUEA 41,39 McUC 50,83 McUC 61,48
msRaue 31,94 sRake 37,78 msRake 44,91 MU 41,94 McEC 51,11 McEAC 61,48
msaku 32,22 sae 38,33 sake 45,09 McE 41,94 McUAC 51,11 McUAC 61,48
msRaku 32,22 sRae 38,33 sRake 45,09 MUA 41,94 McUEC 51,11 McUEC 61,48
msae 32,5 sa 38,47 sae 45,37 MEA 41,94 McUEAC 51,11 McC 61,85
msRae 32,5 sRa 38,47 sRae 45,37 MchUE 41,94 McEAC 51,39 McUEAC 62,13
msakue 32,78 msake 38,47 msae 45,46 ME 42,22 MEC 51,67 cUEC 63,33
msRakue 32,78 msaku 38,47 msRae 45,56 McEA 42,22 MchAC 51,81 MchUEC 63,33
Descr. PCI Descr. PCI Descr. PCI Descr. PCI Descr. PCI Descr. PCI
Ban
co B
saue 16,94 saku 30,97 sRa 32,78
Ban
co B
cC 1,67 McEC 27,5 MchC 26,3
sRaue 16,94 sRaku 30,97 saku 33,8 McC 2,78 McAC 27,78 MchUC 27,22
sau 17,5 sae 31,39 sRak 33,8 EC 7,22 cAC 27,92 McEC 27,41
sRau 17,5 sake 31,39 sau 34,07 cEC 7,22 hEC 27,92 MchEC 27,41
sae 18,33 sRae 31,39 sRaku 34,07 chC 7,78 chC 28,06 MchAC 27,59
saku 18,33 sRake 31,39 sRau 34,17 cAC 8,06 EAC 28,06 chC 27,87
sRae 18,33 sakue 32,64 sae 35,56 MEC 8,33 MchC 28,06 chUC 27,87
sakue 18,33 sRakue 32,64 sRae 35,56 McEC 8,33 McEAC 28,06 MchEAC 28,15
sRaku 18,33 sau 32,92 sake 35,65 MchC 8,33 cEAC 28,19 MchUAC 28,24
sRakue 18,33 sRau 32,92 sRake 35,83 C 8,61 EC 28,33 MchUEC 28,33
Tabla B - 7. Mejores combinaciones de estadísticos obtenidas para a pocas clases.
Con R: No cambia Mejora Empeora
Con U+A: No cambia Mejora Empeora
Anexo B. Resultados experimentales
74
74
E100 - 256NG Número de clases - JPG Número de clases - PNG E100 - 256NG Número de clases - JPG Número de clases - PNG
Op dis Op D Descr 3 6 9 3 6 9 dis Op D Descr 3 6 9 3 6 9
1 E McC 45,28 51,53 62,41 2,78 35,69 33,33 4 E McC 39,17 53,33 57,04 13,89 28,06 36,94
1 E McEC 44,44 51,11 61,76 8,33 28,06 27,22 4 E McEC 36,39 51,39 56,11 12,50 28,33 31,94
1 E McEAC 44,44 51,39 61,57 11,39 30,28 28,98 4 E McEAC 37,22 49,17 56,30 14,17 29,72 32,50
1 NE McC 36,11 53,19 61,48 9,17 27,78 33,24 4 NE McC 36,67 48,61 58,61 15,28 33,19 37,31
1 NE McEC 39,17 50,56 61,48 12,78 22,08 26,94 4 NE McEC 32,50 45,97 57,69 17,78 32,64 33,06
1 NE McEAC 39,44 50,28 61,30 14,44 26,11 27,78 4 NE McEAC 33,61 45,42 57,78 19,72 34,17 33,33
1 N McC 33,33 50,00 61,30 15,56 24,62 31,11 4 N McC 35,83 52,64 61,57 8,33 28,47 32,78
1 N McEC 36,67 49,86 60,65 10,56 18,61 26,39 4 N McEC 35,00 46,53 60,65 10,83 27,22 27,22
1 N McEAC 37,22 52,64 62,04 14,44 24,31 27,41 4 N McEAC 35,28 47,92 60,19 11,94 30,28 28,43
1 NO McC 39,44 49,17 58,33 8,33 25,83 30,37 4 NO McC 36,67 49,03 53,15 13,61 31,94 37,22
1 NO McEC 38,33 47,08 57,69 5,56 21,67 25,65 4 NO McEC 35,28 46,25 52,87 13,61 30,28 31,48
1 NO McEAC 39,44 49,03 59,91 9,72 23,89 26,30 4 NO McEAC 34,44 45,97 54,54 15,00 31,94 31,48
1 M McC 41,39 46,67 56,30 7,50 22,08 27,04 4 M McC 35,28 46,11 51,94 5,83 28,89 34,54
1 M McEC 39,72 47,50 56,94 6,67 17,64 22,41 4 M McEC 33,89 44,31 51,48 7,50 26,25 26,02
1 M McEAC 40,83 47,36 56,76 11,67 20,97 22,96 4 M McEAC 34,44 42,22 50,37 10,56 28,47 26,94
2 E McC 42,78 54,03 59,91 3,33 34,72 39,35 5 E McC 38,33 51,39 55,93 15,28 38,89 42,78
2 E McEC 40,00 51,81 59,91 6,94 27,92 30,93 5 E McEC 36,11 48,47 54,26 15,28 33,61 32,87
2 E McEAC 40,00 51,25 59,72 8,89 27,92 30,83 5 E McEAC 34,72 47,50 53,98 15,83 35,14 32,69
2 NE McC 31,11 51,39 59,26 6,11 29,72 40,09 5 NE McC 33,67 47,78 58,89 27,22 37,50 44,26
2 NE McEC 33,06 49,86 59,07 8,33 29,03 32,78 5 NE McEC 33,89 45,69 57,87 29,72 36,94 38,70
2 NE McEAC 34,17 50,56 58,43 10,83 30,56 33,43 5 NE McEAC 34,17 45,28 57,22 29,44 38,33 37,87
2 N McC 33,89 47,36 60,74 10,28 35,28 35,00 5 N McC 37,78 53,89 62,78 11,39 29,72 37,41
2 N McEC 36,11 45,42 60,00 11,67 24,17 26,02 5 N McEC 35,00 47,78 61,48 13,06 28,19 30,93
2 N McEAC 36,39 47,92 60,28 13,89 26,53 26,94 5 N McEAC 35,00 47,22 59,81 13,89 31,11 30,65
2 NO McC 39,17 54,86 59,26 3,89 30,83 34,07 5 NO McC 37,50 49,17 53,80 14,44 33,89 44,35
2 NO McEC 35,83 50,42 57,87 5,83 24,86 26,57 5 NO McEC 36,67 46,39 53,61 15,00 31,53 37,50
2 NO McEAC 35,83 50,69 58,61 8,61 27,50 26,85 5 NO McEAC 35,56 45,97 54,72 15,56 32,64 36,67
2 M McC 37,50 46,94 52,13 4,44 35,83 38,52 5 M McC 34,72 44,86 50,09 22,22 39,61 39,17
2 M McEC 35,56 45,28 52,04 6,11 25,42 26,85 5 M McEC 31,94 42,08 49,91 23,89 32,08 32,50
2 M McEAC 36,39 46,11 50,93 8,06 25,00 27,69 5 M McEAC 31,94 39,31 48,89 25,00 35,00 31,39
Tabla B - 8. Análisis de distancia y dirección en estadísticos de 2º orden (I).
E100 - 256NG Número de clases - JPG Número de clases - PNG E100 - 256NG Número de clases - JPG Número de clases - PNG
Op dis Op D Descr 3 6 9 3 6 9 Op dis Op D Descr 3 6 9 3 6 9
3 E McC 41,67 52,08 57,41 5,00 32,92 39,44 6 E McC 39,17 50,83 54,81 16,39 39,62 45,09
3 E McEC 40,00 50,69 57,69 6,94 29,03 32,50 6 E McEC 35,28 47,78 53,98 15,56 31,94 37,04
3 E McEAC 40,00 50,28 57,41 8,61 29,58 33,43 6 E McEAC 34,72 46,53 52,78 15,28 32,36 36,94
3 NE McC 36,39 50,97 59,17 8,06 32,64 41,85 6 NE McC 36,39 46,81 58,24 26,67 39,31 48,43
3 NE McEC 34,44 49,17 58,61 8,61 30,69 33,33 6 NE McEC 35,00 45,56 57,69 26,67 35,97 40,93
3 NE McEAC 34,17 48,89 58,70 11,11 32,22 33,24 6 NE McEAC 34,72 45,14 57,31 26,39 38,06 40,65
3 N McC 34,72 50,00 61,76 8,06 24,31 30,28 6 N McC 40,28 52,92 62,22 11,39 33,89 39,44
3 N McEC 34,72 46,53 60,93 10,28 26,25 27,22 6 N McEC 38,06 48,19 60,93 14,44 30,14 32,69
3 N McEAC 35,28 45,69 60,46 11,94 27,78 27,96 6 N McEAC 37,22 48,75 60,56 17,50 33,47 33,70
3 NO McC 40,83 53,89 56,30 10,83 29,86 36,48 6 NO McC 36,94 48,47 55,74 18,06 38,47 46,67
3 NO McEC 37,50 50,14 55,56 11,94 28,75 31,39 6 NO McEC 35,83 45,97 55,46 19,17 32,92 39,81
3 NO McEAC 35,00 47,92 55,28 14,17 30,97 31,94 6 NO McEAC 33,89 46,39 57,04 20,56 34,31 39,07
3 M McC 35,83 45,42 51,67 5,00 29,17 36,02 6 M McC 36,11 44,86 51,11 27,22 37,22 44,44
3 M McEC 34,72 44,17 51,30 7,50 26,39 29,44 6 M McEC 32,78 41,94 48,89 26,11 34,44 38,33
3 M McEAC 35,00 42,08 50,19 9,44 28,06 30,19 6 M McEAC 33,06 39,31 47,96 26,94 36,81 37,87
Tabla B - 9. Análisis de distancia y dirección en estadísticos de 2º orden (II).
Banco A Número de clases
Escala NG Descr. 3 6 9 12 15 18 21 25
100 256 Hu 57,22 72,50 80,00 83,89 85,72 85,65 84,09 85,80
100 32 Hu 57,50 72,36 80,65 84,24 85,94 85,83 84,09 85,73
50 256 Hu 57,50 71,81 80,56 83,89 85,67 85,51 84,09 85,90
50 32 Hu 57,22 72,50 79,81 83,61 85,94 85,79 84,25 85,83
25 256 Hu 56,67 71,53 80,46 83,75 86,11 86,20 84,48 86,30
25 32 Hu 56,67 71,81 80,19 83,96 86,00 85,88 84,25 85,93
Tabla B - 10. Resultados ofrecidos por momentos de Hu para el banco A.
Anexo B. Resultados experimentales
76
76
Banco B Número de clases
Escala NG Descr. 3 6 9 12 15 18 21 25 31 37 43 49 55 61
100 256 Hu 58,06 79,17 76,57 80,56 75,78 79,86 82,18 83,53 85,24 87,25 88,97 90,19 90,92 91,20
100 32 Hu 57,50 79,44 76,48 80,90 76,28 79,91 81,98 83,53 85,51 87,32 89,28 90,54 91,29 91,60
50 256 Hu 58,06 78,19 76,20 80,56 75,72 79,81 81,87 83,33 85,05 87,07 88,84 90,17 90,98 91,22
50 32 Hu 58,06 78,06 77,59 81,94 77,22 80,88 82,58 84,27 85,94 88,02 89,84 90,94 91,65 91,79
25 256 Hu 57,78 78,33 75,93 80,63 75,72 79,91 81,83 83,13 85,11 87,18 88,99 90,19 90,95 91,17
25 32 Hu 57,50 78,61 79,07 82,78 77,89 80,88 82,62 84,57 86,26 88,04 89,84 90,85 91,68 91,89
Tabla B - 11. Resultados ofrecidos por momentos de Hu para el banco B.
Banco A - 81M Número de clases
Escala NG Descr 3 6 9 12 15 18 21 25
100 256 McC 41,39 46,67 56,30 64,93 69,00 70,37 74,88 77,73
100 256 McEC 39,72 47,50 56,94 65,69 69,17 69,72 73,53 77,03
100 256 McEAC 40,83 47,36 56,76 65,69 69,39 70,05 73,69 76,57
100 32 McC 41,11 45,42 55,37 62,15 66,78 67,73 72,14 75,63
100 32 McEC 39,44 46,94 56,3 63,33 67,94 67,87 71,47 74,77
100 32 McEAC 39,72 47,78 58,52 65,42 68,28 69,58 73,02 75,57
50 256 McC 36,39 44,17 52,78 62,71 64,89 66,57 69,52 74,37
50 256 McEC 33,89 43,33 51,02 61,74 63,78 66,39 69,21 73,33
50 256 McEAC 34,17 43,75 52,13 61,88 65,22 66,44 69,80 74,53
50 32 McC 38,33 45,14 54,63 64,72 67,50 69,21 72,10 75,67
50 32 McEC 33,89 42,92 53,06 63,82 67,06 67,96 70,56 74,53
50 32 McEAC 34,44 43,33 52,41 63,26 66,11 67,59 70,24 74,53
25 256 McC 39,17 45,69 55,46 64,79 68,17 69,58 72,46 75,53
25 256 McEC 37,78 44,72 54,72 64,03 67,78 69,21 71,67 75,03
25 256 McEAC 36,11 44,31 55,00 63,68 68,11 69,07 71,39 75,13
25 32 McC 40,00 47,92 57,41 66,53 70,50 70,42 72,78 75,40
25 32 McEC 38,33 46,39 56,02 66,25 69,67 69,12 70,99 74,13
25 32 McEAC 35,56 45,00 54,35 65,07 68,83 69,35 70,95 74,13
Tabla B - 12. Resultados ofrecidos por estadísticos de 2º orden para el banco A.
Tabla B - 13. Resultados ofrecidos por estadísticos de 2º orden para el banco B.
Banco B - 81M Número de clases
Escala NG Descr 3 6 9 12 15 18 21 25 31 37 43 49 55 61
100 256 McC 7,50 22,08 27,04 32,36 35,61 39,49 44,17 53,37 59,49 60,61 63,53 65,71 68,97 71,67
100 256 McEC 6,67 17,64 22,41 31,04 33,72 38,84 43,69 50,37 57,34 58,81 61,69 64,00 66,91 69,84
100 256 McEAC 11,67 20,97 22,96 30,90 33,94 38,84 43,81 50,80 57,66 59,03 61,82 64,22 67,08 70,01
100 32 McC 6,67 22,08 29,07 34,17 35,33 38,61 43,25 51,03 57,72 58,74 64,50 66,50 69,06 71,79
100 32 McEC 10,28 22,22 28,06 34,51 38,33 42,92 47,54 53,83 59,62 60,59 65,19 67,86 70,45 73,02
100 32 McEAC 11,67 23,61 28,61 34,79 38,72 43,15 47,78 54,07 60,05 60,92 65,74 68,32 70,85 73,36
50 256 McC 5,00 28,06 31,11 41,67 44,56 49,63 54,21 58,07 62,34 66,87 69,38 71,09 73,29 75,85
50 256 McEC 5,00 27,22 26,94 37,57 42,22 47,45 52,02 54,93 58,47 63,04 66,61 68,38 70,23 72,24
50 256 McEAC 5,56 33,75 27,41 37,50 42,22 47,41 52,02 55,40 58,79 63,31 66,65 68,49 70,29 72,21
50 32 McC 4,44 29,72 32,87 41,25 44,28 49,12 53,89 57,43 61,75 65,36 68,82 70,31 72,20 74,17
50 32 McEC 5,00 27,08 29,63 37,99 41,61 47,41 51,71 55,50 59,25 63,27 67,83 69,88 71,89 73,11
50 32 McEAC 5,56 28,06 29,44 37,99 41,94 48,06 52,18 55,90 59,65 63,45 68,45 70,49 72,32 73,62
25 256 McC 16,11 45,97 32,87 47,08 50,06 55,32 59,33 63,17 66,02 68,78 70,97 73,91 76,33 78,01
25 256 McEC 16,94 45,42 28,15 41,67 45,33 50,74 54,96 58,60 61,83 65,02 68,33 71,79 74,03 75,72
25 256 McEAC 16,67 44,31 28,89 42,08 45,56 50,79 54,96 58,27 61,69 64,95 68,37 71,82 73,98 75,72
25 32 McC 16,67 37,50 35,28 46,94 50,39 54,49 58,02 61,03 64,25 67,77 71,16 74,12 75,82 77,79
25 32 McEC 16,11 35,56 33,98 46,18 48,06 54,21 57,54 60,30 62,63 65,29 69,21 72,72 74,65 76,15
25 32 McEAC 17,22 45,97 32,50 45,14 47,06 53,47 56,55 59,87 62,04 65,09 69,07 72,31 74,27 75,75
Anexo B. Resultados experimentales
78
78
B.ii Descriptores de Laws
Banco A Número de clases
Escala NG Dim 3 6 9 12 15 18 21 25
100 256 3x3 52,22 69,58 78,61 81,32 83,61 84,44 82,62 82,77
100 256 5x5 54,17 74,58 83,15 87,29 89,72 91,02 89,92 91,07
100 32 3x3 51,11 69,72 78,52 81,04 83,44 84,07 82,66 82,73
100 32 5x5 52,5 72,5 81,85 86,11 89 90,37 89,21 90,27
50 256 3x3 54,17 72,50 80,19 82,15 83,56 84,81 83,25 83,27
50 256 5x5 57,78 78,19 85,00 88,75 91,17 92,73 91,75 92,50
50 32 3x3 53,89 72,64 80,00 81,88 83,50 84,77 83,17 83,33
50 32 5x5 57,50 77,78 85,09 88,61 91,56 92,96 91,87 91,90
25 256 3x3 55,83 74,72 82,41 84,79 85,50 84,86 83,33 83,47
25 256 5x5 60,83 80,14 86,76 90,14 92,39 93,61 92,98 93,60
25 32 3x3 55,83 74,31 82,22 84,44 85,22 84,49 82,98 83,30
25 32 5x5 60,83 80,28 86,85 90,00 92,22 93,47 92,62 93,37
Tabla B - 14. Resultados ofrecidos por descriptores de Laws para el banco A.
Banco B Número de clases
Escala NG Dim 3 6 9 12 15 18 21 25 31 37 43 49 55 61
100 256 3x3 61,94 79,31 79,72 84,51 80,94 85,09 86,98 89,27 91,29 92,66 93,74 94,13 94,71 95,00
100 256 5x5 63,06 78,61 83,70 86,67 84,33 86,99 88,89 90,77 92,61 93,96 94,75 95,00 95,21 95,36
100 32 3x3 61,11 79,44 79,07 84,72 81,11 85,19 87,14 89,40 91,40 92,86 93,86 94,25 94,83 95,11
100 32 5x5 62,50 76,81 82,31 85,76 81,78 84,58 86,75 89,03 91,16 92,84 93,72 94,35 94,77 94,85
50 256 3x3 60,83 81,67 81,67 86,25 84,83 87,92 88,25 90,30 92,31 93,36 94,32 94,59 94,98 95,45
50 256 5x5 62,22 81,67 85,37 88,61 87,61 89,77 91,11 92,53 94,09 95,18 95,60 95,95 96,08 96,34
50 32 3x3 60,56 80,97 81,76 86,46 85,28 88,19 88,37 90,27 92,34 93,49 94,44 94,63 95,00 95,49
50 32 5x5 66,11 81,53 85,09 88,06 87,11 89,40 90,95 92,20 93,79 94,66 95,06 95,65 95,86 95,93
25 256 3x3 61,11 83,19 82,78 86,67 85,56 88,01 88,49 90,40 92,23 93,63 94,57 95,07 95,41 95,83
25 256 5x5 62,22 79,72 84,54 88,54 88,11 90,46 91,87 93,17 94,49 95,45 96,12 96,63 96,82 97,08
25 32 3x3 60,56 83,06 83,06 87,29 86,33 88,43 88,73 90,53 92,45 93,83 94,67 95,10 95,45 95,82
25 32 5x5 63,06 81,11 85,19 88,89 88,33 90,23 91,71 93,27 94,60 95,47 96,05 96,55 96,76 96,60
Tabla B - 15. Resultados ofrecidos por descriptores de Laws para el banco B.
B.iii LBP
Banco A Número de clases
Escala NG Modo 3 6 9 12 15 18 21 25
100 256 LBP 47,22 67,36 64,81 69,65 67,83 69,86 72,10 74,60
100 256 U-LBP 46,39 66,81 65,83 71,67 70,94 72,59 74,72 77,13
100 32 LBP 41,67 57,22 57,31 63,82 62,39 62,08 65,16 68,37
100 32 U-LBP 43,33 59,86 59,44 65,49 63,17 63,84 67,14 70,17
50 256 LBP 35,56 59,58 61,11 63,19 65,83 66,85 68,06 73,23
50 256 U-LBP 37,78 59,31 63,70 65,28 68,17 67,96 69,48 74,13
50 32 LBP 36,94 59,17 60,83 63,68 66,22 66,90 67,90 73,00
50 32 U-LBP 38,61 59,58 63,70 65,21 67,94 67,59 69,40 74,07
25 256 LBP 34,72 58,61 59,54 64,86 68,11 67,55 68,89 73,53
25 256 U-LBP 31,39 57,92 61,76 68,40 70,94 72,27 73,10 77,30
25 32 LBP 35,56 58,89 58,98 64,58 67,67 67,31 68,97 73,27
25 32 U-LBP 33,61 59,17 62,13 68,13 70,44 71,85 72,62 76,90
Tabla B - 16. Resultados ofrecidos por LBP para el banco A.
Banco B Número de clases
Escala NG Modo 3 6 9 12 15 18 21 25 31 37 43 49 55 61
100 256 LBP 15,28 23,89 19,81 26,88 25,39 26,81 28,65 34,30 41,21 40,83 38,41 40,77 41,91 44,29
100 256 U-LBP 15,56 24,44 21,02 29,79 27,11 28,06 30,36 36,10 44,03 42,70 40,12 42,79 43,65 45,82
100 32 LBP 10,83 18,89 20,65 30,56 31,50 34,21 34,92 39,57 45,30 47,52 46,18 47,89 48,85 51,15
100 32 U-LBP 8,89 17,36 19,91 30,90 30,78 34,95 36,67 41,13 47,28 49,35 47,87 49,52 50,73 52,98
50 256 LBP 2,50 21,39 21,11 29,38 29,39 31,81 31,98 36,70 41,61 40,47 39,15 40,44 41,83 43,95
50 256 U-LBP 5,83 20,42 22,22 30,21 31,22 33,94 34,88 39,97 44,81 42,79 41,74 44,05 45,44 47,75
50 32 LBP 1,67 16,11 22,04 29,72 31,06 34,77 35,52 40,50 43,44 45,74 43,82 44,29 45,85 47,90
50 32 U-LBP 1,11 19,17 28,43 35,56 37,50 40,09 40,91 45,73 48,60 49,46 47,89 49,39 50,65 52,91
25 256 LBP 6,67 26,39 24,17 30,42 34,22 35,51 37,54 40,97 48,74 47,84 45,97 48,71 49,73 51,39
25 256 U-LBP 8,61 27,36 27,31 36,46 41,94 44,40 46,07 48,63 55,51 54,50 52,44 55,75 56,76 58,65
25 32 LBP 4,44 22,08 27,96 35,28 36,11 39,26 41,98 47,17 50,51 50,59 49,46 52,23 54,18 55,75
25 32 U-LBP 6,11 22,92 28,06 40,49 43,44 46,71 48,81 53,80 57,31 57,70 56,61 59,85 62,17 63,70
Tabla B - 17. Resultados ofrecidos por LBP para el banco B.
Anexo B. Resultados experimentales
80
80
B.iv Métodos basados en gradiente
Banco A Número de clases
Escala NG Descr Op Umbral 3 6 9 12 15 18 21 25
100 256 PPC Robert 1.75m 28,06 57,36 69,81 77,78 82,00 84,91 86,07 88,73
100 256 PPC Prewitt 1.75m 23,89 55,56 66,11 72,01 79,00 82,55 82,78 85,57
100 256 PPC Sobel 1.75m 21,94 55,28 66,30 72,99 79,56 82,82 83,41 86,00
100 256 Hist Robert 0 36,67 54,17 63,43 71,04 71,28 70,60 73,73 77,07
100 256 HisPpc Robert 1.75m 41,94 62,36 67,22 74,86 76,61 77,18 78,65 81,73
100 256 Hist Prewitt 0 28,33 44,44 53,15 60,00 61,83 62,08 66,79 71,60
100 256 HisPpc Prewitt 1.75m 37,50 53,47 61,02 68,40 71,17 71,76 74,48 77,90
100 256 Hist Sobel 0 28,61 44,31 53,06 60,00 61,56 62,18 67,30 71,77
100 256 HisPpc Sobel 1.75m 37,78 53,75 62,13 68,82 70,72 71,85 74,21 77,93
100 256 hog9 Robert 0 48,33 69,86 70,46 77,43 81,56 84,35 85,99 88,60
100 256 hog9 Robert 1.75m 46,94 69,31 68,70 74,44 78,17 80,69 83,17 85,87
100 256 hog9 Prewitt 0 40,00 67,22 67,31 76,88 80,11 83,84 86,31 88,87
100 256 hog9 Prewitt 1.75m 43,33 69,03 69,26 76,39 80,00 81,62 84,56 88,03
100 256 hog9 Sobel 0 41,39 67,08 67,87 77,08 80,39 84,26 86,59 89,07
100 256 hog9 Sobel 1.75m 43,61 70,00 69,54 77,22 80,61 82,18 85,24 88,50
100 256 hog18 Robert 0 46,11 68,75 69,81 76,04 79,44 81,94 83,73 86,50
100 256 hog18 Robert 1.75m 44,72 67,22 67,87 74,24 77,11 79,86 81,75 84,33
100 256 hog18 Prewitt 0 42,22 67,92 67,69 76,11 79,67 83,84 86,27 89,20
100 256 hog18 Prewitt 1.75m 44,72 69,72 69,54 76,53 79,89 81,76 84,44 87,40
100 256 hog18 Sobel 0 41,94 66,81 67,22 76,53 79,94 83,66 86,11 88,93
100 256 hog18 Sobel 1.75m 45,56 70,56 69,44 76,18 79,89 81,76 84,80 87,80
100 256 hog36 Robert 0 47,50 68,75 69,35 75,69 78,56 80,69 82,42 86,07
100 256 hog36 Robert 1.75m 44,44 65,56 66,20 72,43 76,00 78,52 80,48 82,93
100 256 hog36 Prewitt 0 41,39 67,92 67,96 76,39 79,72 83,84 86,27 88,63
100 256 hog36 Prewitt 1.75m 45,28 70,14 69,81 76,39 79,78 81,06 84,01 87,13
100 256 hog36 Sobel 0 41,94 67,22 68,24 76,46 80,11 84,03 86,43 88,97
100 256 hog36 Sobel 1.75m 45,56 70,14 70,09 77,15 80,28 81,53 84,17 87,37
Tabla B - 18. Resultados ofrecidos por métodos basados en gradiente para banco A (I).
Banco A Número de clases
Escala NG Descr Op Umbral 3 6 9 12 15 18 21 25
100 32 PPC Robert 1.75m 29,17 58,89 71,20 78,06 83,00 85,97 86,98 89,73
100 32 PPC Prewitt 1.75m 23,33 55,56 65,65 72,08 79,17 82,45 83,17 86,33
100 32 PPC Sobel 1.75m 23,61 55,97 66,76 72,64 79,17 82,50 83,41 86,50
100 32 Hist Robert 0 36,94 54,58 63,33 70,69 71,00 70,42 73,41 76,90
100 32 HisPpc Robert 1.75m 42,78 63,06 68,15 75,69 76,50 76,90 78,45 81,70
100 32 Hist Prewitt 0 28,33 44,72 53,33 60,83 62,00 62,22 66,83 71,50
100 32 HisPpc Prewitt 1.75m 37,22 53,06 61,02 68,54 71,28 71,94 74,40 78,07
100 32 Hist Sobel 0 28,89 45,14 53,43 59,93 61,89 62,41 67,34 72,07
100 32 HisPpc Sobel 1.75m 37,22 52,92 62,41 68,75 70,83 71,90 74,29 77,83
100 32 hog9 Robert 0 48,33 70,14 70,09 76,81 81,06 84,03 85,83 88,60
100 32 hog9 Robert 1.75m 46,67 68,75 68,33 74,51 78,28 80,83 82,94 85,50
100 32 hog9 Prewitt 0 40,00 67,92 67,78 76,53 80,06 84,07 86,51 89,10
100 32 hog9 Prewitt 1.75m 43,06 68,61 69,44 76,74 80,00 81,62 84,52 88,10
100 32 hog9 Sobel 0 41,39 67,36 68,24 76,94 80,22 84,17 86,51 89,10
100 32 hog9 Sobel 1.75m 43,89 70,14 69,26 77,29 80,61 82,04 85,12 88,73
100 32 hog18 Robert 0 45,56 69,03 69,81 76,18 79,33 81,53 83,41 86,37
100 32 hog18 Robert 1.75m 45,00 67,64 67,87 74,51 77,44 79,68 81,71 84,23
100 32 hog18 Prewitt 0 41,11 68,19 68,06 76,81 80,11 84,03 86,39 89,20
100 32 hog18 Prewitt 1.75m 44,72 70,00 70,09 76,32 79,83 81,85 84,44 87,33
100 32 hog18 Sobel 0 41,11 66,53 67,59 76,81 80,17 84,26 86,55 89,20
100 32 hog18 Sobel 1.75m 44,44 70,42 69,44 76,46 79,94 81,85 84,60 87,77
100 32 hog36 Robert 0 46,67 67,64 68,70 74,79 77,67 80,19 81,94 85,67
100 32 hog36 Robert 1.75m 44,17 65,00 66,39 72,71 75,72 78,38 80,36 83,07
100 32 hog36 Prewitt 0 41,67 68,19 68,52 76,74 80,28 84,03 86,43 88,90
100 32 hog36 Prewitt 1.75m 44,72 70,14 70,46 76,60 80,28 81,25 84,13 87,30
100 32 hog36 Sobel 0 41,94 66,94 67,87 76,32 80,00 84,03 86,31 88,80
100 32 hog36 Sobel 1.75m 44,44 70,28 70,46 77,36 80,56 81,94 84,68 87,90
Tabla B - 19. Resultados ofrecidos por métodos basados en gradiente para banco A (II).
Anexo B. Resultados experimentales
82
82
Banco A Número de clases
Escala NG Descr Op Umbral 3 6 9 12 15 18 21 25
50 256 PPC Robert 1.75m 29,44 58,89 69,81 76,74 81,94 84,49 86,98 89,53
50 256 PPC Prewitt 1.75m 22,78 59,72 70,56 76,53 82,56 84,58 86,59 88,83
50 256 PPC Sobel 1.75m 20,83 57,78 69,72 75,28 81,17 84,07 85,75 88,53
50 256 Hist Robert 0 26,39 45,56 58,15 63,82 64,50 62,73 65,87 70,90
50 256 HisPpc Robert 1.75m 35,83 52,64 62,96 69,51 75,17 74,95 75,36 78,83
50 256 Hist Prewitt 0 28,61 42,08 48,89 54,44 57,17 56,34 61,94 66,70
50 256 HisPpc Prewitt 1.75m 36,94 48,75 54,44 63,06 67,06 68,52 71,39 75,27
50 256 Hist Sobel 0 27,50 43,06 49,81 54,51 57,22 56,20 61,67 66,57
50 256 HisPpc Sobel 1.75m 35,83 47,50 53,70 62,71 66,28 66,90 70,24 74,83
50 256 hog9 Robert 0 38,06 68,33 72,69 77,78 83,28 85,32 85,63 88,87
50 256 hog9 Robert 1.75m 40,56 69,72 70,83 75,83 80,44 81,99 82,86 85,87
50 256 hog9 Prewitt 0 37,50 67,22 69,63 76,53 80,06 83,33 85,56 88,00
50 256 hog9 Prewitt 1.75m 42,78 69,86 72,22 78,40 81,33 82,87 85,12 88,00
50 256 hog9 Sobel 0 36,39 66,81 69,72 77,22 80,67 83,66 85,83 88,13
50 256 hog9 Sobel 1.75m 43,06 69,86 70,83 77,85 81,00 82,50 85,16 88,20
50 256 hog18 Robert 0 35,83 67,08 71,85 76,46 81,00 83,24 84,25 87,30
50 256 hog18 Robert 1.75m 41,11 68,47 69,81 75,69 79,67 80,60 81,23 83,73
50 256 hog18 Prewitt 0 39,17 66,53 69,63 76,60 78,94 82,27 84,44 87,53
50 256 hog18 Prewitt 1.75m 45,83 67,92 70,56 78,13 80,78 82,13 84,37 87,10
50 256 hog18 Sobel 0 38,89 67,22 70,00 77,78 80,11 83,38 85,44 87,93
50 256 hog18 Sobel 1.75m 43,33 67,22 71,11 77,64 80,17 81,76 84,48 87,33
50 256 hog36 Robert 0 36,11 65,00 70,93 76,53 80,56 82,64 83,81 87,30
50 256 hog36 Robert 1.75m 37,78 65,83 68,98 75,00 78,61 79,58 80,71 82,90
50 256 hog36 Prewitt 0 40,00 67,64 69,63 77,08 79,39 82,41 84,64 87,77
50 256 hog36 Prewitt 1.75m 44,44 67,50 70,93 77,15 79,94 81,48 83,69 86,70
50 256 hog36 Sobel 0 37,78 66,53 69,26 77,36 79,61 82,64 84,96 87,80
50 256 hog36 Sobel 1.75m 43,89 67,78 71,94 77,85 79,39 81,02 83,61 86,83
Tabla B - 20. Resultados ofrecidos por métodos basados en gradiente para banco A (III).
Banco A Número de clases
Escala NG Descr Op Umbral 3 6 9 12 15 18 21 25
50 32 PPC Robert 1.75m 29,44 60,97 70,65 77,85 83,28 85,32 87,82 89,97
50 32 PPC Prewitt 1.75m 23,89 60,14 70,93 77,08 83,22 85,46 87,46 89,57
50 32 PPC Sobel 1.75m 20,56 58,19 68,33 74,31 79,78 82,87 84,92 88,23
50 32 Hist Robert 0 26,11 45,56 58,06 63,75 63,89 62,04 65,56 70,63
50 32 HisPpc Robert 1.75m 34,17 52,08 62,50 68,96 75,22 74,77 75,28 78,83
50 32 Hist Prewitt 0 28,89 43,06 48,98 54,17 57,06 56,02 61,63 66,83
50 32 HisPpc Prewitt 1.75m 36,94 48,89 54,63 63,54 67,44 68,61 71,59 75,50
50 32 Hist Sobel 0 27,50 43,19 48,98 53,96 56,78 55,56 61,19 66,57
50 32 HisPpc Sobel 1.75m 35,83 46,94 53,61 62,29 66,00 66,57 70,00 74,93
50 32 hog9 Robert 0 39,17 67,50 72,87 77,22 82,78 85,28 85,60 88,73
50 32 hog9 Robert 1.75m 43,33 70,00 70,56 75,90 80,67 81,81 82,66 85,47
50 32 hog9 Prewitt 0 38,06 68,19 70,00 77,15 80,56 83,33 85,63 88,17
50 32 hog9 Prewitt 1.75m 42,50 69,72 72,41 79,10 81,72 83,15 85,20 88,27
50 32 hog9 Sobel 0 36,67 66,53 70,09 77,57 80,94 83,80 85,91 88,20
50 32 hog9 Sobel 1.75m 42,50 69,58 71,02 78,13 81,06 82,55 85,20 88,20
50 32 hog18 Robert 0 36,11 67,22 72,04 77,36 81,61 83,75 84,60 87,47
50 32 hog18 Robert 1.75m 41,94 69,86 70,00 75,90 80,00 80,46 81,35 83,63
50 32 hog18 Prewitt 0 39,44 67,22 69,72 76,88 79,22 82,45 84,76 87,63
50 32 hog18 Prewitt 1.75m 45,83 67,92 71,11 77,64 80,00 81,90 84,40 86,90
50 32 hog18 Sobel 0 38,33 66,81 69,81 78,13 80,28 83,52 85,44 87,73
50 32 hog18 Sobel 1.75m 42,78 67,22 70,28 77,22 79,50 81,25 83,97 87,00
50 32 hog36 Robert 0 37,50 65,97 70,93 75,56 80,00 82,73 83,73 86,83
50 32 hog36 Robert 1.75m 38,89 68,33 68,98 74,79 78,78 79,31 80,52 82,50
50 32 hog36 Prewitt 0 39,44 67,78 69,72 77,43 79,61 82,45 84,60 87,87
50 32 hog36 Prewitt 1.75m 43,89 67,50 70,93 77,22 79,83 81,71 84,09 87,07
50 32 hog36 Sobel 0 37,50 67,22 70,09 77,99 80,00 83,19 85,36 87,87
50 32 hog36 Sobel 1.75m 44,44 68,61 71,67 77,71 79,78 81,11 83,65 86,53
Tabla B - 21. Resultados ofrecidos por métodos basados en gradiente para banco A (IV).
Anexo B. Resultados experimentales
84
84
Banco A Número de clases
Escala NG Descr Op Umbral 3 6 9 12 15 18 21 25
25 256 PPC Robert 1.75m 37,22 69,58 79,44 83,61 84,94 87,87 89,72 88,33
25 256 PPC Prewitt 1.75m 38,61 71,25 78,61 83,19 83,94 84,44 86,79 85,97
25 256 PPC Sobel 1.75m 36,94 70,00 78,15 82,85 83,39 84,03 86,03 85,70
25 256 Hist Robert 0 31,67 50,56 59,63 66,94 68,11 68,84 71,23 73,27
25 256 HisPpc Robert 1.75m 38,61 53,47 64,07 71,67 77,11 79,21 80,24 81,60
25 256 Hist Prewitt 0 40,00 49,86 56,30 64,03 64,33 68,47 70,56 73,33
25 256 HisPpc Prewitt 1.75m 44,17 52,36 59,44 68,54 71,44 74,54 77,22 78,37
25 256 Hist Sobel 0 36,11 47,22 53,15 62,08 63,17 66,71 69,33 71,87
25 256 HisPpc Sobel 1.75m 43,33 52,64 60,37 69,03 71,61 74,91 77,46 78,73
25 256 hog9 Robert 0 37,78 66,25 72,22 78,06 82,56 84,12 84,13 86,80
25 256 hog9 Robert 1.75m 43,33 73,47 75,37 78,96 82,83 81,99 83,02 85,30
25 256 hog9 Prewitt 0 42,22 69,86 72,41 79,10 80,50 82,92 84,33 87,50
25 256 hog9 Prewitt 1.75m 45,28 70,14 73,15 78,47 79,72 83,56 84,88 88,10
25 256 hog9 Sobel 0 40,56 69,58 72,96 78,13 80,11 83,29 84,76 88,20
25 256 hog9 Sobel 1.75m 45,56 69,31 73,52 79,65 81,00 84,07 85,36 88,23
25 256 hog18 Robert 0 38,06 65,56 72,31 77,01 81,44 81,99 82,26 85,67
25 256 hog18 Robert 1.75m 42,50 73,06 73,33 76,74 81,00 81,20 81,67 83,70
25 256 hog18 Prewitt 0 43,89 69,58 72,31 78,40 79,72 82,31 83,89 87,53
25 256 hog18 Prewitt 1.75m 44,72 68,06 73,61 80,07 81,22 84,63 85,87 88,50
25 256 hog18 Sobel 0 40,83 68,61 72,59 78,19 79,11 82,36 84,01 87,87
25 256 hog18 Sobel 1.75m 47,22 67,92 73,61 79,58 80,17 83,38 84,84 87,87
25 256 hog36 Robert 0 38,89 64,58 71,76 76,88 80,06 81,67 81,87 84,97
25 256 hog36 Robert 1.75m 42,78 69,72 72,31 75,97 80,00 79,44 79,80 82,63
25 256 hog36 Prewitt 0 42,22 68,47 72,31 78,33 79,78 82,82 84,33 87,57
25 256 hog36 Prewitt 1.75m 45,00 68,75 74,07 79,86 80,56 83,98 85,04 88,03
25 256 hog36 Sobel 0 41,67 68,75 72,50 78,33 79,17 82,04 83,85 87,33
25 256 hog36 Sobel 1.75m 44,44 68,19 72,69 79,38 80,39 83,06 84,64 87,63
Tabla B - 22. Resultados ofrecidos por métodos basados en gradiente para banco A (V).
Banco A Número de clases
Escala NG Descr Op Umbral 3 6 9 12 15 18 21 25
25 32 PPC Robert 1.75m 38,61 69,72 78,06 83,26 85,56 87,55 89,33 88,23
25 32 PPC Prewitt 1.75m 36,94 72,5 79,63 83,96 84,11 84,95 87,42 87,17
25 32 PPC Sobel 1.75m 35,56 69,58 79,07 83,47 84,72 85,23 87,62 87,03
25 32 Hist Robert 0 31,94 50,69 59,26 65,63 66,94 68,15 71,27 73,73
25 32 HisPpc Robert 1.75m 39,44 53,19 64,35 71,88 77,28 79,35 80,00 81,47
25 32 Hist Prewitt 0 39,44 50,28 56,48 63,96 64,72 68,94 70,48 72,97
25 32 HisPpc Prewitt 1.75m 43,89 52,08 58,70 67,57 70,00 73,06 76,23 78,03
25 32 Hist Sobel 0 35,83 47,92 55,00 62,36 63,44 68,01 70,08 72,60
25 32 HisPpc Sobel 1.75m 45,00 54,03 60,93 69,58 72,11 75,00 77,50 78,67
25 32 hog9 Robert 0 38,33 66,81 72,59 77,78 82,11 83,29 83,65 86,50
25 32 hog9 Robert 1.75m 45,28 74,72 74,44 79,03 82,94 82,64 83,57 85,80
25 32 hog9 Prewitt 0 41,94 70,14 73,33 78,82 80,17 83,15 84,92 88,13
25 32 hog9 Prewitt 1.75m 46,67 70,14 73,89 79,24 80,83 84,21 85,60 88,80
25 32 hog9 Sobel 0 40,00 68,89 72,04 78,06 80,11 83,15 84,64 87,93
25 32 hog9 Sobel 1.75m 44,17 68,47 73,33 79,93 80,83 83,84 85,75 88,67
25 32 hog18 Robert 0 38,89 64,86 71,48 77,29 81,00 81,85 81,87 85,33
25 32 hog18 Robert 1.75m 44,72 72,78 73,89 77,36 80,94 80,88 81,31 83,90
25 32 hog18 Prewitt 0 43,33 69,72 72,31 78,33 79,72 82,27 83,97 87,47
25 32 hog18 Prewitt 1.75m 46,11 69,03 73,43 79,72 80,72 84,21 85,71 88,37
25 32 hog18 Sobel 0 40,83 68,06 72,22 78,06 79,22 82,31 84,01 87,73
25 32 hog18 Sobel 1.75m 46,94 68,06 72,31 79,10 80,39 83,61 84,96 87,93
25 32 hog36 Robert 0 38,33 63,75 70,83 76,46 80,06 80,97 81,71 85,03
25 32 hog36 Robert 1.75m 42,50 71,11 72,78 76,94 80,11 80,37 80,83 83,30
25 32 hog36 Prewitt 0 43,06 69,58 73,24 78,75 79,94 82,69 84,40 87,67
25 32 hog36 Prewitt 1.75m 45,00 67,78 73,15 79,93 80,50 83,33 85,12 88,03
25 32 hog36 Sobel 0 41,94 69,17 72,96 78,96 80,06 83,06 84,40 87,87
25 32 hog36 Sobel 1.75m 45,28 68,89 73,06 78,96 79,94 82,73 84,80 87,80
Tabla B - 23. Resultados ofrecidos por métodos basados en gradiente para banco A (VI).
Anexo B. Resultados experimentales
86
86
Banco B Número de clases
Escala NG Descr Op Umbral 3 6 9 12 15 18 21 25 31 37 43 49 55 61
100 256 PPC Robert 1.75m 28,33 51,39 67,31 75,00 75,33 79,63 82,74 85,87 89,35 91,33 92,44 93,55 93,95 94,28
100 256 PPC Prewitt 1.75m 17,50 51,39 69,35 78,06 76,56 78,56 81,55 84,03 86,69 88,72 90,66 92,02 92,74 93,32
100 256 PPC Sobel 1.75m 18,33 51,94 71,48 79,31 77,72 80,14 82,50 84,80 87,96 89,32 90,79 92,47 93,24 93,85
100 256 Hist Robert 0 16,94 35,97 38,98 49,38 50,61 56,81 62,06 66,63 72,26 71,85 72,02 75,05 77,45 78,18
100 256 HisPpc Robert 1.75m 13,06 37,64 37,59 49,86 46,72 52,69 57,74 61,97 67,90 69,28 71,07 74,71 76,41 77,62
100 256 Hist Prewitt 0 13,61 35,97 36,67 46,60 47,06 56,02 60,56 65,00 69,30 68,04 66,67 69,88 72,29 73,73
100 256 HisPpc Prewitt 1.75m 15,56 32,78 36,02 46,67 46,28 54,86 59,33 63,80 69,01 70,74 70,27 72,76 74,64 76,08
100 256 Hist Sobel 0 11,11 36,25 36,85 46,60 46,94 56,11 60,71 64,87 69,22 67,93 66,55 69,95 72,35 73,66
100 256 HisPpc Sobel 1.75m 14,17 32,36 35,56 46,32 45,83 53,75 58,29 62,93 68,58 69,91 69,84 72,62 74,53 75,74
100 256 hog9 Robert 0 11,67 38,75 41,85 53,75 53,22 58,61 60,60 64,10 71,99 72,52 70,14 72,72 74,83 75,23
100 256 hog9 Robert 1.75m 6,94 35,56 37,13 50,35 49,67 53,84 55,20 60,83 66,37 66,62 65,21 67,35 69,80 70,94
100 256 hog9 Prewitt 0 53,89 60,42 60,93 67,43 70,44 73,56 73,97 78,30 82,98 81,82 79,15 81,31 82,53 83,59
100 256 hog9 Prewitt 1.75m 51,11 56,25 54,54 58,61 60,28 64,12 63,33 69,83 75,59 73,54 71,05 74,42 75,26 77,14
100 256 hog9 Sobel 0 50,56 59,31 56,67 64,17 68,22 71,71 72,02 76,90 81,72 81,04 78,88 81,19 82,02 82,83
100 256 hog9 Sobel 1.75m 50,00 57,22 51,39 55,97 57,94 61,90 61,15 68,00 74,11 71,89 69,65 72,96 74,26 76,38
100 256 hog18 Robert 0 11,67 34,44 35,37 48,75 48,17 53,61 55,44 59,13 66,45 66,76 65,29 67,81 70,09 70,52
100 256 hog18 Robert 1.75m 5,83 31,11 30,65 45,00 43,50 48,01 49,25 55,00 61,72 62,39 61,74 63,47 66,21 67,09
100 256 hog18 Prewitt 0 53,06 60,83 60,74 67,36 69,06 72,41 72,58 76,83 81,56 80,09 77,07 78,95 80,15 81,34
100 256 hog18 Prewitt 1.75m 51,94 55,97 54,07 58,54 58,78 62,13 61,15 68,17 74,11 71,76 69,42 72,60 73,80 75,72
100 256 hog18 Sobel 0 51,67 60,42 56,85 64,65 67,89 71,20 70,71 75,67 80,48 79,64 77,00 79,20 80,45 81,50
100 256 hog18 Sobel 1.75m 48,89 56,25 48,98 55,14 57,22 60,88 60,00 66,67 72,58 70,27 68,24 71,29 72,79 74,84
100 256 hog36 Robert 0 11,67 30,14 31,57 43,26 42,72 47,41 49,72 54,00 61,80 61,91 59,83 63,03 65,27 66,02
100 256 hog36 Robert 1.75m 5,83 30,69 31,30 44,79 42,83 47,27 48,45 53,67 60,32 60,14 59,63 61,77 63,79 64,95
100 256 hog36 Prewitt 0 53,06 60,56 58,98 66,04 68,22 71,44 71,47 75,57 80,70 79,12 76,36 78,10 79,52 80,86
100 256 hog36 Prewitt 1.75m 52,22 55,83 53,89 58,06 58,44 61,94 60,83 67,87 73,47 70,77 68,64 71,84 72,89 74,86
100 256 hog36 Sobel 0 51,94 59,72 55,74 63,54 67,06 70,19 69,64 74,53 79,44 78,87 76,26 78,16 79,33 80,52
100 256 hog36 Sobel 1.75m 47,78 55,42 48,89 55,07 56,28 60,23 59,52 66,60 71,96 69,46 67,48 70,66 72,14 74,11
Tabla B - 24. Resultados ofrecidos por métodos basados en gradiente para banco B (I).
Banco B Número de clases
Escala NG Descr Op Umbral 3 6 9 12 15 18 21 25 31 37 43 49 55 61
100 32 PPC Robert 1.75m 39,44 67,78 73,33 80,35 81,50 84,17 85,99 88,60 90,54 92,41 93,60 94,29 94,73 95,14
100 32 PPC Prewitt 1.75m 20,00 57,36 66,67 75,35 77,17 79,12 81,79 83,83 86,80 88,65 90,21 91,51 92,50 93,09
100 32 PPC Sobel 1.75m 27,78 59,86 70,65 78,96 81,11 82,78 84,68 86,53 88,79 90,36 91,94 93,01 93,65 94,02
100 32 Hist Robert 0 14,17 35,56 38,89 49,86 51,56 57,18 62,58 65,97 71,40 72,45 72,79 75,61 77,03 78,25
100 32 HisPpc Robert 1.75m 13,61 39,03 41,39 52,57 49,33 54,63 58,81 63,10 68,20 71,06 73,60 76,72 78,18 78,84
100 32 Hist Prewitt 0 10,28 33,33 33,98 43,82 44,17 50,93 55,95 60,87 66,53 67,59 65,72 68,67 70,32 71,67
100 32 HisPpc Prewitt 1.75m 14,17 31,25 35,19 45,83 45,11 52,73 57,58 62,30 67,26 68,22 68,16 71,14 72,95 74,21
100 32 Hist Sobel 0 10,83 34,72 35,74 45,14 45,78 52,59 57,46 61,93 67,23 68,49 66,84 69,98 71,55 72,91
100 32 HisPpc Sobel 1.75m 13,61 31,67 35,37 46,11 45,33 53,19 57,90 63,27 68,15 69,03 68,93 71,85 73,85 74,82
100 32 hog9 Robert 0 12,78 31,39 33,98 46,94 47,83 51,02 52,74 57,70 66,37 67,41 64,83 67,67 69,71 71,27
100 32 hog9 Robert 1.75m 7,78 34,58 37,41 53,68 53,00 56,62 57,26 61,07 66,64 67,48 66,10 67,57 70,70 71,31
100 32 hog9 Prewitt 0 53,89 59,72 56,67 62,43 65,89 69,35 70,67 74,63 80,16 79,75 77,60 79,56 80,73 82,24
100 32 hog9 Prewitt 1.75m 52,22 57,22 56,11 60,00 61,28 65,00 64,01 69,93 75,40 73,29 71,09 74,23 75,27 77,14
100 32 hog9 Sobel 0 51,39 57,64 51,57 58,47 63,61 66,94 68,29 72,87 78,60 78,31 75,08 77,26 78,26 79,60
100 32 hog9 Sobel 1.75m 49,72 56,81 51,94 57,01 58,89 62,50 61,59 68,17 74,09 71,98 69,90 73,44 74,61 76,53
100 32 hog18 Robert 0 11,67 27,22 29,26 41,04 41,33 44,72 45,36 50,67 58,74 60,74 59,73 62,35 64,29 64,97
100 32 hog18 Robert 1.75m 6,11 31,81 28,15 45,56 43,33 47,50 48,41 53,67 60,05 60,59 59,90 62,04 65,33 65,71
100 32 hog18 Prewitt 0 52,50 57,78 52,87 59,79 62,78 66,62 67,10 70,70 75,86 74,75 72,34 74,51 75,95 77,68
100 32 hog18 Prewitt 1.75m 51,39 56,53 55,56 60,00 59,94 62,96 61,75 67,53 73,04 70,41 68,64 71,90 73,15 74,92
100 32 hog18 Sobel 0 50,00 54,03 49,54 56,88 61,33 64,63 65,04 68,57 74,38 73,31 70,06 72,74 74,32 76,07
100 32 hog18 Sobel 1.75m 48,89 56,81 49,54 55,49 56,83 60,60 59,68 66,03 71,83 69,32 67,52 70,92 72,42 74,43
100 32 hog36 Robert 0 11,67 30,42 28,24 40,14 37,67 41,48 43,37 48,10 55,19 57,27 56,65 59,17 61,53 61,67
100 32 hog36 Robert 1.75m 6,39 25,00 24,07 39,58 37,72 41,85 43,10 47,37 53,68 54,91 55,47 57,52 60,32 60,37
100 32 hog36 Prewitt 0 50,83 51,25 49,72 56,18 59,06 62,27 63,49 67,13 72,93 72,23 69,34 72,09 73,64 75,64
100 32 hog36 Prewitt 1.75m 51,67 55,14 50,46 55,00 55,72 59,81 58,61 64,60 70,27 68,87 67,33 70,15 71,50 73,83
100 32 hog36 Sobel 0 48,33 46,94 46,30 54,24 59,22 62,41 62,70 66,27 71,83 70,92 67,91 71,02 72,44 74,54
100 32 hog36 Sobel 1.75m 49,17 55,28 47,69 53,26 54,89 58,89 57,82 63,63 69,81 68,36 66,96 69,76 71,09 73,31
Tabla B - 25. Resultados ofrecidos por métodos basados en gradiente para banco B (II).
Anexo B. Resultados experimentales
88
88
Banco B Número de clases
Escala NG Descr Op Umbral 3 6 9 12 15 18 21 25 31 37 43 49 55 61
50 256 PPC Robert 1.75m 48,06 70,69 78,24 84,24 84,33 86,71 88,53 89,83 90,73 91,73 92,83 93,98 94,74 94,93
50 256 PPC Prewitt 1.75m 48,89 75,28 83,80 87,43 85,39 86,76 87,50 89,47 91,67 92,36 91,38 92,55 93,32 93,69
50 256 PPC Sobel 1.75m 47,22 73,89 83,06 85,97 84,67 84,77 86,23 87,80 88,87 90,09 89,75 91,55 92,71 93,05
50 256 Hist Robert 0 21,67 36,39 37,31 48,96 51,83 57,08 62,82 68,97 72,34 72,48 72,69 75,37 77,29 78,63
50 256 HisPpc Robert 1.75m 22,50 35,28 34,44 47,50 47,61 53,94 57,90 63,53 70,03 72,48 73,78 76,00 77,26 78,95
50 256 Hist Prewitt 0 13,06 30,97 33,52 45,35 45,61 53,43 58,73 64,87 68,87 68,69 67,02 71,11 73,00 74,37
50 256 HisPpc Prewitt 1.75m 13,61 29,86 30,56 43,26 45,78 53,70 59,17 63,63 69,25 71,28 70,31 73,28 75,06 77,46
50 256 Hist Sobel 0 13,06 30,42 32,69 45,21 46,39 53,84 60,28 65,73 69,70 69,12 67,54 71,46 73,15 74,23
50 256 HisPpc Sobel 1.75m 12,78 29,58 30,00 43,75 46,61 54,77 60,12 64,07 69,70 71,60 70,62 73,20 74,97 77,27
50 256 hog9 Robert 0 27,22 50,69 51,67 59,10 60,78 65,23 67,98 71,97 76,69 76,08 72,36 74,63 76,91 77,66
50 256 hog9 Robert 1.75m 23,61 45,28 48,52 57,50 57,89 63,01 65,56 71,40 75,65 73,85 72,38 73,62 74,41 74,88
50 256 hog9 Prewitt 0 40,00 61,67 62,31 68,40 68,39 70,56 71,07 75,37 80,46 79,17 75,02 78,01 78,91 79,97
50 256 hog9 Prewitt 1.75m 46,11 56,53 58,15 65,35 66,17 68,66 70,91 75,10 79,38 77,61 73,51 75,92 77,03 77,86
50 256 hog9 Sobel 0 44,44 60,56 60,74 68,13 68,44 72,31 73,73 77,30 81,80 80,43 76,74 79,57 80,26 81,22
50 256 hog9 Sobel 1.75m 44,17 53,33 53,98 62,15 63,56 67,73 68,93 73,93 78,58 76,67 73,22 75,70 76,86 78,14
50 256 hog18 Robert 0 23,33 46,53 45,93 54,31 53,39 58,47 61,79 66,17 71,91 70,86 67,98 70,58 73,15 73,81
50 256 hog18 Robert 1.75m 21,11 44,03 45,46 54,86 54,22 58,89 60,20 66,57 71,45 70,25 68,88 70,68 71,50 72,20
50 256 hog18 Prewitt 0 39,17 59,44 60,46 66,67 66,50 68,06 68,81 72,93 77,69 76,17 72,42 75,65 76,89 78,52
50 256 hog18 Prewitt 1.75m 36,94 56,53 58,24 65,35 64,28 66,44 67,22 72,40 76,59 75,20 71,32 73,42 74,35 75,41
50 256 hog18 Sobel 0 41,67 59,31 58,61 66,46 67,39 70,65 71,19 75,60 79,87 78,45 74,84 77,72 78,70 79,71
50 256 hog18 Sobel 1.75m 43,89 52,92 51,94 61,25 63,11 66,71 66,63 71,77 76,75 74,89 71,36 73,50 74,76 76,28
50 256 hog36 Robert 0 21,67 41,67 42,13 50,83 49,78 54,07 57,14 61,53 67,20 66,42 64,21 66,85 69,08 70,01
50 256 hog36 Robert 1.75m 20,00 44,72 46,48 55,76 54,39 59,17 59,92 65,17 69,46 68,15 67,29 68,95 69,89 70,19
50 256 hog36 Prewitt 0 37,50 59,03 57,41 63,82 64,06 65,97 66,71 70,37 75,81 74,77 71,03 74,12 75,39 77,04
50 256 hog36 Prewitt 1.75m 33,61 56,53 55,93 63,19 63,06 65,46 66,39 70,73 75,30 73,99 70,17 72,04 72,68 74,43
50 256 hog36 Sobel 0 45,00 58,61 57,22 65,28 66,33 68,89 69,40 73,33 77,96 77,18 73,49 76,28 76,97 78,20
50 256 hog36 Sobel 1.75m 43,33 53,33 50,83 60,69 61,72 65,23 65,16 70,57 75,38 74,05 70,99 73,30 74,32 75,68
Tabla B - 26. Resultados ofrecidos por métodos basados en gradiente para banco B (III).
Banco B Número de clases
Escala NG Descr Op Umbral 3 6 9 12 15 18 21 25 31 37 43 49 55 61
50 32 PPC Robert 1.75m 55,83 65,69 75,00 80,42 82,72 85,28 87,54 88,83 90,22 91,89 93,26 94,22 94,65 94,96
50 32 PPC Prewitt 1.75m 53,61 73,06 77,04 80,90 81,22 84,07 85,60 87,83 90,03 90,77 90,27 91,60 92,79 93,28
50 32 PPC Sobel 1.75m 55,00 76,25 79,54 83,75 83,00 84,12 85,91 88,23 91,02 91,73 91,36 92,82 93,64 93,92
50 32 Hist Robert 0 21,67 36,81 40,65 51,53 53,94 59,17 63,69 69,43 72,07 72,95 73,33 76,09 77,50 78,57
50 32 HisPpc Robert 1.75m 23,33 36,25 39,17 52,15 50,06 55,56 59,56 65,67 70,40 72,64 74,42 76,39 77,47 79,13
50 32 Hist Prewitt 0 11,11 27,78 35,56 46,81 48,11 54,17 60,24 64,77 68,28 70,25 68,16 71,36 72,65 73,99
50 32 HisPpc Prewitt 1.75m 13,61 30,28 32,13 45,42 46,94 53,98 58,61 64,47 69,44 70,99 70,04 72,65 74,48 76,57
50 32 Hist Sobel 0 12,78 29,31 36,57 47,50 49,22 55,19 61,55 65,63 69,30 70,99 68,97 72,16 73,50 74,56
50 32 HisPpc Sobel 1.75m 12,78 30,69 32,31 45,90 48,11 54,91 59,88 65,37 70,19 71,15 70,16 72,60 74,48 76,49
50 32 hog9 Robert 0 20,28 40,69 48,80 55,56 56,50 59,77 62,26 67,93 74,54 74,46 71,32 73,35 75,32 76,24
50 32 hog9 Robert 1.75m 28,06 39,58 46,57 59,17 60,83 63,98 64,92 71,10 75,65 75,43 73,74 75,14 76,64 76,98
50 32 hog9 Prewitt 0 39,17 57,92 55,09 62,43 64,22 67,13 68,89 72,90 78,63 77,61 73,43 76,00 77,53 78,87
50 32 hog9 Prewitt 1.75m 39,17 57,08 53,80 61,74 63,22 65,97 68,41 73,60 78,68 77,39 74,15 76,04 77,24 78,36
50 32 hog9 Sobel 0 36,67 50,14 53,06 60,28 62,44 66,67 68,93 72,50 78,09 77,50 73,53 76,45 77,33 78,44
50 32 hog9 Sobel 1.75m 45,28 49,31 49,81 58,68 60,00 64,31 66,19 72,63 78,04 76,33 73,20 75,48 76,73 77,81
50 32 hog18 Robert 0 10,28 34,72 41,20 49,86 49,28 50,97 52,86 59,67 66,42 66,06 64,77 67,30 69,62 70,03
50 32 hog18 Robert 1.75m 22,78 36,67 43,06 56,74 54,94 58,24 59,09 64,83 70,51 69,68 68,47 70,44 72,11 72,31
50 32 hog18 Prewitt 0 36,67 50,83 51,02 58,33 61,17 62,08 62,98 66,53 73,47 72,55 68,47 71,58 73,44 74,96
50 32 hog18 Prewitt 1.75m 37,50 55,28 54,17 61,32 62,61 64,91 66,71 71,40 75,99 75,02 71,61 73,50 74,41 75,63
50 32 hog18 Sobel 0 33,33 48,33 49,26 57,29 61,44 63,80 64,64 68,13 74,35 73,67 69,50 72,67 74,03 75,29
50 32 hog18 Sobel 1.75m 42,22 46,67 47,13 58,47 59,94 63,89 64,76 70,60 75,83 74,46 71,43 73,38 74,64 75,83
50 32 hog36 Robert 0 9,72 32,08 37,87 48,13 45,94 48,29 51,07 57,40 64,14 63,76 62,66 65,15 66,86 67,24
50 32 hog36 Robert 1.75m 26,11 39,31 44,63 52,22 50,17 52,64 53,41 58,60 63,58 64,30 64,26 66,46 67,95 67,75
50 32 hog36 Prewitt 0 33,06 48,75 48,52 55,56 58,28 60,09 60,28 64,03 71,02 71,13 67,02 70,48 72,23 73,54
50 32 hog36 Prewitt 1.75m 35,28 49,86 49,35 57,92 58,67 60,83 63,02 67,67 72,72 72,39 68,88 70,99 71,79 73,58
50 32 hog36 Sobel 0 28,61 45,42 47,96 56,18 59,56 62,08 62,18 65,50 72,26 71,73 67,66 70,73 72,15 73,13
50 32 hog36 Sobel 1.75m 40,56 44,44 45,56 55,90 58,39 62,45 62,74 68,23 73,95 73,45 70,29 72,84 73,89 74,96
Tabla B - 27. Resultados ofrecidos por métodos basados en gradiente para banco B (IV).
Anexo B. Resultados experimentales
90
90
Banco B Número de clases
Escala NG Descr Op Umbral 3 6 9 12 15 18 21 25 31 37 43 49 55 61
25 256 PPC Robert 1.75m 64,44 69,17 72,50 79,65 83,11 86,25 87,58 89,77 91,67 92,91 91,28 92,35 93,17 93,40
25 256 PPC Prewitt 1.75m 67,78 83,06 82,41 86,32 87,39 89,12 90,67 91,90 92,85 93,92 93,90 94,51 95,21 95,07
25 256 PPC Sobel 1.75m 63,33 79,58 83,98 88,47 87,17 88,52 89,72 91,13 92,53 93,67 93,95 94,63 95,42 95,33
25 256 Hist Robert 0 34,72 38,89 39,81 50,69 52,61 57,96 60,32 65,23 69,78 71,31 73,35 76,04 77,00 77,98
25 256 HisPpc Robert 1.75m 35,00 38,47 38,80 50,83 54,78 60,37 63,13 68,40 74,03 77,05 78,51 80,53 81,77 83,51
25 256 Hist Prewitt 0 10,00 35,69 39,35 45,97 47,39 52,87 56,55 61,13 67,74 68,81 67,19 70,75 72,14 73,51
25 256 HisPpc Prewitt 1.75m 8,89 32,08 41,39 48,96 49,11 54,95 60,24 63,80 70,43 71,96 70,62 72,96 74,58 76,68
25 256 Hist Sobel 0 9,72 30,14 36,20 44,17 45,33 51,02 55,16 60,27 66,77 67,25 65,95 69,46 70,94 71,76
25 256 HisPpc Sobel 1.75m 6,67 27,92 38,70 47,64 48,11 54,07 60,00 63,90 70,73 72,43 71,07 73,30 75,02 76,68
25 256 hog9 Robert 0 30,83 47,78 56,48 65,76 68,28 69,17 69,29 71,47 76,77 76,53 75,37 77,19 78,59 79,18
25 256 hog9 Robert 1.75m 38,33 54,72 61,30 70,69 73,89 76,90 76,43 79,73 82,18 80,47 81,71 82,94 83,58 83,59
25 256 hog9 Prewitt 0 43,61 55,28 60,74 67,36 69,17 69,63 70,08 73,23 78,15 76,98 74,28 77,11 78,18 78,52
25 256 hog9 Prewitt 1.75m 36,94 59,44 60,00 67,99 71,61 73,33 74,56 76,73 81,21 79,71 78,04 79,46 80,33 80,57
25 256 hog9 Sobel 0 41,11 56,25 61,94 68,82 70,22 70,88 70,99 73,70 79,11 77,34 73,95 76,89 77,92 78,55
25 256 hog9 Sobel 1.75m 37,78 59,86 60,09 67,71 71,89 73,61 74,25 77,93 82,34 80,11 77,91 79,93 80,71 80,86
25 256 hog18 Robert 0 30,00 45,28 47,31 57,85 59,78 61,30 61,94 65,47 71,16 71,89 71,10 73,84 75,77 76,27
25 256 hog18 Robert 1.75m 35,28 54,17 62,31 69,72 71,94 73,29 73,13 76,43 79,73 78,33 79,15 80,61 81,38 80,89
25 256 hog18 Prewitt 0 42,22 55,83 58,98 65,69 66,56 66,34 66,43 70,00 75,59 74,44 72,00 75,03 76,27 76,57
25 256 hog18 Prewitt 1.75m 34,72 56,25 58,89 67,29 70,06 71,06 72,58 75,33 79,92 78,13 75,97 78,11 78,97 79,32
25 256 hog18 Sobel 0 39,17 56,11 58,80 66,88 68,72 68,43 69,21 71,17 76,64 74,59 71,45 74,66 75,88 76,60
25 256 hog18 Sobel 1.75m 33,33 56,53 59,17 66,04 69,33 70,88 72,14 76,10 80,89 78,76 76,30 78,59 79,39 79,55
25 256 hog36 Robert 0 30,56 42,36 43,61 55,14 56,72 58,66 59,33 62,43 68,41 68,94 68,41 70,95 72,52 73,17
25 256 hog36 Robert 1.75m 40,28 56,11 56,94 65,83 68,94 71,62 71,15 74,23 77,80 77,07 77,48 78,72 79,68 79,92
25 256 hog36 Prewitt 0 41,67 55,00 56,02 62,43 63,61 64,68 65,28 68,20 74,27 73,49 70,43 73,52 74,55 75,20
25 256 hog36 Prewitt 1.75m 36,94 56,25 57,31 66,60 70,00 71,34 72,86 75,37 79,33 77,79 75,27 77,35 77,92 78,39
25 256 hog36 Sobel 0 39,17 55,97 55,46 63,61 65,11 65,65 65,99 69,10 75,13 73,29 70,21 73,59 74,79 75,45
25 256 hog36 Sobel 1.75m 36,11 56,11 57,41 65,97 69,00 70,69 71,43 75,77 80,48 78,33 76,01 78,11 79,08 79,22
Tabla B - 28. Resultados ofrecidos por métodos basados en gradiente para banco B (V).
Banco B Número de clases
Escala NG Descr Op Umbral 3 6 9 12 15 18 21 25 31 37 43 49 55 61
25 32 PPC Robert 1.75m 59,17 62,08 72,78 79,79 83,33 86,9 88,13 90,17 91,61 92,79 92,21 93,45 94,14 94,67
25 32 PPC Prewitt 1.75m 66,11 70,83 75,09 80,35 83,11 86,44 88,81 90,27 91,45 92,82 93,14 94,01 94,76 94,93
25 32 PPC Sobel 1.75m 65,28 70,14 75,56 82,15 84,17 86,94 87,66 90,07 91,45 93,31 93,82 94,56 94,94 95,34
25 32 Hist Robert 0 33,33 40,14 44,81 55,69 56,11 61,85 65,04 70,73 74,22 75,34 76,63 79,52 80,36 81,12
25 32 HisPpc Robert 1.75m 32,22 37,36 43,80 57,01 57,83 62,13 63,25 68,70 74,22 77,14 78,72 80,48 81,70 82,87
25 32 Hist Prewitt 0 12,22 36,11 41,20 48,19 47,44 53,84 58,65 63,17 67,39 68,87 67,54 71,67 73,26 74,07
25 32 HisPpc Prewitt 1.75m 8,89 32,64 44,26 49,93 50,11 56,16 60,40 66,20 71,53 73,42 72,42 74,69 76,05 78,01
25 32 Hist Sobel 0 11,67 29,44 37,59 46,60 46,06 52,87 58,02 63,13 68,01 68,94 67,69 71,80 73,48 73,85
25 32 HisPpc Sobel 1.75m 8,61 28,19 40,37 47,36 48,78 55,46 60,48 66,17 71,29 73,06 72,19 74,61 76,09 77,81
25 32 hog9 Robert 0 27,78 39,58 46,67 57,36 58,39 59,86 61,98 67,27 73,09 74,05 73,55 75,90 77,48 78,02
25 32 hog9 Robert 1.75m 38,06 51,53 60,00 69,44 71,28 74,12 73,97 77,27 81,53 81,60 82,87 84,56 85,17 85,48
25 32 hog9 Prewitt 0 49,44 57,36 57,31 66,32 66,33 66,11 67,62 69,87 75,78 75,72 72,73 75,49 76,55 77,16
25 32 hog9 Prewitt 1.75m 38,06 55,69 59,17 67,99 70,94 72,78 74,72 76,43 81,32 80,63 78,66 80,27 80,97 81,02
25 32 hog9 Sobel 0 44,72 55,97 56,48 65,07 65,78 66,11 67,34 69,83 76,05 75,43 72,05 75,05 76,36 77,04
25 32 hog9 Sobel 1.75m 38,33 54,44 58,61 67,99 69,89 72,41 74,17 76,50 80,83 79,44 77,69 79,61 80,29 80,41
25 32 hog18 Robert 0 25,00 34,17 42,50 54,03 53,56 55,83 55,60 61,27 66,32 67,23 67,33 70,49 72,41 73,01
25 32 hog18 Robert 1.75m 36,39 44,31 51,76 65,00 64,11 66,06 65,67 70,03 76,16 76,58 77,81 80,09 80,79 80,41
25 32 hog18 Prewitt 0 41,67 50,14 50,93 59,58 60,39 59,72 60,83 64,73 71,40 71,82 69,15 72,35 73,45 74,14
25 32 hog18 Prewitt 1.75m 38,33 54,44 56,57 66,04 68,00 69,63 71,43 74,20 79,46 78,60 76,32 78,23 79,17 79,11
25 32 hog18 Sobel 0 27,50 41,53 45,37 55,14 58,83 58,94 59,13 62,27 68,98 68,74 66,12 69,64 71,47 72,39
25 32 hog18 Sobel 1.75m 37,78 53,33 57,41 65,97 68,50 70,14 71,59 73,53 78,49 77,21 74,83 77,01 77,89 77,83
25 32 hog36 Robert 0 28,33 35,69 42,78 54,58 51,94 55,46 55,32 60,03 64,44 65,36 66,05 69,51 71,47 71,73
25 32 hog36 Robert 1.75m 35,56 42,92 50,74 59,93 60,56 63,06 62,58 66,97 71,51 72,39 73,60 76,00 77,00 77,06
25 32 hog36 Prewitt 0 22,22 36,25 42,87 53,40 56,11 56,02 57,02 60,47 66,91 67,48 65,45 69,22 70,42 71,34
25 32 hog36 Prewitt 1.75m 38,33 47,78 52,69 61,74 63,28 64,91 67,50 69,83 75,65 75,97 73,66 75,71 76,58 76,64
25 32 hog36 Sobel 0 20,00 33,75 40,28 50,35 55,11 56,06 57,30 60,53 67,20 66,91 64,86 68,50 70,26 71,15
25 32 hog36 Sobel 1.75m 37,78 47,36 50,65 60,00 63,78 66,44 68,77 71,33 76,80 75,97 73,82 75,92 76,73 76,76
Tabla B - 29. Resultados ofrecidos por métodos basados en gradiente para banco B (VI).
Anexo B. Resultados experimentales
92
92
Banco A Número de clases
Escala NG Descr Op Umbral 3 6 9 12 15 18 21 25
100 256 hogI36 Robert 0 47,78 68,89 69,63 75,63 78,50 80,93 82,58 86,20
100 256 hogI36 Robert 1.75m 44,72 66,25 66,85 73,06 75,94 78,47 80,44 83,13
100 256 hogI36 Prewitt 0 41,39 67,78 68,33 76,67 80,06 83,94 86,47 88,80
100 256 hogI36 Prewitt 1.75m 45,00 70,56 70,28 77,22 80,56 81,34 84,21 87,30
100 256 hogI36 Sobel 0 41,67 67,08 68,52 76,94 80,33 84,26 86,63 89,13
100 256 hogI36 Sobel 1.75m 46,11 70,83 70,37 77,22 80,44 81,57 84,37 87,80
Tabla B - 30. Resultados ofrecidos por HOG36 con interpolación angular para banco A.
Banco B Número de clases
Escala NG Descr Op Umbral 3 6 9 12 15 18 21 25 31 37 43 49 55 61
100 256 hogI36 Robert 0 12,22 35,00 35,93 48,40 47,44 52,45 54,25 58,50 65,89 65,86 64,55 67,23 69,08 69,43
100 256 hogI36 Robert 1.75m 5,83 31,53 30,00 44,24 42,56 46,34 47,86 53,67 60,32 60,25 59,67 61,63 63,65 64,70
100 256 hogI36 Prewitt 0 53,61 60,83 60,56 67,57 69,33 72,59 72,18 76,93 81,53 80,25 77,50 79,40 80,62 81,76
100 256 hogI36 Prewitt 1.75m 51,39 55,14 53,61 57,71 57,94 61,53 60,36 67,57 73,20 70,79 68,80 71,89 73,00 75,07
100 256 hogI36 Sobel 0 51,67 59,86 56,11 64,10 67,61 71,02 70,24 75,47 80,46 79,53 77,03 78,83 79,97 81,01
100 256 hogI36 Sobel 1.75m 49,72 56,11 49,07 55,49 56,61 60,23 59,44 66,40 71,77 69,41 67,50 70,75 72,12 74,21
Tabla B - 31. Resultados ofrecidos por HOG36 con interpolación angular para banco B.
Ta
ANEXO C. MANUAL DE LA GUI
C.i Introducción
La interfaz gráfica de usuario Clasificador de Texturas se ha
desarrollado como un complemento que proporciona resultados
prácticos a la mayor parte de las ideas teóricas expuestas en este
trabajo de fin de grado de una manera cómoda y compacta. Consta,
como se puede observar en la Figura C - 1, donde se muestra una
representación de la pantalla principal de la aplicación, de tres
posibles opciones: en primer lugar se ofrece un conglomerado
general de operaciones básicas de procesamiento de imágenes
tales como la modificación del brillo o del contraste, la detección
de bordes y la adición o el filtrado elemental de ruido; en segundo
lugar, se brinda el cálculo de todos los descriptores comentados en
este proyecto sobre una imagen seleccionada por el usuario, a fin
de comprobar de un vistazo las posibles diferencias o variaciones
entre métodos, así como entre distintas muestras; y, como tercera
y última opción, la funcionalidad principal, un clasificador donde
se permite elegir el número de muestras o de texturas con los que
trabajar, el tipo de descriptor a utilizar, los márgenes de
normalización, la aparición o no de posibles proyecciones, etc., y
que ofrece el PCI como indicador de bondad.
Para el desarrollo de la GUI, al igual que para el resto de las funciones que componen la parte software del
proyecto, se ha utilizado la aplicación MATLAB de MathWorks en su versión R2015a.
C.ii Pantalla de procesamiento básico
En esta pantalla de la GUI, donde se podrá realizar un tratamiento general de las imágenes, se distinguen tres
zonas, tal y como se muestra en la Figura C - 2. Sin embargo, dos de ellas (marcadas en verde y en naranja en
la ilustración) están únicamente destinadas a exhibir la imagen que se quiera analizar y el resultado de las
operaciones realizadas sobre la misma, por lo tanto, la única sección de interés para el usuario es el panel de
control, que contiene los recursos que permiten activar dichas operaciones. No obstante, cabe señalar que la zona
naranja está dividida en seis partes estructuradas en dos filas por tres columnas, de modo que, generalmente, las
imágenes ya tratadas aparecerán en la fila de arriba mientras que, si se muestra algún histograma, se hará en la
de abajo, bajo la imagen a la que haga referencia.
Figura C - 1. Pantalla principal.
Anexo C. Manual de la GUI
94
94
C.ii.i Panel de control
El panel de control incluye líneas discontinuas que
dividen visualmente unas operaciones de otras, tal y
como se puede observar en la Figura C - 3, donde, para
fortalecer este efecto, se han numerado los botones con
distinto color dependiendo de la sección a la que
pertenezcan. Así, las primeras opciones, en rojo, están
orientadas a la modificación de imágenes en masa; en
la segunda sección, numerada en azul, se permite
principalmente cargar una imagen concreta, procesarla
de diversas formas y visualizar el resultado obtenido en
pantalla; y la última, en naranja, contiene una función
aislada que permite generar un modelo RGB
modificable en pantalla. El botón “←” de color
amarillo, sin numerar en la ilustración, no es más que
un botón de retorno que permite volver a la pantalla
inicial de la GUI (Figura C - 1).
A continuación se irán detallando y ejemplificando
todas las opciones. En los sucesivos subapartados se
utilizará la numeración utilizada en la Figura C - 3 para
hacer alusión a las funciones y, por comodidad, se
omitirá la referencia a esta figura de forma reiterada.
C.ii.i.i ① Reducción de resolución
La operación ① permite reducir la resolución de una o varias imágenes seleccionadas. Antes de pulsar el botón,
es necesario introducir el valor de reducción en porcentaje en el cuadro de texto adyacente. Las imágenes
modificadas se almacenarán en una carpeta que, si no existe, se creará en el mismo directorio donde se hayan
seleccionado dichas imágenes, y que se denominará ImgEscaladas_x%, donde en lugar de “x” aparecerá el
porcentaje de reducción.
3. Imágenes tratadas y/o
histogramas.
1. Panel
de
control.
2. Imagen
original a
manipular.
Figura C - 2. Panel de Procesamiento Básico.
Figura C - 3. Panel de Control.
Esta función se ha implementado debido a que en este proyecto la escala de las muestras es un factor que se ha
tenido en cuenta en los experimentos realizados, evaluando el decremento de cómputo y la variación frecuencial
de las características de la imagen frente a la pérdida de información producida por la reducción de píxeles.
C.ii.i.ii ② Modificación del nombre
Al pulsar el botón ② se desplegará el panel que se muestra en la Figura C - 4. En él puede verse un conjunto
de elementos que permitirán modificar el nombre de una2 o varias imágenes, y que puede utilizarse del siguiente
modo:
i. Si se introduce una cadena de caracteres en el cuadro de texto “Nuevo Nombre” pero no se marca
ninguna de las opciones de adición al principio o al final, entonces esa cadena será el nombre principal.
ii. En cambio, si se marca alguna de las dos opciones mencionadas, se mantendrá el nombre original como
principal y la cadena introducida se añadirá al principio y/o al final de éste.
iii. Si se introduce un prefijo o un sufijo (exclusivamente numérico), éstos se añadirán al nombre que haya
resultado de las operaciones anteriores.
iv. Si se activan las casillas de incremento (“++”), entonces el elemento numérico correspondiente
(prefijo, sufijo o ambos) se incrementará en la cantidad introducida en el cuadro de texto “Incremento”
entre una imagen y otra.
v. Mientras sea posible, se mantendrá el número de cifras introducido en el prefijo o en el sufijo, por lo
tanto no es lo mismo poner “1”, “01” o “001”.
vi. Si, tras seleccionar múltiples imágenes, las opciones introducidas por el usuario pudieran ocasionar que
el nombre final no variase para cada imagen, resultando un mismo nombre para todos ellos, no se podrá
continuar con la operación, previa aparición de un mensaje de advertencia.
Algunos ejemplos del resultado proporcionado al marcar distintas opciones en el panel de renombramiento
pueden verse en la Tabla C - 1. Para este TFG se ha decidido reconocer la clase de las diversas muestras
añadiendo un número identificativo al final de su nombre, para lo cual se ha utilizado esta función (algo similar
a la última columna de la tabla de ejemplo).
C.ii.i.iii ③ Cuantizar en masa
La operación ③ permite reducir el número de niveles de intensidad de varias imágenes. Antes de pulsar el botón
es necesario introducir el valor de reducción, comprendido entre 1 y 8 (correspondiéndose ese número a la
potencia a la que hay que elevar dos) en el cuadro adyacente. Las imágenes modificadas se almacenarán en una
carpeta que, si no existe, se creará en el mismo directorio donde se hayan seleccionado dichas imágenes, y que
se denominará ImgCuantizadas_xNG, donde en lugar de “x” aparecerá el número de niveles de gris.
2 Es factible modificar el nombre de una sola imagen pero para ese caso particular sería más rápido y sencillo
utilizar el sistema de archivos del propio sistema operativo. Esta función está pensada para renombrar imágenes
en masa.
Figura C - 4. Panel de opciones para renombrar.
Anexo C. Manual de la GUI
96
96
Esta función se ha implementado debido a que en este proyecto el número de niveles de gris ha sido un factor
que se ha tenido en cuenta en los experimentos realizados, evaluando la calidad de los métodos ante la pérdida
de calidad de las muestras.
C.ii.i.iv ④ Submuestreo
④ despliega el panel de la Figura C - 5, donde se habrá de
introducir tanto el número de submuestras por cada clase que
se quieren conseguir como el tamaño de dichas muestras. Una
vez se inicie la función se deberá escoger una carpeta y
automáticamente se procederá según se vio en el diagrama de
la Figura 2-3. Como consideraciones generales, hay que tener
en cuenta que esta función busca dos elementos específicos de
este proyecto: que el nombre de cada muestra termine con dos
dígitos que indiquen la clase a la que pertenecen, y que la
carpeta seleccionada contenga imágenes jpg (banco A) y png
(banco B), ya que, en caso contrario, se interrumpirá sin ofrecer ningún resultado. Lo mismo ocurrirá si el
tamaño escogido no es consistente.
Las nuevas muestras se almacenarán en una carpeta que, si no existe, se creará en el directorio seleccionado, y
que se denominará ImgSubmuestreadas_x, donde en lugar de “x” aparecerá el número de muestras de cada clase.
Esta función se ha implementado debido a que, en este proyecto, el número inicial de muestras no era
suficientemente grande, tal y como se comentó en el segundo capítulo del TFG.
C.ii.i.v ⑤ Supresión de efectos de iluminación
El botón ⑤ despliega un panel similar al de la Figura C - 5, en el que habrá que seleccionar el tamaño de la
subventana que irá recorriendo cada muestra para, posteriormente, restarle la media de iluminación a cada píxel
de la misma (aunque la forma de la ventana puede variar, tanto en las últimas columnas como en las últimas
filas, para ajustarse al tamaño de la imagen). Las nuevas muestras se almacenarán en una carpeta que, si no
existe, se creará en el directorio seleccionado, y que se denominará ImgPreProc_AxB, donde en lugar de “A” y
“B” aparecerá el tamaño de la subventana elegido.
Esta función se ha implementado para intentar mejorar los resultados obtenidos con los descriptores de Laws.
Imágenes seleccionadas
a.jpg, b.jpg, c.jpg, d.jpg.
Nuevo Nombre Im Im _
Añadir al principio ✘ ✔ ✘
Añadir al final ✘ ✔ ✔
Prefijo 1
Sufijo 01 03 01
++ (Pref) ✘ ✘ ✘
++ (Suf) ✔ ✔ ✘ Incremento 1 5
Resultado
1Im01.jpg, 1Im02.jpg, 1Im03.jpg, 1Im04.jpg.
ImaIm03.jpg, ImbIm08.jpg, ImcIm13.jpg, ImdIm18.jpg.
a_01.jpg, b_01.jpg, c_01.jpg, d_01.jpg.
Tabla C - 1. Ejemplos de renombramiento.
Figura C - 5. Panel de submuestreo.
C.ii.i.vi ⑥ Cargar imagen
Tras pulsar el botón ⑥ se abrirá el sistema de archivos permitiendo elegir una imagen que se utilizará como
muestra modificable sobre la que aplicar las operaciones de la sección azul de la Figura C - 3. La imagen
seleccionada aparecerá siempre como referencia en la zona 2 (verde) de la Figura C - 2, de este modo se podrán
apreciar cómodamente los cambios realizados.
En este TFG se ha trabajado con imágenes de extensión “.png” y “.jpg”. No obstante, también se permiten cargar
los tipos “.tiff” y “.bmp”.
C.ii.i.vii ⑦ Guardar imagen
El botón ⑦ permanecerá inactivo mientras no haya ninguna
imagen que poder salvar. No obstante, si suponemos que ya
hemos cargado una imagen con ⑥, entonces el panel que se
despliega tras presionarlo será como el de la Figura C - 6. Los
nuevos pulsadores que aparecen hacen referencia a la zona
verde y a las distintas partes de la zona naranja de la Figura C -
2, estando disponible sólo aquellas en las que exista algo que
salvar (en este caso concreto únicamente la imagen original
cargada). Antes de presionar sobre estos nuevos botones, será
necesario introducir un nombre para el archivo y seleccionar la
extensión. Las imágenes se almacenarán en la carpeta
ImgGuardadas que se creará en caso de no existir en el directorio actual de trabajo de MATLAB.
Una vez salvada la imagen, si se quiere usar cualquier otra operación oculta bajo el panel, será necesario quitarlo
pulsando ⑧.
C.ii.i.viii ⑧ Limpiar resultados
Si se pulsa el botón ⑧ se eliminarán los parámetros introducidos y los resultados obtenidos, además de cerrarse
los paneles auxiliares que se hayan abierto, retornándose así al panel por defecto con la salvedad de que, si había
una imagen cargada, ésta se mantendrá.
C.ii.i.ix ⑨ Conversión a escala de grises
Si se ha cargado una imagen RGB, ⑨ obtiene la imagen equivalente en escala de grises y calcula el histograma
de la misma. En caso de que la imagen cargada ya esté en escala de grises pero se quiera ver su histograma, un
mensaje de advertencia indicará al usuario que puede hacerlo pulsando sobre ⑫.
C.ii.i.x ⑩ Separación de canales
⑩, si la imagen cargada es RGB, muestra los canales separados en imágenes independientes, así como sus
histogramas correspondientes.
C.ii.i.xi ⑪ LBP
El objetivo de la función ⑪ es calcular la imagen LBP, tanto básica como uniforme, correspondiente a la imagen
cargada, además de sus histogramas. Para ello, si esta última es RGB, es necesario realizar el paso previo de
pasar a escala de grises que, por comodidad, también se mostrará en pantalla. Esta operación puede ser costosa
si las dimensiones de la imagen son considerables.
C.ii.i.xii ⑫ Modificación del brillo
El conjunto ⑫ permite modificar el brillo, no sólo de la imagen cargada, sino también de su transformación a
escala de grises (si es posible), que se muestra junto con su histograma correspondiente. Tras pulsar el botón
podremos cambiar el brillo, bien unidad a unidad, pulsando sobre las flechas a ambos extremos del deslizador,
bien bruscamente, introduciendo el valor en el cuadro de texto y presionando la tecla “Intro” del teclado, o
arrastrando directamente el deslizador.
Figura C - 6. Panel de guardado.
Anexo C. Manual de la GUI
98
98
Se ha saturado la adición o la sustracción de gris al rango [−127, 128], que se ha considerado suficiente para
mostrar adecuadamente las variaciones de brillo.
C.ii.i.xiii ⑬ Modificación del contraste
El grupo ⑬ funciona de un modo similar al ⑫, con la diferencia de que se modifica el contraste en lugar del
brillo. Para ello se ha usado, en cada píxel de la imagen, la curva tonal mencionada en la parte teórica del TFG,
que aparece de nuevo en la siguiente expresión:
𝑛𝐼𝑚 = 255 (1
1 + 𝑒−𝑣𝑎𝑙𝑜𝑟 (𝑖𝑚−127)) , 𝑣𝑎𝑙𝑜𝑟 ∈ [0.007, 0.04]
C.ii.i.xiv ⑭ Cuantización
Para visualizar la disminución de los niveles de gris de la imagen cargada y, si es posible, de su correspondiente
transformación a escala de grises (que se mostrará junto con su histograma), el usuario deberá introducir un valor
comprendido entre uno y ocho en el cuadro de texto del conjunto ⑭ y presionar el botón adyacente.
C.ii.i.xv ⑮ Detección de bordes
Tras pulsar ⑮ se despliega el panel que se muestra en la Figura C - 7, donde se podrá seleccionar uno de los
cuatro operadores correspondientes (acción que rellenará las plantillas Px y Py automáticamente) e incluir un
valor umbral en el cuadro específico. Una vez introducidos todos los parámetros y, tras presionar el botón
“Comenzar”, se mostrará la transformación a escala de grises (si es que ha sido necesario este paso previo),
gradiente y módulo, o laplaciana (dependiendo del operador) y la imagen binaria de contornos obtenida a partir
del umbral.
C.ii.i.xvi ⑯ Añadir Ruido
El conjunto ⑯ permite introducir dos tipos de ruido, de forma independiente, a la imagen cargada: ruido sal y
pimienta, y ruido gaussiano. Antes de pulsar el botón de añadir, será necesario indicar la cantidad a aplicar de
cada uno de ellos, el primero mediante un porcentaje y el segundo mediante un valor de varianza adecuado.
C.ii.i.xvii ⑰ Filtrar Ruido
Al presionar ⑰ se pasará la imagen cargada por una serie de filtros básicos, como son los llamados de la media,
de la mediana, de la moda, del mínimo y del máximo. Esta operación puede resultar costosa si las dimensiones
de la imagen son considerables.
Figura C - 7. Panel auxiliar de detección de bordes.
C.ii.i.xviii ⑱ Test RGB
El botón ⑱ sustituye la imagen cargada por un modelo RGB construido con hexágonos superpuestos, y ofrece
tres deslizadores además de tres cuadros de texto, uno por cada color, que permiten modificar la intensidad
correspondiente, tal y como se muestra en la Figura C - 8.
C.iii Test de descriptores
La finalidad de este panel, como ya se mencionó, es calcular todos los descriptores nombrados en el proyecto
sobre una imagen seleccionada. En la Figura C - 9 puede apreciarse que el funcionamiento es bastante intuitivo:
únicamente hay que cargar una imagen con el botón correspondiente (mostrándose ya directamente su
histograma correspondiente), seleccionar algunos parámetros necesarios (aunque siempre hay alguno por
defecto) mediante los menús desplegables de la izquierda, y pulsar el botón verde para iniciar el cálculo, tras lo
cual aparecerán los resultados y las figuras correspondientes. El botón azul es para resetear el panel, mientras
que el amarillo es para volver a la pantalla principal del programa.
Figura C - 8. Paneles auxiliares para el modelo de color RGB.
Figura C - 9. Panel de testeo de descriptores.
Anexo C. Manual de la GUI
100
100
C.iv Clasificación
Aquí podremos establecer un prototipo para cada clase y tratar de clasificar el resto de las muestras disponibles.
En la Figura C - 10 podemos ver el panel completo, donde se han numerado las distintas secciones.
Como conceptos generales, podemos hablar de los tres botones de mando. Como hasta ahora, el botón amarillo
sirve para volver al panel principal de la GUI. El verde se debe utilizar para iniciar los cálculos una vez que los
argumentos deseados estén seleccionados. Por último, el botón rojo se habilita cuando la ejecución está en
marcha y sirve para cancelarla. El flag de cancelación se evalúa muestra por muestra por lo que, en el peor de
los casos, el tiempo de parada será lo que tarde la caracterización de una muestra, que dependerá a su vez del
método escogido.
Además, existen algunos cuadros de texto (en la gran mayoría de los casos, adyacentes por la derecha a su
elemento correspondiente) cuya función es únicamente informar de cuáles fueron los parámetros utilizados en
ejecuciones anteriores, si es que las hubo. Razón por la cual estos cuadros de texto aparecerán siempre
inhabilitados.
C.iv.i ① Selección de método y directorio
En esta zona podemos seleccionar uno de los cuatro métodos de caracterización estudiados en el panel
desplegable, lo que habilitará o deshabilitará respectivamente los paneles del ③ al ⑧ en función del escogido.
Así mismo, también podremos seleccionar el directorio donde se encuentra el conjunto de muestras con las
características que nos interesen. En este proyecto se ha trabajado con tres escalas distintas (25%, 50% y 100%)
y con dos números distintos de intensidades (32 y 256 niveles de gris), que deben encontrarse en el directorio
correspondiente, en parte creado con las funciones en masa ya mencionadas en la sección anterior. En concreto,
las opciones pasan por las rutas del siguiente esquema:
Donde, las muestras con 256 niveles de gris se encuentran directamente dentro de la carpeta que indica la escala,
mientras que si se quieren las de 32 hay que seguir avanzando.
Figura C - 10. Panel de clasificación.
C.iv.ii ② Panel de progreso
En este subpanel podemos habilitar o deshabilitar las barras de progreso que emergerán en el proceso de cálculo.
Se podrá elegir entre mostrar el progreso clase por clase, muestra por muestra, o, como aparece por defecto,
ambas (si bien tener que sobrescribir continuamente las barras consume cómputo, cuando el número de muestras
y clases es elevado es cómodo conocer el progreso).
C.iv.iii ③ Descriptores estadísticos
Este subpanel se habilitará si el método escogido en ① es el estadístico. En primer lugar deberemos seleccionar
el orden de estadísticos, con lo que se ocultarán o mostrarán los descriptores correspondientes. Se podrán marcar
tantos descriptores como haya, en cualquier combinación, con la salvedad de que los momentos de Hu y el resto
de estadísticos de primer orden se consideran aislados.
C.iv.iv ④ Descriptores de Laws
Esta sección aparece si el método escogido en ① es Laws. Lo único que se podrá elegir es si se quieren usar las
plantillas de dimensión 3x3 o las de 5x5 mediante el panel desplegable. Si bien es posible realizar las
combinaciones de los vectores propuestos por Laws para ver las plantillas resultantes, a la hora de iniciar el
cálculo se utilizarán todas ellas, por lo tanto esa funcionalidad es únicamente de carácter informativo.
C.iv.v ⑤ Proyecciones
En caso de que el método escogido sea cualquiera de los dos anteriores, que esté marcada la opción de crear los
prototipos en ⑨ (y que, en el caso de los estadísticos, haya al menos dos descriptores seleccionados) se habilitará
la opción de mostrar las proyecciones. Además, si la marcamos, podremos también elegir si queremos salvar o
no las figuras en el espacio de trabajo. Hay que tener en cuenta que el nombre con el que se guardan las figuras
será figure1, figure2, etc., y que, en ejecuciones consecutivas, éstas se sobrescribirán.
Esta funcionalidad se ha omitido para los otros dos métodos, gradiente y LBP, debido a que trabajan con
histogramas y por tanto el número de proyecciones (comparar cada elemento con todos los demás) sería enorme.
Un par de peculiaridades a tener en cuenta son las siguientes: cuando se escogen tres clases, o menos, los colores
asignados serán, sucesivamente, azul, rojo y negro ya que proporcionan un buen contraste. En cambio, si el
número de clases es mayor, entonces el color de todas ellas se escogerá aleatoriamente, ya que sería un engorro
seleccionar colores adecuados uno a uno. Por otro lado, si el número de clases es cinco o menos, y el número de
muestras menor a cuarenta, entonces el símbolo utilizado en el gráfico para la representación será “x” mientras
que en caso contrario será “·”, ya que de este modo se facilita la visualización cuando comienza a haber un
elevado número de elementos sobre la gráfica. En cualquier caso, “□” representa a los prototipos. Unos ejemplos
de proyecciones pueden verse en la Figura C - 11.
Figura C - 11. Diferencias entre estilos de proyección, tres clases vs seis clases.
Anexo C. Manual de la GUI
102
102
C.iv.vi ⑥ Saturaciones
De nuevo, en el caso de que el método escogido sea el estadístico o el de Laws, podremos activar las funciones
de saturación. Si lo hacemos, aquellas muestras que presenten saturación se irán apilando en la caja de mensajes
correspondiente, pudiendo navegar por ella mediante las flechas del extremo derecho. Además, una vez termine
la ejecución, si se pulsa el botón Mostrar, aparecerán todos los mensajes expuestos en ventanas emergentes que
permiten una mejor visualización.
Por comodidad y, principalmente, por falta de espacio, el descriptor que provoque la saturación aparecerá
únicamente con la letra “c” (de característica) seguido de un número que indique la posición del vector de
características en la que se encuentra. Por ello, para poder entender los mensajes adecuadamente, es importante
conocer el orden en el que se calculan los descriptores.
C.iv.vii ⑦ Descriptores basados en gradiente
Este subpanel aparece si el método escogido en ① es Gradiente. Se podrán seleccionar tanto los descriptores
como los argumentos necesarios relacionados con los mismos, al igual que ocurría con ③.
C.iv.viii ⑧ LBP
Si se escoge el método LBP, podremos en esta sección elegir entre LBP básico o LBP uniforme.
C.iv.ix ⑨ Prototipos
Si se activa la opción de crear los prototipos, se habilitarán los argumentos necesarios para que así sea. Esto es,
el número de clases, el de muestras, el banco donde éstas se encuentran y, si es necesario, el margen de
normalización (de nuevo para los métodos estadístico y de Laws, los otros dos ya trabajan con histogramas
normalizados). Una de las limitaciones de este proyecto es que no permite seleccionar las clases de manera
independiente, es decir, que si se introduce un cuatro serán las cuatro primeras, no cuatro de libre elección. Lo
mismo ocurre con las muestras. Recordemos también que en este TFG las texturas se han diferenciado además
por extensión y que, por tanto, la “xxx_01.jpg” no es la misma que la “xxx_01.png”.
Por otro lado, si no cambia ningún parámetro, no es necesario volver a calcular de nuevo la estructura de
prototipos, acción que puede conllevar un considerable gasto computacional. Cuando la estructura se crea, se
almacena en el espacio de trabajo principal de MATLAB, de modo que se recoge de ahí si queremos realizar
más análisis con ella.
Además, si se quiere hacer otro tipo de pruebas pero únicamente se modifica el número de clases, entonces, de
nuevo, se puede aprovechar la estructura anterior, ya que los prototipos de las clases anteriores serán idénticos,
calculándose únicamente los de las clases nuevas.
C.iv.x ⑩ Clasificación
Si se activa la opción de seguir analizando muestras para su reconocimiento, se podrá elegir entre una muestra
a escoger por el usuario o todas las que queden en el directorio correspondiente. Además, para aquellos casos
en los que sea posible la saturación, deberemos establecer el margen en porcentaje.
Si se escoge analizar una única muestra, y además existen proyecciones abiertas (por haber creado los prototipos
anteriormente), se añadirá esta nueva muestra bajo estudio representada con el símbolo ◊ en color verde (tal y
como se ve en la Figura C - 12), además de una línea discontinua que la unirá con el prototipo más cercano (que
puede ser o no correcto).
C.iv.xi ⑪ Resultados
En este subpanel se muestran los resultados obtenidos en el caso de que se haya realizado algún tipo de análisis.
Si se ha clasificado una única muestra, aparecerá en la parte de arriba la clase asignada y si el resultado ha sido
correcto o no. En caso de haber analizado todas las restantes, aparecerá en la parte de abajo el PCI
correspondiente en porcentaje.
Figura C - 12. Adición de muestra analizada a la proyección.