7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
1/158
LOCALIZACIN Y RECONOCIMIENTO DE ROSTROS EN
IMGENES MONOCULARES DE FRENTE CON VARIACIN EN
ESCALA
Jorge Servn Prez
2009
1
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
2/158
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
3/158
Dedicatoria
A las familias: Servn, Prez y Servn Prez. Con mucho cario.
3
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
4/158
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
5/158
Agradecimientos
Quiero expresar mi ms profundo agradecimiento a todas las personas de la Universidad Autno-
ma Metropolitana, Unidad Cuajimalpa, que tuvieron a bien participar en este proyecto proporcio-
nando los datos, fotografas y dems facilidades requeridas para el mismo.
Quiero agradecer a la Universidad Autnoma Metropolitana, Unidad Azcapotzalco, por la opor-tunidad que me brind de estudiar el posgrado en sus aulas. As tambin, agradezco el apoyo y
enseanza por parte de los profesores del posgrado.
Agradecimiento especial al Consejo Nacional de Ciencia y Tecnologa por los apoyos econmicos
prestados en los dos ltimos trimestres.
5
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
6/158
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
7/158
Resumen
En este trabajo se presenta una nueva tcnica de localizacin y reconocimiento de rostros en
imgenes monoculares de frente con variacin en escala. Se describe la construccin del sistema de
adquisicin de imgenes para generar una base de datos de fotografas que permitan ser
comparadas contra imgenes con cambio de escala. Adems, se presenta como crear la base dedatos de imgenes de prueba, as como los resultados en la localizacin de ojos, la extraccin de la
regin elptica de la cara, la normalizacin, el suavizado con variacin total y la aplicacin de la
tcnica de anlisis de componentes principales para la generacin del espacio de eigenfaces y
obtencin del rostro promedio. Finalmente, se presentan resultados comparables en eficiencia de
reconocimiento de rostros de tcnicas similares.
7
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
8/158
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
9/158
Abstract
In this work we present a novel technique for face detection and recognition of front monocular
images with scale variation. A data acquisition set was carefully assembled in order to complete a
standardized face photograph database, for implementing the matching procedure with different
scales photographs. Furthermore, we present how to create database test images, eyes localizationresults, elliptic face feature extraction, normalization, total variation deblurring, and principal
components analysis applications for building the eigenface space, and mean face. Finally, we
present results at the same level of efficiency of similar techniques for face recognition.
9
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
10/158
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
11/158
ndice General
ndice General 11
Lista de Figuras 15
Lista de Tablas 18
1 INTRODUCCIN 19
1.1. Estado del Arte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.1.1. El rostro visual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.1.2. Los cambios en el rostro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.1.3. Automatizacin del reconocimiento facial . . . . . . . . . . . . . . . . . . . . 20
1.2. Descripcin de Captulos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2 PROBLEMA DE INVESTIGACIN 27
2.1. Planteamiento del Problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.2. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.2.1. Objetivo general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.2.2. Objetivos particulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.3. Justificacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.4. Metodologa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3 ANTECEDENTES TERICOS 31
3.1. Conceptos Fundamentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.1.1. Procesamiento digital de imgenes . . . . . . . . . . . . . . . . . . . . . . . . 31
3.1.2. Reconocimiento de patrones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.1.2.1. Segmentacin de un objeto basado en el umbralizado . . . . . . . . 36
11
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
12/158
ndice General
3.1.2.2. Etiquetado de regiones o componentes conectadas . . . . . . . . . . 39
3.2. Anlisis de Componentes Principales . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.2.1. Conjunto de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.2.2. Vector promedio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.2.3. Matriz de covarianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.2.4. Componentes principales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.3. La TcnicaEigenface. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.3.1. Resolucin de las imgenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.3.2. Clculo de eigenfaces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.3.3. Cmo utilizar los eigenfaces para reconocimiento de rostros . . . . . . . . . . 45
3.4. Normalizacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.5. Variacin Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.5.1. Conceptos preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.5.2. Restauracin de la imagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.5.3. Discretizacin de la variacin total de una imagen . . . . . . . . . . . . . . . 49
3.6. Procesamiento Multiresolucin (Pirmide de Imgenes) . . . . . . . . . . . . . . . . 52
4 PROTOCOLO DE ADQUISICIN DE IMGENES 55
4.1. Proceso de adquisicin de imgenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.2. Resultados del proceso de adquisicin . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.3. Observaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
5 LOCALIZACIN Y RECONOCIMIENTO DE ROSTROS 63
5.1. Imgenes de Entrada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
5.2. Localizacin Facial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5.3. Extraccin de Caractersticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5.4. Reconocimiento de Rostros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.4.1. Imagen de prueba . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.4.2. Normalizacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.4.3. Bases de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
5.4.4. Selector de escala . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
5.4.5. Rostro promedio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
5.4.6. Proyeccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
12
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
13/158
ndice General
5.4.7. Prueba de similitud . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.4.8. Sistema de Rechazo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.5. Identificacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
6 PRUEBAS Y RESULTADOS 73
6.1. Inicializacin de la Base de Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
6.1.1. Localizacin y extraccin de caratersticas . . . . . . . . . . . . . . . . . . . . 73
6.1.2. Normalizacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
6.1.3. Clculo de rostro promedio y eigenfaces . . . . . . . . . . . . . . . . . . . . . 74
6.1.4. Generacin de la pirmide de imgenes . . . . . . . . . . . . . . . . . . . . . 81
6.2. Pruebas de Reconocimiento de Rostros . . . . . . . . . . . . . . . . . . . . . . . . . . 82
6.2.1. Pruebas de reconocimiento de la base de datos . . . . . . . . . . . . . . . . . 87
6.2.2. Pruebas de reconocimiento de imgenes con variacin en escala . . . . . . . . 87
7 CONCLUSIONES Y PERSPECTIVAS 97
7.1. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
7.2. Perspectivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
Bibliografa 99
A Aplicaciones 105
B Hoja de registro 107
C Artculos de Investigacin 109
C.1. Modelo experimental que verifica la ley de cada libre usando una cmara de video . 110
C.2. Imagen promedio de un conjunto de rostros de las carreras de Ingeniera en Com-
putacin y Matemticas Aplicadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
D Cdigos de programas en MATLAB 127
D.1. Variacin total (programa) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
D.2. Extraccin de la regin elptica del rostro (programa) . . . . . . . . . . . . . . . . . 131
D.3. Normalizacin de las regiones elpticas en resolucin y suavizado con TV (programa) 140
D.4. Clculo de eigenfaces (programa) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
D.5. Generacin de la pirmide de imgenes (programa) . . . . . . . . . . . . . . . . . . . 148
13
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
14/158
ndice General
D.6. Verificar imgenes que conforman las bases de datos (programa) . . . . . . . . . . . 150
D.7. Reconcimiento de rostros, prueba de verificacin de cambios de escala . . . . . . . . 155
14
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
15/158
Lista de Figuras
1.1. Problemas de investigacin en la automatizacin del reconocimiento facial. . . . . . . . . 21
1.2. Configuracin de un sistema genrico de reconocimiento facial. . . . . . . . . . . . . . . 22
1.3. Fotografa. a) Rostro original; b) Mapa de piel; c) Mapa de ojos. . . . . . . . . . . . . . 24
1.4. Regin de la elipse. a) Figura geomtrica; b) Regin elptica en el rostro. . . . . . . . . . 24
1.5. Sistema de reconocimiento facial basado en eigenspace estndar. . . . . . . . . . . . . . 25
2.1. Fotografas superpuestas. Rostros con variacin en escala (ancho, alto y profundidad). . 28
2.2. Etapas que componen la metodologa de este proyecto. . . . . . . . . . . . . . . . . . . . 29
3.1. Vecindades. a)N4(p)y b)N8(p), del pxel p con coordenadas (m,n). . . . . . . . . . . . 32
3.2. En mtrica 4, el puntop es adyacente al punto qy no al puntor. . . . . . . . . . . . . . 32
3.3. Camino de longitd 4 en mtrica 8. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333.4. Bajo la mtrica 8, la regin se encuentra completamente conectada. Bajo mtrica 4, la
regin debe ser vista como tres regiones 4-conectadas con 8, 4 y 2 elementos respectivamente. 33
3.5. Regiones conectadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.6. Una imagen y su histograma. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.7. Cubo de 24 bits RGB. a) Esquema, normalizado a valores entre [0,1]; b) Cubo de colores. 36
3.8. Imagen en color (superior) convertida a escala de grises (media) y binarizada (inferior)
con umbralizado por el mtodo de Otsu. . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.9. (a) Imagen binaria; (c-d) Secuencia de etiquetados. . . . . . . . . . . . . . . . . . . . . . 40
3.10. Vector xformado con pxeles den imgenes. . . . . . . . . . . . . . . . . . . . . . . . . 41
3.11. Resultado de la regularizacin por TV para una funcin con ruido (imagen superior) y
para una imagen con un mandril (imagen inferior). Las imgenes de la izquierda son las
originales, las siguientes muestran los resultados de la regularizacin para los valores de
=0.0001, 0.001, 0.01, 0.1 y 1.0. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
15
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
16/158
Lista de Figuras
3.12. Estructura de imagen piramidal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.13. Filtro Gaussiano pasa bajas en el dominio del espacio. . . . . . . . . . . . . . . . . . . . 53
4.1. Set fotogrfico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.2. Diagrama esquemtico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.3. Registro de datos por persona. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.4. Imgenes faciales en color, adquiridas en el set fotogrfico e integrarn la base de datos
del sistema de reconocimiento facial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.5. Imgenes con cambio de escala y las fotos correspondientes al rostro. . . . . . . . . . . . 60
4.6. Ejemplos de imgenes de prueba. Observese el cambio de escala en el rostro de cada imagen. 60
4.7. Nuevo conjunto de imgenes para integrar la base de datos. . . . . . . . . . . . . . . . . 61
5.1. Diagrama a bloques del sistema de reconocimiento automtico de rostros con variacin
en escala. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
5.2. Ejemplos de imgenes de entrada. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
5.3. Fases en la extraccin de caractersticas. . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5.4. Componentes 8-conectadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
5.5. Ejemplo de normalizacin y suavizado. a) Resolucin 274x198 pxeles; b) Resolucin
241x175 pxeles; c) Suavizado con variacin total. . . . . . . . . . . . . . . . . . . . . . . 68
5.6. Niveles 1-7. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
5.7. Rostros femeninos normalizados en tamao, iluminacin y con suavizado. . . . . . . . . 70
5.8. Imagen promedio, rostros femeninos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.9. Conjunto de eigenfaces para rostros femeninos. . . . . . . . . . . . . . . . . . . . . . . . 71
5.10. Ejemplo de identificacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
6.1. Imgenes faciales que integrarn la base de datos del sistema de reconocimiento de rostros. 75
6.2. Extraccin de la regin de la elipse (imgenes en color) en el rostro. . . . . . . . . . . . 76
6.3. Conjunto de imagenes normalizados en tamao y suavizado con TV. . . . . . . . . . . . 78
6.4. Rostros masculinos normalizados en tamao, iluminacin y suavizados con TV. . . . . . 79
6.5. Imagen promedio, rosotros masculinos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
6.6. Conjunto de Eigenfaces para rostros masculinos. . . . . . . . . . . . . . . . . . . . . . . 80
6.7. Rostros femeninos normalizados en tamao, iluminacin y suavizados con TV. . . . . . 80
6.8. Imagen promedio, rostros femeninos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
16
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
17/158
6.9. Conjunto de eigenfaces para rostros femeninos. . . . . . . . . . . . . . . . . . . . . . . . 81
6.10. Imagen promedio, para rostros mixtos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
6.11. Conjunto de eigenfaces, para rostros mixtos. . . . . . . . . . . . . . . . . . . . . . . . . . 82
6.12. Nivel 7. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
6.13. Nivel 6. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
6.14. Nivel 5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
6.15. Nivel 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
6.16. Nivel 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
6.17. Nivel 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
6.18. Nivel 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
6.19. Niveles 1-7. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
6.20. Ejemplos de reconocimiento. a) Nivel 8; b) Nivel 7; c) Nivel 6; d) Nivel 5; y e) Nivel 4. . 88
6.21. Ejemplos de imgenes de prueba. Observese el cambio de escala en el rostro de cada imagen. 89
6.22. Imgenes con cambio de escala y las fotos correspondientes al rostro. . . . . . . . . . . . 89
6.23. Elipses reducidas a la resolucin de 92 112. . . . . . . . . . . . . . . . . . . . . . . . . 90
6.24. Imgenes de prueba con variacin en escala reducidas a, elipses con resolucin de 92112,
con variacin en escala. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 906.25. Resultado de la prueba, identificacin de las cinco imgenes de prueba con variacin en
escala en la resolucin ms baja, cinco aciertos. . . . . . . . . . . . . . . . . . . . . . . . 92
6.26. Nuevo conjunto de imgenes para integrar la base de datos. . . . . . . . . . . . . . . . . 93
6.27. Extraccin de la regin de la elipse (imgenes en color) del nuevo conjunto de rostros. . 94
6.28. Conversin a niveles de grises de la regin de la elipse del nuevo conjunto de rostros. . . 95
6.29. Imgenes normalizadas en resolucin y suavizado con TV del nuevo conjunto de rostros. 95
B.1. Hoja de registro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
C.1. Articulo presentado en la primera Semana de la Computacin y Matemticas Aplicadas
2008, UAM Cuajimalpa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
C.2. Articulo presentado en la primera Semana de la Computacin y Matemticas Aplicadas
2008, UAM Cuajimalpa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
17
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
18/158
Lista de Tablas
Lista de Tablas
1.1. Tcnicas de reconocimiento facial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.2. Bases de datos pblicas de imgenes faciales. . . . . . . . . . . . . . . . . . . . . . . . . 24
4.1. Lista de materiales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.2. Adquisicin de imgenes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
6.1. Parmetros del conjunto de elipses. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
6.2. Niveles en la pirmide de imgenes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
6.3. Resultados de Reconocimiento para 49 imgenes. . . . . . . . . . . . . . . . . . . . . . . 87
6.4. Parmetros del nuevo conjunto de elipses. . . . . . . . . . . . . . . . . . . . . . . . . . . 91
18
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
19/158
Captulo 1
INTRODUCCIN
En esta seccin se presenta una aproximacin al estado actual de la investigacin en reconocimien-to de rostros y se mencionan algunos estudios que formarn parte del desarrollo de este proyecto,
localizacin de ojos y extraccin elptica de la cara, as como reconocimiento de rostros basado en
eigensapace, entre otros.
1.1. Estado del Arte
El problema de reconocimiento de rostros [1], no es un mero problema de reconocimiento de
formas o patrones o imgenes estticas, considera tareas computacionales aun ms generales relativas
a la percepcin de objetos tridimensionales proyectados en un plano fotogrfico en escenas dinmicas
y con variabilidad en la iluminacin, escala, ruido, defectos naturales de las personas, envejecimiento,
maquillaje, lentes y peinado.
1.1.1. El rostro visual
El rostro juega un papel vital en nuestra vida diaria por su amplia variedad de funciones. Al
visualizar la expresin facial podemos determinar, en alguna medida, elementos tales como: el modo
de juzgar, el carcter o las intenciones. Otras seales faciales, ms explicitas, nos permiten estimar
factores como: la edad, gnero, origen tnico y la identidad. Esta ltima, como seal visual para
reconocimiento, es una de las tareas principales de investigacin en el rea de reconocimiento de
rostros o reconocimiento facial.
19
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
20/158
1. INTRODUCCIN
1.1.2. Los cambios en el rostro
El proceso de identificacin de una persona a partir de su apariencia facial tiene que ser realizada
en la presencia de una serie de factores que entran en conflicto, alteran la apariencia y hacen la
tarea aun ms difcil. El rostro puede cambiar su apariencia debido a factores ya sea intrnsecos o
extrnsecos. Las variaciones intrnsecas toman lugar independientemente de cualquier observador y
es debida a la naturaleza fsica del rostro. Por otro lado, las variaciones extrnsecas aparecen cuando
el rostro es observado va la interaccin: luz, rostro y observador
Generalmente la apariencia de un rostro se altera considerablemente dependiendo de las condi-
ciones de iluminacin y, en particular, de la proyeccin de la sombra propia. Las caractersticas de la
cmara (o lente) usadas para observar el rostro tambin afectan la calidad de la imagen. Otros ob-
jetos en la escena pueden causar oclusin, y sombras, as como alteraciones en la luz incidente. Unade las fuentes de variacin ms significativas es el cambio en la posicin. Es de notar que, la posicin
de un rostro est determinada por la orientacin y posicin tridimensional (3D) del observador. La
causa principal del cambio en la posicin es relativa al movimiento rgido entre el observador y el
sujeto. Un rostro sufre movimiento rgido cuando este cambia su posicin y orientacin en el espa-
cio tridimensional relativo al observador. Un rostro tambin puede sufrir un movimiento no rgido
cuando su forma tridimensional cambia debido, por ejemplo, al hablar o por su expresin facial.
Esto resulta en una variacin intrnseca de la apariencia. Aunque estos tipos de movimiento ocurren
juntos, en general se conviene en tratarlos de forma separada. En este trabajo se considera el rostro
en forma rgida con una expresin neutra.
1.1.3. Automatizacin del reconocimiento facial
En la automatizacin del reconocimiento facial, el esfuerzo ha sido multidisciplinario y en esta
tarea han participado reas tan variadas como las ciencias de la computacin, la ciencia cogniti-
va, la matemtica, la fsica, la psicologa y la neurobiologa. Dentro de las aplicaciones deseables del
reconocimiento de rostros basado en computadora, se incluyen interfaces hombre-mquina, multime-
dia, vigilancia, seguridad, teleconferencia, comunicacin, animacin, etc. Por consiguiente, durante
los aos recientes se han hecho grandes esfuerzos de investigacin en el estudio y desarrollo de
modelos computacionales, algoritmos y sistemas de visin por computadora para el reconocimiento
automtico de rostros.
Grosset al. [2], menciona que han emergido sistemas capaces de alcanzar razones de reconocimien-
20
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
21/158
1.1. Estado del Arte
Figura 1.1: Problemas de investigacin en la automatizacin del reconocimiento facial.
to que exceden el 90 % de precisin bajo condiciones controladas. Por otro lado, la variacin en la
escala de factores tales como la iluminacin, la oclusin y la expresin facial entre otras an no es
muy bien entendida.
Yanget al. [3], confirma que la deteccin de rostros desde una imagen es un reto dada la varia-
bilidad en la escala, ubicacin, orientacin, y posicin (Fig. 1). Por otro lado, factores como: cambios
en la expresin facial, oclusin, y diferentes condiciones de iluminacin, cambian la apariencia de los
rostros.
En la Fig. 1.1 se ilustran los problemas relacionados que componen un sistema general de re-
conocimiento facial, estos se detallan a continuacin.
Localizacin facial (face localization). Su objetivo es determinar la posicin de un nico rostro;
este es un problema de deteccin que se simplifica asumiendo que una imagen de entrada slo
tiene un rostro [4, 5].
Deteccin de caractersticas faciales (facial feature detection). La meta es detectar la presencia
y localizacin de caractersticas tales como: ojos, nariz, boca, etc., asumiendo que una imagen
de entrada slo tiene un rostro [6].
21
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
22/158
1. INTRODUCCIN
Figura 1.2: Configuracin de un sistema genrico de reconocimiento facial.
Reconocimiento de rostros (face recognition). Compara una imagen de entrada (de prueba)
contra una base de datos (galera) y reporta una identificacin (comparacin acertada) si hay
alguna [7, 8, 9]. Con respecto al reconocimiento con variacin en escala Turk y Pentlad [7]
presentan resultados del orden del 60 % de aciertos.
Autentificacin facial (face authentication). El propsito es verificar el reclamo de un individuo
en una imagen de entrada.
Rastreo facial (face tracking). Mtodos que estiman de manera contina la ubicacin y posible
orientacin de un rostro en una secuencia de imgenes en tiempo real.
Reconocimiento de expresiones faciales (facial expresin recognition). Tiene que ver con la
identificacin de estados afectivos (alegra, tristeza, disgusto, etc.) en rostros humanos.
Zhao et al. [10], mencionan que un sistema automtico de reconocimiento facial genrico tiene que
considerar las siguientes etapas (Fig. 1.2): a) Imagen de entrada; b) Deteccin y extraccin de
caractersticas faciales; c) Reconocimiento facial e identificacin.
As tambin, indican que los avances en tcnicas de reconocimiento facial (Tabla 1.1), se pueden
clasificar en tres grupos amplios: en mtodos holsticos (holistic methods), en mtodos basados en
caractersticas (feature-based methods) y en mtodos hbridos (hibrid methods). En el primer caso,
las imgenes faciales son representadas como un arreglo bidimensional de pxeles y son comparados
contra una o varias plantillas que representan el rostro completo. Este trabajo de tesis emplea la
tcnica eigenface, ya que aqu se aplican algunos de los modelos matemticos ms utilizados en
22
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
23/158
1.1. Estado del Arte
Tabla 1.1: Tcnicas de reconocimiento facial
MtodosMtodos HolsticosHolsticos
Anlisis de componentes principalesAnlisis de componentes principales (PCA)(PCA)
EigenfacesEigenfacesEigenfacesEigenfaces probabilisticosprobabilisticos
FisherfacesFisherfaces//subespaciosubespacio LDALDA
SVMSVM
EvolucinEvolucin
Lneas caractersticasLneas caractersticas
ICAICA
Otras representacionesOtras representaciones
LDA/FLDLDA/FLD
PDBNNPDBNN
Mtodos basados en caractersticasMtodos basados en caractersticas
MtodosMtodos geometricosgeometricos
Arquitectura de enlace dinmicoArquitectura de enlace dinmico
Modelos deModelos de MarkovMarkovConvolucin de red neuronalConvolucin de red neuronal
Mtodos hbridosMtodos hbridos
EigenfacesEigenfaces modularesmodulares
LFA hbridosLFA hbridos
Forma normalizadaForma normalizada
Basados en componentesBasados en componentes
AproximacinAproximacin
MtodosMtodos HolsticosHolsticos
Anlisis de componentes principalesAnlisis de componentes principales (PCA)(PCA)
EigenfacesEigenfacesEigenfacesEigenfaces probabilisticosprobabilisticos
FisherfacesFisherfaces//subespaciosubespacio LDALDA
SVMSVM
EvolucinEvolucin
Lneas caractersticasLneas caractersticas
ICAICA
Otras representacionesOtras representaciones
LDA/FLDLDA/FLD
PDBNNPDBNN
Mtodos basados en caractersticasMtodos basados en caractersticas
MtodosMtodos geometricosgeometricos
Arquitectura de enlace dinmicoArquitectura de enlace dinmico
Modelos deModelos de MarkovMarkovConvolucin de red neuronalConvolucin de red neuronal
Mtodos hbridosMtodos hbridos
EigenfacesEigenfaces modularesmodulares
LFA hbridosLFA hbridos
Forma normalizadaForma normalizada
Basados en componentesBasados en componentes
AproximacinAproximacin
reconocimiento de rostros, en particular el mtodo de anlisis de componentes principales (PCA,
Principal Component Analysis) que se emplea para reducir la dimensionalidad alcanzando buenosrendimientos en tiempo y complejidad computacional, este mtodo se describe ms adelante, en
la seccin 3.2. En el segundo caso, se toman como base algunas caractersticas geomtricas del
rostro como la distancia entre diferentes puntos faciales, para su comparacin. El tercer caso es una
combinacin de los dos anteriores.
Hajati et al. [11], introducen un mtodo para localizacin facial y reconocimiento en imgenes
de color. El mtodo propuesto emplea la localizacin de o jos por cmputo y extraccin de la regin
elptica de la cara (Figs. 1.3 y 1.4).
Ruiz-del-Solar [12], presenta un estudio de reconocimiento de rostros basado en eigenspace, que
corresponde a una de las metodologas ms utilizadas para el reconocimiento de rostros en im-
genes digitales. Mencionan que se han propuesto diferentes aproximaciones basadas en eigenspace:
estndar, differentialo kernel eigenspace. El estudio considera aspectos tericos as como simula-
ciones empleando bases de datos pblicas Yale Face Database y FERET (Tabla 1.2). La Fig. 1.5
muestra un ejemplo, diagrama a bloques, de un sistema de reconocimiento basado en eigenspace.
23
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
24/158
1. INTRODUCCIN
(a) (b) (c)
Figura 1.3: Fotografa. a) Rostro original; b) Mapa de piel; c) Mapa de ojos.
(a) (b)
Figura 1.4: Regin de la elipse. a) Figura geomtrica; b) Regin elptica en el rostro.
Tabla 1.2: Bases de datos pblicas de imgenes faciales.
MITMIT ftp://whitechapel.media.mit.edu/pub/images/ftp://whitechapel.media.mit.edu/pub/images/
FERETFERET httphttp://://www.nist.govwww.nist.gov//humanidhumanid//feretferet
YaleYale httphttp://://cvc.yale.educvc.yale.edu
AT&TAT&T http://www.uk.research.att.comhttp://www.uk.research.att.com
HarvardHarvard ftpftp://://ftp.hrl.harvard.eduftp.hrl.harvard.edu//pubpub//facesfaces//
Bases de datos pblicasBases de datos pblicas
MITMIT ftp://whitechapel.media.mit.edu/pub/images/ftp://whitechapel.media.mit.edu/pub/images/
FERETFERET httphttp://://www.nist.govwww.nist.gov//humanidhumanid//feretferet
YaleYale httphttp://://cvc.yale.educvc.yale.edu
AT&TAT&T http://www.uk.research.att.comhttp://www.uk.research.att.com
HarvardHarvard ftpftp://://ftp.hrl.harvard.eduftp.hrl.harvard.edu//pubpub//facesfaces//
Bases de datos pblicasBases de datos pblicas
24
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
25/158
1.2. Descripcin de Captulos
Figura 1.5: Sistema de reconocimiento facial basado en eigenspace estndar.
1.2. Descripcin de Captulos
En el estado del arte, no se ve claro que el reconocimiento de rostros con variacin en la escala de
las imgenes sea un problema resuelto. Si el ser humano es capaz de hacer este reconocimiento, es de
esperar que un sistema automtico artificial lo pueda hacer. Cules son los factores que dificultan
este reconocimiento? Cmo se puede aproximar una mejor solucin a este problema? Para dar
respuesta a esta y otras interrogantes se presentan en este proyecto las tcnicas que permiten hacer
el estudio de este problema. A continuacin se describen los captulos siguientes que conforman este
trabajo de investigacin.En el captulo 2, Problema de Investigacin, se describen el problema de investigacin, objetivos,
justificacin y metodologa.
En el captulo 3, Antecedentes Tericos, se presentan los Conceptos Fundamentales relativos a
Procesamiento Digital de Imgenes y Reconocimiento de Patrones. Tambin se presentan las tcnicas
propuestas para el desarrollo de este proyecto de tesis. Anlisis de Componentes Principales, se utiliza
para reducir la dimensionalidad de los datos (imgenes en este proyecto). La Tcnica Eigenface, hace
posible el reconocimiento de rostros. La Normalizacin, mejora la probabilidad de la identificacin
y consiste en ajustar las imgenes en resolucin, suavizado e iluminacin. Variacin Total, se utiliza
para suavizar las imgenes, se incluye, adems, una seccin que muestra cmo discretizar la variacin
total de una imagen. Procesamiento Multiresolucin, con esta tcnica se puede cambiar la escala de
las imgenes.
En el captulo 4, Protocolo de Adquisicin de Imgenes, se presentan la construccin del set
fotogrfico y la adquisicin de imgenes, para la creacin de la base de datos, as como de prueba.
25
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
26/158
1. INTRODUCCIN
En el captulo 5, Sistema de Reconocimiento Automtico de Rostros, se estudia como se hace: la
localizacin facial, la extraccin de caractersticas, la normalizacin, la obtencin del rostro promedio
y eigenfaces, la generacin de la pirmide de imgenes, y el reconocimiento, que forman parte del
sistema de reconocimiento automtico de rostros.
En el captulo 6, Pruebas y Resultados, se muestran las pruebas de localizacin y reconocimiento
de rostros as como los resultados de las mismas.
Finalmente, en el captulo 7, Conclusiones, se presentan las observaciones finales que resultarn
en este proyecto, as como, las recomendaciones de trabajo futuro.
26
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
27/158
Captulo 2
PROBLEMA DE INVESTIGACIN
En esta seccin se describe el problema de investigacin as como los objetivos del proyecto.Hay que hacer notar que los objetivos reflejan el estado actual de la investigacin, as como las
sugerencias de los revisores del proyecto. Esto es, los objetivos se han afinado y, en particular, los
objetivos especficos presentan la certidumbre natural que resulta despus de concluir las etapas que
conforman este proyecto.
2.1. Planteamiento del Problema
Para el estudio del problema de variacin en escala en el reconocimiento de rostros se propone:aplicar un modelo matemtico e implementarlo en un programa computacional para la identificacin
de personas en fotografas con la caraterstica de variacin en escala. Consideremos la imagen de la
Fig. 2.1, esta consiste de dos fotografas superpuestas, imgenes monoculares, ambas contienen la
imagen de un rostro pero con variacin en la escala (ancho, alto y profundidad). Es de inters, que el
modelo y programa computacional propuesto sea capaz de analizar ambas imgenes y determinar si
corresponden o no a la misma persona. Es decir, se pretende desarrollar un programa computacional
que permita de forma automtica, por una parte, determinar la presencia de un rostro en la imagen
bidimensional y localizar la posicin donde se encuentre, a continuacin, identificar el rostro detec-
tado. Esto es, comparar el rostro detectado contra una base de datos y determinar si se encuentra
dentro de la base de datos .
Este proyecto busca hacer anlisis de imgenes bidimensionales (estticas), como las que corres-
ponden a fotografas, esto es, el proyecto se acota al problema de reconocimiento de rostros, aunque se
tomaran en cuenta elementos relativos a los problemas de localizacin y deteccin de caractersticas.
27
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
28/158
2. PROBLEMA DE INVESTIGACIN
Figura 2.1: Fotografas superpuestas. Rostros con variacin en escala (ancho, alto y profundidad).
Estn fuera del alcance de este trabajo las reas de autentificacin facial, anlisis de imgenes en
movimiento, as como de reconocimiento de expresiones faciales.
2.2. Objetivos
2.2.1. Objetivo general
Aplicar un modelo matemtico para la localizacin y reconocimiento de rostros en imgenes
monoculares (imgenes bidimensionales adquiridas con un cmara con un solo lente) con variacin
en escala en fotografas a color que contengan un solo rostro e implementarlo en un programa
computacional.
2.2.2. Objetivos particulares
Modelar el reconocimiento de rostros a travs de las tcnicas: Anlisis de Componentes Prin-
cipales yEigenfaces.
Aplicar Variacin Total para el suavizado de imgenes.
Localizar y extraer caractersticas, mapa de piel y mapa de ojos, en imgenes en color.
Aplicar procesamiento multiresolucin, para obtener la pirmide de imgenes que permita elmanejo de cambios de escala en fotografas.
2.3. Justificacin
El reconocimiento de rostros con variacin en escala tiene aplicaciones potenciales en la identi-
ficacin de una persona con propsitos de seguridad, salud o para algn tipo de registro o servicio,
28
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
29/158
2.4. Metodologa
Inicializacin
Evaluacin
Reconocimiento
Localizacin
Inicializacin
Evaluacin
Reconocimiento
Localizacin
Figura 2.2: Etapas que componen la metodologa de este proyecto.
por ejemplo, pasar lista en un saln de clases, as como para aplicaciones de teleconferencia, comu-
nicacin, animacin, etc.
2.4. Metodologa
Para alcanzar los objetivos arriba planteados de manera que culminen en el dispositivo tecnolgico
de inters, es necesario considerar las siguientes etapas: inicializacin, localizacin, reconocimiento
y evaluacin (Fig. 2.2).
En la etapa de inicializacin se recopilan los elementos materiales para crear un set fotogrfico
que permita hacer la adquisicin de las imgenes de prueba y las imgenes que formarn parte de
la base de datos. Las imgenes de prueba sern imgenes que contengan rostros en condicin de
variacin en escala. Para las etapas siguientes se crea un programa computacional que implemente
las tcnicas ms eficientes para localizacin y reconocimiento facial. En la etapa de localizacin
se determina si existe un rostro en una imagen de prueba dada. En caso de que exista un rostro
entonces se reescala para que pase a la etapa de reconocimiento en la cual se verifica si existe una
imagen facial en la base de datos que empate con la imagen de prueba. Finalmente, en la etapa de
evaluacin se verifica la eficiencia del sistema determinando la cantidad de aciertos y errores en el
reconocimiento de rostros.
29
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
30/158
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
31/158
Captulo 3
ANTECEDENTES TERICOS
A continuacin se exponen las bases tericas sobre las que se sustenta este proyecto. Por suimportancia, se enfatizan las tcnicas de anlisis de componentes principales, la tcnica eigenface,
normalizacin, variacin total y el procesamiento multiresolucin.
3.1. Conceptos Fundamentales
Los algoritmos computacionales de este proyecto se fundamentan en conceptos de las reas del
procesamiento digital de imgenes y reconocimiento de patrones. En esta seccin se describen algunos
de los conceptos de tratamiento de imgenes mayormente empleados en las tcnicas de localizacin
y reconocimiento facial.
3.1.1. Procesamiento digital de imgenes
Una imagen se define [13, 14, 15], como una funcin bidimensional f(x, y), donde x y y son
coordenadas espaciales (plano) y la amplitud de fen cualquier par de coordenadas(x, y)es llamado
laintensidad o nivel de grisde la imagen en ese punto.
Si los valores de los niveles de gris son cantidades discretas (enteros) entonces a la imagen se
le llama imagen digital. Esta imagen digital se compone de elementos llamados pxeles (picture
elements).
El campo del procesamiento digital de imgenesse refiere al procesamiento de imgenes digitales
por medio de una computadora.
Unaimagen binariadenotada como b(x,y)es una imagen digital f(x,y)cuantizada a dos niveles
de intensidad, 0 y 1.
31
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
32/158
3. ANTECEDENTES TERICOS
(a) (b)
Figura 3.1: Vecindades. a)N4(p)y b)N8(p), del pxel p con coordenadas (m,n).
Figura 3.2: En mtrica 4, el punto p es adyacente al punto qy no al punto r.
Funciones de distancia o mtricas d4y d8de basek. Seanp(m,n)y q(u,v)con m,n,u, v ZZy k={4,8}, entonces la distancia euclidiana entre p yqpara ambas mtricas estarn dadas por:
d4(p, q) = |m u|+ |n v| =
(m u)2 + (n v)2 (3.1)
d8(p, q) = max(|m u|, |n v|) (3.2)
VecindadesN4(p)yN8(p). Sea(A, )un espacio mtrico bidimensionaluna mtrica cualquiera,
la vecindad de un pxel p denotada por N(p) es el conjunto de pxeles tales que 0 < (m, n) 1.En la Fig. 3.1 se muestran ambos tipos de vecindades N4(p)y N8(p).
Puntos conectados. Dos puntos p y qse dicen estar conectados si qest en el conjunto N(p).
Puntos adyacentes. Un punto p es adyacente al punto qsi ambos estn conectados (Fig. 3.2).
Un camino entre dos puntos p y qen A es una secuencia de puntos distintos p1, p2, . . . , pn tales
que p0 =p y pn =q, pi es adyacente a pi1, 1 i ny nes la longitud del camino. Puede haber
32
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
33/158
3.1. Conceptos Fundamentales
Figura 3.3: Camino de longitd 4 en mtrica 8.
Figura 3.4: Bajo la mtrica 8, la regin se encuentra completamente conectada. Bajo mtrica 4, laregin debe ser vista como tres regiones 4-conectadas con 8, 4 y 2 elementos respectivamente.
dos tipos de caminos: 4 y 8 conectados. En la Fig. 3.3 se muestra un camino, en mtrica 8, entre los
puntos p y q. La longitud del camino es de 4 pxeles.
Una regin conectada Rb(m, n)es un conjunto de puntos p(m,n) tales que existe un caminoque comienza enp1y termina enp2para todop1y p2 R. Al igual que en el caso de caminos, puedehaber regiones 4 y 8 conectadas. En la Fig. 3.4 se muestra una regin 8-conectada de 14 elementos.
La misma regin en mtrica 4 debe ser vista como tres regiones 4-conectadas con 8, 4 y 2 elementos
respectivamente.
Una regin puede ser simplemente conectada (sin hoyos) o mltiplemente conectada (con hoyos).
En la Fig. 3.5 se muestra un objeto simplemente conectado, en forma de T, y otro multiplemente
33
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
34/158
3. ANTECEDENTES TERICOS
Figura 3.5: Regiones conectadas.
Figura 3.6: Una imagen y su histograma.
conectado con un hoyo.
El histogramade una imagen f(x,y) con L niveles de intensidad o de gris en el rango [0, L-1 ],
denotado comoh(rk)es una funcin discreta:
h(rk) =nkN
(3.3)
donderkes elk-simonivel de gris,nkes el nmero de pxeles en la imagen con el nivel de intensidad
rky Nel nmero total de pxeles en la imagen. En la Fig. 3.6 se muestra una imagen y su histograma.
La funcinh(rk)proporciona un estimado de la probabilidad de ocurrencia de un nivel de gris dado
nk de igual forma, la funcin h(rk) tambin habla de manera global acerca de la apariencia de la
imagen. Por ejemplo, un histograma de imagen sesgado a la izquierda nos habla de una imagen con
poco contraste y obscura, mientras que un histograma con valores sesgados hacia la derecha nos
habla tambin de una imagen con poco contraste pero con brillo.
Fundamentos del color. Bsicamente, los colores que los seres humanos y algunos otros animales
34
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
35/158
3.1. Conceptos Fundamentales
perciben en un objeto est determinada por la naturaleza de la luz reflejada sobre el objeto. La
luz visible est compuesta por una estrecha banda de frecuencias en el espectro electromagntico.
Un cuerpo que refleja la luz balanceada en todo el espacio visible de longitudes de onda aparece
en color blanco para el observador. Si la luz es acromtica entonces el color que se percibe va del
blanco al negro pasando por niveles de grises. La luz cromtica abarca desde los 400 a los 700
nm aprximadamente en el espectro electromagntico. Se emplean tres cantidades para describir la
calidad de una fuente de luz cromtica: radiancia, luminacia y brillo. La radianciaes la cantidad de
energa que fluye desde la fuente de luz, y sus unidades de medidad son en Watts (W). Luminacia,
medida en lumens (lm), es una medida de la cantidad de energa que un observador percibe de la
fuente de luz. Elbrilloes un descriptor subjetivo imposible de medir e incorpora la nocin acromtica
de intensidad y es un factor clave en la descripcin de la sensacin de color. Las caractersticas que
generalmente se emplean para distinguir un color de otro son el brillo, el matiz y la saturacin. El
matiz es un atributo asociado con la longitud de onda dominante en una mezcla de longitudes de
onda. Representa el color dominante percibido por el observador. La saturacin se refiere a la pureza
relativa o la cantidad de luz blanca mezclada con un matiz. Al matiz y a la saturacin juntas se les
llamacromaticidad, y, por tanto, un color puede ser caracterizado por su brillo y su cromaticidad.
Modelos de color. El propsito de un modelo de color (tambin llamado espacio de color o sistema
de colores) es facilitar la especificacin de colores en alguna forma estndar de aceptacin general.
En esencia, un modelo de color es una especificacin de un sistema coordenado y un subespacio
dentro de ese sistema donde cada color se representa por un punto. Los modelos de color que existen
son: RGB, NTSC, YCbCr, HSV, CMY, CMYK y HSI (ver [13, 16]). A continuacin se describen los
espacios de color RGB y YCbCr.
Una imagen de color RGB es una matriz de pxeles de tamao M N 3, donde cada pxeles una combinacin de colores rojo, verde y azul. Por convencin, cada matriz se referencia como
componente rojo, verde y azul de la imagen RGB. Una imagen RGB es de 8 bits (uint8) si su rango
de valores es de [0,255], o de 16 bits (uint16) para [0,65535], o double para [0,1]. El nmero de bits
empleados para representar el pxel de las componentes de la imagen determinan la profundidad de
bit (bit depth). Por ejemplo, si cada una de las componentes de la imagen es de 8 bits, entonces
la imagen RGB correspondiente se dice que es de 24 bits de fondo. El nmero total de colores en
una imagen RGB de 24 bits es de (28)3 = 16, 777, 216. El espacio de color RGB, generalmente se
muestra como un cubo de colores como se muestra en la Fig. 3.7. Los vrtices del cubo son los colores
primarios (rojo, verde y azul) y secundarios (cyan, magenta y amarillo) de la luz.
35
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
36/158
3. ANTECEDENTES TERICOS
(a) (b)
Figura 3.7: Cubo de 24 bits RGB. a) Esquema, normalizado a valores entre [0,1]; b) Cubo de colores.
El termino nivel de gris (gray level) se emplea para referirse a la intensidad de las imgenes
monocromticas.
El espacio de color YCbCr. En este espacio, la informacin de luminancia se representa por una
componente nica, Y, y la informacin de color se almacena como dos componentes diferencia de
color, Cb y Cr. La componente Cb es la diferencia entre la componente azul y un valor de referencia, y
la componente Cr es la diferencia entre la componete roja y un valor de referencia. La transformacin
empleada para convertir imgenes de RGB a YCbCr es atravs de la siguiente ecuacin:
Y
Cb
Cr
=
16
128
128
+
65.481 128.553 24.966
37.797 74.203 112.00112.000 93.786 18.214
+
R
G
B
(3.4)
3.1.2. Reconocimiento de patrones
El reconocimiento de patrones [17], o reconocimiento de formas, se define como la disciplina
cientfica cuya meta es la clasificacin de objetos en un nmero de categoras o clases. Al proceso
que permite extraer la regin de inters de una imagen se le denomina segmentacin.
3.1.2.1. Segmentacin de un objeto basado en el umbralizado
La segmentacin automtica de imgenes es, en general, una de las tareas ms dficiles de realizar
en anlisis de imgenes. Tiene una influencia determinante en el correcto desempeo de un sistema
36
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
37/158
3.1. Conceptos Fundamentales
Figura 3.8: Imagen en color (superior) convertida a escala de grises (media) y binarizada (inferior)con umbralizado por el mtodo de Otsu.
de reconocimiento automtico de objetos (SRAO). En aplicaciones donde muchas de las condiciones
pueden ser controladas, por ejemplo la iluminacin, el que los objetos no se toquen o traslapen entre
ellos facilita el proceso de segmentacin.
La idea bsica de las tcnicas basadas en el umbralizado [14, Cap. 2], es convertir las imgenes
f(x,y) en niveles de gris en una imagen binaria b(x,y), buscando que los objetos de inters de la
imagen queden separadas del fondo.
El mtodo de Otsu [18], es un mtodo de umbralizado automtico. Para su correcto funcionamien-
to el mtodo de Otsu supone que los pxeles de la imagen f(x,y)a binarizar pueden ser separados a
travs de un umbral u(a determinar) en dos clases: C1, la clase del objeto u objetos de inters y
C2, la clase de los pxeles del fondo.
Para el anlisis que sigue se hace uso de la siguiente notacin:
rel nivel de gris de un pxel con coordenadas (x,y).
Lel nmero de niveles de gris de la imagen f(x,y)con0 r L 1.
pr es el nmero de pxeles con el nivel de gris r.
37
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
38/158
3. ANTECEDENTES TERICOS
NT =p0+p1+ . . . +pr+ pL1 es el nmero total de pxeles.
p(r) = prNT
el histograma normalizado de niveles de gris de f(x,y), tal queL1
p(r) = 1.0r=0
uel umbral a determinar. El objetivo consiste en encontrar el valor ptimo de u, u
al maxi-mizar o minimizar una funcin criterio.
El mtodo de Otsu se basa en la tcnica del anlisis discriminante al maximizar alguna medida que
permita separar clases: la de los objetos y las del fondo. Una de estas medidas es la siguiente:
J1(u) =P1(u)P2(u)[1(u) 2(u)]2
P121(u) + P2(u)22(u)
(3.5)
donde:
P1(u) = Pr(C1) =
ur=0
p(r)
P2(u) = Pr(C2) =
L1r=u+1
1p1(u)
1(u) =
ur=0
p(r | C1) = 1p1(u)
ur=0
rp(r)
2(u) =L1
r=u+1
rPr(r | C2) = 1p2(u)
L1r=u+1
rp(r)
21(u) =L1
r=0
(r1(u))2Pr(r | C1) = 1
p1(u)
ur=0
(r 1(u))2p(r)
22(u) =L1
r=0
(r2(u))2Pr(r | C2) = 1
p2(u)
ur=0
(r 2(u))2p(r)
para poder maximizar el criterio dado por la ecuacin (3.5) las medidas de las dos clases deberan
estar bastante bien separadas y las varianzas deberan ser lo ms pequeas posibles. Si esto no
sucede, el valor del umbral obtenido simplemente no producir el resultado deseado. Una imagen
con un fondo muy grande comparado con el objeto u objetos en la imagen puede tambin dar lugar
a valores de umbral que produzcan resultados indeseados.
El valor ptimo u puede encontrarse al buscar en el rango [0,L-1 ] el valor de uque maximice
(3.5). Esto es:
38
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
39/158
3.2. Anlisis de Componentes Principales
u =arg max0uL1
J1(r) (3.6)
En la Fig. 3.8 se muestra una imagen binarizada por el mtodo de Otsu.En el apndice C.1, se ilustra como ejemplo la segmentacin de un objeto en cada libre.
3.1.2.2. Etiquetado de regiones o componentes conectadas
Una vez que una imagen ha sido umbralizada a travs de algunos de los mtodos, sus componentes
conectadas pueden ser etiquetadas. Los pxeles en una regin conectada forman una regin que puede
representar un objeto dado a reconocer. El etiquetado de componentes conectadas (ECC) puede ser
visto como una segunda etapa en el proceso de segmentado de una imagen. Se emplea un algoritmo
recursivo que consiste de los cuatro pasos siguientes, dada una imagen binaria b(x,y):
1. Barrer b(x,y)hasta encontrar un pxel de tipo objeto (con valor 1 o L-1) an no etiquetado y
asignarle una nueva etiqueta E.
2. Asignar en forma recursiva la etiqueta Ea todos sus vecinos, segun la mtrica elegida.
3. Detener si durante el recorrido no se encuentran ms pxeles de tipo objeto.
4. Regresar al paso 1.
En la Fig. 3.9a se muestra una imagen binaria. En las Figs. 3.9b-d se muestra la secuencia de
etiquetados hasta obtener la imagen etiquetada final. En la Fig. 3.9a las etiquetas son la unidad. En
la Fig. 3.9b se distingue la segunda regin con la etiqueta 2 y as sucesivamente para las regiones 3
y 4. Una de las ventajas de este algoritmo es que en una sola pasada se puede obtener el resultado
final.
La tcnica de umbralizado y la tcnica de etiquetado de componentes conectadas pueden ser
combinadas para separar las regiones de cada objeto en una imagen. Cada una de las regiones
etiquetadas pueden ser utilizadas para entrenar clasificadores para el reconocimiento de objetos.
3.2. Anlisis de Componentes Principales
La tcnica Anlisis de Componentes Principales (PCA,Principal Components Analysis) [19, 20]
es una tcnica matemtica til que ha encontrado aplicacin en los campos del reconocimiento de
rostros y en la compresin de imgenes ya que es una tcnica comn para encontrar patrones o
rasgos principales finitos en problemas de dimensin infinita.
39
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
40/158
3. ANTECEDENTES TERICOS
Figura 3.9: (a) Imagen binaria; (c-d) Secuencia de etiquetados.
La tcnica consiste de los siguientes pasos: (1) Recopilar el conjunto de datos; (2) Obtener el
conjunto promedio de los datos; (3) Calcular la matriz de covarianza; (4) Seleccionar los componentes,
formar un vector caracterstico y calcular los eigenvectores y eigenvalores de la matriz de covarianza.
3.2.1. Conjunto de datos
Seanun conjunto de imgenes de tamao MN, dondeMes el nmero de pxeles por renglny Nes el nmero de pxeles por columna. Entonces, un vector:
x= x1, x2,...,xn (3.7)
Se compone de npxeles, donde cada elemento es un pxel localizado en la misma posicin de
cada imagen (Fig. 3.10). Esto implica que se puede tener una matriz Xde vectores xk tales que:
X= x1,x2, ...,xk (3.8)
40
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
41/158
3.2. Anlisis de Componentes Principales
Figura 3.10: Vector xformado con pxeles de nimgenes.
donde k=1,2,...,MNy
xk = x1, x2,...,xn (3.9)
Esta matriz, X, de vectores representa al conjunto de datos.
3.2.2. Vector promedio
El vector promedio del conjunto de datos estar dado por la relacin:
mX= 1MN
MNk=1
xk (3.10)
3.2.3. Matriz de covarianza
La matriz de covarianza CX es una medida de la dispersin entre diferentes variables (ms de
una dimensin). Para el caso de un vector xk y el vector promedio mX tenemos que la matriz de
covarianza est dada por:
CX= 1
MN
MNk=1
(xk mX)(xk mX)T
(3.11)
Sean ei y i, i=1, 2, ..., n, los eigenvectores y eigenvalores correspondientes de la matriz CX,
ordenados por conveniencia en orden descendente, de modo que j = j+1, paraj = 1, 2, . . . , n 1.Por definicin, los eigenvectores y eigenvalores de una matriz de dimensinnnsatisfacen la relacin:
CXei = iei (3.12)
41
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
42/158
3. ANTECEDENTES TERICOS
parai = 1, 2,...,n.
3.2.4. Componentes principales
La transformacin en componentes principales [13] est dado por:
Y= A(xk mX) (3.13)
donde Arepresenta el vector caracterstico o vector propio (eigenvector, del alemn eigenpropio).
Los renglones de A representan los eigenvectores de CX. Los eigenvalores, son los elementos a lo
largo de la diagonal de CY, donde:
CY= ACXAT (3.14)
Los eigenvectores [21], son vectores unitarios, es decir su longitud es 1 y forman un conjunto
ortonormal de vectores en la norma inducida por la matriz de covarianza (son perpendiculares entre
ellos respecto a CX) y aportan informacin acerca de los patrones en los datos. Seleccionando los
eigenvalores de mayor valor se consigue la reduccin de dimensionalidad y la compresin de datos, en
el sentido de que con estos vectores se cubre el espacio de los datos. Hay reduccin de dimensionalidad
en la medida en que la dispersin de los datos se alinean a un eigenvector en particular de manera
que se pueden omitir aquellos eigenvectores en los cuales no sea relevante tal alineacin, es decir,
su eigenvalor sea pequeo. Hay compresin de datos en la medida en que se pueden seleccionarslo aquellos eigenvalores, que sean ms representativos en peso (de mayor valor) de manera que
es posible recuperar la informacin original sin gran perdida de datos, o sea, con error cuadrtico
medio pequeo. Esto es, sea:
X= ATY + mX (3.15)
el conjunto de datos original. Entonces, para un conjunto qreducido de eigenvectores tenemos que
Ase hace una matriz de tamao q n, Aq, de manera que la reconstruccin estar dada por:
X= ATqY + mX (3.16)
El error cuadrtico medio ecm estar dado por:
ecm=nj=1
jq
j=1
j =n
j=q+1
i (3.17)
Si q=nel error es cero.
42
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
43/158
3.3. La TcnicaEigenface
3.3. La Tcnica Eigenface
La tcnica eigenface [7, 22], es el PCA aplicado en imgenes faciales (rostros) sobre un espacio
representado por un conjunto de rostros grande. Los caractersticos significativos son conocidos
comoeigenfacesporque son los eigenvectores (componentes principales) del conjunto de rostros; que
asemejan, aunque no necesariamente, a caractersticas tales como los ojos, odos o nariz. La operacin
de proyeccin caracteriza a un rostro individual por la suma de pesos de los eigenfaces caractersticos,
de manera que para reconocer un rostro particular solo es necesario comparar estos pesos contra
aquellos de los rostros conocidos. En trminos matemticos se requiere encontrar los componentes
principales de la distribucin de rostros, o los eigenvectores de la matriz de covarianza del conjunto de
imgenes faciales, tratando una imagen como un punto (vector) en un espacio dimensional infinito.
Posteriormente, se ordenan los eigenvectores de acuerdo a una cantidad relativa a la variacin entrelas imgenes faciales, seleccionando un nmero finito de estos, los ms representativos en peso de
acuerdo a su eigenvalor y que contribuyen a recuperar la imagen.
Podemos ver, a cada uno de los eigenvectores, como un pequeo espectro o "fantasma", del
rostro original, al cual se le llamaeigenface. Cada rostro individual se puede representar en trminos
de una combinacin lineal de los eigenfaces. Por lo que, un rostro individual se puede aproximar
empleando solo los "mejores" eigenfaces, aquellos que tienen los eigenvalores ms largos o pesados,
y que ms contribuyen en la variacin del conjunto de imgenes faciales. Los mejores M eigenfaces
se extienden sobre un subespacio M-dimensional,espacio facial, de todas las imgenes posibles (se
tiene la reduccin a Mdimensiones del espacio de rostros de dimensin infinita).
3.3.1. Resolucin de las imgenes
Sea Fun conjunto de M imgenes o fotografas de tamao m n,donde:
F= f1, f2, ..., fM (3.18)
Las operaciones de clculo que se proponen en la seccion siguiente, se reducen si cada imagen se
reordena de manera que el tamao o resolucin de las mismas se lleven a la resolucin N1 (todaslas columnas de la imagen se reagrupan en una sola) donde N=mn. De esta forma se obtendr:
= 1, 2,...,M (3.19)
que es un conjunto de M imgenes de resolucin N1.
43
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
44/158
3. ANTECEDENTES TERICOS
3.3.2. Clculo de eigenfaces
El rostro promedio, , del conjunto de fotografas estar dado por:
= 1M
Mk=1
k (3.20)
Sea:
i= i
la diferencia entre la i-esima imagen o fotografa y el rostro promedio. Entonces la matriz de cova-
rianza estar dada por la relacin:
C= 1
M
Mk=1
kTk = AA
T (3.21)
donde
A= [12...M]
es una matriz de tamaoNM. A partir de la matriz de covarianza se pueden obtener los eigenfaces(eigenvectores) y los eigenvalores. Aplicando:
AATvi = ivi
donde vi es el vector de eigenfaces y i el conjunto de eigenvalores. Notemos que la resolucin de
esta operacin estar dada por:
AAT (NM)(NM)T = (NN)
Para hacer este clculo es necesario hacer computacionales las operaciones reduciendo la re-
solucin de las mismas. Aplicando propiedades del lgebra lineal se puede reducir el cmputo de las
operaciones a un valor dado por MM. Esto es:
ATA (NM)T(NM) = (MM)
De esta forma el procedimiento para calcular los eigenvectores y eigenvalores ser el siguiente.
Consideremos la ecuacin:
ATAui = iui
De esta ecuacin obtener los eigenvectores uiy eigenvaloresi. A continuacin ajustar el eigenvector
ui obtenido multiplicandolo por Aya que:
AAT(Aui) = i(Aui) (3.22)
44
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
45/158
3.3. La TcnicaEigenface
donde
vi= Aui (3.23)
nos da el conjunto de eigenfaces buscado.
En el apndice C.2, se ilustra como ejemplo el clculo de la imgen promedio as como de los
eigenfaces correspondientes para un conjunto de doce fotografas.
3.3.3. Cmo utilizar los eigenfaces para reconocimiento de rostros
Los eigenfaces son adecuados para describir imgenes faciales bajo condiciones controladas. Un
valor pequeo M (M
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
46/158
3. ANTECEDENTES TERICOS
2 = f (3.27)
donde
=
y
f=M
i=1 iui
De lo anterior hay cuatro posibilidades para una imagen de entrada y su vector patrn: (1)
espacio facial cercano y clase facial cercana, (2) espacio facial cercano pero ninguna clase facial
cercana conocida, (3) lejana del espacio facial y clase facial cercana, y (4) lejana del espacio facial y
ninguna clase facial cercana conocida. En el primer caso, un individuo es reconocido e identificado.En el segundo caso, un individuo desconocido est presente. Los dos ltimos casos indican que la
imagen no es un rostro. El caso tres muestra un caso tpico de falso positivo que es detectado dada
la distancia significativa entre la imagen de entrada y el espacio facial. Es decir, un falso positivo
corresponde a una imagen detectada como si fuera un rostro o siendo un rostro como si formara
parte de la base de datos. Un falso negativo corresponde a un rostro que no es detectado y que s
forma parte de la base de datos.
3.4. Normalizacin
La normalizacin [1, pag. 93][23], es un proceso que permite mejorar el reconocimiento y con-
siste en alinear tanto como sea posible las imgenes faciales. La alineacin puede ser en traslacin,
orientacin y escala.
Para eliminar la influencia del cabello y del ruido de fondo se puede extraer solo la regin
elptica de la cara. Para reducir los efectos de los cambios en la iluminacin global y direccional, se
pueden aplicar sombreado lineal y ecualizacin a las imgenes faciales. Sin embargo, estas operaciones
pueden ser muy costosas, especialmente en escenas dinmicas. Una alternativa, consiste en aplicaruna correccin en intensidad a cada pxel aplicando la relacin:
CI(xn) =xn
(3.28)
dondeC Irepresenta la correccin en intensidad, xn representa al pxel, representa la intensidad
media y representa la desviacin estndar de la imagen.
46
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
47/158
3.5. Variacin Total
3.5. Variacin Total
Variacin total (TV,Total Variation) es una tcnica matemtica que permite suavizar una imagen
(quitar ruido). En esta seccin se describe su formulacin, sin restriccin y con restriccin a ruido,
as como su discretizacin.
3.5.1. Conceptos preliminares
Cantidades variables llamadas funcionales [24], juegan un papel importante en diferentes pro-
blemas que se presentan en el anlisis, mecnica, geometra, etc. Unfuncionales una correspondencia
que asigna un nmero (real) definido a cada funcin (o curva) que pertenece a alguna clase. Por
tanto, se puede decir que un funcional es una clase de funcin donde la variable es en s misma una
funcin (o curva). La rama ms desarrollada del clculo de funciones est interesada en la bsqueda
de mximos y mnimos de funcionales y se le conoce con el nombre de clculo de variaciones.
SeaJ[y]un funcional de la forma
J[y] =
ba
F(x, y, y)dx (3.29)
definida en el conjunto de funcionesy(x)la cual tiene primeras derivadas continuas en [a,b] y satisface
las condiciones de frontera y(a)=A, y(b)=B. Entonces una condicin necesaria para que J[y]tenga
un extremo para una funcin dada y(x)es que satisfaga la ecuacin de Euler:
Fy ddx
Fy = 0 (3.30)
Las curvas de la ecuacin de Euler se conocen como extremos. La ecuacin de Euler es una
ecuacin diferencial de segundo orden, su solucin dependera, en general, de las condiciones de
frontera.
El problema variacional ms simple consiste en encontrar un extremo dbil de un funcional de la
forma (3.29), donde la clase de funciones admisibles consisten en todas las curvas suaves que unen
dos puntos.
El mtodo de diferencias finitases de amplio uso para resolver problemas variacionales. Con-
siderando un funcional de la forma (3.29) para encontrar una funcin relacionada de la forma ms
corta que considera el anlisis clsico procedemos como sigue. Emplear los puntos:
a= x0, x1, . . . , xn, xn+1= b
47
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
48/158
3. ANTECEDENTES TERICOS
se divide el intervalo [a,b] enn+1 partes iguales. Entonces se reemplaza la curvay=y(x)por la lnea
poligonal con vrtices
(x0, A), (x1, y(x1)), . . . , (xn, y(xn), (xn+1, B)),
y se aproxima la funcional J[y]por la suma:
J(y1, . . . , yn) =n+1i=1
F(xi, yi,yi yi1
h )h, (3.31)
donde
yi= y(xi), h= xi xi1
y0= A yn+1= B
cada lnea poligonal est determinada por la ordenacin y1, . . . , yn de sus vrtices y la suma (3.31)
es por tanto, una funcin de n variables y1, . . . , yn.
3.5.2. Restauracin de la imagen
Consideremos el problema de restaurar una imagen contaminada con ruido o degradada. Sea
u0= K utrue+la imagen adquirida dondeKes un operador de nivel borroso y es el nivel de ruido
o degradacin de la imagen. Encontrar una aproximacinu(x )a la imagen verdaderautrue(x ). TVes un mtodo [25] para recuperar la imagen verdadera, lo ms exacta posible y encontrar una nueva
imagen en la cual la informacin de inters sea ms obvia y ms fcil de extraer.
Se puede modificar una imagen disminuyendo la variacin total
T V(u) |u(x )| dx (3.32)
en la imagen, mientras se preserva algn ajuste a los datos originales u0. A la ecuacin (3.32) se
le conoce como variacin total de u. Al resolver la ecuacin siguiente, la nitidez o suavizado de la
imagen (Fig. 3.11) lo determinanu0y . Esta ecuacin se conoce como la formulacin no restringida
de Tikhonov.
minu
1
2u u02 + T V(u) (3.33)
48
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
49/158
3.5. Variacin Total
Figura 3.11: Resultado de la regularizacin por TV para una funcin con ruido (imagen superior) ypara una imagen con un mandril (imagen inferior). Las imgenes de la izquierda son las originales,las siguientes muestran los resultados de la regularizacin para los valores de =0.0001, 0.001, 0.01,0.1 y 1.0.
La formulacin restringida a ruido est dada por:
minu
T V(u)sujeta a u u02 =2 (3.34)
Computacionalmente este modelo generalmente se resuelve a travs de su ecuacin de Euler-
Lagrange [26, pag. 179]. Adoptando el mtodo de pendiente descendente ( steepest descendent march-
ing) con tiempo tartifical, propuesto por Rudin, Osher and Fatemi [27], tenemos que para:
Etv[u | u0] =
|u| dx + 2
(u0(x) u(x))2dx (3.35)
La ecuacin de Euler-Lagrange estar dada por
ut(x, t) = Etvu
= u|u|
2(u(x, t) u0(x)) (3.36)
Para procesamiento de imgenes, estos mecnismos de difusin son necesarios y una ventaja en
tcnicas de suavizado.
3.5.3. Discretizacin de la variacin total de una imagen
Consideremos una imagen u definida en {0, . . . , N 1}2, dondeNes un entero positivo, extendidaen Z2. La forma clsica de discretizar (3.32) es de la siguiente forma [28, 30, 31, 32]:
T Vd(u) =
|u|d(k, l)0k,l
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
50/158
3. ANTECEDENTES TERICOS
donde
|u
|d(k, l) = (u (k+ 1, l) u (k, l))
2+ (u (k, l+ 1)
u (k, l))
2 (3.38)
Hay otras formas de discretizar la variacin total, por medio de diferencias finitas o con valores
absolutos, sin embargo la ecuacin (3.37) es la forma ms simple y tiene la ventaja de ser euclidiana.
Para los casos de las ecuaciones (3.33) y (3.34) la discretizacin se realiza como sigue[27]. Sea
u0(x, y)una funcin de intensidad que representa los pxeles de una imagen con ruido dondex, y .Seau (x, y)la imagen libre de ruido, entonces:
u0(x, y) = u (x, y) + n (x, y) (3.39)
dondenes el ruido aditivo. Se quiere reconstruirudesdeu0. El problema de mnimizacin restringida
es:
min
u2x+ u
2ydxdy (3.40)
sujeta a
udxdy =
u0dxdy (3.41)
La restriccin significa que el ruido n (x, y)en (3.39) es de promedio cero y
1
2(u u0)2 dxdy = 2 (3.42)
donde >0. La segunda restriccin considera que la desviacin estndard del ruido n (x, y)es .
As se tiene una restriccin lineal y otra no lineal. Sus ecuaciones de Euler-Lagrange son:
0 =
x
uxu2x+ u
2y
+ y
uyu2x+ u
2y
1 2(u u0) (3.43)en,con u
n= 0 sobre la frontera de =.
El procedimiento de solucin emplea una ecuacin parablica con el tiempo como un parmetro en
evolucin, o de manera equivalente, se aplica el mtodo de gradiente descendente. Esto significa que
resolvemos:
50
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
51/158
3.5. Variacin Total
ut =
x
ux
u2x+ u2y
+
y
uy
u2x+ u2y
(u u0) (3.44)
parat>0, x , y , u (x,y, 0)dado, un = 0 sobre.
Se ha suprimido la primera restriccin porque es automticamente forzada por el procedimiento
en evolucin si la media de u (x,y, 0) es la misma de u0(x, y). Cuando t se incrementa esto se
aprovecha para quitar ruido a la imagen. Se debe calcular (t). Al multiplicar la ecuacin (3.44)por
(u u0)e integrar por partes sobre , una vez que se alcanza el estado permanete, el lado izquierdode la ecuacin (3.44)se desvanece, entonces tenemos que:
=
1
22 u2x+ u2y
(u0)x uxu2x+ u2y
+(u0)yuy
u2x+ u2y dxdy (3.45)
El mtodo nmerico en dos dimensiones est dado como sigue, sea:
xi = ih, yj =jh, i, j = 0, 1,...,N, con N h= 1,
tn= nt, n= 0, 1, ...,unij =u (xi, yj , tn),
u0ij =u0(ih,jh) + (ih,jh)
Los datos iniciales se eligen de manera que las restricciones se satisfagan inicialmente, es decir,
que promedien cero.
un+1ij = unij +
th
(x
x+unij
(x+unij)2+(m(y+unij,
yunij))
21/2
+y
y+unij
(x+unij)2+(m(x+unij,xunij))
21/2
)
tn unij u0(ih,jh)parai, j = 1,...,N, con condiciones de frontera:
un0j =un1j , u
nNj =u
nN1,j, u
ni0= u
niN=u
ni,N1
donde
xuij = (ui1,j uij)
yuij = (ui1,j uij)
51
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
52/158
3. ANTECEDENTES TERICOS
m(a, b) = minmod(a, b) =
sgna + sgnb
2
min (|a| , |b|)
As tambien paran tenemos:
n = h22
[i,j
(x+unij2 + y+unij2
(x+u
0ij)(
x+u
nij)
(x+unij)2+(y+unij)
2
(y+u0ij)(
y+kunij)
(x+unij)2+(y+unij)
2 )]
Para estabilidad se impone una restriccin para el tamao del paso, dado por:
th2 c
3.6. Procesamiento Multiresolucin (Pirmide de Imgenes)
Una herramienta importante, conceptualmente simple en estructura para representar imgenes
a ms de una resolucin es la pirmide de imgenes [13, pag. 351]. Una pirmide de imgenes es
un conjunto de imgenes con resolucin decreciente dispuestas en forma de una pirmide. Como se
puede observar en la Fig. 3.12a la base de la pirmide tiene una representacin de resolucin alta de
la imagen que se quiere procesar (Fig. 3.12b); la cima contiene una resolucin baja. Al subir desde
la base de la pirmide tanto el tamao como la resolucin decrecen. Como la base de la pirmide es
de tamao NNentonces esta en el nivel J, dada por:
J=log2N (3.46)
y el siguiente nivel, (N/2) (N/2),en J-1=(log2N)-1. Por ejemplo, sea N=512entonces el nivel Jestar dado porJ=log2(512)=9. Por tanto, J-1=9-1=8donde N/2=512/2=256=2J1 = 28. Esto
quiere decir, que la imagen con resolucin de 512x512pxeles se podr reducir desde el nivel 9 al
nivel 1. En la Fig. 3.12b se muestra una pirmide Gaussiana con filtrado en el dominio del espacio,
empleando un kernel de convolucin Gaussiano de 5 5pasa bajas (Fig. 3.13).
h(x) =
2Ae222x2
52
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
53/158
3.6. Procesamiento Multiresolucin (Pirmide de Imgenes)
(a) (b)
Figura 3.12: Estructura de imagen piramidal.
Figura 3.13: Filtro Gaussiano pasa bajas en el dominio del espacio.
53
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
54/158
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
55/158
Captulo 4
PROTOCOLO DE ADQUISICIN DE
IMGENES
El protocolo de adquisicin de imgenes se compone de dos partes. En la primera parte se
crea el set fotogrfico en el cual se har la adquisicin de las imgenes que integrarn la base de
datos del sistema de reconocimiento de rostros. En este set fotogrfico se busca mantener las mejores
condiciones de iluminacin, el mismo fondo y distancia similar entre el rostro y la cmara fotogrfica.
De manera complementaria, se obtienen diez fotografas con cambio de escala, fondo e iluminacin
diferentes, que se integrarn a la base de datos con objeto de que permitan el reconocimiento facial
con cambios de escala. En la segunda parte, se hace la adquisicin de las imgenes que se utilizarn
como imgenes de prueba con cambios de escala, en un set alterno (saln de clase) donde cambian
las condiciones de iluminacin y escala de los rostros.
4.1. Proceso de adquisicin de imgenes
El proceso de adquisicin consite en: (1) Construccin del set fotogrfico; (2) Promover la colabo-
racin de la comunidad academica en el proyecto; (3) Registrar al participante; y finalmente (4) Hacer
la adquisicin del rostro de frente en fotografas a color y con alta resolucin (con fondo azul para
crear la base de datos).
Para poder hacer la adquisicin de las imgenes para crear la base de datos es necesario configurar
el set fotogrfico que se ilustra en la Fig. 4.1. El set fotogrfico consta de la lista de materiales que
se indica en la Tabla 4.1.
El diagrama esquemtico de la Fig. 4.2 ilustra la disposicin de los materiales en el set fotogrfico.
55
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
56/158
4. PROTOCOLO DE ADQUISICIN DE IMGENES
Tabla 4.1: Lista de materiales.
1. Lmparas reguladoras 500 w (2 unidades)2. Paneles reflectores (2 unidades)3. Banquillo (1 unidad)4. Fondo azul (1 unidad)5. Cmara profesional Nikon d80 (1 unidad)6. Tripie profesional (1 unidad)
Figura 4.1: Set fotogrfico.
Figura 4.2: Diagrama esquemtico
Dos lamparas reguladoras (1) iluminan a la persona a travs de su panel reflector (2). El panel
reflector evita que la intensidad de la luz moleste la retina de los ojos. El banquillo (3) estibiliza la
posicin de la persona. El fondo azul (4) facilitar el proceso de segmentacin. La cmara profesional
(5) permite capturas de imgenes en alta resolucin 10.2 Mpxeles (3872x2592 resolucin mxima y
1936x1296 resolucin mnima). La alta resolucin permitir cambiar la escala de las imgenes.
56
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
57/158
4.2. Resultados del proceso de adquisicin
Figura 4.3: Registro de datos por persona.
La colaboracin fue faborable no solo de la comunidad academica sino de las autoridades, quienes
nos dieron la autorizacin as como todas las facilidades para el desarrollo de este protocolo de
adquisicin. Para este proceso colaborarn ms de 50 personas entre alumnos y personal de la
Universidad Autnoma Metropolitana, Unidad Cuajimalpa.
Durante el proceso de adquisicin, cada persona registr sus datos personales (Fig. 4.3), en
particular: nombre, edad, fecha y lugar de nacimiento, color de pelo, entre otros. Adems, autoriz
el uso de su imagen con propositos de investigacin como se ilustra en la hoja de registro del apndice
B.
Las fotografas en color son imgenes monoculares de frente, con fondo azul. El proyecto se acota
a este tipo de imgenes y no a imgenes de perfil debido a la complejidad de estas ltimas. El
fondo azul permite mejorar la segmentacin de las imgenes para la creacin de la base de datos del
sistema. La alta resolucin es una caracterstica que facilita los cambios de escala (reduccin) de las
imgenes sin gran perdida de datos.
4.2. Resultados del proceso de adquisicin
Como resultado del proceso de adquisicin, en una primera etapa se obtuvieron las imgenes
que se ilustran en la Fig. 4.4. Sin embargo, no fueron suficientes y se requiri una segunda etapa de
adquisicin de la cual se obtuvieron 488 fotografas (Figs. 4.7 y 4.5). Se integrarn 400 imgenes en
la base de datos del sistema. Se utilizarn 48 fotografas como imgenes de prueba con variacin en
escala (Fig. 4.6).
57
7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico
58/158
4. PROTOCOLO DE ADQUISICIN DE
Top Related