INV-Identificacion Del Autor de Un Texto Manuscrito-IPN
Transcript of INV-Identificacion Del Autor de Un Texto Manuscrito-IPN
-
INSTITUTO POLITCNICO NACIONAL
Centro de Investigacin en Computacin
IDENTIFICACIN DEL AUTOR
DE UN TEXTO MANUSCRITO
T E S I S
Que para obtener el grado de:
Maestro en Ciencias de la Computacin
P r e s e n t a:
Edith Cristina Herrera Luna
Director de Tesis:
Dr. Edgardo Manuel Felipe Rivern
Mxico, D. F. Diciembre de 2008
-
2
-
3
-
4
RESUMEN
El presente trabajo muestra una metodologa para caracterizar la escritura de un individuo
con rasgos a nivel de prrafo, rengln y palabra, sin llegar a un anlisis exhaustivo a nivel
de carcter o trazos de la escritura. Usando una base de datos desarrollada
fundamentalmente para esta Tesis.
El procedimiento para clasificar una nueva muestra de escritura se basa en algoritmos del
Enfoque Lgico-Combinatorio, como son el algoritmo BT y Kora- .
-
5
ABSTRACT
This paper shows a methodology to characterize the writing characteristic of an individual
with a paragraph, line and word level, without reaching a comprehensive analysis at the
character level or strokes of the writing. Using a database developed fundamentally for this
Thesis.
The procedure to classify a new sample of writing is based on algorithms of the Logical-
Combinatorial Approach, such as BT and Kora- .
-
6
INDICE
LISTA DE ILUSTRACIONES 8
LISTA DE TABLAS 9
I. INTRODUCCIN 10
I.1 Motivacin y Justificacin ....................................................................................... 10
I.2 Descripcin del problema......................................................................................... 11
I.3 Objetivos ................................................................................................................. 12
I.3.1. General ................................................................................................... 12
I.3.2. Particulares ............................................................................................. 12
I.4 Especificacin del problema .................................................................................... 12
I.4.1. Alcances y limitaciones ............................................................................ 13
I.5 Consideraciones generales ....................................................................................... 13
I.6 Aportes y contribuciones.......................................................................................... 14
I.7 Antecedentes............................................................................................................ 14
I.8 Estado del arte ......................................................................................................... 15
I.9 Organizacin de la tesis ........................................................................................... 18
II. MARCO TERICO 19
II.1 Introduccin ............................................................................................................. 19
II.2 Conceptos bsicos y definiciones ............................................................................. 19
II.3 Seccin 1: Escritura manuscrita y su estudio ............................................................ 22
II.3.1 Escritura: Historia y trascendencia ......................................................... 22
II.3.2 Disciplinas relacionadas con la escritura ................................................ 23
II.3.3 Documentoscopa y Grafoscopa ............................................................. 24
II.3.4 reas de estudio y aplicaciones ............................................................... 25
II.3.5 Caractersticas de la escritura manuscrita .............................................. 27
-
7
II.4 Seccin 2: Computacin .......................................................................................... 33
II.4.1 Muestras de escritura .............................................................................. 33
II.4.2 Anlisis de imgenes y morfologa matemtica ........................................ 34
II.4.3 reconocimiento de patrones: Enfoque Lgico-Combinatorio ................... 34
III. METODOLOGA PROPUESTA 39
III.1 Introduccin ............................................................................................................. 39
III.2 Caractersticas representativas.................................................................................. 39
III.3 Interfaz grfica ......................................................................................................... 46
III.4 Seleccin de las variables y clasificacin ................................................................. 47
III.5 Secuencia detallada del anlisis completo ................................................................ 48
IV. EVALUACIN DE LOS RESULTADOS 50
IV.1 Experimentos realizados .......................................................................................... 50
IV.2 Resultados finales y eficiencia ................................................................................. 51
IV.3 Problemas pendientes ............................................................................................... 52
V. CONCLUSIONES 53
V.1 Conclusiones............................................................................................................ 53
V.2 Trabajos futuros ....................................................................................................... 54
BIBLIOGRAFA 55
ANEXOS 58
A. Formulario para obtener textos manuscritos ............................................................. 58
-
8
LISTA DE ILUSTRACIONES
Ilustracin 1: Ejemplo de una posible divisin de una palabra en grafemas. ................. 17
Ilustracin 2: Elementos formales de las letras ............................................................. 20
Ilustracin 3: Ejemplo de zonas de escritura. ............................................................... 21
Ilustracin 4: Escritura cuneiforme. ............................................................................. 22
Ilustracin 5: Lnea del tiempo representativa de la escritura. ...................................... 23
Ilustracin 6: Caracteristica de orden en la escritura .................................................... 28
Ilustracin 8: Ejemplos de escritura con diferentes dimensiones .................................. 29
Ilustracin 7: Tamao de la escritura ........................................................................... 29
Ilustracin 9: La proporcionalidad en los valos de las letras. ...................................... 29
Ilustracin 10: Proporciones de los margenes .............................................................. 30
Ilustracin 11: Caracteristica de forma de las letras. ..................................................... 30
Ilustracin 12: Escritura con formas triangulares ........................................................ 31
Ilustracin 13: Direccin descendente. ......................................................................... 31
Ilustracin 14: Ejemplo de direccin sinuosa o serpentina. .......................................... 31
Ilustracin 15: Inclinacin en la escritura.. ................................................................... 32
Ilustracin 16: Separacion de palabras y letras. Ejemplo de enlaces. ............................ 32
Ilustracin 17: Procedimiento para el espacio entre renglones ...................................... 42
Ilustracin 18: Ejemplo del procedimiento para el espacio entre renglones. ................. 43
Ilustracin 19: Ejemplo despus de aplicar el procedimiento para encontrar las
caractersticas de proporcin en una palabra. ....................................................... 44
Ilustracin 20: Posibles direcciones de una linea con largo de 15 pixeles ..................... 45
-
9
LISTA DE TABLAS
Tabla 1. Clasificacin del documento, segn su anlisis y propsito de estudio ......... 277
Tabla 2: Clasificacin para la interpretacin grafolgica.............................................. 28
-
Captulo I
Introduccin
I. INTRODUCCIN
I.1 MOTIVACIN Y JUSTIFICACIN
Actualmente un proceso de identificacin y verificacin de una persona es una tarea
cotidiana y no solo est presente cuando la seguridad requerida para cierto objetivo es
extrema. Por ejemplo, al utilizar una computadora se pide una clave de acceso, al cobrar un
cheque en un banco, al votar en un proceso de elecciones, al matricularse como estudiante,
etc. Todas esas tareas no estn restringidas a hacerse manualmente, pero aun as, a pesar de
la creciente demanda de documentos electrnicos, la identificacin por medio de la
escritura manuscrita1 est presente sobre las tareas digitales. Generalmente identificar y
verificar a un individuo es laborioso, consume mucho tiempo y est sujeto a muchas
imprecisiones si se hace manualmente, por lo que se ha optado por tomar soluciones
automatizadas valindose de un software que facilita llevar a cabo dichas tareas con
confianza, rapidez, sin subjetividad y con mrgenes de error mucho menores, dando lugar
al constante inters y desarrollo por cuestiones biomtricas.
1 No debe confundirse escritura manuscrita con escritura script o cursiva. La primera hace referencia a una escritura que
se hace a mano teniendo diferentes tipos de escritura como script o cursiva, de molde, etc., mientras que las siguientes escrituras se refieren a escrituras tambin hechas a mano, pero con cada letra unida a las adyacentes dentro de una palabra.
-
11
La ciencia que se refiere a los mtodos automticos que analizan determinadas
caractersticas humanas con el fin de identificar y autentificar a las personas es conocida
como Biometra2 [1]. Se basa principalmente en la medicin de caractersticas fsicas o de
conducta y rasgos personales de un individuo, las cuales pueden considerarse como
estticas (caractersticas fsicas) o dinmicas (caractersticas conductuales). Los
procedimientos biomtricos ms conocidos usan la escritura manuscrita (firma y texto), la
huella digital, el uso de tarjetas plsticas y el reconocimiento de voz, etc., aunque
recientemente se hacen fusiones, al usarse la combinacin de varias tcnicas para ofrecer
mayor seguridad a los sistemas que lo implementan. La identificacin personal que utiliza
la escritura no solo es una medida de seguridad, sino que se ha extendido a otras reas de
estudio como por ejemplo la Criminalstica3, que es la disciplina que se ocupa de estudiar
cuestiones criminales.
Debido a esta constante tarea de verificacin y a que un anlisis de cierta escritura es
complicado, se pretende realizar una interfaz que sea de utilidad para identificar al autor de
un texto manuscrito, tratando de evitar el error que puede estar presente cuando una
persona que realiza el anlisis, necesita dar una opinin sobre alguna caracterstica de la
escritura en cuestin.
I.2 DESCRIPCIN DEL PROBLEMA
El estudio de la escritura toma un papel importante, entre otras tareas, en el rea
relacionada con la identificacin de autores mediante mtodos forenses de annimos, en la
autentificacin de documentos, en la validez de documentos legales, etc., a tal grado que se
han desarrollado especialidades que estudian la escritura manuscrita y sus caractersticas.
Algunas de ellas son la Grafologa, la Grafoscopa, la Documentoscopa, etc.
Uno de los problemas al realizar el anlisis de una muestra de escritura es la complejidad en
cuanto a las mediciones a hacer, las que deben ser muy precisas, sin que el punto de vista
del especialista influya considerablemente en el anlisis que se est realizando.
Con el desarrollo del tema Identificacin del autor de un texto manuscrito, se pretende
que la interfaz creada sea una ayuda para el especialista y que su punto de vista se rija
principalmente por reglas generales disminuyendo en su diagnstico la subjetividad. La
interfaz obtendr caractersticas similares a las realizadas por un especialista y otras
obtenidas por mtodos computacionales de una forma precisa y en un menor tiempo.
Incluso, se pretende que esta interfaz sea de utilidad para personas que no tienen un
conocimiento a fondo del tema para analizar la escritura de una persona.
2 Tambin definida como la ciencia que se encarga de estudiar estadsticamente las caractersticas cuantitativas de los seres vivos [1].
3 Aborda temas como el delito, el delincuente, procesos de criminales. Se puede entender como la disciplina que busca el cmo, cundo y dnde se comete un hecho presuntamente delictuoso y prueba la culpabilidad o no aportando pruebas.
-
12
I.3 OBJETIVOS
El objetivo general y los objetivos particulares de la tesis son:
I.3.1. GENERAL
Implementar un sistema para identificar al autor de un texto manuscrito, por medio del
reconocimiento fuera de lnea de las caractersticas representativas de las muestras
previamente recolectadas de escritura manuscrita en letra de molde contenidas en una base
de datos.
I.3.2. PARTICULARES
Los objetivos particulares son:
Elaborar una base de datos conformada por las muestras de escritura manuscrita y la firma de varios individuos.
Analizar principalmente las zonas de escritura de las palabras en el texto.
Obtener, identificar y seleccionar las caractersticas representativas de la escritura de un individuo y generalizar el proceso mediante una metodologa que pueda
usarse en otras aplicaciones.
Identificar el vector de caractersticas necesario y suficiente para resolver el problema de la clasificacin.
I.4 ESPECIFICACIN DEL PROBLEMA
El propsito de la tesis es identificar al autor de un texto manuscrito en base a muestras de
escritura previamente recolectadas, para lo que se elabor un formulario desarrollado en el
Centro de Investigacin en Computacin (CIC) del Instituto Politcnico Nacional (IPN), en
el cual se recolectan textos y firmas de varios individuos, a los que llamaremos autores.
El primer punto es encontrar rasgos representativos de la escritura manuscrita que sean
semejantes a los obtenidos por un especialista en el estudio de la escritura, tratando de
ponderar aquellas caractersticas que discriminan ms a un escritor de otro. Es decir, el
anlisis de la imagen no se hace como una textura sino se analiza el texto escrito como
palabras o grafemas (ver Capitulo I.8).
La idea general es no llegar a los niveles ms bajos de anlisis de escritura que son hechos
con trazos o caracteres, sino hacer una clasificacin como mnimo segn las palabras o
secciones de ellas. Tambin se pretende dar robustez a los procedimientos en la interfaz
desarrollada para que no importe el texto que se escriba o que sea necesario repetir muchas
veces un mismo prrafo para poder clasificar, ya que se elegirn las palabras de manera
aleatoria, caracterstica que no muchos sistemas implementan.
Otro punto importante es el uso del Enfoque Lgico-Combinatorio del Reconocimiento de
Patrones para encontrar la importancia de las caractersticas obtenidas, as como facilitar la
clasificacin de las muestras ya existentes en la base de datos y de nuevas muestras de
escritura. Adems, la interfaz presentada puede ser utilizada para identificar escrituras an
-
13
sin conocimientos previos de cmo se realiza un anlisis de texto.
I.4.1. ALCANCES Y LIMITACIONES
El desarrollo del proyecto se limita a las muestras de escritura de la base de datos
particularmente desarrollada en el CIC para este propsito. Su elaboracin se llev a cabo
con la informacin recogida con la ayuda de un formulario a llenar por los autores, el cual
se describe en la seccin II.4.1. Para su elaboracin, con el fin de lograr la indispensable
calidad y uniformidad de las muestras, se consideraron las siguientes normas:
1. Todos los textos se escribirn en idioma espaol a menos que se indique lo contrario.
2. La persona escribir sus textos de la forma en que suele escribir, preferiblemente en letra de molde, y usando letras maysculas y minsculas.
3. Se utilizar bolgrafo negro comn que se proporciona al momento de llenar el formulario, junto con una tablilla como apoyo o soporte.
4. La persona deber escribir siempre sin tocar los bordes del marco y sin cruzarse con su propia escritura.
5. No se podr borrar, ni tachar, ni sobrescribir.
6. Todo dato personal y los correspondientes textos manuscritos estarn amparados por la firma autgrafa de la persona.
Las caractersticas de la escritura tienen limitaciones en cmo debe ser presentada la
imagen, es decir, texto negro y fondo blanco, no estar rayada ni fuera de los lmites
establecidos, y preferentemente con los renglones de texto que no se toquen ni se
sobrepongan.
En cuanto a las caractersticas obtenidas de las muestras de texto escrito, se usa una
combinacin de las caractersticas convencionales y computacionales (Captulo II.4.1) que
han sido obtenidas para el desarrollo de la tesis.
El formulario se muestra en el Anexo A.
I.5 CONSIDERACIONES GENERALES
La tesis Identificacin del Autor de un Texto Manuscrito tiene restricciones en cuanto a las
muestras de escritura que consideraremos vlidas para analizar, ya que las variaciones que
se pueden hacer al escribir son incontables, por ejemplo, las tachaduras, rayones, escrituras
que fueron alteradas por algn mtodo de la Documentoscopa (Ver Captulo II), el uso de
diferentes tiles de escritura, los diferentes soportes para escribir, etc. Sin embargo, es
posible que se analicen muestras de escritura con un previo procesamiento a la imagen para
posteriormente obtener los rasgos descritos ms adelante en este trabajo.
Tambin es de inters notar que a pesar de que se pide que un texto sea escrito 3 veces, el
anlisis de la escritura no siempre se realiza a las mismas palabras en todos los escritores,
-
14
dando una ventaja con otros mtodos al ser independiente del texto; tampoco se pide para la
clasificacin ni para obtener el peso de informacin que representa cada rasgo, una cantidad
mnima de palabras.
Una consideracin final es recordar que aunque el Reconocimiento ptico de Caracteres
(OCR) ha sido muy estudiado, es una tarea muy diferente a la de caracterizar una escritura e
incluso identificar su autor, ya que para el OCR generalmente se trabaja con letras del
abecedario por separado mientras que caracterizar una escritura involucra varias
combinaciones de caracteres en forma de palabras. Por ltimo el procesamiento fuera de
lnea (Ver Captulo II) es una tarea esttica que aporta menos informacin que si se utilizan
tabletas digitalizadoras, las cuales facilitan la tarea de caracterizar la escritura de un autor.
I.6 APORTES Y CONTRIBUCIONES
Los aportes principales que se ofrecen son:
1. Se ha creado un nuevo mtodo para obtener rasgos que caractericen la escritura de un
autor, recordando que estas caractersticas, aunque estn enfocadas principalmente a la
escritura en letra de molde, pueden funcionar tambin con letra script.
2. La elaboracin de un formulario en espaol para crear una base de datos con muestras de
escrituras y firmas autgrafas, en la que colaboran poco ms de 50 autores y donde se
pueden encontrar desde el abecedario en letras maysculas y minsculas, hasta prrafos en
ingls y espaol y los nmeros del 0 al 9. Esto hace posible que estas imgenes sean para
uso pblico en la investigacin nacional, especialmente para el Centro de Investigacin en
Computacin.
Tambin se establece una idea de cmo involucrar criterios de comparacin cualitativos y
cuantitativos, para utilizar mtodos del Enfoque Lgico-Combinatorio del Reconocimiento
de Patrones, el que a pesar de ser usado en muchas aplicaciones, se desarrolla poco o de
manera nula para la clasificacin y discriminacin de rasgos en el estudio de la escritura
manuscrita computacionalmente; los clasificadores estadsticos son los que ms
predominan en los problemas relacionados con la identificacin del autor de un texto.
I.7 ANTECEDENTES
Hoy en da la tecnologa ha permitido que muchos de los procedimientos que se hacan
antes manualmente y que consuman mucho tiempo, se puedan realizar de una manera ms
sencilla y rpida con las computadoras. Por ejemplo, el almacenamiento de la informacin
de grandes cantidades de datos en regiones fsicas muy pequeas se puede hacer
digitalmente lo que permite que se transporte de manera ms sencilla, eficiente, con un
menor costo y con gran seguridad. Sin embargo, a pesar de este auge en la informacin
digital, muchos de los documentos cotidianos requieren de la escritura manuscrita y la
obtencin de informacin de una manera tradicional. La gran cantidad de documentos
escritos y los datos que contienen son una fuente importante de consulta para diversas
reas. Para los sistemas judicial y policial, la escritura manuscrita tiene gran relevancia en
la identificacin de documentos de dudoso origen (documentos dubitados), especialmente
desde los puntos de vista de verificacin e identificacin [1].
-
15
En cuanto a los estudios computaciones referentes al reconocimiento de la escritura se
identifican dos reas principales:
Reconocimiento ptico de Caracteres (OCR Optical Character Recognition, en ingles);
Identificacin y verificacin de la escritura.
El reconocimiento ptico de caracteres consiste en que dada una muestra de escritura se
segmenten los caracteres de tal forma que el escrito pueda ser interpretado con algn
dispositivo especfico o con un formato preestablecido. Sin duda alguna, los avances
obtenidos han sido utilizados en varios proyectos comerciales como son el uso de
organizadores personales que convierten las palabras escritas a mano en caracteres de
teclado, TablePC; escneres que permiten identificar los nmeros o unas letras de otras, etc.
En cambio, la identificacin y verificacin de la escritura se ocupa de reconocer al autor de
dicha muestra de escritura, de verificar si la escritura ha sido alterada, de saber si existe ms
de un autor en el texto, comprobar el autor de dicha escritura, conocer si una firma ha sido
falsificada, etc. Trata con procedimientos sobre la escritura de carcter biomtrico, de
criminalidad o psicolgicos, entre otros. Debido a la gran variedad de pruebas y objetivos
que se persiguen al analizar una escritura, los avances en esta rea no cubren las
posibilidades de un estudio nico; por ello, la constante investigacin en este campo ha sido
pauta para muchas variantes de algoritmos para la identificacin y la verificacin. Cabe
mencionar que dichos anlisis dependen mucho de la forma en que se extrae la informacin
inicial. Tanto en el reconocimiento ptico de caracteres como en la verificacin de la
escritura e identificacin de las personas, se contemplan dos tcnicas de captura de datos:
en lnea (on-line) y fuera de lnea (off-line).
I.8 ESTADO DEL ARTE
Los estudios de la escritura en relacin con su identificacin y verificacin por medios
computacionales datan de los aos 1950 hasta la actualidad. Uno de los estudios ms
reconocidos e importantes que se refiere a la escritura de un individuo como una marca
nica de cada persona fue realizado por el Dr. Sargur N. Srihari [2], un distinguido profesor
de la Universidad de Buffalo, director fundador del Centro de Excelencia para el Anlisis y
Reconocimiento de Documentos (CEDAR, del ingls Center of Excellence for Document
Analysis and Recognition). El grupo de trabajo del Dr. Srihari crea una base de datos con
muestras de escritura de aproximadamente 1500 participantes, quienes escriban una carta
en idioma ingls en una hoja en blanco [2], [3]. Reconocen dos tipos de caractersticas:
convencionales y computacionales, de acuerdo a si las mismas son las halladas por los
especialistas o son obtenidas mediante algn algoritmo -por ejemplo, software operando
sobre una imagen escaneada-, respectivamente; se trabaja a nivel de anlisis del documento
completo, prrafo, lnea, palabra y caracteres. Las caractersticas computacionales que
obtiene se consideran dentro de dos grupos: las macro-caractersticas, que operan a nivel
del documento completo, prrafo, rengln o palabra, y las micro-caractersticas, en las que
se trabaja con palabras, caracteres o trazos.
Para su anlisis consideraron 21 caractersticas convencionales, de las que seleccionaron 5
y se desarrollaron 11 macro-caractersticas que las representan; su descripcin puede
-
16
consultarse en [2]. En las micro-caractersticas obtuvieron 3, que son: Gradiente,
Estructura y Concavidad (GSC Gradient Structure - Concavity). Estos rasgos fueron obtenidos en trabajos previos para reconocer cdigos postales [3] [4],. Debido a que la base
de datos contaba con un nmero considerable de muestras en sus experimentos, mencionan
que conforme aumentaba el nmero de participantes, la eficiencia decreca hasta un 78% y
los mejores resultados los obtuvieron al realizar anlisis en caracteres utilizando micro-
caractersticas. Los mejores resultados tienen una exactitud del 96%.
Un algoritmo propuesto por H. E. Said, T. Tan y K. D. Baker [5], [6] para el anlisis de la
informacin fuera de lnea, se basa en caractersticas de textura, es decir, se analiza la
imagen como un todo, de la que obtienen caractersticas independientes del texto y de cmo
est distribuido. Las muestras fueron tomadas de escrituras en hojas blancas y las tcnicas
para analizarlas son los filtros multicanal, las matrices de co-ocurrencia en escala de grises,
(GSCM- Gray Scale Co-occurrence Matrices) y la clasifican mediante distancias
euclidianas ponderadas y con el clasificador de K-Vecinos Prximos (K-Nearest Neighboor). Participaron 10 escritores para un total de 150 muestras de escritura; en los
documentos realizan primero una normalizacin del skew4 o desencuadre y posteriormente
una normalizacin para el espacio entre palabras y renglones, ya que seleccionan porciones
del documento de 128 x 128 pixeles a los cuales les extraen las caractersticas que
desarrollaron. Combinando sus procedimientos, el mejor resultado identifica correctamente
el 96% de los 150 documentos analizados [1], [5].
En [7] E. Zois y V. Anastassopoulos proponen un algoritmo que utiliza proyecciones
horizontales y operadores morfolgicos, as como un anlisis de textura para palabras en
ingls y griego. Las muestras de escritura conforman una base de datos con 50 escritores,
quienes en una hoja blanca de tamao A4 escribieron 45 palabras en ingls y en otra hoja
su equivalente en griego, ya que tratan de demostrar que su mtodo es independiente del
idioma. A grandes rasgos su procesamiento consiste en umbralar las imgenes de las
palabras independientemente con niveles entre 170 y 180; posteriormente hacen un
adelgazamiento de la palabra y una serie de aperturas morfolgicas con diferentes
elementos de estructura para obtener sus caractersticas. Como clasificadores utilizan un
perceptrn multicapa y un clasificador Bayesiano, consiguiendo una exactitud del 95%.
En [1] se describe un sistema que intenta utilizar una combinacin de algunas
caractersticas reconocidas por el Dr. Srihari, pero trabajando con texto independiente al
nivel de carcter. Dicho sistema trabaja con imgenes digitalizadas o fotocopias escaneadas
a 300 ppp - puntos por pulgada (dpi dots per inch); posteriormente se segmentan manualmente los caracteres los cuales son almacenados en una base de datos en la que se
asocian a un usuario registrado en el sistema, ya sea dubitado o indubitado5.
4 Es una falta de alineamiento del documento respecto a cmo fue escaneado. Es una correccin de un
documento o prrafo hacia la horizontal.
5 El usuario indubitado es aquel registrado en la base de datos al que se le asocian diferentes muestras de
letras que son autnticas o verificadas. El usuario dubitado es el que tiene asociadas muestras de un
sospechoso; por tanto, es el individuo que debe ser identificado entre los del grupo de usuarios dubitados de la
base de datos [1].
-
17
Despus de un preprocesamiento para obtener la letra o texto en forma binaria se obtienen
las caractersticas Gradiente, Estructura y Concavidad (GSC) [5], [6] y geomtricas [3];
posteriormente se obtienen caractersticas mediante el uso de la direccin del vector
gradiente [1]. En este procedimiento tienen en cuenta una formulacin tipogrfica, que es
una tcnica forense en el rea de la identificacin criminal, que indica que no todas las
letras son igualmente importantes para la identificacin de un autor. Esta tcnica se aplica
reduciendo el nmero de caracteres y subclases de forma para cada letra, donde la imagen a
clasificar primero se asigna a una subclase de la letra y despus se clasifican segn las
subclases. El mtodo de clasificacin para la identificacin que utiliza el sistema es el
algoritmo del Vecino ms cercano. Los experimentos realizados para este procedimiento
fueron hechos con 1400 muestras de letras y 40 participantes, de los cuales 20 eran
individuos indubitados. Los resultados obtenidos con el sistema favorecen a las
caractersticas de gradiente con 20 individuos, con la que obtuvieron una precisin del
100%, pero al utilizar todas las caractersticas lograron una precisin del 90%.
Otra investigacin la realizaron Ameur Bensefia, Thierry Paquet y Laurent Heutte [8]
quienes hicieron una base de datos en francs en la que colaboraron 88 personas que
copiaron una carta con 107 palabras, adems de probar sus caractersticas con una parte
disponible por Internet (aproximadamente 20%, 150 escritores) de una base de datos IAM
[9]. El procedimiento consiste en segmentar la escritura en grafemas (Graphemes), que son
patrones elementales de la escritura resultado del algoritmo de segmentacin basado en el
anlisis de los contornos superiores de las letras (Ilustracin 1).
Posteriormente se analizan los grafemas obtenidos para identificar las caractersticas
individuales de las letras, se usan combinaciones de grafemas y las caractersticas son
relevantes segn la aparicin en el documento a analizar y su frecuencia de ocurrencia en el
resto de los documentos; con ello obtienen una identificacin del escritor aproximada del
90%.
La tesis de doctorado de Susana Pecharromn [10] describe el procedimiento utilizado para
reconocer a un escritor independientemente del texto mediante caractersticas de textura de
la imagen. Para ello considera tres etapas, una de preprocesamiento, otra de extraccin de
caractersticas y una etapa final para la comparacin de las caractersticas obtenidas con un
modelo, ya sea para identificar o para verificar al autor del escrito. Las caractersticas que
Ilustracin 1: Ejemplo de una posible divisin de una palabra en grafemas.
Contorno superior
Palabra de ejemplo
Grafemas producidos
-
18
toma estn generalmente relacionadas con el contorno de las letras o palabras, el grueso de
los trazos y su amplitud o regularidad.
En la tesis doctoral Aportaciones al Reconocimiento Automtico de Texto manuscrito, de
Moiss Pastor [11], se describen procedimientos que sirven para obtener algunas
caractersticas de una palabra tales como su inclinacin, su orientacin en relacin a los
ejes vertical y horizontal, etc.; aunque la tesis est orientada al OCR, el preprocesamiento
de la imagen y la obtencin de caractersticas del escrito est muy relacionada con el
anlisis de la escritura de forma grafolgica.
I.9 ORGANIZACIN DE LA TESIS
La presente tesis consta de 5 captulos. El Captulo 1 contiene la descripcin del problema,
el objetivo general y los objetivos especficos del trabajo, la justificacin de la
investigacin, el alcance y las limitaciones, las consideraciones generales tenidas en cuenta
para su desarrollo, los aportes y contribuciones y brevemente los antecedentes y el estado
del arte del tema particular. El Captulo 2 engloba dos secciones, en una de ellas se
presentan los conceptos ms importantes sobre la escritura manuscrita y algunas
caractersticas que se obtienen de ella al anlizarlas, mientras que en la siguiente seccin se
habla sobre los mtodos computacionales utilizados para procesar la imagen que contiene la
escritura y clasificarla. En el Captulo 3 se presenta la interfaz desarrollada, as como la
metodologa propuesta para cumplir los objetivos general y particulares del trabajo,
incluyendo las caractersticas obtenidas, una estrategia de decisin y la secuencia del
anlisis completo. Dentro del Captulo 4 se muestran los experimentos y resultados
obtenidos, los problemas encontrados a lo largo de la investigacin y algunas observaciones
generales. Para finalizar, el Captulo 5 muestra las conclusiones, las recomendaciones y los
posibles trabajos futuros que se desprenden del tema tratado.
-
Captulo II
Marco Terico
II. MARCO TERICO
II.1 INTRODUCCIN
En este captulo se presentan los antecedentes sobre el tema a tratar. Se desarrollan dos
secciones, una donde se trata la escritura manuscrita y su estudio y la otra los tpicos
relacionados con la computacin. El primer apartado muestra una idea general de lo que es
la escritura manuscrita, su historia, las disciplinas que la analizan y las caractersticas, ya
sean computacionales o convencionales, que sirven para estudiar una muestra de escritura.
La seccin de Computacin se enfoca en describir los conocimientos y mtodos que se
utilizaron para el desarrollo de la tesis, los cuales involucran el anlisis de imgenes
digitales, la morfologa matemtica y temas sobre el reconocimiento de patrones
principalmente con el enfoque lgico-combinatorio para resolver el problema. Se ofrecen
conceptos y definiciones bsicas que permiten tener una idea general de los conceptos
utilizados para el desarrollo de la tesis.
II.2 CONCEPTOS BSICOS Y DEFINICIONES
Existen muchos conceptos para definir la escritura; sin embargo la gran mayora converge
hacia la idea de que es una representacin del pensamiento mediante signos grficos. Una
definicin ms precisa es la siguiente: Una representacin grfica de una lengua por medio de signos grabados o dibujados sobre un soporte. Del latn scriptura, es el sistema de signos
-
20
o letras empleados para representar las palabras o las ideas trazados en papel u otra
superficie [12]. De aqu podemos desligar el concepto de Soporte que es el material en cuya superficie se plasman los signos [12], por ejemplo, papel, tela, cintas, etc. y se da el
nombre de til de escritura al elemento con el que se escribe.
Cuando se realiza un estudio de la escritura, tambin se consideran los elementos que la
constituyen y a los que se les ha atribuido un nombre especfico, como es el caso de la
rbrica, la firma, el documento, el trazo, el rasgo y la materia escriptoria. Un trazo es cada
una de las partes en que se divide la letra escrita a mano, es decir, son las lneas o rayas
esenciales en una letra, mientras que un rasgo es aquella lnea que no es esencial [13]. La
firma es un conjunto de trazos que identifica a una persona, generalmente acompaado de
la rbrica, que son los rasgos que conforman una figura; por eso sta tambin es conocida
como una firma corta.
Para realizar un anlisis de una escritura manuscrita es necesario hacer mediciones a varios
elementos del grafismo de la persona. Estos elementos conforman dos grupos llamados
elementos formales y elementos estructurales de la escritura (Ilustracin 2).
Los elementos formales son aquellos que constituyen las letras o palabras, como son los
trazos, rayas, lneas, puntos iniciales y finales, etc. Tambin se pueden considerar como
elementos formales las partes de las letras, segn [14], a los valos, que son las partes
centrales cerradas de las letras, las crestas, que son las partes superiores de las letras y los
ejes que son las partes inferiores de las letras, adems de los signos de puntuacin (puntos,
comas, etc.). Un elemento estructural es aquel que describe la escritura, por ejemplo, su
forma, tamao, direccin, orden, etc.; existe una gran cantidad de estos elementos que han
sido estudiados desde hace poco ms de 100 aos sin lograrse llegar a una unificacin de
rasgos por parte de los especialistas.
Para realizar muchas de las mediciones a dichos elementos se necesita de una base en la
escritura, conocida como zonas de la escritura, que corresponden a las partes en que se
divide una palabra al trazarse de forma imaginaria dos lneas horizontales tangentes a las
partes superior e inferior de las letras que no sobresalen, como la a, e, o, u, m, n [15]. Esto
da origen a tres zonas de la escritura que son (Ilustracin 3):
Ilustracin 2: Elementos formales de las letras (Izquierda). Ejemplo de elemento estructural:
(1, 2,4) Cresta. (3) valo inclinacin hacia la derecha. (Derecha)
(5) Ejes (6) Punto Inicial
(7) Punto final
-
21
- Zona Media. Es la parte central de la palabra; abarca completamente las letras minsculas
6 a, c, e, m, n, o, r, s, u, v, w, x. Se puede limitar la zona media tomando
como base el tamao promedio de los valos en la palabra y trazando dos lneas por
la parte superior e inferior.
- Zona Superior. Es la parte en la que se encuentran las crestas de las letras que conforman la palabra.
- Zona Inferior. Haciendo la divisin basada en el cuerpo de las letras, es la parte en la que se encuentran los ejes -o parte inferior- de las letras.
Generalmente las lneas que sirven de base para identificar las zonas de la escritura son
paralelas; sin embargo, no siempre siguen una lnea recta ni son paralelas, ya que en
algunas caractersticas como se ver ms adelante- la informacin sobre la proximidad entre dichas lneas es una medida para conocer la forma de la caja de escritura.
Estos conceptos son bsicos para conocer cmo se conforma la escritura, porque son los
elementos en los que se basan muchos anlisis. Es importante definir a la escritura
manuscrita como aquella escritura hecha a mano y no confundirla con la escritura cursiva o
script ya que estas ltimas son tipos de escritura.
Finalmente, es importante conocer las formas en que se pueden obtener las muestras de
escritura de una persona para ser analizadas por una computadora. Se consideran dos
formas [16]:
- En lnea (on line). La informacin se obtiene directamente con la ayuda de algn dispositivo (como las tabletas digitalizadoras) que presenta la informacin al
momento; los datos obtenidos son considerados como informacin dinmica;
algunos son: presin de la escritura, velocidad de la escritura, nmero de trazos,
puntos inicial y final, etc.
- Fuera de lnea (off line). La informacin no se obtiene directamente, pues se necesita que se escriba en un soporte dado para posteriormente obtener la imagen
por medio de un escner o cmara fotogrfica. Esta informacin es esttica.
Para el desarrollo de nuestro sistema utilizamos la forma fuera de lnea, ya que a partir de
textos escritos en papel y mediante escner, se capturarn las imgenes de las cuales se
obtendrn los rasgos que caractericen al escritor.
6 Hay casos especiales en los que estas letras pueden abarcar otras zonas; por ejemplo, la z y la s pueden escribirse solo en la zona media o tener alguna prolongacin hacia la zona inferior o hacia la zona superior.
Ilustracin 3: Ejemplo de zonas de escritura.
crestas
ejes
-
22
II.3 SECCIN 1: ESCRITURA MANUSCRITA Y SU ESTUDIO
Se le ha dado una gran variedad de usos al estudio de la escritura, lo que ha originado
disciplinas en las que dependiendo de su objetivo se extraen caractersticas de la escritura
con una mayor o menor importancia. A continuacin se describen brevemente algunas
caractersticas que se tratan de simular computacionalmente para el propsito de
identificacin del autor de un texto manuscrito.
II.3.1 ESCRITURA: HISTORIA Y TRASCENDENCIA
Una de las herramientas ms valiosas con las que cuenta el ser humano es la capacidad de
comunicarse. A lo largo del tiempo el poder expresar sus necesidades, pensamientos,
sentimientos, etc., ha provocado que se desarrollen diversas formas de comunicacin tanto
oral como escrita.
Gracias a las aportaciones de diferentes culturas al desarrollo de la escritura, su exactitud es
ms confiable en cuanto a la transmisin y recepcin de la informacin. La invencin y el
desarrollo de la escritura actual se han logrado despus de un proceso llevado a cabo a lo
largo de miles de aos, evolucionando ideogrfica y fonticamente7. Las primeras formas
de representacin grfica son las pinturas rupestres que datan aproximadamente del ao
30,000 a.C.; posteriormente surge el pictograma, que es una representacin grfica
sintetizada de objetos o ideas hechos sobre roca que sirvieron como base para que se
desarrollara el concepto de dar un significado contextual y no solo de objetos aislados, sino
conceptos ms elaborados.
Las siguientes representaciones son grabados en huesos con base en un sistema de
mnemnicos; la primera representacin considerada como escritura es la cuneiforme, que
toma su nombre de los dibujos en forma de cua o triangular que la conformaban, dejando
un poco las formas cilndricas y redondas que predominaban hasta entonces (Ilustracin 4).
7 Ideogrficamente se refiere a la expresin de ideas, mientras que fonticamente es la representacin de sonidos, de
donde se demostr que la escritura ideogrfica es antecesora de la escritura fontica.
Ilustracin 4: Escritura cuneiforme. Tablilla de Ur (2900-2600 a. C.,) (Izquierda). Roca en la que se describe la restauracin de Babilonia, realizada por un rey Asirio (679 a.C.).
-
23
A partir de esta escritura, podemos encontrar como ms representativas la escritura
jeroglfica en Egipto, la escritura del Valle del Indo y la escritura fenicia; aproximadamente
en 1500 a.C. la escritura en China; en el ao 800 a.C. el alfabeto griego; cerca del ao 80
d.C. se inicia la escritura Maya, aunque debido a la destruccin que sufrieron varios de sus
escritos y cdices se cree que pueden ser ms antiguos [1] y en 1400 d.C. la escritura azteca
(Ilustracin 5). De las bastas culturas a lo largo del tiempo surgieron diversas formas de
comunicacin escrita y alfabetos que han permitido que la escritura, como la conocemos
hoy en da, abarque aspectos para seguir desarrollndose y que los datos se transmitan
perdurando ms tiempo y con mayor fiabilidad.
Hoy en da, a pesar del auge que han tomado los documentos electrnicos, no podemos
decir que sustituirn completamente a la escritura manuscrita; sin embargo, permiten que se
adopten nuevas formas para que la escritura sea interpretada y almacenada por medios
automticos.
II.3.2 DISCIPLINAS RELACIONADAS CON LA ESCRITURA
La escritura es una marca individual. Ninguna persona puede suplantar la escritura de otro
individuo. Es posible que exista una gran similitud a simple vista, pero los rasgos que
caracterizan al escritor siempre estn incorporados involuntariamente en la escritura. Un
anlisis completo y correcto permite obtener muchas caractersticas que diferencian la
escritura, incluso de la misma persona, a lo largo de su vida o por alguna enfermedad grave.
El inters por conocer al hombre a travs de su escritura ha dado origen a muchas
disciplinas que se encargan de estudiarla con fines especficos; sin embargo, no existe
formalmente un nombre para el estudio general de la escritura. El primer nombre dado al
estudio de la escritura fue el de Grafologa, con el fin de hacer un anlisis psquico del
autor; este trmino es el que muchos especialistas consideran el ms adecuado para
designar el estudio de la escritura, pero no enfocado solo en el estudio psquico del autor,
sino como una idea que englobe todos los anlisis. Actualmente, debido a la gran cantidad
de disciplinas con que se relaciona, el trmino grafologa se considera como el de una rama
de dicho estudio, dando lugar al concepto genrico de Grafotecnia como la disciplina
general que estudia la escritura.
Algunos ejemplos de las disciplinas relacionadas con la escritura son:
Grafologa
Tambin conocida como grafosicologa, es la disciplina que estudia la personalidad
Ilustracin 5: Lnea del tiempo representativa de la escritura.
-
24
del individuo a travs del examen de la escritura.
Grafofisiologa
Relaciona la escritura con la finalidad de tener un conocimiento de aspectos
fisiolgicos del autor del escrito.
Grafotcnica
Disciplina orientada a la investigacin del origen o procedencia de los documentos
sobre los que se realiza un anlisis, as como de su constitucin y/o naturaleza.
Grafopatologa
Mediante el estudio de la escritura de una persona, se pretende detectar signos que
preceden a alguna enfermedad, as como signos clnicos o alteraciones somticas.
Grafoterapia
Tcnica teraputica que tiene la finalidad de corregir la conducta y personalidad por
medio de una re-educacin escritural.
Grafoscopa
Disciplina que analiza la escritura y la firma para identificar su origen.
Grafometra
Agrupa las tcnicas con las que se hacen mediciones a una escritura manuscrita,
firma o trazo, para determinar su autenticidad, correspondencia, falsedad, entre
otros aspectos.
Documentoscopa
Disciplina que se encarga del estudio de los documentos para determinar su
autenticidad, falsedad o alteracin.
Caligrafa
Disciplina que se encarga de estudiar la forma de hacer bella la escritura.
Las disciplinas mencionadas no son las nicas que estudian la escritura, ya que muchos de
estos trminos son agrupados, tomados como sinnimos, o subdivididos de otros de
acuerdo al anlisis de las caractersticas que se haga. Estas disciplinas actualmente estn
tomando fuerza y credibilidad, pero no son consideradas como ciencias debido a la falta de
unificacin de tcnicas y de definiciones exactas sobre la escritura y sus elementos. Para
fines de investigacin y cientficos hay principalmente dos disciplinas ampliamente
reconocidas: la Documentoscopa y la Grafoscopa.
II.3.3 DOCUMENTOSCOPA Y GRAFOSCOPA
La Documentoscopa, tambin conocida como Documentologa, es una disciplina relativa a la aplicacin prctica y metdica de los conocimientos cientficos, teniendo como
objetivo verificar la autenticidad o determinar la autora de los documentos [12].
No existe una definicin nica para Documentoscopa, pero en general sus definiciones la
-
25
describen como una tcnica que trata de establecer la autenticidad de los escritos y
documentos, tomando en cuenta que no siempre es posible identificar o no al autor del
mismo, en especial por el tipo de anlisis que se realice y por el soporte con el que se
trabaja. A pesar de que no siempre es posible tener una respuesta a si se trata de un
documento autntico o falso, la Documentoscopa crece desarrollando tcnicas para superar
las limitantes de un correcto anlisis y trabajando para estar a la par de las nuevas formas
de tiles de escritura, soportes y formas de almacenamiento.
Existen muchas disciplinas que auxilian a la Documentoscopa, ya que para analizar un
documento se necesitan varias pruebas como son el tipo de soporte o papel utilizado, si se
trata de un documento antiguo, anlisis para conocer la tinta utilizada en el documento, si
se trata de verificar si es falso o si adems de eso se desea identificar al autor de un escrito,
pruebas para identificar mltiples autores en un mismo documento, anlisis para validar
sellos, firmas, escrituras, hologramas, etc.; en realidad existe una gran combinacin de
pruebas que dependen completamente del documento y del objetivo de su estudio, para lo
que se valen de otras disciplinas que estudian la escritura. Unas de las herramientas ms
importantes para identificar al autor de una escritura son la Grafoscopa y la Grafometra;
la primera es una disciplina encargada de analizar la escritura y firma para identificar su
origen, mientras que la Grafometra se encarga de agrupar las tcnicas con las que se hacen
mediciones a una escritura manuscrita, firma o trazo, para determinar su autenticidad,
correspondencia o falsedad. Estas disciplinas son indispensables para un buen anlisis
forense, razn por la cual su estudio va en aumento.
Algunas de las medidas realizadas por la grafoscopa y la grafometra son [13]:
1. Relaciones entre letras. Son las medidas de la altura media de los trazos de una palabra.
2. Forma de la caja del rengln. La caja del rengln es el rectngulo que engloba a una palabra y su forma es una de las medidas esenciales para reconocer a un
autor. La caja del regln puede tener forma paralela, convergente o divergente8.
3. Valores angulares. Son las medidas correspondientes a la inclinacin de la escritura, ya sea de palabras, caracteres o trazos.
4. Medidas correspondientes a signos de puntuacin. Como ejemplo de medida est la altura del signo de puntuacin en relacin con la base de la caja del
rengln.
5. ndices diametrales. Son las medidas correspondientes a los dimetros mayor y menor de un valo.
II.3.4 REAS DE ESTUDIO Y APLICACIONES
Para la biometra, la escritura manuscrita es una caracterstica dinmica [17] que ha tomado
fuerza en combinacin con otras tcnicas biomtricas; la criminalstica, por su parte, ha
8 A la caja del rengln tambin se le conoce como caja de escritura. Las comparaciones realizadas en varias muestras de escritura de una persona se hacen con palabras de igual nmero de trazos.
-
26
desarrollado inters en el rea, dando importancia a la informacin forense que puede
presentar el anlisis tanto de una escritura como de una firma; la psicologa toma entre sus
anlisis las muestras de dibujos, trazos, escritura y firma, entre otros aspectos, para conocer
rasgos sobre la conducta de la persona, etc. Estas ciencias, entre otras, se valen
principalmente de disciplinas especializadas en la escritura, tales como la Grafologa, la
Documentoscopa y la Grafoscopa.
Los campos o reas de aplicacin estn relacionados directamente con el propsito del
anlisis, el soporte, el til de escritura, los medios y mtodos utilizados para su revisin,
etc., dando origen a clasificaciones en mbitos de actuacin diferentes (Tabla 1). Una de las
clasificaciones ms importante de los documentos se da de acuerdo al tipo y a la
informacin que se desea analizar [18].
Clasificacin Descripcin Ejemplos Observaciones
Documentos
manuscritos
Se integra el estudio de textos
y firmas. Existe gran variedad
en los documentos.
El objetivo del estudio es
validar lo escrito en el
documento; por ejemplo el
conocer si debe o no
cumplirse un testamento,
segn que el resultado del
estudio lo tome como
autntico o falso.
- Firmas en escritura notarial
- Annimos con amenazas
- Firmas en letras de cambio
- Textos en recetas mdicas
Documentos
mercantiles
Estudia las manipulaciones
fraudulentas bajo las que el
documento probablemente ha
sido tratado.
- Cheques bancarios
- Letras de cambio
- Pagars
El documento fue
borrado, aadido,
intercalado, lavado con
productos qumicos,
confeccionado
ntegramente, etc.
Documentos
de Identidad o
Identificacin
Se identifica su autenticidad
parcial o total, ya sea de la
informacin contenida en l
como de la autenticidad del
soporte o documento.
- Pasaportes
- Actas de nacimiento
- Ttulos de viaje
Cambios de fechas,
fotografas, materiales
del soporte,
estampados, etc.
-
27
Tabla 1. Clasificacin del documento, segn su anlisis y propsito de estudio.
Un ejemplo del uso de la documentoscopa es el que le da la criminalstica, pues como
disciplina aplica tcnicas y conocimientos cientficos para investigar hechos de inters
indagatorio policial [18], hasta el punto de que las herramientas que le ofrece la
documentoscopa a la criminalstica dan lugar a una de las subdivisiones de estudio. El
campo de estudio y de aplicacin que tiene la escritura manuscrita es muy amplio, pero
debido a la informalidad en muchas de estas reas, no est muy difundido su conocimiento;
sin embargo, con el paso del tiempo la aceptacin de varios estudios y su crtica han
permitido que tengan mayor aceptacin en reas tales como la psicologa y la medicina.
II.3.5 CARACTERSTICAS DE LA ESCRITURA MANUSCRITA
Como ya se mencion, la escritura se puede estudiar sobre la base de sus elementos, ya
sean formales o estructurales. Cada uno de estos elementos en dependencia del objetivo del
estudio, puede tener un significado diferente segn la disciplina que se encarga del anlisis.
Varios especialistas que no estn de acuerdo unos con otros, han creado clasificaciones
diferentes -de los elementos estructurales principalmente- para englobar las caractersticas
representativas de la escritura de una persona.
Una de las primeras clasificaciones y que ha sido base para otras, se debe a Jules Crepieux-
Jamin (1859-1940) [14], quien es considerado el padre de la grafologa cientfica. Entre sus
aportaciones estn Las siete leyes de Crepieux-Jamin, donde engloba las caractersticas principales que existen en toda escritura en 7 gneros o especies. Sin embargo, no todos los
especialistas toman en cuenta estas caractersticas. Por ejemplo, la Tabla 2 muestra tres
clasificaciones adems de la hecha por Crepieux-Jamin, creadas por Flix Del Val Latierro
[15], por la grafloga cientfica Susana Tesouro [17] y por el Licenciado en Criminalstica
Carlos A. Guzmn [19].
Documentos
con textos
realizados por procedimientos mecnicos
Se estudia el texto elaborado
por medios tales como
mquinas de escribir,
impresoras, procedimientos de
artes grficas, etc.
No siempre es posible
superar las dificultades
encontradas debido a la
tecnologa empleada en
las mismas; se necesita
una gran precisin.
Tarjetas de
crdito,
billetes de
banco,
permisos de
conducir,
cupones y
otros
El estudio principal es la
autenticidad del soporte, como
en el caso del papel moneda.
- Billetes falsos
-
28
Crepieux-Jamin Val Latierro Tesouro Guzmn
1 Orden Angulosidad Orden Gesto Grfico
2 Tamao Dimensin Dimensin Velocidad
3 Forma Direccin y forma Forma Ritmo
4 Direccin Enlaces Inclinacin Presin
5 Presin Inclinacin Direccin Proporcionalidad
6 Velocidad Presin Velocidad Continuidad
7 Continuidad Rapidez Continuidad Orden y Regularidad
8 - Proporcionalidad Presin Angulosidad
9 - Orden, regularidad - Dimensin
10 - Continuidad - Inclinacin
11 - - - Direccin
12 - - - Enlace
Tabla 2: Clasificacin para la interpretacin grafolgica. Estructura de los grafismos.
Actualmente esta clasificacin ha cambiado. En el libro El ABC de la Grafologa [20], [21] se considera una clasificacin de 12 elementos generales: movimiento, forma, presin,
espacio, tamao, inclinacin, direccin de las lneas, orientacin, regularidad, firmeza,
conexin y apertura. A continuacin se describen, de entre ellas, las caractersticas que
consideramos como las ms representativas.
Orden o Regularidad. Se refiere a la distribucin y organizacin entre letras, palabras, lneas de texto, prrafos y mrgenes del texto. Es una evaluacin de la
claridad de la escritura, de su legibilidad y su regularidad en el texto (Ilustracin 6).
Ilustracin 6: El orden que sigue el texto superior se puede considerar como legible y regular, mientras que el texto inferior no es tan claro para su lectura y tiene mucha
irregularidad en la posicin de las palabras.
-
29
Tamao o Dimensin. Se considera como tal la amplitud de la escritura, o el espacio que ocupan las letras en las palabras, o las palabras en un rengln (Ilustracin
8). Se basa en las zonas de la escritura, en el tamao de los valos de las letras (letra
pequea menor a 2.5mm, letra mediana de 2.6 a 3.0mm, letra grande de 3.1 a
5.0mm), en el tamao de las maysculas, etc., y dependiendo del experto, pueden
tomarse una o varias medidas. Dentro de este rasgo se considera si el texto ha sido
escrito solo con letras maysculas o no (Ilustracin 7). Se pueden hacer observaciones
si en la escritura de un rengln o de una palabra hay variaciones en el tamao de las
letras, lo que da origen a diferentes subclases. Para mayor informacin [22].
Proporcionalidad. Este elemento puede ser considerado como un subconjunto de las medidas obtenidas en la caracterstica Dimensin. No obstante, esta propiedad
puede basarse en las proporciones de las zonas superior e inferior de la escritura con
respecto a la zona central; la proporcin de los mrgenes de una hoja hacia el texto
que contiene (Ilustracin 10); el espacio total que ocupa un texto en relacin con el
espacio que se tiene para escribirlo; proporciones entre las partes de las letras
(Ilustracin 9), etc.
Ilustracin 8: El tamao del texto superior es mayor al inferior y se aprecia fcilmente pues a
pesar de ser el mismo texto, la escritura superior ocupa ms espacio.
Ilustracin 7: La misma palabra escrita por 3 personas diferentes. (De izquierda a derecha)
palabra escrita con mayscula, palabra con dimensin sobrealzada debido al tamao de sus crestas,
palabra con dimensin rebajada, con crestas pequeas en relacin al cuerpo de la letra.
Ilustracin 9: La proporcionalidad puede referirse a la forma de los valos de las letras.
-
30
Ilustracin 11: La forma de la letra superior es como hilo, en el texto central
predominan las formas curvas, mientras que en el texto inferior la forma es
adornada principalmente en las letras maysculas.
Forma. Hace alusin al tipo de la escritura. Existen diversas subdivisiones que se agrupan de acuerdo a los rasgos que presentan las letras: si son angulosos, curvos,
tipogrficos, complicados (Ilustracin 11). Para conocer algunas formas de escritura
referirse a [22].
Angulosidad. Esta caracterstica de la escritura puede ser una subdivisin del elemento estructural Forma; sin embargo, depende mucho de los rasgos que se
evalan en este ltimo. La angulosidad estudia la forma que tienen las letras, el
Ilustracin 10: Posible clasificacin de la proporcin del margen superior de la hoja con respecto al comienzo del texto (Arriba). (Abajo), de derecha a izquierda: margen ausente,
margen normal, margen grande.
-
31
Ilustracin 13: Direccin descendente. Las lneas punteadas son horizontales, mientras que las
lneas continuas muestran la direccin que sigue la escritura, donde se observa que llegan ms
abajo del rengln.
predominio de curvas o ngulos, las terminaciones de las letras, las aperturas en las
curvas de los trazos, etc. (Ilustracin 12).
Direccin. Su estudio depende de la trayectoria de las lneas de un escrito. Algunos autores toman como base la direccin de la caja de la escritura, otros una lnea
imaginaria horizontal (Ilustracin 13). Es importante notar que algunas veces el
elemento estructural Inclinacin no se considera como una caracterstica separada y
por lo tanto, puede incluirse en esta categora la medicin individual hecha de la
direccin de las letras respecto a la vertical. Existen diversas clasificaciones para la
direccin de una palabra, lnea de rengln o texto (Ilustracin 14). Para ms
informacin referirse a [17] y [22].
Inclinacin. Es el ngulo al que tiende la escritura en una palabra, lnea o prrafo; generalmente se consideran inclinaciones a la derecha o izquierda y rangos entre
stas (Ilustracin 15). La forma ms comn de medirla es con relacin al eje
transversal de la letra, siguiendo la direccin de la misma con una lnea base.
Ilustracin 12: La letras L, I, T, muestran formas triangulares
Ilustracin 14: Ejemplo de direccin sinuosa o serpentina, que es la escritura con ondulaciones en la caja de escritura.
-
32
Continuidad o enlaces. Es la particularidad en las letras o palabras cuando se unen por algn trazo o simplemente la ausencia de ste. Estudiando la forma de los
enlaces se pueden crear categoras desde ligada a desligada, o considerar el tamao
de las separaciones entre letras y palabras como un rasgo caracterstico (Ilustracin
16).
Velocidad. Esta propiedad es el grado de rapidez con que se escribe. Una velocidad rpida se estima cuando se escriben entre 130 y 200 letras por minuto; una
velocidad media es entre 100 y 130 letras por minuto; cuando se escriben menos de
100 letras por minuto podemos decir que es una escritura lenta. Esta propiedad de la
escritura generalmente es considerada como una caracterstica dinmica, pues es
muy representativa para cuando se hace una captura de informacin en lnea; no
obstante, cuando la informacin es fuera de lnea, estudiando los trazos de las letras,
sus direcciones y puntos iniciales y finales, es posible identificar si la persona
escribi con mayor o menor rapidez.
Ilustracin 15: La escritura superior tiene una inclinacin hacia la derecha, mientras que la escritura inferior casi es vertical.
Ilustracin 16: La escritura superior tiene una separacin pequea entre letras y una
separacin mayor entre palabras. La escritura del centro tiene algunos enlaces entre
letras. El texto inferior tiene una separacin casi igual entre palabras y entre letras.
-
33
Espacios y cortes. La separacin existente entre letras, palabras o lneas de escritura son consideradas como espacios y los cortes son los trazos involucrados
en un mismo signo, letra o palabra (Ilustracin 16). Las posibles mediciones de estas
separaciones pueden dar un ndice o rango de medidas para identificar un escritor de
otro.
II.4 SECCIN 2: COMPUTACIN
Dentro de esta seccin se describe el formulario diseado para capturar las muestras de
escritura que se analizan con las caractersticas desarrolladas en el Capitulo III.2; tambin
se describe someramente las herramientas que se utilizan para el preprocesamiento de la
imagen, es decir, operaciones de procesamiento de imgenes digitales y morfologa
matemtica.
Tambin se hace referencia a los mtodos que se utilizarn para ponderar la importancia de
cada rasgo obtenido y la forma en que se clasificar la muestra de escritura de un autor
desconocido por medio de algoritmos de reconocimiento de patrones con un enfoque
lgico-combinatorio.
II.4.1 MUESTRAS DE ESCRITURA
La obtencin de las muestras de escritura que constituyen los datos se realiz fuera de lnea,
es decir, las imgenes fueron escaneadas a partir de un formulario creado en hojas tamao
carta (21.56 x 27.94cm) de papel bond blanco. El formulario creado consta de 4 pginas;
cada una tiene dos marcas para orientar la orientacin de la hoja, una en la esquina superior
izquierda y otra en la esquina inferior derecha y cuentan con un recuadro para identificar
mediante cdigo binario el nmero de la hoja con la que se trabaja (ver Anexo A).
La primera hoja contiene algunos datos personales del autor de la muestra como son, entre
otros, su nombre completo, dnde puede ser localizado, su nivel de estudios, profesin,
telfonos, etc., y al final un espacio para su firma. Se ha tratado de no capturar datos
personales que puedan comprometer de alguna forma a los autores de la muestra. La
segunda y tercera hojas, adems del nombre de quien llena el formulario, tienen un prrafo
en espaol y otro en ingls, los que deben ser repetidos por el autor de la muestra una vez
en la segunda pgina y dos veces en la tercera; al final de cada hoja hay un recuadro para
plasmar su firma cuatro veces y una vez, respectivamente. Finalmente, en la cuarta pgina
del formulario se encuentran un apartado para escribir el abecedario castellano con letras
minsculas, otro para el abecedario castellano con letras maysculas y los nmeros del 0 al
9; tambin se le pide que escriba de manera rpida una pequea frase; de igual forma al
final de la hoja se pide que firme en un recuadro y se le solicita la autorizacin para utilizar
la informacin proporcionada con fines cientficos.
Todas las hojas del formulario cuentan con un recuadro en el cual se coloc el Nmero de
Registro, el que servir como identificador de cada caso en la base de datos creada y as sea
prctico trabajar con los archivos, ya que en ella se almacenarn las rutas de las imgenes
obtenidas tanto de las originales como de las preprocesadas resultantes, adems de contar
con tablas especficas para guardar los valores de los rasgos extrados de cada escritura.
Este nmero de registro fue dado consecutivamente al momento de presentarle el
-
34
formulario a la persona que lo habra de llenar. Las restricciones o requerimientos mnimos
para el formulario se describieron en la seccin I.4.1 de la tesis y las hojas de los
formularios se encuentran en el Anexo A.
II.4.2 ANLISIS DE IMGENES Y MORFOLOGA MATEMTICA
Los procedimientos utilizados en el anlisis de imgenes nos permiten, entre otras cosas,
mejorar adecuadamente las imgenes de los textos para que la extraccin de sus
caractersticas sea ms confiable y robusta. El preprocesamiento es una de las etapas
importantes, ya que mientras ms claro y mejor limitado sean los caracteres escritos, la
extraccin de los rasgos globales de la escritura ser mejor y ms confiable. Los mtodos
de preprocesamiento dependen del sistema en general a utilizar y de la entrada de la
informacin disponible [11]. Para la etapa de preprocesamiento se utiliza principalmente el
umbralado (thresholding) de la imagen digital de entrada, filtros de mediana y de rango, el
uso de proyecciones horizontal y vertical, dilataciones y erosiones con elementos de
estructura cuadrados y rectilneos rotados, aperturas y clausuras, reconstrucciones
geodsicas, etc. Para encontrar una descripcin de estos procedimientos y muchos ms,
debe referirse a [8], [11], [23].
II.4.3 RECONOCIMIENTO DE PATRONES: ENFOQUE LGICO-COMBINATORIO
El reconocimiento de patrones es una disciplina cientfica que inicia formalmente a finales
de los aos 50 y se ocupa de resolver problemas relacionados con la clasificacin de
objetos y con la determinacin de los factores que inciden en los mismos [24], [25]. Los
procesos de clasificacin de objetos se realiza en base a semejanza y diferencias, con un
principio general: los objetos que son semejantes deben pertenecer a una misma clase o categora, mientas que objetos diferentes pertenecern a clases distintas
9. Podemos considerar 4 tipos de problemas de clasificacin: la Seleccin de Variables (que se usa
principalmente para reducir los trminos en los que se describe un objeto y para conocer
qu rasgos discriminan ms); la Clasificacin Supervisada (con objetos en todas las clases
creadas, con aprendizaje), la Clasificacin no Supervisada (no se conocen las clases en el
universo ni cmo se agrupan los objetos, sin aprendizaje) y la Clasificacin Parcialmente
Supervisada (con objetos clasificados en algunas clases, al menos una clase no tiene
objetos, con aprendizaje parcial). Para tener un concepto ms general y ejemplos revisar
[24].
Dentro del reconocimiento de patrones existen varios enfoques que tratan a los problemas
segn la forma en que se pueden representar los objetos y los objetivos que se persiguen.
Dentro de los enfoques ms conocidos se encuentran: Enfoque Mtrico (Clustering),
Estadstico, Sintctico, Neuronal, Lgico-Combinatorio [24], [26]. Para nuestro caso el
modelo Lgico-Combinatorio nos ofrece la posibilidad de modelar el problema lo ms
cercano a la realidad y nos permite utilizar variables cuantitativas y cualitativas mezcladas
9 Objeto es un concepto con el cual se representa a los elementos en estudio. Clase es un conjunto de objetos,
Patrn es usado como sinnimo de objeto; en ocasiones al patrn se le conoce como un objeto ya clasificado.
-
35
lo que en otros enfoques no siempre es posible. En el enfoque lgico-combinatorio los
patrones que son descripciones de objetos en relacin con variables o rasgos- , pueden contener variables booleanas, variables k-valentes, difusas o lingsticas [25]. Cuando se
intenta clasificar un objeto nos enfrentamos principalmente a dos fases una de ellas es la
seleccin de variables y la otra es la clasificacin. A continuacin se menciona brevemente
lo que se utilizar para estas dos fases en el desarrollo de la tesis.
Cuando existe una gran cantidad de rasgos y una gran cantidad de objetos la clasificacin
puede no ser sencilla; sin embargo, es posible hacer uso de la Teora de Testores10
, que nos
permite conocer qu rasgos discriminan ms a los objetos que otros y usar subconjuntos de
rasgos que son ms apropiados para el problema de la clasificacin al reducir su espacio de
representacin.
Sea Tm,n,k un cubrimiento11
con m objetos, n rasgos y k clases, donde cada objeto O1,Om se describen en trminos de los rasgos R = {r1,rn}, un patrn o descripcin de objetos ser la n-tupla X(Oi) = (r1(Oi), rn(On)); para facilitar la representacin se utiliza una matriz de aprendizaje o de descripcin M tal que cada fila representa un objeto del
cubrimiento y las columnas los rasgos o variables; adems esta dividida en k clases. Los
testores clsicos o testores de Zhuravlv son un subconjunto de rasgos {ri-1,ri-s} de T si y solo si al remover de las descripciones de objetos todos los rasgos (remover las columnas
de M) excepto los de , no resultan subdescripciones de objetos idnticas en clases distintas, es decir, no hay confusin entre los objetos (entre filas de la matriz M). Para ms
informacin consultar [24], [25], [26], [27], [28]. Cuando en un testor ningn subconjunto
de rasgos es un testor se le llama testor tpico, irreducible o primo. Algunos algoritmos
para obtener los testores de M son: algoritmos BT y TB [26], algoritmo LEX [29],
algoritmo CC [25], etc. Para el caso de la presente tesis se trabaja con testores de
Zhuravlv; sin embargo existen extensiones al concepto de testor como son los -testores, testores de Goldman, etc., [26], [30]. Describimos brevemente las definiciones y algoritmos
para el clculo de testores usando BT.
Algoritmo BT
Llamamos Lista al nmero binario de r bits (r es el nmero de rasgos) que representa algn
subconjunto R donde R es el conjunto de rasgos para describir un objeto. Tenemos 3 proposiciones:
Proposicin A. Una lista no es una lista testor cuando y solo cuando exista un rengln
a de la matriz bsica tal que AND a = 0.
10 Se desarrolla como un rea independiente a finales de los aos 50; su origen se vincula al utilizar mtodos
lgicos matemticos para localizar desperfectos de circuitos. Los primeros trabajos en esta rama de la Lgica
Matemtica se atribuyen a I. A. Cheguis y S. V. Yablonskii [24], [26]. A mediados de los aos 60, Yuri
Ivanovich Zhuravlev extiende su aplicacin a problemas clsicos del reconocimiento de patrones [25].
11 Tupla conformada por objetos, rasgos, descriptores de clases, relacin de pertenencia y una funcin de
semejanza. Se puede tener interseccin no vaca entre las clases.
-
36
Proposicin B. Si la lista y el rengln a cumplen la proposicin A se construye de la siguiente forma: Sea k el ndice del ltimo 1 en , = 1, 2, r donde cada
. Las listas que se encuentran entre y - 1 no son listas testor.
Proposicin C. Si es una lista testor y k el subndice de su ltimo 1, entonces las siguientes 2
r-k-1 listas son listas testor pero no tpicas.
Algoritmo:
1. Calcular la matriz de diferencias y su matriz bsica12.
2. Generar la primera lista a probar ( = 1).
3. Averiguar si es lista testor aplicando la propiedad A.
4. Si no es lista testor aplicar la propiedad B.
Si es lista testor aplicar la propiedad C.
5. Regresar al paso 3 hasta que = 2r-1 (se terminen con las listas)
6. Seleccionar los testores tpicos.
Para mayor informacin consultar: [24], [26], [31], [32]
Para la fase de clasificacin, ya que se tiene reducido el espacio de representacin de los
objetos, se utilizan algoritmos como el Kora- y Conjuntos Representantes [24], [27] que se describen a continuacin.
Algoritmo Kora-
Es una extensin del algoritmo Kora-3 que fue desarrollado por el grupo de Bongard para
solucionar problemas de Geologa en los aos 60. Este algoritmo se introduce en 1998
llamado Fuzzy Kora-Omega Algorithm [33], [34] y permite usar subconjuntos de diferente
cardinalidad a diferencia de Kora-3 que utiliza solo subconjuntos de 3 elementos; define un
tipo de rasgo llamado complejo y se necesita de umbrales para caracterizar a los objetos de
las clase; permite trabajar con problemas de ms de dos clases; para crear una regla de
solucin se pueden ponderar los rasgos de acuerdo a las variables involucradas y a los
objetos que cubre.
Antes de escribir el algoritmo se necesitan algunos conceptos clave. Sea un subconjunto de
s rasgos = {r1, r2,, rs}; un Rasgo Complejo es un conjunto de valores para esos rasgos (a1,a2, ,as). Un Rasgo Complejo Caracterstico es un rasgo complejo si aparece al menos
U1 veces en la clase Ki y U1 veces como mximo en las otras clases. Se dice que un objeto
en una clase est cubierto por un rasgo complejo caracterstico si y solo si satisface la
12 Para conocer como se obtienen tanto la matriz de diferencia como la matriz bsica referirse al Capitulo 1.5
de [24].
-
37
condicin del mismo. El Resto de una clase con respecto a un rasgo complejo caracterstico
es el conjunto de objetos que no fueron cubiertos por ese rasgo; finalmente un Rasgo
Complejo Complementario de una clase es un rasgo complejo que ocurre U2 veces en el
resto de la clase y U2 veces como mximo entre los objetos de clases distintas.
Algoritmo:
1. Determinar los conjuntos de apoyo.
2. Determinar los umbrales necesarios para distinguir los rasgos complejos caractersticos y complementarios.
3. Calcular los rasgos complejos complementarios de cada clase usando los criterios de comparacin definidos por cada rasgo.
4. Determinar los restos de cada clase.
5. Calcular los rasgos complejos complementarios en cada clase usando los criterios de comparacin para cada rasgo.
6. Determinar los rasgos complejos caractersticos y complementarios que satisface cada patrn a clasificar.
7. Aplicar la regla de solucin creada segn los objetos cubiertos o la importancia de cada rasgo.
Puede encontrar ms informacin en [24], [26], [27], [34].
Conjuntos Representantes
Este algoritmo es una idea desarrollada por Baskakova y Zhuravlv en la cual se trata de
evaluar la informacin a favor y en contra de los objetos en las clases; para esto definen los
Representantes Positivos, Negativos y Neutros de las clases. La idea principal es que para
una clase en particular, una combinacin de caractersticas o rangos en valores puede tener
informacin suficiente para caracterizar a esa clase [28].
Las definiciones para trabajar con este algoritmo son muy similares a las expuestas en el
algoritmo Kora-. Los rasgos complejos caractersticos de una clase Ki los tomaremos ahora como Representantes Positivos S
+ de Ki; los Representantes Negativos S
- son
aquellos rasgos que cumple el umbral establecido para los rasgos complejos caractersticos,
pero en otras clases y no en la clase actual, mientras que los Representantes Neutros S0 son
aquellos que no caracterizan ni ms ni menos a la clase.
La regla de solucin propuesta para este algoritmo consiste en hacer una votacin
dependiendo del conjunto de representantes encontrados para cada clase y del conjunto de
apoyo (seleccin de variables). Tomemos S+ como el conjunto de representantes positivos
de una clase que cumple el patrn Pi y de igual manera tomemos a S- y S
0 como los
conjuntos representantes negativos y neutros respectivamente. Al clasificar al patrn se
calcula para cada clase y para cada conjunto de apoyo:
-
38
donde cj es el conjunto de apoyo actual; finalmente se da la pertenencia del patrn a la clase
Ki si los valores son positivos o negativos o se crea una nueva clase si no cumple con
ninguno de los representantes elegidos.
Algoritmo:
1. Seleccionar los conjuntos de apoyo (seleccin de variables);
2. Seleccionar el umbral U1;
3. Para cada clase calcular los representantes positivos, negativos y neutros (S+, S-, S0);
4. Para cada patrn a clasificar determinar los conjuntos que cumplen en cada clase;
5. Calcular la votacin para cada clase de cada patrn a clasificar considerando los representantes positivos al conteo de S
+ y los representantes negativos al conteo de
S+;
6. Aplicar la regla de solucin usando las votaciones obtenidas en el paso anterior.
Para mayor informacin revisar: [24], [27], [28].
-
Captulo III Metodologa Propuesta
III. METODOLOGA PROPUESTA
III.1 INTRODUCCIN
A continuacin se presenta el procedimiento que se utiliz para hacer el preprocesamiento a
la imagen de texto manuscrito extrada del formulario, se describe la interfaz utilizada para
el desarrollo de la tesis, la forma en que se extraen sus caractersticas y como son
calculados estos rasgos para posteriormente aplicar los algoritmos del Enfoque Lgico-
Combinatorio que nos permitan conocer la importancia de un rasgo sobre otros y as
obtener las reglas de solucin para clasificar las muestras de escritura contenidas o no en la
base de datos.
III.2 CARACTERSTICAS REPRESENTATIVAS
Principalmente existen dos formas de tratar la imagen cuando se trata de obtener las
caractersticas de una imagen de texto manuscrito. Una de ellas consiste en trabajar con la
imagen como un todo y hacer un anlisis de textura, es decir, no importa cmo se presente
la ubicacin de las palabras o letras. La otra forma es extraer caractersticas del texto en la
imagen; en este caso la ubicacin de las letras, palabras o prrafos son una fuente de
informacin para extraer otros rasgos. Algunos ejemplos de investigaciones realizadas
trabajando con texturas son [5], [6], [7], [10], mientras que ejemplos de investigaciones
usando caractersticas del texto son [1], [2], [8]; es importante marcar esta diferencia ya que
-
40
la presente tesis corresponde al segundo grupo pues se extraen caractersticas del texto ya
sea usando palabras o grafemas. Una ventaja del sistema creado es que el nivel ms bajo de
anlisis de texto se hace a las palabras y no se trabaja con caracteres; adems, cabe resaltar
que no importa si se hace una divisin exacta de la palabra en relacin al texto, las
caractersticas del texto; se pueden obtener tanto a palabras como a grafemas de ellas, sin
que se alteren drsticamente los rasgos.
Dentro del sistema se pueden considerar 3 fases:
Adquisicin de imgenes;
Preprocesamiento y obtencin de rasgos;
Seleccin de variables y clasificacin.
La primera fase consisti en la creacin del formulario para recolectar las muestras de
escritura; la creacin de una base de datos con Borland C++ Builder y MySql 5.0; la
extraccin de las partes del texto que corresponden a las muestras de escritura para
almacenarlas como imgenes independientes; y actualizar la base de datos con la ubicacin
de las nuevas imgenes. Para extraer las secciones de texto de inters se usaron las marcas
creadas en la esquina superior izquierda y en la esquina inferior derecha, se alineaba la hoja
y se recortaba la imagen para tener menos error al extraer el texto.
El preprocesamiento de la imagen est ntimamente ligado al procedimiento que se usa para
obtener las caractersticas de texto que se describirn ms adelante.
Las caractersticas de texto consideradas en nuestro trabajo son las siguientes:
Caractersticas de Prrafo:
1. Distancia del texto a los mrgenes izquierdo y derecho (R1 y R2)
2. Espacio entre renglones sucesivos (R3).
Caractersticas de Direccin y Espacio:
1. Espacio entre palabras (R4)
2. Direccin de la escritura en un rengln (R5).
Caractersticas de la Zona de Escritura:
1. Proporcin de la Zona Superior con relacin a la Zona Media de una palabra (R6)
2. Proporcin de la Zona Inferior con relacin a la Zona Media de una palabra (R7).
Caracterstica de Inclinacin:
1. Principal inclinacin en una palabra (R8).
-
41
Preprocesamiento de la imagen de texto
Una vez que se tenan las secciones de texto como una imagen, se le preproces para
convertirla en una imagen binaria; se trataron dos mtodos diferentes para ello. El primero
consiste en suavizar la imagen en colores con un filtro de media de 3x3, seleccionar el
plano verde de esta imagen y umbralarla usando el mtodo de Otsu. Por otro lado, de la
imagen original en colores se selecciona el plano verde y se umbrala usando el algoritmo de
Khashman y Sekeroglu [35]. La imagen obtenida con Otsu es muy clara y corta algunas
regiones importantes de texto, mientras que la imagen obtenida con el segundo mtodo
tiene mucho ruido; sin embargo, el texto se presenta mucho mejor. Por lo tanto se hace una
reconstruccin geodsica por erosin usando como mscara a la imagen obtenida con el
mtodo de Khashman y como marcadora la imagen obtenida mediante umbralado por Otsu,
logrndose as una imagen binaria con muy poco o ningn ruido y con el texto muy claro.
El segundo mtodo consiste en usar el mtodo de Khashman para obtener el umbral del
plano verde de la imagen original; a la imagen binaria obtenida se le extraen aquellos
objetos que tienen un rea menor que o igual a 20 pixeles y finalmente se hace una
reconstruccin geodsica por erosin para eliminar el borde de la imagen.
Caractersticas de Prrafo
Entre las caractersticas de los prrafos consideramos los espacios a los mrgenes verticales
(derecho e izquierdo) y la separacin entre los renglones del texto; para esto utilizamos la
proyeccin horizontal (PH).
La caracterstica de separacin de la escritura al margen de la hoja se hace despus de
preprocesar la imagen. Ya binaria la imagen, se corta para tener el texto dentro del
rectngulo mnimo que lo contiene, se cuenta el nmero de pixeles que se cortaron con
respecto a la imagen original y se calcula qu porcentaje fue cortado del lado derecho y del
lado izquierdo, obtenindose as una proporcin por cada margen y los dos primeros rasgos
de la escritura R1 y R2.
Para calcular la caracterstica del especio entre renglones sucesivos (R3) se parte de la idea
de tomar la relacin que existe entre las filas de la imagen que corresponden a texto y las
filas de la imagen que corresponden a los espacios entre renglones. Para esta caracterstica
se usa la imagen binaria ya preprocesada del texto y se le rellenan los huecos existentes
entre letras o trazos, para que a esta ultima imagen se le calcule la Proyeccin Horizontal
(PH) de la
Se necesita calcular un limite G para contar los espacios entre letras y palabras, este limite
es igual al 25% de la mxima frecuencia en la PH, en la Ilustracin 17 se puede observar
este limite como una lnea roja, el eje X en el grfico corresponde al numero de fila de la
imagen, mientras que el eje Y representa la frecuencia de pixeles con nivel cero en cada
fila, esta es la PH de la imagen presentada en la misma ilustracin. (Ilustracin 17).
Posteriormente las filas que pertenecen a espacios son aquellas que tienen una frecuencia
en la PH menor que G, en caso contrario una frecuencia mayor- la fila es contabilizada como fila de rengln. Con esto se obtiene una serie de valores que nombraremos (ER) para
todas aquellas filas que pertenecen a lo ancho del texto o rengln y los valores (EE)
-
42
corresponden a las filas que se cuentan como espacios.
El primero y ltimo elemento de EE se quitan de la lista, ya que no estn entre texto
(corresponden al espacio del margen superior y margen inferior). Posteriormente se calcula
el promedio (P) y la desviacin estndar (S) a ambas lis