inv-identificacion del autor de un texto manuscrito-ipn

62
INSTITUTO POLITÉCNICO NACIONAL Centro de Investigación en Computación IDENTIFICACIÓN DEL AUTOR DE UN TEXTO MANUSCRITO T E S I S Que para obtener el grado de: Maestro en Ciencias de la Computación P r e s e n t a: Edith Cristina Herrera Luna Director de Tesis: Dr. Edgardo Manuel Felipe Riverón México, D. F. Diciembre de 2008

Upload: capsqro

Post on 24-Nov-2015

39 views

Category:

Documents


13 download

TRANSCRIPT

  • INSTITUTO POLITCNICO NACIONAL

    Centro de Investigacin en Computacin

    IDENTIFICACIN DEL AUTOR

    DE UN TEXTO MANUSCRITO

    T E S I S

    Que para obtener el grado de:

    Maestro en Ciencias de la Computacin

    P r e s e n t a:

    Edith Cristina Herrera Luna

    Director de Tesis:

    Dr. Edgardo Manuel Felipe Rivern

    Mxico, D. F. Diciembre de 2008

  • 2

  • 3

  • 4

    RESUMEN

    El presente trabajo muestra una metodologa para caracterizar la escritura de un individuo

    con rasgos a nivel de prrafo, rengln y palabra, sin llegar a un anlisis exhaustivo a nivel

    de carcter o trazos de la escritura. Usando una base de datos desarrollada

    fundamentalmente para esta Tesis.

    El procedimiento para clasificar una nueva muestra de escritura se basa en algoritmos del

    Enfoque Lgico-Combinatorio, como son el algoritmo BT y Kora- .

  • 5

    ABSTRACT

    This paper shows a methodology to characterize the writing characteristic of an individual

    with a paragraph, line and word level, without reaching a comprehensive analysis at the

    character level or strokes of the writing. Using a database developed fundamentally for this

    Thesis.

    The procedure to classify a new sample of writing is based on algorithms of the Logical-

    Combinatorial Approach, such as BT and Kora- .

  • 6

    INDICE

    LISTA DE ILUSTRACIONES 8

    LISTA DE TABLAS 9

    I. INTRODUCCIN 10

    I.1 Motivacin y Justificacin ....................................................................................... 10

    I.2 Descripcin del problema......................................................................................... 11

    I.3 Objetivos ................................................................................................................. 12

    I.3.1. General ................................................................................................... 12

    I.3.2. Particulares ............................................................................................. 12

    I.4 Especificacin del problema .................................................................................... 12

    I.4.1. Alcances y limitaciones ............................................................................ 13

    I.5 Consideraciones generales ....................................................................................... 13

    I.6 Aportes y contribuciones.......................................................................................... 14

    I.7 Antecedentes............................................................................................................ 14

    I.8 Estado del arte ......................................................................................................... 15

    I.9 Organizacin de la tesis ........................................................................................... 18

    II. MARCO TERICO 19

    II.1 Introduccin ............................................................................................................. 19

    II.2 Conceptos bsicos y definiciones ............................................................................. 19

    II.3 Seccin 1: Escritura manuscrita y su estudio ............................................................ 22

    II.3.1 Escritura: Historia y trascendencia ......................................................... 22

    II.3.2 Disciplinas relacionadas con la escritura ................................................ 23

    II.3.3 Documentoscopa y Grafoscopa ............................................................. 24

    II.3.4 reas de estudio y aplicaciones ............................................................... 25

    II.3.5 Caractersticas de la escritura manuscrita .............................................. 27

  • 7

    II.4 Seccin 2: Computacin .......................................................................................... 33

    II.4.1 Muestras de escritura .............................................................................. 33

    II.4.2 Anlisis de imgenes y morfologa matemtica ........................................ 34

    II.4.3 reconocimiento de patrones: Enfoque Lgico-Combinatorio ................... 34

    III. METODOLOGA PROPUESTA 39

    III.1 Introduccin ............................................................................................................. 39

    III.2 Caractersticas representativas.................................................................................. 39

    III.3 Interfaz grfica ......................................................................................................... 46

    III.4 Seleccin de las variables y clasificacin ................................................................. 47

    III.5 Secuencia detallada del anlisis completo ................................................................ 48

    IV. EVALUACIN DE LOS RESULTADOS 50

    IV.1 Experimentos realizados .......................................................................................... 50

    IV.2 Resultados finales y eficiencia ................................................................................. 51

    IV.3 Problemas pendientes ............................................................................................... 52

    V. CONCLUSIONES 53

    V.1 Conclusiones............................................................................................................ 53

    V.2 Trabajos futuros ....................................................................................................... 54

    BIBLIOGRAFA 55

    ANEXOS 58

    A. Formulario para obtener textos manuscritos ............................................................. 58

  • 8

    LISTA DE ILUSTRACIONES

    Ilustracin 1: Ejemplo de una posible divisin de una palabra en grafemas. ................. 17

    Ilustracin 2: Elementos formales de las letras ............................................................. 20

    Ilustracin 3: Ejemplo de zonas de escritura. ............................................................... 21

    Ilustracin 4: Escritura cuneiforme. ............................................................................. 22

    Ilustracin 5: Lnea del tiempo representativa de la escritura. ...................................... 23

    Ilustracin 6: Caracteristica de orden en la escritura .................................................... 28

    Ilustracin 8: Ejemplos de escritura con diferentes dimensiones .................................. 29

    Ilustracin 7: Tamao de la escritura ........................................................................... 29

    Ilustracin 9: La proporcionalidad en los valos de las letras. ...................................... 29

    Ilustracin 10: Proporciones de los margenes .............................................................. 30

    Ilustracin 11: Caracteristica de forma de las letras. ..................................................... 30

    Ilustracin 12: Escritura con formas triangulares ........................................................ 31

    Ilustracin 13: Direccin descendente. ......................................................................... 31

    Ilustracin 14: Ejemplo de direccin sinuosa o serpentina. .......................................... 31

    Ilustracin 15: Inclinacin en la escritura.. ................................................................... 32

    Ilustracin 16: Separacion de palabras y letras. Ejemplo de enlaces. ............................ 32

    Ilustracin 17: Procedimiento para el espacio entre renglones ...................................... 42

    Ilustracin 18: Ejemplo del procedimiento para el espacio entre renglones. ................. 43

    Ilustracin 19: Ejemplo despus de aplicar el procedimiento para encontrar las

    caractersticas de proporcin en una palabra. ....................................................... 44

    Ilustracin 20: Posibles direcciones de una linea con largo de 15 pixeles ..................... 45

  • 9

    LISTA DE TABLAS

    Tabla 1. Clasificacin del documento, segn su anlisis y propsito de estudio ......... 277

    Tabla 2: Clasificacin para la interpretacin grafolgica.............................................. 28

  • Captulo I

    Introduccin

    I. INTRODUCCIN

    I.1 MOTIVACIN Y JUSTIFICACIN

    Actualmente un proceso de identificacin y verificacin de una persona es una tarea

    cotidiana y no solo est presente cuando la seguridad requerida para cierto objetivo es

    extrema. Por ejemplo, al utilizar una computadora se pide una clave de acceso, al cobrar un

    cheque en un banco, al votar en un proceso de elecciones, al matricularse como estudiante,

    etc. Todas esas tareas no estn restringidas a hacerse manualmente, pero aun as, a pesar de

    la creciente demanda de documentos electrnicos, la identificacin por medio de la

    escritura manuscrita1 est presente sobre las tareas digitales. Generalmente identificar y

    verificar a un individuo es laborioso, consume mucho tiempo y est sujeto a muchas

    imprecisiones si se hace manualmente, por lo que se ha optado por tomar soluciones

    automatizadas valindose de un software que facilita llevar a cabo dichas tareas con

    confianza, rapidez, sin subjetividad y con mrgenes de error mucho menores, dando lugar

    al constante inters y desarrollo por cuestiones biomtricas.

    1 No debe confundirse escritura manuscrita con escritura script o cursiva. La primera hace referencia a una escritura que

    se hace a mano teniendo diferentes tipos de escritura como script o cursiva, de molde, etc., mientras que las siguientes escrituras se refieren a escrituras tambin hechas a mano, pero con cada letra unida a las adyacentes dentro de una palabra.

  • 11

    La ciencia que se refiere a los mtodos automticos que analizan determinadas

    caractersticas humanas con el fin de identificar y autentificar a las personas es conocida

    como Biometra2 [1]. Se basa principalmente en la medicin de caractersticas fsicas o de

    conducta y rasgos personales de un individuo, las cuales pueden considerarse como

    estticas (caractersticas fsicas) o dinmicas (caractersticas conductuales). Los

    procedimientos biomtricos ms conocidos usan la escritura manuscrita (firma y texto), la

    huella digital, el uso de tarjetas plsticas y el reconocimiento de voz, etc., aunque

    recientemente se hacen fusiones, al usarse la combinacin de varias tcnicas para ofrecer

    mayor seguridad a los sistemas que lo implementan. La identificacin personal que utiliza

    la escritura no solo es una medida de seguridad, sino que se ha extendido a otras reas de

    estudio como por ejemplo la Criminalstica3, que es la disciplina que se ocupa de estudiar

    cuestiones criminales.

    Debido a esta constante tarea de verificacin y a que un anlisis de cierta escritura es

    complicado, se pretende realizar una interfaz que sea de utilidad para identificar al autor de

    un texto manuscrito, tratando de evitar el error que puede estar presente cuando una

    persona que realiza el anlisis, necesita dar una opinin sobre alguna caracterstica de la

    escritura en cuestin.

    I.2 DESCRIPCIN DEL PROBLEMA

    El estudio de la escritura toma un papel importante, entre otras tareas, en el rea

    relacionada con la identificacin de autores mediante mtodos forenses de annimos, en la

    autentificacin de documentos, en la validez de documentos legales, etc., a tal grado que se

    han desarrollado especialidades que estudian la escritura manuscrita y sus caractersticas.

    Algunas de ellas son la Grafologa, la Grafoscopa, la Documentoscopa, etc.

    Uno de los problemas al realizar el anlisis de una muestra de escritura es la complejidad en

    cuanto a las mediciones a hacer, las que deben ser muy precisas, sin que el punto de vista

    del especialista influya considerablemente en el anlisis que se est realizando.

    Con el desarrollo del tema Identificacin del autor de un texto manuscrito, se pretende

    que la interfaz creada sea una ayuda para el especialista y que su punto de vista se rija

    principalmente por reglas generales disminuyendo en su diagnstico la subjetividad. La

    interfaz obtendr caractersticas similares a las realizadas por un especialista y otras

    obtenidas por mtodos computacionales de una forma precisa y en un menor tiempo.

    Incluso, se pretende que esta interfaz sea de utilidad para personas que no tienen un

    conocimiento a fondo del tema para analizar la escritura de una persona.

    2 Tambin definida como la ciencia que se encarga de estudiar estadsticamente las caractersticas cuantitativas de los seres vivos [1].

    3 Aborda temas como el delito, el delincuente, procesos de criminales. Se puede entender como la disciplina que busca el cmo, cundo y dnde se comete un hecho presuntamente delictuoso y prueba la culpabilidad o no aportando pruebas.

  • 12

    I.3 OBJETIVOS

    El objetivo general y los objetivos particulares de la tesis son:

    I.3.1. GENERAL

    Implementar un sistema para identificar al autor de un texto manuscrito, por medio del

    reconocimiento fuera de lnea de las caractersticas representativas de las muestras

    previamente recolectadas de escritura manuscrita en letra de molde contenidas en una base

    de datos.

    I.3.2. PARTICULARES

    Los objetivos particulares son:

    Elaborar una base de datos conformada por las muestras de escritura manuscrita y la firma de varios individuos.

    Analizar principalmente las zonas de escritura de las palabras en el texto.

    Obtener, identificar y seleccionar las caractersticas representativas de la escritura de un individuo y generalizar el proceso mediante una metodologa que pueda

    usarse en otras aplicaciones.

    Identificar el vector de caractersticas necesario y suficiente para resolver el problema de la clasificacin.

    I.4 ESPECIFICACIN DEL PROBLEMA

    El propsito de la tesis es identificar al autor de un texto manuscrito en base a muestras de

    escritura previamente recolectadas, para lo que se elabor un formulario desarrollado en el

    Centro de Investigacin en Computacin (CIC) del Instituto Politcnico Nacional (IPN), en

    el cual se recolectan textos y firmas de varios individuos, a los que llamaremos autores.

    El primer punto es encontrar rasgos representativos de la escritura manuscrita que sean

    semejantes a los obtenidos por un especialista en el estudio de la escritura, tratando de

    ponderar aquellas caractersticas que discriminan ms a un escritor de otro. Es decir, el

    anlisis de la imagen no se hace como una textura sino se analiza el texto escrito como

    palabras o grafemas (ver Capitulo I.8).

    La idea general es no llegar a los niveles ms bajos de anlisis de escritura que son hechos

    con trazos o caracteres, sino hacer una clasificacin como mnimo segn las palabras o

    secciones de ellas. Tambin se pretende dar robustez a los procedimientos en la interfaz

    desarrollada para que no importe el texto que se escriba o que sea necesario repetir muchas

    veces un mismo prrafo para poder clasificar, ya que se elegirn las palabras de manera

    aleatoria, caracterstica que no muchos sistemas implementan.

    Otro punto importante es el uso del Enfoque Lgico-Combinatorio del Reconocimiento de

    Patrones para encontrar la importancia de las caractersticas obtenidas, as como facilitar la

    clasificacin de las muestras ya existentes en la base de datos y de nuevas muestras de

    escritura. Adems, la interfaz presentada puede ser utilizada para identificar escrituras an

  • 13

    sin conocimientos previos de cmo se realiza un anlisis de texto.

    I.4.1. ALCANCES Y LIMITACIONES

    El desarrollo del proyecto se limita a las muestras de escritura de la base de datos

    particularmente desarrollada en el CIC para este propsito. Su elaboracin se llev a cabo

    con la informacin recogida con la ayuda de un formulario a llenar por los autores, el cual

    se describe en la seccin II.4.1. Para su elaboracin, con el fin de lograr la indispensable

    calidad y uniformidad de las muestras, se consideraron las siguientes normas:

    1. Todos los textos se escribirn en idioma espaol a menos que se indique lo contrario.

    2. La persona escribir sus textos de la forma en que suele escribir, preferiblemente en letra de molde, y usando letras maysculas y minsculas.

    3. Se utilizar bolgrafo negro comn que se proporciona al momento de llenar el formulario, junto con una tablilla como apoyo o soporte.

    4. La persona deber escribir siempre sin tocar los bordes del marco y sin cruzarse con su propia escritura.

    5. No se podr borrar, ni tachar, ni sobrescribir.

    6. Todo dato personal y los correspondientes textos manuscritos estarn amparados por la firma autgrafa de la persona.

    Las caractersticas de la escritura tienen limitaciones en cmo debe ser presentada la

    imagen, es decir, texto negro y fondo blanco, no estar rayada ni fuera de los lmites

    establecidos, y preferentemente con los renglones de texto que no se toquen ni se

    sobrepongan.

    En cuanto a las caractersticas obtenidas de las muestras de texto escrito, se usa una

    combinacin de las caractersticas convencionales y computacionales (Captulo II.4.1) que

    han sido obtenidas para el desarrollo de la tesis.

    El formulario se muestra en el Anexo A.

    I.5 CONSIDERACIONES GENERALES

    La tesis Identificacin del Autor de un Texto Manuscrito tiene restricciones en cuanto a las

    muestras de escritura que consideraremos vlidas para analizar, ya que las variaciones que

    se pueden hacer al escribir son incontables, por ejemplo, las tachaduras, rayones, escrituras

    que fueron alteradas por algn mtodo de la Documentoscopa (Ver Captulo II), el uso de

    diferentes tiles de escritura, los diferentes soportes para escribir, etc. Sin embargo, es

    posible que se analicen muestras de escritura con un previo procesamiento a la imagen para

    posteriormente obtener los rasgos descritos ms adelante en este trabajo.

    Tambin es de inters notar que a pesar de que se pide que un texto sea escrito 3 veces, el

    anlisis de la escritura no siempre se realiza a las mismas palabras en todos los escritores,

  • 14

    dando una ventaja con otros mtodos al ser independiente del texto; tampoco se pide para la

    clasificacin ni para obtener el peso de informacin que representa cada rasgo, una cantidad

    mnima de palabras.

    Una consideracin final es recordar que aunque el Reconocimiento ptico de Caracteres

    (OCR) ha sido muy estudiado, es una tarea muy diferente a la de caracterizar una escritura e

    incluso identificar su autor, ya que para el OCR generalmente se trabaja con letras del

    abecedario por separado mientras que caracterizar una escritura involucra varias

    combinaciones de caracteres en forma de palabras. Por ltimo el procesamiento fuera de

    lnea (Ver Captulo II) es una tarea esttica que aporta menos informacin que si se utilizan

    tabletas digitalizadoras, las cuales facilitan la tarea de caracterizar la escritura de un autor.

    I.6 APORTES Y CONTRIBUCIONES

    Los aportes principales que se ofrecen son:

    1. Se ha creado un nuevo mtodo para obtener rasgos que caractericen la escritura de un

    autor, recordando que estas caractersticas, aunque estn enfocadas principalmente a la

    escritura en letra de molde, pueden funcionar tambin con letra script.

    2. La elaboracin de un formulario en espaol para crear una base de datos con muestras de

    escrituras y firmas autgrafas, en la que colaboran poco ms de 50 autores y donde se

    pueden encontrar desde el abecedario en letras maysculas y minsculas, hasta prrafos en

    ingls y espaol y los nmeros del 0 al 9. Esto hace posible que estas imgenes sean para

    uso pblico en la investigacin nacional, especialmente para el Centro de Investigacin en

    Computacin.

    Tambin se establece una idea de cmo involucrar criterios de comparacin cualitativos y

    cuantitativos, para utilizar mtodos del Enfoque Lgico-Combinatorio del Reconocimiento

    de Patrones, el que a pesar de ser usado en muchas aplicaciones, se desarrolla poco o de

    manera nula para la clasificacin y discriminacin de rasgos en el estudio de la escritura

    manuscrita computacionalmente; los clasificadores estadsticos son los que ms

    predominan en los problemas relacionados con la identificacin del autor de un texto.

    I.7 ANTECEDENTES

    Hoy en da la tecnologa ha permitido que muchos de los procedimientos que se hacan

    antes manualmente y que consuman mucho tiempo, se puedan realizar de una manera ms

    sencilla y rpida con las computadoras. Por ejemplo, el almacenamiento de la informacin

    de grandes cantidades de datos en regiones fsicas muy pequeas se puede hacer

    digitalmente lo que permite que se transporte de manera ms sencilla, eficiente, con un

    menor costo y con gran seguridad. Sin embargo, a pesar de este auge en la informacin

    digital, muchos de los documentos cotidianos requieren de la escritura manuscrita y la

    obtencin de informacin de una manera tradicional. La gran cantidad de documentos

    escritos y los datos que contienen son una fuente importante de consulta para diversas

    reas. Para los sistemas judicial y policial, la escritura manuscrita tiene gran relevancia en

    la identificacin de documentos de dudoso origen (documentos dubitados), especialmente

    desde los puntos de vista de verificacin e identificacin [1].

  • 15

    En cuanto a los estudios computaciones referentes al reconocimiento de la escritura se

    identifican dos reas principales:

    Reconocimiento ptico de Caracteres (OCR Optical Character Recognition, en ingles);

    Identificacin y verificacin de la escritura.

    El reconocimiento ptico de caracteres consiste en que dada una muestra de escritura se

    segmenten los caracteres de tal forma que el escrito pueda ser interpretado con algn

    dispositivo especfico o con un formato preestablecido. Sin duda alguna, los avances

    obtenidos han sido utilizados en varios proyectos comerciales como son el uso de

    organizadores personales que convierten las palabras escritas a mano en caracteres de

    teclado, TablePC; escneres que permiten identificar los nmeros o unas letras de otras, etc.

    En cambio, la identificacin y verificacin de la escritura se ocupa de reconocer al autor de

    dicha muestra de escritura, de verificar si la escritura ha sido alterada, de saber si existe ms

    de un autor en el texto, comprobar el autor de dicha escritura, conocer si una firma ha sido

    falsificada, etc. Trata con procedimientos sobre la escritura de carcter biomtrico, de

    criminalidad o psicolgicos, entre otros. Debido a la gran variedad de pruebas y objetivos

    que se persiguen al analizar una escritura, los avances en esta rea no cubren las

    posibilidades de un estudio nico; por ello, la constante investigacin en este campo ha sido

    pauta para muchas variantes de algoritmos para la identificacin y la verificacin. Cabe

    mencionar que dichos anlisis dependen mucho de la forma en que se extrae la informacin

    inicial. Tanto en el reconocimiento ptico de caracteres como en la verificacin de la

    escritura e identificacin de las personas, se contemplan dos tcnicas de captura de datos:

    en lnea (on-line) y fuera de lnea (off-line).

    I.8 ESTADO DEL ARTE

    Los estudios de la escritura en relacin con su identificacin y verificacin por medios

    computacionales datan de los aos 1950 hasta la actualidad. Uno de los estudios ms

    reconocidos e importantes que se refiere a la escritura de un individuo como una marca

    nica de cada persona fue realizado por el Dr. Sargur N. Srihari [2], un distinguido profesor

    de la Universidad de Buffalo, director fundador del Centro de Excelencia para el Anlisis y

    Reconocimiento de Documentos (CEDAR, del ingls Center of Excellence for Document

    Analysis and Recognition). El grupo de trabajo del Dr. Srihari crea una base de datos con

    muestras de escritura de aproximadamente 1500 participantes, quienes escriban una carta

    en idioma ingls en una hoja en blanco [2], [3]. Reconocen dos tipos de caractersticas:

    convencionales y computacionales, de acuerdo a si las mismas son las halladas por los

    especialistas o son obtenidas mediante algn algoritmo -por ejemplo, software operando

    sobre una imagen escaneada-, respectivamente; se trabaja a nivel de anlisis del documento

    completo, prrafo, lnea, palabra y caracteres. Las caractersticas computacionales que

    obtiene se consideran dentro de dos grupos: las macro-caractersticas, que operan a nivel

    del documento completo, prrafo, rengln o palabra, y las micro-caractersticas, en las que

    se trabaja con palabras, caracteres o trazos.

    Para su anlisis consideraron 21 caractersticas convencionales, de las que seleccionaron 5

    y se desarrollaron 11 macro-caractersticas que las representan; su descripcin puede

  • 16

    consultarse en [2]. En las micro-caractersticas obtuvieron 3, que son: Gradiente,

    Estructura y Concavidad (GSC Gradient Structure - Concavity). Estos rasgos fueron obtenidos en trabajos previos para reconocer cdigos postales [3] [4],. Debido a que la base

    de datos contaba con un nmero considerable de muestras en sus experimentos, mencionan

    que conforme aumentaba el nmero de participantes, la eficiencia decreca hasta un 78% y

    los mejores resultados los obtuvieron al realizar anlisis en caracteres utilizando micro-

    caractersticas. Los mejores resultados tienen una exactitud del 96%.

    Un algoritmo propuesto por H. E. Said, T. Tan y K. D. Baker [5], [6] para el anlisis de la

    informacin fuera de lnea, se basa en caractersticas de textura, es decir, se analiza la

    imagen como un todo, de la que obtienen caractersticas independientes del texto y de cmo

    est distribuido. Las muestras fueron tomadas de escrituras en hojas blancas y las tcnicas

    para analizarlas son los filtros multicanal, las matrices de co-ocurrencia en escala de grises,

    (GSCM- Gray Scale Co-occurrence Matrices) y la clasifican mediante distancias

    euclidianas ponderadas y con el clasificador de K-Vecinos Prximos (K-Nearest Neighboor). Participaron 10 escritores para un total de 150 muestras de escritura; en los

    documentos realizan primero una normalizacin del skew4 o desencuadre y posteriormente

    una normalizacin para el espacio entre palabras y renglones, ya que seleccionan porciones

    del documento de 128 x 128 pixeles a los cuales les extraen las caractersticas que

    desarrollaron. Combinando sus procedimientos, el mejor resultado identifica correctamente

    el 96% de los 150 documentos analizados [1], [5].

    En [7] E. Zois y V. Anastassopoulos proponen un algoritmo que utiliza proyecciones

    horizontales y operadores morfolgicos, as como un anlisis de textura para palabras en

    ingls y griego. Las muestras de escritura conforman una base de datos con 50 escritores,

    quienes en una hoja blanca de tamao A4 escribieron 45 palabras en ingls y en otra hoja

    su equivalente en griego, ya que tratan de demostrar que su mtodo es independiente del

    idioma. A grandes rasgos su procesamiento consiste en umbralar las imgenes de las

    palabras independientemente con niveles entre 170 y 180; posteriormente hacen un

    adelgazamiento de la palabra y una serie de aperturas morfolgicas con diferentes

    elementos de estructura para obtener sus caractersticas. Como clasificadores utilizan un

    perceptrn multicapa y un clasificador Bayesiano, consiguiendo una exactitud del 95%.

    En [1] se describe un sistema que intenta utilizar una combinacin de algunas

    caractersticas reconocidas por el Dr. Srihari, pero trabajando con texto independiente al

    nivel de carcter. Dicho sistema trabaja con imgenes digitalizadas o fotocopias escaneadas

    a 300 ppp - puntos por pulgada (dpi dots per inch); posteriormente se segmentan manualmente los caracteres los cuales son almacenados en una base de datos en la que se

    asocian a un usuario registrado en el sistema, ya sea dubitado o indubitado5.

    4 Es una falta de alineamiento del documento respecto a cmo fue escaneado. Es una correccin de un

    documento o prrafo hacia la horizontal.

    5 El usuario indubitado es aquel registrado en la base de datos al que se le asocian diferentes muestras de

    letras que son autnticas o verificadas. El usuario dubitado es el que tiene asociadas muestras de un

    sospechoso; por tanto, es el individuo que debe ser identificado entre los del grupo de usuarios dubitados de la

    base de datos [1].

  • 17

    Despus de un preprocesamiento para obtener la letra o texto en forma binaria se obtienen

    las caractersticas Gradiente, Estructura y Concavidad (GSC) [5], [6] y geomtricas [3];

    posteriormente se obtienen caractersticas mediante el uso de la direccin del vector

    gradiente [1]. En este procedimiento tienen en cuenta una formulacin tipogrfica, que es

    una tcnica forense en el rea de la identificacin criminal, que indica que no todas las

    letras son igualmente importantes para la identificacin de un autor. Esta tcnica se aplica

    reduciendo el nmero de caracteres y subclases de forma para cada letra, donde la imagen a

    clasificar primero se asigna a una subclase de la letra y despus se clasifican segn las

    subclases. El mtodo de clasificacin para la identificacin que utiliza el sistema es el

    algoritmo del Vecino ms cercano. Los experimentos realizados para este procedimiento

    fueron hechos con 1400 muestras de letras y 40 participantes, de los cuales 20 eran

    individuos indubitados. Los resultados obtenidos con el sistema favorecen a las

    caractersticas de gradiente con 20 individuos, con la que obtuvieron una precisin del

    100%, pero al utilizar todas las caractersticas lograron una precisin del 90%.

    Otra investigacin la realizaron Ameur Bensefia, Thierry Paquet y Laurent Heutte [8]

    quienes hicieron una base de datos en francs en la que colaboraron 88 personas que

    copiaron una carta con 107 palabras, adems de probar sus caractersticas con una parte

    disponible por Internet (aproximadamente 20%, 150 escritores) de una base de datos IAM

    [9]. El procedimiento consiste en segmentar la escritura en grafemas (Graphemes), que son

    patrones elementales de la escritura resultado del algoritmo de segmentacin basado en el

    anlisis de los contornos superiores de las letras (Ilustracin 1).

    Posteriormente se analizan los grafemas obtenidos para identificar las caractersticas

    individuales de las letras, se usan combinaciones de grafemas y las caractersticas son

    relevantes segn la aparicin en el documento a analizar y su frecuencia de ocurrencia en el

    resto de los documentos; con ello obtienen una identificacin del escritor aproximada del

    90%.

    La tesis de doctorado de Susana Pecharromn [10] describe el procedimiento utilizado para

    reconocer a un escritor independientemente del texto mediante caractersticas de textura de

    la imagen. Para ello considera tres etapas, una de preprocesamiento, otra de extraccin de

    caractersticas y una etapa final para la comparacin de las caractersticas obtenidas con un

    modelo, ya sea para identificar o para verificar al autor del escrito. Las caractersticas que

    Ilustracin 1: Ejemplo de una posible divisin de una palabra en grafemas.

    Contorno superior

    Palabra de ejemplo

    Grafemas producidos

  • 18

    toma estn generalmente relacionadas con el contorno de las letras o palabras, el grueso de

    los trazos y su amplitud o regularidad.

    En la tesis doctoral Aportaciones al Reconocimiento Automtico de Texto manuscrito, de

    Moiss Pastor [11], se describen procedimientos que sirven para obtener algunas

    caractersticas de una palabra tales como su inclinacin, su orientacin en relacin a los

    ejes vertical y horizontal, etc.; aunque la tesis est orientada al OCR, el preprocesamiento

    de la imagen y la obtencin de caractersticas del escrito est muy relacionada con el

    anlisis de la escritura de forma grafolgica.

    I.9 ORGANIZACIN DE LA TESIS

    La presente tesis consta de 5 captulos. El Captulo 1 contiene la descripcin del problema,

    el objetivo general y los objetivos especficos del trabajo, la justificacin de la

    investigacin, el alcance y las limitaciones, las consideraciones generales tenidas en cuenta

    para su desarrollo, los aportes y contribuciones y brevemente los antecedentes y el estado

    del arte del tema particular. El Captulo 2 engloba dos secciones, en una de ellas se

    presentan los conceptos ms importantes sobre la escritura manuscrita y algunas

    caractersticas que se obtienen de ella al anlizarlas, mientras que en la siguiente seccin se

    habla sobre los mtodos computacionales utilizados para procesar la imagen que contiene la

    escritura y clasificarla. En el Captulo 3 se presenta la interfaz desarrollada, as como la

    metodologa propuesta para cumplir los objetivos general y particulares del trabajo,

    incluyendo las caractersticas obtenidas, una estrategia de decisin y la secuencia del

    anlisis completo. Dentro del Captulo 4 se muestran los experimentos y resultados

    obtenidos, los problemas encontrados a lo largo de la investigacin y algunas observaciones

    generales. Para finalizar, el Captulo 5 muestra las conclusiones, las recomendaciones y los

    posibles trabajos futuros que se desprenden del tema tratado.

  • Captulo II

    Marco Terico

    II. MARCO TERICO

    II.1 INTRODUCCIN

    En este captulo se presentan los antecedentes sobre el tema a tratar. Se desarrollan dos

    secciones, una donde se trata la escritura manuscrita y su estudio y la otra los tpicos

    relacionados con la computacin. El primer apartado muestra una idea general de lo que es

    la escritura manuscrita, su historia, las disciplinas que la analizan y las caractersticas, ya

    sean computacionales o convencionales, que sirven para estudiar una muestra de escritura.

    La seccin de Computacin se enfoca en describir los conocimientos y mtodos que se

    utilizaron para el desarrollo de la tesis, los cuales involucran el anlisis de imgenes

    digitales, la morfologa matemtica y temas sobre el reconocimiento de patrones

    principalmente con el enfoque lgico-combinatorio para resolver el problema. Se ofrecen

    conceptos y definiciones bsicas que permiten tener una idea general de los conceptos

    utilizados para el desarrollo de la tesis.

    II.2 CONCEPTOS BSICOS Y DEFINICIONES

    Existen muchos conceptos para definir la escritura; sin embargo la gran mayora converge

    hacia la idea de que es una representacin del pensamiento mediante signos grficos. Una

    definicin ms precisa es la siguiente: Una representacin grfica de una lengua por medio de signos grabados o dibujados sobre un soporte. Del latn scriptura, es el sistema de signos

  • 20

    o letras empleados para representar las palabras o las ideas trazados en papel u otra

    superficie [12]. De aqu podemos desligar el concepto de Soporte que es el material en cuya superficie se plasman los signos [12], por ejemplo, papel, tela, cintas, etc. y se da el

    nombre de til de escritura al elemento con el que se escribe.

    Cuando se realiza un estudio de la escritura, tambin se consideran los elementos que la

    constituyen y a los que se les ha atribuido un nombre especfico, como es el caso de la

    rbrica, la firma, el documento, el trazo, el rasgo y la materia escriptoria. Un trazo es cada

    una de las partes en que se divide la letra escrita a mano, es decir, son las lneas o rayas

    esenciales en una letra, mientras que un rasgo es aquella lnea que no es esencial [13]. La

    firma es un conjunto de trazos que identifica a una persona, generalmente acompaado de

    la rbrica, que son los rasgos que conforman una figura; por eso sta tambin es conocida

    como una firma corta.

    Para realizar un anlisis de una escritura manuscrita es necesario hacer mediciones a varios

    elementos del grafismo de la persona. Estos elementos conforman dos grupos llamados

    elementos formales y elementos estructurales de la escritura (Ilustracin 2).

    Los elementos formales son aquellos que constituyen las letras o palabras, como son los

    trazos, rayas, lneas, puntos iniciales y finales, etc. Tambin se pueden considerar como

    elementos formales las partes de las letras, segn [14], a los valos, que son las partes

    centrales cerradas de las letras, las crestas, que son las partes superiores de las letras y los

    ejes que son las partes inferiores de las letras, adems de los signos de puntuacin (puntos,

    comas, etc.). Un elemento estructural es aquel que describe la escritura, por ejemplo, su

    forma, tamao, direccin, orden, etc.; existe una gran cantidad de estos elementos que han

    sido estudiados desde hace poco ms de 100 aos sin lograrse llegar a una unificacin de

    rasgos por parte de los especialistas.

    Para realizar muchas de las mediciones a dichos elementos se necesita de una base en la

    escritura, conocida como zonas de la escritura, que corresponden a las partes en que se

    divide una palabra al trazarse de forma imaginaria dos lneas horizontales tangentes a las

    partes superior e inferior de las letras que no sobresalen, como la a, e, o, u, m, n [15]. Esto

    da origen a tres zonas de la escritura que son (Ilustracin 3):

    Ilustracin 2: Elementos formales de las letras (Izquierda). Ejemplo de elemento estructural:

    (1, 2,4) Cresta. (3) valo inclinacin hacia la derecha. (Derecha)

    (5) Ejes (6) Punto Inicial

    (7) Punto final

  • 21

    - Zona Media. Es la parte central de la palabra; abarca completamente las letras minsculas

    6 a, c, e, m, n, o, r, s, u, v, w, x. Se puede limitar la zona media tomando

    como base el tamao promedio de los valos en la palabra y trazando dos lneas por

    la parte superior e inferior.

    - Zona Superior. Es la parte en la que se encuentran las crestas de las letras que conforman la palabra.

    - Zona Inferior. Haciendo la divisin basada en el cuerpo de las letras, es la parte en la que se encuentran los ejes -o parte inferior- de las letras.

    Generalmente las lneas que sirven de base para identificar las zonas de la escritura son

    paralelas; sin embargo, no siempre siguen una lnea recta ni son paralelas, ya que en

    algunas caractersticas como se ver ms adelante- la informacin sobre la proximidad entre dichas lneas es una medida para conocer la forma de la caja de escritura.

    Estos conceptos son bsicos para conocer cmo se conforma la escritura, porque son los

    elementos en los que se basan muchos anlisis. Es importante definir a la escritura

    manuscrita como aquella escritura hecha a mano y no confundirla con la escritura cursiva o

    script ya que estas ltimas son tipos de escritura.

    Finalmente, es importante conocer las formas en que se pueden obtener las muestras de

    escritura de una persona para ser analizadas por una computadora. Se consideran dos

    formas [16]:

    - En lnea (on line). La informacin se obtiene directamente con la ayuda de algn dispositivo (como las tabletas digitalizadoras) que presenta la informacin al

    momento; los datos obtenidos son considerados como informacin dinmica;

    algunos son: presin de la escritura, velocidad de la escritura, nmero de trazos,

    puntos inicial y final, etc.

    - Fuera de lnea (off line). La informacin no se obtiene directamente, pues se necesita que se escriba en un soporte dado para posteriormente obtener la imagen

    por medio de un escner o cmara fotogrfica. Esta informacin es esttica.

    Para el desarrollo de nuestro sistema utilizamos la forma fuera de lnea, ya que a partir de

    textos escritos en papel y mediante escner, se capturarn las imgenes de las cuales se

    obtendrn los rasgos que caractericen al escritor.

    6 Hay casos especiales en los que estas letras pueden abarcar otras zonas; por ejemplo, la z y la s pueden escribirse solo en la zona media o tener alguna prolongacin hacia la zona inferior o hacia la zona superior.

    Ilustracin 3: Ejemplo de zonas de escritura.

    crestas

    ejes

  • 22

    II.3 SECCIN 1: ESCRITURA MANUSCRITA Y SU ESTUDIO

    Se le ha dado una gran variedad de usos al estudio de la escritura, lo que ha originado

    disciplinas en las que dependiendo de su objetivo se extraen caractersticas de la escritura

    con una mayor o menor importancia. A continuacin se describen brevemente algunas

    caractersticas que se tratan de simular computacionalmente para el propsito de

    identificacin del autor de un texto manuscrito.

    II.3.1 ESCRITURA: HISTORIA Y TRASCENDENCIA

    Una de las herramientas ms valiosas con las que cuenta el ser humano es la capacidad de

    comunicarse. A lo largo del tiempo el poder expresar sus necesidades, pensamientos,

    sentimientos, etc., ha provocado que se desarrollen diversas formas de comunicacin tanto

    oral como escrita.

    Gracias a las aportaciones de diferentes culturas al desarrollo de la escritura, su exactitud es

    ms confiable en cuanto a la transmisin y recepcin de la informacin. La invencin y el

    desarrollo de la escritura actual se han logrado despus de un proceso llevado a cabo a lo

    largo de miles de aos, evolucionando ideogrfica y fonticamente7. Las primeras formas

    de representacin grfica son las pinturas rupestres que datan aproximadamente del ao

    30,000 a.C.; posteriormente surge el pictograma, que es una representacin grfica

    sintetizada de objetos o ideas hechos sobre roca que sirvieron como base para que se

    desarrollara el concepto de dar un significado contextual y no solo de objetos aislados, sino

    conceptos ms elaborados.

    Las siguientes representaciones son grabados en huesos con base en un sistema de

    mnemnicos; la primera representacin considerada como escritura es la cuneiforme, que

    toma su nombre de los dibujos en forma de cua o triangular que la conformaban, dejando

    un poco las formas cilndricas y redondas que predominaban hasta entonces (Ilustracin 4).

    7 Ideogrficamente se refiere a la expresin de ideas, mientras que fonticamente es la representacin de sonidos, de

    donde se demostr que la escritura ideogrfica es antecesora de la escritura fontica.

    Ilustracin 4: Escritura cuneiforme. Tablilla de Ur (2900-2600 a. C.,) (Izquierda). Roca en la que se describe la restauracin de Babilonia, realizada por un rey Asirio (679 a.C.).

  • 23

    A partir de esta escritura, podemos encontrar como ms representativas la escritura

    jeroglfica en Egipto, la escritura del Valle del Indo y la escritura fenicia; aproximadamente

    en 1500 a.C. la escritura en China; en el ao 800 a.C. el alfabeto griego; cerca del ao 80

    d.C. se inicia la escritura Maya, aunque debido a la destruccin que sufrieron varios de sus

    escritos y cdices se cree que pueden ser ms antiguos [1] y en 1400 d.C. la escritura azteca

    (Ilustracin 5). De las bastas culturas a lo largo del tiempo surgieron diversas formas de

    comunicacin escrita y alfabetos que han permitido que la escritura, como la conocemos

    hoy en da, abarque aspectos para seguir desarrollndose y que los datos se transmitan

    perdurando ms tiempo y con mayor fiabilidad.

    Hoy en da, a pesar del auge que han tomado los documentos electrnicos, no podemos

    decir que sustituirn completamente a la escritura manuscrita; sin embargo, permiten que se

    adopten nuevas formas para que la escritura sea interpretada y almacenada por medios

    automticos.

    II.3.2 DISCIPLINAS RELACIONADAS CON LA ESCRITURA

    La escritura es una marca individual. Ninguna persona puede suplantar la escritura de otro

    individuo. Es posible que exista una gran similitud a simple vista, pero los rasgos que

    caracterizan al escritor siempre estn incorporados involuntariamente en la escritura. Un

    anlisis completo y correcto permite obtener muchas caractersticas que diferencian la

    escritura, incluso de la misma persona, a lo largo de su vida o por alguna enfermedad grave.

    El inters por conocer al hombre a travs de su escritura ha dado origen a muchas

    disciplinas que se encargan de estudiarla con fines especficos; sin embargo, no existe

    formalmente un nombre para el estudio general de la escritura. El primer nombre dado al

    estudio de la escritura fue el de Grafologa, con el fin de hacer un anlisis psquico del

    autor; este trmino es el que muchos especialistas consideran el ms adecuado para

    designar el estudio de la escritura, pero no enfocado solo en el estudio psquico del autor,

    sino como una idea que englobe todos los anlisis. Actualmente, debido a la gran cantidad

    de disciplinas con que se relaciona, el trmino grafologa se considera como el de una rama

    de dicho estudio, dando lugar al concepto genrico de Grafotecnia como la disciplina

    general que estudia la escritura.

    Algunos ejemplos de las disciplinas relacionadas con la escritura son:

    Grafologa

    Tambin conocida como grafosicologa, es la disciplina que estudia la personalidad

    Ilustracin 5: Lnea del tiempo representativa de la escritura.

  • 24

    del individuo a travs del examen de la escritura.

    Grafofisiologa

    Relaciona la escritura con la finalidad de tener un conocimiento de aspectos

    fisiolgicos del autor del escrito.

    Grafotcnica

    Disciplina orientada a la investigacin del origen o procedencia de los documentos

    sobre los que se realiza un anlisis, as como de su constitucin y/o naturaleza.

    Grafopatologa

    Mediante el estudio de la escritura de una persona, se pretende detectar signos que

    preceden a alguna enfermedad, as como signos clnicos o alteraciones somticas.

    Grafoterapia

    Tcnica teraputica que tiene la finalidad de corregir la conducta y personalidad por

    medio de una re-educacin escritural.

    Grafoscopa

    Disciplina que analiza la escritura y la firma para identificar su origen.

    Grafometra

    Agrupa las tcnicas con las que se hacen mediciones a una escritura manuscrita,

    firma o trazo, para determinar su autenticidad, correspondencia, falsedad, entre

    otros aspectos.

    Documentoscopa

    Disciplina que se encarga del estudio de los documentos para determinar su

    autenticidad, falsedad o alteracin.

    Caligrafa

    Disciplina que se encarga de estudiar la forma de hacer bella la escritura.

    Las disciplinas mencionadas no son las nicas que estudian la escritura, ya que muchos de

    estos trminos son agrupados, tomados como sinnimos, o subdivididos de otros de

    acuerdo al anlisis de las caractersticas que se haga. Estas disciplinas actualmente estn

    tomando fuerza y credibilidad, pero no son consideradas como ciencias debido a la falta de

    unificacin de tcnicas y de definiciones exactas sobre la escritura y sus elementos. Para

    fines de investigacin y cientficos hay principalmente dos disciplinas ampliamente

    reconocidas: la Documentoscopa y la Grafoscopa.

    II.3.3 DOCUMENTOSCOPA Y GRAFOSCOPA

    La Documentoscopa, tambin conocida como Documentologa, es una disciplina relativa a la aplicacin prctica y metdica de los conocimientos cientficos, teniendo como

    objetivo verificar la autenticidad o determinar la autora de los documentos [12].

    No existe una definicin nica para Documentoscopa, pero en general sus definiciones la

  • 25

    describen como una tcnica que trata de establecer la autenticidad de los escritos y

    documentos, tomando en cuenta que no siempre es posible identificar o no al autor del

    mismo, en especial por el tipo de anlisis que se realice y por el soporte con el que se

    trabaja. A pesar de que no siempre es posible tener una respuesta a si se trata de un

    documento autntico o falso, la Documentoscopa crece desarrollando tcnicas para superar

    las limitantes de un correcto anlisis y trabajando para estar a la par de las nuevas formas

    de tiles de escritura, soportes y formas de almacenamiento.

    Existen muchas disciplinas que auxilian a la Documentoscopa, ya que para analizar un

    documento se necesitan varias pruebas como son el tipo de soporte o papel utilizado, si se

    trata de un documento antiguo, anlisis para conocer la tinta utilizada en el documento, si

    se trata de verificar si es falso o si adems de eso se desea identificar al autor de un escrito,

    pruebas para identificar mltiples autores en un mismo documento, anlisis para validar

    sellos, firmas, escrituras, hologramas, etc.; en realidad existe una gran combinacin de

    pruebas que dependen completamente del documento y del objetivo de su estudio, para lo

    que se valen de otras disciplinas que estudian la escritura. Unas de las herramientas ms

    importantes para identificar al autor de una escritura son la Grafoscopa y la Grafometra;

    la primera es una disciplina encargada de analizar la escritura y firma para identificar su

    origen, mientras que la Grafometra se encarga de agrupar las tcnicas con las que se hacen

    mediciones a una escritura manuscrita, firma o trazo, para determinar su autenticidad,

    correspondencia o falsedad. Estas disciplinas son indispensables para un buen anlisis

    forense, razn por la cual su estudio va en aumento.

    Algunas de las medidas realizadas por la grafoscopa y la grafometra son [13]:

    1. Relaciones entre letras. Son las medidas de la altura media de los trazos de una palabra.

    2. Forma de la caja del rengln. La caja del rengln es el rectngulo que engloba a una palabra y su forma es una de las medidas esenciales para reconocer a un

    autor. La caja del regln puede tener forma paralela, convergente o divergente8.

    3. Valores angulares. Son las medidas correspondientes a la inclinacin de la escritura, ya sea de palabras, caracteres o trazos.

    4. Medidas correspondientes a signos de puntuacin. Como ejemplo de medida est la altura del signo de puntuacin en relacin con la base de la caja del

    rengln.

    5. ndices diametrales. Son las medidas correspondientes a los dimetros mayor y menor de un valo.

    II.3.4 REAS DE ESTUDIO Y APLICACIONES

    Para la biometra, la escritura manuscrita es una caracterstica dinmica [17] que ha tomado

    fuerza en combinacin con otras tcnicas biomtricas; la criminalstica, por su parte, ha

    8 A la caja del rengln tambin se le conoce como caja de escritura. Las comparaciones realizadas en varias muestras de escritura de una persona se hacen con palabras de igual nmero de trazos.

  • 26

    desarrollado inters en el rea, dando importancia a la informacin forense que puede

    presentar el anlisis tanto de una escritura como de una firma; la psicologa toma entre sus

    anlisis las muestras de dibujos, trazos, escritura y firma, entre otros aspectos, para conocer

    rasgos sobre la conducta de la persona, etc. Estas ciencias, entre otras, se valen

    principalmente de disciplinas especializadas en la escritura, tales como la Grafologa, la

    Documentoscopa y la Grafoscopa.

    Los campos o reas de aplicacin estn relacionados directamente con el propsito del

    anlisis, el soporte, el til de escritura, los medios y mtodos utilizados para su revisin,

    etc., dando origen a clasificaciones en mbitos de actuacin diferentes (Tabla 1). Una de las

    clasificaciones ms importante de los documentos se da de acuerdo al tipo y a la

    informacin que se desea analizar [18].

    Clasificacin Descripcin Ejemplos Observaciones

    Documentos

    manuscritos

    Se integra el estudio de textos

    y firmas. Existe gran variedad

    en los documentos.

    El objetivo del estudio es

    validar lo escrito en el

    documento; por ejemplo el

    conocer si debe o no

    cumplirse un testamento,

    segn que el resultado del

    estudio lo tome como

    autntico o falso.

    - Firmas en escritura notarial

    - Annimos con amenazas

    - Firmas en letras de cambio

    - Textos en recetas mdicas

    Documentos

    mercantiles

    Estudia las manipulaciones

    fraudulentas bajo las que el

    documento probablemente ha

    sido tratado.

    - Cheques bancarios

    - Letras de cambio

    - Pagars

    El documento fue

    borrado, aadido,

    intercalado, lavado con

    productos qumicos,

    confeccionado

    ntegramente, etc.

    Documentos

    de Identidad o

    Identificacin

    Se identifica su autenticidad

    parcial o total, ya sea de la

    informacin contenida en l

    como de la autenticidad del

    soporte o documento.

    - Pasaportes

    - Actas de nacimiento

    - Ttulos de viaje

    Cambios de fechas,

    fotografas, materiales

    del soporte,

    estampados, etc.

  • 27

    Tabla 1. Clasificacin del documento, segn su anlisis y propsito de estudio.

    Un ejemplo del uso de la documentoscopa es el que le da la criminalstica, pues como

    disciplina aplica tcnicas y conocimientos cientficos para investigar hechos de inters

    indagatorio policial [18], hasta el punto de que las herramientas que le ofrece la

    documentoscopa a la criminalstica dan lugar a una de las subdivisiones de estudio. El

    campo de estudio y de aplicacin que tiene la escritura manuscrita es muy amplio, pero

    debido a la informalidad en muchas de estas reas, no est muy difundido su conocimiento;

    sin embargo, con el paso del tiempo la aceptacin de varios estudios y su crtica han

    permitido que tengan mayor aceptacin en reas tales como la psicologa y la medicina.

    II.3.5 CARACTERSTICAS DE LA ESCRITURA MANUSCRITA

    Como ya se mencion, la escritura se puede estudiar sobre la base de sus elementos, ya

    sean formales o estructurales. Cada uno de estos elementos en dependencia del objetivo del

    estudio, puede tener un significado diferente segn la disciplina que se encarga del anlisis.

    Varios especialistas que no estn de acuerdo unos con otros, han creado clasificaciones

    diferentes -de los elementos estructurales principalmente- para englobar las caractersticas

    representativas de la escritura de una persona.

    Una de las primeras clasificaciones y que ha sido base para otras, se debe a Jules Crepieux-

    Jamin (1859-1940) [14], quien es considerado el padre de la grafologa cientfica. Entre sus

    aportaciones estn Las siete leyes de Crepieux-Jamin, donde engloba las caractersticas principales que existen en toda escritura en 7 gneros o especies. Sin embargo, no todos los

    especialistas toman en cuenta estas caractersticas. Por ejemplo, la Tabla 2 muestra tres

    clasificaciones adems de la hecha por Crepieux-Jamin, creadas por Flix Del Val Latierro

    [15], por la grafloga cientfica Susana Tesouro [17] y por el Licenciado en Criminalstica

    Carlos A. Guzmn [19].

    Documentos

    con textos

    realizados por procedimientos mecnicos

    Se estudia el texto elaborado

    por medios tales como

    mquinas de escribir,

    impresoras, procedimientos de

    artes grficas, etc.

    No siempre es posible

    superar las dificultades

    encontradas debido a la

    tecnologa empleada en

    las mismas; se necesita

    una gran precisin.

    Tarjetas de

    crdito,

    billetes de

    banco,

    permisos de

    conducir,

    cupones y

    otros

    El estudio principal es la

    autenticidad del soporte, como

    en el caso del papel moneda.

    - Billetes falsos

  • 28

    Crepieux-Jamin Val Latierro Tesouro Guzmn

    1 Orden Angulosidad Orden Gesto Grfico

    2 Tamao Dimensin Dimensin Velocidad

    3 Forma Direccin y forma Forma Ritmo

    4 Direccin Enlaces Inclinacin Presin

    5 Presin Inclinacin Direccin Proporcionalidad

    6 Velocidad Presin Velocidad Continuidad

    7 Continuidad Rapidez Continuidad Orden y Regularidad

    8 - Proporcionalidad Presin Angulosidad

    9 - Orden, regularidad - Dimensin

    10 - Continuidad - Inclinacin

    11 - - - Direccin

    12 - - - Enlace

    Tabla 2: Clasificacin para la interpretacin grafolgica. Estructura de los grafismos.

    Actualmente esta clasificacin ha cambiado. En el libro El ABC de la Grafologa [20], [21] se considera una clasificacin de 12 elementos generales: movimiento, forma, presin,

    espacio, tamao, inclinacin, direccin de las lneas, orientacin, regularidad, firmeza,

    conexin y apertura. A continuacin se describen, de entre ellas, las caractersticas que

    consideramos como las ms representativas.

    Orden o Regularidad. Se refiere a la distribucin y organizacin entre letras, palabras, lneas de texto, prrafos y mrgenes del texto. Es una evaluacin de la

    claridad de la escritura, de su legibilidad y su regularidad en el texto (Ilustracin 6).

    Ilustracin 6: El orden que sigue el texto superior se puede considerar como legible y regular, mientras que el texto inferior no es tan claro para su lectura y tiene mucha

    irregularidad en la posicin de las palabras.

  • 29

    Tamao o Dimensin. Se considera como tal la amplitud de la escritura, o el espacio que ocupan las letras en las palabras, o las palabras en un rengln (Ilustracin

    8). Se basa en las zonas de la escritura, en el tamao de los valos de las letras (letra

    pequea menor a 2.5mm, letra mediana de 2.6 a 3.0mm, letra grande de 3.1 a

    5.0mm), en el tamao de las maysculas, etc., y dependiendo del experto, pueden

    tomarse una o varias medidas. Dentro de este rasgo se considera si el texto ha sido

    escrito solo con letras maysculas o no (Ilustracin 7). Se pueden hacer observaciones

    si en la escritura de un rengln o de una palabra hay variaciones en el tamao de las

    letras, lo que da origen a diferentes subclases. Para mayor informacin [22].

    Proporcionalidad. Este elemento puede ser considerado como un subconjunto de las medidas obtenidas en la caracterstica Dimensin. No obstante, esta propiedad

    puede basarse en las proporciones de las zonas superior e inferior de la escritura con

    respecto a la zona central; la proporcin de los mrgenes de una hoja hacia el texto

    que contiene (Ilustracin 10); el espacio total que ocupa un texto en relacin con el

    espacio que se tiene para escribirlo; proporciones entre las partes de las letras

    (Ilustracin 9), etc.

    Ilustracin 8: El tamao del texto superior es mayor al inferior y se aprecia fcilmente pues a

    pesar de ser el mismo texto, la escritura superior ocupa ms espacio.

    Ilustracin 7: La misma palabra escrita por 3 personas diferentes. (De izquierda a derecha)

    palabra escrita con mayscula, palabra con dimensin sobrealzada debido al tamao de sus crestas,

    palabra con dimensin rebajada, con crestas pequeas en relacin al cuerpo de la letra.

    Ilustracin 9: La proporcionalidad puede referirse a la forma de los valos de las letras.

  • 30

    Ilustracin 11: La forma de la letra superior es como hilo, en el texto central

    predominan las formas curvas, mientras que en el texto inferior la forma es

    adornada principalmente en las letras maysculas.

    Forma. Hace alusin al tipo de la escritura. Existen diversas subdivisiones que se agrupan de acuerdo a los rasgos que presentan las letras: si son angulosos, curvos,

    tipogrficos, complicados (Ilustracin 11). Para conocer algunas formas de escritura

    referirse a [22].

    Angulosidad. Esta caracterstica de la escritura puede ser una subdivisin del elemento estructural Forma; sin embargo, depende mucho de los rasgos que se

    evalan en este ltimo. La angulosidad estudia la forma que tienen las letras, el

    Ilustracin 10: Posible clasificacin de la proporcin del margen superior de la hoja con respecto al comienzo del texto (Arriba). (Abajo), de derecha a izquierda: margen ausente,

    margen normal, margen grande.

  • 31

    Ilustracin 13: Direccin descendente. Las lneas punteadas son horizontales, mientras que las

    lneas continuas muestran la direccin que sigue la escritura, donde se observa que llegan ms

    abajo del rengln.

    predominio de curvas o ngulos, las terminaciones de las letras, las aperturas en las

    curvas de los trazos, etc. (Ilustracin 12).

    Direccin. Su estudio depende de la trayectoria de las lneas de un escrito. Algunos autores toman como base la direccin de la caja de la escritura, otros una lnea

    imaginaria horizontal (Ilustracin 13). Es importante notar que algunas veces el

    elemento estructural Inclinacin no se considera como una caracterstica separada y

    por lo tanto, puede incluirse en esta categora la medicin individual hecha de la

    direccin de las letras respecto a la vertical. Existen diversas clasificaciones para la

    direccin de una palabra, lnea de rengln o texto (Ilustracin 14). Para ms

    informacin referirse a [17] y [22].

    Inclinacin. Es el ngulo al que tiende la escritura en una palabra, lnea o prrafo; generalmente se consideran inclinaciones a la derecha o izquierda y rangos entre

    stas (Ilustracin 15). La forma ms comn de medirla es con relacin al eje

    transversal de la letra, siguiendo la direccin de la misma con una lnea base.

    Ilustracin 12: La letras L, I, T, muestran formas triangulares

    Ilustracin 14: Ejemplo de direccin sinuosa o serpentina, que es la escritura con ondulaciones en la caja de escritura.

  • 32

    Continuidad o enlaces. Es la particularidad en las letras o palabras cuando se unen por algn trazo o simplemente la ausencia de ste. Estudiando la forma de los

    enlaces se pueden crear categoras desde ligada a desligada, o considerar el tamao

    de las separaciones entre letras y palabras como un rasgo caracterstico (Ilustracin

    16).

    Velocidad. Esta propiedad es el grado de rapidez con que se escribe. Una velocidad rpida se estima cuando se escriben entre 130 y 200 letras por minuto; una

    velocidad media es entre 100 y 130 letras por minuto; cuando se escriben menos de

    100 letras por minuto podemos decir que es una escritura lenta. Esta propiedad de la

    escritura generalmente es considerada como una caracterstica dinmica, pues es

    muy representativa para cuando se hace una captura de informacin en lnea; no

    obstante, cuando la informacin es fuera de lnea, estudiando los trazos de las letras,

    sus direcciones y puntos iniciales y finales, es posible identificar si la persona

    escribi con mayor o menor rapidez.

    Ilustracin 15: La escritura superior tiene una inclinacin hacia la derecha, mientras que la escritura inferior casi es vertical.

    Ilustracin 16: La escritura superior tiene una separacin pequea entre letras y una

    separacin mayor entre palabras. La escritura del centro tiene algunos enlaces entre

    letras. El texto inferior tiene una separacin casi igual entre palabras y entre letras.

  • 33

    Espacios y cortes. La separacin existente entre letras, palabras o lneas de escritura son consideradas como espacios y los cortes son los trazos involucrados

    en un mismo signo, letra o palabra (Ilustracin 16). Las posibles mediciones de estas

    separaciones pueden dar un ndice o rango de medidas para identificar un escritor de

    otro.

    II.4 SECCIN 2: COMPUTACIN

    Dentro de esta seccin se describe el formulario diseado para capturar las muestras de

    escritura que se analizan con las caractersticas desarrolladas en el Capitulo III.2; tambin

    se describe someramente las herramientas que se utilizan para el preprocesamiento de la

    imagen, es decir, operaciones de procesamiento de imgenes digitales y morfologa

    matemtica.

    Tambin se hace referencia a los mtodos que se utilizarn para ponderar la importancia de

    cada rasgo obtenido y la forma en que se clasificar la muestra de escritura de un autor

    desconocido por medio de algoritmos de reconocimiento de patrones con un enfoque

    lgico-combinatorio.

    II.4.1 MUESTRAS DE ESCRITURA

    La obtencin de las muestras de escritura que constituyen los datos se realiz fuera de lnea,

    es decir, las imgenes fueron escaneadas a partir de un formulario creado en hojas tamao

    carta (21.56 x 27.94cm) de papel bond blanco. El formulario creado consta de 4 pginas;

    cada una tiene dos marcas para orientar la orientacin de la hoja, una en la esquina superior

    izquierda y otra en la esquina inferior derecha y cuentan con un recuadro para identificar

    mediante cdigo binario el nmero de la hoja con la que se trabaja (ver Anexo A).

    La primera hoja contiene algunos datos personales del autor de la muestra como son, entre

    otros, su nombre completo, dnde puede ser localizado, su nivel de estudios, profesin,

    telfonos, etc., y al final un espacio para su firma. Se ha tratado de no capturar datos

    personales que puedan comprometer de alguna forma a los autores de la muestra. La

    segunda y tercera hojas, adems del nombre de quien llena el formulario, tienen un prrafo

    en espaol y otro en ingls, los que deben ser repetidos por el autor de la muestra una vez

    en la segunda pgina y dos veces en la tercera; al final de cada hoja hay un recuadro para

    plasmar su firma cuatro veces y una vez, respectivamente. Finalmente, en la cuarta pgina

    del formulario se encuentran un apartado para escribir el abecedario castellano con letras

    minsculas, otro para el abecedario castellano con letras maysculas y los nmeros del 0 al

    9; tambin se le pide que escriba de manera rpida una pequea frase; de igual forma al

    final de la hoja se pide que firme en un recuadro y se le solicita la autorizacin para utilizar

    la informacin proporcionada con fines cientficos.

    Todas las hojas del formulario cuentan con un recuadro en el cual se coloc el Nmero de

    Registro, el que servir como identificador de cada caso en la base de datos creada y as sea

    prctico trabajar con los archivos, ya que en ella se almacenarn las rutas de las imgenes

    obtenidas tanto de las originales como de las preprocesadas resultantes, adems de contar

    con tablas especficas para guardar los valores de los rasgos extrados de cada escritura.

    Este nmero de registro fue dado consecutivamente al momento de presentarle el

  • 34

    formulario a la persona que lo habra de llenar. Las restricciones o requerimientos mnimos

    para el formulario se describieron en la seccin I.4.1 de la tesis y las hojas de los

    formularios se encuentran en el Anexo A.

    II.4.2 ANLISIS DE IMGENES Y MORFOLOGA MATEMTICA

    Los procedimientos utilizados en el anlisis de imgenes nos permiten, entre otras cosas,

    mejorar adecuadamente las imgenes de los textos para que la extraccin de sus

    caractersticas sea ms confiable y robusta. El preprocesamiento es una de las etapas

    importantes, ya que mientras ms claro y mejor limitado sean los caracteres escritos, la

    extraccin de los rasgos globales de la escritura ser mejor y ms confiable. Los mtodos

    de preprocesamiento dependen del sistema en general a utilizar y de la entrada de la

    informacin disponible [11]. Para la etapa de preprocesamiento se utiliza principalmente el

    umbralado (thresholding) de la imagen digital de entrada, filtros de mediana y de rango, el

    uso de proyecciones horizontal y vertical, dilataciones y erosiones con elementos de

    estructura cuadrados y rectilneos rotados, aperturas y clausuras, reconstrucciones

    geodsicas, etc. Para encontrar una descripcin de estos procedimientos y muchos ms,

    debe referirse a [8], [11], [23].

    II.4.3 RECONOCIMIENTO DE PATRONES: ENFOQUE LGICO-COMBINATORIO

    El reconocimiento de patrones es una disciplina cientfica que inicia formalmente a finales

    de los aos 50 y se ocupa de resolver problemas relacionados con la clasificacin de

    objetos y con la determinacin de los factores que inciden en los mismos [24], [25]. Los

    procesos de clasificacin de objetos se realiza en base a semejanza y diferencias, con un

    principio general: los objetos que son semejantes deben pertenecer a una misma clase o categora, mientas que objetos diferentes pertenecern a clases distintas

    9. Podemos considerar 4 tipos de problemas de clasificacin: la Seleccin de Variables (que se usa

    principalmente para reducir los trminos en los que se describe un objeto y para conocer

    qu rasgos discriminan ms); la Clasificacin Supervisada (con objetos en todas las clases

    creadas, con aprendizaje), la Clasificacin no Supervisada (no se conocen las clases en el

    universo ni cmo se agrupan los objetos, sin aprendizaje) y la Clasificacin Parcialmente

    Supervisada (con objetos clasificados en algunas clases, al menos una clase no tiene

    objetos, con aprendizaje parcial). Para tener un concepto ms general y ejemplos revisar

    [24].

    Dentro del reconocimiento de patrones existen varios enfoques que tratan a los problemas

    segn la forma en que se pueden representar los objetos y los objetivos que se persiguen.

    Dentro de los enfoques ms conocidos se encuentran: Enfoque Mtrico (Clustering),

    Estadstico, Sintctico, Neuronal, Lgico-Combinatorio [24], [26]. Para nuestro caso el

    modelo Lgico-Combinatorio nos ofrece la posibilidad de modelar el problema lo ms

    cercano a la realidad y nos permite utilizar variables cuantitativas y cualitativas mezcladas

    9 Objeto es un concepto con el cual se representa a los elementos en estudio. Clase es un conjunto de objetos,

    Patrn es usado como sinnimo de objeto; en ocasiones al patrn se le conoce como un objeto ya clasificado.

  • 35

    lo que en otros enfoques no siempre es posible. En el enfoque lgico-combinatorio los

    patrones que son descripciones de objetos en relacin con variables o rasgos- , pueden contener variables booleanas, variables k-valentes, difusas o lingsticas [25]. Cuando se

    intenta clasificar un objeto nos enfrentamos principalmente a dos fases una de ellas es la

    seleccin de variables y la otra es la clasificacin. A continuacin se menciona brevemente

    lo que se utilizar para estas dos fases en el desarrollo de la tesis.

    Cuando existe una gran cantidad de rasgos y una gran cantidad de objetos la clasificacin

    puede no ser sencilla; sin embargo, es posible hacer uso de la Teora de Testores10

    , que nos

    permite conocer qu rasgos discriminan ms a los objetos que otros y usar subconjuntos de

    rasgos que son ms apropiados para el problema de la clasificacin al reducir su espacio de

    representacin.

    Sea Tm,n,k un cubrimiento11

    con m objetos, n rasgos y k clases, donde cada objeto O1,Om se describen en trminos de los rasgos R = {r1,rn}, un patrn o descripcin de objetos ser la n-tupla X(Oi) = (r1(Oi), rn(On)); para facilitar la representacin se utiliza una matriz de aprendizaje o de descripcin M tal que cada fila representa un objeto del

    cubrimiento y las columnas los rasgos o variables; adems esta dividida en k clases. Los

    testores clsicos o testores de Zhuravlv son un subconjunto de rasgos {ri-1,ri-s} de T si y solo si al remover de las descripciones de objetos todos los rasgos (remover las columnas

    de M) excepto los de , no resultan subdescripciones de objetos idnticas en clases distintas, es decir, no hay confusin entre los objetos (entre filas de la matriz M). Para ms

    informacin consultar [24], [25], [26], [27], [28]. Cuando en un testor ningn subconjunto

    de rasgos es un testor se le llama testor tpico, irreducible o primo. Algunos algoritmos

    para obtener los testores de M son: algoritmos BT y TB [26], algoritmo LEX [29],

    algoritmo CC [25], etc. Para el caso de la presente tesis se trabaja con testores de

    Zhuravlv; sin embargo existen extensiones al concepto de testor como son los -testores, testores de Goldman, etc., [26], [30]. Describimos brevemente las definiciones y algoritmos

    para el clculo de testores usando BT.

    Algoritmo BT

    Llamamos Lista al nmero binario de r bits (r es el nmero de rasgos) que representa algn

    subconjunto R donde R es el conjunto de rasgos para describir un objeto. Tenemos 3 proposiciones:

    Proposicin A. Una lista no es una lista testor cuando y solo cuando exista un rengln

    a de la matriz bsica tal que AND a = 0.

    10 Se desarrolla como un rea independiente a finales de los aos 50; su origen se vincula al utilizar mtodos

    lgicos matemticos para localizar desperfectos de circuitos. Los primeros trabajos en esta rama de la Lgica

    Matemtica se atribuyen a I. A. Cheguis y S. V. Yablonskii [24], [26]. A mediados de los aos 60, Yuri

    Ivanovich Zhuravlev extiende su aplicacin a problemas clsicos del reconocimiento de patrones [25].

    11 Tupla conformada por objetos, rasgos, descriptores de clases, relacin de pertenencia y una funcin de

    semejanza. Se puede tener interseccin no vaca entre las clases.

  • 36

    Proposicin B. Si la lista y el rengln a cumplen la proposicin A se construye de la siguiente forma: Sea k el ndice del ltimo 1 en , = 1, 2, r donde cada

    . Las listas que se encuentran entre y - 1 no son listas testor.

    Proposicin C. Si es una lista testor y k el subndice de su ltimo 1, entonces las siguientes 2

    r-k-1 listas son listas testor pero no tpicas.

    Algoritmo:

    1. Calcular la matriz de diferencias y su matriz bsica12.

    2. Generar la primera lista a probar ( = 1).

    3. Averiguar si es lista testor aplicando la propiedad A.

    4. Si no es lista testor aplicar la propiedad B.

    Si es lista testor aplicar la propiedad C.

    5. Regresar al paso 3 hasta que = 2r-1 (se terminen con las listas)

    6. Seleccionar los testores tpicos.

    Para mayor informacin consultar: [24], [26], [31], [32]

    Para la fase de clasificacin, ya que se tiene reducido el espacio de representacin de los

    objetos, se utilizan algoritmos como el Kora- y Conjuntos Representantes [24], [27] que se describen a continuacin.

    Algoritmo Kora-

    Es una extensin del algoritmo Kora-3 que fue desarrollado por el grupo de Bongard para

    solucionar problemas de Geologa en los aos 60. Este algoritmo se introduce en 1998

    llamado Fuzzy Kora-Omega Algorithm [33], [34] y permite usar subconjuntos de diferente

    cardinalidad a diferencia de Kora-3 que utiliza solo subconjuntos de 3 elementos; define un

    tipo de rasgo llamado complejo y se necesita de umbrales para caracterizar a los objetos de

    las clase; permite trabajar con problemas de ms de dos clases; para crear una regla de

    solucin se pueden ponderar los rasgos de acuerdo a las variables involucradas y a los

    objetos que cubre.

    Antes de escribir el algoritmo se necesitan algunos conceptos clave. Sea un subconjunto de

    s rasgos = {r1, r2,, rs}; un Rasgo Complejo es un conjunto de valores para esos rasgos (a1,a2, ,as). Un Rasgo Complejo Caracterstico es un rasgo complejo si aparece al menos

    U1 veces en la clase Ki y U1 veces como mximo en las otras clases. Se dice que un objeto

    en una clase est cubierto por un rasgo complejo caracterstico si y solo si satisface la

    12 Para conocer como se obtienen tanto la matriz de diferencia como la matriz bsica referirse al Capitulo 1.5

    de [24].

  • 37

    condicin del mismo. El Resto de una clase con respecto a un rasgo complejo caracterstico

    es el conjunto de objetos que no fueron cubiertos por ese rasgo; finalmente un Rasgo

    Complejo Complementario de una clase es un rasgo complejo que ocurre U2 veces en el

    resto de la clase y U2 veces como mximo entre los objetos de clases distintas.

    Algoritmo:

    1. Determinar los conjuntos de apoyo.

    2. Determinar los umbrales necesarios para distinguir los rasgos complejos caractersticos y complementarios.

    3. Calcular los rasgos complejos complementarios de cada clase usando los criterios de comparacin definidos por cada rasgo.

    4. Determinar los restos de cada clase.

    5. Calcular los rasgos complejos complementarios en cada clase usando los criterios de comparacin para cada rasgo.

    6. Determinar los rasgos complejos caractersticos y complementarios que satisface cada patrn a clasificar.

    7. Aplicar la regla de solucin creada segn los objetos cubiertos o la importancia de cada rasgo.

    Puede encontrar ms informacin en [24], [26], [27], [34].

    Conjuntos Representantes

    Este algoritmo es una idea desarrollada por Baskakova y Zhuravlv en la cual se trata de

    evaluar la informacin a favor y en contra de los objetos en las clases; para esto definen los

    Representantes Positivos, Negativos y Neutros de las clases. La idea principal es que para

    una clase en particular, una combinacin de caractersticas o rangos en valores puede tener

    informacin suficiente para caracterizar a esa clase [28].

    Las definiciones para trabajar con este algoritmo son muy similares a las expuestas en el

    algoritmo Kora-. Los rasgos complejos caractersticos de una clase Ki los tomaremos ahora como Representantes Positivos S

    + de Ki; los Representantes Negativos S

    - son

    aquellos rasgos que cumple el umbral establecido para los rasgos complejos caractersticos,

    pero en otras clases y no en la clase actual, mientras que los Representantes Neutros S0 son

    aquellos que no caracterizan ni ms ni menos a la clase.

    La regla de solucin propuesta para este algoritmo consiste en hacer una votacin

    dependiendo del conjunto de representantes encontrados para cada clase y del conjunto de

    apoyo (seleccin de variables). Tomemos S+ como el conjunto de representantes positivos

    de una clase que cumple el patrn Pi y de igual manera tomemos a S- y S

    0 como los

    conjuntos representantes negativos y neutros respectivamente. Al clasificar al patrn se

    calcula para cada clase y para cada conjunto de apoyo:

  • 38

    donde cj es el conjunto de apoyo actual; finalmente se da la pertenencia del patrn a la clase

    Ki si los valores son positivos o negativos o se crea una nueva clase si no cumple con

    ninguno de los representantes elegidos.

    Algoritmo:

    1. Seleccionar los conjuntos de apoyo (seleccin de variables);

    2. Seleccionar el umbral U1;

    3. Para cada clase calcular los representantes positivos, negativos y neutros (S+, S-, S0);

    4. Para cada patrn a clasificar determinar los conjuntos que cumplen en cada clase;

    5. Calcular la votacin para cada clase de cada patrn a clasificar considerando los representantes positivos al conteo de S

    + y los representantes negativos al conteo de

    S+;

    6. Aplicar la regla de solucin usando las votaciones obtenidas en el paso anterior.

    Para mayor informacin revisar: [24], [27], [28].

  • Captulo III Metodologa Propuesta

    III. METODOLOGA PROPUESTA

    III.1 INTRODUCCIN

    A continuacin se presenta el procedimiento que se utiliz para hacer el preprocesamiento a

    la imagen de texto manuscrito extrada del formulario, se describe la interfaz utilizada para

    el desarrollo de la tesis, la forma en que se extraen sus caractersticas y como son

    calculados estos rasgos para posteriormente aplicar los algoritmos del Enfoque Lgico-

    Combinatorio que nos permitan conocer la importancia de un rasgo sobre otros y as

    obtener las reglas de solucin para clasificar las muestras de escritura contenidas o no en la

    base de datos.

    III.2 CARACTERSTICAS REPRESENTATIVAS

    Principalmente existen dos formas de tratar la imagen cuando se trata de obtener las

    caractersticas de una imagen de texto manuscrito. Una de ellas consiste en trabajar con la

    imagen como un todo y hacer un anlisis de textura, es decir, no importa cmo se presente

    la ubicacin de las palabras o letras. La otra forma es extraer caractersticas del texto en la

    imagen; en este caso la ubicacin de las letras, palabras o prrafos son una fuente de

    informacin para extraer otros rasgos. Algunos ejemplos de investigaciones realizadas

    trabajando con texturas son [5], [6], [7], [10], mientras que ejemplos de investigaciones

    usando caractersticas del texto son [1], [2], [8]; es importante marcar esta diferencia ya que

  • 40

    la presente tesis corresponde al segundo grupo pues se extraen caractersticas del texto ya

    sea usando palabras o grafemas. Una ventaja del sistema creado es que el nivel ms bajo de

    anlisis de texto se hace a las palabras y no se trabaja con caracteres; adems, cabe resaltar

    que no importa si se hace una divisin exacta de la palabra en relacin al texto, las

    caractersticas del texto; se pueden obtener tanto a palabras como a grafemas de ellas, sin

    que se alteren drsticamente los rasgos.

    Dentro del sistema se pueden considerar 3 fases:

    Adquisicin de imgenes;

    Preprocesamiento y obtencin de rasgos;

    Seleccin de variables y clasificacin.

    La primera fase consisti en la creacin del formulario para recolectar las muestras de

    escritura; la creacin de una base de datos con Borland C++ Builder y MySql 5.0; la

    extraccin de las partes del texto que corresponden a las muestras de escritura para

    almacenarlas como imgenes independientes; y actualizar la base de datos con la ubicacin

    de las nuevas imgenes. Para extraer las secciones de texto de inters se usaron las marcas

    creadas en la esquina superior izquierda y en la esquina inferior derecha, se alineaba la hoja

    y se recortaba la imagen para tener menos error al extraer el texto.

    El preprocesamiento de la imagen est ntimamente ligado al procedimiento que se usa para

    obtener las caractersticas de texto que se describirn ms adelante.

    Las caractersticas de texto consideradas en nuestro trabajo son las siguientes:

    Caractersticas de Prrafo:

    1. Distancia del texto a los mrgenes izquierdo y derecho (R1 y R2)

    2. Espacio entre renglones sucesivos (R3).

    Caractersticas de Direccin y Espacio:

    1. Espacio entre palabras (R4)

    2. Direccin de la escritura en un rengln (R5).

    Caractersticas de la Zona de Escritura:

    1. Proporcin de la Zona Superior con relacin a la Zona Media de una palabra (R6)

    2. Proporcin de la Zona Inferior con relacin a la Zona Media de una palabra (R7).

    Caracterstica de Inclinacin:

    1. Principal inclinacin en una palabra (R8).

  • 41

    Preprocesamiento de la imagen de texto

    Una vez que se tenan las secciones de texto como una imagen, se le preproces para

    convertirla en una imagen binaria; se trataron dos mtodos diferentes para ello. El primero

    consiste en suavizar la imagen en colores con un filtro de media de 3x3, seleccionar el

    plano verde de esta imagen y umbralarla usando el mtodo de Otsu. Por otro lado, de la

    imagen original en colores se selecciona el plano verde y se umbrala usando el algoritmo de

    Khashman y Sekeroglu [35]. La imagen obtenida con Otsu es muy clara y corta algunas

    regiones importantes de texto, mientras que la imagen obtenida con el segundo mtodo

    tiene mucho ruido; sin embargo, el texto se presenta mucho mejor. Por lo tanto se hace una

    reconstruccin geodsica por erosin usando como mscara a la imagen obtenida con el

    mtodo de Khashman y como marcadora la imagen obtenida mediante umbralado por Otsu,

    logrndose as una imagen binaria con muy poco o ningn ruido y con el texto muy claro.

    El segundo mtodo consiste en usar el mtodo de Khashman para obtener el umbral del

    plano verde de la imagen original; a la imagen binaria obtenida se le extraen aquellos

    objetos que tienen un rea menor que o igual a 20 pixeles y finalmente se hace una

    reconstruccin geodsica por erosin para eliminar el borde de la imagen.

    Caractersticas de Prrafo

    Entre las caractersticas de los prrafos consideramos los espacios a los mrgenes verticales

    (derecho e izquierdo) y la separacin entre los renglones del texto; para esto utilizamos la

    proyeccin horizontal (PH).

    La caracterstica de separacin de la escritura al margen de la hoja se hace despus de

    preprocesar la imagen. Ya binaria la imagen, se corta para tener el texto dentro del

    rectngulo mnimo que lo contiene, se cuenta el nmero de pixeles que se cortaron con

    respecto a la imagen original y se calcula qu porcentaje fue cortado del lado derecho y del

    lado izquierdo, obtenindose as una proporcin por cada margen y los dos primeros rasgos

    de la escritura R1 y R2.

    Para calcular la caracterstica del especio entre renglones sucesivos (R3) se parte de la idea

    de tomar la relacin que existe entre las filas de la imagen que corresponden a texto y las

    filas de la imagen que corresponden a los espacios entre renglones. Para esta caracterstica

    se usa la imagen binaria ya preprocesada del texto y se le rellenan los huecos existentes

    entre letras o trazos, para que a esta ultima imagen se le calcule la Proyeccin Horizontal

    (PH) de la

    Se necesita calcular un limite G para contar los espacios entre letras y palabras, este limite

    es igual al 25% de la mxima frecuencia en la PH, en la Ilustracin 17 se puede observar

    este limite como una lnea roja, el eje X en el grfico corresponde al numero de fila de la

    imagen, mientras que el eje Y representa la frecuencia de pixeles con nivel cero en cada

    fila, esta es la PH de la imagen presentada en la misma ilustracin. (Ilustracin 17).

    Posteriormente las filas que pertenecen a espacios son aquellas que tienen una frecuencia

    en la PH menor que G, en caso contrario una frecuencia mayor- la fila es contabilizada como fila de rengln. Con esto se obtiene una serie de valores que nombraremos (ER) para

    todas aquellas filas que pertenecen a lo ancho del texto o rengln y los valores (EE)

  • 42

    corresponden a las filas que se cuentan como espacios.

    El primero y ltimo elemento de EE se quitan de la lista, ya que no estn entre texto

    (corresponden al espacio del margen superior y margen inferior). Posteriormente se calcula

    el promedio (P) y la desviacin estndar (S) a ambas lis