diseÑo e implementaciÓn de un software de …

132
DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE CORRECCIÓN FONÉTICA PARA NIÑOS CON PROBLEMAS DE APRENDIZAJE. PAOLA MILENA ORTIZ RICO JULIE ANDREA PARRA CARDENAS UNIVERSIDAD DE SAN BUENAVENTURA FACULTAD DE INGENIERÍA PROGRAMAS DE INGENIERÍA ELECTRÓNICA Y SONIDO BOGOTÁ 2007

Upload: others

Post on 29-Jul-2022

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE CORRECCIÓN FONÉTICA PARA NIÑOS CON PROBLEMAS DE APRENDIZAJE.

PAOLA MILENA ORTIZ RICO

JULIE ANDREA PARRA CARDENAS

UNIVERSIDAD DE SAN BUENAVENTURA

FACULTAD DE INGENIERÍA PROGRAMAS DE INGENIERÍA ELECTRÓNICA Y SONIDO

BOGOTÁ 2007

Page 2: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE CORRECCIÓN FONÉTICA PARA NIÑOS CON PROBLEMAS DE APRENDIZAJE.

PAOLA MILENA ORTIZ RICO

JULIE ANDREA PARRA CARDENAS

Trabajo de grado como requisito para optar al titulo de

Ingeniero Electrónico e Ingeniero de Sonido

Nodo de investigación facultad de ingeniería

UNIVERSIDAD DE SAN BUENAVENTURA

FACULTAD DE INGENIERÍA PROGRAMAS DE INGENIERÍA DE SONIDO Y ELECTRÓNICA

BOGOTÁ 2007

Page 3: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

AGRADECIMIENTOS

Queremos expresar nuestros agradecimientos a:

Ing. José Tumialan, por sus conocimientos y aportes durante la culminación del proyecto, a: Ing. Pedro Luis Muñoz, Ing. Miguel Pérez Pereira, C.S. P Olga Lucía Mora y C.S. P Patricia Carreño, tutores y directores por su valiosa colaboración durante la elaboración y desarrollo del mismo.

Aquellas personas que gracias a su orientación y apoyo permitieron la culminación exitosa de esta ardua labor.

Page 4: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

Nota de Aceptación

_____________________________________ _____________________________________ _____________________________________ _____________________________________ _____________________________________ _____________________________________

_____________________________________________

Firma del Presidente del Jurado

_____________________________________________

Firma del Jurado

_____________________________________________

Firma del Jurado

Bogotá, 10 de junio del 2007.

Page 5: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

CONTENIDO

Pág.

INTRODUCCIÓN 16 PLANTEAMIENTO DEL PROBLEMA 18 1.1 ANTECEDENTES 19 1.2 DESCRIPCIÓN Y FORMULACIÓN DEL PROBLEMA 20 1.3 JUSTIFICACIÓN 20 1.4 OBJETIVO DE LA INVESTIGACIÓN 21 1.4.1 Objetivo general 21 1.4.2 Objetivos específicos 21 MARCO DE REFERENCIA 22 2.1 MARCO CONCEPTUAL 23 2.1.1 El lenguaje 24 2.1.2 Reconocimiento de voz 25 2.1.3 Redes neuronales 25 2.2 MARCO LEGAL O NORMATIVO 26 2.2.1 Código de Ética Asociación Colombiana de Fonoaudiología y 27 Terapia del lenguaje (Noviembre, 1999). 2.3 MARCO TEÓRICO 27

2.3.1 Problemas de lenguaje en la pronunciación de fonemas 28

2.3.2 Los rangos distintivos de las consonantes 28

2.3.3 Consonantes explosivas 28

2.3.4 Reconocimiento de Voz 29

Page 6: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

2.3.5 Tratamiento de la señal del habla 29 2.3.6 Principio y final de la palabra 33 2.3.7 Cálculo espectral y caracterización de la voz 33 2.4 FORMANTES 33 2.5 ANÁLISIS LPC 34 2.5.1 Método de autocorrelación 37

2.6 DESVIACIÓN ESTÁNDAR 39

2.7 REDES NEURONALES 39

2.7.1 El Modelo Biológico 40 2.7.2 Estructura de la neurona 40 2.7.3 La Red Backpropagation 41 2.7.4 Estructura de la Red 41 2.7.5 Regla de Aprendizaje 42 2.7.6 Control de la Convergencia 47 3. METODOLOGÍA 49 3.1. ENFOQUE DE LA INVESTIGACIÓN 49 3.2. LÍNEA DE INVESTIGACIÓN 49 3.3 TÉCNICAS DE RECOLECCIÓN DE INFORMACIÓN 49 3.4. POBLACIÓN Y MUESTRA 50 3.5 HIPÓTESIS 50 3.6. VARIABLES 51 3.6.1. Variables Independientes 51 3.6.2 Variables Dependientes 51

Page 7: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

4. PRESENTACIÓN Y ANÁLISIS DE RESULTADOS 52 4.1 ENTREVISTA A FONOAUDIÓLOGOS 52 4.2 DIAGRAMAS DE RECONOCIMIENTO DE PATRONES 55 4.3 ADQUISICIÓN DE LA SEÑAL DE VOZ 55 4.4 PROCESAMIENTO DE SEÑAL 56 4.4.1 Filtrado de la señal adquirida 56 4.4.2 Detección de principio y final de palabra 56 4.5 RECONOCIMIENTO DE PATRONES 59 4.5.1 Detección de formantes 59 4.5.2 Punto de incertidumbre 61

4.6 RED NEURONAL ARTIFICIAL 65

4.7 INTERFAZ GRÁFICA USUARIO (GUI) 70

5. DESARROLLO INGENIERIL 74

5.1 DETECCIÓN DE PICOS MÁXIMOS DE LA SEÑAL 81

5.2 RED NEURONAL ARTIFICIAL 82

5.2.1 Entrenamiento 82

5.3 INTERFAZ GRAFICA DE USUARIO 83

6. RECOMENDACIONES 85 7. CONCLUSIONES 86

BIBLIOGRAFÍA 88

8. ANEXOS 129

Page 8: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

TABLA DE ANEXOS

ANEXO A Encuesta A Fonoaudiologos ANEXO B Líneas De Código: Adquisición De Señal ANEXO C Líneas De Código: Filtrado De La Señal ANEXO D Líneas De Código: Detección De Bordes ANEXO E Líneas De Código: Detección De Formantes ANEXO F Líneas De Código: Red Neuronal ANEXO G Líneas de código: red neuronal entrenamiento Algoritmo backpropagation. ANEXO H Líneas De Código: Diseño Interfaz Grafica ANEXO I Líneas De Código Para La Implementación del Ejecutable.

Page 9: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

LISTA DE TABLAS

Pág

Tabla 1. Rasgos de los fonemas explosivos orales 27 Tabla 2 . Parámetros para la detección sordo/sonoro 33 Tabla 3. Frecuencias formantes para el fonema G 61 Tabla 4. Frecuencias formantes para el fonema K 62 Tabla 5. Frecuencias formantes para la palabra Gato 63 Tabla 6. Frecuencias formantes para la palabra Koala 64 Tabla 7. Rango de intervalos de picos máximos para el fonema G 81 Tabla 8. Rango de intervalos de picos máximos para el fonema K 81 Tabla 9 . Rango de intervalos de picos máximos para la palabra Gato 82 Tabla 10 . Rango de intervalos de picos máximos para la palabra Koala 88

Page 10: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

LISTA DE FIGURAS

Pág Figura 1. Diagrama Aparato Fonador 23 Figura 2 . Muestreo y reconstrucción de una señal continua en el 29 Tiempo Figura 3. Respuesta de un filtro Butterwoth 30 Figura 4. Respuesta de un filtro Chevyshev 31 Figura 5: Diferentes tipos de ventanas utilizadas en el muestreo de 32 una señal Figura 6. Posición de los formantes por ancho de banda 34 Figura 7: Modelo general de tiempo discreto para la producción 35 del habla Figura 8. Representación de la función de transferencia del filtro a 36 partir de los coeficientes de predicción lineal. Figura 9. Redes Neuronales 39 Figura 10. Forma general de una neurona 41 Figura 11. Redes Multicapa 42 Figura 12. Disposición de una red sencilla de tres capas 43 Figura 13. Superficie típica de error 48 Figura 14. Porcentaje de los fonemas K y G entre las dislalias más 52 Comunes Figura 15. Porcentaje para el motivo de diagnosticar una dislalia 53 Figura 16. Porcentaje de los niños en consulta a los cuales se les 53 diagnostica Kappacismo o Gammacismo Figura 17. Porcentaje para determinar si las palabras gato y 54 koala son importantes para trabajar los fonemas k y g Figura 18. Porcentaje para establecer la importancia de que el 54 software incluya imágenes Figura 19. Diagramas de bloque general para el reconocimiento 55 de patrones Figura 20. Diagramas de bloques especifico para el reconocimiento 55 de patrones Figura 21. Diagrama especifico para la red neuronal 65 Figura 22. Topología de la RNA implementada 65 Figura 23. Señal de grabación del fonema g 75 Figura 24. Señal de grabación del fonema gato 75 Figura 25. Señal de grabación de la palabra k 75 Figura 26. Señal de grabación de la palabra koala 76 Figura 27. Señal de filtrado del fonema g 76 Figura 28. Señal de filtrado del fonema k 77 Figura 29 Señal de filtrado de la palabra gato 77 Figura 30. Señal de filtrado de la palabra koala 77

Page 11: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

Figura 31. Señal de detección del inicio del fonema g 78 Figura 32. Señal de detección del final del fonema g 78 Figura 33. Señal de detección del inicio del fonema k 79 Figura 34. Señal de detección del final del fonema k 79 Figura 35. Señal de detección del inicio de la palabra gato 79 Figura 36. Señal de detección del final de la palabra gato 80 Figura 37. Señal de detección del inicio de la palabra koala 80 Figura 38. Señal de detección del final de la palabra koala 80 Figura 39. Ventana de inicio del GUI del software 83 Figura 40. Ventana de inicio del GUI del software de entrenamiento 84 para los fonemas k y g Figura 41. Ventana de inicio del GUI del software de entrenamiento 84 para las palabras koala y gato

Page 12: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

GLOSARIO

ALGORITMO: conjunto de sentencias / instrucciones en lenguaje nativo, los cuales expresan la lógica de un programa.

ALIASING: es el efecto que causa que señales continuas distintas se tornen indistinguibles cuando se les muestrea digitalmente. Cuando esto sucede, la señal original no puede ser reconstruida de forma unívoca a partir de la señal digital.

APARATO FONADOR: conjunto de órganos que intervienen en la producción de sonidos.

APRENDIZAJE: las RNA tienen la habilidad de aprender mediante una etapa que se llama etapa de aprendizaje. Esta consiste en proporcionar a la RNA datos como entrada a su vez que se le indica cuál es la salida (respuesta) esperada.

AUTOCORRELACIÓN: es una función en el dominio de tiempo, una medida de la proporción en que se parecen una forma de señal o una forma de onda a una forma retrasada de si mismas. Está relacionada de cerca al Cepstro. El valor de la autocorelación puede variar entre cero y uno.

AUTOORGANIZACIÓN: es cuando una RNA crea su propia representación de la información en su interior, descargando al usuario de esto.

BACKPROPAGATION: retropropagación, clase de red neuronal en la cual se interconectan varias unidades de procesamiento en capas, las neuronas de cada capa no se interconectan entre sí. Sin embargo, cada neurona de una capa proporciona una entrada a cada una de las neuronas de la siguiente capa, esto es, cada neurona transmitirá su señal de salida a cada neurona de la capa siguiente.

BIT: se le denomina bit a cada posición donde exista un dígito binario, es decir 1 ò 0.

CEPSTRO: consiste en tomar un espectro de un espectro, se trata a un espectro como si fuera una forma de onda, y se hace otro espectro a partir del primero.

DISARTRIA: es una alteración del lenguaje producida por una lesión cerebral. Se distingue de las afasias motrices en que no se presentan alteraciones en la prolongación ni en la secuencia del lenguaje sino dificultades asociadas con los componentes fonológicos, es decir con la realización de los sonidos del lenguaje.

DISFASIA: es la pérdida parcial del habla debida a una lesión cortical en las áreas específicas del lenguaje.

DISFEMIAS: son alteraciones del lenguaje caracterizadas por tropiezos, espasmos y repeticiones debido a una imperfecta coordinación de las funcio

Page 13: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

ideomotrices cerebrales.

DISLEXIA: incapacidad de algunas personas para leer y escribir correctamente, sin tener por otro lado, una deficiencia intelectual, ni motriz ni visual o en cualquier otro ámbito.

ENTRENAMIENTO: es el proceso por el cual los parámetros de la red se adecuan de acuerdo a la solución de cada problema. También se denomina genéricamente programación

FILTRO DIGITAL: un filtro es un sistema que discrimina lo que pasa a su través de acuerdo a algunos parámetros. Los filtros digitales tienen como entrada una señal analógica o digital y a su salida tienen otra señal analógica o digital, cambiado en amplitud y/o fase dependiendo de las características del filtro.

FONEMA: cada uno de los sonidos simples del lenguaje hablado denominado unidad fónica. FONETICA ACÚSTICA: estudia los mecanismos por los cuales el oyente es capaz de identificar las unidades de comunicación que constituyen el mensaje hablado. FONOAUDIOLOGÍA: estudia y aborda científicamente la comunicación interpersonal, oral, lecto-escrita y gestual; las alteraciones que en ella se presentan por factores de naturaleza ambiental, biológica, psicológica y/o social en las diferentes áreas que la constituyen: el habla (voz, articulación, fluidez, procesos miofuncionales y deglución, entre otros); el lenguaje (comprensión y expresión) y la audición.

FORMANTES: es la resonancia producida en el tracto vocal, en promedio aparece un formante por cada Khz.

FRECUENCIA DE MUESTREO: (tasa de muestreo) cantidad de muestras por unidad de tiempo. Cuanto mayor sea, mayor es la respuesta en frecuencia del sistema.

FUNCIÓN DE TRANSFERENCIA: es una función matemática, determina las variables de salida dependiendo de las señales de entrada.

GAMMACISMO: trastorno del lenguaje caracterizado por dificultad o imposibilidad de de pronunciar correctamente o fonema /g/.

HABLA: es la capacidad de los seres humanos para comunicarse por medio de signos establecidos, correspondientes al lenguaje escrito u oral.

INTERFAZ DE USUARIO: es el conjunto de componentes necesarios para que exista una comunicación entre usuario y el computador.

KAPPACISMO: trastorno del lenguaje caracterizado por dificultad o imposibilidad

Page 14: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

14

de de pronunciar correctamente o fonema /k/.

LENGUAJE DE PROGRAMACIÓN: es un conjunto de sintaxis y reglas semánticas que definen los programas del computado.

LPC: coeficientes de predicción lineal.

MUESTREAR: Discretización en el tiempo, el muestreo consiste en tomar valores de la señal a intervalos regulares de tiempo.

NEURONAS: una neurona es una célula nerviosa, o elemento fundamental de la arquitectura nerviosa. Es la unidad funcional que transporta los impulsos nerviosos

PALABRA: conjunto de fonemas articulados que expresan una idea

PESOS: hacen referencia a las conexiones sinápticas biológicas, el conjunto de los pesos determina el conocimiento de la RNA y tiene la propiedad de resolver el problema para el que la RNA ha sido entrenada.

PROCESAMIENTO DIGITAL DE SEÑAL: estudia las señales de voz a partir de una representación digital mediante la combinación del proceso digital de la señal y el procesamiento del lenguaje. RASGOS DISTINTIVOS: son las unidades inferiores al fonema, que pueden definirse en el nivel articulatorio o acústico. RED NEURONAL: son un paradigma de aprendizaje y procesamiento automático inspirado en la forma en que funciona el sistema nervioso. Se trata de un sistema de interconexión de neuronas en una red que colabora para producir un estímulo de salida. RESOLUCION: número de bits utilizado para tomar una muestra, entre mayor resolución mejor será la representación de la amplitud de la señal.

SEÑAL DE AUDIO: una señal de audio es una señal electrónica que es una representación eléctrica exacta de una señal sonora. Normalmente está en el rango de frecuencias audibles por los seres humanos que está entre los 20 y 20000 hercios (Hz), aproximadamente

SILABA: se entiende como el conjunto de letras, en donde la pronunciación emplea solo una emisión de voz.

SÍNTESIS DE VOZ: es la capacidad que tiene un computador para producir lenguaje de forma oral, esta puede ser generada a partir de fonemas, silabas y palabras.

SOFTWARE: es la parte lógica del ordenador, conjunto de programas que puede ejecutar el hardware para la realización de las tareas de computación a las que se destina. Es el conjunto de instrucciones que permite la utilización del equipo.

Page 15: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

15

TOPOLOGÍA: es realizada a partir del patrón de conexión que presenta, pueden ser del tipo monocapa o multicapa.

VENTANAS: son funciones matemáticas usadas con frecuencia en el análisis y el procesamiento de señales para evitar las discontinuidades al principio y al final de los bloques analizados.

VOZ: es el sonido que produce el aire expelido por los pulmones a través de la laringe haciendo que vibren las cuerdas vocales.

Page 16: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

16

INTRODUCCIÓN

Una de las principales características que diferencian al ser humano es su capacidad de comunicación oral. No poder comunicarse (oralmente), de forma correcta dificulta la vida en sociedad; Este es un problema que impide a miles de personas lograr un desarrollo adecuado de sus facultades de aprendizaje tales como lectura, escritura y expresión verbal. Para que exista el lenguaje1 se requieren ciertos factores: de índole fisiológico (el organismo tiene que ser capaz de emitir sonidos); gramatical (el discurso tiene que poseer una estructura), y semántico (es imprescindible que la mente pueda entender lo que se habla). En una conversación casual intervienen varios agentes que permiten la correcta integibilidad e interpretación de la palabra, como la adecuada pronunciación por parte del emisor hacia el receptor para que las ideas puedan ser captadas correctamente y de esta manera responder acorde al dialogo. Esta emisión de palabras se logra mediante el aparato fonador y la producción de ondas producidas a través de este. En una segunda etapa de la comunicación el oído interno tiene como función captar las ondas acústicas y convertirlas en impulsos nerviosos para poder ser procesadas en el cerebro. Este proceso es realizado por el órgano de Corti que está compuesto por las células sensoriales auditivas llamadas células pilosas, las cuales transforman la energía mecánica de las ondas sonoras en energía nerviosa. Cabe resaltar que estas células no poseen capacidad regeneradora lo cual genera pérdidas auditivas irremediables con la edad. Si en las etapas de comunicación anteriormente mencionadas se presenta alguna falencia se debe realizar una evaluación al paciente (en este caso niños), que establezca el grado y origen del trastorno presentado. Las dificultades comúnmente relacionadas al tema del lenguaje son (Disartrias, Dislexia, Disfasia, entre otras). Debido a los trastornos del lenguaje mencionados anteriormente, han surgido avances tecnológicos en el campo informático, con respecto al tema de la comunicación oral, generando métodos que permiten captar la voz humana hacia los ordenadores, de forma rápida y con medios que no resultan ser tan costosos. El reconocimiento de voz, es de gran utilidad en el desarrollo de herramientas dirigidas a aquellas personas que poseen un cierto tipo de dificultad en su entorno, puesto que facilita las actividades realizadas diariamente. Este

1 BASIL, B . Theoretical Studies Towards a Sociology of Language Inglaterra: El Roure . 1971 p. 15

Page 17: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

18

proceso es ejecutado a través de sistemas tales como (Redes Neuronales, Modelos ocultos de Markov, Espectrogramas) entre otros. Las redes neuronales se caracterizan por sus funciones biológicas que permiten simular operaciones realizadas por el sistema nervioso central humano, mediante la implementación de algoritmos. La red backpropagation se ha convertido en una de las herramientas más utilizadas en el reconocimiento de voz gracias a su arquitectura y efectividad. Debido a los proyectos realizados anteriormente en el país, relacionados con el tema de corrección fonética y reconocimiento de voz se encontró que actualmente existen diferentes ayudas o herramientas de corrección, pero ninguna especifica para los fonemas seleccionados. Este proyecto desarrolla e implementa una técnica de ayuda para el aprendizaje y la correcta pronunciación, de los fonemas K y G incluyendo las palabras Gato y Koala, permitiendo que los niños realicen terapias de lenguaje en casa y en el consultorio con ayuda de los fonoaudiólogos. Este proceso se realiza mediante un software desarrollado por medio de redes neuronales a través del algoritmo Backpropagation. Gracias a esta ayuda es posible que los niños tengan la posibilidad de escuchar y expresarse con una correcta pronunciación de las consonantes en las cuales presentan dificultad y de esta manera realizar una corrección pertinente, con ayudas visuales para su mejor interpretación.

Page 18: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

18

1. PLANTEAMIENTO DEL PROBLEMA 1.1 ANTECEDENTES En estudios realizados en el área de fonoaudiología, se han hallado diferentes causas que producen dificultad en la pronunciación de algunos fonemas. Entre estos se pueden mencionar (Dispraxia, Dislexia, Disartria, Disfasia, Disfemia, entre otras); las cuales requieren de un tipo de tratamiento especializado, según el diagnóstico hecho por el fonoaudiólogo. Dependiendo del grado de dificultad encontrado durante la evaluación, se define el tipo de tratamiento y la clase de seguimiento que se requiere.

Se han implementado varias ayudas en algunos centros especializados en el tema. En Colombia las terapias de lenguaje dirigidas por profesionales en fonoaudiología, cuentan con recursos visuales como láminas, cartillas y una pronunciación correcta de los fonemas. Se han desarrollado proyectos universitarios basados en el reconocimiento de voz, implementando software y herramientas, útiles a personas con ciertas limitaciones.

En la actualidad el uso de microordenadores se ha convertido en una experiencia normal tanto en el colegio como en casa, la década de los 90 asintió a la expansión de las posibilidades de los ordenadores, facilitando el acceso y la tecnología para los centros con alumnos que presentan dificultad en el aprendizaje. La tecnología puede beneficiar a los estudiantes con dificultad de aprendizaje de la siguiente manera: Aumenta el potencial de los individuos, compensa los efectos de las dificultades, proporciona modos alternativos de representación de actividades. Cuando se habla de medios de comunicación y nuevas tecnologías aplicadas a los alumnos con necesidades educativas especiales, hay que tener en cuenta por una parte los materiales que puedan ser de ayuda y beneficio para este tipo de alumnos, y por otra la diversidad de materiales que pueden facilitar el trabajo a los propios maestros para que avancen los educandos.

Por este motivo, se pretende hacer una breve recopilación de materiales tecnológicos que pueden servir como recursos educativos para los profesores, alumnos e incluso para los propios padres para reforzar conocimientos en casa. Por otro lado, también se tiene en cuenta, no sólo el tipo de dificultad sino también su grado. Atendiendo a esto se debe emplear un tipo de material u otro. A continuación se realiza una breve descripción de algunas herramientas educativas comúnmente usadas:

El sistema TE SIGNO2: Programa compuesto por más de 1500 signos, fotografías y clips de vídeo para el aprendizaje bimodal. Esta aplicación

2 DEUTSCH, Deborah S. Bases Psicopedagógicas de la Educación Especial. Nashville, Tennessee: Pearson Prentice Hall, 2003. p.137

Page 19: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

18

pretende acercar las tecnologías de la Información y de la comunicación al ámbito educativo especial.

Algunas de las ventajas que ofrece su uso son: Poder aprender signos básicos, utilizar centros de interés, permite adaptar el aprendizaje a las necesidades del alumno.

El sistema ACCESIBILIDAD PARA TODOS: Todos los productos de este software están desarrollados en colaboración con un equipo multidisciplinar de profesionales (pedagogos, psicólogos, logopedas y profesores), que trabajan diariamente con alumnos y adultos con dislexia y con dificultades de aprendizaje de escritura o de lectura. DiDoc es un instrumento imprescindible para personas con dislexia. Aunque principalmente se trabaja a través de un escáner, el programa también permite trabajar con archivos en formato de imagen, como planos y diseños del disco duro, unidades externas (CD, DVD etc.) o bien procedentes de un servidor central.

El sistema EL ARTE DE CONTAR SIN CONTAR: La unidad comienza con la descripción e introducción de los distintos tipos de problemas de Recuento: selección, colocación, partición y descomposición. Para dar paso a la explicación y situaciones que describen los principios básicos del calculo.

LA INTEGRACIÓN DE ALUMNOS ESPECIALES: Esta Unidad tiene el objetivo de garantizar una atención educativa de calidad para los niños y los jóvenes con necesidades educativas especiales, otorgando prioridad a los que presentan discapacidad. Esto se lleva a cabo mediante el fortalecimiento del proceso de integración educativa y de los servicios de educación especial

Se han consultado algunas fuentes correspondientes al tema para el idioma español y para otra lenguas, tanto en el contexto local como internacional y teniendo en cuenta los desarrollos por entidades especializadas en el tema de audición y producción de fonemas. Algunos de los proyectos encontrados se mencionan a continuación:

El sistema JIE YAN3 desarrollado en China busca sintetizar una imagen humana en tres dimensiones (3d) realizando la articulación bucal en tiempo real a partir de un texto escrito por el usuario.

El proyecto de R. COLE desarrollado en Inglaterra abarca varias tecnologías de reconocimiento, síntesis de voz y animación facial.

Estos proyectos han sido desarrollados sin pretender implementar métodos alternativos de ayuda y formar parte de alguna terapia para personas con dificultas de comunicación oral.

El sistema VISHA desarrollado en España, es un sistema basado en el cálculo

3 www.unesco.org.uy , Bernal Bermúdez Jesús, Congreso Internacional De Informática En La Educación, Madrid España.

Page 20: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

19

espectral de la señal de voz y procesamiento posterior para su caracterización.

En España han surgido proyectos de caracterización y simulación de fonemas mediante animación (3d), para personas con un mayor grado de comprensión, y simulación de las articulaciones. En el campo de la medicina incluyendo la fonoaudiología, la inteligencia artificial o redes neuronales (RNA) se han convertido a través del tiempo en un conjunto de técnicas de evaluación de procesamiento automático basado en la forma como funciona el sistema nervioso. Estas redes simulan las propiedades observadas en los sistemas neuronales biológicos a través de modelos matemáticos recreados mediante mecanismos artificiales. El objetivo es obtener una respuesta similar a la que el cerebro es capaz de emitir.

1.2 DESCRIPCIÓN Y FORMULACIÓN DEL PROBLEMA

En las investigaciones y consultas realizadas en la actualidad se ha encontrado que en la mayoría de instituciones especializadas en el tema de terapias de lenguaje no cuentan con herramientas suficientes para el desarrollo completo de las mismas, resultando ser monótonas. No obstante las terapias realizadas actualmente no cubren las necesidades presentadas en la población de niños con problemas de aprendizaje, debido a que los costos de las mismas oscilan entre $ 15.000 y $ 70.000, dependiendo de la institución y de las herramientas de trabajos con las que cuentan estos lugares, en algunos casos son modelos desactualizados y poco innovadores los cuales no generan interés en los niños.

Dadas las circunstancias presentadas por algunos centros de corrección de lenguaje se ha planteado ¿Qué herramienta permite realizar una terapia de lenguaje, para niños que presentan problemas en el aprendizaje?

1.3 JUSTIFICACIÓN En los niños, el sistema consonántico está completo (a excepción de los fonemas r, rr) con la pronunciación de los alófonos implosivos y los grupos consonánticos (gl, bl, kl etc) a la edad de tres años. El dominio completo del sistema fonológico puede ponerse entre los tres y cinco años de edad. A partir de los cinco años de edad se considera que existe un problema de dislalia en la pronunciación del niño si se omiten ciertos fonemas o son reemplazados por otros. Las dificultades de lenguaje en muchos de los casos están relacionadas con los problemas de aprendizaje, debido a la estrecha relación existente entre los dos, es importante realizar una detección temprana de las causas de las dificultades presentadas en el lenguaje o en el aprendizaje. Ya que estas juegan un papel esencial en el sistema cognitivo, de las habilidades de lecto-escritura y de la competencia social. Por todo esto, el retraso en la adquisición del lenguaje respecto al patrón de lenguaje de desarrollo considerado normal,

Page 21: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

20

no debe ser subestimado ya que tiene profundas implicaciones tanto en el desarrollo intelectual como el desarrollo social de los niños.

Los estudios actualmente realizados en fonoaudiología demuestran que los fonemas oclusivos velares se encuentran entre unos de los grupos de dislalias especificas más comunes entre la población infantil en edades de 4 a 7 años. Entre el grupo de los fonemas oclusivos velares se pueden encontrar la G (oclusivo velar sonoro) y la K (oclusivo velar sordo), dado que los niños tienden a reemplazar o a omitir ciertos fonemas por otros que se asemejen en su pronunciación y articulación. Entre las dislalias específicas, se encuentran el Gammacismo o ausencia del fonema "g" (a,o,u) que se sustituye por "l", "t" o "d" y Kappacismo o ausencia del fonema "k" que se sustituye por el fonema "t". Estas dificultades se producen por una mala posición articulatoria del aparato fonador. Según el tipo de alteración del lenguaje se requiere de una terapia especializada, guiada por un fonoaudiólogo y con cierto grado de continuidad dependiendo el caso.

El software es enfocado específicamente en niños con problemas de lenguaje y fonoaudiólogos que requieran de este sistema como implemento de trabajo, además aquellos niños que no pueden contar con una serie de terapias continuas. Este proyecto es una forma novedosa de enseñanza, con carácter social que pretende solucionar ciertas falencias existentes en centros especializados que no cuentan con un apoyo financiero pero cumplen con una obra social para el país, además de esto es una forma de corrección para el español (colombiano), de forma actual y de fácil manejo, con una variedad en el menú que permite realizar diferentes aplicaciones.

Mediante la implementación del software se pretende facilitar el acceso a una terapia no personalizada la cual motive al niño y le permita practicarla en casa de forma interactiva cuantas veces sea necesario. Y a la familia monitorear el progreso a través de cada sección. Los resultados obtenidos deben ser confiables y precisos, para que este proceso sea logrado se requiere de la comparación de las señales de voz, para la cual existen varios métodos de redes neuronales, entre ellos el Backpropagation (retropropagación), que ha sido utilizado en el reconocimiento de patrones en la actualidad, este tipo de, algoritmo consiste en una regla de aprendizaje aplicada en modelos de redes con más de dos capas de neuronas. Tiene la capacidad de autoadaptar los pesos de las capas intermedias para aprender la relación que existe entre un conjunto de patrones dados y sus salidas correspondientes.

1.4 OBJETIVO DE LA INVESTIGACIÓN

1.4.1 Objetivo general

Diseñar e implementar una herramienta de enseñanza didáctica para terapias correctivas en la pronunciación de algunos fonemas del lenguaje español (colombiano), para niños con dificultad en el lenguaje.

Page 22: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

21

1.4.2 Objetivos específicos

• Delimitar la población a la cual va ser dirigido el proyecto, teniendo en cuenta las dificultades en el lenguaje presentadas en los niños de edades de 5 a 7 años.

• Definir los fonemas que presentan mayor dificultad en la pronunciación para la creación de los patrones y la base de datos.

• Identificar la didáctica como estrategia en el diseño de la interfaz gráfica de usuario de acuerdo a la población a la cual se dirige el proyecto.

• Determinar el contenido de la base de datos listando imágenes y palabras de acuerdo a los fonemas escogidos.

• Desarrollar un software con varios niveles de dificultad donde el niño y su tutor puedan monitorear sus progresos.

• Grabar la señal de entrada capturada a través de un MIC para realizar con esta un procesamiento digital de señal

• Realizar el tratamiento de la señal muestreada para ser introducida a una red neuronal teniendo en cuenta cada uno de los métodos existentes.

• Diseñar, preparar y entrenar una red neuronal para reconocimiento de la señal

• Comparar una señal grabada preestablecida con la señal obtenida del paciente, y determinar el grado de semejanza o de diferencia por medio de una red neuronal artificial.

• Cuantizar el número de aciertos y de errores que tenga el paciente durante la ejecución del software con el fin de que éste y el fonoaudiólogo puedan monitorear los aciertos obtenidos.

• Realizar el ejecutable del software planteado.

1.5 ALCANCES Y LIMITACIONES

1.5.1 ALCANCES

Diseño e implementación de un software de corrección fonética para niños con problemas de aprendizaje.

El proyecto cumple una labor social e investigativa de tipo tecnológico y educativo en el cual se involucran estudios relacionados con áreas aplicadas a

Page 23: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

22

los conocimientos adquiridos.

El proyecto está contemplado para realizar un software con dos niveles de corrección, a dos fonemas pertenecientes al lenguaje español (Colombiano) seleccionados entre una población de niños de 5 a 7 años.

Esta herramienta es asequible, de fácil manejo, siendo operada de forma sencilla y confiable. Permite que los niños a través de la interfaz grafica puedan sentirse motivados al utilizarla en su aprendizaje, y lograr la corrección de los fonemas G y K, junto con las palabras alusivas tales como GATO y KOALA.

1.5.2 LIMITACIONES

• Es importante una elección adecuada del software de programación puesto que algunos de estos programas requieren de cierta capacidad de memoria para su ejecución

• Se tendrá en cuenta el tiempo de aprendizaje que tarda una red neuronal en su entrenamiento.

• Debido a que el diseño y entrenamiento de una red neuronal puede tardar dependiendo del tipo de aprendizaje que esta requiera, la base de datos queda reducida a los fonemas G y K.

• El software se limita a una población de niños entre los 5 a 7 años de edad, que presenten problemas de aprendizaje de los fonemas G y K.

Page 24: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

23

2. MARCO DE REFERENCIA

2.1 MARCO CONCEPTUAL

El lenguaje y la fonoaudiología son dos áreas que se complementan para que exista una comunicación correcta entre los seres humanos y exista una relación con el entorno.

2.1.1 El Lenguaje 4. Es una habilidad de todo ser humano que permite expresar y percibir estados afectivos, conceptos, ideas, por medio de signos acústicos o gráficos, cada uno de los sonidos simples del lenguaje hablado se denomina fonema, y sílaba al conjunto de letras en donde la pronunciación emplea solo una emisión de voz. El conjunto de fonemas articulados que expresan una idea forman una palabra.

En el lenguaje español (Colombiano) existe una clasificación para el tipo de pronunciación y articulación de los fonemas, entre las cuales se encuentran: según el lugar de articulación: Bilabiales, se realizan con los dos labios, como la p, la b y la m, labiodentales, se pronuncian con el labio inferior y los dientes superiores, como la f. Interdentales, se realiza con la lengua entre los dientes, como la c y la z, dentales, son las que se realizan con la lengua sobre la parte posterior de los dientes, como la t y la d, alveolares, se pronuncian con al lengua en la raíz de los dientes, como la s, n, r, l; paladares, se realizan con la lengua sobre el paladar, como la, ñ, velares, se pronuncian en el velo del paladar o campanilla, como la g, j, k.

Clasificación según el modo de articulación: Oclusivas, se pronuncian con un breve cierre de la boca seguida de una pequeña explosión, como la p, t, k, b, d, g. Sordas Sonoras Fricativas, se pronuncian con un estrechamiento del canal de la boca, son la s, f, g, j, x, c, z, africadas, tienen primero una fase de oclusión y después una fase de fricación, es decir, primero cierre y luego estrechamiento, como la y. Nasales, se pronuncian emitiendo parte del aire por la nariz, son la m, n, ñ, las liquidas, tienen mayor sonoridad que otras consonantes y pueden agruparse con otras para formar silabas, se dividen en dos: laterales, el aire sale por ambos lados de la lengua, como la l. Vibrantes: como la r y la rr. La “r” se pronuncia con una sola vibración y la “rr” se pronuncia con varias vibraciones

Durante el desarrollo del lenguaje se pueden producir ciertos problemas que se pueden derivar en un trastorno del lenguaje, las alteraciones del lenguaje se generan por la mala articulación de los movimiento en los órganos articulatorios esto se conoce como dislalia, lo que genera que la fonoaudiología estudie la

4 BASIL, B . Theoretical Studies Towards a Sociology of Language Inglaterra: El Roure . 1971 p. 59

Page 25: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

24

causa por las cuales se producen este tipo de alteraciones además de brindar terapias correctivas dependiendo de la evaluación realizada al paciente.

Según los diagnósticos emitidos por los fonoaudiólogos se pueden presentar diferentes tipos de dificultades de lenguaje dependiendo de la consonante o vocal a la cual esté relacionado. Entre las dislalias específicas podemos mencionar el Kappacismo y el Gammacismo las cuales presentan incapacidad articulatoria en las consonantes K y G respectivamente.

2.1.2 Dificultad en el aprendizaje 5: La dificultad en el aprendizaje es un termino general que se refiere a un grupo heterogéneo de desordenes manifestados por las dificultades significativas en la adquisición y el uso de las capacidades de audición, habla, lectura escritura, razonamiento y habilidades matemáticas. Estos desordenes intrínsecos al individuo, se piensa que se deben a una disfunción del sistema nervioso central y que puede suceder en cualquier momento. Los problemas en las conductas autorreguladoras, la percepción social pueden coexistir junto con las dificultades en el aprendizaje, pero no por si mismas constituyen una dificultad en el aprendizaje.

Las dificultades de aprendizaje se clasifican en Problemas Generales de Aprendizaje y Trastornos Específicos de Aprendizaje:

- Problemas generales de aprendizaje : Se manifiesta un retardo general de todo el proceso de aprendizaje, observándose lentitud, desinterés, deficiencia en la atención y concentración, afectando el rendimiento global. Estas características se presentan en niños con un desarrollo normal y con inmadurez en el área cognitiva o verbal, lo que provocaría una lentitud para aprender. También es posible ver estas manifestaciones en niños con retardo mental, dificultades auditivas severas y alteración en la psicomotricidad.

- Trastorno específico de aprendizaje : Se manifiestan en niños con inteligencia normal o alrededor de lo normal que carecen de alteraciones sensomotoras o emocionales severas. Su ambiente sociocultural y educacional es satisfactorio. No logran un rendimiento escolar normal y presentan dificultades reiteradas en ciertas áreas del aprendizaje, funcionando bien en algunas y mal en otras. Estas dificultades dependen de alteraciones en el desarrollo, la maduración psíquica y neurológica.

La presencia de las dificultades se da en diferentes niveles de aprendizaje: recepción, comprensión, retención y creatividad en relación a su edad mental y ausencia de alteraciones sensoriales graves. Aprenden en cantidad y calidad inferior a lo esperado en relación a su capacidad. Este desnivel entre el potencial y la capacidad de aprendizaje se produce por alteraciones psiconeurológicas.

5 DEUTSCH, Deborah S. Bases Psicopedagógicas de la Educación Especial. Nashville, Tennessee: Pearson Prentice Hall, 2003. p.137

Page 26: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

25

2.1.5 Didáctica: Etimológicamente, didáctica deriva del griego didaskein (enseñar) y tekne (arte), esto es, arte de enseñar, de instruir. La didáctica es ciencia y arte de enseñar. Es ciencia en cuanto investiga y experimenta nuevas técnicas de enseñanza, teniendo como base la filosofía. Es arte, cuando establece normas de acción o sugieren formas de comportamiento didáctico basándose en los datos científicos y empíricos de la educación; esto sucede porque la didáctica no puede separar teoría y práctica. Ambas deben fundirse en un solo cuerpo, procurando la mayor eficiencia de la enseñanza y su mejor ajuste a las realidades humana y social del educando. De un modo más explicito, puede decirse que la didáctica está representada por el conjunto de técnicas a través de las cuales se realiza la enseñanza; para ello reúne y coordina, con sentido practico, todas las conclusiones y resultados a que arriban las ciencias de la educación, a fin de que dicha enseñanza resulte más eficaz. La didáctica es una disciplina orientada en mayor grado hacia la práctica, toda vez que su objetivo primordial es orientar la enseñanza. A su vez, la enseñanza no es más que la dirección del aprendizaje. Luego, en ultima instancia, la didáctica esta constituida por un conjunto de procedimientos y normas destinados a dirigir el aprendizaje de la manera más eficiente que sea posible.

• Elementos Didácticos: La didáctica tiene que considerar seis elementos fundamentales que son, con referencia a su campo de actividades: El alumno, los objetivos, el profesor, la materia, las técnicas de enseñanza y el medio geográfico, económico, cultural y social. El alumno. El alumno es quien aprende; al que por quien y para quien existe la escuela. Siendo así, esta claro que la escuela la que debe adaptarse a el, y no el a la escuela. Esto debe interpretarse de un modo general. En la realidad debe existir una adaptación reciproca, que se orienta hacia la integración, esto es, hacia la identificación entre el alumno y la escuela. Los Objetivos. Toda acción didáctica supone objetivos la escuela no tendría razón de ser sino tuviese en cuenta la conducción del alumno hacia determinadas metas, tales como: modificación del comportamiento, adquisición de conocimientos, desenvolviendo de la personalidad, orientación profesional, etc. El profesor. El profesor es el orientador de la enseñanza debe ser fuente de estímulos que lleva al alumno a reaccionar para que se cumpla el proceso del

Page 27: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

26

aprendizaje. El deber del profesor es tratar de entender a sus alumnos. Lo contrario es mucho más difícil y hasta imposible. El profesor debe distribuir sus estímulos entre los alumnos en forma adecuada, de modo que lo lleve a trabajar de acuerdo con sus peculiaridades y posibilidades. La materia. La materia es el contenido de la enseñanza. A través de ella serán alcanzados los objetivos de la escuela para entrar en el plan de estudios, la materia debe someterse a dos selecciones:

1. la primera selección es para el plan de estudios se trata de saber cuales son las materia más apropiadas para que se concreten los objetivos de la escuela primaria, secundaria o superior. En este aspecto es importante el papel que desempeñan la psicología y la sociología, en lo que atañe a la tención de los intereses del educando y sus necesidades sociales.

2. la segunda selección es necesaria para organizar los programas de las diversas. Dentro de cada asignatura es preciso saber cuales son los temas o actividades que deben seleccionarse en merito a su valor funcional, informativo o formativo.

Métodos y técnicas de enseñanza: tanto los métodos como las técnicas son fundamentales en la enseñanza, y deben estar, lo más próximo que sea posible a la manera de aprender de los alumnos. Métodos y técnicas deben propiciar la actividad de los educados, pues ya ha mostrado la psicología del aprendizaje la superioridad de los procedimientos activos sobre los pasivos. Medio geográfico, económico, cultural y social. Es indispensable para que la acción didáctica se lleve a cabo en forma ajustada y eficiente tomar en consideración en medio donde funciona la escuela, pues solamente así podrá ella orientarse hacia las verdades exigencias económicas, culturales y sociales. La escuela cumplirá cabalmente su función social solamente si considera como corresponde el medio al cual tiene que servir, de manera que habilite al educando para tomar conciencia de la realidad ambiental que lo rodea y en la que debe participar. - Recursos Audiovisuales en la Didáctica Los objetivos de los recursos audiovisuales propiamente dichos serian aquellos que asocian elementos auditivos y visuales.

1. Despertar y atraer la atención. 2. contribuir a la retención de la imagen visual y de la formación.

3. Favorecer la enseñanza basada en la observación y en la

experimentación.

Page 28: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

27

4. Facilitar la apreciación sugestiva de un tema o de un hecho en estudio.

5. Ayudar a formar imágenes correctas, ya que cada uno puede percibir la información oral según su capacidad de discernimiento y su experiencia anterior. En caso de que la enseñanza sea solamente verbal, se corre el riesgo, al finalizar la clase, de que cada alumno interprete de manera diferente lo que dijo el profesor.

6. Ayudar a una mejor compresión de las relaciones de las partes con el

todo de un tema, objeto o fenómeno.

7. Contribuir a la formación de conceptos exactos, principalmente lo que atañe a los temas de difícil observación directa.

8. Mejorar la fijación y la integración del aprendizaje.

9. Hacer que la enseñanza sea más objetiva, concreta y a la vez más

próxima a la realidad.

10. Dar oportunidad para efectuar un mejor análisis y una correcta interpretación del tema presentado, teniendo al fortalecimiento del espíritu crítico.

Por ultimo, los recursos audiovisuales ayudan, con más eficacia, a la formulación de conceptos, a despertar intereses y a asumir aptitudes de comportamiento y aceptación.

• Elementos básicos de los recursos audiovisuales: Los recursos audiovisuales deben constar de algunos elementos que son básicos para que la enseñanza sea realmente eficiente. Estos son:

1. Exactitud, o sea, la representación fidedigna de los datos o de lo esenciadle un hecho.

2. Actualidad esto es la necesidad de que, de acuerdo con la índole del

hecho, reflejen las características que les ofrece el presente. 3. Imparcialidad, cuando se trate de hechos que tengan implicaciones

políticas, sociales, económicas, filosóficas, etc. 4. Cualidad, si es que realmente favorecen la adquisición de

conocimientos, actitudes y valores. 5. Finalidad, si están de acuerdo con los objetivos de planteamiento de la

enseñanza.

Page 29: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

28

6. Utilidad, si ofrecen posibilidades operacionales para los alumnos y el profesor.

7. Sencillez, ya que entre más complicados menos eficientes son.

8. Aplicabilidad, es decir que deben guardar relación con el tema dado.

9. Interés, o sea que deben despertar el interés de los alumnos a los

cuales están destinados.

10. Comprensión, es decir, no deben dar margen a dudas y a confusiones; deben ser de fácil percepción.

11. presentación, esto es, deben obedecer a los principios psicológicos de

percepción y estética, de modo que facilite la aprobación por parte de los alumnos.

- Los software como medio educativo 6: Así como existen profundas diferencias entre las filosofías pedagógicas, así también existe una amplia gama de enfoques para la creación de software educativos atendiendo a los diferentes tipos de interacción que debería existir entre los actores del proceso de enseñanza aprendizaje: educador, aprendiz, conocimiento, computador. El enfoque de la instrucción asistida por computadora pretende facilitar la tarea del educador, sustituyéndole parcialmente en su labor. El software educacional resultante generalmente presenta una secuencia (a veces establecida con técnicas de inteligencia artificial) de lecciones, o módulos de aprendizaje. También generalmente incluye métodos de evaluación automática, utilizando preguntas cerradas.

Tipos de software educativo.

- Actividades de repetición y práctica : adaptado a actividades de todo tipo, se presenta una pregunta que al responderla el estudiante, la responde y si está errado la computadora le pide al usuario que intente otra vez, hasta lograrlo o hasta que pida la respuesta correcta de la computadora para que el estudiante la compare con la suya y determine si hay acierto o error. Se repite tantas veces como sea necesario.

- Sistema tutorial : la computadora cumple las funciones de un tutor o guía y es capaz de introducir al estudiante en nuevos conceptos y materiales, extendiendo a lecciones anteriores. Son de uso individual y el avance es controlado por cada estudiante. Sirven para introducir a la persona, paso a paso en una nueva habilidad.

6 www.rena.edu.ve/SegundaEtapa/tecnologia/software .htm Gutiérrez, Juan. Girasol. Caracas: Editorial Eneva.Universidad Nacional Abierta (1992). Introducción a la informática. Caracas: UNA.

Page 30: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

29

- Simulaciones, demostraciones y juegos educativos: Se estimula al usuario por medio de la interacción, se establece un diálogo entre el estudiante y la computadora. Las simulaciones proveen a los usuarios la posibilidad de estar observando un evento, y participar en ellos como si estuviera jugando, esto se denomina realidad virtual. Incluso brinda la oportunidad de tomar decisiones, ya que los resultados serán acordes a la selección del estudiante

- Micromundos: estos son programas diseñados como ambientes pequeños donde se estimula al estudiante a explorar y desarrollar habilidades de observación, análisis y toma de decisiones para resolver problemas que se puedan presentar. Puede hacer el ejercicio, repitiendo tantas veces como sea necesario, hasta conseguir una solución satisfactoria. Existe el programa LOGO, creada para niños donde se presentan situaciones de programación para trabajarse con una tortuguita que sigue las órdenes recibidas del usuario.

- Juegos informáticos: Los juegos informáticos son los juegos de videos electrónicos que se consiguen en disquetes o discos compactos (C.D.). Hay una gran variedad, algunos son de aventura, acción, educativos y deportivos. Vienen a todo color y con sonidos incorporados, aunque la mayoría trae las instrucciones en el idioma inglés.

2.1.6 Lenguajes de Programación:

- MATLAB es un programa interactivo para cálculo numérico y tratamiento de datos. Contiene muchas herramientas y utilidades que permiten realizar diferentes procesos y funciones, como la presentación gráfica en tercera dimension, el uso del GUI y otro tipo de herramientas agrupadas en "paquetes" (toolboxes). A Matlab se le pueden añadir paquetes especializados para algunas tareas (por ejemplo, para tratamiento de imágenes o para redes neuronales). Anque las nuevas versiones de matlab ya contienen estos toolboxes.

- VISUAL BASIC Es un lenguaje de fácil manejo tanto para programadores principiantes como expertos, guiado por eventos, y centrado en un motor de formularios que facilita el rápido desarrollo de aplicaciones gráficas. Su sintaxis, se deriva del antiguo BASIC.

2.1.7 Reconocimiento de Voz. 7El reconocimiento de voz es la capacidad que tiene un ordenador, para comprender el lenguaje con el fin de captar datos de la persona que habla, a través de la síntesis de voz la cual se encarga de producir lenguaje de forma oral que se generada a partir de fonemas, silabas y palabras en un computador. Este método se ha convertido en una gran ayuda, debido que al capturar una señal de voz por medio del ordenador permite hacer un reconocimiento y tratamiento pertinente.

7 DELLER , John R. Procesamiento Digital de señales. New Jersey: Macmillan Publishing, 1993. p. 195

Page 31: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

30

El procesamiento digital estudia las señales de voz a partir de una representación mediante la combinación del proceso digital de la señal y el procesamiento del lenguaje. Un filtro es un sistema que, dependiendo de algunos parámetros, realiza un proceso de discriminación de una señal de entrada obteniendo variaciones en su salida. Los filtros digitales tienen como entrada una señal analógica o digital y a su salida tienen otra señal analógica o digital, cambiado en amplitud, frecuencia o fase dependiendo de las características del filtro. Un filtro paso banda es un tipo de filtro electrónico que deja pasar un determinado rango de frecuencias de una señal y atenúa el paso del resto.

- La Predicción Lineal (LP): en el reconocimiento de voz, consiste en modelar el tracto vocal como un filtro digital constituido únicamente por polos (respuesta a impulso infinita o IIR) permitiendo así calcular la próxima muestra como una suma ponderada de las muestras pasadas. Este filtro de predicción se traduce en la función de transferencia Entonces, serán los coeficientes de predicción los que se usarán como parámetros de reconocimiento de palabras. Estos se determinan minimizando el error que se comete cuando se intenta realizar la aproximación de la señal. La función de autocorrelación proporciona una medida de la relación de la señal con una copia desfasada de sí misma. Se define a p como el orden de análisis. Valores típicos de p pueden ser entre 10 y 15, lo que significa que por cada ventana de señal se extraerán entre 10 y 15 coeficientes, proceso denominado codificación por LP (LPC).

2.1.8 Las Redes Neuronales 8Son un método de aprendizaje y procesamiento basado en el funcionamiento del sistema nervioso, normalmente en forma de software programado o dispositivos. Las redes neuronales∗ simulan las propiedades de los sistemas neuronales biológicos a través de modelos matemáticos buscando simular todas las propiedades y respuesta del cerebro. El elemento fundamental de la arquitectura nerviosa es la célula nerviosa o neurona, la cual se encarga de transportar los impulsos nerviosos, la combinación de una cantidad de neuronas interconectadas, de forma paralela, consiguen resolver problemas relacionados con el reconocimiento de formas y patrones, etc. Entre las características que diferencian los distintos modelos de redes neuronales se encuentran la topología que es realizada a partir del patrón de conexión que presenta, pueden ser del tipo monocapa o multicapa. y del mecanismo de aprendizaje en lo cual las RNA tienen la habilidad de aprender mediante una etapa que se llama etapa de aprendizaje. Esta consiste en proporcionar a la RNA datos como entrada a su vez que se le indica cuál es la salida (respuesta) esperada entre otros. En cualquier tipo de RNA se requiere de un proceso de entrenamiento, por el cual los parámetros de la red se adecuan de acuerdo a la solución de cada problema también se denomina genéricamente programación

8 HILERA, J.R., Bengochea, L., Sánchez, R. Gutiérrez, J.A., Martínez, J.J. Aplicación de técnicas de Ingeniería Lingüística en sistemas de e-learning basados en objetos de aprendizaje Barcelona, Spain: 2005 p. 43

Page 32: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

31

El Modelo de kohonen es un tipo de red de autoorganización es decir aquellas que no requieren ser supervisadas en su aprendizaje, posee una arquitectura de dos capas (entrada-salida) (una sola capa de conexiones), funciones de activación lineales y flujo de información unidireccional (son redes en cascada). Otro tipo de red neuronal que se basa en el reconocimiento de voz, es la de Retropropagación (Backpropagation) este método de entrenamiento, conocido como backpropagation la regla delta generalizada. Se trata de un método descendente de gradiente, con el cual se puede minimizar el error cuadrático total de la salida calculada por la red. El backpropagation puede entrenar redes multicapas feedforward, con funciones de transferencia diferenciables para ejecutar funciones de aproximación, asociación de patrones, y clasificación de patrones. (Pueden entrenarse también otros tipos de redes, aunque. El término backpropagation se refiere al proceso por el cual pueden calcularse las derivadas de error de la red, con respecto a los pesos de la red y vías. Este proceso puede usarse con varias estrategias de optimización diferentes. El proceso de entrenamiento de una red backpropagation involucra tres fases: la feedforward de los patrones de entrenamiento de entrada, el cálculo y la propagación inversa del error asociado, y el ajuste de los pesos. Después del entrenamiento, la aplicación de la red incluye solamente las computaciones de la fase feedforward. Aún si el entrenamiento es bajo, una red entrenada puede producir su salida muy rápidamente.

Las conexiones sinápticas biológicas, en las redes neuronales hacen referencia al conjunto de los pesos de entrada y salida. Estos pesos pueden ser modificados por el programador o la topología de la red.

2.2 MARCO LEGAL O NORMATIVO

Inclusión de niños con Discapacidad en la Escuela Regular HACIA EL DESARROLLO DE ESCUELAS INCLUSIVAS 9 UNICEF, UNESCO, Fundación HINENI - Los Derechos humanos de los niños, niñas y adoles centes Los principios básicos que deben orientar la política educativa para los niños, las niñas y los adolescentes con discapacidad son los mismos que orientan la política para cualquier niño. Estos principios están consagrados en los instrumentos internacionales de Derechos Humanos y más particularmente en la Convención sobre los Derechos del Niño. Esta convención tiene gran relevancia dado que ha sido ratificada casi universalmente y en Chile tiene fuerza de ley con rango constitucional. El eje central de la Convención es que consigna a los niños, todos los niños, como sujetos de derecho lo que implica un cambio sustantivo en la relación entre los niños, el mundo adulto y el 9 http://www.unicef.cl/archivos_documento/47/debate8.pdf. Marisol Santelices y Luz María Pérez. 2001

Page 33: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

32

Estado. El hecho que los niños, las niñas y los adolescentes sean titulares de derecho hace necesario implementar cambios legales, institucionales y culturales para que estos derechos sean efectivamente respetados y puedan ser exigidos. - Derecho a la Educación La Convención Internacional sobre los Derechos del Niño tiene una propuesta muy clara en torno a la educación, en ella se establece que:

• La educación es un derecho de todos los niños

• El acceso a este derecho debe estar eximido de discriminación e inspirado en la igualdad de oportunidades.

• Se debe garantizar al interior del sistema escolar un trato compatible con

la dignidad humana.

• La educación se orientará por objetivos de calidad, que desarrollen al máximo las capacidades del niño, preparándole para la vida adulta Inclusión de niños

• La educación debe realizarse en medio de una convivencia respetuosa

de los derechos humanos, la libertad, justicia, respeto y la promoción de la participación de niños y adolescentes en los asuntos de su interés.

En síntesis, la escuela debe ser un instrumento para la igualdad de oportunidades para todos, además de un espacio de integración social, donde se conoce, comparte y convive con personas provenientes de otros grupos sociales, y se aprende a respetar y valorar al diferente. Se busca la mayor calidad educativa para todos, para lograr su plena participación e integración social y productiva en el mundo adulto. Nada puede ser más perjudicial para la formación de nuestros hijos que educarlos en guetos, en una escuela que no da cabida, ni tolera la diversidad en su interior. La escuela debe ser el espacio privilegiado, en que todos aprendemos a convivir con los otros, y en que cada uno tiene la oportunidad de desarrollar al máximo sus capacidades de aprendizaje. - Derecho a la Educación, la No Discriminación y l a Participación Otro aspecto a considerar es que la Convención de los Derechos del Niño en su artículo 2 deja en claro que los niños no deben ser objeto de ningún tipo de discriminación. Esto no significa tratar a todas las personas de la misma manera, sino, por el contrario, ofrecer las ayudas y oportunidades que cada persona necesita de acuerdo a sus características y necesidades individuales. Por lo tanto, implica que los sistemas educativos han de proveer los recursos humanos, materiales y financieros necesarios para que los alumnos con necesidades educativas especiales cuenten con las ayudas necesarias que

Page 34: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

33

faciliten su proceso de aprendizaje y su autonomía personal. En este sentido, la igualdad de oportunidades no hay que entenderla sólo en relación con el acceso a la educación sino también con el derecho a una educación de igual calidad. La misma Convención en su artículo 23 apunta específica mente a los niños con discapacidad, señalando: ..que los Estados Partes reconocen que el niño mental o físicamente impedido, deberá disfrutar de una vida plena y decente en condiciones que aseguren su dignidad, permitiendo llegar a bastarse por sí mismo y faciliten la participación activa del niño en la comunidad". En el ámbito educativo este derecho significa que los niños con necesidades educativas especiales deberían educarse con el resto de los alumnos de su edad y participar al máximo posible de las actividades escolares sin perder de vista sus necesidades específicas. Deben participar del currículo común, haciendo los ajustes necesarios, ya que en éste se establecen las competencias necesarias para ser un ciudadano que participa activamente en la sociedad. Inclusión de niños con Discapacidad en la Escuela Regular - La atención a la diversidad. La educación escolar tiene como finalidad fundamental promover de forma intencional el desarrollo de ciertas capacidades y la apropiación de determinados contenidos de la cultura necesarios para que los alumnos puedan ser ciudadanos activos en su marco sociocultural de referencia. Para lograr esta finalidad, la escuela ha de conseguir el difícil equilibrio de proporcionar una cultura común a todos los alumnos que evite la discriminación y desigualdad de oportunidades, respetando al mismo tiempo sus características individuales, sociales, lingüísticas y culturales. El concepto de diversidad nos remite al hecho de que todos los alumnos tienen unas necesidades educativas individuales propias y específicas para poder acceder a las experiencias de aprendizaje necesarias para su socialización, que están establecidas en el currículo escolar. Estas necesidades educativas individuales tienen su origen en las diferencias culturales, sociales, de género y personales. Los modelos y propuestas educativas están influidos por la percepción y connotaciones de valor que se tengan respecto de las diferencias. Cuando se habla de diferencias sociales se está hablando no sólo de alumnos diversos, sino de alumnos que tienen diferentes oportunidades (unos tienen más que otros). Cuando se habla de diferencias culturales, suele considerarse que hay una cultura mayoritaria y otras minoritarias que tienen menor influencia en la sociedad. Cuando hablamos de diferencias individuales suele haber una tendencia a valorar más a aquellos que tienen altas capacidades; especialmente las de tipo intelectual. Muchos alumnos experimentan dificultades de aprendizaje y de participación en la escuela porque no se tienen en cuenta dichas diferencias, como consecuencia del modelo homogeneizador de los sistemas educativos. Los diversos grupos sociales, culturales y etnias tienen normas, valores, creencias y comportamientos distintos a los de la cultura escolar. Los alumnos que pertenecen a sectores sociales y culturales

Page 35: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

34

con menor vinculación a los objetivos y cultura de la escuela pueden generar menos expectativas en los profesores y tener menor autoestima y seguridad en las actividades escolares. La percepción de estos alumnos de que se espera poco de ellos refuerza su sensación inicial de que son poco competentes para las tareas escolares. Las diferencias de género también influyen en el proceso de enseñanza- aprendizaje. En América Latina no existe un problema importante de inequidad de género en cuanto al acceso a la educación, salvo en el mundo rural e indígena, pero existen problemas de discriminación que se reflejan en los contenidos, expectativas, estilos de enseñanza y materiales didácticos. Finalmente, las diferencias individuales en cuánto a capacidades, motivaciones, estilo de aprendizaje, etc., que son inherentes al ser humano y se dan al interior de los colectivos señalados, tienen gran influencia en los procesos de aprendizaje haciendo que estos sean únicos e irrepetibles en cada caso. Sin embargo, se debe señalar que las necesidades educativas de los alumnos no dependen sólo de las diferencias anteriormente señaladas, sino que están también relacionadas con el tipo de situaciones que vive cada uno en la escuela. La oferta curricular, la organización escolar, las estrategias de aprendizaje en el aula, las expectativas de los profesores, las relaciones con la familia y los sistemas de participación que se establecen son mecanismos importantes que favorecen o dificultan el aprendizaje y la plena participación de los alumnos al proceso educativo. Dos escuelas del mismo contexto pueden abordar de forma muy distinta las diferencias de los alumnos y alumnos, contribuyendo al éxito en el aprendizaje y la participación o por el contrario al fracaso y segregación de los alumnos. - El concepto de necesidades educativas especiales Muchas necesidades individuales pueden ser atendidas a través de una serie de actuaciones que todo profesor y profesora conoce para dar respuesta a la diversidad; dar más tiempo al alumno para el aprendizaje de determinados contenidos, utilizar otras estrategias o materiales educativos, diseñar actividades complementarias, etc. En algunos casos, sin embargo, determinadas necesidades individuales no pueden ser resueltas por los medios señalados, siendo preciso poner en marcha una serie de ayudas, recursos y medidas pedagógicas especiales o de carácter extraordinario distintas de las que requieren habitualmente la mayoría de los alumnos. El concepto de necesidades educativas especiales implica que cualquier alumno o alumna que encuentre barreras para progresar en relación con los aprendizajes escolares, por la causa que fuere, reciba las ayudas y recursos especiales que necesite, ya sea de forma temporal o permanente, en el contexto educativo más normalizado posible. Algunas necesidades educativas especiales sólo requieren para ser atendidas una serie de medios, recursos o ayudas técnicas que van a permitir que el alumno pueda seguir en gran medida el currículo común, y van a facilitar su autonomía y proceso de aprendizaje.

Page 36: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

35

Otras necesidades educativas van a requerir modificaciones o ajustes en el currículo mismo, y finalmente existen necesidades que requieren para ser atendidas modificaciones en el contexto educativo, estructura social o clima afectivo en el que tiene lugar el hecho educativo. Hasta hace relativamente poco sólo los alumnos con algún tipo de discapacidad eran los destinatarios de este tipo de ayudas y recursos especiales, mientras que muchos otros que tenían dificultades de aprendizaje o de adaptación seguían en la escuela común sin ningún tipo de ayudas. El concepto de necesidades educativas especiales afecta a un número mayor de alumnos que aquellos que presentan discapacidad ya que existe un colectivo más amplio de alumnos que, por diferentes causas, pueden requerir ayudas especiales para superar sus dificultades de aprendizaje y favorecer el pleno de sus capacidades. Uno de los avances más importantes del concepto de necesidades educativas especiales es que pone el acento en lo que la escuela puede hacer para compensar las dificultades del alumno, ya que desde este enfoque se considera que las dificultades de aprendizaje, sea cual sea el origen de las mismas, tienen un carácter interactivo dependiendo tanto de sus características personales como de la respuesta educativa que se le ofrece. Este enfoque se preocupa sobre todo por identificar las necesidades educativas del alumno y la alumna como consecuencia, no sólo de sus limitaciones personales sino también de las deficiencias de la respuesta educativa. En la mayoría de los países se sigue considerando como alumnos y alumnas con necesidades especiales sólo a aquellos que presentan una discapacidad, porque se utiliza como criterio el origen del problema en lugar de considerar el tipo de ayudas o recursos que hay que proporcionar a ciertos alumnos y alumnas para facilitar su proceso de aprendizaje y su progresión con relación al currículo escolar. - El concepto de integración educativa La integración es la consecuencia del principio de normalización, es decir, el derecho de las personas con discapacidad a participar en todos los ámbitos de la sociedad recibiendo el apoyo que necesitan en el marco de las estructuras comunes de educación, salud, empleo, ocio y cultura, y servicios sociales, reconociéndoles los mismos derechos que el resto de la población. La integración educativa debe formar parte de una estrategia general cuya meta sea alcanzar una educación de calidad para todos. El argumento esencial para defender la integración tiene que ver con una cuestión de derechos y con criterios de justicia e igualdad. Todos los alumnos tienen derecho a educarse en un contexto normalizado que asegure su futura integración y participación en la sociedad. Una segunda razón por la que surge la integración es que las escuelas especiales no han proporcionado los beneficios que se esperaban, y el hecho de existir éstas ha conllevado que un gran porcentaje de alumnos que fracasan en la escuela vaya a parar a ella. En prácticamente todos los países de la región, la educación especial se ha configurado como producto de un proceso

Page 37: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

36

sistemático de expulsar a los alumnos y alumnas con discapacidades leves del sistema regular, sumándoles posteriormente a los alumnos y alumnas que presentan niveles más graves de discapacidad. Las escuelas especiales están atendiendo a los niños y niñas de los que la escuela regular no se quiere hacer cargo. Mientras, un alto porcentaje de niños y niñas con discapacidad, que necesitan una mayor atención, están en sus casas sin poder acceder a ningún tipo de educación ni regular ni especializada. Un tercer aspecto a considerar es que las escuelas de educación especial han fallado en su objetivo principal de preparar a los niños, niñas y jóvenes con discapacidad para su participación y su inserción posterior en la sociedad. Se presenta, entonces, la integración educativa como el medio para que esta inserción social sea efectiva. Otros argumentos a favor de la integración tienen que ver con la calidad de la educación misma. La integración realizada en las debidas condiciones y con los recursos necesarios, es beneficiosa no sólo para los alumnos con discapacidad, sino también para el resto de los alumnos, y para los docentes. No obstante, también existen ciertos temores hacia la integración, incluso por parte de aquellas personas que comparten su filosofía y principios. Un primer obstáculo tiene que ver con la dificultad de cambiar las representaciones y las creencias. Muchos piensan que los alumnos con discapacidad "aprenden menos" en la escuela común que en la especial, porque no tienen una enseñanza tan individualizada ni la presencia constante de especialistas. Otro temor muy frecuente es que el resto de los niños aprendan menos o más lentamente por la presencia en las aulas de niños con discapacidad. Sin embargo, las evaluaciones e investigaciones realizadas no avalan lo anterior, sino todo lo contrario. Otra de las principales preocupaciones está relacionada con el funcionamiento de la escuela regular: clases muy numerosas, mayores exigencias, enseñanza muy rígida y homogeneizadora. Obviamente, la integración implica que se produzcan cambios profundos en el currículo, la metodología y la organización de las escuelas, de forma que creen las condiciones necesarias para que todos los alumnos, sin excepción, participen y tengan éxito en su aprendizaje. Finalmente se argumenta que la integración requiere una serie de recursos materiales y humanos, que no siempre están disponibles. Es cierto que se requieren una serie de recursos, humanos y materiales de carácter especializado, pero no siempre es necesario aumentar los recursos sino utilizar de forma distinta los ya existentes. La generalización de la integración implica la reconversión progresiva de los centros de educación especial, pero no la eliminación de los profesionales y servicios de educación especial que habrán de realizar funciones distintas. Desde esta perspectiva la educación especial deja de ser un sistema paralelo que sólo se ocupa de los niños y niñas con discapacidad para convertirse en un conjunto de servicios y apoyos para todos los alumnos que lo requieran, contribuyendo así a la mejora de la calidad de la enseñanza.

Page 38: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

37

En consecuencia, los centros de educación especial han de reconvertir progresivamente su rol y sus funciones, incorporándose a la red general del sistema educativo y los procesos de reforma. La tendencia general es que se conviertan en centros de recursos para la comunidad y las escuelas comunes, y que sólo escolaricen niños y niñas gravemente afectadas. - El concepto de educación inclusiva La educación inclusiva se asocia frecuentemente con la participación de los niños con discapacidad en la escuela común y de otros alumnos etiquetados "con necesidades educativas especiales". Sin embargo, esta acepción estaría más relacionada, según lo expresado anteriormente, con el concepto de integración educativa y no el de inclusión. El concepto de educación inclusiva es más amplio que el de integración y parte de un supuesto distinto, porque está relacionado con la naturaleza misma de la educación regular y de la escuela común. La educación inclusiva implica que todos los niños y niñas de una determinada comunidad aprendan juntos independientemente de sus condiciones personales, sociales o culturales, incluidos aquellos que presentan una discapacidad. Se trata de un modelo de escuela en la que no existen "requisitos de entrada" ni mecanismos de selección o discriminación de ningún tipo, para hacer realmente efectivos los derechos a la educación, a la igualdad de oportunidades y a la participación. El proceso de integración educativa ha tenido como preocupación central reconvertir la educación especial para apoyar la educación de los niños integrados a la escuela común, trasladando, en muchos casos, el enfoque individualizado y rehabilitador, propio de la educación especial, al contexto de la escuela regular. Desde esta perspectiva, se hacían ajustes y adaptaciones sólo para los alumnos etiquetados "como especiales" y no para otros alumnos de la escuela. El enfoque de educación inclusiva, por el contrario, implica modificar substancialmente la estructura, funcionamiento y propuesta pedagógica de las escuelas para dar respuesta a las necesidades educativas de todos y cada uno de los niños y niñas, de forma que todos tengan éxito en su aprendizaje y participen en igualdad de condiciones. En la escuela inclusiva todos los alumnos se benefician de una enseñanza adaptada a sus necesidades y no sólo los que presentan necesidades educativas especiales. - Desafíos Para Avanzar Hacia Una Educación Inclus iva El desarrollo de una educación inclusiva implica cambios en el ámbito del sistema y de las políticas educativas, en el funcionamiento de las escuelas, en las actitudes y prácticas de los docentes y en los niveles de relación de los distintos actores. Un primer aspecto a considerar en la región de América Latina es la necesidad de incorporar el concepto de inclusión en todas las normativas nacionales y continuar desarrollando los conceptos de discapacidad, incorporando las nuevas definiciones de la Organización Mundial de la Salud. A su vez, se observa una debilidad en la introducción de estos

Page 39: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

38

conceptos en los sistemas de recolección de datos nacionales, por lo que es importante elaborar y diseñar indicadores de necesidades educativas especiales útiles para la definición de políticas, la toma de decisiones y la asignación de recursos. - Cambios en las políticas, las normativas y los s istemas educativos. . Fortalecimiento de la responsabilidad del estado para garantizar la igualdad de oportunidades y asegurar las condiciones básicas de funcionamiento de las escuelas en términos de recursos humanos, materiales y didácticos, de forma que puedan atender la diversidad de su alumnado. Es fundamental asimismo establecer mecanismos de discriminación positiva que beneficien a los grupos en situación de mayor vulnerabilidad y a las escuelas con mayores carencias. - Ampliación de la cobertura y de la calidad de los p rogramas de educación y cuidado de la primera infancia : Cuanto antes se comienza la integración en el sistema regular, más normalizado es el proceso. Actualmente es una realidad que los niños y niñas que más necesitan una educación temprana para compensar su situación de desventaja son quienes menos acceden a los programas, o reciben una educación de menor calidad. Por ello, un desafío importante es lograr una mayor equidad en la distribución y la calidad de la oferta educativa que asegure la igualdad de oportunidades de los niños y niñas que por sus condiciones individuales, sociales o culturales se encuentran en situación de desventaja. Los niños con discapacidad constituyen uno de los colectivos más excluidos, en circunstancias que para ellos es vital una educación temprana que compense sus dificultades y optimice su desarrollo. - Flexibilidad de la oferta educativa en todas las etapas . Es necesaria una mayor flexibilidad y diversificación de la oferta educativa dentro de las propias instituciones, ofreciendo distintas propuestas y alternativas en cuanto al currículo, las situaciones de aprendizaje, los materiales y procedimientos de evaluación. Las instituciones educativas han de ofrecer a sus alumnos y alumnas más de un camino o formato para asegurar que todos logren, en la medida de sus posibilidades, las competencias básicas establecidas en el currículo escolar. - Recursos de apoyo para los docentes . La mayoría de los países cuentan con una serie de servicios de apoyo a la escuela que son de capital importancia para el éxito de las políticas educativas inclusivas. Los recursos de apoyo han de centrar su intervención en la escuela en su conjunto, orientando a los profesores y las familias para que sean cada vez más capaces de atender las necesidades de los niños. Un apoyo muy valioso es el que se pueden prestar las escuelas entre sí; es importante fomentar redes de trabajo entre escuelas y entre los sistemas de educación regular y especial, que se reúnan para reflexionar conjuntamente e intercambiar experiencias.

Page 40: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

39

- Políticas educativas e intersectoriales que prom uevan la inclusión en todos los niveles educativos . Un aspecto sumamente sensible tiene que ver con la transición de los y las estudiantes con necesidades educativas especiales a lo largo de su vida: transición del hogar a la educación inicial, de ahí a la educación primaria o básica, la transición de la básica a la educación secundaria y de ahí al mundo laboral. Cada proceso de transición tiene sus propias complejidades y es necesario encontrar la forma de suavizar y simplificar estos procesos. En América Latina tenemos todavía un largo camino que recorrer. Los mayores avances se han dado en la educación de la primera infancia y en los primeros años de la educación básica. Ha habido muy pocos progresos en los últimos años de educación básica y en la enseñanza media, en circunstancias que la primera generación de estudiantes con discapacidad integrados en la educación regular está llegando a estos niveles. - Legislación y normativas educativas e intersectoria les . El concepto de la integración de alumnos con discapacidad en la educación regular ya se ha incorporado plenamente en las políticas de los países. Un aspecto a destacar es que el sector de educación es el único que ha desarrollado normativas en todos los países de la región la educación integrada se encuentra regulada desde los ministerios, mecanismo que permite la asignación de recursos adicionales en apoyo a esta modalidad educativa. En varios casos, la concepción legal de la educación integrada está directamente relacionada con la promulgación de leyes generales e iniciativas de carácter multisectorial que garantizan la integración y participación de las personas con discapacidad en todas las esferas de la vida nacional, incluyendo la integración escolar, laboral y social desde el punto de vista de la equiparación de oportunidades. Estas legislaciones se encuentran en proceso de llevarse al plano práctico, a través de normativas específicas en los sectores más importantes (salud, trabajo, vivienda, etc.). Sin embargo, la formulación de leyes y normativas con respecto a la inclusión y la educación inclusiva es todavía una asignatura pendiente. - Redes de trabajo intersectorial entre diferentes sectores responsables del bienestar de las personas con discapacidad . Es necesaria la articulación entre el gobierno y la sociedad civil para colaborar principalmente en temas relacionados principalmente con la educación, el empleo y la salud. La articulación efectiva entre diferentes sectores e instituciones es una asignatura pendiente en la región. - Cambios en las actitudes y las prácticas educativ as Valoración de la diversidad como un elemento que enriquece el desarr ollo personal y social . La condición más importante para el desarrollo de una educación inclusiva es que la sociedad en general y la comunidad educativa en particular tengan una actitud de aceptación, respeto y valoración de las diferencias. Es fundamental desarrollar una intensa actividad de información y sensibilización, en la que los medios de comunicación social pueden jugar un rol fundamental. - Un currículo amplio y flexible es una condición fundamental para responder a las diversidad ya que permite tomar decisiones ajustadas a las

Page 41: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

40

diferentes realidades sociales, culturales e individuales. Pero la respuesta a la diversidad implica además un currículo amplio y equilibrado en cuanto al tipo de capacidades y contenidos que contempla. En América Latina se han realizado importantes avances en el diseño de currículo que pueden ser muy beneficiosos para dar respuesta a la diversidad, pero todavía no se ha logrado que estos modifiquen realmente la práctica educativa, porque muchos docentes no se han apropiado de ellos. Otro aspecto positivo en la región es que se están eliminando en un buen número de países los programas paralelos para los diferentes grupos con discapacidad, estableciendo como referente para la educación de estos alumnos el currículo común con las adaptaciones necesarias. - Los enfoques metodológicos y la pedagogía deben estar centrados en el alumno, y facilitar la diversificación y flexibilidad de la enseñanza, de modo que sea posible personalizar las experiencias de aprendizaje comunes. El punto central es cómo organizar las situaciones de aprendizaje de forma que todos los alumnos participen sin perder de vista las necesidades y competencias específicas de cada uno. Uno de los mayores desafíos en América Latina es romper con la cultura homogenizadora de las escuelas y la enseñanza transmisora y frontal que considera que todos los alumnos son iguales y aprenden de la misma forma. - Criterios y procedimientos flexibles de evaluación y de promoción . Desde la perspectiva de una educación inclusiva, el fin de la evaluación es identificar el tipo de ayudas y recursos que precisan para facilitar su proceso de enseñanza-aprendizaje y de desarrollo personal y social. Un aspecto que favorece la atención a la diversidad, es que en muchos países se ha superado el modelo curricular en el que se gradúan los aprendizajes curso por curso, y se ha establecido la promoción automática. La respuesta a las diferencias implica utilizar una variedad de procedimientos de evaluación que se adapten a distintos estilos, capacidades y posibilidades de expresión de los alumnos. - Proyectos educativos de toda la escuela que contemp le la diversidad y compromiso de cambio . Los procesos de descentralización curricular y de gestión educativa que han emprendido muchos países facilitan que las escuelas puedan elaborar proyectos educativos acordes a las necesidades de sus alumnos y su realidad. En aquellas escuelas en las que existe un trabajo colaborativo entre los profesores, entre profesores y padres y entre los propios alumnos, es más factible que se pueda atender a la diversidad. La existencia de un buen clima afectivo y emocional en la escuela y el aula también es una condición fundamental para que los alumnos aprendan y participen plenamente. - Participación de los padres y de la comunidad . Es importante una relación de colaboración entre todos los implicados en el proceso: entre directivos, directivos y docentes, entre docentes, entre docentes y padres, y entre los propios alumnos. Los padres han de participar en las actividades de la escuela,

Page 42: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

41

en el apoyo de determinados aprendizajes en el hogar y en el control de los progresos de sus hijos. - Formación de los docentes y otros profesionales . Todos los cambios señalados no pueden llevarse a cabo si los docentes y especialistas no cuentan con las competencias necesarias para desarrollar una práctica educativa distinta. Por ello es fundamental renovar los programas de formación docente inicial y en servicio y de otros especialistas para responder a los requerimientos de la educación inclusiva. Es también importante que los profesores tengan unas condiciones laborales adecuadas, una mayor valoración por el trabajo que realizan y una serie de incentivos que redunden en su desarrollo profesional. Uno de los grandes objetivos de las agencias internacionales es contribuir y apoyar a los Inclusión de niños con Discapacidad en la Escuela Regular países en este proceso de transformación de los sistemas educativos, para convertirlos en verdaderos instrumentos de integración social que permitan la plena participación de los ciudadanos en la vida pública. Las agencias internacionales han cumplido el rol de agentes coordinadores. Este rol debe ser reforzado y aumentado para que el desarrollo de la inclusión se introduzca en las agendas de trabajo de todos los países de la región.

En la realización de software la universidad cuenta con una serie de licencias académicas que soportan el desarrollo del producto a través de estas.

Otro tipo de normativas y leyes competente al desarrollo del producto están contenidas en el área ingenieríl son contempladas a continuación

La Ley 115 de 1994 (Ley General de la Educación, en Colombia) ∗, indica que: "La educación para personas con limitaciones físicas, sensoriales, psíquicas, cognoscitivas, emocionales" o con capacidades intelectuales excepcionales, es parte del servicio público educativo.

Los establecimientos educativos organizarán directamente o por convenio, acciones pedagógicas y terapéuticas que permitan el proceso de integración académica y social de dichos educandos" (Artículo 46).

2.2.1 Código de Ética Asociación Colombiana de Fon oaudiología y Terapia del lenguaje (Noviembre, 1999). 10 El código de ética de la Asociación Colombiana de Fonoaudiología y Terapia del Lenguaje, especifica los estándares de práctica y las responsabilidades de los Fonoaudiólogos Colombianos con el fin de proteger la integridad a los que sirven y a la profesión. 10 CÓDIGO COLOMBIANO DE ÉTICA PARA FONOAUDIOLOGÍA. Bogotá: Alfaomega, 1997. p. 22

Page 43: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

42

El código se divide en tres partes. En la primera se encuentran los principios, las reglas y los preceptos que los miembros de la asociación deben cumplir y mantener. En la segunda están los procedimientos a que deben acogerse los miembros para cumplir los principios y las reglas y en la tercera se encuentra la conducta a seguir ante violaciones del código de Fonoaudiólogos no asociados.

La normativa vigente a tener en cuenta en el área de ingeniería es la Ley 842 del 9 de octubre del 2003, donde se establece el ejercicio de la ingeniería de sus profesiones afines y de sus profesiones auxiliares, se adopta el código de ética profesional y se dictan otras disposiciones por el congreso de la República de Colombia. Haciendo especial énfasis en el título IV correspondiente al código de ética para el ejercicio de la ingeniería en general y afines en todos sus capítulos y artículos.

2.2.2 La Evaluación De Software Educativo. La evaluación de los programas educativos es un proceso que consiste en la determinación del grado de adecuación de dichos programas al contexto educativo. Cuando el programa llega al docente, es de suponer que ha sido analizado y evaluado tanto en sus aspectos pedagógicos y didácticos, como en los técnicos que hacen a la calidad del producto desarrollado según ciertas pautas de garantía de calidad. Básicamente, se realizan las evaluaciones interna y externa del software, a fin de detectar los problemas que generarán cambios en el producto, lo antes posible, a fin de reducir costos y esfuerzos posteriores. Estas evaluaciones consideran las eventuales modificaciones sugeridas por el equipo de desarrollo y por los usuarios finales, teniéndose en cuenta a docentes y alumnos en el contexto de aprendizaje. Cuando un producto del tipo comercial educativo, llega al docente, significa que ha superado las etapas de evaluaciones interna y externa. Además para obtener el grado de eficacia y de eficiencia del producto se deberá realizar una evaluación en el contexto de uso. Es preciso definir ciertos “criterios” para seleccionar un programa como “de acuerdo a las necesidades del docente”, y se debe considerar el uso de los vocablos evaluación y valoración que en muchos de los trabajos consultados se usan indistintamente para determinar si un programa dado cumple con los objetivos tanto técnicos como pedagógicos y didácticos para lo que fue pensado. - La Evaluación Interna De acuerdo a lo expuesto anteriormente, se deberá llevar a cabo una evaluación interna del software, [Marquès, 1995] que estará a cargo de los miembros del equipo de desarrollo (que se realiza al obtener la versión alfa) y otra evaluación externa en la que participan profesores y alumnos destinatarios del programa, cuando se haya terminado el mismo, o esté casi listo.

Page 44: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

43

Algunos autores como Marquès [1995] consideran que se pueden contemplar tres aspectos fundamentales en la evaluación en general: aspectos técnicos, pedagógicos y funcionales. Los primeros permitirán asegurar la calidad del producto desde el punto de vista técnico específicamente, pudiéndose realizar un análisis estructural de elementos tales como el diseño de pantallas y la interfase de comunicación. Los aspectos pedagógicos, son aquellos que se refieren al fin con el que el software será utilizado. Por ello hay que analizar elementos como: los objetivos educativos, los contenidos y los caminos pedagógicos, que se deben considerar en toda buena programación didáctica. Respecto de los funcionales, habría que considerar cuales son las ventajas que da al profesor como material didáctico y cómo facilita los aprendizajes de los alumnos. - La Evaluación Externa La evaluación externa permite obtener sugerencias de los alumnos, quiénes serán en definitiva los usuarios del software y de los docentes que lo utilizarán como material didáctico. Durante este tipo de pruebas, se encuentran errores imprevistos no detectados y se verifica el cumplimiento de los programas con los objetivos educativos que se han considerado en el diseño. Alfred Bork [1986] la denomina evaluación sumativa y es la evaluación del producto final que generalmente la realizan equipos distintos a los desarrolladores. La información se recoge mediante checklists y preguntas cerradas y abiertas a contestar luego de interactuar con el programa, durante un tiempo predeterminado. En casi todas las investigaciones consideradas se denota la falta de herramientas de evaluación sencillas y de documentación de los programas educativos. Como resultado de ambas evaluaciones, se obtendrá la primera versión del programa con su respectivo manual de usuario, conteniendo todos los aspectos que se consideren indispensables para el uso docente, con detalles técnicos, y del entorno pedagógico y didáctico en el que se desarrolló el programa.

Page 45: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

44

2.3 MARCO TEÓRICO

Este proyecto está compuesto de tres cuerpos de investigación como:

2.3.1 Dificultad de aprendizaje: Es un término general que describe problemas del aprendizaje específicos, puede causar que una persona tenga dificultades aprendiendo y usando ciertas destrezas. Las destrezas que son afectadas con mayor frecuencia son: lectura, ortografía, escuchar, hablar, razonar, y matemática. Los problemas del aprendizaje varían entre personas.

La discapacidades del lenguaje ha sido abordada desde dos puntos de vista, desde la parte educativa como: Una discapacidad específica de aprendizaje, un desorden en uno o más procesos psicológicos básicos implicados en la comprensión o en el uso del lenguaje, hablado o escrito, que se manifiesta en una capacidad imperfecta para escuchar, pensar, hablar, leer, escribir, deletrear, o hacer cálculos matemáticos, incluyendo condiciones como las discapacidades de percepción, los daños cerebrales, la disfunción cerebral mínima, la dislexia la afasia. El término no incluye problemas de aprendizaje que son, sobretodo, el resultado de discapacidades visuales, auditivas, motoras, retraso mental, trastornos emocionales o desventajas ambientales o culturales.

Desde la parte gubernamental: es un término general que se refiere a un grupo heterogéneo de desordenes manifestados por las dificultades significativas en la adquisición y el uso de capacidades de audición, habla, escritura, lectura razonamiento y habilidad matemática, estos desordenes son intrínsecos al individuo, se piensa que se deben a una disfunción en el sistema nervioso central y que pueden suceder en cualquier momento. Los problemas en las conductas autorreguladoras, la percepción social y la interacción social pueden coexistir junto a las discapacidades de aprendizaje, pero no por si mismas constituyen una discapacidad de aprendizaje.

- Tipos de dificultades de aprendizaje : estas discapacidades se presentan de manera distinta de pendiendo de los individuos, no existe ningún tipo de clasificación uniforme para estos estudiantes. Se supone que estos estudiantes presentan un tipo de inteligencia normal, pero no consiguen un rendimiento académico acorde a sus posibilidades.

- Identificación: El uso de fórmulas de discrepancia en la identificación de los estudiantes con discapacidades de aprendizaje se centran en procesos de evaluación, estas formulas son complicadas y difíciles de utilizar, por lo que se ha aceptado el uso de programas de ordenador especiales para anotar la discrepancia entre el rendimiento de un estudiante y el cociente intelectual.

Las dificultades de aprendizaje se incluyen dentro de la categoría de discapacidad, algunos niños presentan una leve discapacidad de aprendizaje la cual consiguen beneficiarse del currículos ordinario ofrecido por el sistema ordinario y cunado crecen pueden ir a la universidad. Sin embargo los niños con discapacidades severas requieren un tipo de atención especial.

Page 46: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

45

- CAUSAS: en la actualidad se sabe poco sobre las causas de las discapacidades de aprendizaje, pero lo que se puede constatar es que la diversidad de las personas que las tienen es tan grande como las topologías existentes. Puede que algunos estudiantes tengan una disfunción de su sistema nervioso central que les impida aprender. Otros presentarían un daño causado por un accidente o por un momento de falta de oxigeno antes, durante o después del nacimiento, lo que tiene como consecuencias dificultades neurológicas en el desarrollo que afectan a su capacidad para aprender.

- PREVENCIÓN: existen métodos de prevención o reducción de los efectos de discapacidad, no hay que ignorar el beneficio que proporciona el desarrollo de adecuadas capacidades de lenguaje y de toma de conciencia auditiva, en la etapa de preescolar, los niños que no desarrollan buenas capacidades de lenguaje durante sus primeros años de infancia muestran mayor tendencia a padecer problemas académicos durante los últimos años escolares. Dado que un concepto recientemente aprendido sirve de base para la construcción de otro conocimiento que se acaba de presentar, la carencia de un dominio de los conceptos básicos puede llevar al fracaso de los niños en comparación con el rendimiento académico mostrado por sus compañeros. Para prevenir los efectos de las discapacidades de aprendizaje, estos niños necesitan cuanto antes recibir la ayuda de un profesor de educación especial o de su profesor de aula ordinaria.

- CARACTERISTICAS DEL APRENDIZAJE : El problema de todos los estudiantes con discapacidad de aprendizaje es la asimilación y el dominio de las tareas académicas, a continuación se muestra un cuadro comparativo de las características de las discapacidades de aprendizaje:

Nivel académico Desarrollo social Estilo conductual

Exhibe una significativa discrepancia entre el potencial y el rendimiento

Demuestra falta de habilidad para resolver problemas

Experimenta retrasos substanciales en el rendimiento académico

Presenta capacidades académicas desiguales

No se involucra

Muestra capacidades sociales inmaduras

Elige los patrones de conducta menos aceptables socialmente

Malinterpreta las indicaciones sociales y las conductas verbales

No toma decisiones adecuadas

Con frecuencia adopta el papel de victima

No presta atención en clase se distrae

Exhibe excesivo movimiento hiperactivo

Es impulsivo

Tiene una pobre coordinación motora y escasas capacidades de relación espacial

Es desorganizado

Parece falto de motivación tiende a ser

Page 47: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

46

activamente en las tareas de aprendizaje

Evidencia un desarrollo pobre del lenguaje y/o cognitivo

No ha adquirido las capacidades básicas de la lectura

No puede predecir las condiciones de su conducta

Utiliza las convenciones sociales de forma inadecuada

Experimenta rechazo por parte de sus compañeros

Confía demasiado en las motivaciones y en la sinceridad de los demás es ingenuo

Es tímido distraído y se aísla

extremadamente dependiente del profesor y de sus compañeros durante la clase

- El PROCESAMIENTO DE LA INFORMACIÓN: Muchas personas con discapacidades de aprendizaje tienen dificultad para aprender a leer y a escribir, en la comprensión de los mensajes orales e incluso en su propia expresión oral. La teoría de procesamiento de la información sugiere que las discapacidades de aprendizaje están causadas por una incapacidad de organizar el pensamiento y de abordar las tareas de aprendizaje sistemáticamente.

Teoría del procesamiento de la información y sus similitudes con el sistema de ordenadores.

DISPOSITIVOS DE

ENTRADA

MEMORIA DISPOSITIVOS DE SALIDA

ESTIMULOS DE ENTRA

DA

MEMORIA DISPOSITIVOS DE SALIDA

TECLADO

JOYSTICK

TARJETA GRAFICA

INTERRUPTO- RES

RATÓN

UNIDAD DE PROCESAMIEN-TO CENTRAL

(CPU)

MONITOR

IMPRESORA

IMPRESORA BRAILLE

SINTETIZ

AUDITIVO

VISUAL

ESCUCHA

LECTURA

EL CEREBRO SISTEMA

DE PROCESAMIEN-TO

COGNITIVO

RESPUESTA MOTORA

CONDUCTA

HABLA

ESCRITURA

Page 48: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

47

VENTANA DE ACCESO

RECONOCIMIENTO DE VOZ

ADORE DE HABLA

AMBIENTAL

TÁCTIL

APRENDIZAJE

- Dificultad en el leguaje y en el habla : el habla es el componente vocal del lenguaje, y en mayor parte de las ocasiones constituye la manera más rápida y eficaz de comunicarse, un buen conocimiento de los mecanismos neuronales, respiratorios y vocales que intervienen en el mismo. El habla se considera anormal cuando es inteligible, desagradable al oído o entorpece la comunicación los trastornos del habla se producen afectando con mayor frecuencia la voz, la articulación y la fluidez.

- Problemas de la voz: Hace referencia a la producción anormal del lenguaje caracterizado por un volumen, tono y calidad de sonido que interfiere el proceso de comunicación, son muy frecuentes durante la infancia deben ser tratados de forma inmediata por un especialista.

- Problemas de articulación : Es la producción anormal de los sonidos del lenguaje, la articulación es el mecanismo mediante el cual se producen los sonidos, para que el oyente se a capaz el contenido del mensaje, es necesario que se escuche de forma nítida y clara cada uno de los sonidos que componen el mismo. Si los sonidos se pronuncian de forma incorrecta, o si se confunden entre ellos el contenido será mal interpretado.

- Problemas de fluidez : Se presentan por la repetición de palabras o sonidos que interrumpen el ritmo de producción normal del lenguaje oral, son asociados a la tasa de producción de palabras por minuto que produce el emisor mientras habla. Generalmente son relacionados con omisión o la repetición de un determinado sonido.

2.3.2 Problemas de lenguaje en la pronunciación d e fonemas. 11El trastorno o dificultades del lenguaje en los niños puede presentarse debido a causas tales como el entorno en el que estén habitualmente, la edad, factores biológicos que son presentados en el aparato fonador Ver (figura 1) y articulador y sociológicos, factores genéticos y de motricidad, entre otros.

11 BASIL, B . Theoretical Studies Towards a Sociology of Language Inglaterra: El Roure . 1971. p. 134

Page 49: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

48

Figura 1. Diagrama Aparato Fonador

Fuente : Enciclopedia estudiantil Tomo 8.

Los niños aprenden palabras y a valerse por medio de estas, desde edades tempranas, pero el tiempo estimado para que estos adquieran hábitos puede ser no estimado, en varios casos se presentan problemas debido a factores tales como el de dejar de pronunciar algún sonido (omisión), reemplazar un sonido por otro (sustitución), emitir incorrectamente un sonido (distorsión) o agregar sonidos que no corresponden.

Se han realizado varias clasificaciones aproximadas en etapas de crecimiento para comprender el desarrollo oral de un niño, entre las cuales se encuentran

- Antes de los 12 meses los niños producen balbuceos para relacionarse con el entorno, y van incorporando tonos diferentes hasta formar palabras, en esta etapa los niños prestan atención a los sonidos que se producen a su alrededor reaccionando ante esto si esto no sucede puede presentarse una pérdida de audición.

- Entre los 12 y 15 meses los niños son capaces de balbucear algunos sonidos pronunciar varias palabras y obedecer a ciertas instrucciones.

- De 18 a 24 meses los niños son capaces de manejar un vocabulario aproximado de 50 palabras, realizando combinaciones de palabras y prestando atención a órdenes.

- Los niños entre 2 a 3 años, la adquisición de lenguaje es incontable se produce combinación y comprensión de las palabras.

- Las disartrias 12son errores de la articulación de las palabras, que no coinciden con las normas socioculturales impuestas por el ambiente, que dificultan la inteligibilidad del discurso y que se presentan a una edad en que ya se debiera tener una articulación correcta.

12 BASIL, B . Theoretical Studies Towards a Sociology of Language Inglaterra: El Roure . 1971. p. 87

Page 50: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

49

- Disartrias funcionales 13 son producidas por una función anómala del SNC o de los órganos periféricos, sin que existan trastornos, lesiones o modificaciones orgánicas.

La denominación de los distintos errores que se dan, se hace con la raíz griega del fonema afectado (rota=r, sigma=s, lambda=l, etc) y el sufijo "tismo" o "cismo" cuando el fonema no se articula correctamente (sigmatismo o sigmacismo = dificultad para articular la s) y con la misma raíz y el prefijo "para" cuando el fonema es sustituido por otro (pararrotacismo o pararrotatismo cuando se sustituye el fonema r por otro, generalmente g, d ó l).

2.3.2 Los rangos distintivos de las consonantes A nivel fonológico, operan unas unidades lingüísticas que no tienen significación en sí mismas, pero que son capaces de cambiar el significado de un morfema, una palabra o una frase por sustitución. : los fonemas. El morfema es percibido y está compuesto por varios fonemas, este está constituido y se identifica por medio de varios rangos distintivos, que funcionan por medio de varios correlatos acústicos o articulatorios. Según Pierre Dellatre los rangos distintivos es una señal fonética compleja capaz de cambiar un fonema en otro por sustitución y como consecuencia de originar transformaciones significativas. Un rango distintivo no debe confundirse con un índice acústico o con un movimiento articulatorio; estos últimos solo contribuyen al funcionamiento lingüístico del rango distintivo. El Binarismo fundamenta sus principios en que las relaciones entre las unidades fónicas distintivas de las lenguas se basan en la presencia o ausencia de un rango distintivo (principio binario) lo que equivale a la elección entre dos cualidades polares de la misma categoría (denso / difuso) o entre la presencia de una cualidad (sonoro/sordo). - Rasgo de sonoridad: sonoro / sordo Se caracteriza acústicamente por la superposición de una fuente armónica sonora que se refleja en el espectrograma como un formante de baja frecuencia, situado, en su parte inferior. El rasgo de sordez se manifiesta por ese formante. Articulatoriamente la diferencia entre estos rasgos se debe a la vibración o no vibración de las cuerdas vocales, vibración que origina el formante inferior de sonoridad o barra de sonoridad. - Rasgos de tonalidad: Están relacionados están relacionados con los rasgos prosódicos que utilizan la altura o tono de la voz. Se hacen patentes principalmente por medio de la distribución de la energía en el espectro de

13 Ibid ., p90

Page 51: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

50

frecuencias de un fonema. Los rasgos de tonalidad son los siguientes grave-agudo, bemolizado o no bemolizado, sostenido o no sostenido. - Grave agudo: Desde el punto de vista acústico se manifiestan por el predominio de una parte significante del espectro sobre la otra. Cuando predomina la, parte baja del espectro, el sonido posee el rasgo grave, mientras que si predomina la parte alta, el sonido posee rasgo agudo. El rasgo grave en los segmentos vocálicos y consonánticos, viene determinado por una cavidad bucal de resonancia amplia y no dividida (fonema periférico), mientras que el rasgo agudo se origina a causa de una cavidad bucal de resonancia pequeña y dividida (fonema mediano). Las consonantes [p,b,m,k,g]son graves, los resonadores bucales son grandes y no están divididos. 2.3.3 Consonantes explosivas 14 Desde el punto de vista acústico, el término de consonantes explosivas se debe la hecho de que el momento más audible es el de la explosión, que equivale al distensivo. Reciben también el término de momentáneas a causa de la interrupción del continum fónico durante su percepción. Desde el punto de vista articulatorio de consideran como oclusivas, y se definen como aquellas consonantes que son producidas por un cierre del canal bucal. Se incluyen tanto las oclusivas orales [p,b,t,d,k,g] como las nasales [m,n,ŋ] ya que lo más importante es la interrupción de la salida del aire a través del canal bucal. - Explosivas orales: características a). La interrupción total en la emisión del sonido (esta interrupción se produce durante la tensión de la consonante); b). La explosión que sigue a esta interrupción (explosión que se manifiesta en forma de sonido turbulento, breve o intenso) c). la rapidez de las transiciones de los formantes de las vocales precedentes o siguientes. - Distribución: En español se conocen seis fonemas explosivos orales: tres sordos / p, t, k/, y tres sonoros /b, d, g/. En posición silábica prenuclear, los fonemas sordos se realizan normalmente como explosivos, mientras que los sonoros se realizan como tales, en distribución complementaria, 1. Todos después de pausa 2. Todos después de nasal 3. Solo en el caso de /d/ después de lateral /l/. En los demás situaciones, los demás fonemas se realizan como fricativos. Las dos series de fonemas explosivos comprenden dos articulatoriamente tres órdenes: labial /p,b/, dental /t,d/, velar /k,g/. Estos fonemas funcionan planamente en posición silábica prenuclear. - Caracterización acústica: Los espectrogramas de las explosivas sordas se caracterizan por la ausencia total de zonas de frecuencia; en las sonoras, esta ausencia también es patente, pero una barra de sonoridad en la parte inferior de su espectro, las diferencia de las anteriores, esta barra se origina por las vibración de las cuerdas vocales. El espectro de las explosivas sordas y

14 QUILIS , Antonio Joseph A. Fernández. Curso de fonética y fonología .Madrid: Investigaciones Científicas, Instituto "Miguel de Cervantes", 1973. p.223

Page 52: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

51

sonoras no proporciona ningún dato que las caracterice y que pueda explicar por que se perciben [p] como diferente de [k] o [b] como diferente de [g]. - La explosión: En los espectrogramas se refleja la explosión de estas consonantes por medio de una barra perpendicular (barra de explosión) situada al final del segmento explosivo e inmediatamente antes de la vocal siguiente. En estas barras de explosión aparecen algunas zonas de concentración de energía a determinadas frecuencias. Para comprobar la hipótesis de que la explosión podría ser el índice acústico característico de las explosivas, sobre todo de las sordas [p,t,k] ; únicamente las síntesis de lenguaje podía decidir si, en este caso, este era pertinente o no en la percepción de las vocales. Se sinterizaron sílabas que constaban de una explosión y de una vocal. La explosión adopto las forma de ovalo vertical de 600 cps. Y de 0,015 seg. De duración. Estas explosiones se situaron en 12 frecuencias distintas, como resultado se obtuvo que la frecuencia de la explosión es variable para cada vocal. - Transiciones: En el espectro de [explosiva + vocal] se perciben además de la barra de explosión, unos determinados movimientos en los formantes de las vocales contiguas. Este movimiento fisiológico se refleja en el espectrograma acústico por medio de cambios de frecuencia generalmente rápidos y continuos en los formantes, es decir en las concentraciones de energía acústica, que corresponden a las frecuencias de las cavidades del pabellón. Igual que las notas de resonancia del sistema de las cavidades cambian contiguamente de frecuencia. La terminología acústica da el nombre de transiciones a estos cambios de frecuencia en los formantes. - Distinción del modo articulatorio:(Oclusivo, constructivo, semioclusivo, cerrado, abierto, oral, nasal, sordo, sonoro, palatalizado etc. ) En la percepción de los modos de articulación es importante no solo el papel de la T1 si no de la T2 y T·3 y depende del grado de las transiciones, es decir del grado de velocidad, con el que cambian de frecuencia. El régimen está unido a la vocalización de la consonante. Así las consonantes sonoras tienen por medio, transiciones más lentas que las sordas. - Explosivas orales en el español: Las sordas [p, t, k] son no aspiradas, y que las sonoras [b, d, g] son plenamente sonoras. Las T1 y T2 de estas vocales naturales estás casi de acuerdo con los mismos movimientos antes señalados, a excepción de la [ku] en la que T2 se presenta negativo o sin transición en lugar de tener movimiento positivo. - Clasificación acústica: Las consonantes explosivas para el español presentan la siguiente clasificación:

Page 53: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

52

Tabla 1. Rasgos de los fonemas explosivos orales.

Rasgos p B t d K g Vocálico/no vocálico Consonántico/no consonántico Denso/difuso Grave/agudo Estridente/mate Oral/nasal Sonoro/sordo Continuo/interrupto

-- + -- + -- + -- --

-- + -- + -- + + +

-- + -- -- -- + -- --

-- + -- -- -- + + +/-

-- + + + -- + -- --

-- + + + -- + + +/-

. Fuente : Libro Fonética acústica de la lengua española. Quilis, Antonio.

a. Compactas o densas: [k, g]; difusas [p, b, t, d]. En [k, g] son las compactas por tener la cavidad anterior de resonancia mayor que la posterior, mientras que las restantes serán difusas por presentar condiciones distintas en los volúmenes de las cavidades de resonancia.

b. Graves, Labiales y velares: [p, b, k, g], y agudas [t, d]. Genéticamente la

distinción se presenta en que las labiales y velares presentan un resonador indivisible, único, las dentales lo presentan dividido.

c. Sordas: [p, t, k]; sonoras [b, d, g]; en las primeras no existe una barra de

sonoridad en la parte inferior de su espectro, mientras que en las segundas si. Todas las explosivas orales son interruptas.

d. La división tensa-débil [p, t, k] – [b, d, g] no tiene valides en el español,

como norma general las consonantes sordas son más tensas, más enérgicas y presentan un contactos más amplio que las correspondientes sonoras.

- La Didáctica : Es importante al momento de definir los criterios de diseño en la interfaz gráfica de usuario, desde las diferentes perspectivas de la didáctica, la estrategia permite delimitar un sistema de planificación aplicable a un conjunto articulado de acciones para llegar a una meta. De manera que no se puede hablar de que se usan estrategias cuando no hay una meta hacia donde se orienten las acciones. En su aplicación, la estrategia puede hacer uso de una serie de técnicas para conseguir los objetivos que persigue. Actualmente, la aplicación de las ciencias cognitivas a la didáctica ha permitido que los nuevos modelos didácticos sean más flexibles y abiertos, y muestren la enorme complejidad y el dinamismo de los procesos de enseñanza-aprendizaje.

Cabe distinguir:

• Didáctica general, aplicable a cualquier individuo.

Page 54: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

53

• Didáctica diferencial, que tiene en cuenta la evolución y características del individuo.

• Didáctica especial, que estudia los métodos específicos de cada materia

La riqueza audiovisual -imágenes, sonido, movimiento- y el poder interactivo propios de la tecnología multimedial representan una alternativa muy promisoria para diseñar instrumentos novedosos, que utilizados en contextos didácticos apropiados, pueden potenciar el desarrollo de múltiples aprendizajes en alumnos con y sin necesidades educativas especiales.

2.3.4 Reconocimiento de Voz 15 En el reconocimiento de voz es importante tener en cuenta ciertos parámetros que influyen en la caracterización de la señal de voz, para poder tener un reconocimiento por parte del computador es necesario conocer y diferenciar las características fundamentales de la voz humana entre las cuales se encuentra (Tono, Timbre, Altura e Intensidad)

El reconocimiento de voz hace parte de la llamada inteligencia artificial la cual tiene como objetivo que exista una interacción entre hombre / computador (ordenador), generando comunicación entre estos dos. El reconocimiento de voz presenta como principal problema el hecho de que no hay interacción entre todos los elementos que intervienen en este tipo de comunicación tales como (acústica, fonética, fonológica, léxica, sintáctica, semántica). De manera que no exista un mensaje claro.

Para que exista un reconocimiento de voz por parte de un ordenador es necesario elaborar un tipo de aprendizaje que sea capaz de emular diversas áreas del conocimiento. En la actualidad existen dos tipos de aprendizaje para el reconocimiento de voz lo cuales serán mencionados a continuación:

- Aprendizaje Inductivo: En este tipo de aprendizaje el sistema a través de ejemplos reales es capaz de conseguir su propio conocimiento para lograr su objetivo.

- Aprendizaje Deductivo: En este tipo el humano transfiere al sistema sus conocimientos informáticos.

Para que exista reconocimiento de voz se han expuesto varios trabajos elaborados a partir de los diferentes métodos que son mencionados a continuación (Modelos Ocultos de Markov, Redes Neuronales Artificiales, Dinamic Time Warping entre otros).

2.3.5 Tratamiento de la señal del habla: 16 La pronunciación de sonidos por el aparato fonador humano produce ondas de señal con diferentes amplitudes. La fluctuación de las amplitudes de la forma de onda del habla constituye la base del funcionamiento de numerosos sistemas y dispositivos de grabación, 15 DELLER , John R. Procesamiento Digital de señales. New Jersey: Macmillan Publishing, 1993. p. 56 . 16 HILERA , Jose R. Redes Neuronales Artificiales. Madrid: AlfaomegaSeries Paradigma, 1998. p. 154

Page 55: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

54

almacenamiento y procesamiento de señales del habla. En la mayoría de los sistemas de reconocimiento de las señales del habla, tanto de palabras aisladas, como de reconocimiento del habla continua, reconocimiento del locutor y otros, la distinción de las unidades acústicas se realiza a través de la forma de onda del habla.

El proceso parte de una señal continua x(t), que se muestrea usando un convertidor A/D para producir una sucesión de valores discretos x[n] =x(nTs), donde n es un valor entero que se utiliza como índice de muestreo y Ts es el período de muestreo. La frecuencia de muestreo es el valor fs = 1/Ts. El convertidor D/A ideal permite recuperar de nuevo la señal a partir de los valores discretos. El Teorema de Muestreo indica que si se elige una frecuencia de muestreo superior a dos veces la frecuencia mayor, fmax, presente en la señal de entrada, es decir fs > 2*fmax, entonces la salida y(t) en el sistema de la figura 2.1, será exactamente igual a la entrada x(t) si se reconstruye "adecuadamente" la señal. Para obtener la frecuencia fmax se puede representar la entrada como una suma de sinuoidales (Transformación de Fourier) y fmax sera le frecuencia asociada a la componente de mayor frecuencia con amplitud distinta de cero. La mayoría de los ordenadores tienen un conversor análogico-digital incorporado (A/D) y un conversor digital- análogico (D/A) incluido en la tarjeta de sonido. Estos sistemas son las realizaciones físicas de los conceptos idealizados de convertidores A/D y D/A respectivamente.

El proceso de conversión digital/analógico que se necesita en esta práctica solo va a depender del tiempo (Ts) entre los muestreos de la señal y en caso de reproducir la señal con la tarjeta de sonido, debe considerarse este valor como el correspondiente al valor de muestreo del conversor D/A que se esté usado.

Figura 2 : Muestreo y reconstrucción de una señal continúa en el tiempo

Fuente: www.ii.uam.es

Los procesos de muestreo y cuantificación proporcionan, por tanto, una discretización de la señal analógica, del habla tanto en el tiempo como en la amplitud. Para la realización del muestreo de la señal del habla es necesario hacer unas consideraciones previas sobre el riesgo del “aliasing”. El teorema de muestreo de Shannon establece que a las muestras de una señal analógica les corresponde unívocamente una representación si la señal analógica tiene la banda limitada y si la frecuencia de muestreo es al menos el doble de la frecuencia de Nyquist. Las bandas de frecuencia de las frases de voz de los diferentes sonidos no están completamente limitadas. Sin embargo, en las frecuencias altas el espectro tiende a disminuir en intensidad.

Page 56: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

55

En sonidos con articulaciones sonoras, las frecuencias superiores a 4 Khz. toman valores inferiores al menos en 40 dB respecto del pico del espectro. En el caso de sonidos con articulaciones sordas, el espectro no disminuye apreciablemente hasta frecuencias de 8 Khz. así pues, el teorema de muestreo la frecuencia de muestreo, que se debe utilizar para obtener una representación fiable sería al menos de 16 Khz. Sin embargo, en la mayor parte de las aplicaciones no se necesita esta frecuencia de muestreo, ya que la base del reconocimiento del habla consiste en estimar las tres primeras frecuencias formantes que, en cualquier caso son inferiores a 3.5 Khz. Por tanto una frecuencia de Nyquist de 4 Khz. es suficiente y, según el teorema de muestreo, la frecuencia de muestreo que se debe utilizar para obtener una representación fiable es de al menos 8 Khz.

Un aspecto importante es el referente a la pureza de la señal del habla original del habla. Es decir, que la señal analógica debe mantenerse dentro de unos niveles determinados de corrupción por ruido aleatorio. En caso de niveles altos de ruido, la señal combinada de habla y ruido debe filtrarse con un filtro pasabaja que recorte por encima de la frecuencia de Nysquit para evitar problemas de aliasing.

- filtros digitales: Los filtros digitales tienen como entrada una señal analógica o digital y a su salida tienen otra señal analógica o digital, pudiendo haber cambiado en amplitud, frecuencia o fase dependiendo de las características del filtro.

- filtro de Butterworth: Es uno de los filtros electrónicos más básicos, diseñado para producir la respuesta más plana que sea posible hasta la frecuencia de corte. En otras palabras, la salida se mantiene constante casi hasta la frecuencia de corte, luego disminuye a razón de 20n dB por década, donde n es el número de polos del filtro.

Figura 3 : Respuesta de un filtro Butterworth

Tomada de : http://es.wikipedia.org/wiki/Filtro_de_Butterworth

- Filtros de Chevyshev: En los filtros de chebyshev se consigue una caída de la respuesta en frecuencia más pronunciada en frecuencias bajas debido a que permiten más rizado que otros filtros en alguna de sus bandas.

Page 57: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

56

Figura 4. Respuesta de un filtro chevyshev.

Tomada de: http://es.wikipedia.org/wiki/Filtro_de_Chevyshev

- Ventanas: Son funciones matemáticas usadas con frecuencia en el análisis y el procesamiento de señales para evitar las discontinuidades al principio y al final de los bloques analizados. En procesamiento de señales, una ventana se utiliza para conocer una señal de longitud voluntariamente limitada. En efecto, una señal real tiene que ser de tiempo finito; además, un cálculo sólo es posible que a partir de un número finito de puntos.

- Ventana Rectangular.

Una ventana rectangular es aquella que posee un valor de 1 en todo el intervalo de la ventana, y de 0 para cualquier otro valor.

En la figura 1(a) podemos observar que la ventana rectangular continua, la misma que posee una amplitud constante, por lo que al utilizar una ventana de este tipo la señal no se verá afectada. En la figura 1(b) encontramos el equivalente de esta señal para señales muestreadas, es decir la ventana rectangular discreta.

- Ventana de hanning

La ventana de hanning se define a través de la función (1.0):

(1.0)

Para valores fuera del rango 1 a n tenemos una amplitud de 0.

- Ventana de hamming

La función (2.0) define esta ventana:

Page 58: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

57

(2.0)

De manera similar, si se tiene otros valores fuera del rango 0a n-1, estos poseen valor de cero.

En la figura 1(e) observamos la grafica de la ventana de Hamming continua. Podemos observar que es muy similar a la de Hanning, pero su respuesta en frecuencia variará, este tema se analizará con mayor detalle en las siguientes secciones del documento. En la figura 1(f) podemos observar la ventana de Hamming discreta, la misma que se ha obtenido a partir de 32 muestras.

Figura 5: Diferentes tipos de ventanas utilizadas en el muestreo de una señal.

Fuente : Tomada de www.monografias.com

Page 59: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

58

- Ventana de Blackman

La ventana de Blackman se define mediante la función (3.0):

(3.0)

En al figura 1 (g) podemos observar la ventana de blackman continua, mientras que en la figura 1(h) podemos observar la ventana de blackman discreta

2.3.6 Principio y final de palabra: 17 Un problema importante en el campo del reconocimiento del habla es la detección de la presencia del habla en un entorno más o menos ruidoso, lo que se denomina problema de localización de principio y final de palabra. La resolución de este problema consiste en buscar un detector de los bordes de la palabra, que consiga distinguir entre voz y silencio.

Tabla 2 . Parámetros para la detección sordo/sonoro

Segmentos sonoros: Segmentos sordos:

Energía por debajo de : 3 KHz, Energía por encima de

3 KHz

Componente principal: 700 Hz Componente principal 2,5 kHz Z[n] : 14 en10ms. Z[n] : 49en

10ms.

Fuente : www.physionet.cps.unizar.es

2.3.7 Cálculo espectral y caracterización de la voz : La Transformada de Fourier es una herramienta de análisis muy utilizada en el campo científico (acústica, ingeniería biomédica, métodos numéricos, procesamiento de señal, sonar, electromagnetismo, comunicaciones, etc.). Transforma una señal representada en el dominio del tiempo al dominio de la frecuencia pero sin alterar su contenido de información, sólo es una forma diferente de representarla. Se parte de la base de que toda señal genérica se puede descomponer en una suma de funciones periódicas simples de distinta frecuencia. En definitiva, la Transformada de Fourier visualiza los coeficientes de las funciones sinusoidales que forman la señal original.

2.4 FORMANTES18

El espectro de una señal periódica consistirá en un componente fundamental en el recíproco del periodo en una serie de armónicos de esa frecuencia. La fundamental también se llama primer armónico. Es posible tener una señal 17 SANTOS, Gustavo J Inteligencia Artificial y Matemática Aplicada : Reconocimiento Automático del Habla. Madrid: Universidad de Valladolid, 2000. p. 30 18 Ibid. p. 70

Page 60: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

59

periódica donde la fundamental es tan baja en nivel que no se puede observar, pero los armónicos todavía estarán a distancias iguales a la frecuencia fundamental.

La laringe excita las cavidades que componen el tracto vocal y se producen unas determinadas frecuencias de resonancia llamadas formantes, que equivalen a los máximos relativos de la envolvente del espectro de la señal. Cada sonido tiene varios máximos relativos (4 a 5). Se llama alófono a cada sonido que se diferencia de otros por el número de formantes, posición de los mismos, anchos de banda, nivel espectral.

Figura 6. Posición de los formantes por ancho de banda

Fuente www.wikipedia.org

Los primeros formantes pueden estimarse de diferentes formas. A través del cálculo de predicción lineal es posible obtener una estimación de las frecuencias formantes, que consiste en factorizar el polinomio predictor y a partir de las raíces obtenidas, decir cuales son formantes y cuales pertenecen a polos de la curva espectral. Estos picos o frecuencias formánticas se producen no necesariamente a un armónico, sino a un grupo de armónicos de frecuencias próximas a la de resonancia. Un formante se define como un máximo en la función de transferencia del tracto vocal. Cada vocal se caracteriza por unos formantes determinados que distinguen unas de otras, así las vocales castellanas se pueden clasificar en función de su estructura armónica.

Page 61: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

60

2.5 ANÁLISIS LPC . El método de análisis de predicción lineal es una de la recinchas de análisis de habla más potentes. Este método permite estimar los parámetros fundamentales, como son las frecuencias formantes, el espectro y la función de área del tracto vocal. A demás permite representaciones del habla para almacenamiento o transmisión con una baja proporción de bits por segundo. L a importancia del método está, por una parte, en que permite obtener con gran fiabilidad, los parámetros del habla, y por otra, en su relativa velocidad de cálculo. La idea básica de la predicción lineal está en que una muestra del habla pueda aproximarse dentro de un intervalo suficientemente estrecho, aunque en la práctica puede ser ancho, para que exista periodicidad. Mediante una combinación lineal de las muestras anteriores. Minimizando la suma de las diferencias al cuadrado sobre un intervalo finito entre las predicciones y las muestras reales, podemos determinar un conjunto único de coeficientes del preeditor: los coeficientes utilizados en la combinación lineal. La filosofía de la predicción lineal esta muy relacionada con el modelo básico de síntesis del habla, cuyo esquema es el de la figura 7.

Se puede observar que la señal del habla se modela como la salida de un sistema lineal variable con el tiempo con una excitación dependiendo si el sonido es sordo o sonoro. En el caso de sonido sonoro, la excitación consiste en pulsos cuasi-periódicos. En el caso de sonidos sordos, la excitación consiste en ruidos aleatorios. Como en el procesamiento de la forma de onda del habla, la predicción lineal permite varias formulaciones. Se consideran básicamente dos: El métodos de covarianza y autocorrelación.

Figura 7: Modelo general de tiempo discreto para la producción del habla.

Fuente: Inteligencia Artificial y matemática aplicada: Reconocimiento automático del habla

La importancia del método de predicción lineal está en la seguridad con que aplica un modelo básico al problema de la producción del habla, con los efectos

Page 62: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

61

de radiación, tracto vocal y excitación glotal representados por un filtro digital variable en el tiempo cuya función de transferencia (4.0) del sistema es de la forma

∑=

−−==

p

k

kk za

G

zU

zSzH

1

1)(

)()( (4.0)

Un aspecto importante en la formulación de predicción lineal es que permite una interpretación de las frecuencias formantes en términos de los coeficientes de predicción lineal que permiten obtener la función de transferencia del filtro del modelo según la ecuación (4.0). En la Figura 8. Muestra las frecuencias formantes que se pueden interpretar entonces, como los picos de la función de transferencia, el análisis espectral constituye, por tanto, una eficaz estimación del espectro en tiempo corto.

El sistema esta excitado por un tren de impulsos para el habla sonoro y una secuencia de ruido aleatorio para el habla sordo. Con ello, los parámetros que intervienen en el sistema son: clasificación sorda/sonora, periodo de la frecuencia fundamental, para habla sonora, parámetro de ganancia G y los coeficientes { ka } del filtro digital.

Figura 8. Representación de la función de transferencia del filtro a partir de los coeficientes de predicción lineal.

Fuente : Inteligencia Artificial y Matemática aplicada: Reconocimiento Automática del habla.

Este modelo simplificado todo – polo es una representación natural para sonidos sonoros no nasales. Sin embrago para sonidos sonoros y fricativos, la función de transferencia debe tener ceros y polos. No obstante, si el orcen del filtro p, es suficientemente grande, un modelo todo – polo proporciona una buena representación para cualquier sonido del habla humana. La principal ventaja de este modelo está en el parámetro G y los coeficientes del filtro { ka } pueden estimarse computacionalmente de forma directa y eficiente por el método de análisis de predicción lineal. Para el sistema de producción del

Page 63: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

62

habla propuesto, las muestras de habla s(n) se relacionan con la excitación u(n) por la siguiente ecuación (5.0) en diferencias.

S(n) = ∑=

+−p

kk nGuknsa

1

)()( (5.0)

Se define un predictor lineal de orden p con coeficientes predictores ka como

un sistema cuya salida es ŝ ∑=

−=p

kk knsan

1

)()( . (6.0)

La función del sistema de un predictor lineal de orden p es el polinomio

P (z) = kp

kk za −

=∑ *

1

(7.0)

Se define el error de predicción, e(n), en la ecuación (8.0)

e(n) = s(n) - ŝ(n)= -∑=

−p

kk knsa

1

)(* . (8.0)

De esta ecuación vemos que la sucesión de error de predicción es la salida de un sistema cuya función de transferencia (9.0) es

A(z)= 1 - kp

kk za −

=∑ *

1

. (9.0)

Comparando las ecuaciones (6.0) y (9.0) puede verse que la señal de habla se ajusta exactamente al modelo de la ecuación 2 y si ka = ka , entonces se cumple que e(n) = Gu(n). Así, el filtro de error de predicción, A(z), será un filtro inverso para el sistema de la ecuación (6.0), H(z) es decir,

H(z) = )(zA

G (10.0)

El problema básico del análisis de predicción lineal está en la determinación de un conjunto de coeficientes de predicción { ka } directamente desde la señal del habla, que permita obtener una buena estimación de las propiedades espectrales de la señal del habla utilizando la ecuación (10.0). Debido a la naturaleza variable con el tiempo de la señal del habla, los coeficientes del predictor deben estimarse en segmentos cortos del señal del habla. Un acercamiento básico consiste en encontrar un conjunto de coeficientes del predictor que minimicen el error de predicción cuadrático medio sobre un segmento corto de la forma de onda, los parámetros resultantes entonces se

Page 64: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

63

suponen que son los parámetros de la función del sistema, H(z), en el modelo de predicción del habla.

2.5.1 Método de autocorrelación : En este método de modelado, los coeficientes ap(k) pueden obtenerse resolviendo las ecuaciones normales de autocorrelación:

(11.0)

Donde

(12.0)

Calculados los coeficientes ap(k), podemos estimar el parámetro b(0) de la siguiente manera:

(13.0)

Y con estos parámetros disponibles, ya sólo resta sustituirlos en la "Ecuación de Estimación AR", para obtener la estimación espectral de potencia. En ocasiones, este método se denomina de Yule-Walker, y es equivalente al método de máxima entropía. De hecho, la única diferencia entre los dos métodos reside en la suposición realizada sobre el proceso x(n). Con el método de Yule-Walker se asume que x(n) es un proceso autorregresivo, mientras que en el método de máxima entropía se asume que x(n) es gaussiano.

Como la matriz de autocorrelación Rx utilizada en las ecuaciones normales es Toeplitz, puede utilizarse la recursión de Levinson-Durbin para resolver las ecuaciones y hallar los coeficientes ap(k). Además, si Rx > 0, las raíces de Ap(z) residirán dentro del círculo unidad. De todas formas, puesto que el método de autocorrelación aplica una ventana rectangular a los datos cuando estima la secuencia de autocorrelación, los datos son extrapolados con ceros. Generalmente, este método produce una resolución menor que otros métodos que no aplican el enventanado a los datos, como ocurre con el método de la covarianza.

Un fenómeno que puede observarse en este método es la separación espectral, que provoca que un pico en el espectro aparezca como dos picos

Page 65: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

64

separados y distintos. Este hecho se manifiesta cuando x(n) es sobreestimado por haber elegido un orden p demasiado alto. La estimación de la secuencia de autocorrelación realizada con este método es sesgada, pero podemos modificar este método con una estimación no sesgada:

(14.0)

En este caso, no se garantiza que la matriz de autocorrelación sea definida positiva, y, como resultado, la varianza de la estimación del espectro tiende a crecer cuando la nueva matriz de autocorrelación está mal condicionada o es singular. Por consiguiente, generalmente se prefiere la estimación sesgada de rx(k).

2.6 DESVIACIÓN ESTÁNDAR:

La desviación estándar es la medida de la dispersión de los valores respecto a la media (valor promedio). La formula utilizada fue la siguiente:

( )( )1

2

−−∑

n

xx (15.0)

donde x es la media de muestra promedio y n es el tamaño de la muestra.

2.7 Redes Neuronales 19

En la actualidad las redes neuronales es uno de los sistemas más utilizados en el reconocimiento de voz, puesto que su porcentaje de efectividad oscila entre un 90%. Existen varios tipos de RNA dependiendo de su topología, aprendizaje y aplicación, las RNA pueden desarrollar un tipo de aprendizaje supervisado o no supervisado, dependiendo del objetivo que se quiera que estas desarrollen (figura 9)

Figura 9. Redes neuronales

Fuente : www.answermath.com

19 HILERA , Jose R. Redes Neuronales Artificiales. Madrid: AlfaomegaSeries Paradigma, 1998. p. 56

Page 66: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

65

Una red neuronal es un conjunto de neuronas artificiales interconectadas por medios de procesadores que simulan las conexiones sinápticas, las redes neuronales parte de un conjunto de datos de entrada para empezar una fase de entrenamiento (programación), en esta fase se modelan los pesos (conexiones sinápticas), para que la red pueda cumplir el objetivo y resolver el problema para la cual ha sido entrenada.

A cada neurona que compone la red se le asocia una ecuación matemática (función de transferencia), la cual es capaz de emitir una señal de salida de la neurona dependiendo de la señal de entrada.

Utilizar redes neuronales en el reconocimiento de voz es de gran importancia debido a la eficacia que presentan y a su alto porcentaje de efectividad, entre otras ventajas encontramos

• Aprendizaje: Las RNA tienen la habilidad de aprender mediante una etapa que se llama etapa de aprendizaje. Esta consiste en proporcionar a la RNA datos como entrada a su vez que se le indica cuál es la salida (respuesta) esperada.

• Auto organización: Una RNA crea su propia representación de la información en su interior, descargando al usuario de esto.

• Tolerancia a fallos. Debido a que una RNA almacena la información de forma redundante, ésta puede seguir respondiendo aceptablemente aún si parcialmente se daña.

• Flexibilidad: Una RNA puede manejar cambios no importantes en la información de entrada, como señales con ruido u otros cambios en la entrada (ej. si la información de entrada es la imagen de un objeto, la respuesta correspondiente no sufre cambios si la imagen cambia un poco su brillo o el objeto cambia ligeramente)

• Tiempo real: La estructura de una RNA es paralela, por lo cuál si esto es implementado con computadoras o en dispositivos electrónicos especiales, se pueden obtener respuestas en tiempo real.

2.7.1 El Modelo Biológico 20 La teoría y modelado de las redes neuronales artificiales está inspirada en la estructura y funcionamiento de los sistemas nerviosos, donde la neurona es el elemento fundamental, existen neuronas de formas, tamaños y longitudes.

2.7.2 Estructura de la neurona 21 Una neurona es una célula viva y, como tal, contiene los mismos elementos que forman parte de todas las células biológicas. Una neurona consta de un cuerpo celular más o menos esférico, de 5 a 10 micras de diámetro del que salen una capa del axón, y varias ramas más cortas, llamadas dendritas. A su vez, el axón puede producir ramas en entorno a su punto de arranque, y con frecuencia se ramifica extensamente cerca de su entorno.

20 HILERA , Jose R. Redes Neuronales Artificiales. Madrid: AlfaomegaSeries Paradigma, 1998. p. 154 21 Ibid,. p 158

Page 67: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

66

Figura 10. Forma general de una neurona.

Fuente : www.unizar.es

2.7.3 La Red Backpropagation: 22es un tipo de red de aprendizaje supervisado, que emplea un ciclo propagación – adaptación de dos fases. Una vez que se ha aplicado un patrón a la entrada de la red como estímulo, este se propaga desde la primera capa a través de las capas superiores de la red, hasta generar una salida. La señal de salida se compara con la salida deseada y se calcula una señal de error para cada una de las salidas.

Las salidas de error se propagan hacia atrás, partiendo de la capa de salida, hacia todas las neuronas de la capa oculta que contribuyen directamente a la salida. Sin embargo las neuronas de la capa oculta solo reciben una fracción de la señal total del error, basándose aproximadamente en la contribución relativa que haya aportado cada neurona a la salida original. Este proceso se repite, capa por capa, hasta que todas las neuronas de la red hayan recibido una señal de error que describa su contribución relativa al error total. Basándose en la señal de error percibida, se actualizan los pesos de conexión de cada neurona, para hacer que la red converja hacia un estado que permita clasificar correctamente todos los patrones de entrenamiento.

2.7.4 Estructura de la Red: 23 La estructura típica de una red multicapa se observa en la (Figura 3) Puede notarse que esta red de tres capas equivale a tener tres redes tipo Perceptrón en cascada; la salida de la primera red, es la entrada a la segunda y la salida de la segunda red es la entrada a la tercera. Cada capa puede tener diferente número de neuronas, e incluso distinta función de transferencia.

22 HILERA , Jose R. Redes Neuronales Artificiales. Madrid: Alfaomega Series Paradigma, 1998. p. 160 23 Ibid,. 162

Page 68: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

67

Figura 11. Redes Multicapa

Tomada de : www.ohm.utp.edu.co

- La regla delta generalizada: La regla propuesta por Widrow en 1960 (regla delta) ha sido extendida a redes con capas intermedias (regla delta generalizada) con conexiones hacia delante (feedforward) y cuyas células tienen funciones de activaciones continuas (lineales o sigmoides), dando lugar al algoritmo de retropropagation (backpropagation). Estas funciones continuas son no decrecientes y deribables,

2.7.5 Regla de Aprendizaje: La red Backpropagation trabaja bajo aprendizaje supervisado y por tanto necesita un set de entrenamiento que le describa cada salida y su valor de salida esperado de la siguiente forma:

{p1,t1}, {p2,t2}, . . . ,{pQ, tQ} (16.0)

Donde pQ es una entrada a la red y tQ es la correspondiente salida deseada para el patrón q-ésimo. El algoritmo debe ajustar los parámetros de la red para minimizar el error medio cuadrático.

El entrenamiento de una red neuronal multicapa se realiza mediante un proceso de aprendizaje, para realizar este proceso se debe inicialmente tener definida la topología de la red esto es: número de neuronas en la capa de entrada el cual depende del número de componentes del vector de entrada, cantidad de capas ocultas y número de neuronas de cada una de ellas, número de neuronas en la capa de la salida el cual depende del número de componentes del vector de salida o patrones objetivo y funciones de transferencia requeridas en cada capa, con base en la topología escogida se asignan valores iniciales a cada uno de los parámetros que conforma la red.

Page 69: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

68

Cada patrón de entrenamiento se propaga a través de la red y sus parámetros para producir una respuesta en la capa de salida, la cual se compara con los patrones objetivo o salidas deseadas para calcular el error en el aprendizaje, este error marca el camino mas adecuado para la actualización de los pesos y ganancias que al final del entrenamiento producirán una respuesta satisfactoria a todos los patrones de entrenamiento, esto se logra minimizando el error medio cuadrático en cada iteración del proceso de aprendizaje.

Figura12 . Disposición de una red sencilla de 3 capas.

Fuente: www.ohm.utp.edu

q: Equivale al número de componentes el vector de entrada. m: Número de neuronas de la capa oculta l: Número de neuronas de la capa de salida

Para iniciar el entrenamiento se le presenta a la red un patrón de entrenamiento, el cual tiene q componentes como se describe en la ecuación (17.0)

(17.0)

Cuando se le presenta a la red una patrón de entrenamiento, este se propaga a través de las conexiones existentes produciendo una entrada neta n en cada una las neuronas de la siguiente capa, la entrada neta a la neurona j de la siguiente capa debido a la presencia de un patrón de entrenamiento en la entrada esta dada por la ecuación (18.0), nótese que la entrada neta es el valor justo antes de pasar por la función de transferencia

Page 70: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

69

(18.0)

W oji: Peso que une la componente i de la entrada con la neurona j de la capa

oculta pi: Componente i del vector p que contiene el patrón de entrenamiento de q componentes bo

j: Ganancia de la neurona j de la capa oculta

Donde el superíndice (o) representa la capa a la que pertenece cada parámetro, es este caso la capa oculta.

Cada una de las neuronas de la capa oculta tiene como salida aoj que esta

dada por la ecuación (19.0).

(19.0)

f o: Función de transferencia de las neuronas de la capa oculta

Las salidas aoj de las neuronas de la capa oculta (de l componentes) son las

entradas a los pesos de conexión de la capa de salida, este comportamiento esta descrito por la ecuación (20.0)

(20.0)

Wskj: Peso que une la neurona j de la capa oculta con la neurona k de la capa

de salida, la cual cuenta con s neuronas

aoj: Salida de la neurona j de la capa oculta, la cual cuenta con m neuronas.

bsk: Ganancia de la neurona k de la capa de salida.

nsk: Entrada neta a la neurona k de la capa de salida

La red produce una salida final descrita por la ecuación (21.0)

(21.0)

f s: Función de transferencia de las neuronas de la capa de salida

Reemplazando (20.0) en (21.0) se obtiene la salida de la red en función de la entrada neta y de los pesos de conexión con la ultima capa oculta

Page 71: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

70

(22.0)

La salida de la red de cada neurona ask se compara con la salida deseada tk

para calcular el error en cada unidad de salida (23.0)

(23.0)

El error debido a cada patrón p propagado esta dado por (24.0)

(24.0)

ep2: Error medio cuadrático para cada patrón de entrada p

kδ : Error en la neurona k de la capa de salida con l neuronas

Este proceso se repite para el número total de patrones de entrenamiento (r), para un proceso de aprendizaje exitoso el objetivo del algoritmo es actualizar todos los pesos y ganancias de la red minimizando el error medio cuadrático total descrito en (25.0)

(25.0)

e2: Error total en el proceso de aprendizaje en una iteración luego de haber presentado a la red los r patrones de entrenamiento

El error que genera una red neuronal en función de sus pesos, genera un espacio de n dimensiones, donde n es el número de pesos de conexión de la red, al evaluar el gradiente del error en un punto de esta superficie se obtendrá la dirección en la cual la función del error tendrá un mayor crecimiento, como el objetivo del proceso de aprendizaje es minimizar el error debe tomarse la dirección negativa del gradiente para obtener el mayor decremento del error y de esta forma su minimización, condición requerida para realizar la actualización de la matriz de pesos en el algoritmo Backpropagation:

(26.0)

El gradiente negativo de ep2 se denotara como y se calcula como la derivada del error respecto a todos los pesos de la red.

Page 72: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

71

En la capa de salida el gradiente negativo del error con respecto a los pesos es:

(27.0)

: Componente del gradiente respecto al peso de la conexión de

la neurona de la capa de salida y la neurona j de la capa oculta .

: Derivada de la salida de la neurona k de la capa de salida respecto, al peso Ws

kj.

Para calcular se debe utilizar la regla de la cadena, pues el error no es una función explícita de los pesos de la red, de la ecuación (22.0) puede verse que la salida de la red as

k esta explícitamente en función de nsk y de la

ecuación (21.0) puede verse que nsk esta explícitamente en función de Ws

kj, considerando esto se genera la ecuación (28.0)

(28.0)

Tomando la ecuación (29.0) y reemplazándola en la ecuación (28.0) se obtiene,

(29.0)

: Derivada de la entrada neta a la neurona k de la capa de salida respecto a los pesos de la conexión entre las neuronas de la capa oculta y la capa de salida

Page 73: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

72

: Derivada de la salida de la neurona k de la capa de salida respecto a su entrada neta.

Reemplazando en la ecuación (29.0) las derivadas de las ecuaciones (21.0) y (22.0) se obtiene

(30.0)

Como se observa en la ecuación (30.0) las funciones de transferencia utilizadas en este tipo de red deben ser continuas para que su derivada exista en todo el intervalo, ya que el término f’s (ns

k) es requerido para el cálculo del error.

Las funciones de transferencia más utilizadas y sus respectivas derivadas son las siguientes:

Logsig: (31.0)

Tansig: (32.0)

Purelin: (33.0)

De la ecuación (30.0), los términos del error para las neuronas de la capa de salida están dados por la ecuación (34.0), la cual se le denomina comúnmente sensitividad de la capa de salida.

(34.0)

Este algoritmo se denomina Backpropagation o de propagación inversa debido a que el error se propaga de manera inversa al funcionamiento normal de la red, de esta forma, el algoritmo encuentra el error en el proceso de aprendizaje desde las capas más internas hasta llegar a la entrada; con base en el cálculo de este error se actualizan los pesos y ganancias de cada capa.

2.7.6 Control de la Convergencia: En las técnicas de gradiente descendiente es conveniente avanzar por la superficie de error con incrementos pequeños de los pesos; esto se debe a que tenemos una información local de la superficie y no se sabe lo lejos o lo cerca que se está del punto mínimo, con incrementos grandes, se corre el riesgo de pasar por encima del punto mínimo, con

Page 74: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

73

incrementos pequeños, aunque se tarde más en llegar, se evita que esto ocurra.

Al elegir un incremento adecuado influye en la velocidad de convergencia del algoritmo, esta velocidad se controla a través de la rata de aprendizaje , la que por lo general se escoge como un número pequeño, para asegurar que la red encuentre una solución. Un valor pequeño de significa que la red tendrá que hacer un gran número de iteraciones, si se toma un valor muy grande, los cambios en los pesos serán muy grandes, avanzando muy rápidamente por la superficie de error, con el riesgo de saltar el valor mínimo del error y estar oscilando alrededor de él, pero sin poder alcanzarlo.

Es recomendable aumentar el valor de a medida que disminuye el error de la red durante la fase de entrenamiento, para garantizar así una rápida convergencia, teniendo la precaución de no tomar valores demasiado grandes que hagan que la red oscile alejándose demasiado del valor mínimo. Algo importante que debe tenerse en cuenta, es la posibilidad de convergencia hacia alguno de los mínimos locales que pueden existir en la superficie del error del espacio de pesos como se ve en la figura 8.

Figur13. Superficie típica de error

Fuente : Redes Neuronales Artificiales, José, Hilera.

En el desarrollo matemático que se realizo para llegar al algoritmo Backpropagation, no se asegura en ningún momento que el mínimo que se encuentre sea global, una vez la red se asiente en un mínimo sea local o global cesa el aprendizaje, aunque el error siga siendo alto. En todo caso, si la solución es admisible desde el punto de vista del error, no importa si el mínimo es local o global o si se ha detenido en algún momento previo a alcanzar un verdadero mínimo.

Page 75: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

74

3. METODOLOGÍA

3.1. ENFOQUE DE LA INVESTIGACIÓN El enfoque empleado en esta investigación será de tipo Empírico-analítico debido a que se desarrollará una herramienta enfocada dentro del entorno técnico e investigativo. El conocimiento y la experiencia son adquiridos a través de la información recolectada y el desarrollo del proyecto mediante la búsqueda y la sustentación de las diferentes teorías expuestas para cada campo de investigación que compete al desarrollo del proyecto. Al aplicar y analizar los diferentes métodos hallados, es posible obtener el objetivo deseado. 3.2. LÍNEA DE INVESTIGACIÓN Debido a las características interdisciplinarias del proyecto las líneas de investigación a seguir son:

• Tecnologías actuales y sociedad: Debido a que el proyecto es realizable utilizando metodologías aplicables al desarrollo de la adecuada pronunciación de niños con discapacidad oral.

Las sublíneas de las facultades de Ingeniería de Sonido y Electrónica son:

• Procesamiento de Señal: Al capturar una señal de voz es necesario someterla a un procesamiento digital para determinar ciertas características y lograr el reconocimiento de la señal por parte del ordenador.

Los campos de Investigación a seguir son:

• Análisis y procesamiento de señales: Dentro de las redes neuronales es necesario realizar un análisis de la señal obtenida y almacenada logrando que la RNA cumpla su función de comparación.

• Diseño de sistemas de sonido: Es una herramienta diseñada para la

corrección fonética que involucra procesamiento de señal y síntesis de voz.

3.3. TÉCNICAS DE RECOLECCIÓN DE INFORMACIÓN

El desarrollo del proyecto Sugiere aplicar tres métodos para la recolección de información, en primer lugar se llevaron a cabo las encuestas a los fonoadiólogos para determinar cuales son los tipos de dislalias más comunes y a las cuales no se les ha prestado mayor atención en la creación de herramientas que permitan el desarrollo de terapias en los niños.

Page 76: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

75

Ello ha provocado que gran parte del tiempo sea dedicado a la investigación en el área de la Fonoaudiología lo cual requiere que se solicite la adecuada información para retroalimentar el proyecto debido a que está enfocado a la educación especializada. Para la elección de los dos fonemas contemplados, se recurrió a especialistas en el tema de fonoaudiología y lenguaje los cuales por medio de entrevistas (ver anexo) y preguntas especificas tales como ¿Cuáles son los tipos de dislalias especificas más comunes en los niños?, ¿Qué tan común es encontrar dislalias específicas en los niños, en los fonemas G y K conocidas como Gammacismo y Kappacismo?,¿Cree usted que un software destinado a la corrección fonética sería de gran ayuda para la terapia realizada en el consultorio como en casa?, fueron decisivos en sus respuestas para determinar que tan viable es implementar una herramienta para los fonemas o dislalia especificas evaluados y el tipo de ayuda la cual se requiere para el desarrollo optimo de la terapia requerida.

En segundo lugar se consultaron algunos textos publicados por el Instituto Caro y Cuervo, los cuales han sido enfocados al estudio y evolución de la lengua Castellana en Colombia, para consolidar que el Gammacismo y el Kappacismo son realmente dislalias especificas.

Como un tercer proceso, fueron obtenidas muestras de voz de la población infantil seleccionada en dos instituciones educativas con edades que oscilan entre los 4 y 6 años, para lo cual se les pidió pronunciar los fonemas y palabras escogidos. Posteriormente los patrones obtenidos fueron seleccionados y clasificados para la creación de la base de datos la cual es introducida como patrón general a la red neuronal.

3.4. POBLACIÓN Y MUESTRA

El Software a desarrollar va dirigido a:

• La Fonoaudiología como abordaje temático es un área de la salud interesada por el estudio y manejo de los procesos normales y patológicos de la comunicación humana (audición, voz, habla y lenguaje). En primera instancia se recurrió a una especialista del centro ICAL y luego a diez especialistas en el tema de fonoaudiología y lenguaje por medio de entrevista para la elección de los dos fonemas contemplados.

• El desarrollo de lógica de pensamiento del lenguaje de los niños de 5 años en adelante que presentan problemas de aprendizaje de los fonemas K y G.

• Las muestras de entrenamiento se realizaron en dos instituciones educativas Colegio San Rafael y Centro Santa Magdalena Sofía, a 50 niños entre edades de 5 a 7 años. Las muestras posteriores de comparación son tomadas de niños con dificultad en el lenguaje que asisten a terapia en el centro ICAL mediante el contacto directo con algunos de los padres.

Page 77: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

76

3.5. HIPÓTESIS Si se desarrolla un diseño del Software de corrección fonética para niños con problemas de aprendizaje se podrá obtener una herramienta de enseñanza asistida ya que es un software de fácil acceso y manipulación. En el Software se podrá visualizar los fonemas K y G, palabras e imágenes establecidas en la base de datos, permitiendo cuantizar el número de aciertos conseguidos por el paciente. 3.6. VARIABLES 3.6.1. Variables Independientes -Desarrollo de la metodología integrable a la herramienta. -Desarrollo de un módulo de asociación visual integrable a la herramienta. 3.6.2. Variables Dependientes

• Dependiendo de la metodología desarrollada por parte de la persona encargada del tratamiento la herramienta tendría alta relevancia además de variar la efectividad de la herramienta conforme se instaure el proceso pedagógico en el paciente.

• La posibilidad de expansión del vocabulario inicial tiene gran relevancia

debido a que sería necesaria la implementación de una base de datos aplicada a audio.

• El desarrollo del módulo de asociación visual facilitaría de alguna

manera la evolución del niño y de la niña ya que permitiría agregar otro elemento de asociación al proceso facilitando la identificación de la palabra.

Page 78: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

77

4. PRESENTACIÒN DE ANÁLISIS Y RESULTADOS

4.1 ENTREVISTA A FONOAUDIÓLOGOS

A partir de los resultados obtenidos por las entrevistas y la investigación realizada, fueron seleccionadas las respuestas más significativas con las cuales se concluye que K y G son realmente una dificultad en la pronunciación actual de los niños que presentan trastornos en el aprendizaje del lenguaje, y para los cuales no se han desarrollado herramientas especificas para el tratamiento de estos, para un mejor desarrollo durante la terapia se recomienda complementar la sesión con palabras relacionadas con los fonemas mencionados anteriormente, para esto se realizó una selección de dos palabras las cuales comienzan por los fonemas escogidos, como lo son: gato y koala, este procedimiento fue desarrollado con el fin de alcanzar un nivel de dificulta en la terapia. La selección de las palabras se realizó teniendo en cuenta la facilidad que presentan para ser recordadas por los niños. Es recomendado que cada uno de los fonemas y palabras sean acompañados de imágenes, por esta razón su elección hace alusión a los fonemas y palabras mencionados anteriormente y es acorde a la interfaz de usuario implementada.

Como resultado de las encuestas realizadas a los fonoaudiólogos y realizando la tabulación pertinente de los datos por medio de gráficos, se obtuvieron los siguientes resultados.

¿Entre los tipos de dislalias más comunes en los niños, se encuentran incluidos los fonemas k y g?

Figura 14. Porcentaje de los fonemas K y G entre las dislalias más comunes.

80%

20%

Respuestas Positivas Respuestas Negativas

Para esta pregunta realizada a los fonoaudiologos se obtuvo un total de 8 respuestas positivas y dos negativas para las cuales la K y la G se encuentran incluidas como uno de las dislalias más comunes en la población infantil.

¿Por que se pueden encontrar estos tipos de dislalias Kappacismo y Gammacismo?

Page 79: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

78

Figura 15. Porcentaje para los motivos para diagnosticar una dislalia.

50%

30%

20%

Incorrecta Posición en los organos alteraciones Anatonicas Padres Expresan de forma incorrecta

Un 50% de los encuestados concluyó que este tipo de dislalias se puede presentar por la incorrecta posición en los órganos articulatorios, el 30% por la alteración anatómica o fisiológica, y un 20% concluyo que otra razón puede ser porque los padres expresan de forma incorrecta o consentida las palabras a sus hijos.

¿De cada 20 niños en consulta en cuantos se puede diagnosticar dislalias específicas, en el fonema G y K conocidas como (Kappacismo y Gammacismo)?

Figura 16 . Porcentaje de los niños en consulta a los cuales se les diagnostica Gammacismo o Kappacismo.

80%

20%

Respuestas Positivas Respuestas Negativas

Generalmente se pueden encontrar 12 niños que presenten dislalias específicas con los fonemas K y G.

¿Considera usted, que las palabras gato y koala son importantes para trabajar en los niños cuando se presenta gammacismo y kapacismo por que?

Page 80: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

79

Figura 17. Porcentaje para determinar si las palabras gato y koala son importantes para trabajar los fonemas G y K.

80%

20%

Respuestas Positivas Respuestas Negativas

UN 80% de los encuestados piensa que son importantes estas palabras con su imagen ya que ayudaran a afianzar la pronunciación, teniendo en cuenta anterior a esto un proceso de articulación. ¿Cree usted necesario en el caso de que sea implementado un software que este incluya imágenes alusivas a los fonemas y palabras tratados? Figura 18 . Porcentaje para establecer la importancia de que el software incluya imágenes alusivas.

Respuetas Positivas; 100%

1

El 100% concluye que es obligatorio que el software contenga imágenes alusivas a los fonemas y palabras a tratar, ya que es de gran ayuda conocer que objetos tienen estos fonemas y si son vistos serán expresados con la mejor claridad posible y de forma mecánica.

Page 81: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

80

4.3 Diagramas de Reconocimiento de Patrones En la (figura 19.) se define los procedimientos generales para el reconocimiento de patrones. Figura 19. Diagrama de bloques general para el reconocimiento de patrones.

El diagrama muestra un bloque de adquisición de datos seguido de un procesamiento digital y finalmente un proceso de reconocimiento de patrones para obtener la salida deseada. En la (figura 20.) se observa el diagrama de bloques para realizar un reconocimiento de patrones con una salida deseada, en el cual se realiza un análisis detallado para cada bloque. Figura 20. Diagrama de Bloques especifico para el reconocimiento de patrones.

En el primer bloque es definido parámetros de tiempo y frecuencia de muestreo necesarios para realizar la adquisición de la voz seguido de un filtrado pasabandas definiendo el trozo de la señal analizada mediante la detección de principio y final de palabra; la detección de formantes permite obtener seis puntos máximos los cuales son introducidos a la red neuronal la cual mediante un proceso de entrenamiento y aprendizaje realiza una comparación de muestras que define que tan similares son las señales. 4.3 ADQUISICIÓN DE LA SEÑAL DE VOZ La señal de voz fue adquirida por medio de un micrófono multimedia (MIC- 01A), omnidireccional con una impedancia máxima de salida de 2.2 Kw, sensibilidad de – 62 dB ± 4 dB (1 Khz), respuesta de frecuencia de 100 Hz a 10 Khz, relación señal ruido > 40dB (1Khz). Tarjeta de sonido C-Media Audio

Page 82: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

81

Device AC-97 puerto PCI del sistema en el canal 1. Con una frecuencia de muestreo de 11025 Hz, a 16 bits en un formato .wav, monofónico. Esta adquisición fue posible mediante un código implementado en Matlab con un tiempo de captura de 2 Sg. Ver (anexo B). 4.5 PROCESAMIENTO DE SEÑAL 4.5.1 Filtrado de la señal adquirida: Los diferentes tipos de filtro digitales analizados fueron Filtro Bessel, Elípticos, Butterworth, Chevyshev. Según la banda de frecuencia deseada se obtuvo una mejor respuesta con los filtros Chevyshev y Butterworth puesto que permitieron un corte de frecuencias en el rango deseado. Entre los filtros elegidos se conformó un pasabandas con las siguientes características un filtro Chevy pasabajas con frecuencia de corte en 4000 Hz, de orden 9, y un filtro Butter pasaaltas con frecuencia de corte en 250 Hz, de orden 6, para obtener el rango de frecuencias a analizar en el cual se encuentran los tres primeros formantes o picos máximos de la señal de voz. 4.5.2 Detección de principio y final de palabra: La detección del habla se realizó teniendo en cuenta que las muestras son tomadas en un ambiente mas o menos ruidoso, con el fin de localizar la señal de interés el detector de principio y final consigue distinguir entre voz y silencio. Los parámetros son calculados a partir de dos medidas de la señal teniendo en cuenta el cruce por ceros y la energía. En el algoritmo de detección de bordes se calculan los parámetros y umbrales definidos anteriormente. Se considera el segmento de la señal muestreada en la cual se encuentra la palabra entre un silencio inicial y un silencio final, este se divide en ventanas de npi = 256 muestras correspondientes a 10 mseg solapadas entre si es decir se consideran los intervalos de la señal y a estos se les calcula la energía. En la búsqueda del principio se determina la primera ventana que supera el UESUP (umbral de energía superior ). El comienzo de palabra es anterior a esta ventana, posteriormente se establece el principio de la señal en la primera ventana anterior a la calculada que no supere el umbral UEINF (umbral de energía inferior ). El cruce por cero es utilizado para detectar niveles bajos de energía, la constante niz24 es el número de intervalos a analizar, por otra parte se define el valor V como el número posible que debe superar el umbral en los niz segmentos anteriores al principio y como el número posible de veces que se puede superar el umbral en los niz en el final de la palabra. 4.5 RECONOCIMIENTO DE PATRONES 4.5.1 Detección de formantes: El algoritmo desarrollado para el cálculo de las frecuencias formantes consiste, en calcular el espectro y después, elegir los formantes a partir de un método de picos máximos. En este código se calcula

24 niz ; Numero de intervalos de cruces por cero

Page 83: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

82

el espectro de la señal a analizar para luego extraer los formantes de la señal en bandas de frecuencia seleccionadas. Al aplicar la transformada de fourier, a la señal en el dominio del tiempo, se obtiene la señal en dominio de la frecuencia, de esta forma se puede obtener el espectro de la señal con sus coordenadas en amplitud y en frecuencia. En primer lugar la señal es dividida en seis ventanas de igual ancho de banda dentro del espectro en las cuales se calcula el valor con máxima amplitud cuya frecuencia (valor en el eje de las abcisas) corresponderá a los formantes. El método implementado por Matlab determina el número mayor de la función en análisis. Mediante este algoritmo se obtienen la ubicación de 6 puntos máximos o formantes, su valor en amplitud y su ubicación en frecuencia, este valor es obtenido en un valor complejo del cual se debe obtener la magnitud para su posterior análisis en la red neuronal.

4.5.2.1 Punto de incertidumbre: Antes de calcular el punto de incertidumbre es necesario realizar una clasificación de las muestras de voz grabadas con anterioridad, para determinar una base de datos con características similares en los valores obtenidos para cada banda en frecuencia. Algunas de las muestras descartadas no fueron tenidas en cuenta por factores tales como defectos de grabación, errores en la pronunciación, excesivo ruido los cuales interferían en el momento de obtener los picos máximos de la señal.

El punto de incertidumbre fue calculado por medio de la desviación estándar a cada uno de los datos obtenidos en el punto anterior, para determinar que valor se puede desplazar por encima o por debajo de la frecuencia determinada para cada formante.

Los valores seleccionados en la base de datos para cada patrón varían muy poco entre sí, en cada una de las bandas de frecuencia, como se puede observar a continuación:

Tabla 3 . Frecuencias de los formantes para el fonema G.

F1 F2 F3 F4 F5 F6 494 533 1016 1980 2131 2923 237 498 993 1857 2163 2666 459 670 1393 1798 2330 2484 433 498 1090 1948 2144 2607 386 575 1070 1934 2184 2492 401 605 1200 1947 2025 2551 483 501 1221 1949 2116 2547 411 566 1025 1847 2264 2878 383 509 1161 1932 2317 2508 414 620 1033 1657 2277 2689 440 662 1322 1965 1997 2658 293 586 1475 1772 2371 2653

Page 84: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

83

472 512 1193 1916 2034 2760 490 520 1038 1818 2064 2584 280 563 1138 1973 2280 2557 273 548 1377 1930 2202 2733 294 593 1104 1980 2060 2901 257 524 1041 1824 2345 2604 306 617 1235 1859 2147 2807 390 582 1367 1785 2322 2760 257 571 1142 1973 2289 2858 267 539 1090 1914 2143 2640 294 593 1104 1980 2060 2901 257 524 1041 1824 2345 2604 306 617 1235 1859 2147 2807 390 582 1367 1785 2322 2760 257 571 1142 1973 2289 2858 267 539 1090 1914 2143 2640 485 534 1076 1897 2160 2700 321 627 991 1968 2078 2525 483 513 1028 1546 2320 2576 324 654 991 1968 1981 2947 398 737 1105 1969 2323 2802 368 743 1111 1854 2223 2963 310 627 1255 1889 2202 2514 238 502 1003 1752 2242 2501 466 501 1173 1948 2352 2798 494 498 1000 1838 2352 2816 485 495 1107 1877 2455 2642 240 729 1378 1787 2425 2848 267 523 1034 1962 2062 2820 313 627 1262 1887 2445 2512 469 506 1445 1759 2221 2925 480 495 1211 1957 2384 2801 395 541 1156 1725 2476 2919

Tabla 4. Frecuencias de los formantes para el fonema K.

F1 F2 F3 F4 F5 F6 252 620 1012 1496 2176 2960 493 535 1242 1486 2231 2806 202 872 1005 1526 2404 2613 423 847 1068 1487 2331 2567 402 806 1008 1565 2422 2825 227 942 1025 1525 2476 2848 209 864 1033 1554 2415 2545 225 668 1258 1512 2390 2521 361 732 1274 1594 2363 2554 324 665 1132 1559 2197 2668

Page 85: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

84

273 595 1084 1781 2153 2620 384 568 1036 1725 2465 2639 294 603 1003 1486 2009 2644 309 660 993 1667 2132 2845 261 797 1326 1592 1993 2905 410 719 1043 1611 2461 2793 249 744 991 1493 2465 2491 308 978 991 1641 2301 2627 372 924 1482 1486 2031 2948 252 990 1011 1688 2057 2881 251 987 1286 1857 2090 2564 262 981 1007 1580 2004 2930 344 954 1028 1571 1986 2733 227 924 1027 1641 2101 2909 280 843 1119 1675 1993 2510 305 904 1006 1497 2416 2487 210 871 1074 1496 2119 2506 245 985 997 1517 2466 2486 282 824 1138 1648 2003 2856 251 987 1286 1857 2090 2564 197 585 1368 1559 2256 2915 173 901 1007 1497 1981 2971 279 828 1102 1733 2239 2506 210 854 1078 1500 2075 2954 209 872 1289 1506 2399 2558 245 990 1012 1689 2100 2883

74,04014355 142,1041508 131,2613139 104,9977891 175,7140986 172,580913

Tabla 5 . Frecuencias de los formantes para la palabra Gato.

F1 F2 F3 F4 F5 F6 467 703 1151 1839 2055 2607 237 737 1440 1695 2438 2824 420 634 1241 1486 2458 2567 225 501 1011 1725 2346 2843 368 748 1469 1493 2390 2585 191 610 1120 1562 2466 2506 214 678 1345 1567 2445 2630 365 540 1459 1633 1998 2733 334 501 1346 1513 2411 2851 389 779 1362 1561 2131 2727 218 683 1350 1592 2450 2559 264 831 1106 1661 2218 2492 453 819 1371 1644 2460 2744 487 496 1268 1959 2085 2541 337 775 1348 1507 2070 2872 262 811 1065 1595 2399 2651

Page 86: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

85

266 633 1316 1762 2331 2868 466 715 1427 1648 2138 2572 276 837 1393 1671 2232 2784 460 693 1385 1610 2073 2764 392 787 1373 1566 2352 2945 266 788 1048 1582 2094 2898 259 791 1031 1601 2025 2522 255 983 991 1766 2004 2868 273 831 1083 1694 2131 2971 369 737 1105 1845 2215 2956 460 713 1425 1601 2032 2947 272 634 1236 1848 2366 2519 289 580 1462 1742 2318 2636 183 510 993 1818 2279 2656 242 597 1111 1829 2444 2637 173 502 1395 1498 2143 2777 196 771 1006 1565 2020 2953 285 856 1151 1722 2000 2873 287 841 1168 1748 2042 2923 404 798 999 1610 2399 2580 188 678 1281 1492 2457 2807

94,59047975 121,0425743 161,9024147 120,4188199 170,6931858 153,9429616

Tabla 6 . Frecuencias de los formantes para la palabra Koala.

F1 F2 F3 F4 F5 F6 451 690 1142 1597 2466 2523 391 805 1020 1604 2421 2657 413 628 1053 1487 2315 2746 452 694 1173 1864 2453 2546 358 716 1070 1553 2460 2679 205 590 1005 1602 2459 2750 413 591 996 1544 2418 2546 389 581 1161 1566 2342 2519 241 892 992 1805 2323 2558 357 540 1245 1563 2306 2851 418 827 1051 1586 2059 2832 210 854 1285 1489 2353 2551 250 748 994 1770 2035 2536 240 516 994 1579 2272 2750 484 783 1304 1564 2081 2862 226 700 1407 1670 2098 2858 412 552 1394 1538 2472 2702 256 782 1047 1486 2472 2801 245 770 1030 1551 2318 2562 451 671 1121 1571 2467 2910 282 543 1143 1734 1997 2585

Page 87: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

86

412 847 1293 1515 2157 2801 462 517 992 1692 2018 2831 282 877 1164 1773 2062 2953 467 740 1480 1718 2450 2927 334 977 1012 1629 2032 2953 242 831 1381 1733 2462 2554 251 501 1007 1527 2004 2751 403 808 1013 1623 2021 2965 211 513 1036 1604 2179 2830 279 840 1120 1885 2400 2634 201 813 1020 1637 2255 2811 236 715 1453 1695 2173 2837 275 779 1161 1742 2046 2621 196 786 994 1822 2013 2964

95,51633236 129,0079992 150,5077289 110,3286382 178,902006 148,765265

4.6 RED NEURONAL ARTIFICIAL

En la (figura 21) se observa los seis formantes que ingresan a la red neuronal, como capa de entrada con los cuales se realiza la comparación entre la señal a reconocer y las muestras que se encuentran en la base de datos, teniendo en cuenta que la red debe haber pasado por un proceso de entrenamiento en el cual se determina el numero de iteraciones, el numero de neuronas ocultas, una función de transferencia y el calculo del error mediante un ajuste de pesos que se realiza por medio del algoritmo de entrenamiento backpropagation.

Figura 21. Diagrama de bloques especifico para la RNA

El uso de redes multicapas necesita la determinación eficiente de los pesos w y los umbrales Φ. En el reconocimiento del habla las entradas de la red neuronal corresponden a los valores de las energías por bandas normalizadas de un segmento de sonido a clasificar y las salidas corresponden a otras muestras que son tomadas como patrones generales puesto que ya han sido analizadas y clasificadas. El término backpropagation se refiere al proceso por el cual pueden calcularse las derivadas de error de la red, con respecto a los pesos de la red y bases. Este proceso puede usarse con varias estrategias de optimización diferentes.

Page 88: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

87

Para cada patrón se entrenó una red neuronal con características similares (figura 22). Las entradas de la red neuronal fueron definidas en base a los datos los cuales contienen 40 muestras de diferentes locutores para cada patrón, por medio de la detección de formantes se puede obtienen 6 frecuencias las cuales hacen referencia a los puntos máximos de la señal.

Al realizar la transposición de los datos para cada patrón se define una topología para la red neuronal de la siguiente manera:

• Entrada: Compuesta por 6 neuronas de entrada correspondiente al resultado obtenido de la transposición de los datos anteriores.

• Capa Oculta: Compuesta por 36 neuronas

• Salida: Compuesta por 1 neurona de salida, la cual es diferente dependiendo del patrón elegido.

Figura 22. Topología de la RNA entrenada.

El proceso de entrenamiento de una red backpropagation involucra tres fases: la feedforward de los patrones de entrenamiento de entrada, el cálculo y la propagación inversa del error asociado, y el ajuste de los pesos. Después del entrenamiento, la aplicación de la red incluye solamente las computaciones de la fase feedforward. Aún si el entrenamiento es bajo, una red entrenada puede producir su salida muy rápidamente. Las redes backpropagation entrenadas de manera apropiada, se orientan a dar respuestas razonables cuando se les presentan entradas que aún no han sido consideradas. Típicamente, una

1

2

3

4

5

6

CAPA DE

SALIDA

1 2 N E U RONAS

Capas ocultas 1 5 N E U RONAS

C A P A S D E E N T R A D A

Page 89: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

88

nueva entrada conduce a una salida similar a la salida correcta para vectores de entrada que se han empleado en el entrenamiento. Para obtener los resultados deseados durante el entrenamiento fue necesario ajustar parámetros durante cada prueba, tales como el número de iteraciones el cual aumentó de acuerdo al requerimiento de la red hasta llegar a un total de 100 000 ciclos, la capa oculta la cual inició con 3 neuronas y aumentó a un valor de 36 hasta llegar ala tasa de aprendizaje propuesta y aceptada de n 05.0−e si al final de las iteraciones no se llega ala error deseado se incrementa el numero de iteraciones.

4.7 Interfaz Gráfica Usuario (GUI)

Con el objetivo de facilitar la interacción del usuario con el software, se creo una interfaz gráfica utilizando la herramienta GUI incorporada en MATLAB.

La interfaz creada para este proyecto, permite seleccionar el fonema o la palabra que se quiera tratar. Fueron implementadas tres ventanas en las cuales son importadas una serie de imágenes correspondientes al contenido de cada una de estas, y dentro de las cuales se encuentran pushbutton que permiten realizar el proceso de grabación y comparación de la señal, seguido de un pushbutton de reproducción que permite escuchar el fonema o palabra seleccionado para tener una guía en la pronunciación, así como conocer el número de aciertos para cada terapia correctiva.

En cada pushbutton se encuentran contenido las líneas de código implementadas para cada proceso anteriormente mencionado. A continuación se realiza una descripción para cada una de las ventanas contenidas en el software.

• Ventana 1: Correspondiente a la presentación del software permite dar acceso a la ventana siguiente mediante un pushbutton.

• Ventana 2: Aquí se realiza el entrenamiento para cada fonema mediante un pushbutton de grabación en el cual está contenido todas las líneas de código correspondientes a los procesos de adquisición de voz, filtrado, detección de bordes, formantes y la red neuronal la cual permite realizar la comparación y de esta forma mostrar si es correcta o incorrecta la señal adquirida además un pushbutton adicional de reproducción de una muestra pronunciada correctamente. De esta ventana se puede tener acceso a la siguiente ventana de entrenamiento de palabras en la cual el funcionamiento es similar al anterior.

Page 90: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

89

5. DESARROLLO INGENIERIL

Este proyecto es desarrollado por dos ramas de la ingeniería que buscan aportar a la ciencia un avance en la parte de la fonoaudiología, demostrando que todos los perfiles de formación pueden ser integrados en pro del mejoramiento de la calidad de vida de la sociedad.

El desarrollo del proyecto abarca temas relacionados con la Fonética acústica debido a que los fonemas listados presentan características fundamentales dependiendo de la articulación y la pronunciación, además de su clasificación como consonantes oclusivas sonoras / sordas que tienen que ser analizadas y tenidas en cuenta en el reconocimiento de voz. Puesto que las sonoras presentan regiones de frecuencia en su espectro y las sordas se caracterizan por la ausencia de estas regiones.

Inicialmente se realizó una investigación en los fonemas que tenían mayor dificultad de pronunciación y articulación en los niños de 5 a 7 años, y se concertó con las fonoaudiólogas, que el gammacismo y el kappacismo son unas de las dislalias específicas con mayor alteración y poco tratadas del lenguaje español Colombiano; Esto permitió tener en cuenta dentro de la investigación que tipo de herramientas son útiles para los especialistas y a la vez dirigidas a la población infantil. Para lograr un entrenamiento y corrección fonética adecuada un software presenta ventajas en su versatilidad, además de ser una herramienta innovadora, permite realizar una terapia correctiva en casa como también en el consultorio.

La base de datos está compuesta por los fonemas K y G y dos palabras que involucran en su pronunciación los fonemas anteriormente mencionados, como lo son gato y koala, estas fueron escogidas porque presentan mayor facilidad para ser recordadas y pronunciadas, para ello se muestran imágenes alusivas a los patrones escogidos, además una interfaz de usuario que permite tener accesibilidad a un menú, en el cual se encuentra los niveles de dificultad entre fonema y palabra para ser desarrollados por los niños.

Después de seleccionar los fonemas y las palabras se determinó la plataforma de de programación en la cual se iba a llevar a cabo la elaboración del software, en principio se analizó Visual Basic el cual permite hacer una programación dirigida a objetos, este no fue viable puesto que al llegar a la detección de formantes, se hizo necesario la aplicación de complejas funciones matemáticas y varios ciclos de programación, lo cual no es viable por el tiempo que conlleva para su desarrollo, y las respectivas pruebas de comprobación del código.

Como una segunda alternativa al analizar las herramientas y funciones disponibles de Matlab, dentro de los procesos necesarios en el reconocimiento de patrones, se encontró que esta plataforma de programación era accesible conllevaba menos tiempo de programación y muchas de las funciones

Page 91: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

90

matemáticas están definidas mediante item, los cuales permiten agilizar los procesos requeridos. Al socializarse más con el entorno y distinguir varias de las herramientas que brinda Matlab, se logró la manera de realizar una interfaz de usuario agradable teniendo en cuenta los criterio propuestos para esta y los recursos ofrecidos por el programa. En un ultimo paso Matlab permite realizar .exe (ejecutables) de la implementación realizada con lo cual se concluye el objetivo, de poder ejecutar el software implementado.

A continuación se describen los procesos e implicaciones tenidas en cuenta para la culminación del proyecto, estos procesos son implementados en la plataforma de programación Matlab.

Para la realizar del muestreo de la señal de habla, fue necesario tener en cuenta el teorema de Shannon el cual establece que a las muestras de una señal analógica le corresponde una representación, si la señal tiene la banda limitada y si la frecuencia de muestreo es al menos el doble de la frecuencia de Nyquist. La adquisición de voz de las muestras iniciales, que van hacer tenidas en cuenta por la red para realizar la comparación, fueron grabadas en formato .Wav, a una frecuencia de muestreo de 11025 Hz con un tamaño de muestra de 16 bits, y canal monofónico. Las muestras fueron realizadas en diversos colegios de acorde a los rangos de edades escogidas, para que se cumpliera la condición a la cual va aplicado el software. La grabación se realizó a 50 niños entre edades de 5 a 7 años entre sexo femenino y masculino. La muestras fueron tomadas en un recinto aislado del ruido externo teniendo en cuenta la pronunciación, la intensidad y la velocidad en los diferentes niños hablantes para conservar cierta igualdad en las muestras que van a ser tenidas en cuentas como patrones generales.

Figura 23. Señal de grabación del fonema G.

Realizada en el lenguaje de programación MATLAB

Page 92: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

91

Figura 24. Señal de grabación de la palabra gato

Realizada en el lenguaje de programación MATLAB

Figura 25 . Señal de grabación del fonema K. Realizada en MATLAB

Realizada en el lenguaje de programación MATLAB

Page 93: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

92

Figura 26. Señal de grabación del fonema Koala.

Realizada en el lenguaje de programación MATLAB

Como se puede observar en las figuras anteriores ninguna señal de voz es estacionaria en el tiempo, además el nivel de amplitud varía dependiendo el locutor y la velocidad con que pronuncie el patrón. Estas muestras fueron realizadas con un tiempo de 2 seg. Y al analizar las graficas se encuentra que ninguna señal de voz posee la misma ubicación en el tiempo.

• Selección de Filtros:

Se propone realizar un mejoramiento de la relación señal a ruido, mediante un preprocesamiento digital de la señal por medio de un banco de filtros que realce las bandas de frecuencia de interés. Se evaluaron filtros tipo Butterworth y Chebyshev de distintos órdenes, y se comparó su desempeño con diferentes ruidos de fondo. Las pruebas se hicieron con distintas señales de voz capturadas por la tarjeta de sonido.

Para la implementación de los filtros se tuvo en cuenta la distribución del espectro de frecuencias de los formantes las cuales se encuentran en un rango de 350Hz hasta 3500Hz. Considerando esto, fue posible realizar un filtrado de la señal que atenúe o elimine las componentes que no son de interés para el análisis. Se utilizo un filtro Chebychev y un filtro Buttherworth en un rango de 250 Hz y 4000Hz. Para de esta forma realizar la eliminación de ruido aleatorio.

El orden de los filtros describe el grado de aceptación o rechazo de frecuencias por arriba o por debajo, de las respectivas frecuencias de corte, para el filtro chebyshev se eligio de orden 6 con una atenuación de 36 dB, esto se relaciona con los polos y ceros, ya que los polos hacen que la pendiente suba con 20 dB y los ceros puede hacer que baje y de esta forma compensan su efecto. El orden del filtro Buterhworth se determino en 9 con una atenuación

Page 94: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

93

mayor en la frecuencia de corte de 250Hz. En las siguientes figuras se pueden observar las señales correspondientes a fonemas y palabras filtradas.

Figura 27 . Señal filtrada G

Realizada en el lenguaje de programación MATLAB

Figura 28 . Señal filtrada K

Realizada en el lenguaje de programación MATLAB

Figura 29 . Señal filtrada Gato

Realizada en el lenguaje de programación MATLAB

Page 95: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

94

Figura 30 . Señal filtrada Koala

Realizada en el lenguaje de programación MATLAB

• Detección de principio y final de palabra:

Es importante en el campo del reconocimiento de patrones debido a que es un problema fundamental localizar el habla en un entorno más o menos ruidoso, la solución a este problema consiste en buscar un detector de los bordes de la palabra, que consiga distinguir entre voz y silencio.

Se ha implementado el sistema de detección de bordes ajustando variables tales como la el numero de muestras, el cruce por cero, umbrales de energía, detección del principio y el final de la señal de voz. Ha sido aplicado sobre el total de fonemas y palabra que forman las base de datos de sonidos grabados correspondientes a los patrones, comprobando los resultados satisfactoriamente en todos los registros, es importante destacar que el conjunto de patrones de la base de datos existe gran variedad de articulaciones, sobretodo, los niveles bajos de energía entre los cuales se encuentran oclusivas débiles sordas y sonoras.

Figura 31. Señal de detección de inicio del fonema G.

0 0.5 1 1.5 2 2.5

x 104

-0.1

-0.05

0

0.05

0.1señal de sonido

tiempo

ampl

itud

Realizada en el lenguaje de programación MATLAB

Page 96: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

95

Figura 32. Señal de detección de final del fonema G.

0 0.5 1 1.5 2 2.5

x 104

-0.1

-0.05

0

0.05

0.1señal de sonido

tiempo

ampl

itud

Realizada en el lenguaje de programación MATLAB

Figura 33. Señal de detección de inicio del fonema k.

0 0.5 1 1.5 2 2.5

x 104

-0.2

-0.1

0

0.1

0.2señal de sonido

tiempo

ampl

itud

Figura 34. Señal de detección de final del fonema K.

0 0.5 1 1.5 2 2.5

x 104

-0.2

-0.1

0

0.1

0.2señal de sonido

tiempo

ampl

itud

Realizada en el lenguaje de programación MATLAB

Page 97: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

96

Figura 35. Señal de detección de inicio de la palabra Gato.

0 0.5 1 1.5 2 2.5

x 104

-0.1

-0.05

0

0.05

0.1señal de sonido

tiempo

ampl

itud

Figura 36. Señal de detección de final de la palabra Gato.

0 0.5 1 1.5 2 2.5

x 104

-0.1

-0.05

0

0.05

0.1señal de sonido

tiempo

ampl

itud

Figura 37. Señal de detección de inicio de la palabra koala.

0 0.5 1 1.5 2 2.5

x 104

-0.2

-0.1

0

0.1

0.2señal de sonido

tiempo

ampl

itud

Realizada en el lenguaje de programación MATLAB

Page 98: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

97

Figura 38. Señal de detección de final de la palabra Koala.

0 0.5 1 1.5 2 2.5

x 104

-0.2

-0.1

0

0.1

0.2señal de sonido

tiempo

ampl

itud

Realizada en el lenguaje de programación MATLAB

5.1 DETECCIÓN DE PICOS MÁXIMOS DE LA SEÑAL: Para conseguir unos buenos resultados a la hora de realizar un seguimiento de formantes, es imprescindible disponer de una técnica de detección de formantes fiable. Existen diversas formas, entre las cuales se encuentra LPC, el cual presenta un problema ya que la voz puede presentar múltiples excitaciones de comportamiento no lineal (efectos aerodinámicos, vibraciones no lineales de las paredes del tracto, etc.), las cuales no podrían ser modeladas por el filtro LPC. Otro problema que presenta esta técnica es que el método de mínimos cuadrados que permite determinar los coeficientes óptimos del filtro provoca que el filtro resultante estime bien los picos, pero no los valles. Existen otras técnicas para realizar el seguimiento de formantes. Desde la más elemental, que sería determinar los formantes según la proximidad de frecuencia hasta métodos basados en waveletbased, HMM (modelos ocultos de Markov), vector quantization, técnicas que son utilizadas para llevar a cabo el seguimiento de picos espectrales. Este tipo de metodos son muy complejos para su procesamiento lo cual implica mas costo computacional.

Debido a este problema se opto por usar la detección de picos máximos de la señal la cual permite obtener los puntos más sobresalientes de una muestra, en el caso de reconocimiento de patrones fue importante analizar 6 puntos máximos, para obtener una respuesta más exacta, teniendo en cuenta las frecuencias útiles de 250Hz a 4KHz se dividen en 6 intervalos de la misma longitud. Para cada una de las bandas se obtiene la amplitud máxima en ese intervalo con su respectiva localización en frecuencia.

Al aplicar el algoritmo implementado para lograr obtener los picos máximos de las señales analizadas se encuentra que los valores están oscilantes en un rango de:

Page 99: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

98

• Para la G: Para este fonema fueron analizadas 45 muestras y los resultados obtenidos se muestran a continuación.

Tabla 7. Rango del intervalo de picos máximos para el fonema G.

Número de Bandas

F1 F2 F3 F4 F5 F6

Localización en frecuencia

237 – 494

495 – 737

994 – 1475

1546 – 1980

1981 – 2476

2484 - 2963

• Para la K: Para este fonema fueron analizadas 36 muestras y los resultados obtenidos se muestran a continuación.

Tabla 8. Rango del intervalo de picos máximos para el fonema K.

Número de Bandas

F1 F2 F3 F4 F5 F6

Localización en Frecuencias

173 – 493

535 – 990

991 – 1368

1486 – 1857

1981 – 2476

2487 - 2954

• Para Gato: Para este fonema fueron analizadas 37 y los resultados obtenidos se muestran a continuación.

Tabla 9. Rango del intervalo de picos máximos para el fonema GATO.

Número de Bandas

F1 F2 F3 F4 F5 F6

Localización en Frecuencia

173 – 487

496 – 983

991 – 1462

1486 – 1959

1998 – 2460

2492 - 2971

• Para Koala: Para este fonema fueron analizadas 35 y los resultados

Page 100: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

99

obtenidos se muestran a continuación.

Tabla 10. Rango del intervalo de picos máximos para el fonema KOALA.

Número de Bandas

F1 F2 F3 F4 F5 F6

Localización en frecuencia

196 – 484

501 – 997

992 – 1480

1487 – 1864

1997 – 2472

2519 - 2965

5.2 RED NEURONAL ARTIFICIAL

Para la comparación de patrones se eligió las redes neuronales por su:

• Entrenamiento : se puede determinar si el sistema necesita un entrenamiento previo antes de empezar a usarse.

• Dependencia del hablante : determina si el sistema debe entrenarse para cada usuario o es independiente del hablante.

• Continuidad : determina si el sistema puede reconocer habla contínua o el usuario debe hacer pausas entre palabra y palabra.

• Robustez : determina si el sistema está diseñado para usarse con señales poco ruidosas o, por el contrario, puede funcionar aceptablemente en condiciones ruidosas, ya sea ruido de fondo, ruido procedente del canal o la presencia de voces de otras personas.

La red neuronal multicapa fuertemente conectada, con topología feedforward es el resultado de varias pruebas y no es la única que existe para resolver el problema de reconocimiento de patrones. La red fue entrenada mediante el algoritmo Backprogation con el fin de realizar la comparación de muestras y obtener una salida deseada. . La salida de la red neuronal hace referencia al valor promedio de las frecuencias formantes, a las cuales se les calcula el punto de incertidumbre, que indica que tanto puede la señal crecer o decrecer del rango hallado, para estimar la similitud entre las muestras Para definir la tasa de aprendizaje se estimó un error mínimo de n 05.0−e para las cuatro redes neuronales ya que un error de esa magnitud se considera por debajo de cero, lo que indica que es totalmente valido. Al iniciar el entrenamiento para cada red con 50 muestras correspondientes a la base de datos se observaba que el error estaba por encima del estimado, lo que impedía el reconocimiento de los patrones. Para definir el error aceptable fue necesario observar los diferentes valores obtenidos al introducir nuevas muestras de comparación entre las que se incluían muestras pronunciadas correctamente y otras que no correspondían a una pronunciación correcta, se estimó un rango de valores aceptable entre los

Page 101: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

100

cuales se puede considerar la palabra como correcta o aceptable, este error obtenido durante todo el proceso, es considerado correcto a la hora de realizar la comparación entre las dos muestras El rango de error tolerable para cada fonema y palabra es mencionado a continuación: RANGO DE ERRORES CONSIDERADOS COMO ACEPTABLES PARA LOS

FONEMAS Y PALABRAS

Para K 0.653 05.0−e hasta 0.523 05.0−e

Para Koala 0.478 05.0−e hasta 0.341 05.0−e

Para G 0.921 05.0−e hasta 0.798 05.0−e

Para Gato 0.208 05.0−e hasta 0.114 05.0−e Estos valores son definidos, en el proceso de entrenamiento, a medida que se van introduciendo nuevas muestras de comparación correctas e incorrectas se observa la fluctuación de valores y se establece un punto máximo y mínimo en el cual el patrón es correcto; si las muestras no son reconocidas pasan a formar parte de la salida de la red hasta que esta produzca una salida correcta con una nueva muestra, en el rango tolerable. Figura 38. Diseño de la RNA entrenada con el algoritmo Backpropagation.

En la figura 38. se observa la topología de la red neuronal la cual se compone de una capa de entrada con seis neuronas que corresponden a los seis formantes del fonema o palabra seleccionado, dos capas ocultas; la primera esta compuesta por 12 neuronas y 15 en la segunda capa oculta, debido a que como mínimo se sugiere utilizar el doble de las neuronas de entrada, se estableció esta arquitectura y el numero de neuronas puesto que el resultado que se obtuvo a la salida fue satisfactorio.

5.2.1 Entrenamiento: El algoritmo seleccionado Backprogation permite ajustar los pesos de la red con el fin de que las entradas introducidas produzcan las salidas deseadas. Para iniciar el entrenamiento es necesario inicializar los pesos con valores pequeños para asegura que la red no se sature con grandes pesos y que comience en un punto aleatorio de la superficie del error.

Page 102: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

101

El entrenamiento de la red neuronal con 6 neuronas en la capa de entrada, 36 neuronas en la capa oculta y 1 neurona en la capa de salida requiere como mínimo de 10.000 iteraciones durante aproximadamente 20 horas por cada red.

Las funciones de transferencia pueden ser una función lineal o no lineal de n, y es escogida dependiendo de las especificaciones del problema que la neurona tenga que resolver, en este caso se utilizo la función tangencial, sigmoidal y logaritmica. Ver (Anexo H)

El objetivo del entrenamiento es ajustar los pesos de la red con el fin de que las entradas introducidas produzcan las salidas deseadas. Al lograr obtener el valor de aprendizaje deseado se detiene el proceso de entrenamiento para evitar el sobreaprendizaje de la red. Esto conlleva a realizar varias pruebas con diferentes locutores y establecer si el valor del error definido es correcto. Si el valor de error corresponde al estimado se da por finalizado el entrenamiento y aprendizaje de la red.

5.3 INTERFAZ GRAFICA DE USUARIO

La interfaz fue realizada en el lenguaje de programación, Matlab, antes de esto se realizó una selección de colores imágenes y prediseños que permitieron establecer cuales son los mejores y mas didácticos para los niños a los cuales se enfoca el software.

Matlab cuenta con herramientas GUI para el desarrollo de entornos gráficos para usuarios las cuales fueron aprovechadas y de esta manera realizar un software de la siguiente manera:

Presentación del proyecto en esta ventana se encuentra el nombre de la universidad, el nombre del proyecto y de las creadoras así como las imágenes seleccionadas y un comando que dirige al la segunda ventana.

Figura 39 . Ventana Inicio de GUI del software.

Page 103: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

102

• Al oprimir el botón de siguiente permite pasar a la siguiente ventana la cual corresponde a los fonemas G y K.

Ventana de entrenamiento para los fonemas K y G: En esta ventana se encuentran las imágenes de los fonemas K y G el comando que permite la grabación del fonema a entrenar y unas casillas en las cuales se indica en número de aciertos o desaciertos obtenidos durante la sección,. Y el comando que permite continuar a la tercera ventana.

Figura 40. Ventana de entrenamiento de los fonemas G y K..

• Cuando se oprime el botón de Gato o Koala el software se reproduce la palabra que se desea pronunciar.

• Cuando se oprime el Botón de grabar, el software realizara todo el proceso de:

1. Captura de la voz, la cual se puede visualizar por medio de esta ventana

Page 104: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

103

2. Filtrado de la Señal.

3. Detección de bordes.

4. Detección de picos Máximos.

5. Comparación de patrones por medio de la red neuronal.

• En las casillas de Bien y Mal se obtiene el resultado de la comparación de patrones, las cuales corresponden a un contador que va sumando el numero de aciertos y de errores del paciente.

Ventana de entrenamiento para palabras: En esta ventana se realiza el entrenamiento para las palabras gato y koala, se puede observar las imágenes correspondientes a los fonemas comandos para grabar, contador de aciertos y desaciertos y un comando que permite regresar a la ventana de entrenamientos de fonemas.

Figura 41. Ventana de entrenamiento para las palabras gato y koala.

Page 105: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

104

• Cuando se oprime el botón de Gato o Koala el software se reproduce la palabra que se desea pronunciar.

• Cuando se oprime el Botón de grabar, el software realizara todo el proceso de:

1. Captura de la voz, la cual se visualiza por la ventana que muetra cuando se esta realizando este proceso.

2. Filtrado de la Señal.

3. Detección de bordes.

4. Detección de picos Máximos.

5. Comparación de patrones por medio de la red neuronal.

• En las casillas de Bien y Mal se obtiene el resultado de la comparación de patrones, las cuales corresponden a un contador que va sumando el numero de aciertos y de errores del paciente.

• Cuando el software no captura ningún sonido de la traza de voz saldrá un aviso de error, el cual se produce ya que la detección de principio y final de palabra no detecto ninguna energía que se pueda considerar como voz

Page 106: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

105

.EXE en MATLAB Matlab posee un compilador que convierte los GUI y los M-file en archivos .exe que pueden ejecutarse sin necesidad de abrir MATLAB. Para crear un archivo .exe en MATLAB, se ejecuta en la ventana de comandos el código que se encuentra en (Anexo I). Matlab permite realizar ejecutables con otros compiladores como por ejemplo c++ builder o visual, se escogió el de Matlab por su fácil manejo y su rápida compilación.

5.4 ESTUDIO DE IMPACTO DEL SOFTWARE SOBRE LA POBLAC IÓN.

Los niños que hicieron parte en el diseño del software de corrección fonetica, se dividieron en dos grupos, el primer grupo se compone de los niños que no presentan ninguna dificultad en su pronunciación los cuales hicieron parte del entrenamiento de la RNA, el segundo grupo se compone de 50 niños que asisten a terapias de lenguaje en el ICAL y los cuales hicieron parte del entrenamiento de la red en donde se puede estimar el porcentaje de error cuando es mal pronunciado el fonema y la palabra. Sin especificar el sexo en la investigación se demostró que:

• El color y las imágenes escogidas estimulan al niño a interactuar con el software.

• El uso del Micrófono produce una sensación de emoción porque pueden observar su señal de voz.

• Cuando escuchan la muestra pregrabada estimula al paciente para que imite la pronunciación correcta.

Teniendo en cuenta los seis elementos fundamentales de la didáctica como referencia en el desarrollo del software de corrección fonética se determinaron de la siguiente forma:

Page 107: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

106

• El alumno: en este elemento se determino la población a la cual va dirigida el proyecto.

• Los objetivos: el software tiene como objetivo corregir la pronunciación

de los fonemas G y K en los niños con dificultad en el lenguaje.

• El profesor: Con la ayuda del fonoaudiólogo el niño tendrá una terapia correctiva y divertida.

• La materia: En este punto el fonoaudiologo realiza una terapia con las

diferentes herramientas entre las cuales se incluye el software en el cual se puede escuchar los fonema G y K o las palabras alusivas a estos, cuando se realiza la grabación, la herramienta arroja un resultado donde se puede determinar si se pronunció bien o mal.

• Las técnicas de enseñanza: Una de las técnicas utilizadas en las

terapias es la audición del fonema y posteriormente la repetición del mismo, por lo tanto se determino utilizar esta técnica para implementarla en el software.

• El medio geográfico, económico, cultural y social: Teniendo en cuenta

la población a la cual va dirigida el proyecto se desarrollo un software debido a que puede ser utilizado con el fonoaudiologo o sencillamente desde casa utilizando un entorno amigable para cualquier sexo.

Page 108: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

107

RECOMENDACIONES

• Para un mejor desempeño al utilizar el software se recomienda un computador con una memoria RAM igual o superior a 256 MB, un procesador Pentium (sugerido) con una velocidad igual o mayor a 2.0 GHz. Tarjeta de sonido C-Media Audio Device o superior. Micrófono multimedia, omnidireccional, Sistema operativo Windows XP

• Colocar el micrófono frente al hablante y conservar una distancia prudente mientras se emite el fonema o la palabra. (aproximadamente entre 5 a 10 cm).

• No inhalar ni exhalar al pronunciar el fonema o la palabra para evitar el ruido de la respiración durante la grabación de la palabra.

• Mantener una intensidad constante para cada fonema o palabra durante la grabación de las muestras.

• La grabación es realizada durante dos segundos si no se realizó durante este tiempo es necesario volver a capturar la muestra.

• Se recomienda iniciar por la pronunciación de los fonemas para continuar con las palabras.

• Se recomienda iniciar la terapia de corrección en compañía de un adulto o profesional que guíe las primeras secciones e indique el uso correcto del software y el objetivo de este, en el caso de ser manipulado por el niño.

• Como resultado de este desarrollo se sugiere que el software sea utilizado como una herramienta de aprendizaje de los fonemas G y K puesto que despertó el interés en los niños.

PARA IMPLEMENTACIÓN DE UN SOFTWARE SIMILAR

� Realizar la mayor cantidad de muestras posibles a diferentes niños según las edades requeridas y según la población delimitada, para poder establecer un rango determinado con mayor .

� Realizar las muestras y las pruebas con los mismos dispositivos de grabación

� Realizar un filtrado previo de la señal ingresada para eliminar frecuencias no deseadas.

� Realizar detección de principio y fin de la señal para evitar tomar datos innecesarios de ruido u otros componentes no pertenecientes a la señal

Page 109: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

108

de voz.

� Determinar un método de extracción de características similares el cual permita establecer semejanzas entre el patrón a analizar.

� Ingresar nuevas señales para la comparación y si no son acertadas introducirlas a la base de datos de la red neuronal para realizar el entrenamiento nuevamente.

� Para el diseño del entorno visual en la interfaz gráfica de usuario utilizar los conceptos previos de didáctica para lograr una estrategia de enseñanza teniendo en cuenta los gustos de la población infantil y las herramientas ofrecidas para el diseño.

� Establecer un diseño apropiado para la interfaz grafica la cual involucre los colores y las figuras apropiadas, así como un fácil manejo de las herramientas ofrecidas, para que los niños sientan a gusto con el entorno desarrollado y despierten el interés por aprender con el software.

Page 110: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

109

CONCLUSIONES

• Según la investigación realizada para conocer que fonemas presentan mayor dificultad en el español Colombiano se encontró que la R, S, K y G son los más comunes entre los niños pero no todos han sido tenidos en cuenta en la creación de herramientas para realizar una terapia correctiva.

• La muestras se realizan por encima del doble de la frecuencia a muestrear (según el teorema de Nyquist) con un valor de 11025 a 16 bits puesto que se encontró que las muestras realizadas con una frecuencia de muestreo inferior presentan una baja calidad en la señal resultante debido a que entre más muestras se tengan, será posible reconstruir mejor la señal; una mayor frecuencia de muestreo requiere una mayor resolución (número de bits).

• Debido a que los formantes que determinan de las características de la señal de voz se encuentran en un rango de frecuencia aproximado de 350 a 3500 Hz. Se estableció filtrar la señal en un rango de 250 a 4000Hz y de esta manera obtener una señal limpia de ruidos aleatorios .

• La detección de bordes se realizó a la señal adquirida con el fin de eliminar silencios o ruidos que no hacen parte de la señal de voz, teniendo en cuenta que si se procesa toda la muestra adquirida se pueden tomar valores innecesarios que no hacen parte de las frecuencias formantes y en muchos de los casos corresponden a ruido, recargando innecesariamente los procesos posteriores.

• Para el reconocimiento de la señal por medio de la detección de formantes es necesario tomar al menos 6 puntos máximos de la señal, puesto que tomar menos muestras por señal son insuficientes para realizar una comparación, debido a que existe una gran variedad de valores de los formantes para un mismo sonido es decir las frecuencias formantes no son unas cantidades exactas para un mismo fonema sino que producen una gran variedad de valores para el mismo fonema con diferentes locutores.

• Se determinó una sola neurona de salida, debido a que se utilizó una red para cada patrón elegido, puesto que después de propagar 40 muestras grabadas por los locutores, la red entrenada con todos los patrones llegó a un porcentaje de reconocimiento del 20%.

Page 111: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

110

• Cuando el entrenamiento de la Red Neuronal llega cerca del error deseado, se realiza una prueba con una entrada diferente a las de la base de datos, provenientes de al menos dos hablantes para cada una de la red, si se obtiene mas del 95% de aciertos en la que debe identificar y menos del 5 % de los que no debe identificar se detiene el entrenamiento, sino, se añaden las muestras que no identificó al archivo y se continua con el entrenamiento.

• Para lograr un resultado óptimo en el aprendizaje de una red neuronal es necesario un entrenamiento constante el cual requiere de suficiente tiempo debido a que en cada iteración la red puede tardar en arrojar el resultado y en muchos de los casos este no es satisfactorio llevando consigo una iteración más. Además de esto requiere un costo computacional lo cual implica más procesos en memoria.

• El diseño obtenido fue apropiado en cuanto al uso de los colores e imágenes, puesto que al realizar las pruebas de corrección se observó el interés que los niños mostraron por querer manipular el software.

Page 112: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

111

BIBLIOGRAFÍA

CÓDIGO COLOMBIANO DE ÉTICA PARA FONOAUDIOLOGÍA. Bogotá: Alfaomega, 1997. pág. 320 BASIL, Carmen. Signos de sistemas y ayudas técnicas para la comunicación aumentativa y alternativa: Principios teóricos y aplicaciones. Madrid: Masson, 2004. 198p.

ARANDINGA VALLES, Antonio. PAF: evaluación de dislalias. Prueba de articulación de fonemas. Madrid: Gruer, 2002. 205p. GARCÍA PASCUAL, Pilar. La dislalia. Naturaleza, diagnóstico y rehabilitación. Madrid: Cepe, 2003. 197 p. DEUTSCH, Deborah S. Bases Psicopedagógicas de la Educación Especial. Nashville, Tennessee: Pearson Prentice Hall, 2003. p.137 DELLER, John R. Procesamiento Digital de señales. New Jersey: Macmillan Publishing, 1993. 223p FAUNDEZ, Marcos. Tratamiento digital de voz e imagen. Mexico: Alfaomega, 2001. 288p HILERA, José R. Redes Neuronales Artificiales. Madrid: AlfaomegaSeries Paradigma, 1998. 390p FAUSETT, Laurene. Fundamentals of neuronal networks: Architectures, Algorithms, and applications. ED. Prentice Hall, 1994. RABINER, Lawrence. Tutorial y aplicaciones de modelos de Marcov. Procceding IEEE. Vol 2. 1989. 289 p.

BEN Gold, Morgan Nelson. Speech Audio Signal Proccessing. IEEE. Vol 2, 1986. 1289 p.

RAMACHANDRAN Raul, Richard J. Mammone. Modern methods of speech processing: USA: Luwer Academic publisher, 1995. 492 p.

SANTOS GARCÏA, Gustavo. Inteligencia artificial y matemática aplicada: Reconocimiento automático del habla: Universidad de Valladolid. Secretariado de Publicaciones e Intercambio Editorial, 2000. 219 p. The MATHWORKS Inc. Manual de Matlab. REFERENCIAS DE LA WEB

Page 113: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

112

ACOSTA, Maria. Universidad Tecnológica de Pereira. Tutorial de Redes Neuronales Artificiales: Tomado de la World Wide Web. El 11 de septiembre de 2006, www.ohm.utp.edu.co. Answer math, Tomado de la World Wide Web. El 4 de septiembre de 2006. www.answermath.com. Physionet cps, unizar. Tomado de la World Wide Web. El 11 de diciembre de 2006. www.physionet.com

Gc ssr. Tomado de la World Wide Web. El 20 de enero de 2007. www.gc.ssr.upm.es/inves/neural/ann2/anntutorial.htm.

Wikipedia org. Tomado de la World Wide Web. El 1 de Marzo de 2007. es.wikipedia.org/wiki/Categoría:Redes_neuronales

Rena.edu Tomado de la World Wide web el 18 Junio de 2007 de www.rena.edu.ve/SegundaEtapa/tecnologia/software.htm

UNICEF Tomado de la World Wide web el 18 Junio de 2007 http://www.unicef.cl/archivos_documento/47/debate8.pdf.

Page 114: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

113

ANEXO A

ENCUESTA Tema: Desarrollo de herramienta para el entrenamiento y corrección fonética. Objetivo : Definir los fonemas que presentan mayor dificultad de pronunciación en los niños de 5 a 7 años de edad

1. ¿Que es una dislalia especifica?_______________________________ ____________________________________________________________ 2. ¿Qué juicios son importantes a la hora de diagnosticar una dislalia

específica en un niño?________________________________________ _____________________________________________________________

3. ¿Entre los tipos de dislalias más comunes en los niños, se encuentran

incluidas los fonemas k y g?___________________________________ ____________________________________________________________ 4. ¿Por qué se puede presentar estos tipos de dislalias (gammacismo y

kappacismo) y como se detectan? ______________________________ _____________________________________________________________ 5. ¿De cada 20 niños en consulta en cuantos se puede diagnosticar

dislalias específicas, en el fonema G y K conocidas como (Kappacismo y Gammacismo)? ________________________________________________________________________________________________

6. ¿Cuales son los fonemas que se presenta mayor dificultad de

pronunciación en los niños? _____________________________________

____________________________________________________________ 7. ¿Considera usted, que las palabras gato y koala son importantes para

trabajar en los niños cuando se presenta gammacismo y kapacismo por que?______________________________________________________

_____________________________________________________________ 8. ¿A partir de que edad se obtiene la pronunciación y el movimiento

articulatorio correcto de los fonemas y de las palabras en los niños? _____________________________________________________________ 9. ¿Que características son importantes para diferenciar la voz de un niño

a la de una niña, y a partir de que edad quedan establecidas? _____________________________________________________________

Page 115: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

114

10. ¿Con que tipo de herramientas se cuenta actualmente para las terapias

de lenguaje?________________________________________________ 11. ¿Cree usted que un software destinado a la corrección fonética sería de

gran ayuda para la terapia realizada en el consultorio como en casa?_____________________________________________________

12. ¿Cree usted necesario en el caso de que sea implementado un software

que este incluya imágenes alusivas a los fonemas y palabras tratados? _____________________________________________________________

Page 116: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

115

ANEXO B

LÍNEAS DE CÓDIGO: ADQUISICIÓN DE SEÑAL Mediante estas líneas de código se puede leer el puerto de la tarjeta de sonido y de esta forma capturar la señal de audio. AI = analoginput('winsound', 0); % añadir canales al objeto addchannel(AI,1); % configurar los valores de la adquisición, configuración de la gráfica y almacenamiento de los datos fs=11025; %frecuencia de muestreo ActualRate = get(AI,'SampleRate');%11025 set(AI,'SamplesPerTrigger',duration*ActualRate); muestras_totales=duration*ActualRate; figure(1) set(gcf,'doublebuffer','on') %Reduce el parpadeo en la gráfica muestras=1000;

Page 117: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

116

ANEXO C

LÍNEAS DE CÓDIGO: FILTRADO DE LA SEÑAL

Esta es la declaración de filtros que eliminan la interferencia de la red eléctrica [b,a] = cheby1(9, 4000/(ActualRate/2)); %filtro pasabajo [e,f] = butter(6,250/(ActualRate/2),'high'); %filtro pasaalto fcorte=250Hz Mediante este código se obtiene un filtro pasabanda, con ancho de banda de 250Hz a 4000Hz.

ANEXO D

Page 118: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

117

LÍNEAS DE CÓDIGO: DETECCIÓN DE BORDES

En estas líneas de código se observa como se puede determinar el principio y el final de la palabra, eliminando los silencios o el ruido que se encuentra en el inicio o en el final de la señal de voz.

%/////////////////////////////////////////////////// % DETERMINACION DEL INICIO DE PALABRA %////////////////////////////////////////////////// % E: vector para la energia de los intervalos % z= vector para pasos por cero de los intervalos % V = 5; %V debe ser el numero de vesce que ha de superar / = a la señal % nifs = 19; % numero de intervalos solapados de silencio % npi=220; % El nulero de puntos por intervalos debe ser par % niis=19; % El numero de intervalos solapados iniciales de silencio % DZCSF = desviación tipica de los pasos por cero en intervalo final de silencio % EMAXF = valor maximo de la energia en toda la señalanalizada % UESUPF = Umbral de energia superior % UEINFF= Umbral de energia inferior % UZF = Umbral de cruces por cero clc close all file='datos_filtrados'; %[datos_filtrados,Freq, NBits] = wavread(file); %[m,n]= size(datos_filtrados); %plot (datos_filtrados); %M es el numero de intervalo donde se localizara el principio npi=220; % El nulero de puntos por intervalos debe ser par niis=19; % El numero de intervalos solapados iniciales de silencio %Calculamosla energia y los pasos por cero de cada intervalo E=zeros(1,ni); % vector para energia de los intervalos z=zeros(1,ni); % vector para pasos por cero de los intervalos for i=1:ni; interv=datos_filtrados(L1:L2); E(i)=sum(abs(interv)); % calcula los ceros if interv(length(interv))<0,x=[x-1];else,x=[x1];end z(i)= sum(interv2<=0); %fin del calculo de los ceros end; %calculamos valores relativos al intervalo inicial de silencio

Page 119: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

118

silencio = z (1:niis);

Page 120: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

119

ZCMS = mean (silencio);%valor medio de los pasos por cero en el intervalo inicial de silencio inicial DZCS = std(silencio); % desviacion tipica de los pasos por dero en el intervalo inicial de silencio inicial EMS = mean (E(1:niis)); %valor medio de la energia n el intervalo inicial de silencio inicial EMAX = max (E);%valor maximo de la energia en todo la señal analizada clear silencio %calculamos los tres umbrales : UZC, UEINF, UESUP UZC = ZCMS + 2 * DZCS; UEINF = min (P1,P2); %UESUP = min (UEINF*100,P3); UESUP = P3; if UESUP<UEINF, error ('el algoritmo ha fallado: UESUO < UEINF');end %busqueda del prioncipio de la palabra %1) buscamos 3l primer intervalo que supera o iguala a UESUP M =1; UESUP while E (M)<UESUP,M=M+1 ; end %2)retrocediendo, buscamosa el primer intervalo que no supere o que iguale %a UEINF if M==1,error('EUSUP se supera muy pronto');end M = M-1; while E (M)>UEINF, M=M-1; end %/////////////////////////////////////////////////// % DETERMINACION DEL FINAL DE PALABRA %////////////////////////////////////////////////// nifs = 19; % numero de intervalos solapados de silencio % calculamos valores relativos al intervalo final de silencio silencio = z(ni - nifs + 1:ni); ZCMSF = mean (silencio); % valor medio de los pasos por cero en el intervalo final de silencio % inicial DZCSF = std (silencio);%desviación tipica de los pasos por cero en intervalo final de silencio clear silencio % calculamos los parametro intermedios P1 P2 P3 UZCF = ZCMSF + 2* DZCSF; UEINFF = min (P1F,P2F); UESUPF = min (UEINFF * 100,P3F); UESUPF = P3F; if UESUPF<UEINFF,error('el algoritmo ha fallado: uesupf<ueinff');end MF=ni; while E(MF)<UESUPF,MF=MF-1;end; AF=MF; if MF == ni,

Page 121: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

120

error ('EUSUPF se supera muy pronto'); end MF = MF+1; %3 en caso de fonemas fricativos y de fonemas fricativos, el final aun %puede encontrarse despues aprovechnado su gran numero de pasos por cero %buscamos el final hacia adelante mientras se va superando el umbral de %pasos por cero V = 10 veces en niz = 25 intervalos while 1 n = min (ni,MF+niz); M1 = 0; % contador del numero de veces que se supera el umbral UZEF for j = MF : n if z(j) >= UZCF % si este intervalo supera UZCF M1 = M1+1; MF = j; % además el final lo movemos interinamete %MFinterm = j; % además el final lo movemos interinamete end end % del lazo for end % 4 encontrado ya el intervalo final guerdamos los datos save datosf.mat E z UESUPF UEINFF UZCF ZCMS DZCSF EMS EMAXF ni niz V

Page 122: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

121

ANEXO E

LÍNEAS DE CÓDIGO: DETECCIÓN DE FORMANTES

El código de detección de formantes permite calcular los picos máximos de la señal muestreada por medio del método de puntos máximos por bandas.

frm=11025; frn=ceil(frm/2); pot2=4096; dhz=frn/pot2;%corrector de cambios de ejes fhz=(0:pot2)*dhz;%eje de abcizas que indica la frecuencias en hertz a=fft(nlet,pot2*2);%calculo de fft que da valores complejos vfft=STP*conj(a);%modulo de transformada de fourier vfft(pot2+2:pot2*2)=[];vfft(2:pot2)=2*vfft(2:pot2);%simetria de fft clear a;%elimina las variables de calculo %se considera una franja inicial de la transformada de fourier %correspondiente a los valores entre dos valores de frecuencia (de 0 a %4Khz); pues en estos esta la informacion relevante fr1=0;%valor minimo de la banda de frecuancia 0Hz fr2=4000;%valor maximo de la banda de frdcuencia pfr1=ceil(fr1*pot2/frn)+1;%punto del minimo de la banda de frecuecia pfr2=ceil(fr2*pot2/frn);%punto maximo de la banda de frecuencia fhz=fhz(pfr1:pfr2); vfft=vfft(pfr1:pfr2);%cambio del eje y fft a la banda correspondiente %Calula los picos màs significativos por bandas(numeros de bandas %=ban)considra un ancho d ebanda que almcena en ban. el numero de bandas en %el ancho d efrecuencia considerado (fr1-fr2), ha de ser menor o igual a 18 ban=6;%numero bandas(5) anb=nptos*dhz/ban;%ancho de banda

Page 123: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

122

for k=1:ban, am=round(nptos*(k-1)/ban)+1; bm=round(nptos*k/ban); [i j]=max(vfft(am:bm)); vb(1,k)=i;%cordenada del maximo.%amplitus o energia vb(4,k)= (sum(vfft(am:bm))-(vfft(am)+vfft(bm))/2)*dhz; %energia en banda end clear i j k; %eliminacion de variables de calculo %calculA la media de los valores en abcisas armpt=0; b=0; while b<ensum/2, armpt=armpt +1;b=b+vfft(armpt); end armhz =armpt*dhz;%frecuencia con eje en Hz clear b;%eliminacion de variables de calculo

ANEXO F

LINEAS DE CÓDIGO: RED NEURONAL

function [W1,W2,RMS,LR]=bprop(x,t,W1,W2,RMS_Goal,lr,maxcycles) %Treinamento BackPropagation 2 Camadas (Tanh/Logistic) Rede Neural % [W1,W2,RMS,LR]=bprop_jose(x,t,W1,W2,RMS_Goal,lr,maxcycles) % Esta função treina 2 camadas de multicamadas, utilizando o algoritmo de % backpropagation. % % x : Matriz de Entrada. % t : Matriz de Saida. % W1 : Matriz da canada intermediaria. % W2 : Matriz da canada Saida. % RMS_Goal : Root Mean Squared Error goal. % lr : Learning rate. % maxcycles : Numero Maximo de iterações do treinamento. [inputs,patterns1]=size(x); [outputs,patterns]=size(t); [hidden,inputs1]=size(W1); [outputs1,hidden1]=size(W2); if outputs1 ~= outputs error('Weight dimension of W1 does not match the target vector.') end if inputs1 ~= inputs+1

Page 124: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

123

error('Weight dimension of W2 does not match the input vector.') end if hidden1 ~= hidden+1 error('Weight dimension of W1 and W2 does not coincide.') end terms=outputs*patterns; RMS=zeros(1,maxcycles); X=[ones(1,patterns); x]; % Augment inputs with bias dummy node. for i=1:maxcycles h=tanh(W1*X); H=[ones(1,patterns);h]; % Hiden layer output output = tanh(W2*H); % Output Vector e = t-output; % Output Error RMS(i) = sqrt(sum(sum(e.^2))/terms); % Root mean squared error. if RMS(i)<RMS_Goal; break;end if RMS(i)<=RMS(max((i-1),1)) lr=lr*1.1; % Adaptive learning rate. else lr=lr*.1; end LR(i) = lr; delta2= output.*(1-output).*e; del_W2= 2*lr* delta2*H'; delta1 = (1-h.^2).*(W2(:,2:hidden+1)'*delta2); del_W1 = 2*lr*delta1*X'; W1 = W1+del_W1; % Hidden layer weight update. W2 = W2+del_W2; % Output layer weight update % if rem(i,50)==0, fprintf('Epoch = %i, lr = %f, RMS Error = %f\n',i,LR(i),RMS(i)),end end RMS=nonzeros(RMS); LR=nonzeros(LR);

Page 125: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

124

ANEXO G

LÍNEAS DE CÓDIGO: RED NEURONAL ENTRENAMIENTO BACKPROPAGATION

%---------------------------------------------------------------------- % ALGORITMO DE ENTRENAMIENTO BACKPROPAGATION clc; clear; close all; fprintf('Tolerancia de error de salida = 0.001.\n'); RMS_Goal = 0.0001; fprintf('O valor inicial do learning es = 0.001.\n'); lr = 0.001; %---------------------------------------------------------------------- % lectura de los datos almacenados en el archivo %--------------------------------------------------------------------- eval(['load ',arquivo])

Page 126: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

125

%---------------------------------------------------------------------- % transpuesta de los archivos de entrada %---------------------------------------------------------------------- xn = xn'; tn = tn'; %---------------------------------------------------------------------- % separándolos datos para el entrenamiento %---------------------------------------------------------------------- [x,t,xr,tr] = getNumber(xn,tn,2); %---------------------------------------------------------------------- [inputs,patterns1]=size(x); [outputs,patterns]=size(t); %---------------------------------------------------------------------- % Inicializacion de los pesos por capas %---------------------------------------------------------------------- W1=0.5*randn(camada,inputs+1); % Inicializando la matriz de pesos de la capa de oculta. W1=0.5*randn(camada,inputs+1); % Inicializando la matriz de pesos de la segunda capa oculta. W2=0.5*randn(outputs,camada+1); % Inicializando la matriz de pesos capa de salida %---------------------------------------------------------------------- % Funcion de la red neuronal %---------------------------------------------------------------------- [W1 W2 RMS LR]=bprop_josef(x,t,W1,W2,RMS_Goal,lr,maxcycles); %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% % tolerancia de criterio de error % %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% cycles=length(RMS); %---------------------------------------------------------------------- % grafico de comparación de salidas %---------------------------------------------------------------------- figure plot(tf,'r');hold on plot(saida,'b:'); legend('Saida deseada','Saida de test',3);

Page 127: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

126

ylabel('Salida'); xlabel('Entrada'); axis([1 4 0 0.0065]); grid;

ANEXO H

LÍNEAS DE CÓDIGO: DISEÑO INTERFAZ

function varargout = COMIENZO11(varargin) % COMIENZO11 M-file for COMIENZO11.fig % COMIENZO11, by itself, creates a new COMIENZO11 or raises the existing % singleton*. % % H = COMIENZO11 returns the handle to a new COMIENZO11 or the handle to % the existing singleton*. % % COMIENZO11('CALLBACK',hObject,eventData,handles,...) calls the local % function named CALLBACK in COMIENZO11.M with the given input arguments. % % Begin initialization code - DO NOT EDIT gui_Singleton = 1; gui_State = struct('gui_Name', mfilename, ...

Page 128: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

127

'gui_Singleton', gui_Singleton, ... 'gui_OpeningFcn', @COMIENZO11_OpeningFcn, ... 'gui_OutputFcn', @COMIENZO11_OutputFcn, ... 'gui_LayoutFcn', [] , ... 'gui_Callback', []); if nargin && ischar(varargin{1}) gui_State.gui_Callback = str2func(varargin{1}); end if nargout [varargout{1:nargout}] = gui_mainfcn(gui_State, varargin{:}); else gui_mainfcn(gui_State, varargin{:}); end % End initialization code - DO NOT EDIT % --- Executes just before COMIENZO11 is made visible. function COMIENZO11_OpeningFcn(hObject, eventdata, handles, varargin) % This function has no output args, see OutputFcn. % hObject handle to figure % eventdata reserved - to be defined in a future version of MATLAB % handles structure with handles and user data (see GUIDATA) % varargin command line arguments to COMIENZO11 (see VARARGIN) % Choose default command line output for COMIENZO11 handles.output = hObject; % Update handles structure guidata(hObject, handles); % UIWAIT makes COMIENZO11 wait for user response (see UIRESUME) % uiwait(handles.figure1); % --- Outputs from this function are returned to the command line. function varargout = COMIENZO11_OutputFcn(hObject, eventdata, handles) % varargout cell array for returning output args (see VARARGOUT); % hObject handle to figure % eventdata reserved - to be defined in a future version of MATLAB % handles structure with handles and user data (see GUIDATA) % Get default command line output from handles structure varargout{1} = handles.output; [x,map]=imread('fondoTRES.jpg','jpg'); %Representamos imagen en figura, con su mapa de colores image(x),colormap(map),axis off,hold on

Page 129: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

128

% --- Executes on button press in pushbutton1. function pushbutton1_Callback(hObject, eventdata, handles) % hObject handle to pushbutton1 (see GCBO) % eventdata reserved - to be defined in a future version of MATLAB % handles structure with handles and user data (see GUIDATA) clear all; close all;clc; COMIENZO1; % --- Executes on button press in pushbutton2. function pushbutton2_Callback(hObject, eventdata, handles) % hObject handle to pushbutton2 (see GCBO) % eventdata reserved - to be defined in a future version of MATLAB % handles structure with handles and user data (see GUIDATA) y=wavread('gato_39.wav'); wavplay(y,11025); % --- Executes on button press in pushbutton3. function pushbutton3_Callback(hObject, eventdata, handles) % hObject handle to pushbutton3 (see GCBO) % eventdata reserved - to be defined in a future version of MATLAB % handles structure with handles and user data (see GUIDATA) y=wavread('koala_5.wav'); wavplay(y,11025); function egatobien_Callback(hObject, eventdata, handles) % hObject handle to egatobien (see GCBO) % eventdata reserved - to be defined in a future version of MATLAB % handles structure with handles and user data (see GUIDATA) % Hints: get(hObject,'String') returns contents of egatobien as text % str2double(get(hObject,'String')) returns contents of egatobien as a double % --- Executes during object creation, after setting all properties. function egatobien_CreateFcn(hObject, eventdata, handles) % hObject handle to egatobien (see GCBO) % eventdata reserved - to be defined in a future version of MATLAB % handles empty - handles not created until after all CreateFcns called % Hint: edit controls usually have a white background on Windows. % See ISPC and COMPUTER. if ispc && isequal(get(hObject,'BackgroundColor'), get(0,'defaultUicontrolBackgroundColor'))

Page 130: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

129

set(hObject,'BackgroundColor','white'); end function egatomal_Callback(hObject, eventdata, handles) % hObject handle to egatomal (see GCBO) % eventdata reserved - to be defined in a future version of MATLAB % handles structure with handles and user data (see GUIDATA) % Hints: get(hObject,'String') returns contents of egatomal as text % str2double(get(hObject,'String')) returns contents of egatomal as a double % --- Executes during object creation, after setting all properties. function egatomal_CreateFcn(hObject, eventdata, handles) % hObject handle to egatomal (see GCBO) % eventdata reserved - to be defined in a future version of MATLAB % handles empty - handles not created until after all CreateFcns called % Hint: edit controls usually have a white background on Windows. % See ISPC and COMPUTER. if ispc && isequal(get(hObject,'BackgroundColor'), get(0,'defaultUicontrolBackgroundColor')) set(hObject,'BackgroundColor','white'); end function edit5_Callback(hObject, eventdata, handles) function ekoalabien_CreateFcn(hObject, eventdata, handles) % hObject handle to ekoalabien (see GCBO) % eventdata reserved - to be defined in a future version of MATLAB % handles empty - handles not created until after all CreateFcns called % Hint: edit controls usually have a white background on Windows. % See ISPC and COMPUTER. if ispc && isequal(get(hObject,'BackgroundColor'), get(0,'defaultUicontrolBackgroundColor')) set(hObject,'BackgroundColor','white'); end function ekoalamal_Callback(hObject, eventdata, handles) % hObject handle to ekoalamal (see GCBO) % eventdata reserved - to be defined in a future version of MATLAB % handles structure with handles and user data (see GUIDATA) % Hints: get(hObject,'String') returns contents of ekoalamal as text % str2double(get(hObject,'String')) returns contents of ekoalamal as a double % --- Executes during object creation, after setting all properties.

Page 131: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

130

function ekoalamal_CreateFcn(hObject, eventdata, handles) % hObject handle to ekoalamal (see GCBO) % eventdata reserved - to be defined in a future version of MATLAB % handles empty - handles not created until after all CreateFcns called % Hint: edit controls usually have a white background on Windows. % See ISPC and COMPUTER. if ispc && isequal(get(hObject,'BackgroundColor'), get(0,'defaultUicontrolBackgroundColor')) set(hObject,'BackgroundColor','white'); end

Page 132: DISEÑO E IMPLEMENTACIÓN DE UN SOFTWARE DE …

131

ANEXO I

LÍNEAS DE CÓDIGO: PARA LA IMPLEMENTACIÓN DEL EJECUT ABLE .

% mcc indica el compilador de matlab % mg indica el tipoi de archivo % COMIENZO11 : nombre del archivo mcc –mg COMIENZO11.