coeficientes cepstrales en frecuencia mel y dynamic time ...jorjasso/files/expo.pdf · escuela de...
TRANSCRIPT
![Page 1: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/1.jpg)
Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time Warping para Reconocimiento
Automatico del Habla
Jorge Luis Guevara Diaz Semana ciencia de la Computación
Escuela de Informática Universidad Nacional de Trujillo-Perú
![Page 2: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/2.jpg)
Podriamos conversar con las maquinas como lo hacemos con
los humanos?
![Page 3: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/3.jpg)
Sistemas informáticos del lenguaje hablado
1. Modulo de reconocimiento del hablante (speaker recognition)
2. Modulo de reconocimiento reconocimiento automatico del habla (speech recognition)
3 Modulo de entendimiento del lenguaje Spoken Language Understanding
4 Modulo de sintesis (Text-to-Speech Conversion)
![Page 4: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/4.jpg)
![Page 5: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/5.jpg)
Modulo de reconocimiento• Reconocimiento Automatico del Habla
(Speech recognition)
![Page 6: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/6.jpg)
Que necesito?• Hacer un procesamiento de la señal de voz
en la computadora , con algoritmos óptimos menor complejidad computacional
Procesamiento digital de señales Algoritmos, matematicas, tecnicas para señales digitalizadas
Machine learnigcomo hacer que las maquinas aprendan
![Page 7: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/7.jpg)
Empecemos!!!
• Idea :
Analizar el modelo biologico para poder construir el modelo computacional
![Page 8: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/8.jpg)
Produccion del habla
![Page 9: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/9.jpg)
percepción del habla
![Page 10: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/10.jpg)
Empecemos!!!• Capturar la señal analogica y digitalizarla
para poder usarla en la computadora
![Page 11: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/11.jpg)
Problema: cuantas muestras debo tomar?
Frecuencia de muestreo
Generalmente Fs > 8000 muestras para poder obtener buenos resultados
Teorema del muestreo
Fs=2*Fa
Fa=más alta frecuencia de la señal
POR QUE????
![Page 12: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/12.jpg)
IdeaEliminar componentes de alta frecuencia > Fs/2 !!!
![Page 13: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/13.jpg)
Mas problemas!!!
• Vectores de 16000 elementos por segundo
• Como identifico las frecuencias ?
![Page 14: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/14.jpg)
quantificación
• PCM
![Page 15: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/15.jpg)
Procesamiento digital de la señal
• Algo de teoria:Sistemas lineales e invariantes en el tiempo:
![Page 16: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/16.jpg)
Procesamiento digital de la señal
• Convolucion
![Page 17: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/17.jpg)
Procesamiento digital de señales• Analizar la señal en el dominio de la
frecuencia : transformada de fourier
![Page 18: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/18.jpg)
Transformada de fourier
Donde :
![Page 19: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/19.jpg)
Algo importante
Convolucion en el dominio del tiempo es igual a una multiplicación en el dominio deLa frecuencia
![Page 20: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/20.jpg)
Transformada discreta de fourier
Complejidad computacional : O(n2 )
Intratable para aplicaciones con datos con mas de 8000 Muestras por segundo
Idea : utilizar divide y conquista!!!
![Page 21: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/21.jpg)
Transformada rapida de fourier
• Existen varios algoritmos que implementan la transformada rapida de fourier en solo O(n log n)!!!
• En esta investigacion :
• Algoritmo radix-2 con diezmado en frecuencia y reordenamiento de la salida de bits mezclados.....
![Page 22: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/22.jpg)
![Page 23: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/23.jpg)
![Page 24: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/24.jpg)
![Page 25: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/25.jpg)
Transformada Rápida de Fourier : reordenamiento de bitsmezclados
La mariposa Gentleman-Sande
![Page 26: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/26.jpg)
Complejidad computacional
Resolviendo la ecuación de recurrencia se tiene:
![Page 27: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/27.jpg)
Volvamos !!!Analizar segmentos de habla en el dominio de la frecuencia
![Page 28: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/28.jpg)
Extraccion de características
• Existen varias tecnicas entre las mas usadas tenemos :
• Coeficientes cepstrales
• Predicción lineal
• Coeficientes cepstrales en escala Mel
• Predicción lineal perceptual
![Page 29: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/29.jpg)
Coeficientes cepstrales en escala Mel
• Unidad minima :
el frame = xm[n]=x[n-mF]w[n]
x=señal de voz
F= tamaño de paso aprox [10mS,20mS]
w= ventana aprox[20mS, 25mS]
![Page 30: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/30.jpg)
Transformada corta de fourier
![Page 31: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/31.jpg)
Que tipo de ventana utilizar?
• Tipos de ventana:
Rectangular
Hamming
Cual es mejor? Analicemos....
![Page 32: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/32.jpg)
Ventana Rectangular
![Page 33: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/33.jpg)
Ventana Hamming
![Page 34: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/34.jpg)
Comparacion de ventanas
![Page 35: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/35.jpg)
CepstrumSi imaginamos la señal de voz como producto de la conmvoluciondel aire que fluye de nuestros pulmones y varios filtros correspondientes al tracto vocal
objetivoDesconvolucionar la señal de voz
![Page 36: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/36.jpg)
Cepstrum
![Page 37: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/37.jpg)
Cepstrum
![Page 38: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/38.jpg)
Frecuencia Mel
![Page 39: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/39.jpg)
Frecuencia Mel• Es una escala basada en como oímos, y se ha
construido , a través de experimentos fisiológicos
![Page 40: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/40.jpg)
Frecuencia Mel : bins
![Page 41: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/41.jpg)
Coeficientes Cepstrales en Frecuencia Mel
Estos seran nuestros vectores de caracteristicas, generalmenteM=13
Si tenemos una señal analizada en 1000 segmentos la matrizde caracteristicas tendrá 1300 valores, mucho menos que 16000!!!
![Page 42: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/42.jpg)
Reconocimiento del Habla como clasificación de Patrones
• Posibles técnicas– Redes bayesianas
– Modelos ocultos de Markov– Redes Neuronales (mapas autoorganizativos ,
redes de clasificacion espacio temporal de Tramas)
![Page 43: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/43.jpg)
Dynamic Time Warping
• Un algoritmo optimizado que hace uso de la programación dinamica y es usado muchas veces por las técnicas anteriormente mencionadas ejem: modelos ocultos de markov
![Page 44: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/44.jpg)
Dynamic Time Warping
• Para una palabra A buscar una palabra Aw que minimice la distancia(A,Aw)
A y Aw conjunto de valores de caracteristicas
![Page 45: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/45.jpg)
Dynamic Time Warping
• Caso 1– A y B del mismo tamaño Facil!!!
• Caso 2– Diferentes longitudes
Que podemos hacer?
![Page 46: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/46.jpg)
El tiempo es el enemigo
• Normalizacion lineal???– Distancia(A,Aw)=distancia(A,Aw)
• Pero
S i l e n c i o | casa | silencio
Silencio |c a s a |s i l e n c i oMala idea!!!
![Page 47: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/47.jpg)
Dynamic Time WarpingDistancia (A,B)=Distancia( A(w(1)) , B(w(2)) )
![Page 48: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/48.jpg)
Dynamic Time Warping: reglas de juego
![Page 49: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/49.jpg)
Dynamic Time Warping: reglas de juego
• Analizar todas las distancias y encontrar la mejor es EXPONENCIAL!!!
• Solucion Programación dinámica– La solucion puede verse como un problema de
La ruta mas corta O(n2)
![Page 50: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/50.jpg)
Dynamic Time Warping• Formalmente:
– Señales de voz
encontrar
La distancia:
![Page 51: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/51.jpg)
Dynamic Time Warping
• Idea: restringir un poco las condiciones : ventana de ajuste O(n)!!!!
![Page 52: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/52.jpg)
• Slope constraint
![Page 53: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/53.jpg)
Dynamic Time Warping
![Page 54: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/54.jpg)
Algoritmo PD matching
![Page 55: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/55.jpg)
Ideas!!!
• Utilizar probabilidades
• Modelos hibridos
• Gramaticas
• Tecnicas de busqueda
• Mucho por recorrer
![Page 56: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/56.jpg)
Presentacion del software para pruebas
Lorito version 3.14
![Page 57: Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time ...jorjasso/files/expo.pdf · Escuela de Informática ... Modulo de reconocimiento del hablante (speaker recognition) 2. Modulo](https://reader033.vdocuments.co/reader033/viewer/2022060217/5f066c057e708231d417ea17/html5/thumbnails/57.jpg)
Preguntas????
ideas???