la señal de voz asunción moreno. indice el aparato fonador la señal vocal parámetros...
TRANSCRIPT
La señal de voz
Asunción Moreno
Indice
El aparato fonador La señal vocal Parámetros fundamentales Modelo de producción de la voz Fonética acústica El oído Percepción del sonido
El aparato fonador
La glotis
x104
El gol -pe de ti - món f - ue sobr-e co-g-e - do - r
Señal de voz (fm= 8Khz/12 bits)
0 100 200 300 400
-1000
-800
-600
-400
-200
0
200
400
600
800
0 100 200 300 400
-200
-150
-100
-50
0
50
100
150
Señal sonora: /e/ Señal sorda: /s/
Representación temporal y frecuencial
0 5 10 15 20 25 30-200
-100
0
100
200
0 500 1000 1500 2000 2500 3000 3500 4000-150
-100
-50
0
Espectrograma
0 500 1000 1500
-1500
-1000
-500
0
500
1000
0 500 1000 1500
-500
0
500
1000
0 500 1000
-1000
-500
0
500
Tres realizaciones de lapalabra “el” pronunciadaspor tres locutores distintos
Variabilidad
Factores de variabilidad
Culturales
• Volumen de la voz• Conjunto de sonidos• Duración• Entonación• Formas de formar frases• Velocidad del habla• Vocabulario
GramáticaEspañola
Diccionar
ioDicc
ionario
EspañolEspañol
Ambientales
• Ruido de fondo• Factores mecánicos: vibraciones• Estado emocional • Acústica de la sala • Ambiente: calor
Fisiológicas
• Tracto vocal• Cuerdas vocales y• frecuencia de vibración• Forma del pulso glotal• Cansancio• Congestión nasal
Variabilidad intra locutor
ArticuladaArticulada SusurradaSusurrada Alta vozAlta voz
NormalNormal EnfadoEnfado SuaveSuave RápidaRápida
Palabra cero pronunciada en diversos estilos
Análisis estadístico
0 200 400 600 800-1000
-800
-600
-400
-200
0
200
400
600
Transición del fonema /f/ al fonema /u/
No estacionariedad
Histograma
-3 -2 -1 0 1 2 30
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Aproximación del histograma
Representación conjunta de dos muestras consecutivas
0 20 40 60 80
-1000
-500
0
500
1000
1500
2000
2500
3000
Indice desplaz.
Corr. M./seg.=357 Sol.= 0% V.Dat: Rect Estim: Inse
0 20 40 60 80-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
2.5
x 105
Indice desplaz.
Corr. M./seg.=459 Sol.= 0% V.Dat: Rect Estim: Inse
Tramas sorda y sonora con su autocorrelación
0 100 200 300 400
-1000
-800
-600
-400
-200
0
200
400
600
800
0 100 200 300 400
-200
-150
-100
-50
0
50
100
150
Tramas sorda y sonora: densidad espectral de potencia
0 100 200 300 400
-1000
-800
-600
-400
-200
0
200
400
600
800
0 500 1000 1500 2000 2500 3000 3500
10
20
30
40
50
60
70
Freq.(Hz)
Period. Mues./seg.=460 Sol.= 0% Vent. Hamm
0 500 1000 1500 2000 2500 3000 35005
10
15
20
25
30
35
40
45
Freq.(Hz)
Period. Mues./seg.=459 Sol.= 0% Vent. Hamm
0 100 200 300 400
-200
-150
-100
-50
0
50
100
150
Parámetros fundamentales
Tono (frecuencia fundamental) Formantes Ancho de banda
Tono (frecuencia fundamental)
Gama de variación entre 50 Hz y 400 Hz Tono medio:
mujeres: 220 Hz varones: 130 Hz
1 octava de variación en el habla normal.
Tono o frecuencia fundamental
Hz
Formantes de un sonido sonoro
0 2 4 kHz
Formantes de las vocales Triángulo de las vocales
200
800
800 2000
F1
F2
u
a
i
F3: 2.24 kHz (u)3.01 kHz (i)
Formantes de un sonido sordo
0 2 4 kHz
Evolución de los formantes
Hz
Parametrización de la voz
Hz
Ancho de banda
canal telefónico
inteligibilidad
50 Hz300 Hz
3.4 kHz
7 kHz
naturalidad
Modelo de producción de la voz
excitación tracto vocal
voz
ruido
tren periódico de pulsos H(z)
sonidos sonoros
sonidossordos
No
Fonética acústica
FricativasAproximantes
VibrantesLaterales
Son
ori
dad
VocalesSiNasales
Oclusivas
Oclusivas Fricativas
Africadas
Oclusión
No Total Parcial
Fonética acústica
Puntos de articulación
Alófono
Fonema
Variabilidad
Puntos de articulación
labios: [p], [b], [m]
dientes: [t], [d]
alveolos: [n], [s]
paladar: [J], [L]
velo: [k], [g], [x]
Alófono
Cada uno de los sonidos propios de una lengua
Fonema
Conjunto de alófonos con el mismo valor fonológico en una lengua /s/, /z/ casa, mismo /n/, /N/ cana, tango
Variabilidad
contexto coarticulación prosodia
locutor factores individuales ... y sociolingüísticos
El oído
Oído interno
Percepción del sonido
Respuesta a la composición frecuencial (no a la forma de onda)
Enmascaramiento en frecuencia
Bandas críticas
Escalas de Bark y mel
Enmascaramiento Simultáneo