tarea 1 bmc 234 final

16
                                                                 c  {   ...   }       s  {   }        i  ∈  N            m ∈ N                        

Upload: boanerges-martinez-cbd

Post on 04-Oct-2015

220 views

Category:

Documents


0 download

DESCRIPTION

Procesamiento de sonidos

TRANSCRIPT

  • Boanerges Martinez Cortez A73791

    CI-2600 Temas Especiales de I. A.: Procesamiento de Sonido

    Tarea 1:

    Sonidos peridicos vs. no peridicos

    Parte I.

    Recoleccin de muestras

    Grabe su voz pronunciando las vocales a, e, i, o, u, las consonantes s, f, m (no ese,

    efe, eme), y los dgitos 0, 1, 2,. . . , 9, con pequeas pausas entre ellos (como si las

    estuviera dictando). Utilice una tasa muestreo de al menos 8 kHz (8 000 muestras por

    segundo) pero no ms de 20 kHz ya que esta tasa es suciente para representar la voz

    humana sin prdida de informacin.. Si el software utilizado para hacer la grabacin le

    permite seleccionar el nmero de bits asignados a cada muestra, seleccione al menos 8 bits

    (se recomienda 16 bits). Procure que la amplitud de cada vocal y de cada dgito (de ahora

    en adelante llamados colectivamente muestras) sea al menos 1/3 del rango registrable,

    pero no tan alta que exceda el mximo valor permisible. Repita la grabacin al menos

    dos veces para contar con al menos tres muestras de cada sonido. Luego, haga lo mismo

    utilizando al menos otros dos sujetos (que no estn tomando el curso): al menos uno de

    sexo femenino y uno de sexo masculino.

    Utilice un editor de sonido para separar cada una de las muestras. Procure dejar

    un pequeo espacio antes y despus de cada muestra, y guarde cada una de ellas en

    un archivo wav, usando el siguiente formato para el nombre: csim.wav, donde c {a, e, i, o, u, s, f, m, 0, 1, 2,. . .,9} representa la clase de la muestra, s {f,m} repre-senta el sexo del hablante, i N representa el identicador (secuencial) del sujeto den-tro de su sexo (consecuentemente, el par si identica de forma nica a cada sujeto), y

    m N representa el nmero de muestra correspondiente a cierta clase y sujeto. Por ejem-plo, la segunda muestra de la vocal u producida por el primer varn tendr el nombre

    um12.wav, y la tercera muestra de la vocal a producida por la primer mujer tendr el

    nombre af13.wav.

    1

  • Observacin. En esta tarea no se utilizarn las muestras correspondientes a los dgitos;

    se utilizarn en una tarea posterior, pero se recomienda recolectarlas de una vez para

    evitar en el futuro tener que buscar nuevamente a los sujetos (o a nuevos sujetos).

    Parte II.

    Anlisis de las muestras

    Sonidos Peridicos

    1. Seleccione una muestra de cada una de las vocales y de la consonante m corres-

    pondientes a su voz. Para cada una de ellas utilice un editor de sonido (o alterna-

    tivamente Matlab u Octave) para hacer un acercamiento (zoom-in) de la seal,

    e identique visualmente su periodo.

    a) Graque ocho periodos de la seal, y seale el inicio y nal de uno de ellos.

    A

    E

    I

    O

    2

  • UF

    S

    M

    b) Utilice los indicadores de tiempo desplegados por el editor de sonido para

    estimar el periodo T de la seal y su frecuencia fundamental f0.

    3

  • Letra Periodo(T)[ms] Frecuencia fundamental(fo)[Hz]

    a 8 125

    e 9 111

    i 9 111

    o 10 100

    u 9 111

    m 8 125

    c) Graque la funcin de magnitud promedio de la diferencia (FMPD)

    d () =1

    Tv Tv0

    |s(t) s(t+ )| dt,

    implementada en tiempo discreto como

    d [k] =1

    N kNkn=1

    |s[n] s[n+ k]| ,

    y utilice la posicin de la muesca ms cercana a T para mejorar sus estimadosde T y f0.

    A

    En este caso la FMPD tiene un mnimo en T = 9,7ms, en la tabla de la parteb teniamos un valor de 8ms.

    E

    4

  • La FMPD tiene un mnimo cerca a T = 9,7ms, en la tabla de la parte bteniamos un valor de 9ms.

    I

    La FMPD tiene un mnimo cerca a T = 9,4ms, en la tabla de la parte bteniamos un valor de 9ms.

    O

    5

  • La FMPD tiene un mnimo cerca a T = 9,8ms, en la tabla de la parte bteniamos un valor de 10ms.

    U

    La FMPD tiene un mnimo cerca a T = 9,6ms, en la tabla de la parte bteniamos un valor de 9ms.

    M

    6

  • La FMPD tiene un mnimo cerca a T = 9ms, en la tabla de la parte b teniamosun valor de 8ms.

    d) Graque el espectro de la seal correspondiente a los ocho periodos gracados

    en el punto 1a y verique que los picos ms altos del espectro correspondan

    con mltiplos de f0. Seale las primeras tres armnicas de la seal (f0, 2f0 y3f0) y muestre sus frecuencias.

    A

    E

    7

  • IO

    8

  • UM

    9

  • e) Graque la sonoridad especca relativa como funcin de su posicin en la

    cclea.

    A

    E

    10

  • IO

    11

  • UM

    12

  • 2. Seleccione una muestra de cada una de las vocales y de la consonante m corres-

    pondientes a la voz de uno de los sujetos cuyo sexo sea distinto al suyo. Identique

    visualmente el periodo de cada una de ellas, y mejore sus estimados utilizando la

    FMPD.

    Letra H BMC M Nellie

    Periodo(ms) Frecuencia(Hz) Periodo(ms) Frecuencia(Hz)

    a 9.7 103 6 167

    e 9.7 103 6 167

    i 9.4 106 5.65 177

    o 9.8 102 5.9 170

    u 9.6 104 5.4 185

    m 9 111 5.2 192

    MG 9.53 105 5.68 176

    3. Calcule la media geomtrica de las n1 frecuencias fundamentales encontradas enel punto 1 y la media geomtrica de las n2 frecuencias fundamentales encontradasen el punto 2.La media geomtrica es ms apropiada que la media aritmtica pa-

    ra calcular promedios de frecuencias fundamentales debido a que los humanos

    percibimos la altura en una escala logartmica (geomtrica) y no lineal (aritmtica).

    a) Cul de las dos voces exhibi una frecuencia fundamental media ms alta, la

    femenina o la masculina? Basado en el sexo de los sujetos, fue el resultado el

    esperado?

    La vos con frecuencia fundamental mas alta fue la femenina, hasta donde se

    la vos femenina es mas aguda que la masculina que tiende a ser mas grave,

    asi que podria decirse que el resultado fue el esperado.

    b) Calcule la diferencia entre las frecuencias fundamentales medias de ambos

    sexos, y exprese esta diferencia en octavas y en semitonos.

    13

  • La diferencia en octavas es: log2176 log2105 = 0,745 octavas.La diferencia en semitonos es: 12 0,745 = 8,94 semitonos.c) Investigue a qu nota musical (incluyendo el nmero de la octava) corresponde

    cada una de las frecuencias fundamentales medias encontradas.

    Para la frecuencia 105Hz encontre los siguientes valores enWikipedia: sol1=98.0