descripción de contenidos con wavelets jaime gaviria

22
Descripción de Contenidos con Wavelets Jaime Gaviria

Upload: gregorio-urquidez

Post on 28-Jan-2016

213 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Descripción de Contenidos con Wavelets Jaime Gaviria

Descripción de Contenidos con Wavelets

Jaime Gaviria

Page 2: Descripción de Contenidos con Wavelets Jaime Gaviria

Introducción

Uso de Coeficientes Wavelets para la descripción de contenido del audio

Se debe aplicar una técnica óptima para la extracción de contenidos de modo que:

– Se obtenga una información precisa de contenidos que pueda diferenciar de un contenido a otro parecido

– Que no se tenga una información demasiado detallada de tal forma que no se pueda identificar algo que no este en la muestra original

Page 3: Descripción de Contenidos con Wavelets Jaime Gaviria

Escenario

Se cuenta con 2 piezas de audio– La primera es el movimiento 4 Sonata 1 grabado

por N. Milstein, que representa la entrada de audio del usuario que hace la petición para identificar

– La segunda es la misma pieza grabada por Y. Menuhin la cual se encuentra grabada y permitirá la identificación

Page 4: Descripción de Contenidos con Wavelets Jaime Gaviria

Escenario

Page 5: Descripción de Contenidos con Wavelets Jaime Gaviria

Dos Posibles Soluciones

En la búsqueda de una solución, se encontraron dos alternativas que no son las óptimas pero deben ser tomadas en cuenta:– Descriptor de Envolvente Wavelet Gaussiano– Análisis Wavelet Estadístico para descripción de

contenidos

Page 6: Descripción de Contenidos con Wavelets Jaime Gaviria

Descriptor de Envolvente Wavelet Gaussiano

El contenido de audio es representado en el dominio wavelet por varios patrones. Estos patrones se ven bastante parecidos incluso para nuestras interpretaciones del escenario

Page 7: Descripción de Contenidos con Wavelets Jaime Gaviria

Descriptor de Envolvente Wavelet Gaussiano

Se estima la energía promedio de los coeficientes tomando segmentos de N muestras

Se estima un valor de umbral con el método que se considere más apropiado

Page 8: Descripción de Contenidos con Wavelets Jaime Gaviria

Descriptor de Envolvente Wavelet Gaussiano

Se estiman los valores superiores e inferiores de los patrones de energia wavelet, a partir de los cuales se obtienen las funciones numéricas de modo que se pueda estimar el grado de correlación entre ambos y poder hacer la identificación de la pieza.

Page 9: Descripción de Contenidos con Wavelets Jaime Gaviria

Problemas

La medida de correlación puede no se lo que se espera a pesar del “parecido” de las señales

Es necesaria la sincronización Función NO suave Poco Compacta Cálculos numéricos grandes

Page 10: Descripción de Contenidos con Wavelets Jaime Gaviria

Usando Curvas Gaussianas

Para describir la función se usa una curva gaussiana

ai es la amplitud, pi la posición, y wi el ancho del pico Gaussiano i

Page 11: Descripción de Contenidos con Wavelets Jaime Gaviria

Usando Curvas Gaussianas

Page 12: Descripción de Contenidos con Wavelets Jaime Gaviria

Usando Curvas Gaussianas

Page 13: Descripción de Contenidos con Wavelets Jaime Gaviria

Usando Curvas Gaussianas

Page 14: Descripción de Contenidos con Wavelets Jaime Gaviria

Usando Curvas Gaussianas

Permite mejores cálculos, reduce la cantidad de datos

Los picos son similares con alta correlación El ancho de los picos NO presenta alta correlación. Si se estima un número inferior de picos, el

reconocimiento no será bueno. A pesar de sus bondades, no es lo suficientemente

bueno para la descripción de contenido de audio.

Page 15: Descripción de Contenidos con Wavelets Jaime Gaviria

Análisis Wavelet Estadístico para descripción de contenidos

Se busca similaridad entre coeficientes wavelets a través de sumas estadísticas

Se trabaja en base a constelaciones de señal de audio

Herramientas de suma de datos estadísticos

Medida de escala de frecuencia

Page 16: Descripción de Contenidos con Wavelets Jaime Gaviria

Una nueva medida de dispersión wavelets

Las anteriores técnicas primero obtenían carácterísticas de cada escala, a las cuales luego se les buscaban similaridades.

Con esta técnica se busca hacer una medida de dispersión clasificada

Los coeficientes wavelets son ordenados en orden ascendente, se guardan los índices y se crean histogramas para cada escala

Page 17: Descripción de Contenidos con Wavelets Jaime Gaviria

Matriz clasificadora de dispersión wavelet

Permite la extracción de características especiales

Page 18: Descripción de Contenidos con Wavelets Jaime Gaviria

Histogramas de dispersión “rankeados”

Page 19: Descripción de Contenidos con Wavelets Jaime Gaviria

Vectores de dispersión

Se obtienen los n vectores por cada archivo de audio

A partir de los vectores se construye una matriz de n x m donde m depende del número de escalas y la técnica de reducción usada

Page 20: Descripción de Contenidos con Wavelets Jaime Gaviria

Reducción de dimensión de la medida de dispersión

Solo un porcentaje de las barras de histograma de “rank” son mantenidas

Se borran los datos de rank mas bajos y mas altos ya que de algún modo representan los coeficientes wavelets mas pequeños

Page 21: Descripción de Contenidos con Wavelets Jaime Gaviria

Indicador de rendimiento de la medida de dispersión

Vectores descriptores de contenido de 2 piezas ejecutadas por 4 diferentes personas

Page 22: Descripción de Contenidos con Wavelets Jaime Gaviria

Indicadores de rendimiento