sistema de recuperacion de audio

Post on 29-Jun-2015

1.233 Views

Category:

Travel

4 Downloads

Preview:

Click to see full reader

TRANSCRIPT

“ANÁLISIS, DISEÑO E IMPLEMENTACIÓN DE UN SISTEMA

DE BÚSQUEDA DE AUDIO MEDIANTE LA INTEGRACIÓN DE

RECONOCIMIENTO AUTOMÁTICO DE VOZ Y BÚSQUEDA POR

INDEXACIÓN.”

Vicente Ordóñez R.

EL PROBLEMA

3

EL PROBLEMA

Búsqueda de documentos de audio (multimedios que incluyan audio), cuando estos documentos no poseen información de descripción (metadatos).

4

MOTIVACIÓN

Investigar acerca de herramientas para hacer reconocimiento automático del habla y los protocolos utilizados para acceder a estas tecnologías.

Conocer la relación entre eficacia de las tecnologías de reconocimiento de voz subyacentes y la efectividad del sistema como un todo.

5

OBJETIVOS

Investigar el estado del arte de las tecnologías de reconocimiento automático de voz.

Analizar y diseñar una arquitectura que permita extraer transcripciones de grandes cantidades de archivos digitales de audio para luego almacenarlas de tal forma que posteriormente se puedan efectuar búsquedas de manera eficiente.

 Implementar un prototipo de la arquitectura propuesta utilizando un motor de reconocimiento de voz disponible en el mercado.

6

OBJETIVOS

Diseñar e implementar un modelo de aplicación que permita la integración de los componentes de esta arquitectura con un sistema ya existente.

Implementar un buscador de archivos de audio accesible como una aplicación Web y que utilice la arquitectura propuesta. 

ANÁLISIS Y DISEÑO

8

CASOS DE USO DEL SISTEMA

9

FLUJO DE PROCESOS DEL SISTEMA

10

MODELO DEL SISTEMA

11

CAPAS DE ABSTRACCIÓN DEL SISTEMA

IMPLEMENTACIÓN

13

COMPONENTES IMPLEMENTADOS

14

ACCESO A SERVICIOS DE RECONOCIMIENTO DE VOZ

CLIENTE WEB

15

DEMO

PRUEBAS

18

RENDIMIENTO DE INDEXACIÓN

19

RENDIMIENTO DE BÚSQUEDA

Prueba 1 Prueba 2 Prueba 3

Cantidad de documentos total en el índice

10000 100000 250000

Tamaño resultante del índice

12.4 MB 125 MB 300 MB

Tiempo promedio para cada consulta

4.17ms 16.78 ms 35.84 ms

Desviación estándar de los tiempos de consulta

17.3 ms 13.29 ms 15.49 ms

Máximo tiempo registrado

174 ms 130 ms 155 ms

Mínimo tiempo registrado

1 ms 11 ms 26 ms

20

PRECISIÓN DEL MOTOR DE RECONOCIMIENTO DE VOZ

Transcripción Palabrasreconocidascorrectamente

Total de palabras reconocidas

Precisión

Transcripción1 123 385 32%

Transcripción2 53 171 31%

Transcripción3 136 230 60%

Total 312 786 40%

21

RETENTIVA DEL MOTOR DE RECONOCIMIENTO DE VOZ

Transcripción Palabrasreconocidascorrectamente

Total de palabras en el audio

Retentiva

Transcripción1 123 277 44%

Transcripción2 53 134 39%

Transcripción3 136 302 45%

Total 312 713 44%

22

PRUEBAS CON USUARIOS

0102030405060708090

100

Computer Technology

Scientific Research

Presidential Race

Usuario 1

Usuario 2

Usuario 3

Usuario 4

Usuario 5

23

PRECISIÓN DEL BUSCADOR

Transcripción Cantidad deDocumentosRelevantes

Total de Resultados Considerados

Precisión

Computer technology

8 10 80%

Scientific Research

9,8 10 98%

Presidential Race 6,8 10 68%

Total 24,6 30 82%

24

CONCLUSIONES

Los resultados de búsqueda resultan relevantes utilizando solamente información obtenida con reconocimiento de voz.

Precisión del sistema de búsqueda es mayor a la precisión del sistema de reconocimiento de voz subyacente.

25

PERSPECTIVAS

Los sistemas de reconocimiento del habla se continuarán integrando con los sistemas operativos modernos.

Surgirá la necesidad de llegar finalmente a un consenso entre fabricantes y seguir estándares.

PREGUNTAS

top related