la ingeniería lingüística en la sociedad de la...

12
Maria Antònia Martí i Joaquim Llisterri Universitat de Barcelona i Universitat Autònoma de Barcelona Curso de Industrias de la Lengua “La ingeniería lingüística en la Sociedad de la Información” Fundación Duques de Soria, Soria, 17 de julio de 2000 La ingeniería lingüística en la Sociedad de la Información Maria Maria Antònia Martí Antònia Martí Departament de Lingüística General i Centre de Llenguatge i Computació, Universitat de Barcelona http://www.ub.es/ling/labcat.htm Joaquim Llisterri Joaquim Llisterri Departament de Filologia Espanyola, Universitat Autònoma de Barcelona http://liceu.uab.es/~joaquim/home.html Maria Antònia Martí i Joaquim Llisterri Universitat de Barcelona i Universitat Autònoma de Barcelona La ingeniería lingüística en la Sociedad de la Información El lenguaje en la Sociedad de la Información Las Las tecnologías lingüísticas tecnologías lingüísticas Las tecnologías del texto escrito Las tecnologías del habla La Sociedad de la Información y las tecnologías lingüísticas en el contexto europeo Perspectivas profesionales Maria Antònia Martí i Joaquim Llisterri Universitat de Barcelona i Universitat Autònoma de Barcelona Ingeniería lingüística (Language Engineering) “Aplicación de los conocimientos sobre la lengua al desarrollo de sistemas informáticos que puedan reconocer, comprender, interpretar y generar el lenguaje humano en todas sus formas” Ingeniería lingüística. Cómo aprovechar la fuerza del lenguaje. Luxembourg: Anite Systems. Versión española: Observatorio Español de Industrias de la Lengua, Instituto Cervantes. http://www.hltcentral.org/le/es/broch/harness.html Maria Antònia Martí i Joaquim Llisterri Universitat de Barcelona i Universitat Autònoma de Barcelona Ingeniería lingüística La ingeniería lingüística se basa en: Procesamiento del lenguaje natural (NLP, Natural Language Processing) Tecnologías del habla (Speech Technologies) Recursos lingüísticos

Upload: phamkiet

Post on 02-Oct-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Curso de Industrias de la Lengua“La ingeniería lingüística en la Sociedad de la Información”

Fundación Duques de Soria, Soria, 17 de julio de 2000

La ingeniería lingüísticaen la Sociedad de la Información

Maria Maria Antònia MartíAntònia MartíDepartament de Lingüística General i Centre de Llenguatge i

Computació, Universitat de Barcelonahttp://www.ub.es/ling/labcat.htm

Joaquim LlisterriJoaquim LlisterriDepartament de Filologia Espanyola,Universitat Autònoma de Barcelona

http://liceu.uab.es/~joaquim/home.html

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

La ingeniería lingüísticaen la Sociedad de la Información

El lenguaje en la Sociedad de la Información

Las Las tecnologías lingüísticastecnologías lingüísticas

Las tecnologías del texto escrito

Las tecnologías del habla

La Sociedad de la Información y las tecnologíaslingüísticas en el contexto europeo

Perspectivas profesionales

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Ingeniería lingüística(Language Engineering)

“Aplicación de los conocimientos sobre la lenguaal desarrollo de sistemas informáticos que puedanreconocer, comprender, interpretar y generar ellenguaje humano en todas sus formas”

Ingeniería lingüística. Cómo aprovechar la fuerza del lenguaje.Luxembourg: Anite Systems. Versión española: ObservatorioEspañol de Industrias de la Lengua, Instituto Cervantes.http://www.hltcentral.org/le/es/broch/harness.html

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Ingeniería lingüística

• La ingeniería lingüística se basa en:

Procesamiento del lenguaje natural(NLP, Natural Language Processing)

Tecnologías del habla (Speech

Technologies)

Recursos lingüísticos

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Industrias de la lengua

“Abarca una serie de actividades comerciales enlas que el tratamiento del lenguaje, por personas,por máquinas o por una combinación de unas yotras, forma una parte fundamental del productoo servicio”

Lenguaje y tecnología. De la torre de Babel a la aldea global.Luxemburgo: Oficina de Publicaciones Oficiales de las ComunidadesEuropeas, 1997.

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

La ingeniería lingüísticaen la Sociedad de la Información

El lenguaje en la Sociedad de la Información

Las tecnologías lingüísticas

Las tecnologías del texto escritoLas tecnologías del texto escrito

Las tecnologías del habla

La Sociedad de la Información y las tecnologíaslingüísticas en el contexto europeo

Perspectivas profesionales

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

La ingeniería lingüísticaen la Sociedad de la Información

El lenguaje en la Sociedad de la Información

Las tecnologías lingüísticas

Las tecnologías del texto escrito

Las Las tecnologías del hablatecnologías del habla

La Sociedad de la Información y las tecnologíaslingüísticas en el contexto europeo

Perspectivas profesionales

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Las tecnologías del habla

La interacción oral con los sistemasinformáticos

Los sistemas de diálogo y sus aplicacionesen el contexto de la Sociedad de laInformación

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Ventajas de la comunicación oralpersona-máquina

Libertad para otras tareas simultáneas

Acceso al ordenador mediante el teléfono

Sistema potencialmente económico

Medio de comunicación natural

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Libertad para otras tareas simultáneas

Libera las manos y las vista

Es omnidireccional y permite movilidad

No interfiere con otras actividades

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Libertad para otras tareas simultáneas

• Entrada de datos sobre productos en gestión defondos de almacén

• Control de calidad en entornos industriales

• Acceso a información en cabinas de aviones

• Control de los accesorios en vehículos

• Dictado de informes médicos o legales

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Acceso al ordenador mediante el teléfono

Rapidez de acceso

Facilidad de acceso sin equipo específico

Independiente de la distancia

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Acceso al ordenador mediante el teléfono

• Horarios de transportes públicos

• Consulta de páginas amarillas

• Consulta de notas

• Banca electrónica

• Centralitas automatizadas

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Sistema potencialmente económico

Utilización de equipos electrónicos

Producción a bajo coste

No requiere el uso de pantalla ni deteclado

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Medio de comunicación natural

CHAPANIS, A. (1975) "Interactive HumanCommunication", Scientific American 232:

36-42.

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Canales de comunicación

Visual

Micrófono y altavoz

Mecanismo de transmisión de escrituramanuscrita

Máquina de escribir e impresora adistancia (Telex)

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Tiempo de resolución de problemas

• Cualquier canal en combinación con el habla:menos de 15 minutosmenos de 15 minutos

• Únicamente el habla : 16 minutos16 minutos

• Cualquier canal, sólo o combinado con otros:más de 20 minutos

• Únicamente escritura a mano omecanografiada: más de 30 minutosmás de 30 minutos

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Limitaciones de la comunicación oralpersona-máquina

Falta de naturalidad de los sistemas de síntesis

Dificultades en el reconocimiento del hablacontinua en sistemas independientes del locutor

Falta de adecuación de los modelos de diálogopersona-máquina

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Aplicaciones de los sistemas de diálogo

Sistemas de información

Sistemas de transacciones

Traducción automática del habla

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Aplicaciones de los sistemas de diálogo

• Sistemas de información

• Transportes públicos RAILTEL, ARISE, MAITS, DGXIII, CE

WAXHOLM, Department of Speech, Music andHearing, KTH

MASK, LIMSI-CNRS

ATIS, SRI International

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

RAILTEL, ARISE, MAITSDGXIII, CE

ARISE, Automatic Railway Information Systems for Europehttp://www2.echo.lu/langeng/en/le3/arise/arise.html

RAILTEL, Railway Telephone Information Servicehttp://www2.echo.lu/langeng/en/mlap94/railtel.html

MAIS, Multilingual Inquiry Systemshttp://www2.echo.lu/langeng/en/mlap94/mais.html

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

WAXHOLM, Dept. of Speech, Music and Hearing, KTH http://www.speech.kth.se/waxholm/waxholm2.html

• Información detráfico marítimo en elarchipiélago deEstocolmo• Entrada mediantereconocimiento del habla• Informaciónproporcionada mediantesíntesis del hablacomplementada porsíntesis visual y uninterfaz gráfico

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

MASK, LIMSI-CNRS http://www.limsi.fr/Recherche/TLP/kiosk-sncf.html

MASK : Le systeme MASK vousécoute

USER : Euh... je voudrais allerdemain de Paris à Bordeaux...

MASK : A quelle heure voulez-vous partir?

USER : Vers 12:30

MASK : Il y a un train a 12:43,voulez-vous réserver?

USER : Oui en première classe

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

ATIS, SRI Internationalhttp://www-speech.sri.com/demos/atis.html

• Información sobre horarios y tarifas de vuelos

• Incluye comprensión del lenguaje

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Aplicaciones de los sistemas de diálogo

• Sistemas de información• Información ciudadana

MAIRIEVOX, CNET, Lannion VOYAGER, MIT Spoken Language SystemsGroup AdApt, Department of Speech, Music andHearing, KTH

• Información meteorológica JUPITER, MIT Spoken Language SystemsGroup

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

AdApt, Department of Speech, Music and Hearing, KTHhttp://www.speech.kth.se/ctt/proj/adapt/

• Información sobre laciudad de Estocolmo

• Agentesconversacionalespara ayudar en elproceso de obtenciónde información

• Síntesis visual

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Aplicaciones de los sistemas de diálogo

• Sistemas de transacciones• Reserva de billetes

PEGASUS, MIT Spoken Language SystemsGroup

• Pedidos por teléfono SAPLEN, Grupo de Procesamiento de Señales yComunicaciones, Universidad de Granada

• Gestión de itinerarios TRAINS, Rochester University

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

TRAINS, Department of Computer Science, Rochester University

http://www.cs.rochester.edu:80/research/trains/

• Gestión de itinerarios de trenes

Síntesis y reconocimiento del habla

Diálogo

Comprensión del lenguaje

Interfaz visual

Integración en un sistema interactivo

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Traducción automática del habla(spoken language translation)

Reconocimiento del habla

Gestión del diálogo

Traducción automática de textos

Conversión de texto a habla

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

JANUS, Interactive Systems Labshttp://www.is.cs.cmu.edu/ISL.speech.janus.html

• Dominios limitados: citas, reserva de hoteles,itinerarios de viajes

• Lenguas de entrada: inglés y alemán

• Lenguas de salida: inglés, alemán y japonés

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Versión portátil de JANUShttp://isl.ira.uka.de/ISL.speech.janus.port.html

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Spoken Language Translation, SRI Internationalhttp://www.cam.sri.com

• Dominio restringido: información sobre vuelos

• Traducción del inglés al francés

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Teleface, Dept. of Speech, Music and Hearing, KTHhttp://www.speech.kth.se/teleface/

• Generación dehabla sintetizadacon apoyo visual(lectura labial)para personas condificultades deaudición

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

La ingeniería lingüísticaen la Sociedad de la Información

El lenguaje en la Sociedad de la Información

Las tecnologías lingüísticas

Las tecnologías del texto escrito

Las tecnologías del habla

La Sociedad de la Información y las tecnologíasLa Sociedad de la Información y las tecnologíaslingüísticas en el contexto europeolingüísticas en el contexto europeo

Perspectivas profesionales

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Programas europeos: Tecnologías parala Sociedad de la Información

Tecnologías de la Sociedad de la InformaciónTecnologías de la Sociedad de la Información.Un programa de Investigación, DesarrolloTecnológico y Demostración del V ProgramaMarco (1999-2002)

Dirección General XIII, Sociedad de laInformación

http://www.cordis.lu/ist/home.html

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

III.4.1. Multilingüismo en loscontenidos y servicios digitales

III.4.2. Interactividad natural

III.4.3. Gestión de informaciónmultilingüe

Acción Clave III.4: Tecnologíaspara el lenguaje humano

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

III.4.1: Multilingüismo en el contenidoy los servicios digitales

Centralitas y servicios automáticos de atenciónal clienteIdentificación de la lengua y verificación delhablanteAsistentes para servicios de directorioFiltrado, traducción y respuesta de correoelectrónicoGestión y acceso a catálogos multilingüesServicios comerciales en la web con interfazoral

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

III.4.1: Multilingüismo en el contenidoy los servicios digitales

Autoría conjunta de documentosHerramientas de corrección para no nativosHerramientas para la gestión de laterminologíaTraducción, comprensión y resumen en líneapara trabajo en grupoAprendizaje intercultural en el mundo de losnegociosEnseñanza de lenguas asistida por ordenador

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

III.4.1: Multilingüismo en el contenidoy los servicios digitales

Autoría de contenidos multimedia ypublicación en paralelo en varias lenguas yorientada a diversas culturasPortales multilingües con búsquedas, perfilesde usuario y presentación con “sensibilidadlingüística”Tratamiento de la diversidad lingüística de losusuarios de servicios en red

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

III.4.2: Interactividad natural

Comprensión y síntesis de habla robustas y dealta calidad

Aplicables a navegadores, lectores de correoelectrónico y asistentes personales

Funcionales en entornos adversos

Adaptados a personas con necesidadesespeciales

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

III.4.2: Interactividad natural

Mejoras en la comprensión de mensajesmultimodalesVídeo-conferencia con pizarra electrónicacompartidaTratamiento de gestos, lectura labial, etc..Sistemas de diálogo persona - máquina conhabla espontánea y comprensiónSistemas de diálogo asistido persona - persona

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

III.4.3: Gestión de informaciónmultilingüe

Recuperación de información multilingüe

Asistentes inteligentes

Tratamiento de dependencias semánticas

Consultas y respuestas intuitivas

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

III.4.3: Gestión de informaciónmultilingüe

Obtención de conocimiento multilingüe“Minería de textos”Extracción de datosIdentificación del temaDetección y extracción de términos y derasgos de clasificaciónComprensión y direccionamiento demensajes

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

Tecnologías para el lenguajehumano

http://www.hltcentral.org/hlt/

Maria Antònia Martí i Joaquim LlisterriUniversitat de Barcelona i Universitat Autònoma de Barcelona

La ingeniería lingüísticaen la Sociedad de la Información

El lenguaje en la Sociedad de la Información

Las tecnologías lingüísticas

Las tecnologías del texto escrito

Las tecnologías del habla

La Sociedad de la Información y las tecnologíaslingüísticas en el contexto europeo

Perspectivas profesionalesPerspectivas profesionales