lingüística computacional 2018-2019 · a materia lingüística computacional introduce os...

50
1 FACULTADE DE FILOLOXÍA DEPARTAMENTO DE LINGUA E LITERATURA ESPAÑOLAS, TEORÍA DA LITERATURA E LINGÜÍSTICA XERAL Lingüística Computacional Ana Isabel Codesido García GUÍA DOCENTE E MATERIAL DIDÁCTICO 2019/2020

Upload: others

Post on 22-Mar-2020

20 views

Category:

Documents


0 download

TRANSCRIPT

1

FACULTADE DE FILOLOXÍA

DEPARTAMENTO DE LINGUA E LITERATURA ESPAÑOLAS,

TEORÍA DA LITERATURA E LINGÜÍSTICA XERAL

Lingüística

Computacional

Ana Isabel Codesido García

GUÍA DOCENTE E MATERIAL DIDÁCTICO

2019/2020

2

FACULTADE DE FILOLOXÍA. DEPARTAMENTO DE LINGUA E LITERATURA

ESPAÑOLAS, TEORÍA DA LITERATURA E LINGÜÍSTICA XERAL

AUTORA: Ana Isabel Codesido García.

Edición electrónica. 2019

ADVERTENCIA LEGAL: Reservados todos os dereitos. Queda prohibida a duplicación

total ou parcial desta obra, en calquera forma ou por calquera medio (electrónico,

mecánico, gravación, fotocopia ou outros) sen consentimento expreso por escrito da

autora.

3

1. DATOS DESCRITIVOS DA MATERIA

1.1. DATOS BÁSICOS

CÓDIGO G5041608

NOME DA MATERIA LINGÜÍSTICA COMPUTACIONAL

TITULACIÓN

Grao en Filoloxía Clásica

Grao en Lingua e Literatura Españolas

Grao en Lingua e Literatura Galegas

Grao en Lingua e Literatura Inglesas

Grao en Linguas e Literaturas Modernas

CARÁCTER

OBRIGATORIA EN MINOR DE LINGÜÍSTICA

OPTATIVA (nos demais casos)

Nº DE CRÉDITOS ECTS 6

1.2. REQUISITOS

Non se requiren coñecementos previos, máis aló da formación básica adquirida

ata este momento nas materias de contido lingüístico cursadas nos diferentes Graos; a

materia está planificada para que poida ser cursada por calquera estudante da

Facultade. Recoméndase que o estudantado posúa habilidades para a lectura (con

capacidade de síntese) e comprensión crítica da información recollida en diferentes

soportes.

Tamén convén posuír un nivel medio-alto de comprensión escrita das linguas

española, galega e inglesa, xa que os materiais de consulta recomendados así como os

empregados nas sesións de clase inclúen textos publicados nestes idiomas.

Por outra banda, debe terse moi en conta que para superar a materia, ademais de

acadar o nivel requirido en canto a contidos e prácticas, será requisito indispensable

L OCALIZACIÓN F ACULTADE DE F ILOLOXÍA

( Campus de Santiago)

4

amosar na realización das diferentes probas –orais e/ou escritas– un nivel de dominio

(exposición e argumentación, redacción e ortografía) conforme coa

situación académica do estudante.

Por último, recoméndase posuír coñecementos de informática a nivel de usuario e

manexo básico da rede Internet.

1.3. PROFESORA ENCARGADA DA MATERIA

Profesora: Ana Isabel Codesido García

Área de coñecemento: Lingüística Xeral

Departamento: Lingua e Literatura Españolas, Teoría da Literatura e Lingüística

Xeral

Lingua vehicular de docencia: galego

1.4. TITORÍAS: HORARIO, LUGAR E INFORMACIÓN DE CONTACTO

Horario: Fixado ao comezo do 2.º semestre

Lugar: Gabinete 122

Teléfono: 881 811 776

Enderezo electrónico: [email protected]

2. SENTIDO DA MATERIA

Lingüística Computacional forma parte do módulo “Lingüística e procesamento

das linguas. Aplicacións”. Este módulo pódese cursar como complementario ou como

optativo, combinado con calquera dos ofrecidos por outras áreas da Facultade de

Filoloxía en función dos intereses do alumnado. Para a obtención do “Minor en

Lingüística Xeral” deberá ser combinado co bloque de materias que conforman o módulo

“Linguas e comunicación. Aplicacións”.

Así pois, e tomando como base os obxectivos xenéricos do módulo no que se insire,

a materia Lingüística Computacional introduce os estudantes nos fundamentos da

utilización de ordenadores no estudo e coñecemento das linguas, salientando a

pertinencia dos instrumentos informáticos no traballo con bases inxentes de datos

lingüísticos reais e a súa incidencia no procesamento automático destes. O sentido global

desta materia é completar a formación académica dos estudantes

5

proporcionándolles coñecementos transdisciplinares básicos relacionados cos novos

perfís profesionais demandados na sociedade actual. Deste xeito, e adoptando unha

orientación resolutiva, reflexionaremos ademais sobre a presenza das TIC nos eidos da

comunicación e das linguas, ben no ámbito propiamente da Lingüística, ben no da

Literatura, Teoría literaria, creación ou investigación filolóxica.

3. OBXECTIVOS DA MATERIA

A evolución do contexto socioeconómico nos últimos anos, prestando atención

preferente aos cambios producidos no mundo laboral nos seus diferentes aspectos e

manifestacións, xunto coas esixencias e necesidades de capacitación profesional que a

sociedade actual poida demandar dos futuros graduados, foron referente obrigado á hora

de establecérense os obxectivos da materia Lingüística computacional. Os moitos e

variados perfís profesionais propostos nos Graos impartidos na Facultade de Filoloxía,

así como tamén as competencias xenéricas e específicas que o alumnado debe posuír

para a obtención da súa titulación constitúen, polo tanto, a base sobre a que se asentan

os obxectivos da materia que a continuación se expoñen e que deberan posibilitar aos

estudantes a adquisición de conceptos e recursos para:

• Desenvolver destrezas para abordar os múltiples problemas que presenta a

linguaxe natural para o seu tratamento computacional nos seus diferentes niveis,

atendendo de xeito integrado ás perspectivas lingüística, lóxica, matemática e

informática.

• Coñecer os diferentes modelos de procesamento computacional das linguas

naturais co fin de convertelas en linguaxes automáticas.

• Achegarse aos métodos e ferramentas de traballo empírico da Lingüística actual

que permitan ao estudante manexar datos lingüísticos reais procedentes de

diversos corpus para o seu posterior tratamento informático e computacional.

• Coñecer os recursos relacionados co tratamento computacional da linguaxe (bases

de datos, ferramentas de análise textual, programas de tradución automática,

sistemas de ditado automático, etc.).

6

• Analizar estes recursos e os resultados obtidos a partir do seu manexo e aplicación

co fin de poder valoralos criticamente de acordo cos coñecementos teóricos e

metodolóxicos adquiridos.

4. COMPETENCIAS

Ademais das competencias xerais propias dos estudos universitarios e

especificadas nos títulos de Grao, os estudantes desta materia deberan acadar as

seguintes competencias específicas:

4.1.1.Competencias disciplinares cognitivas (saber)

(1) Capacidade de reflexión crítica sobre as relacións entre as linguas e as novas

tecnoloxías.

(2) Adquisición das bases teórico-metodolóxicas da Lingüística Computacional.

(3) Coñecemento das ferramentas, aplicacións e recursos de natureza diversa

desenvolvidas por e para o estudo computacional das linguas.

(4) Comprensión, avaliación e aproveitamento destas ferramentas e recursos.

4.1.2. Competencias profesionais procedimentais (saber facer)

(1) Manexo eficaz dos recursos técnicos sobre linguas e comunicación –incluídos os

accesibles en liña– en particular os orientados á investigación e á formación en

ámbitos lingüísticos, literarios, de creación ou de investigación filolóxica.

(2) Capacidade para poñer en práctica algúns dos coñecementos adquiridos en

ámbitos como: tradución automática, confección e explotación de corpora lingüísticos, e

recoñecemento e síntese de fala.

4.1.3. Competencias académicas actitudinais (ser)

(1) Capacidade para poñer en relación as distintas disciplinas nas que se sustenta o

estudo computacional das linguas.

(2) Interese pola diversidade lingüística e cultural e sensibilidade na valoración das

súas repercusións no manexo e deseño de ferramentas computacionais para o estudo dos

fenómenos comunicativos.

7

(3) Capacidade para analizar, valorar e promover as aplicacións técnicas de

comunicación multimodal naqueles casos de trastornos comunicativos derivados de

lesións motoras e/ou sensoriais.

(4) Desenvolvemento dunha actitude crítica perante o manexo e xestión das TIC e da

Internet nos ámbitos académico, investigador e profesional.

5. CONTIDOS DA MATERIA

5.1. TEMARIO

TEMA 1. Lingüística Computacional: evolución historiográfica e principais liñas de

investigación.

TEMA 2. Utilidades informáticas en Lingüística e desenvolvementos da Lingüística de

Corpus como metodoloxía de base empírica.

TEMA 3. Procesamento da linguaxe natural e Tradución automática.

TEMA 4. Tratamento da lingua –falada e escrita– e desenvolvemento de produtos

comerciais: lingüística e tecnoloxía.

5.2. BIBLIOGRAFÍA

5.2.1. RECURSOS XERAIS: DICIONARIOS, PANORÁMICAS E ENCICLOPEDIAS DE

LINGÜÍSTICA COMPUTACIONAL

AGUADO, G. (1993), Diccionario comentado de terminología informática, Madrid:

Paraninfo.

BAKER, P., A. HARDIE & T. MCENERY (2006), A glossary of corpus linguistics, Edinburgh:

E.U.P.

DALE, R., H. MUYSI & H. SOMERS (eds.) (2000), Handbook of Natural Language

Processing, New York/Basilea: Marcel Dekker, Inc.

INDURKHYA, N. & F.J. DAMERAU (eds.) (2010), Handbook of Natural Language

Processing, Boca Ratón, CRC.

LÜDELING, A. & M. KYTÖ (eds.) (2008), Corpus linguistics: an international handbook.

Vol. 1, Berlin/NY: Mouton de Gruyter.

LÜDELING, A. & M. KYTÖ (eds.) (2009), Corpus linguistics: an international handbook.

Vol. 2, Berlin/NY: Mouton de Gruyter.

8

MARCOS MARÍN, F. (1994), Informática y Humanidades, Madrid: Gredos.

MARTÍ, M.ª A. (coord.) (2003), Tecnologías del lenguaje, Barcelona: UOC.

MITKOV, R. (ed.) (2003), The Oxford Handbook of Computational Linguistics, Oxford:

O.U.P.

O'KEEFFE, A. & M. MCCARTHY (eds.) (2010), The Routledge Handbook of Corpus

Linguistics, London: Routledge.

WILSON, R.A. & F. C. KEIL (eds.) (2002), Enciclopedia MIT de ciencias cognitivas, Madrid:

Síntesis.

5.2.2. INTRODUCIÓNS Á LINGÜÍSTICA COMPUTACIONAL

BARNBROOK, G. (1996), Language and Computers. A Practical Introduction to the

Computer Analysis of Language, Edinburgh: E.U.P.

CHIARI, I. (2007), Introduzione alla linguistica computazionale, Roma: Laterza.

GÓMEZ GUINOVART, J. (1998) "Fundamentos de lingüística computacional: bases

teóricas, líneas de investigación y aplicaciones", en P. Cid & J. Baró (eds.) Anuario

SOCADI de Documentación e Información 1998, Barcelona: Societat Catalana de

Documentació i Informació, 135-146.

GÓMEZ GUINOVART, J. & M. PALOMAR (coords.) (1998), Monografía: Lengua y Tecnologías

de la Información. Novática, Revista de la Asociación de Técnicos de Informática,

133 (Mayo-Junio), 3-45.

GÓMEZ GUINOVART, X. (2000), “Lingüística computacional”, en F. Ramallo, G. ReiDoval

& X.P. Rodríguez Yáñez (eds.), Manual de Ciencias da Linguaxe, Vigo: Xerais,

221-286. [http://webs.uvigo.es/sli/arquivos/xerais.pdf]

GOMEZ GUINOVART, X. et al. (eds.) (1999), Panorama de la investigación en lingüística

informática. Monografía de Revista Española de Lingüística Aplicada.

GRISHMAN, R. (1986). Computational Linguistics, Cambridge: C.U.P. [Trad. esp. A.

Moreno Sandoval (1991), Introducción a la lingüística computacional, Madrid:

Visor]

HAUSSER, R. (2001 [1999]): Foundations of Computational Linguistics: HumanComputer

Communication in Natural Language, 2ª ed., revisada y ampliada, Berlin:

Springer-Verlag.

9

KAWAGUCHI, Y. et al. (2005), Linguistic informatics: state of the art and the future,

Amsterdam/Philadelphia: John Benjamins.

LAVID, J. (2005), Lenguaje y nuevas tecnologías: nuevas perspectivas, métodos y

herramientas para el lingüista del siglo XXI, Madrid: Cátedra.

LAWLER, J. & H. ARISTAR DRY (eds.) (1998): Using Computers in Linguistics. A Practical

Guide, London/New York: Routledge.

LLISTERRI, J. (2003), "Lingüística y tecnologías del lenguaje", Lynx. Panorámica de

Estudios Lingüísticos, 2, 9-71

[http://liceu.uab.cat/~joaquim/publicacions/Llisterri_03_Linguistica_Tecnologias

_Lenguaje.pdf]

MARTÍ, M.ª A. & I. CASTELLÓN (2001), La lingüística computacional, Barcelona:

Edicions Universitat de Barcelona.

MORENO SANDOVAL, A. (1998), Lingüística computacional, Madrid: Síntesis.

MOURE, T. & J. LLISTERRI (1996), “Lenguaje y nuevas tecnologías: el campo de la

lingüística computacional”, en M. Fernández Pérez (coord.) (1996), Avances en

Lingüística Aplicada, Santiago: Servicio de Publicacións. USC, 147-227.

[http://liceu.uab.es/~joaquim/publicacions/Llisterri_Moure_96_Linguistica_Com

putacional.pdf]

TOMASI, F. (2009), Metodologie informatiche e discipline umanistiche, Roma: Carocci.

TORDERA, J.C. (2012), El abecé de la Lingüística computacional, Madrid: Arco/Libros.

5.2.3. OUTRAS REFERENCIAS DE INTERESE (AGRUPADAS POR ÁMBITOS)

5.2.3.1. Lingüística de corpus

BARLOW, M. (2001), “Corpus linguistics and theoretical linguistics”, International

Journal of Computational Linguistics, 16:1, 3-44.

KAWAGUCHI, Y. et al. (2007), Corpus-based perspectives in Linguistics,

Amsterdam/Philadelphia, PA: John Benjamins.

LLISTERRI, J. et al. (2005), "Corpus orales para el desarrollo de las tecnologías del

habla en español", Oralia. Análisis del discurso oral, 8, 289-325.

MCENERY, T. & A. WILSON (1996, 20012), Corpus Linguistics: an introduction,

Edinburgh: E.U.P.

[http://www.lancs.ac.uk/fss/courses/ling/corpus/CONTENTS.HTM]

10

MCENERY, T. & A. HARDIE (2011). Corpus linguistics: Method, theory and practice.

Cambridge: C.U.P..

MCENERY, T., R. XIAO & Y. TONO (2006): Corpus-Based Language Studies: an advanced

resource book, London/New York: Routledge.

PARODI, G. (2010), Lingüística de Corpus: de la teoría a la empiria, Madrid:

Iberoamericana.

SARDINHA, T. B. (2004), Lingüística de Corpus, Barueri-São Paulo: Manole.

TEUBERT, W. & R. KRISHNAMURTHY (eds.) (2007), Corpus linguistics: critical concepts in

linguistics, London: Routledge.

TORRUELLA, J. (2017), Lingüística de corpus: génesis y bases metodológicas de los

corpus (históricos) para la investigación en Lingüística, Frankfurt am Main:

Peter Lang.

WILSON, A., P. RAYSON & T. MCENERY (eds.) (2003), A rainbow of corpora: corpus

linguistics and the language of the world, München: Lincom.

WYNNE, M. (ed.) (2005), Developing Linguistic Corpora: a Guide to Good Practice,

Oxford: Oxbow Books [http://www.ahds.ac.uk/creating/guides/linguistic-

corpora/index.htm]

5.2.3.2. Procesamento da linguaxe natural e Tradución automática

COLEMAN, J. (2005), Introducing Speech and Language Processing,

Cambridge/NewYork: C.U.P.

HOCKEY, S. (2001), Electronic texts in the humanities. Principles and practices, Oxford:

O.U.P.

HUTCHINS, W. J. (1986): Machine translation: past, present, future, Chichester, Ellis

Horwood: Ellis Horwood Series in Computers and their Applications.

[http://www.hutchinsweb.me.uk/PPF-TOC.htm]

HUTCHINS, W.J. & H.L. SOMERS (1995), Introducción a la traducción automática,

Madrid: Visor.

HUTCHINS, W.J. (2005), Publications on machine translation, computer-based

translation technologies, linguistics and other topics [dispoñíbel en

http://www.hutchinsweb.me.uk]

11

JURAFSKY, D. & J. H. MARTIN (20092), Speech and Language Processing. An Introduction

to Natural Language Processing, Computational Linguistics and Speech

Recognition, Upper Saddle River, NJ: Pearson Prentice Hall.

MARTÍ, M.ª A. & J. LLISTERRI (eds.) (2002), Tratamiento del lenguaje natural: tecnología

de la lengua oral y escrita, Soria/Barcelona: Fundación Duques de Soria/Edicions

Universitat de Barcelona.

MARTÍ, M.ª A. & J. LLISTERRI (eds.) (2004), Tecnologías del texto y del habla, Barcelona:

Edicions Universitat de Barcelona.

MORENO, L. et al. (1999), Introducción al procesamiento del lenguaje natural, Alacant:

Universitat de Alacant.

NIRENBURG, S. (ed.) (1987), Machine Translation. Theoretical and Methodological

Issues, Cambridge: C.U.P.

OLIVER, A., J. MORÉ & S. CLIMENT (coords.) (2007), Traducción y tecnologías, Barcelona:

Editorial UOC.

OLIVER, A. (2016), Herramientas tecnológicas para traductores, Barcelona: Editorial

UOC.

TORDERA, J.C. (2011), Lingüística computacional. Análisis, generación y traducción

automática (Anexo 20 de Lynx), València: Universitat de València.

TORDERA, J.C. (2011), “Puentes entre la lingüística computacional y la psicolingüística”,

Revista de Lingüística y Lenguas Aplicadas, 6, 341-352.

[https://polipapers.upv.es/index.php/rdlyla/article/view/914/984]

5.2.3.3. Tecnoloxías lingüísticas

AGUILERA, S. et al. (2001), “Aplicaciones sociales de las tecnologías de la lengua”, Quark.

Ciencia, Medicina, Comunicación y Cultura, 21, 90-94.

[http://www.prbb.org/quark/21/021090.htm]

CAL, M., P. NÚÑEZ & I. PALACIOS (eds.) (2005), Nuevas tecnologías en lingüística,

traducción y enseñanza de lenguas, Santiago de Compostela: Universidade de

Santiago de Compostela, Servizo de Publicacións e Intercambio Científico.

COLE, R. A. et al. (eds.) (1997), Survey of the State of the Art in Human Language

Technology, Cambridge: C.U.P. [http://www.dfki.de/~hansu/HLT-Survey.pdf]

12

LLISTERRI, J. (2003), "Las tecnologías del habla: Entre la ingeniería y la lingüística", en

Actas del Congreso Internacional ‘La ciencia ante el público. Cultura humanista y

desarrollo científico tecnológico’, Salamanca: Instituto Universitario de Estudios

de la Ciencia y la Tecnología, 44-67. [Ed. en CD_ROM]

[http://liceu.uab.es/~joaquim/publicacions/Llisterri_03_Tecnologias_Habla_Inge

nieria_Linguistica.pdf]

LLISTERRI, J. (2006), "Introducción a los sistemas de diálogo", en J. Llisterri & M.J.

Machuca (eds.) Los sistemas de diálogo, Bellaterra-Soria: UAB, Servei de

Publicacions - Fundación Duques de Soria (Manuals de la UAB, Lingüística,

45), 11-21.

[http://liceu.uab.cat/~joaquim/publicacions/Llisterri_06_Sistemas_Dialogo.pdf]

MARTÍ, M.ª A. et al. (2004), “Tecnologies de la llengua i las seves aplicacions”, Revista

Gallega de Filología, 5, 107-139.

MARTÍ, M.ª A. & J. LLISTERRI (2001), “La ingeniería lingüística en la sociedad de la

información”, Digithum, 3.

https://digithum.uoc.edu/articles/abstract/10.7238/d.v0i3.595/]

SIEMENS, R. & S. SCHREIBMAN (eds.) (2007), A companion to digital literary studies,

Malden: Blackwell.

TORDERA, J.C. (2011), Linguistica computacional. Tecnologias del habla. València:

Universitat de València.

VARILE, G. & A. ZAMPOLLI (eds.) (1997), Survey of the State of the Art in Human

Language Technology, Cambridge: C.U.P.

VIDAL BENEYTO, J. (dir.) (1991), Las industrias de la lengua, Madrid: Fundación Sánchez

Ruipérez / Pirámide.

13

5.3. ESTRUTURA DETALLADA DO TEMARIO (SESIÓNS EXPOSITIVAS, INTERACTIVAS E

TITORÍAS)

TEMA 1. Lingüística Computacional: evolución historiográfica e principais

liñas de investigación.

OBXECTIVOS: presentar ao estudantado argumentos que xustifiquen a necesidade do

deseño e posterior manexo de diversas ferramentas informáticas nas investigacións

lingüísticas a partir da reflexión sobre posibles problemas reais derivados do uso das

linguas e que piden solución.

CONTIDOS

1. Introdución ao campo da Lingüística Computacional: evolución

historiográfica e principais liñas de investigación.

1.1. Lingüística e Informática; Lingüística e Intelixencia artificial.

1.2. A Lingüística Computacional no seo da Lingüística aplicada: caracterización e

historiografía

2. O carácter transdisciplinar da Lingüística Computacional: vertentes de

estudo

2.1. Lingüística informática: ferramentas de manipulación e análise de datos, dicionarios

automáticos, deseño e explotación de corpus lingüísticos.

2.2. Procesamento da linguaxe natural e tradución automática.

2.3. Tecnoloxías (do texto e da fala) e Industrias da lingua.

BIBLIOGRAFÍA BÁSICA

MORENO FERNÁNDEZ, F. (1990), “Lingüística informática e informática lingüística”,

Lingüística Española Actual, 12/1, 5-16.

MOURE, T. & J. LLISTERRI (1996), “Lenguaje y nuevas tecnologías. El campo de la

lingüística computacional”, en M. Fernández Pérez (coord.), Avances en

Lingüística Aplicada, Santiago: Servicio de Publicacións. Universidade de

Santiago de Compostela, 147-227 (aptdos. 1, 3.2.1.1. e 5).

ROJO, G. (2005-2006), “Informática y Lingüística: Las lenguas en la sociedad del

14

conocimiento”, Boletín de RedIRIS, 74-75.

[http://www.rediris.es/rediris/boletin/74-75/ponencia1.pdf]

BIBLIOGRAFÍA COMPLEMENTARIA

ARES, F. (2008), El robot enamorado. Una historia de la Inteligencia Artificial,

Barcelona: Ariel. [caps. 7 e 11]

LAHOZ-BELTRÁ, R. (2005), Turing. Del primer ordenador a la inteligencia artificial,

Madrid: Nivola.

MCCARTHY, J. (2007), What is Artificial Intelligence?

[http://www-formal.stanford.edu/jmc/whatisai/]

MORENO SANDOVAL, A. (1998), Lingüística computacional, Madrid: Síntesis. [caps. 1 e 2]

MORENO SANDOVAL, A. (2016), “Lingüística Computacional”, en J. Gutiérrez-Rexach

(ed.) Enciclopedia de Lingüística Hispánica, Vol. 1, London: Routledge, 204-215.

SINCLAIR, J. (2001), Corpus, Concordance, Collocation, Oxford: O.U.P.

VIDAL, J. & J. BUSQUETS (1996), “Lingüística computacional”, en C. Martín Vide (ed.),

Elementos de Lingüística, Barcelona: Octaedro Universidad, 392-446.

ORGANIZACIÓN DAS SESIÓNS EXPOSITIVAS E INTERACTIVAS

- 3 sesións expositivas nas que se desenvolverán as seguintes actividades:

• explicación dos contidos do tema

• discusión de lecturas obrigatorias

- 3 sesións seminario:

• (1.1.) Presentación e organización da materia: explicación do contido de

seminarios e titorías así como tamén da maneira como se vai avaliar o traballo

dos estudantes.

• (1.2.) Traballo de discusión (en pequeno grupo) baseado en material diverso sobre

o ámbito de estudo da Lingüística Computacional: problemas de delimitación da

disciplina, distintas aproximacións segundo vertentes, cuestións

terminolóxicas.

• (1.3.) Posta en común e análise de diferentes tipos de materiais relacionados co

campo da Intelixencia Artificial.

15

TEMA 2. Utilidades informáticas en Lingüística e desenvolvementos da

Lingüística de corpus como metodoloxía de base empírica.

OBXECTIVOS: presentar aos estudantes a utilización instrumental da informática

naqueles estudos de corte lingüístico caracterizados polo manexo cuantitativo dos datos.

Insistirase en considerar o ordenador como ferramenta que dinamiza e economiza o

traballo con grandes bases de datos lingüísticos.

CONTIDOS

1. Introdución

1.1. Ubicación do campo da Lingüística informática dentro dos estudos en Lingüística

computacional.

1.2. Panorámica das utilidades informáticas en Lingüística.

2. Transcrición de interaccións comunicativas (o sistema CHILDES)

2.1. Linguaxe adulta (de interese para Pragmática, Análise do discurso, Dialectoloxía,

Sociolingüística, Ensino/Aprendizaxe de linguas, Planificación lingüística).

2.2. Linguaxe infantil (de interese para Psicolingüística evolutiva, Lingüística clínica,

Ensino/Aprendizaxe de linguas, Planificación lingüística). 3. Ferramentas de

manipulación e análise de datos

3.1. Índices e frecuencias.

3.2. Concordancias e colocacións.

4. Desenvolvementos da Lingüística de Corpus como metodoloxía de base

empírica:

4.1. Recursos, ferramentas e aplicacións en Lingüística computacional.

4.2. Tipos e utilidade dos corpus.

4.3. Procesos de enriquecimento e extracción de información dun corpus:

segmentación, análise, tipificación, etiquetado.

5. Lexicografía computacional:

5.1. Bancos de datos lexicográficos.

5.2. Dicionarios electrónicos.

16

BIBLIOGRAFÍA BÁSICA

MORENO SANDOVAL, A. (1998), Lingüística computacional, Madrid: Síntesis (28-29; 130-

141).

PARODI, G. (2008), “Lingüística de Corpus: una introducción al ámbito”, Revista de

Lingüística Teórica y Aplicada, 46/1, 93-119.

TORRUELLA, J. & J. LLISTERRI (1999), "Diseño de corpus textuales y orales", en J.M.

Blecua et al. (eds.) Filología e informática. Nuevas tecnologías en los estudios

filológicos. Barcelona: UAB / Milenio, 45-77.

[http://liceu.uab.cat/~joaquim/publicacions/Torruella_Llisterri_99.pdf]

BIBLIOGRAFÍA COMPLEMENTARIA

ABAITÚA, J. (2002), “Tratamiento de corpora bilingües”, en M.ª A. Martí & J. Llisterri

(eds.) (2002), Tratamiento del lenguaje natural: tecnología de la lengua oral y

escrita, Soria: Fundación Duques de Soria; Barcelona: Edicions Universitat de

Barcelona, 61-90.

ÁGUILA ESCOBAR, G. (2009), Los diccionarios electrónicos del español, Madrid:

Arco/Libros, S.L.

FERNÁNDEZ PÉREZ, M. (2011), Lingüística de corpus y adquisición de la lengua, Madrid:

Arco/Libros.

MOURE, T. & J. LLISTERRI (1996), “Lenguaje y nuevas tecnologías. El campo de la

lingüística computacional”, en M. Fernández Pérez (coord.) (1996), Avances en

Lingüística Aplicada, Santiago: Servicio de Publicacións. Universidade de

Santiago de Compostela, 147-227 (esp. 148, 151, 174-177; 151, 174-177; 198-202).

PRIETO, S., E. MOSQUEIRA & N. VÁZQUEZ (2009): “Córpora y enseñanza de lenguas: se

buscan colocaciones”, en P. Cantos & A. Sánchez (eds.), A Survey of Corpusbased

Research. Panorama de investigaciones basadas en corpus, AELINCO,

Murcia, 366-373.

[http://www.dicesp.com/app/webroot/files/file/Prieto%20et%20al_2009.pdf]

SINCLAIR, J. (2005), “Corpus and Text: Basic Principles”, en M. Wynne (ed.), Developing

Linguistic Corpora: a Guide to Good Practice, Oxford: Oxbow Books: 1-16.

[http://www.ahds.ac.uk/creating/guides/linguistic-corpora/chapter1.htm]

17

TEUBERT, W. (2005), “My version of corpus linguistics”, International Journal of Corpus

Linguistics, 10/1, 1-13.

VIDAL BENEYTO, J. (1991), Las industrias de la lengua, Madrid: Fundación Germán

Sánchez Ruipérez-Pirámide (caps. 3, 4, 5 e 8).

VINCZE, O., E. MOSQUEIRA & M. ALONSO (2011), "An online collocation dictionary of

Spanish", en I. Boguslavsky e L. Wanner (eds.), Proceedings of the 5th

International Conference on Meaning-Text Theory (Barcelona), 275-286.

[http://www.dicesp.com/app/webroot/files/file/MTT%202011%20Vincze%20et%20

al_.pdf]

ZULAICA HERNÁNDEZ, I. (2016), “Lingüística de Corpus”, en J. Gutiérrez-Rexach (ed.)

Enciclopedia de Lingüística Hispánica, Vol. 1, London: Routledge, 216-224.

ORGANIZACIÓN DAS SESIÓNS EXPOSITIVAS E INTERACTIVAS

- 5 sesións expositivas nas que se desenvolverán as seguintes actividades:

• explicación dos contidos do tema

• discusión de lecturas obrigatorias

• análise de supostos prácticos

- 5 sesións seminario nas que os estudantes realizarán coa profesora as seguintes

actividades:

• (2.1.) Revisión e análise dos diferentes tipos de ferramentas informáticas de

análise textual.

• (2.2.) Traballo con corpus (I): Actividades destinadas a familiarizar os estudantes

co manexo dos corpus lingüísticos informatizados e reflexionar sobre o seu valor

e utilidade (teórica e práctica).

• (2.3.) Traballo con corpus (II): posta en común e discusión de exercicios do

seminario 2.2.

• (2.4.) Traballo con corpus (III): posta en común e discusión de exercicios do

seminario 2.3.

• (2.5.) Actividades destinadas a familiarizar os estudantes co manexo de bancos

de datos lexicográficos e dicionarios electrónicos.

18

TEMA 3. Procesamento da linguaxe natural e Tradución automática.

OBXECTIVOS: introducir os estudantes no tratamento computacional das linguas

naturais a través da comprensión e comparación dos distintos modelos de procesamento

que nos permite convertelas en linguaxes automáticas.

CONTIDOS

1. Introdución

1.1. O tratamento computacional das linguas: do natural ao automático.

2. A tradución automática

2.1. Historiografía do ámbito da tradución automática.

2.2. Tradución automática fronte a tradución asistida por ordenador.

2.3. Clasificación dos sistemas de tradución automática: criterios e tipoloxía.

2.4. A tradución automática en liña.

3. Procesamento da linguaxe natural (oral e escrita)

3.1. Introdución ao procesamento da linguaxe natural. Os procesos de recoñecemento e

síntese. Os sistemas de diálogo.

3.2. Procesamento da linguaxe natural escrita: as tecnoloxías do texto.

3.3. Procesamento da linguaxe natural oral: as tecnoloxías da fala.

3.4. Aplicacións do procesamento da linguaxe natural: presente e futuro.

BIBLIOGRAFÍA BÁSICA

ALONSO, J.A. (2003), “La traducción automática”, en M.ª A. Martí (coord.), Tecnologías

del Lenguaje, Barcelona: UOC, 94-129.

PERIÑÁN, C. (2005), “Procesamiento del lenguaje natural: de lingüista a ingeniero del

conocimiento”, en I. K. Brady, M. Navarro & C. Periñán (eds.), Nuevas Tendencias en

Lingüística Aplicada, Murcia: Quaderna, 293-317.

RUIZ, J. C. (2005), “Lenguaje e informática/Lenguaje y ordenadores”, en Á. López & B.

Gallardo (eds.), Conocimiento y lenguaje, València: Universitat, 401-436.

19

BIBLIOGRAFÍA COMPLEMENTARIA

ABAITUA, J. (1997-2001), “Presente y futuro de la traducción automática”

[http://paginaspersonales.deusto.es/abaitua/konzeptu/ta/ta97.htm]

ADOLPHS, S. (2006), Introducing Electronic Text Analysis. A practical guide for language

and literary studies, London/New York: Routledge.

HUTCHINS, J. (2003), “Machine Translation: General Overview”, en R. Mitkov, (ed.) The

Oxford Handbook of Computational Linguistics. New York/Oxford: O.U.P., 501-

511.

LLISTERRI, J. (2006), "Introducción a los sistemas de diálogo", en J. Llisterri & M.J.

Machuca (eds.), Los sistemas de diálogo, Bellaterra - Soria: UAB, Servei de

Publicacions-Fundación Duques de Soria (Manuals de la UAB, Lingüística, 45),

11-21. [http://liceu.uab.cat/~joaquim/publicacions/Llisterri_06_Sistemas_Dialogo.pdf]

MORENO, L. & MOLINA, A. (1999): “Preliminares y tendencias en el Procesamiento del

Lenguaje Natural”, Inteligencia Artificial, 3/7, 65-76.

MOURE, T. & J. LLISTERRI (1996), “Lenguaje y nuevas tecnologías. El campo de la

lingüística computacional”, en M. Fernández Pérez (coord.) (1996), Avances en

Lingüística Aplicada, Santiago: Servicio de Publicacións. Universidade de

Santiago de Compostela, 147-227 (esp. para PLN: §3 (3.1.1., 3.1.2., 3.1.5.; 3.2.2.;

3.2.3.) e para TA: §3 (3.2.1.))

OLIVER, A. (2006), “La traducció automàtica a Internet”, Revista Tradumàtica -

Traducció i Tecnologies de la Informació i la Comunicació. 04: La Traducció

Automàtica.

https://ddd.uab.cat/pub/tradumatica/15787559n4/15787559n4a7.pdf

VALLEZ, M. & R. PEDRAZA-JIMÉNEZ (2007), “El Procesamiento del Lenguaje Natural en

la Recuperación de Información Textual y áreas afines”, Hipertext.net, 5

[http://www.hipertext.net]

ORGANIZACIÓN DAS SESIÓNS EXPOSITIVAS E INTERACTIVAS

- 5 sesións expositivas nas que se desenvolverán as seguintes actividades:

• explicación dos contidos do tema

20

• discusión de lecturas obrigatorias

• análise de supostos prácticos

- 5 sesións seminario nas que os estudantes realizarán coa profesora:

• (3.1. e 3.2.) Tradución automática (I): Actividades destinadas a familiarizar os

estudantes cos sistemas de TA e reflexionar sobre o seu valor e utilidade (teórica

e práctica).

• (3.3.) Tradución automática (II): Actividades de aplicación de métodos e

estratexias para valorar as traducións automáticas en liña.

• (3.4. e 3.5.) Procesamento da linguaxe natural: posta en común e análise de

diferentes tipos de programas de PLN aplicados a diferentes linguas e

compoñentes destas.

TEMA 4. Tratamento da lingua –falada e escrita– e desenvolvemento de

produtos comerciais: lingüística e tecnoloxía.

OBXECTIVOS: presentar ao estudantado dous terreos que se relacionan na medida en

que un deles, o das chamadas Tecnoloxías da fala, céntrase no deseño de procedementos

variados que permiten a comunicación natural entre persoas e máquinas mediante a

fala, en tanto que o outro, o das Industrias lingüísticas, engloba unha serie de produtos

e aplicacións enfocadas dende e cara á vertente escrita.

CONTIDOS

1. Introdución

1.1. Situación do campo das Tecnoloxías e Industrias lingüísticas no seo da

Lingüística Computacional. Relación destas dúas vertentes cos eidos da

Tecnoloxía de

comunicacións e da Enxeñaría lingüística.

1.2. Panorámica actualizada das vertentes de aplicación en Tecnoloxías da fala e

Industrias da lingua.

2. Tecnoloxías da fala

2.1. Introdución.

21

2.2. Aplicacións: Síntese da fala, Recoñecemento da fala. Tradución oral

automática,.

Identificación e/ou verificación da identidade dos interlocutores.

2.4. Sistemas de diálogo persoa-máquina.

3. Industrias da lingua

3.1. Introdución.

3.2. Aplicacións: Conversión de texto a fala; ditado automático; recuperación,

procura e extracción de información; produción asistida por ordenador (PAO)

e edición electrónica, e produtos multimedia; tradución automática e asistida;

correctores (ortográficos, gramaticais e estilísticos) e verificadores; tesauros

e dicionarios electrónicos; tratamento multilingüe de textos; ELAO (Ensino

de Linguas Asistido por Ordenador); aplicacións da Enxeñaría lingüística á

axuda a discapacitados (tratamento da escritura, lectura óptica, sistemas

alternativos de comunicación), Tecnoloxía e xestión do multilingüismo.

BIBLIOGRAFÍA BÁSICA

LLISTERRI, J. et al. (2003), “El papel de la lingüística en el desarrollo de las tecnologías

del habla”, en M. Casas (dir.) & C. Varo (ed.), VII Jornadas de Lingüística, Cádiz:

Servicio de Publicaciones Universidad de Cádiz, 137-191.

LLISTERRI, J. (2007), "El español y las nuevas tecnologías", en M. Lacorte (ed.)

Lingüística aplicada del español. Madrid: Arco/Libros (Biblioteca Philologica),

483-520.

MOURE, T. & J. LLISTERRI (1996), “Lenguaje y nuevas tecnologías: el campo de la

lingüística computacional”, en M. Fernández Pérez (coord.) (1996), Avances en

Lingüística Aplicada, Santiago: Servicio de Publicacións. Universidade de

Santiago, 147-227. (esp. §§ 1.1.3, 1.1.4, 2, 3.2.5, 4).

BIBLIOGRAFÍA COMPLEMENTARIA

ABRIL, D., C. DELGADO & Á. Vigara (2009), Comunicación Aumentativa y Alternativa.

Guía de referencia, Madrid: CEAPAT

[http://sid.usal.es/idocs/F8/FDO21102/com_aumentativa.pdf].

22

LLISTERRI, J. et al. (2005), “Corpus orales para el desarrollo de las tecnologías del habla

en español”, Oralia. Análisis del discurso oral, 8, 289-325.

[http://liceu.uab.es/~joaquim/publicacions/Llisterri_Machuca_Mota_Riera_Rios_05_Cor

pus_Orales_Tecnologias_Habla_Espanol.pdf]

LLISTERRI, J. (2009), “Las tecnologías del habla en las lenguas románicas ibéricas”,

Studies in Hispanic and Lusophone Linguistics, 2 (1), 133-180.

[http://liceu.uab.cat/~joaquim/publicacions/Llisterri_09_Tecnologias_Habla_Len

guas_Romanicas_Ibericas.pdf]

MARTÍ, M.ª A. (2003) (coord.), Tecnologías del Lenguaje, Barcelona: UOC.

MARTÍ, M.ª A. (2009) “Llengües minoritzades i tecnologia lingüística: perspectives de

futur”, Llengua, Societat i Comunicació, 7

[http://revistes.ub.edu/index.php/LSC/issue/view/268]

VIDAL VILLALBA, J. & J. BUSQUETS RIGAT (1996), “Lingüística computacional”, en C.

Martín Vide (ed.) (1996), Elementos de lingüística, Barcelona: Octaedro, 393-446

(esp. §§ 3.1, 4.1, 4.2, 4.3, 4.5, 4.6, 5)

ORGANIZACIÓN DAS SESIÓNS EXPOSITIVAS E INTERACTIVAS

- 3 sesións expositivas nas que se desenvolverán as seguintes actividades:

• explicación dos contidos do tema

• discusión de lecturas obrigatorias

• análise de supostos prácticos

- 3 sesións seminario nas que se levará a cabo, coa supervisión da profesora, unha

actividade individual na que o estudante debe escoller unha das posibles aplicacións

das tecnoloxías lingüísticas e, conxugando as pesquisas na Internet coa revisión

dalgunhas lecturas propostas, preparar un traballo que ha de ser exposto no seminario

3.3. (Cfr. Aptdo. 6 desta Guía).

TITORÍAS PROGRAMADAS

A profesora desenvolverá as seguintes titorías en grupos reducidos:

TITORÍA 1 (1.ª quenda de febreiro): organización dos grupos, distribución das lecturas

e orientacións para a realización dos traballos relacionados cos temas 2 e 3.

23

TITORÍA 2 (2.ª quenda de abril): revisión e orientación da elaboración dos traballos en

curso.

6. METODOLOXÍA

Nesta materia adoptaremos unha metodoloxía de ensino presencial que garanta a

interacción entre a profesora e o alumnado sen que isto supoña minusvalorar o proceso

de aprendizaxe autónoma. Así, o curso de Lingüística Computacional desenvolverase a

través das clases presenciais (3 h. semanais) e do traballo persoal dos estudantes en

horas non presenciais (estudo do temario a través das lecturas e

preparación dos exercicios de aplicación).

As clases presenciais serán de tres tipos:

1. Sesións expositivas (1 hora), nas que a profesora proporcionará a información

teórica básica dos temas do programa, reforzada coa presentación de diversos materiais

representativos dos conceptos estudados. Máis concretamente, asignamos a cada tema

desta materia unha serie de lecturas obrigatorias que presentan con claridade os

contidos teórico-prácticos sobre o procesamento lingüístico e as súas aplicacións

informáticas.

2. Sesións seminario (2 horas), dedicadas, dun lado, á posta en común e discusión

das lecturas obrigatorias do programa para comprobar a asimiliación dos contidos e,

doutro, á presentación e avaliación dos exercicios de aplicación propostos.

3. Titorías programadas (hora e media) en grupos reducidos co obxectivo de guiar

o traballo autónomo dos estudantes.

Como complemento das sesións expositivas e interactivas, habilitarase unha aula

virtual que se utilizará para o depósito dos materiais dixitais que a profesora vaia

disponibilizando ao longo do curso e para difundir calquera tipo de información.

Os exercicios de aplicación que os estudantes elaborarán nas horas non presenciais

responderán aos seguintes tipos:

a) Resposta a cuestións breves relacionadas co contido dos temas, que

obriguen a enfrontarse cos aspectos de máis difícil comprensión para aclarar as

24

posibles dúbidas ou que sirvan de aplicación práctica de conceptos explicados nas

sesións expositivas.

b) Revisión crítica de distintas fontes documentais relacionadas cos

contidos da materia.

Tamén elaborarán un traballo sobre algunha das aplicacións existentes no terreo

das tecnoloxías lingüísticas (estudadas ao longo de todo o curso e dun xeito máis

específico no Tema 4), que debera será presentado nas últimas sesións do curso. Se ben

todos os detalles deste tipo de proba serán presentados pola profesora ao comezo do

semestre, os estudantes deberán ser quen de demostrar a asimilación dos contidos e o

dominio das destrezas que contribúan ao desenvolvemento de competencias

profesionais a través da redacción dun proxecto persoal que non só estimule a reflexión

crítica sobre o material estudado, senón que ademais esixa a necesidade de tomar

decisións motivadas, anticipe problemas potenciais e propoña posibles solucións desde

a perspectiva da Lingüística Computacional.

7. DISTRIBUCIÓN DA CARGA ECTS. CRONOGRAMA DO CURSO ACADÉMICO 2019-2020

Tendo en conta o calendario oficial aprobado pola USC, a distribución temporal da

materia ao longo do semestre queda como segue:

7.1. DISTRIBUCIÓN DA CARGA ECTS

TIPO DE SESIÓN HORAS

PRESENCIAIS

HORAS NO

PRESENCIAIS

HORAS TOTAIS

EXPOSITIVAS 12 68 80

SEMINARIO 28 36 64

TIUTORÍAS GRUPO 3 3 6

TOTAL 43 107 150

7.2. CRONOGRAMA DO CURSO ACADÉMICO 2019-2020

TEMAS TEMA 1 TEMA 2 TEMA 3 TEMA 4

PERIODO xan/febr febr/marzo marzo/abril abril/maio

25

SESIÓNS

EXPOSITIVAS 2 x 60’ 4 x 60’ 4 x 60’ 3 x 60’

SESIÓNS

SEMINARIO 2 x 120’ 5 x 120’ 4 x 120’ 3 x 120’

TITORÍAS

PROGRAMADAS 1 x 90’ --- --- 1 x 90’

8. AVALIACIÓN

1ª OPORTUNIDADE: Ao comezo do cuadrimestre, o estudante poderá escoller entre

estas dúas opcións de avaliación:

1) Exame final -de toda a materia- que incluirá cuestións teóricas e prácticas

(correspondentes ás sesións expositivas e ás sesións interactivas) e que se

realizará na aula de informática na data establecida pola Secretaría da

Facultade (22/05/2019).

2) Avaliación continuada:

• un 50% da cualificación corresponderá, ademais de á asistencia regular,

ás actividades e exercicios realizados e/ou programados nas sesións expositivas e

interactivas;

• un 50% corresponderá á elaboración e presentación (oral e escrita) dun

proxecto persoal.

Os aspectos, criterios e instrumentos de avaliación aparecen reflectidos a continuación:

ASPECTO

Asistencia, participación e aproveitamento das clases presenciais

CRITERIOS

- Participación activa nas clases

- Calidade científica dos traballos: asimilación de contidos, comprensión dos textos,

análises e interpretacións adecuadas

INSTRUMENTO

- Traballos entregados e/ou expostos nos seminarios e nas titorías programadas

VALOR

- 50%

26

ASPECTO

Conceptos, métodos e ferramentas aprendidos durante todo o curso

CRITERIOS

- Dominio dos coñecementos teóricos e operativos da materia

- Aproveitamento das lecturas

- Calidade científica dos traballos

INSTRUMENTO

- Presentación oral e entrega por escrito dun proxecto persoal.

VALOR

- 50%

2ª OPORTUNIDADE: Efectuarase exclusivamente a través dun exame final que

incluirá cuestións teóricas e prácticas (correspondentes ás sesións expositivas e ás

sesións interactivas). Este exame realizarase na aula de informática na data

establecida pola Secretaría da Facultade (04/07/2019).

ESTUDANTES CON DISPENSA DE ASISTENCIA A CLASE

Os estudantes que teñan concedida polo Decanato a dispensa de asistencia a clase e,

polo tanto, non poidan seguir a avaliación continuada, serán avaliados exclusivamente

a través dun exame final de toda a materia que poderán realizar tanto na primeira coma

na segunda oportunidade. Este exame realizarase na aula de informática nas datas

establecidas pola Secretaría da Facultade para cada unha das oportunidades

(22/05/2019 || 04/07/2019).

27

1. Datos descriptivos de la materia

1.1. DATOS BÁSICOS

CÓDIGO G5041608

NOMBRE DE LA MATERIA LINGÜÍSTICA COMPUTACIONAL

TITULACIÓN

Grado en Filología Clásica

Grado en Lengua y Literatura Españolas

Grado en Lengua y Literatura Gallegas

Grado en Lengua y Literatura Inglesas

Grado en Lenguas y Literaturas Modernas

CARÁCTER

OBLIGATORIA EN MINOR DE LINGÜÍSTICA

OPTATIVA (en los demás casos)

Nº DE CRÉDITOS ECTS 6

LOCALIZACIÓN

FACULTAD DE FILOLOGÍA

(Campus de Santiago)

1.2. REQUISITOS

No se requieren conocimientos previos, más allá de la formación básica adquirida

hasta este momento en las materias de contenido lingüístico cursadas en los diferentes

Grados; la materia está planificada para que pueda ser cursada por cualquier estudiante

de la Facultad. Se recomienda que el estudiantado posea habilidades para la lectura

(con capacidad de síntesis) y comprensión crítica de la información recogida en

diferentes soportes.

También conviene poseer un nivel medio-alto de comprensión escrita de las

lenguas española, gallega e inglesa, ya que los materiales de consulta recomendados así

como los empleados en las sesiones de clase incluyen textos publicados en estos

idiomas.

28

Por otra parte, debe tenerse muy en cuenta que para superar la materia, además

de alcanzar el nivel requerido en cuanto a contenidos y prácticas, será requisito

indispensable mostrar en la realización de las diferentes pruebas –orales y/o escritas–

un nivel de dominio (exposición y argumentación, redacción y ortografía)

acorde con la situación académica del estudiante.

Por último, se recomienda poseer conocimientos de informática a nivel de usuario

y manejo básico de la red Internet.

1.3. PROFESORA ENCARGADA DE LA MATERIA

Profesora: Ana Isabel Codesido García

Área de conocimiento: Lingüística General

Departamento: Lingua e Literatura Españolas, Teoría da Literatura e Lingüística

Xeral

Lengua vehicular de docencia: gallego

1.4. TUTORÍAS: HORARIO, LUGAR E INFORMACIÓN DE CONTACTO

Horario: Fijado al inicio del 2.º semestre

Lugar: despacho 122

Teléfono: 881 811 776

Correo electrónico: [email protected]

2. SENTIDO DE LA MATERIA

Lingüística Computacional forma parte del módulo “Lingüística y procesamiento

de las lenguas. Aplicaciones”. Este módulo se puede cursar como complementario o como

optativo, combinado con cualquiera de los ofertados por otras áreas de la Facultad de

Filología en función de los interéses del alumnado. Para la obtención del “Minor en

Lingüística General” deberá ser combinado con el bloque de materias que constituyen el

módulo “Lenguas y comunicación. Aplicaciones”.

Así pues, y tomando como base los objetivos genéricos del módulo en el que se

integra, la materia Lingüística Computacional introduce a los estudiantes en los

fundamentos de la utilización de ordenadores en el estudio y conocimiento de las

lenguas, destacando la pertinencia de los instrumentos informáticos en el trabajo con

29

bases ingentes de datos lingüísticos reales y su incidencia en el procesamiento

automático de los mismos. El sentido global de esta materia es completar la formación

académica de los estudiantes proporcionándoles conocimientos transdisciplinares

básicos relacionados con los nuevos perfiles profesionales demandados en la sociedad

actual. De este modo, y adoptando una orientación resolutiva, reflexionaremos además

sobre la presencia de las TIC en los terrenos de la comunicación y de las lenguas, bien

en el ámbito propiamente de la Lingüística, bien en el de la Literatura, Teoría literaria,

creación o investigación filológica.

3. OBJETIVOS DE LA MATERIA

La evolución del contexto socioeconómico en los últimos años, prestando atención

preferente a los cambios producidos en el mundo laboral en sus diferentes aspectos y

manifestaciones, junto con las exigencias y necesidads de capacitación profesional que

la sociedad actual pueda demandar de los futuros graduados, fueron referente obligado

a la hora de establecerse los objetivos de la materia Lingüística computacional. Los

muchos y variados perfiles profesionales propuestos en los Grados impartidos en la

Facultad de Filología, así como también las competencias genéricas y específicas que el

alumnado debe poseer para la obtención de su titulación constituyen, por tanto, la base

sobre la que se asientan los objetivos de la materia que a continuación se exponen y que

debieran posibilitar a los estudiantes la adquisición de

conceptos y recursos para:

• Desarrollar destrezas para abordar los diferentes problemas que presenta el

lenguaje natural para su tratamiento computacional en sus diferentes niveles,

atendiendo de modo integrado a las perspectivas lingüística, lógica, matemática

e informática.

• Conocer los diferentes modelos de procesamiento computacional de las lenguas

naturales con el fin de convertirlas en lenguajes automáticos.

• Acercarse a los métodos y herramientas de trabajo empírico de la Lingüística

actual que permitan al estudiante manejar datos lingüísticos reales procedentes

de diversos corpus para su posterior tratamiento informático y computacional.

30

• Conocer los recursos relacionados con el tratamiento computacional del lenguaje

(bases de datos, herramientas de análisis textual, programas de traducción

automática, sistemas de dictado automático, etc.).

• Analizar estos recursos y los resultados obtenidos a partir de su manejo y

aplicación con el fin de poder valorarlos críticamente de acuerdo con los

conocimientos teóricos y metodológicos adquiridos.

4. COMPETENCIAS

Además de las competencias generales propias de los estudios universitarios y

especificadas en los títulos de Grado, los estudiantes de esta materia deberan alcanzar

las siguientes competencias específicas:

4.1.1.Competencias disciplinares cognitivas (saber)

(1) Capacidad de reflexión crítica sobre las relaciones entre las lenguas y las nuevas

tecnologías.

(2) Adquisición de las bases teórico-metodológicas de la Lingüística Computacional.

(3) Conocimiento de las herramientas, aplicaciones y recursos de naturaleza diversa

desarrolladas por y para el estudio computacional de las lenguas.

(4) Comprensión, evaluación y aprovechamiento de estas herramientas y recursos.

4.1.2. Competencias profesionales procedimentales (saber hacer)

(1) Manejo eficaz de los recursos técnicos sobre lenguas y comunicación –incluidos

los accesibles en línea– en particular los orientados a la investigación y a la formación

en ámbitos lingüísticos, literarios, de creación o de investigación filológica.

(2) Capacidad para poner en práctica algunos de los conocimientos adquiridos en

ámbitos como: traducción automática, confección y explotación de corpus lingüísticos, y

reconocimiento y síntesis de habla.

4.1.3. Competencias académicas actitudinales (ser)

(1) Capacidad para poner en relación las distintas disciplinas en las que se sostiene

el estudio computacional de las lenguas.

31

(2) Interés por la diversidad lingüística y cultural y sensibilidad en la valoración de

sus repercusiones en el manejo y diseño de herramientas computacionales para el

estudio de los fenómenos comunicativos.

(3) Capacidad para analizar, valorar y promover las aplicaciones técnicas de

comunicación multimodal en aquellos casos de trastornos comunicativos derivados de

lesiones motoras y/o sensoriales.

(4) Desarrollo de una actitud crítica ante el manejo y la gestión de las TIC y de

Internet en los ámbitos académico, investigador y profesional.

5. CONTENIDOS DE LA MATERIA

5.1. TEMARIO

TEMA 1. Lingüística Computacional: evolución historiográfica y principales líneas de

investigación.

TEMA 2. Utilidades informáticas en Lingüística y desarrollos de la Lingüística de

Corpus como metodología de base empírica.

TEMA 3. Procesamiento del lenguaje natural y Traducción automática.

TEMA 4. Tratamiento de la lengua –hablada y escrita– y desarrollo de productos

comerciales: lingüística y tecnología.

5.2. BIBLIOGRAFÍA

5.2.1. RECURSOS GENERALES: DICCIONARIOS, PANORÁMICAS Y ENCICLOPEDIAS DE

LINGÜÍSTICA COMPUTACIONAL

AGUADO, G. (1993), Diccionario comentado de terminología informática, Madrid:

Paraninfo.

BAKER, P., A. HARDIE & T. MCENERY (2006), A glossary of corpus linguistics, Edinburgh:

E.U.P.

DALE, R., H. MUYSI & H. SOMERS (eds.) (2000), Handbook of Natural Language

Processing, New York/Basilea: Marcel Dekker, Inc.

INDURKHYA, N. & F.J. DAMERAU (eds.) (2010), Handbook of Natural Language

Processing, Boca Ratón, CRC.

LÜDELING, A. & M. KYTÖ (eds.) (2008), Corpus linguistics: an international handbook.

Vol. 1, Berlin/NY: Mouton de Gruyter.

32

LÜDELING, A. & M. KYTÖ (eds.) (2009), Corpus linguistics: an international handbook.

Vol. 2, Berlin/NY: Mouton de Gruyter.

MARCOS MARÍN, F. (1994), Informática y Humanidades, Madrid: Gredos.

MARTÍ, M.ª A. (coord.) (2003), Tecnologías del lenguaje, Barcelona: UOC.

MITKOV, R. (ed.) (2003), The Oxford Handbook of Computational Linguistics, Oxford:

O.U.P.

O'KEEFFE, A. & M. MCCARTHY (eds.) (2010), The Routledge Handbook of Corpus

Linguistics, London: Routledge.

WILSON, R.A. & F. C. KEIL (eds.) (2002), Enciclopedia MIT de ciencias cognitivas,

Madrid: Síntesis.

5.2.2. INTRODUCCIONES A LA LINGÜÍSTICA COMPUTACIONAL

BARNBROOK, G. (1996), Language and Computers. A Practical Introduction to the

Computer Analysis of Language, Edinburgh: E.U.P.

CHIARI, I. (2007), Introduzione alla linguistica computazionale, Roma: Laterza.

GÓMEZ GUINOVART, J. (1998) "Fundamentos de lingüística computacional: bases

teóricas, líneas de investigación y aplicaciones", en P. Cid & J. Baró (eds.) Anuario

SOCADI de Documentación e Información 1998, Barcelona: Societat Catalana de

Documentació i Informació, 135-146.

GÓMEZ GUINOVART, J. & M. PALOMAR (coords.) (1998), Monografía: Lengua y Tecnologías

de la Información. Novática, Revista de la Asociación de Técnicos de Informática,

133 (Mayo-Junio), 3-45.

GÓMEZ GUINOVART, X. (2000), “Lingüística computacional”, en F. Ramallo, G. ReiDoval

& X.P. Rodríguez Yáñez (eds.), Manual de Ciencias da Linguaxe, Vigo: Xerais,

221-286. [http://webs.uvigo.es/sli/arquivos/xerais.pdf]

GOMEZ GUINOVART, X. et al. (eds.) (1999), Panorama de la investigación en lingüística

informática. Monografía de Revista Española de Lingüística Aplicada.

GRISHMAN, R. (1986). Computational Linguistics, Cambridge: C.U.P. [Trad. esp. A.

Moreno Sandoval (1991), Introducción a la lingüística computacional, Madrid:

Visor]

33

HAUSSER, R. (2001 [1999]): Foundations of Computational Linguistics: HumanComputer

Communication in Natural Language, 2ª ed., revisada y ampliada, Berlin:

Springer-Verlag.

KAWAGUCHI, Y. et al. (2005), Linguistic informatics: state of the art and the future,

Amsterdam/Philadelphia: John Benjamins.

LAVID, J. (2005), Lenguaje y nuevas tecnologías: nuevas perspectivas, métodos y

herramientas para el lingüista del siglo XXI, Madrid: Cátedra.

LAWLER, J. & H. ARISTAR DRY (eds.) (1998): Using Computers in Linguistics. A Practical

Guide, London/New York: Routledge.

LLISTERRI, J. (2003), "Lingüística y tecnologías del lenguaje", Lynx. Panorámica de

Estudios Lingüísticos, 2, 9-71

[http://liceu.uab.cat/~joaquim/publicacions/Llisterri_03_Linguistica_Tecnologias

_Lenguaje.pdf]

MARTÍ, M.ª A. & I. CASTELLÓN (2001), La lingüística computacional, Barcelona:

Edicions Universitat de Barcelona.

MORENO SANDOVAL, A. (1998), Lingüística computacional, Madrid: Síntesis.

MOURE, T. & J. LLISTERRI (1996), “Lenguaje y nuevas tecnologías: el campo de la

lingüística computacional”, en M. Fernández Pérez (coord.) (1996), Avances en

Lingüística Aplicada, Santiago: Servicio de Publicacións. USC, 147-227.

[http://liceu.uab.es/~joaquim/publicacions/Llisterri_Moure_96_Linguistica_Com

putacional.pdf]

TOMASI, F. (2009), Metodologie informatiche e discipline umanistiche, Roma: Carocci.

TORDERA, J.C. (2012), El abecé de la Lingüística computacional, Madrid: Arco/Libros.

5.2.3. OTRAS REFERENCIAS DE INTERÉS (AGRUPADAS POR ÁMBITOS)

5.2.3.1. Lingüística de corpus

BARLOW, M. (2001), “Corpus linguistics and theoretical linguistics”, International

Journal of Computational Linguistics, 16:1, 3-44.

KAWAGUCHI, Y. et al. (2007), Corpus-based perspectives in Linguistics,

Amsterdam/Philadelphia, PA: John Benjamins.

LLISTERRI, J. et al. (2005), "Corpus orales para el desarrollo de las tecnologías del habla

en español", Oralia. Análisis del discurso oral, 8, 289-325.

34

MCENERY, T. & A. WILSON (1996, 20012), Corpus Linguistics: an introduction,

Edinburgh:E.U.P. [http://www.lancs.ac.uk/fss/courses/ling/corpus/CONTENTS.HTM]

MCENERY, T. & A. HARDIE (2011). Corpus linguistics: Method, theory and practice.

Cambridge: C.U.P.

MCENERY, T., R. XIAO & Y. TONO (2006): Corpus-Based Language Studies: an advanced

resource book, London/New York: Routledge.

PARODI, G. (2010), Lingüística de Corpus: de la teoría a la empiria, Madrid:

Iberoamericana.

SARDINHA, T. B. (2004), Lingüística de Corpus, Barueri-São Paulo: Manole.

TEUBERT, W. & R. KRISHNAMURTHY (eds.) (2007), Corpus linguistics: critical concepts in

linguistics, London: Routledge.

TORRUELLA, J. (2017), Lingüística de corpus: génesis y bases metodológicas de los

corpus (históricos) para la investigación en Lingüística, Frankfurt am Main:

Peter Lang.

WILSON, A., P. RAYSON & T. MCENERY (eds.) (2003), A rainbow of corpora: corpus

linguistics and the language of the world, München: Lincom.

WYNNE, M. (ed.) (2005), Developing Linguistic Corpora: a Guide to Good Practice,

Oxford: Oxbow Books

[http://www.ahds.ac.uk/creating/guides/linguisticcorpora/index.htm]

5.2.3.2. Procesamiento del lenguaje natural y Traducción automática

COLEMAN, J. (2005), Introducing Speech and Language Processing,

Cambridge/NewYork: C.U.P.

HOCKEY, S. (2001), Electronic texts in the humanities. Principles and practices, Oxford:

O.U.P.

HUTCHINS, W. J. (1986): Machine translation: past, present, future, Chichester, Ellis

Horwood: Ellis Horwood Series in Computers and their Applications.

[http://www.hutchinsweb.me.uk/PPF-TOC.htm]

HUTCHINS, W.J. & H.L. SOMERS (1995), Introducción a la traducción automática,

Madrid: Visor.

35

HUTCHINS, W.J. (2005), Publications on machine translation, computer-based

translation technologies, linguistics and other topics [disponible en

http://www.hutchinsweb.me.uk]

JURAFSKY, D. & J. H. MARTIN (20092), Speech and Language Processing. An Introduction

to Natural Language Processing, Computational Linguistics and Speech

Recognition, Upper Saddle River, NJ: Pearson Prentice Hall.

MARTÍ, M.ª A. & J. LLISTERRI (eds.) (2002), Tratamiento del lenguaje natural: tecnología

de la lengua oral y escrita, Soria/Barcelona: Fundación Duques de Soria/Edicions

Universitat de Barcelona.

MARTÍ, M.ª A. & J. LLISTERRI (eds.) (2004), Tecnologías del texto y del habla, Barcelona:

Edicions Universitat de Barcelona.

MORENO, L. et al. (1999), Introducción al procesamiento del lenguaje natural, Alacant:

Universitat de Alacant.

NIRENBURG, S. (ed.) (1987), Machine Translation. Theoretical and Methodological

Issues, Cambridge: C.U.P.

TORDERA, J.C. (2011), Lingüística computacional. Análisis, generación y traducción

automática (Anexo 20 de Lynx), València: Universitat de València.

TORDERA, J.C. (2011), “Puentes entre la lingüística computacional y la psicolingüística”,

Revista de Lingüística y Lenguas Aplicadas, 6, 341-352.

[https://polipapers.upv.es/index.php/rdlyla/article/view/914/984]

5.2.3.3. Tecnologías lingüísticas

AGUILERA, S. et al. (2001), “Aplicaciones sociales de las tecnologías de la lengua”, Quark.

Ciencia, Medicina, Comunicación y Cultura, 21, 90-94.

[http://www.prbb.org/quark/21/021090.htm]

CAL, M., P. NÚÑEZ & I. PALACIOS (eds.) (2005), Nuevas tecnologías en lingüística,

traducción y enseñanza de lenguas, Santiago de Compostela: Universidade de

Santiago de Compostela, Servizo de Publicacións e Intercambio Científico.

COLE, R. A. et al. (eds.) (1997), Survey of the State of the Art in Human Language

Technology, Cambridge: C.U.P. [http://www.dfki.de/~hansu/HLT-Survey.pdf]

LLISTERRI, J. (2003), "Las tecnologías del habla: Entre la ingeniería y la lingüística", en

Actas del Congreso Internacional ‘La ciencia ante el público. Cultura humanista y

36

desarrollo científico tecnológico’, Salamanca: Instituto Universitario de Estudios

de la Ciencia y la Tecnología, 44-67.

[http://liceu.uab.es/~joaquim/publicacions/Llisterri_03_Tecnologias_Habla_Inge

nieria_Linguistica.pdf]

LLISTERRI, J. (2006), "Introducción a los sistemas de diálogo", en J. Llisterri & M.J.

Machuca (eds.) Los sistemas de diálogo, Bellaterra-Soria: UAB, Servei de

Publicacions - Fundación Duques de Soria (Manuals de la UAB, Lingüística,

45), 11-21.

[http://liceu.uab.cat/~joaquim/publicacions/Llisterri_06_Sistemas_Dialogo.pdf]

MARTÍ, M.ª A. et al. (2004), “Tecnologies de la llengua i las seves aplicacions”, Revista

Gallega de Filología, 5, 107-139.

MARTÍ, M.ª A. & J. LLISTERRI (2001), “La ingeniería lingüística en la sociedad de la

información”, Digithum, 3.

[https://digithum.uoc.edu/articles/abstract/10.7238/d.v0i3.595/]

SIEMENS, R. & S. SCHREIBMAN (eds.) (2007), A companion to digital literary studies,

Malden: Blackwell.

TORDERA, J.C. (2011), Linguistica computacional. Tecnologias del habla. València:

Universitat de València.

VARILE, G. & A. ZAMPOLLI (eds.) (1997), Survey of the State of the Art in Human

Language Technology, Cambridge: C.U.P.

VIDAL BENEYTO, J. (dir.) (1991), Las industrias de la lengua, Madrid: Fundación Sánchez

Ruipérez / Pirámide.

5.3. ESTRUCTURA DETALLADA DEL TEMARIO (SESIONES EXPOSITIVAS, INTERACTIVAS Y

TUTORÍAS)

TEMA 1. Lingüística Computacional: evolución historiográfica y principales

líneas de investigación.

OBJETIVOS: presentar a los estudiantes argumentos que justifiquen la necesidad del

diseño y posterior manejo de diversas herramientas informáticas en las

37

investigaciones lingüísticas a partir de la reflexión sobre posibles problemas reales

derivados del uso de las lenguas y que piden solución.

CONTENIDOS

1. Introducción al campo de la Lingüística Computacional

1.1. Lingüística e Informática; Lingüística e Inteligencia artificial.

1.2. La Lingüística Computacional en el seno de la Lingüística aplicada:

caracterización e historiografía

2. El carácter transdisciplinar de la Lingüística Computacional: vertientes

de estudio

2.1. Lingüística informática: herramientas de manipulación y análisis de datos,

diccionarios automáticos, diseño y explotación de corpus lingüísticos.

2.2. Procesamiento del lenguaje natural y traducción automática.

2.3. Tecnologías (del texto y del habla) e Industrias de la lengua.

BIBLIOGRAFÍA BÁSICA

MORENO FERNÁNDEZ, F. (1990), “Lingüística informática e informática lingüística”,

Lingüística Española Actual, 12/1, 5-16.

MOURE, T. & J. LLISTERRI (1996), “Lenguaje y nuevas tecnologías. El campo de la

lingüística computacional”, en M. Fernández Pérez (coord.), Avances en

Lingüística Aplicada, Santiago: Servicio de Publicacións. Universidade de

Santiago de Compostela, 147-227 (aptdos. 1, 3.2.1.1. e 5).

ROJO, G. (2005-2006), “Informática y Lingüística: Las lenguas en la sociedad del

conocimiento”, Boletín de RedIRIS, 74-75.

[http://www.rediris.es/rediris/boletin/74-75/ponencia1.pdf]

BIBLIOGRAFÍA COMPLEMENTARIA

ARES, F. (2008), El robot enamorado. Una historia de la Inteligencia Artificial,

Barcelona: Ariel. [caps. 7 e 11]

MCCARTHY, J. (2007), What is Artificial Intelligence?

[http://www-formal.stanford.edu/jmc/whatisai/]

MORENO SANDOVAL, A. (1998), Lingüística computacional, Madrid: Síntesis. [caps. 1 e

2]

38

SINCLAIR, J. (2001), Corpus, Concordance, Collocation, Oxford: O.U.P.

VIDAL, J. & J. BUSQUETS (1996), “Lingüística computacional”, en C. Martín Vide (ed.),

Elementos de Lingüística, Barcelona: Octaedro Universidad, 392-446.

ORGANIZACIÓN DE LAS SESIONES EXPOSITIVAS E INTERACTIVAS

- 3 sesiones expositivas en las que se desarrollarán las siguientes actividades:

• explicación de los contenidos del tema

• discusión de lecturas obligatorias

- 3 sesiones seminario:

• (1.1.) Presentación y organización de la materia: explicación del contenido de

seminarios y tutorías así como también del sistema de evaluación del esfuerzo de

los estudiantes.

• (1.2.) Trabajo de discusión (en pequeño grupo) basado en material diverso sobre

el ámbito de estudio de la Lingüística Computacional: problemas de delimitación

de la disciplina, distintas aproximaciones según vertientes,

cuestiones terminológicas.

• (1.3.) Puesta en común y análisis de diferentes tipos de materiales relacionados

con el campo de la Inteligencia Artificial.

TEMA 2. Utilidades informáticas en Lingüística y desarrollos de la Lingüística

de corpus como metodología de base empírica.

OBJETIVOS: presentar a los estudiantes la utilización instrumental de la informática en

aquellos estudios de corte lingüístico caracterizados por el manejo cuantitativo de los

datos. Se insistirá en considerar el ordenador como herramienta que dinamiza y

economiza el trabajo con grandes bases de datos lingüísticos.

CONTENIDOS

1. Introducción

39

1.1. Ubicación del campo de la Lingüística informática dentro de los estudios en

Lingüística computacional.

1.2. Panorámica de las utilidades informáticas en Lingüística.

2. Transcripción de interacciones comunicativas (el sistema CHILDES)

2.1. Lenguaje adulto (de interés para Pragmática, Análisis del discurso, Dialectología,

Sociolingüística, Enseñanza/Aprendizaje de lenguas, Planificación lingüística).

2.2. Lenguaje infantil (de interés para Psicolingüística evolutiva, Lingüística clínica,

Enseñanza/Aprendizaje de lenguas, Planificación lingüística).

3. Herramientas de manipulación y de análisis de datos

3.1. Índices y frecuencias.

3.2. Concordancias y colocaciones.

4. Desarrollos de la Lingüística de Corpus como metodología de base

empírica:

4.1. Recursos, herramientas y aplicaciones en Lingüística computacional.

4.2. Tipos y utilidad de los corpus.

4.3. Procesos de enriquecimento y extracción de información de un corpus:

segmentación, análisis, tipificación, etiquetado.

5. Lexicografía computacional:

5.1. Bancos de datos lexicográficos.

5.2. Diccionarios electrónicos.

BIBLIOGRAFÍA BÁSICA

MORENO SANDOVAL, A. (1998), Lingüística computacional, Madrid: Síntesis (28-29; 130-

141).

PARODI, G. (2008), “Lingüística de Corpus: una introducción al ámbito”, Revista de

Lingüística Teórica y Aplicada, 46/1, 93-119.

TORRUELLA, J. & J. LLISTERRI (1999), "Diseño de corpus textuales y orales", en J.M.

Blecua et al. (eds.) Filología e informática. Nuevas tecnologías en los estudios

filológicos. Barcelona: UAB / Milenio, 45-77.

[http://liceu.uab.cat/~joaquim/publicacions/Torruella_Llisterri_99.pdf]

40

BIBLIOGRAFÍA COMPLEMENTARIA

ABAITÚA, J. (2002), “Tratamiento de corpora bilingües”, en M.ª A. Martí & J. Llisterri

(eds.) (2002), Tratamiento del lenguaje natural: tecnología de la lengua oral y

escrita, Soria: Fundación Duques de Soria; Barcelona: Edicions Universitat de

Barcelona, 61-90.

ÁGUILA ESCOBAR, G. (2009), Los diccionarios electrónicos del español, Madrid:

Arco/Libros, S.L.

FERNÁNDEZ PÉREZ, M. (2011), Lingüística de corpus y adquisición de la lengua, Madrid:

Arco/Libros.

MOURE, T. & J. LLISTERRI (1996), “Lenguaje y nuevas tecnologías. El campo de la

lingüística computacional”, en M. Fernández Pérez (coord.) (1996), Avances en

Lingüística Aplicada, Santiago: Servicio de Publicacións. Universidade de

Santiago de Compostela, 147-227 (esp. 148, 151, 174-177; 151, 174-177; 198202).

PRIETO, S., E. MOSQUEIRA & N. VÁZQUEZ (2009): “Córpora y enseñanza de lenguas: se

buscan colocaciones”, en P. Cantos & A. Sánchez (eds.), A Survey of Corpusbased

Research. Panorama de investigaciones basadas en corpus, AELINCO,

Murcia, 366-373.

[http://www.dicesp.com/app/webroot/files/file/Prieto%20et%20al_2009.pdf]

SINCLAIR, J. (2005), “Corpus and Text: Basic Principles”, en M. Wynne (ed.), Developing

Linguistic Corpora: a Guide to Good Practice, Oxford: Oxbow Books: 1-16.

[http://www.ahds.ac.uk/creating/guides/linguistic-corpora/chapter1.htm]

TEUBERT, W. (2005), “My version of corpus linguistics”, International Journal of Corpus

Linguistics, 10/1, 1-13.

VIDAL BENEYTO, J. (1991), Las industrias de la lengua, Madrid: Fundación Germán

Sánchez Ruipérez-Pirámide (caps. 3, 4, 5 e 8).

VINCZE, O., E. MOSQUEIRA & M. ALONSO (2011), "An online collocation dictionary of

Spanish", en I. Boguslavsky e L. Wanner (eds.), Proceedings of the 5th

International Conference on Meaning-Text Theory (Barcelona), 275-286.

[http://www.dicesp.com/app/webroot/files/file/MTT%202011%20Vincze%20et%20

al_.pdf]

41

ORGANIZACIÓN DE LAS SESIONES EXPOSITIVAS E INTERACTIVAS

- 5 sesiones expositivas en las que se desarrollarán las siguientes actividades:

• explicación de los contenidos del tema

• discusión de lecturas obligatorias

• análisis de supuestos prácticos

- 5 sesiones seminario en las que los estudiantes realizarán con la profesora:

• (2.1.) Revisión y análisis de los diferentes tipos de herramientas informáticas de

análisis textual.

• (2.2.) Trabajo con corpus (I): Actividades destinadas a familiarizar a los

estudiantes con el manejo de los corpus lingüísticos informatizados y reflexionar

sobre su valor y utilidad (teórica y práctica).

• (2.3.) Trabajo con corpus (II): puesta en común y discusión de ejercicios del

seminario 2.2.

• (2.4.) Trabajo con corpus (III): puesta en común y discusión de ejercicios del

seminario 2.3.

• (2.5.) Actividades destinadas a familiarizar a los estudiantes con el manejo de

bancos de datos lexicográficos y diccionarios electrónicos.

TEMA 3. Procesamiento del lenguaje natural y Traducción automática.

OBJETIVOS: introducir a los estudiantes en el tratamiento computacional de las lenguas

naturales a través de la comprensión y comparación de los distintos modelos de

procesamiento que nos permite convertirlas en lenguajes automáticos.

CONTENIDOS

1. Introducción

1.1. El tratamiento computacional de las lenguas: de lo natural a lo automático.

2. La traducción automática

2.1. Historiografía del ámbito de la traducción automática.

2.2. Traducción automática frente a traducción asistida por ordenador.

42

2.3. Clasificación de los sistemas de traducción automática: criterios y tipología.

2.4. La traducción automática en línea.

3. Procesamiento del lenguaje natural (oral y escrito)

3.1. Introducción al procesamiento del lenguaje natural. Los procesos de

reconocimiento y síntesis. Los sistemas de diálogo.

3.2. Procesamiento del lenguaje natural escrito: las tecnologías del texto.

3.3. Procesamiento del lenguaje natural oral: las tecnologías del habla.

3.4. Aplicaciones del procesamiento del lenguaje natural: presente y futuro.

BIBLIOGRAFÍA BÁSICA

ALONSO, J.A. (2003), “La traducción automática”, en M.ª A. Martí (coord.), Tecnologías

del Lenguaje, Barcelona: UOC, 94-129.

PERIÑÁN, C. (2005), “Procesamiento del lenguaje natural: de lingüista a ingeniero del

conocimiento”, en I. K. Brady, M. Navarro & C. Periñán (eds.), Nuevas Tendencias

en Lingüística Aplicada, Murcia: Quaderna, 293-317.

RUIZ, J. C. (2005), “Lenguaje e informática/Lenguaje y ordenadores”, en Á. López & B.

Gallardo (eds.), Conocimiento y lenguaje, València: Universitat, 401-436.

BIBLIOGRAFÍA COMPLEMENTARIA

ABAITUA, J. (1997-2001), “Presente y futuro de la traducción automática”

[http://paginaspersonales.deusto.es/abaitua/konzeptu/ta/ta97.htm]

ADOLPHS, S. (2006), Introducing Electronic Text Analysis. A practical guide for language

and literary studies, London/New York: Routledge.

HUTCHINS, J. (2003), “Machine Translation: General Overview”, en R. Mitkov, (ed.) The

Oxford Handbook of Computational Linguistics. New York/Oxford: O.U.P., 501-

511.

LLISTERRI, J. (2006), "Introducción a los sistemas de diálogo", en J. Llisterri & M.J.

Machuca (eds.), Los sistemas de diálogo, Bellaterra - Soria: UAB, Servei de

Publicacions-Fundación Duques de Soria (Manuals de la UAB, Lingüística, 45),

11-21.

[http://liceu.uab.cat/~joaquim/publicacions/Llisterri_06_Sistemas_Dialogo.pdf]

MORENO, L. & MOLINA, A. (1999): “Preliminares y tendencias en el Procesamiento del

43

Lenguaje Natural”, Inteligencia Artificial, 3/7, 65-76.

MOURE, T. & J. LLISTERRI (1996), “Lenguaje y nuevas tecnologías. El campo de la

lingüística computacional”, en M. Fernández Pérez (coord.) (1996), Avances en

Lingüística Aplicada, Santiago: Servicio de Publicacións. Universidade de

Santiago de Compostela, 147-227 (esp. para PLN: §3 (3.1.1., 3.1.2., 3.1.5.; 3.2.2.;

3.2.3.) e para TA: §3 (3.2.1.))

VALLEZ, M. & R. PEDRAZA-JIMÉNEZ (2007), “El Procesamiento del Lenguaje Natural en

la Recuperación de Información Textual y áreas afines”, Hipertext.net, 5

[http://www.hipertext.net]

ORGANIZACIÓN DE LAS SESIONES EXPOSITIVAS E INTERACTIVAS

- 5 sesiones expositivas en las que se desarrollarán las siguientes actividades:

• explicación de los contenidos del tema

• discusión de lecturas obligatorias

• análisis de supuestos prácticos

- 5 sesiones seminario en las que los estudiantes realizarán con la profesora las

siguientes actividades:

• (3.1. e 3.2.) Traducción automática (I): Actividades destinadas a familiarizar a los

estudiantes con los sistemas de TA y reflexionar sobre su valor y utilidad (teórica

y práctica).

• (3.3.) Traducción automática (II): Actividades de aplicación de métodos y

estrategias para valorar las traducciones automáticas en línea.

• (3.4. e 3.5.) Procesamiento del lenguaje natural: puesta en común y análisis de

diferentes tipos de programas de PLN aplicados a diferentes lenguas y

componentes de las mismas.

TEMA 4. Tratamiento de la lengua –hablada y escrita– y desarrollo de

productos comerciales: lingüística y tecnología.

OBJETIVOS: presentar a los estudiantes dos terrenos que se relacionan en la medida en

que uno de ellos, el de las llamadas Tecnologías del habla, se centra en el diseño de

44

procedimientos variados que permiten la comunicación natural entre persoas y

máquinas mediante el habla, en tanto que el otro, el de las Industrias lingüísticas,

engloba una serie de productos y aplicaciones enfocados desde y hacia la vertiente

escrita.

CONTENIDOS

1. Introducción

1.1. Situación del campo de las Tecnologías e Industrias lingüísticas en el seno de

la Lingüística Computacional. Relación de estas dos vertientes con los campos

de la Tecnología de comunicaciones y de la Ingeniería lingüística.

1.2. Panorámica actualizada de las vertientes de aplicación en Tecnologías del

habla e Industrias de la lengua.

2. Tecnologías del habla

2.1. Introducción.

2.2. Aplicaciones: Síntesis del habla, Reconocimiento del habla. Traducción oral

automática, Identificación y/o verificación de la identidad de los

interlocutores.

2.4. Sistemas de diálogo persona-máquina.

3. Industrias de la lengua

3.1. Introducción.

3.2. Aplicaciones: Conversión de texto a habla; dictado automático; recuperación,

búsqueda y extracción de información; producción asistida por ordenador

(PAO) y edición electrónica, y productos multimedia; traducción automática

y asistida; correctores (ortográficos, gramaticales y estilísticos) y

verificadores; tesauros y diccionarios electrónicos; tratamiento multilingüe de

textos; ELAO (Enseñanza de Lenguas Asistida por Ordenador); aplicaciones

de la Ingeniería lingüística a la ayuda a discapacitados (tratamiento de la

escritura, lectura óptica, sistemas alternativos de comunicación), Tecnología

y gestión del multilingüismo.

45

BIBLIOGRAFÍA BÁSICA

LLISTERRI, J. et al. (2003), “El papel de la lingüística en el desarrollo de las tecnologías

del habla”, en M. Casas (dir.) & C. Varo (ed.), VII Jornadas de Lingüística, Cádiz:

Servicio de Publicaciones Universidad de Cádiz, 137-191.

LLISTERRI, J. (2007), "El español y las nuevas tecnologías", en M. Lacorte (ed.)

Lingüística aplicada del español. Madrid: Arco/Libros (Biblioteca Philologica),

483-520.

MOURE, T. & J. LLISTERRI (1996), “Lenguaje y nuevas tecnologías: el campo de la

lingüística computacional”, en M. Fernández Pérez (coord.) (1996), Avances en

Lingüística Aplicada, Santiago: Servicio de Publicacións. Universidade de

Santiago, 147-227. (esp. §§ 1.1.3, 1.1.4, 2, 3.2.5, 4).

BIBLIOGRAFÍA COMPLEMENTARIA

ABRIL, D., C. DELGADO & Á. Vigara (2009), Comunicación Aumentativa y Alternativa. Guía de

referencia, Madrid: CEAPAT

[http://sid.usal.es/idocs/F8/FDO21102/com_aumentativa.pdf].

LLISTERRI, J. et al. (2005), “Corpus orales para el desarrollo de las tecnologías del habla en

español”, Oralia. Análisis del discurso oral, 8, 289-325.

[http://liceu.uab.es/~joaquim/publicacions/Llisterri_Machuca_Mota_Riera_Rios_05_Cor

pus_Orales_Tecnologias_Habla_Espanol.pdf]

LLISTERRI, J. (2009), “Las tecnologías del habla en las lenguas románicas ibéricas”, Studies in

Hispanic and Lusophone Linguistics, 2 (1), 133-180.

[http://liceu.uab.cat/~joaquim/publicacions/Llisterri_09_Tecnologias_Habla_Lenguas_R

omanicas_Ibericas.pdf]

MARTÍ, M.ª A. (2003) (coord.), Tecnologías del Lenguaje, Barcelona: UOC.

MARTÍ, M.ª A. (2009) “Llengües minoritzades i tecnologia lingüística: perspectives de futur”,

Llengua, Societat i Comunicació, 7

[http://revistes.ub.edu/index.php/LSC/issue/view/268]

VIDAL VILLALBA, J. & J. BUSQUETS RIGAT (1996), “Lingüística computacional”, en C.

Martín Vide (ed.) (1996), Elementos de lingüística, Barcelona: Octaedro, 393-446

(esp. §§ 3.1, 4.1, 4.2, 4.3, 4.5, 4.6, 5)

ORGANIZACIÓN DE LAS SESIONES EXPOSITIVAS E INTERACTIVAS

- 3 sesiones expositivas en las que se desarrollarán las siguientes actividades:

46

• explicación de los contenidos del tema

• discusión de lecturas obligatorias

• análisis de supuestos prácticos

- 3 sesiones seminario en las que se llevará a cabo, bajo la supervisión de la profesora,

una actividad individual en la que el estudiante debe escoger una de las posibles

aplicaciones de las tecnologías lingüísticas y, conjugando las búsquedas en Internet

con la revisión de algunas lecturas propuestas, preparar un trabajo que ha de ser

expuesto en el seminario 3.3. (Cfr. Aptdo. 6 de esta Guía).

TUTORÍAS PROGRAMADAS

La profesora desarrollará las siguientes tutorías en grupos reducidos:

TUTORÍA 1 (1.ª quincena de febrero): organización de los grupos, distribución de las

lecturas y orientaciones para la realización de los trabajos relacionados con los temas 2

y 3.

TUTORÍA 2 (2.ª quincena de abril): revisión y orientación de la elaboración de los

trabajos en curso.

6. METODOLOGÍA

En esta materia adoptaremos una metodología de enseñanza presencial que

garantice la interacción entre la profesora y los estudiantes sin que esto suponga

minusvalorar el proceso de aprendizaje autónomo. Así, el curso de Lingüística

Computacional se desarrollará a través de las clases presenciales (3 h. semanales) y del

trabajo personal de los estudiantes en horas no presenciales (estudio del temario a

través de las lecturas obligatorias y preparación de los ejercicios de aplicación).

Las clases presenciales serán de tres tipos:

1. Sesiones expositivas (1 hora), en las que la profesora proporcionará la información

teórica básica de los temas del programa, reforzada con la presentación de diversos

materiales representativos de los conceptos estudiados. Más concretamente,

asignamos a cada tema de esta materia una serie de lecturas obligatorias que

presentan con claridad los contenidos teórico-prácticos sobre el procesamiento

lingüístico y sus aplicaciones informáticas.

47

2. Sesiones seminario (2 horas), dedicadas, por un lado, a la puesta en común y

discusión de las lecturas obligatorias del programa para comprobar la asimilación de

los contenidos y, por otro, a la presentación y evaluación de los ejercicios de aplicación

propuestos.

3. Tutorías programadas (hora y media) en grupos reducidos con el objetivo de

guiar el trabajo autónomo de los estudiantes.

Como complemento de las sesiones expositivas e interactivas, se habilitará un aula

virtual que se utilizará para el depósito de los materiales digitales que los profesores

vayan disponibilizando a lo largo del curso y para difundir cualquier tipo de información.

Los ejercicios de aplicación que los estudiantes elaborarán en las horas no presenciales

responderán a los siguientes tipos:

a) Respuesta a cuestiones breves relacionadas con el contenido de los

temas, que obliguen a enfrentarse con los aspectos de más difícil comprensión para

aclarar las posibles dudas o que sirvan de aplicación práctica de conceptos explicados

en las sesiones expositivas.

b) Revisión crítica de distintas fuentes documentales relacionadas con los

contenidos de la materia.

También elaborarán un trabajo sobre alguna de las aplicaciones existentes en el

terreno de las tecnologías lingüísticas (estudiadas a lo largo de todo el curso y de un

modo más específico en el Tema 4), que habrá de presentarse en las últimas sesiones del

curso. Si bien todos los detalles de este tipo de prueba serán presentados por la profesora

al comienzo del semestre, los estudiantes deberán ser capaces de demostrar la

asimilación de los contenidos y el dominio de las destrezas que contribuyan al desarrollo

de competencias profesionales a través de la redacción de un proyecto personal que no

solo estimule la reflexión crítica sobre el material estudiado, sinó que además exija la

necesidad de tomar decisiones motivadas, anticipe problemas potenciales y proponga

posibles soluciones desde la perspectiva de la Lingüística Computacional.

48

7. DISTRIBUCIÓN DE LA CARGA ECTS. CRONOGRAMA DEL CURSO ACADÉMICO

2019/2020

La distribución temporal de la materia a lo largo del semestre queda como sigue:

7.1. DISTRIBUCIÓN DE LA CARGA ECTS

TIPO DE SESIÓN HORAS

PRESENCIALES

HORAS NO

PRESENCIALES

HORAS TOTALES

EXPOSITIVAS 12 68 80

SEMINARIO 28 36 64

TUTORÍAS GRUPO 3 3 6

TOTAL 43 107 150

7.2. CRONOGRAMA DEL CURSO ACADÉMICO 2019-2020

TEMAS TEMA 1 TEMA 2 TEMA 3 TEMA 4

PERIODO ener/febr febr/marzo marzo/abril abril/mayo

SESIONES 2 x 60’ 4 x 60’

EXPOSITIVAS 4 x 60’ 3 x 60’

SESIONES

SEMINARIO 2 x 120’ 5 x 120’ 4 x 120’ 3 x 120’

TUTORÍAS

PROGRAMADAS

1 x 90’

---

---

1 x 90’

8. EVALUACIÓN

1ª OPORTUNIDAD: Al comienzo del cuatrimestre, el estudiante podrá escoger entre

estas dos opciones de evaluación:

1) Examen final -de toda la materia- que incluirá cuestiones teóricas y prácticas

(correspondientes a las sesiones expositivas y a las sesiones interactivas) y que

49

se realizará en el aula de informática en la fecha establecida por la Secretaría

de la Facultad (22/05/2019).

2) Evaluación continua:

* un 50% de la calificación corresponderá, además de a la asistencia regular,

a las actividades y ejercicios realizados y/o programados en las sesiones

expositivas e interactivas.

* un 50% corresponderá a la elaboración y presentación (oral y escrita) de un

proyecto personal.

Los aspectos, criterios e instrumentos de evaluación aparecen reflejados a continuación:

ASPECTO

Asistencia, participación y aprovechamiento de las clases presenciales

CRITERIOS

-Participación activa en las clases

-Calidad científica de los trabajos: asimilación de contenidos, comprensión de los textos,

análisis e interpretaciones adecuados.

INSTRUMENTO

Trabajos entregados y/o expuestos en los seminarios y en las tutorías programadas

VALOR

50%

ASPECTO

Conceptos, métodos y herramientas aprendidos durante todo el curso

CRITERIOS

-Dominio de los conocimientos teóricos y operativos de la materia

-Aprovechamiento de las lecturas obligatorias

INSTRUMENTO

Presentación oral y entrega por escrito de un proyecto personal

VALOR

50%

50

2ª OPORTUNIDAD: Se efectuará exclusivamente a través de un examen que incluirá

cuestiones teóricas y prácticas (correspondientes a las sesiones expositivas y a las

sesiones interactivas). Este examen se realizará en el aula de informática en la fecha

establecida por la Secretaría de la Facultad (04/07/2019).

ESTUDIANTES CON DISPENSA DE ASISTENCIA A CLASE

Los estudiantes que tengan concedida por el Decanato la dispensa de asistencia a clase

y, por lo tanto, no puedan seguir la evaluación continua, serán evaluados

exclusivamente a través de un examen final que podrán realizar tanto en la primera

como en la segunda oportunidad. Este examen se realizará en el aula de informática en

las fechas establecidas por la Secretaría de la Facultad para cada una de las

oportunidades.