presentació lc

13
Adolfo Zárate Pérez UPF LOS USOS DEL CORPUS INFORMATIZADO EN LOS ESTUDIOS DEL DISCURSO

Upload: adolfo

Post on 23-Jul-2015

147 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Presentació lc

Adolfo Zárate Pérez UPF

LOS USOS DEL CORPUS INFORMATIZADO EN LOS

ESTUDIOS DEL DISCURSO

LOS USOS DEL CORPUS INFORMATIZADO EN LOS

ESTUDIOS DEL DISCURSO

Page 2: Presentació lc

Punto de partida

Problema:

¿Hasta qué punto son útiles los corpus informatizados para el Análisis del Discurso?

¿Qué limitaciones presentan los corpus informatizados para los ED?

¿cuál es la concepción del corpus desde la LC y los ED (ECD y AC).

Objetivos:

• Explicar las limitaciones de los megacorpus actuales para los ED.

• Verificar los usos y concepciones del corpus• Determinar la utilidad de los corpus informatizados

en los ED: relación entre la LC y los ED

1. INTRODUCCIÓN

Page 3: Presentació lc

• Monika Bednarek (2009):

Textos individuales Pequeña escala Gran escala

Análisis manual Análisis del corpus Análisis del corpus

Baker, Paul. (2006). Using corpora in discourse analysis. Propone algunas técnicas de análisis que pueden ser utilizados en ED, basado en el corpus: la concordancia, la evidencia lingüística, estrategias retóricas ... Baker parte de una concepción genérica de ED (no esp.: uso del lenguaje, la estructura lingüística), se limita el uso de programas informáticos.

Michal Měchura (2007) en Discourse analysis using corpora. ejemplos de corpus anotados que sirven para los ED, sobre todo el fenómeno de la estructura de la información ( a mano e informatizado): tema y rema.

El desarrollo histórico de la lingüística de corpus hasta ahora ha sido tal que la disciplina progresiva se mueve hacia arriba de un nivel de descripción lingüística a la siguiente

EL CORPUS Y ESTUDIOS DEL DISCURSO: EL ESTADO DE LA CUESTIÓN

Page 4: Presentació lc

ENCUENTROS Y DESENCUENTROS ENTRE LA LC Y LOS ED: UN ANALISIS PRÁCTICO

Investigación:“Representación del inmigrante sudamericano en la prensa escrita española entre 2006 y 2009“.

Línea: ECD. Discurso y racismo.Construcción del corpus: ¿cómo y dónde?Criterios: qué periódicos y cuantosPor géneros discursivos o secciones del periódico.Es representativa, ¿cómo definir?

Palabras claves: racismo, inmigrante (s), sudamericano (a)(s), extranjeros, migración, prensa,...

Page 5: Presentació lc

• British National Corpus:100 million word collection of samples of written and spoken language: British English

http://www.natcorp.ox.ac.uk/

Mark Davies / Brigham Young University

MEGACORPUS EN LÍNEA

Here is a random selection of 50 solutions from the 352 found.A05 341 He belonged to a family of immigrant Jews which had fled to a Glasgow speakers within the city. A3S 406 The immigrant in him also makes him a bad delegater, say former...

40 19-N España:ABC   resiste a desaparecer diluido entre la mayoría anglosajona. De la mano de los nuevos inmigrantes, nuestro idioma viene para quedarse, sin que pueda impedirlo la hostilidad de los

41 19-N España:ABC   ventajas adaptativas y demográficas sobre los recién llegados. En la teoría de Eva los inmigrantes ganaron la mano. La magnitud de la ventaja necesaria para tal sustitución puede medirse

42 19-N España:ABC   los homínidos fósiles reflejan una secuencia anatómica continúa durante el Pleistoceno, no interrumpida por inmigrantes africanos en tiempo alguno. Las formas distintivas de los primeros de estos restos de

FUENTE:

FECHA:TITULO: ESPAÑA: ABCAUTOR: BOO, JUAN VICENTEFUENTE: http://www.abc.es (hoy)Expanded context: Departamentos que ofrecen estudios graduados. 3.000 estudiantes cursan estudios de licenciatura y existen a lo largo de todo el territorio de la Unión 25 Asociaciones de Hispanistas. En la guerra civil lingüística de los Estados Unidos, el español gana unas batallas y pierde otras pero, a estas alturas de la contienda, está seguro de no resultar derrotado. Por primera vez, el inglés se enfrenta a un idioma universal que, a diferencia del alemán, el italiano o el yiddish, se resiste a desaparecer diluido entre la mayoría anglosajona. De la mano de los nuevos inmigrantes, nuestro idioma viene para quedarse, sin que pueda impedirlo la hostilidad de los extremistas anglófonos. A pesar de sus campañas, el español es el idioma extranjero más estudiado en Estados Unidos. Entre los norteamericanos el español es el idioma extranjero preferido, a considerable distancia del francés, sobre todo desde que las perspectivas de integración con México e Iberoamérica se convierten en realidad a pasos agigantados. Aprender español está bien visto, lo mismo que intercalar algunas palabras fáciles como " amigo ", " gracias " o

Page 6: Presentació lc

RAE- Corpus de Referencia del Español Actual (CREA)http://corpus.rae.es/creanet.htmlBuscar “inmigrantes” del 2006 al 2009, simplemente no accede, porque el corpus no está

actualizado (1994-2004), si busco de todos años me accede a 1017 casos en 422 documentos. La información estadística me ofrece % de año y tema en el que más aparece el término.

• Documentos: me ofrece datos generales de los 422 documentos, en el siguiente cuadro:

• Concordancias:

RAE-CREA

•Concordancias: me da el contexto del texto•Documentos: me ofrece datos generales de los 422 documentos, en el siguiente cuadro:

Casos Año Autor Obra País Tema Publicación

4 2004 prensa

La Voz de Galicia, 15/01/2004 : ECONOMÍA

ESP Justicia, legislación La Voz de Galicia, S.A. (La Coruña), 2004

1 reyerta donde una de las empleadas, esposa de un inmigrante, sufrió una lesión leve en un labio. La de ** 2004 PRENSA La Voz de Galicia, 15/01/2004 : ECONOMÍA ESPAÑA 03.Justicia, legislación La Voz de Galicia, S.A. (La Coruña), 20042 o, el PSC perdió una buena parte de su electorado inmigrante y castellano-parlante que ya no ha vuelto ** 1995 PRENSA La Vanguardia, 16/06/1995 : JOSEP M. COLOMER ESPAÑA 02.Historia T.I.S.A (Barcelona), 19953 determinadas circunstancias pueden dar opción al inmigrante a regularizar su situación. La enorme bols ** 2004 PRENSA El País, 27/10/2004 : Opinión ESPAÑA 03.Justicia, legislación El País S.L. (Madrid), 2004

Page 7: Presentació lc

• Agrupaciones: grupos de palabras de 2, 3 y 4 palabras, estadísticamente relevante, sin embargo no se puede acceder a ese grupo, no hay un hipervínculo … inmigrantes ilegales el 13%.

Párrafo nº 10"Los españoles son iguales ante la ley, sin que pueda prevalecer discriminación alguna por razón de nacimiento, raza, sexo, religión, opinión o cualquiera otra condición o circunstancia personal o social" (artículo 14, Constitución Española). Esa es la teoría con la que todos estamos de acuerdo, pero, en la práctica, la vida cotidiana ya es otra cosa.Que la sociedad se configura en clases desde el punto de vista económico es algo con lo que vivimos siempre, y dudo mucho que eso cambie si no cambian los dioses. Pero incluso con esa clasificación asumida existe una fuerte organización social, no declarada, que clasifica a las personas en grupos admitidos a formar parte de su entramado, y en otros grupos rechazados de manera directa o de manera sutil.También es obvio que lo que llamamos "grupos marginales", los desheredados o, ¿por qué no decirlo?, los parias del sistema como los indigentes, los inmigrantes sin recursos, los drogadictos, la prostitución barata, etcétera, se clasifican en el grupo de los rechazados por la sociedad "bienpensante", que, mientras la situación se dé de esta manera, se la podría llamar como realmente se comporta, como "la sociedad malpensante".Al margen de esos claros grupos definidos -no sé cómo se los puede definir tan claramente, ya que ¿dónde está la línea divisoria entre un ser humano desesperado en busca de la droga y en otro ser humano "bienpensante", también desesperado, que esnifa cocaína los fines de semana o la semana entera?-, la línea se halla en si tiene dinero o no. Es decir, a que se llama vicio en una clase social se le llama hábito o costumbre entre la gente que puede pagarlo. Al margen, repito, de esos grupos, hay otros sin clasificación que obtienen un parecido rechazo social. En él se incluyen a los que cuestionan de frente los

AÑO: 1994

AUTOR: PRENSA

TÍTULO: La Vanguardia, 06/07/1994 : El rechazo a la mujer sola.

PAÍS: ESPAÑA

TEMA: 02.Mujer

PUBLICACIÓN: T.I.S.A (Barcelona), 1994

Page 8: Presentació lc

El Corpus Oral y Sonoro del Español Rural (COSER)http://www.lllf.uam.es/coser/ficha2.php?

es&archivos&Valladolid&44&01

• Enclave Arrabal de Portillo (Valladolid) Código 4401• Fecha 7 de diciembre de 1994• Informantes I1: Mujer (86 años)• I2: Mujer (48 años)• Temas La matanza del cerdo, animales domésticos (vacas, ovejas, la

lana, gallinas), alimentación (dulces, chorizos, tocino, jamón, sangre, pan, el horno, leche, queso, vino, aceite), costumbres (bodas, el ajuar), labores del hogar (cocina de leña, colchones de lana, encaje de bolillos).

• Archivo sonoro: Escuchar muestra "a" • Escuchar muestra "b" • Transcripción: Versión para imprimir

Corpus oral

Page 9: Presentació lc

John Sinclair (2004) “is a collection of pieces of language text in electronic form, selected according to external criteria to represent, as far as possible, a language or language variety as a source of data for linguistic research”.

Para el ACD, un corpus es una selección de materiales significativos, analizables e intencionales de acuerdo con el objetivo del investigador. Materiales significativos en tanto sean artefactos culturales, es decir no solo textos orales y escritos, sino también los hipertextos, las imágenes, la multimedialidad y la multimodalidad…

Giovanni Parodi define al corpus “como una colección o conjunto de textos que está formado por al menos dos o más textos (…)conjunto amplio de textos digitales de naturaleza específica y que cuenta con una organización predeterminada en torno a categorías identificables para la descripción y análisis de una variedad de lengua

El concepto de corpus desde la LC y los ED

Page 10: Presentació lc

Ruth Wodak postula que los ED, el ACD, han de incluir siempre el trabajo de campo y datos etnográficos con el fin de explorar el objeto sometido a investigación y ello es condición previa para cualquier ulterior análisis y teorización (Wodak, 2003 [2001]).

Lingüística descriptiva, lexicografía, terminología: Le basta el corpus para estudiar.

METODOLOGíAS

Page 11: Presentació lc

CDA

Textual analysisAnalysis of

social context

Linguistic analysis Intertextual analysis

Macro - / micro-levelanalysis

La metodología: Estudios Críticos del Discurso (ECD)

Page 12: Presentació lc

- Existen concepciones diferentes sobre corpus desde la LC y los ED.

- Los corpus grandes en en línea aun tienen limitaciones para ser objeto de estudio de los ED.

- Es posible aprovechar los aportes de la LC en los ED, pero no solo limitados a ella, al menos por el momento.

- Es posible combinar metodos cuantitativos ycualilativos en lso diferentes enfoques de los ED.

CONCLUSIONES

Page 13: Presentació lc

BIBLIOGRAFÍA

-Baker, Paul. (2006). Using corpora in discourse analysis. London/New York: Continuum.

-Bednarek, Monika 2009. Selected Proceedings of the 2008 HCSNet Workshop on Designing the Australian National Corpus, ed. Michael Haugh et al., 19-24. Somerville, MA: Cascadilla Proceedings Project

-Hardt-Mautner, Gerlinde (1995). ‘Only Connect.’ Critical Discourse Analysis and Corpus Linguistics. Institut f ¨ ur Englische Sprache Wirtschaftsuniversit ¨ atWien, Augasse 9, Austria

-Měchura, Michal (2007). Discourse analysis using corpora. M.Phil. in Speech and Language Processing, Michaelmas.

-Sinclair, John. (2004) Trus the text. Language, corpus and discourse. Cambridge.-Wodak, Ruth y Michel Mayer (2003) Métodos de Análisis Crítico del Discurso. Barcelona: Gedisa. [Título original: Methods of Critical Discourse Analysis, 2001]