utilidad de los corpus lingüísticos en el aula de español para ......en este caso es patente la...

22
Utilidad de los corpus lingüí sticos en el aula de español para extranjeros AQUILINO SÁNCHEZ Universidad de Murcia l. ¿Qué es un corpus lingüístico? Un corpus lingüfstico es un conjunto de datos lingUfsticos (pertenecien- tes al uso oral o escrito de la lengua, o a ambos), sistematizados según de- terminados criterios, s ufi cientemente extensos en amplitud y variedad, de manera que sean representativos del uso lingüístico o de alguno de sus ám- bitos y dispuestos de tal modo que puedan ser procesados mediante ordena- dor con el fin de obtener resultados varios y útiles tanto para el análisis como, en este caso, para el trabajo en el aula. Los corpus lingüísticos tienen una historia muy corta. Sin embargo, los profesores de lengua están familiarizados con los vocabularios fundamen- ta le s, que se hicieron famosos en la época de la metodología audio-oral. Los profesores de inglés han utilizado con frecuencia los listados de voces más representativas de esta lengua, elaborados por Thomdike y Lorge en 1944 (The Teacher's workbook of 30.000 words) y por Michael West (Ge- neral Service List of English Words, 1953). Ambas publicaciones han cons- tituido punto de referencia obligada para muchos autores de manuales a lo largo de muchos años. Entre los profesores de francés, la norma del Franfais Fondamemal, elaborada en la década de los sesenta, fue casi uni- versalmente aceptada. En el caso del español también se han elaborado al - gunos vocabularios fundamentales o de frecuencia, pero sobre principios no siempre rigurosamente científicos. Entre e ll os destacan los de García Hoz (1953), Márquez ViUegas (1975) y recientemente el de Sánchez Lo- 39

Upload: others

Post on 14-Dec-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Utilidad de los corpus lingüísticos en el aula de español para ......En este caso es patente la utilidad de los listados de frecuencia. 3.2. Aplicaciones prácticas de los listados

Utilidad de los corpus lingüísticos en el aula de español para extranjeros

AQUILINO SÁNCHEZ Universidad de Murcia

l. ¿Qué es un corpus lingüístico?

Un corpus lingüfstico es un conjunto de datos lingUfsticos (pertenecien­tes al uso oral o escrito de la lengua, o a ambos), sistematizados según de­terminados criterios, suficientemente extensos en amplitud y variedad, de manera que sean representativos del uso lingüístico o de alguno de sus ám­bitos y dispuestos de tal modo que puedan ser procesados mediante ordena­dor con el fin de obtener resultados varios y útiles tanto para el análisis como, en este caso, para el trabajo en el aula.

Los corpus lingüísticos tienen una historia muy corta. Sin embargo, los profesores de lengua están familiarizados con los vocabularios fundamen­tales, que se hicieron famosos en la época de la metodología audio-oral. Los profesores de inglés han utilizado con frecuencia los listados de voces más representativas de esta lengua, elaborados por Thomdike y Lorge en 1944 (The Teacher's workbook of 30.000 words) y por Michael West (Ge­neral Service List of English Words, 1953). Ambas publicaciones han cons­tituido punto de referencia obligada para muchos autores de manuales a lo largo de muchos años. Entre los profesores de francés, la norma del Franfais Fondamemal, elaborada en la década de los sesenta, fue casi uni­versalmente aceptada. En el caso del español también se han elaborado al­gunos vocabularios fundamentales o de frecuencia, pero sobre principios no siempre rigurosamente científicos. Entre ellos destacan los de García Hoz (1953), Márquez ViUegas (1975) y recientemente el de Sánchez Lo-

39

Page 2: Utilidad de los corpus lingüísticos en el aula de español para ......En este caso es patente la utilidad de los listados de frecuencia. 3.2. Aplicaciones prácticas de los listados

bato y Aguirre (1992). Solamente tos recopilados por Thomdike y Michaet West se hicieron sobre un conjunto de textos equiparables a los corpus. Pero ha sido la aparición de tos ordenadores la que ha acabado por dar un impulso decisivo a este tipo de estudios.

A finales del presente milenio, puede afirmarse ya sin lugar a duda que la era de los co1pus no solamente se va consoUdando, sino que empieza a ser tomada en serio con carácter general. El corpus, como conjunto de da­tos lingüísticos ordenados en múltiples modalidades, constituye ya un para­digma de la investigación y del trabajo lingüístico. Mas no solamente es útil para los lingüistas: es una necesidad para las empresas que se ocupan del procesamiento de los lenguajes naturales y constituye un utensilio de grandes posibilidades para otros colectivos, entre ellos el de los profesores de idiomas.

La disponibilidad de corpus del español útiles para la investigación o la docencia es aún muy escasa. Además del corpus Cumbre, de propiedad privada y ya finalizado en su primera etapa (diez milJones de palabras), que comenzará próximamente a comercializarse en alguna de sus partes y con distintas finalidades, puede accederse gratuitamente, mediante FfP (Uni­versidad Autónoma de Madrid), al C01pus del Espa1iol de la República Ar­gentina (dos miUooes de palabras de textos escritos d~ Argentina), al Cor­pus Chileno de Referencia (dos millones de palabras de textos escritos de Chile) y el Corpus Oral de Referencia del Español Contemporáneo (un mi­llón de palabras). El Informe sobre Recursos Lingüfsticos para el Español, elaborado por el Instituto Cervantes, menciona varios proyectos más rela­cionados con la recopilación de datos lingüísticos, pero la finalización o disponibiHdad de casi todos ellos aún debe ser confirmada. En la actuali­dad, el proyecto más importante es el encomendado a la Real Academia de la Lengua Española (CREA), que aspira a recopilar cien millones de pala­bras del español actual.

2. El tratamiento informático del corpus

Un repertorio de textos se presenta como una secuencia de e lementos lingüísticos, en la que las palabras se diferencian gracias al espacio en blanco que media entre una y otra. El corpus precisa, por Jo tanto, de una adaptación o adecuación tanto en lo que se refiere al formato como a la dis­posición del contenido. La adaptación a que nos referimos aquí puede va­riar según la finalidad del corpus. En el caso que nos ocupa, deben tenerse en cuenta los siguientes aspectos:

40

l . Posibilidad de identificar los textos que constituyen el corpus: origen, modalidad (oral, escrito), ámbito de uso, tipo de lenguaje o tema.

Page 3: Utilidad de los corpus lingüísticos en el aula de español para ......En este caso es patente la utilidad de los listados de frecuencia. 3.2. Aplicaciones prácticas de los listados

2. Posibilidad de etiquetar las palabras del corpus, de manera que las búsquedas o ejercicios que interesen puedan contar, como mínimo, con información sobre las partes de la oración.

3. Posibilidad de elegir textos en tamaño y formato adecuados para trabajar con e llos en clase: los textos no deben ser ni demasiado ex­tensos ni demasiado cortos.

4. Posibilidad de contar con un soporte físico adecuado (ordenador) y con suficiente capacidad de almacenamiento.

S. Acceso a un programa de gestión que permita llevar a cabo todas las funciones que requiera el trabajo en clase mediante textos.

Siempre que se trate de un corptts comercializado (como será el caso del sub-corpus de Cumbre, de próxima publicación) estas tareas deben ser realizadas por la e m presa responsable de su elaboración. Si se tratase de textos que el profesor añade a un corpus ya diseñado y estructurado, e l cor­pus maestro debe incluir en su diseño la posibilidad de ampliarlo y, en con­secuencia, permitir llevar a cabo esta tarea sin romper la armonía ya exis­tente en los textos recopilados.

3. Listados de palabras

3.1. Consideraciones previas

Como ya anoté anteriormente, la utilidad de los corpus lingüísticos se puso de manifiesto en el ámbito de la enseñanza de idiomas, primeramente a través de los listados de palabras más usadas, que sirvieron a muchos autores de manuales para seleccionar el vocabulario de los textos introduci­dos en cada lección.

Los listados de frecuencia no eran desconocidos para los autores de ma­teriales docentes, tal cual acreditan los nombres y estudios mencionados anteriormente. La historia de la enseñanza de idiomas cuenta con algunos ejemplos más sobre diversos intentos realizados para determinar y fijar e l mímero de palabras <<básicas» o más usadas, con la declarada finalidad de utilizar esos resultados en la enseñanza.

Para que tenga un grado razonable de fiabilidad, el listado debe reunir, al menos, dos requisitos, referidos a:

- La amplitud o extensión, que debe estar basada en muestraS repre­sentativas, de acuerdo con los objetivos o finalidades propuestas.

- El tamaño, que ha de sustentarse sobre una cantidad de palabras tal, que garantice la validez estadística.

41

Page 4: Utilidad de los corpus lingüísticos en el aula de español para ......En este caso es patente la utilidad de los listados de frecuencia. 3.2. Aplicaciones prácticas de los listados

En el ámbito del cspailol, el vocabulario fundamental de mayor relieve ha sido hasta ahora el de Vicente García Hoz ( 1953). Este autor hace refe­rencia a tres tipos de niveles léxicos:

usual (12.402 palabras), común (1.971 palabras) y fundamental (208 palabras).

Los criterios para elaborar tales listados fueron, al menos en parte, «peculia­res», aunque no carecían de aspectos valiosos. Garcfa Hoz fundamentó la elec­ción de 400.000 palabras sobre textos tomados de cuatro «aspectos de la vida>>:

l. la vida familiar (concretada en cartas p rivadas: 620 cartas), 2. la vida social indiferenciada (concretada en una variedad de perió­

dicos), 3. la vida social regulada (concretada en documentos oficiales: políti­

cos, religiosos y sindicales) 4. la vida cultural (concretada en textos tomados de los libros más

vendidos en aquellos años, sean del género que fueren).

De cada uno de esos cuatro sectores tomó 100.000 palabras. La suma de los cuatro bloques dio origen a un total de 12.913 palabras diferentes, con una frecuencia media de 100 (las denominadas «Usuales»).

Naturalmente, el método utilizado para seleccionar las voces condi­ciona sustancialmente los resultados. Si comparamos éstos con las palabras más frecuentes obtenidas de un sub-corpus de C11mbre (1995), con un total de cuatro millones de palabras (diez veces más extenso que el de García Hoz y diseñado sobre bases más representativas) referidas a la letra A (que equivale, aproximadamente, a un 1 O% del total del léxico), comprobamos que en la lista de García Hoz sólo aparece un 58,6% del total del vocabula­rio fundamental equiva.lente del mencionado sub-corpus. La desviación es, por tanto, notable. Muchas de las voces que contiene el listado de Garcfa Hoz y que no aparecen en el corpus, se justifican por el contexto histórico del momento y los valores propios de la sociedad en aquel entonces. Así se explica que el vocabulario fundamental de Garcfa Hoz contenga, entre las 2.000 voces más frecuentes, términos como:

adorar, adornar, agrupaci6n, alabar, allllr, amado, ap6stol, arca, artillería, ascender ... , ·

mientras que no figuran voces como:

42

aborto, accidente, acceso, actor, adi6s, aeropuerto, agrícola, alamw, amenaza, a11tena, asamblea, asesinato, asesino, atentado, autonomía, avi6n ...

Page 5: Utilidad de los corpus lingüísticos en el aula de español para ......En este caso es patente la utilidad de los listados de frecuencia. 3.2. Aplicaciones prácticas de los listados

Pero también puede apreciarse que entre las 2.000 palabras más fre­cuentes que aparecen en nuestro corpus, probablemente algunas no habrían estado ausentes del vocabulario de García Hoz si este autor hubiese reali­zado la recopilación con criterios más representativos. Se trata de palabras como:

adentro, adi6s, afuera, agradecer, aguantar, ajeno, aümentaci6n, amable, amenaza, amplio, aniUll, aprobado, área, arreglar, aun­que ...

El ejemplo ilustra, por tanto, la importancia del diseño de un corpus, ya que ello incide en los resultados. También se pone de manifiesto el grado de relatividad de cualquier listado de frecuencia, puesto que aquél siempre estará condicionado por el contexto que define cada periodo histórico.

Admitidos estos condicionantes, parece razonable concluir que, si una voz aparece muy a menudo en el corpus, su incidencia e importancia en el proceso comunicativo son muy elevadas y, por consiguiente, es más «renta­ble», en términos comunicativos, que un alumno extranjero aprenda esta palabra antes que otras de menor frecuencia y uso. En consonancia con esta norma, la solución más rápida y expeditiva es elaborar listados de frecuen­cias por tramos O as 800, 1.500, 2.000, ... palabras más frecuentes) y va­lerse de ellas para la redacción de textos, diálogos o ejercicios, segón pre­conice la metodología de base. Así se hacfa en los años sesenta con los métodos audio-orales. En este caso es patente la utilidad de los listados de frecuencia.

3.2. Aplicaciones prácticas de los listados de palabras

No es habitual que el profesor de idiomas lleve a clase listas de pala­bras, sin más, para trabajar con ellas o memorizarlas. Pero aunque los lista­dos de palabras en cuanto tales no sean recomendables como instrumento didáctico, sí tienen otras funciones positivas.

En primer lugar, Jos listados de palabras que pueden obtenerse de un re­pertorio de textos no se limitan al bien conocido listado alfabético de vo­ces. Pueden aportar otro tipo de información ótil,

a. Sobre la frecuencia de cada palabra en los textos analizados, o en el texto en el que se trabaja. La frecuencia léxica tampoco es de interés por sí misma, pero el profesor sí que puede aprovecharse de esa informa­ción para tomar determinadas decisiones, como serfa, por ejemplo, insistir más o menos en el aprendizaje de una voz según el grado de importancia que ésta tenga en el texto (hecho que deriva de su fndice de frecuencia).

43

Page 6: Utilidad de los corpus lingüísticos en el aula de español para ......En este caso es patente la utilidad de los listados de frecuencia. 3.2. Aplicaciones prácticas de los listados

Este hecho incide directamente en la eficacia docente y discente. Y no de­bemos olvidar que el aprendizaje de una lengua busca precisamente la ren­tabilidad comunicativa y ésta depende de la eficacia en el aprendizaje.

b. Sobre aspectos diversos de las palabras o léxico con que se tra­baja, como pueden ser:

44

b .l. El listado de voces con una determinada letra o secuencia in­termedia, prefijo, s ufijo o similar. En muchos momentos a lo largo de la docencia se hace necesario disponer de palabras que empiecen por retro-, hiper-, ... o que acaben en -dad ... o que contengan -rr-, -qu -, -sp -, etcétera. En estos casos el corpus es capaz de suministramos tal información en cuestión de segundos, tal cual sugieren Jos siguientes ejemplos:

-ZC- -QU -AD aborreu:a alambique prioridad aborreu:o alfeñique probabilidad amanezca almanaque productividad aparezcan aquí profesionalidad coovaleu:o Arequipa profundidad

arlequ(n progresividad -RR- arlequines propiedad arranque arquean proporcionalidad arranqué arqueo prosperidad arranques arqueologra proximidad cerrarse arqueológica cerrazón HIPER-cerré -SP- hiperactividad cerril asperezas hlperin Hación cerro asperjada hipertensos cerró asperjados hipertrofia cerrojo áspero cierra aspiraciones RETRO-cierran aspiramos retroceder

aspiran retrocedía relrocedido retrocediendo

b.2. De no menor utilidad es poder disponer de un listado de pala­bras pertenecientes a la parte de la oración deseada: nombres, adjetivos , etcétera. Tal li stado es viable solamente si el corpus está etiquetado a nivel básico (como se verá más adelante).

b .J. El lista do útil puede cifrarse en la obtención de palabras de una determinada extensión: de JO, 9, 5, .. . letras, al estilo de los ejemplos siguientes:

Page 7: Utilidad de los corpus lingüísticos en el aula de español para ......En este caso es patente la utilidad de los listados de frecuencia. 3.2. Aplicaciones prácticas de los listados

Palabras tk 12 letras alternativas complementen comprensible comunicación constitución consumidores continuación culpabilidad demográficas especulación

b.4. Listados inversos

Palabras de 3 letras con del las les los por que son ten una

La utilidad de los listados puede residir también en proporcionar información que se base no en la ordenación por el principio de cada voz, sino por las letras finales:

a biblioteca acaba dedica acercaba indica señalaba Bélgica hablaba tónica brillaba Guernica pasaba ' . mUSIC8 pensaba informática necesitaba practica calentaba práctica estaba blanca Córdoba bizca

Conviene advertir que no se trata de juegos más o menos intere­santes o di vertidos, sino de instrumentos que pueden resultar úti­les en un determinado momento, atendiendo a las necesidades y finalidades de cada clase en cada momento. Quien acostumbra a valerse de juegos y rompecabezas para el aprendizaje del léxico encontrará en este tipo de utensilios informáticos una ayuda tan valiosa como imprescindible. Sin perder de vista que el factor motivación también puede resultar beneficiado por actividades de este tipo.

b.S. Listados de sintagmas o palabras que concuerden en género o número.

Este tipo de listados amplía considerablemente el ámbito de utili­dad de los corpus, ya que permite al profesor disponer de mate-

45

Page 8: Utilidad de los corpus lingüísticos en el aula de español para ......En este caso es patente la utilidad de los listados de frecuencia. 3.2. Aplicaciones prácticas de los listados

rinles sobre los cuales ilustrar det.erminados comportamientos sintácticos del español, asf como determinadas reglas gramatica­les o usos fundamentales que afectan a la gramática. Estos lista­dos pueden obtenerse o bien como listados simples o bien como listados con su contexto (concordancias). Piénsese en la utilidad de elementos como los siguientes:

Secuencia de palabras con terminación -as -as ... alguaas scmiiiM

llclll He FlC 6S6!i 16!0 opcuulu .ohnbltl la e4.5cata. Yo ....,¡e IICJUI afgunu lto•llhu, pucn1, ~:as uno bol•lta,, cbpu~ pcll

alcun.u s-...-prauJ 1

HdlJ 1 MEX PRN; lt.l7 ho ~11ft fd81o m el q1e III.J lpCfiU &lltlf1US Mf'II"JikJ. Al~ de un cwrpo pct!«.to Hoy e --· HE31 BOL Plt.N: 614 ¡w • ·: · o de~ que~ • atpus tkttd• polilieü 1 ao ~e •OIID6 M C'!UC«<a 11

a rm21 Dt'gNI 1

ltell tOS POE; 1 )"29 cM dkrtltS y evc;hlllos, eon dicdonarios y OIMit t rmllS IN':Il.f"M eotl c lw respe1ab)eJ. M lwuon a di.spul»

al"lllas qu.Jmlc:a1 1

IIE51 BOLPRN;~to E!J.._.cld ~isndta~dcq~noea a.rma qu:flnkMdlilreftoobcdcce ac:p.*--.s.bet b

arqllit<C'I&.ftt IM"o'C'Iillk:u

ftEXl06 MEX ANT:A )611 m la Gbra de Carb Futtncs con. la,.,., arquiltdurat ltOVtlfaklla, l,.u c:lnco pkw que mll'lt ttp

Secuencia de palabras con terminación -iz -a ... --Hd»l 041 PRN; Jtj6 accwilldldohlot.doi ... de SU O....CIIfiOA. la atb'tl.....,..._ O:nl 8:-owM. n.YOdoallijol;; VD:U~t4

actri~ hall..,..

Uel))l C111 PRN; 2A65 IIc. Oc tdlnamknto. nadn. Bo~olmoai!WIJC al~ actrl l lla iJo.na con esos eSlrotu y vc:, cldai ras3ados. palo

rnacr~ c:on•'*b• 1

llECOS MEX ANT'.A 3.567 triliii&Gt, Wpcn '1 Nnoca ~ceno um JtM ~trúc cGn••l&a dencto <k 11 cual M JIIMI d tlliiCIIII!iMIO *' pmli&....... 1

licl2 HlS f'IOE; 1102 IIHtral,lllYCI&te ,._,a\lt.Udo~ll pcrditoloroa 'J~Ifdllllp.1¡odclol fod'~pk:d

ral.t Er• lk ll HIS POE: 2920

Secuencia de palabras con terminación -iz -o ...

Íllfdil. ·~·to 1

lrGOI 3 HE CVI!."C 174 l¡abk c<>mo la q\.ICI ctrn y noche conve~¡f• Mil:lR el lnfeUt lret~to, fll w pobre ambal wt!MIIftkano. Le ett m

Secuencia de palabras con terminación -os -os ...

.... , ... ' ltEOl 1 VEN PRN;P 1111 hlc!M. Fe:~ ÑIIOftlo MMcitla el CC*Iellkt Cft kK JJ•Jos (Oftdoot: <'011 d m'IIOque:e de 61 Pl~t¡OiM y aübcll sic&

Bajus htUimtos 1

He031 MEX PRN~ 117$ r Sllltncy l.umct6111p 11n 1tdón del mi¡mo a'*ltdc Bajos in$tln101. El U\PI\0. The 0\IWIIIan, U m.1n0 c¡-:.e 1111C1CC

"""'"~- r fkiiJ .. N8l:lf "'' ~~d .-fitpilnodlridlne ........ ~ .... ......,. ~· ,..,.d Ullifo

bamll5 urd!Mf'411: 1

UcO)I MEX PltN'; .tUl llktU CMW!IICII ~ lu ~CICiflb do kNI 30 bartOJ sardi~t«Of y de IUS L--ipu!tclonu,. I!'M CnfiUII&n pi'

46

Page 9: Utilidad de los corpus lingüísticos en el aula de español para ......En este caso es patente la utilidad de los listados de frecuencia. 3.2. Aplicaciones prácticas de los listados

Secuencia de palabras con terminación -e -e ... -· .. --HcOll MEX ,.,..: 411) ~a Copc:i • ~ «.wwo • b cwriNk c.,..... c.ldcn , "'dd a. tr:Cidlrio,... --H9»1 !JIU P1.H:P 1)97 ~ -..obn -.;c-., .. .......__ •c:ndnlk ..-mMaJc• cwjela ,--.. • ....._,_

tr(Jnk ,.cdcallllor

HcO)t Cto P'IVt )701 '*"- -<:4cM a a ~JacO. con O*? -so, "'">' C:HJt!Kt1 pncCblllc', de: cnia doftlliiúcal .,~ CIIM Di

Secuencia de palabras con terminación -a -a . .. OI.IIU l...ou l

HE006 MBX A~A 172J Ptdto d homl:n libre, r.r.y hlll"" d fiiMor, la Oll!lll Lota, ti mn~11 y 1~ ReiM Uabci1Óit OC!'OllaMOS

110006 MBX AN'I~A 1Wo se bu!Viir.i inc:xorablell'letlte en •uii'ICI ~IICOife. t. D1ullll IAet lo~ mú acta dra. l.m3gir~ cf'OII6r..¡a,

lfllmbduü'-tblllll 2

ffeol 1 YEN PRN;P 7117 ,ru.en.w y ai'WIIle:w que. le. hocen una Nb)'IIIJI•n.,. dll.nlstU Jltbtlrba~~a, Tlcfle 464 a.'lol y su nombre, Mncalbo,

HBOll VEN PltN:P 192'1 •ftilttbl y ,.,ck:W<I• k hocen un....,....,. t11mbtli J1i1Mirltet1a. Tiene 464 da y su flCIC'nbft, Mtfltlitlo,

d•u abta J

K8:I06 MEX ANT".A 1265 • wa c:uc:tp0 • Ooclrillll y p:w ... ~ - ....,. abu 1 ac.W1ka alftdeclor de la aax:d6n. -'\Oft'AI

Secuencia de palabras con terminación -o -o ... .... ,.~ HEOll PEA Plt.NJI to:f,S ~pan b uc:rilt:r.ty podlbft tn .n IIYM llabtre ~._ $in podtft:lck otlta •xi6o IOCI ~ y

IIIIIC'M,. tftftbdo

Kc0t4 He RCO;R 199 io clcnde ya nadie se dedditb a ptlk:lnr. d taAe ma.tStro tlllflt.do n1 ditttd&l al rlo. lll mri6n IOmiCdas

man.dado rompldO 1

llel l 1 He FIC: $1o40dw. -sr. abucb. - Y de puo, p¡w que ha¡at ~ti mandado t0111ptdo. dik q~.~e nostm(RMe un "mi..tor y utv

muKO lntlltlnllrlo

IIF.006 MBX ANT':A 216 hace de n lc objeto, w. (Wetido a un llbro, un mus~o'O lmlltlt~lrlo, un up:do nt que $61o le f:dtllri:an tu

m UJ¡;.o lltrftO 1

lklll l He F1C. 1216 pio de lo• ~l.li'iiiOOS La pid te le cubrió de un nlllj ¡;_O l.ltrna, ~r-mejvne 11 que pro5J!Craba en d dllleco .n

c. Sobre las palabras que suelen acompañar a determinadas vo­ces o que pueden aparecer en determinadas situaciones o contextos co­municativos. Los libros de texto ya suelen tener en cuenta estos hechos, aunque ello se haga de manera más intuitiva que experimental. Un cor­pus permite que el profesor compruebe por sf mismo qué palabras, por ejemplo, suelen acompañar con un mayor fndice de frecuencia a la pala­bra casa. Este sería un ejemplo real, basado en un corpus de un millón de palabras, pero que podría hacerse sin ninguna dificultad en cualquier otra muestra:

47

Page 10: Utilidad de los corpus lingüísticos en el aula de español para ......En este caso es patente la utilidad de los listados de frecuencia. 3.2. Aplicaciones prácticas de los listados

mi dec ir problemas bueno familia amas hacer hijo marido cosas padre hija trabajo mujer gente fuera hermano persona mañana ve:r. papá momento mamá madre días teléfono vivir años acá cosa tiempo pucna hijos tener señora chicos

Con esta información e l profesor tiene la posibilidad de orientar el aprendizaje del léxico en la dirección que más interese, tomando siempre como guía la rentabilidad comunicativa de lo que aprende el alum.no.

4. Las concordancias

Otro de los grandes pilares sobre los que se ha justificado la utilidad de un corpus es el de las concordancias léxicas. Por concordancia se entiende el conjunto de ocurrencias de una forma, con referencia explícita al con­texto en que dicha forma aparece. El contexto apona la información nece­saria para descubrir cómo «actúa» y cómo se «comporta» cada palabra cuando es utilizada por los hablantes nativos de una lengua. La gran ven­taja de las concordancias es triba en que cada elemento lingüístico se pre­senta arropado en su entorno tantas veces como se encuentre en un texto, de manera unificada, sin que haya necesidad de recurrir a la lectura secuen­cial de ese texto para recabar la información contextua!. Su presentación suele revestir la siguiente forma: - '' tlolll VAP...-iM Eco 1216 IIIICifeado Cll.,llloy por hOy, k 6niea ~ falno6Mb m d tfti.Wido 110 t6lo m Ycoet~~t¡. ni en Ammea

Hol l l VAF·vlii Eco 11'7 rioa I.Atlnl. ~n el mun6o la Unica concrpd6l! c:c:on<lt~llcn que c:Md lmpubando t.u «lúúbbm.W w c:l mWld

Ho lll VAP·Yiü Seo 130 paU coow!W.U que 1» Cl'llpN:ndi4o 111111 n:rorm.2 e«~~~4mka 1 Coodo 7 que tfd deMO de un;;a atnldun

tiolll vAF-v\il &o m 11 ~ '*' ... qii:01t c:o~: 11 po.ici6D ...-..,.,....-dicha.~,.... • ~ H9111 VAF·<fiH Eco 411 c:onomla de mcmdo d d~ 11 loll~ tdll'mka. pcw q~7, ponpe econom(a de rntn:ICSo ri.plf liol l l V AP·viii Eco 523 g.nn probkf•• que C<ll'll'rCHMurb. wnll polflka é!C'GIIÓifl lca «:nt~ en la n:viiii~M~Ción dd bolfvlllr. Una

HOJ I2 VABF-viii Seo S)) ldoldcl Olñbe pw. l~~mMt:lc la Wr¡nd6c ~b de r.rc1ilk. Eat. ~ ICAdria eeMI) o

HOII2 VABF..mEt:o»t drliiiCJOMOCIII;d:ñ'o..-IIWI'mla~ ~&m y la e; cióamc.. ta.p:tbesckllllcum

H0112 VABF·oñii Eto 550 te comcrelo de Am6ria. del Norte.&! l¡¡ p;ane ttolu~•,.lc.a en C'Jta I'C'III\Ióndcl arupotk 1ot li'C':J CONCRIC

llo122 VAP.Yiil Et.v J.O reocvpodO!I COQ loe subiMiklf de l:a C.omunkbd F..cvft6mka Eurupc.t y ~le tos~ hol:anck

Kol22: VAJI.vüi Eco 6"l ~pon. OC*~ • la c-i:lld t.t..Mia ~ Oc.q~~t neo ,..sm. .._.w- pr:

Hol22 VAP..vfii Eco 9)2 Veoc:z:ue&a ecnttfiOl ~ eeonom:fa r-mura ~ic:a q;Je p;w l6ol hl estado ICI'I!Atlmbndo por un M

Hol22 VAt'Z-vlll Eco 1199 Caldttt conciba ul lll eoontlm'a.ID ¡IO!fliQ t<On6m~ y ~tlllitltlcl. tllmpoco. Aqui QO se bt pl"nleo<lo

Hol2l VAP·vlii &:o 1221 nW ÍlfiiCIIpnta como «CCIaQm(~ 1111 JNIIftQ tt0114fnlcll. Hoy • miiiXj;IA e~~ ao. pabea. •tOI'IIIIOlmudlo

48

Page 11: Utilidad de los corpus lingüísticos en el aula de español para ......En este caso es patente la utilidad de los listados de frecuencia. 3.2. Aplicaciones prácticas de los listados

Holl2 VA.Jil.vW1 Eco IJ63 ue por r;wortotlt·OII~l«k ~potakt ~ pot la vf1 1bcaa, potla di~. pot

Hol22 V~ill feo 1"'26 U.ll d ¡ot*mo l'ra (~wdo Ctl $U potl\lcll «UIIÓIIIie:l. 'f cl lfthmo lkfte llWC ftC:'Iib, Ahon. tr 111

Hoi2J VABP· vlll f?co 2$1 is. La eñdt Clold orl¡lnada pof la poU'tlcn tron6ndtil que hAlle~ CMO gobierno y se w puu el

Como ayuda complementaria, es posible ordenar las ocurrencias de cada forma, no sólo por su orden de aparición, sino atendiendo a la primera letra de la palabra que sigue inmediatamente a la forma en cuestión; u or­denar las ocurrencias según el último signo de la palabra que precede a la forma alineada (orden alfabético reverso).

tcOJt6miCII 2 1

Holl i VAF-ril 6tllll0 paú CJ:WtllllftiJU._ .. ~- rdonna ~a r-so y que oU ócmro de ur.anuuc:twa

Holll VAF·'Ii~ &. m ...- ,..._. .. cocr~ .. poNtb C'lt'OMinia u:alndte~ Al~*' bollqo. u. Ho l!l V ABF·ri• F.co 266 isis. La trislt ct&4 pnmda por 1i1 poU\b ~ ck cale ¡oWflno. • !1 pwo. por cjrmpllo. d H01 12 VABF·vill Eco S33 ado$ del c.ribc p;ah fOIUentu la iMea:rad6fl «QQI6miu de b «si&!. &.ca QOÓICÍón: IIP:ftdtl':t. COfnO o

Uo lll VAP·vili f'..tl) 126 ~·es, hi•y por lloy, lo. Oniefi c:OII'I«pddtl «0t16mka en el m1.111..SO no ~lo en Ver.czueb ni en a~rka

H0112 VAOF·Yill Gco .S.SO re cornc:~eio <le Am.!ria. del None. & la pu1c ccqn6mlc:a en estu reunión tloc-1 ¡napo dt los IICs CONOtiC llo123 VABF·vlli Sto 1049 Midenn que w •Ilirio. en la citc:IIIIMiotil «0116mie:l en. que eMa~Mt vfvlauSo de uno inltaci(\n pi Hol%2 VAF-riii feo 641 esplliiiOII pw1 01r01 apltalode b CamuÑCIId Eton6tiniu Eurcpea. 0 a qur.a~o p!dkn Ílnehldyt; pe

llol22 YA.F-di 6c'O )0 ~u. lo& ~• la~ F~ IEM1pc:.l y f*\CIIIIII e S. 'P*",.._. Holl2 v,u;..¡¡¡ Eco tm obirtu:......,cc...~ b ~ ~ tto,.w-~m 1011 ,.&Ksdt r.or..._.. flo l23 VA8f.vl1l &10"12 es eJ pudiCo. ftOft b. ptc. a 11 polllb tc0e6.k:a neolib:tal. El\!~ ;.neo., YMIOK l ftl

Hol22 VAP-viil Eco 1:163 1.Je poi' C1vor le» rt".tpUnSablcs dt !:1 polílica ft.'CH'l6mloal por la vr:a lal. por la. via eomttdal, por liolll VAP~vllllko 411 conomí:t de tneru.do e• ~~kmen~ 1.1 Ptlldad K'Ot\ÓII~l<-a, por q~'t. ptHque teon011lf11 de mef'\:116o Jl¡l\lf

Holll VAP-vi!l Eco 227 l;t sesti&n J.\lbeffliii)Ctll.al que onn 11 poildófl eoon6miC'• ptqlbmente dldiL Entooc::et, vlltllOI a MOfiiOif

Holll VA.F.vUI &o 127 rico ~iN, m el miltldo la llAleaeoncc:pddn «w~6•ica q¡..e "'' implllAofldo l.u ~r.. Vl*l mund

Una rápida ojeada a estos datos revela el alto indice de preposiciones (a, de, en, por), de la conjunción copulativa y y del nexo que que acompa­ñan a la forma económica, entre otras posibles observaciones.

Es impottante resaltar la claridad y sencillez con que esta organización pennite reconocer los compuestos o locuciones más frecuentes de una pala­bra. En este caso observamos el alto índice de ocurrencias de la secuencia po­lítica económica (nueve veces), seguida de otras como: Comunidad Econó­mica Europea, integración económica y concepción económica, entre otras.

Todas las ejemplificaciones presentadas hasta ahora son exclusivas de formas o palabras aisladas, es decir, fruto de la selección y búsqueda de una única secuencia específica de letras. Sin embargo, también es posible obte­ner resultados y datos sobre determinados grupos de palabras: sintagmas, lo­cuciones, perífrasis verbales, giros, correlaciones, etc. He aquf un ejemplo:

lt:l'ler que 4 Eoll3 EABP..Yi!i eoo61 ho creci6o. por Rn.l.a (01\dición dGque vnn ll lcncr CIIIC valllu alJIIIIO da IUS CXKn¡W\c:tOJ de Yiljr; pa.ra Eolll EABF·vl.ll Eco4SI .s no lo l'la didiiiir.~ mellO$ vvno• • ctntr q11t rclrirnOJ 11• dt.a. kit que $1lm01 en com.l~ Eo113 eABMi.il Eco 4~ 4ol • ~e Utve•~tÓones ..- dlll van a ''""'que aecwdu, «ldnr un pknO dd Co.¡rt10,..,. !ollA UF--vlil RcJ 117 o wus., ,_ ...... (C) e.a.o. )'O a-w.cr ..... ~ tUo&o ~ pi5IICit'U,. OVI{ju.

Los resultados se pueden extender no solamente a palabras consecuti­vas, sino también a partrculas correlativas e interdependlentes separadas por otras palabras. A menudo la distancia que aleja a dos elementos lin-

49

Page 12: Utilidad de los corpus lingüísticos en el aula de español para ......En este caso es patente la utilidad de los listados de frecuencia. 3.2. Aplicaciones prácticas de los listados

güísticos no es predecible y puede variar en cada caso (por ejemplo, por un lado ... por otTo lado, tanto ... como). El ejemplo que sigue corresponde a la correlación no ... ni, para los casos en que la separación máxima entre ambas partículas no excede de cuatro palabras.

110 1111 1

Eoll) EABF~-wiJI&o IOi lea ttrridoru &:.1 •no y no M q,¡.ic:n los e.li.g_c. no ttndi"CmUS aqul, ni di:motf'K'in, ni juMida, ni \11~ c:co

Eoll3 EABF·"WUI.Eco .578 cz i&of;, no t6lo no tenemos peMiolltlaiao. que ... lltA6'err.os, nJ dquicra. ..... (0) ~.no au Eolll EABF·oriiifm 9.S& ~ ~ lo liM tedio p;115iWe pc111q1111a. si CS*O • ~ t.cioMdro. .. ~ M ......_ 0 sea. ...,.lft:t Eoll4 EAF--ñl Rt'-1 21.S los siboldc ~que Clll ~I IIIOII*IIlO 1M ~ v*-t., 111 hlbk. dipmo~, ~tillO q

r!ol24 EAf'.viJ Rel )19 o un lfi4Sooto muy in~eretat~le. sobm codo. cuando no l\li afdo ni p¡u;~or, 111 ove:j•. l'<ttquc, u.no ve el rnoando

eo 114 &\F-vll Rd 628 ro. qu. el upcmdor 110 quc:de ó:sorien~ado. E\0 110 -. "1 como lul dlkho d ldlct ~ t:1ftc6. 111 cOMO b

e.at& EAF-..U Rd 1001 ~ inrilidllyiiiiDidlolcR$.,_.,. lf.k .... purdat • conw. ¿ao? Al- J'Oa1a 1M ...,;e Bol U EAf'.y;¡ Jtd 1009 Ganda. '1 M!WIIIIO)'. Yo llewlbt plaMill.-. M po6 .,._.., Ull pno, inc~10 me qucñ:ln poner en un

S. Otras implicaciones del corpus en la enseñanza de E/LE

Anteriormente se hizo referencia a dos de los c.apírulos en que se ha centrado la utilidad de los corpus hasta el momento: los listados de pala­bras y las palabras en contexto. En ambos casos se ilustró el tema con ejemplos.

En lo relativo a los listados, es conveniente añadir a lo dicho anterior­mente que la prueba más fehaciente de la adecuación entre la realidad del uso y lo que ofrece un libro de texto reside en una comparación que esta­blezca los niveles de correlación entre las palabras más frecuentes de un corpus y las que ofrece un manua.l en concreto, tomando en consideración las formas no flexionadas y las flexionadas. La diferenciación entre formas flexionadas y no flexionadas no es inocua, ya que si una forma concreta aparece cien veces en un método, es más probable que se aprenda antes o mejor que otra que sólo aparece una o dos veces. Ejemplificando el tema en el verbo tener, se Uega a las siguientes conclusiones:

La frecuencia de tener, incluyendo todas las formas flexionadas, en un corpus oral de más de un millón de palabras, es del 0,96%. En relación con ese total de apariciones, tiene ostenta el récord de frecuencia con un 30%, tengo s igue muy de lejos con un 8,5 %. Todas las formas de indicativo agrupadas ocupan el 66% de frecuencia.

Esa misma frecuencia, en Cumbre 1, manual de español para extranje­ros que aquí tomamos como término de comparación, es del 0,77% para el total de tener. En relación con el total de este verbo, tiene ocupa también un 30%, tengo un 14% y todas las formas flexionadas del presente de indi­cativo equivalen a u o 66%. Pueden apreciarse los datos con más c laridad en el siguiente cuadro:

50

Page 13: Utilidad de los corpus lingüísticos en el aula de español para ......En este caso es patente la utilidad de los listados de frecuencia. 3.2. Aplicaciones prácticas de los listados

Ver bo tener y sus formas flexionadas en el cor pus Cumbre y en Cumbre 1:

S ub-torpus de Cumbre Cumbre~l (mécodo de español para extranjeros)

rendrá 95 terulnl 4

tendrán 32 tendrá.n 1 tendrás 9 rendrás 6 1endré 7 tendré 2 1endréis 1 rendremos 2 tendremos 50 tenéis 2 tendría 11 8 tenemos 13 tendña.is 2 TENER 13 rendrfamos 47 tengo 24 tendrfan 28 tenía 11 tendrías 2 ten!an 2 1enéis 32 tenido 6 tenemos 1377 tiene 50 tener 1009 tienen 8 tenga 260 tienes 10 tengáis 1 tuve 1 tengamos 66 tuvieron 2 tengan 140 tuvimos 1 tengas 24 tuviste 1 tengo 900 t'uvisteis 1 1enía 522 tuvo 2 1enfamos 95 tenían 141 tenías 27 (TOTAL de palabras del Cumbre-/ : 20.976) tenido 420 1eniendo 99 riene 3197 tienen 1119 tienes 397 tuve 83 tuviera 39 tuvierais 1 cuviéramos 12 tuvieran 16 tuvieras 5 tuvieron 51 tuvimos 67 ruviste 2 tuVO 124

(TOTAL de palabras del sulr<ol]lus: 1.102.643)

PORCENTAJES DE FRECUENCIA de tener; PORCENTAJES DE FRECUENCIA de te11er.

Sobre total: 0,96 % Sobre total: O, 77 % tiene: 30 % tiene: 30 % tengo: 8,5% tengo: 14% Formas de presente de indicativo: 66% Formas de presente de indicativo: 66%

51

Page 14: Utilidad de los corpus lingüísticos en el aula de español para ......En este caso es patente la utilidad de los listados de frecuencia. 3.2. Aplicaciones prácticas de los listados

La correspondencia no es exacta en todos los casos, pero sí razonable­mente aproximada y en tal sentido puede afirmarse que este manual se acerca a la realidad comunicativa en lo que se refiere a la presencia del verbo tener y sus formas.

Los resultados anteriores no deberían inducir a conclusiones sesgadas. El análisis del tema obliga a concluir que, si bien las distancias deberían ajustarse a ciertos límites, no es pasible reducirlas a cero, eJjminando todas las diferencias léxicas entre un corpus representativo de la totalidad de un idioma y un manual para la enseñanza de la lengua a extranjeros. Las razo­nes son de dos tipos: de orden metodológico y de orden contextua! (limita­ciones derivadas del contexto).

La metodología sobre la que se basa un manual condiciona de ante­mano el contenido que debe seleccionarse para la docencia, al menos en parte. Una metodología «tradicional» da prioridad a los aspectos gramatica­les, y el léxico, por ejemplo, no tiene par qué sujetarse a contextos o situa­ciones. En cambio una metodología comunicativa exige la selección de si­tuaciones comunicativas y contextos que conllevan el uso de vocabulario relacionado con tales parámetros. Si no existiese limitación en el número de situaciones seleccionables y en la amplitud con que cada una de ellas debe tratarse en el nivel elemental, las coincidencias con un corpus como Cumbre podrían aproximarse al lOO %. Pero dado que los libros de texto deben limitar el número de situaciones y la extensión de su tratamiento par razones externas al proceso comunicativo en cuanto tal, es imposible alcan­zar el grado de ex.baustividad que caracteriza a un corpus. Reflexiones que no deben utilizarse como disculpa, sino como justificantes de una realidad que se impone por necesidad y que deriva de las premisas específicas sobre las cuales se asientan tanto un corpus como un manual para la enseñanza a extranjeros, cada uno por su lado.

El contexto impone también sus exigencias. Tomar un corpus como punto de referencia para los manuales no ha de entenderse como si se tratase de un corsé impuesto desde fuem y ajeno a la dinámica derivada de la docencia, del qué y cómo se enseña. El corpus debe ser un punto de referencia básico (e incluso ideal), pero no es el único eje en tomo al cual se elabom un manual o materiales para la clase. En efecto, el cor­pus, de entrada, no puede recoger toda la lengua usada. En relación con las situaciones de la vida diaria, es también imposible encontrar en él to­das las concreciones que pueden darse en la vida real y en el ámbito de las re laciones sociales (por ejemplo, «para pedir un favor»). Esta limita­ción repercute en el vocabulario recopilado: si la situación concreta de <<Sacar un billete de avión>> no figura en el corpus, e l término avión ten­drá un menor índice de frecuencia. Circunstancias repetidas o similares de esta índole pueden bacer que algunas palabras no aparezcan (caso ex­tremo) o no alcancen la frecuencia necesaria para figurar en los tramos

52

Page 15: Utilidad de los corpus lingüísticos en el aula de español para ......En este caso es patente la utilidad de los listados de frecuencia. 3.2. Aplicaciones prácticas de los listados

de frecuencias altas (en las cuales aparecen las 1.000, 2.000, etcétera pa­labras más frecuentes).

El caso puede darse también en sentido contrario: si por circunstan­cias inevitables, derivadas de la misma selección, un corpus contiene varios textos o conversaciones en los que se habla del <<aborto» o de la <<planifica­ción familiar» (porque esos son temas candentes en un determinado mo­mento y, por ende, tema frecuente de comunicación), es probable que las voces relacionadas con este tema (aborto, abortar, etc.) aumenten conside­rablemente su índice de frecuencia y, como consecuencia de ello, aparez­can en tramos de frecuencia alta. Es evidente que si el tema del aborto no se toca en un manual para extranjeros, la palabra aborto no figurará en el listado de voces del libro. ¿Se da entonces alguna deficiencia en el manual? Afirmar que sí equivaldría a situamos fuera de una visión equilibrada y realista. Aparte del hecho de que términos de esta índole pueden ser consi­derados <<Circunstanciales», desde el punto de vista de su incidencia en la comunicación: su frecuencia en un corpus realizado diez años más tarde, si esta temática ha decrecido en importancia, sería, con toda seguridad, más baja.

Se impone, por tanto, admitir que los listados de frecuencia derivados de un corpus son puntos de referencia fiables, eficaces y útiles, pero no fuentes exclusivas y <<dogmáticas>>. Los vocabularios básicos deben utili­zarse por manualistas y profesores con gran flexibilidad y teniendo en cuenta la globalidad del uso y las restricciones y facilidades que derivan de la selección de un contexto determinado. Probablemente lo más útil que puede derivarse del listado de frecuencias de un corpus es que sirva de guía para deducir las contextualizaciones y situaciones que exijan tal vocabu­lario.

6. El corpus y la enseñanza de la gramática

En lo que respecta a la g ramática (morfología y sintaxis principal­mente) , la ayuda del corpus se centrará en dos ámbitos:

• Ofrecer información respecto a la conveniencia o no de incluir sintag­mas o estructuras determinadas que ofrezcan un nivel de uso sufi­ciente para justificar su enseñanza en los diferentes niveles de que suele constar un manual (1.0, 2.R, 3.R). Los índices de frecuencia de ta­les estructuras constituyen la referencia obligada.

• Ofrecer los contextos en que tales estructuras gramaticales suelen darse en el uso lingüístico. He aquí algunos ejemplos, centrados en sintagmas o formas usuales, como esta mañana, este aíio, este mes, les gusta, me gusta, me gustarla, nos gustaría:

53

Page 16: Utilidad de los corpus lingüísticos en el aula de español para ......En este caso es patente la utilidad de los listados de frecuencia. 3.2. Aplicaciones prácticas de los listados

t:OIII ~Ci

10111 e-1 Me

6()111 &l ..

fOIII &4 )k

00111 ~Me

F.OIII ~ ~

E0111 &.1 Me

EOIII 2..1 Me

2011 1 ~ Me

tttl IIQIIN 66

O. .no« dios. Lws Mlpd Od. G'•atocS • tttJ ~MIMM m la SER. O La ÜIÜC::I$ ICCOI • Ooots .- hc1110

A ~ -II!OIIdl .. ....._ tMa ...._ clcl,_. El Dllftdo. Aaoiril, d llbldrko .a&

fMa ....... MCai'O ~K 11-. ~.......e.,. .bwkt

A~ de lo6dioco.o ...._, •• aca ...._en El pi&..,... a~,.._~,.

Y nao ai. r.1 CfiiC' .. 1 ....,., t~ta ...... por.,. ab:io..lJflli Utf:wt ,_,)'O 1p11.,..,

E:RI .... na '-» manda!; ck • Xn~ s.ajeYo ~ ll

~ lsbu-. c:6nlo lo~~ no5 prorpone li1! MaAat~a p:ltl la tdlc.U611, ,_ C0114icb:ada.t. E V~n~~C~t.

lUrio o Cll plqllfll* a a!JUDOS de n~M:~Uo~ inYI~ tMa n'lalhna desde S~je\'0: F Haott '"" lA" pn'f"llll qw Wd

Otirtllll u ta trUM\aaa, c:so •f. to.: aviones conti!Wan patrvl_llnda por la

6te ..no 66-

U0 111 MAP 0t at~!Mia y podrl'a COI'ICttiM'SC potlll la .kjUt~ •nttnd do ~''' afio. Sobro mcdíodl11, c:l ~.sidmrc Solicu rue el ltwl~

H0121 MAP 01 ttiOO Niacloo:.l dari 1:. scqntsa eo lAS d ttdOI'IU ck tite lll'lo )'11 qw obctndnl la victoria. A$( lo 1Lfifm6d eatldld

U0121 MAF Po A u:x I'IIC:ióll :11 pMOrM'lll polftiC'o de ~tfO pcaltell nlll aJio de mil fiOWCÍM!ot I\IOYWIII Y CUQII'Otn que lot 11Mjk

lt0121 MAF Po tl.l.1klnet y c:omenurios sobre k puUlica llolCional en tfte allo di ¡ran cambio polftico. tNiricl 9 E:l veintiuno de

110121 MAF Po dof de~ se deAi'rol!l!Ñn los comicios (ecknlu t'!lle dG, pero c:-6mo te desllrroi!WWI m ~ lk la orien

lt01ll MAP Po pcndofu. a¡en:u de 'tiaje. ltneu llrcu t!lln:IPfill1, H it •'-na llmer lu¡:tr u ();lcrÑta. Pft'Cisamctlk 1*'1

lt0122 MDP O, Ida dc.cicllco vdndrincolloa, UK"-* clurWc bk ..... ck_tde d dos de diónlltft: &: *""CCIU ydol ~

H0122 MBF P., 1 u.--a ~~d CUIUO. • .... bfe ... peto..,...._ add ccwdlllórd c:n.e-. mor-H0114MC'· C. Y ...,dicr......,.eJ-., a.c.•••Jo .....,,OIIO!QI:i rzp'toeaMbulema

HOI14 NC- O. w ~de litft ca:ar:teio d pr'-ro *- eotr0 el& de-. r. " ...... ~ dd pai5 d poWtat t.. ... -ute IIXt 9

00111 & :1 C. ni6n de ata 6peR. que a v-.a 1 ver IQI4fu. y de ttU IML Plau y M:artln 1t.1a hcdlo ...a ~ff.a ~lime

110005 MJ Te de~ FQU,, pn ver, dico en au tmiiM. m tf.tt meto. PIR \'ler qiJI! dr.a eot~e~t:llmCIS la ho"' ¿ú, RAid

110 111 MAP 0t IDI &fl:ldc:l lemu del foro <~'te IC c:clebnd el y Clo tJte ~~ de enero, en ll UnivmilbS lb!!~ eOIIYOetd UOII-4 MC· Po 1at1e una audietM:::Ia. &t C\all, not r. ptOO'Ittlck para tMe muelo t iiCtO, dn que büca aban ~1"00' Wll tCSpuata

•10 124 MC· Cu la cokln.ia Roma. eslañtlabit'rtu 111 pútilk:o dt.ttt!\10 dlt nltll, hay por11 lodos los püblic:os. Todo lktw. u.n pritlcípl

H01 12 V·l Cl, deftnltion.t!*lte., el proyeeto vo. antes de tinalil.ar eJte mu a eon1ejo clo mil\i,.1too de mancrn~uc: stll.I¡)I'Obltlo

Ho 12J V •V Be: onbr 1~ eon8idOIS que se pn:tcnllllon d'ur.llllcl IOdo tite mu Oo abri 1 y que dieron pic:.a este pt(lp'llna eJpKilll ... ¿Qué profesor dudaría de la utilidad de esta infonnación en el aula para

decidir, por ejemplo, si determinadas secuencias deben mantener la priori­dad de que gozan o no en la praxis doceme? ¿O para extraer ejemplos de contextos de uso? De igual utilidad podrfan ser los ejemplos referidos a «ser» y «estar» (eterno problema en la enseñanza del español a extranje­ros), o a las fonnas verbales del pretérito indefinido frente al imperfecto de indicativo o frente al pretérito perfecto (otro de los temas siempre presentes en Jos libros de texto para extranjeros) y extraer de eUos las consecuencias adecuadas.

El uso de los pronombres personales precediendo al verbo, frente a su ausencia y en qué contextos, es objeto de prácticas frecuentes y reglas más o menos afortunadas. Ambos extremos pueden sistematizarse para la clase sobre los materiales que aporta el corpus:

54

Page 17: Utilidad de los corpus lingüísticos en el aula de español para ......En este caso es patente la utilidad de los listados de frecuencia. 3.2. Aplicaciones prácticas de los listados

ltl..... 12

00111 1-i Me 11 4*J111 es .. tlica • pea que C*li dcpon."vo, ~ tu tu• a kla pt11C*btt pan ~;t.ot:t d ~ dt ll pe.:

EOIII!-iMe ~·- ¡!! "' fp~~~-ll~k+'rl .. ltt .... ala•ll~......._queoolfOI't&llacJ

EOIII 1-1 Me 8 Y llorp la,.,.._ A Et .. • lel ..... lof ailoJ 110 Dlliel*ll. kla

00112 6-1 So a_..,...,,. • .._~a d ...._ • In,_.,, B No.,. Cl'tO CJIIC lit* .t. El! Jellir:bi a qgt ._

0011] E-l So .... ,.. ---'*<irqK blao. mbmlc ......... d ...... d .. ~ ... ~,.... ..

E0114 E-ll Ol C ~ ~ A 1M p1t1 la~ 1 uo.. Ea • airio ........ como a 4d:li

E0114 E-a 01 ~ tMao. 1111' d ~¡Wc:o. 1111 fcr~D~dc aCido 1» la:C~Mla ••• A FA dt&rúcl." .. .tdotL 8 En ddÍIIlich-:a. en d

lu CUSIA.n 2

E!OII4 S.l C. COII'IpoN:tiiC& del pblnett. porq...c oo~ ~a d io. ltt &USIA.n t'*-lotl ttl'lllll que proponemos cbdc b red~~ecj,ón

EOII" B-ll Po n dnr 11.1 opl.u6n de: porql)6 les VOI#'I '1 ~es lo que let rujian de dlot. pcaque a tn.l me b\ceruari11 ~rlos.. hro

Ju Jlijlari1 2

EOII) B-1 So que la mujer fj;~ can:mcJo tem:ao sobrGdJot y qoe ltt cu:.uarfa vlvlf ~n un 1nundo tt1 e.l q~~e hu.bk:ta mú ICUC'*"

00114 E-1 O. l, utltd ele q!M ttnu de: Jos~ a'.in no b:ti'IOi ha.blldolu ~U~IMia tlabl11. B Yo picniO lo mdmo q~.~e l<lfle, q.c es1c

....... ll

EOIII 8.& 0t M otqua:La. pao que: hlo Olido ar.JI!bos ddool dice, DO _. OJAA. )'O k:C1f0 la.,.... dt Xu '1 no Jt qol. que d ..

EOIII EW M& 110 .. r:tr11J 11im. t.l:pXO. quE quiere decir cm. pae .,_~C.._, Cldt PfO')'edo a¡ 'iu.6t>. t:a:1a JitO>'

fOIII a.¡ M& • ,.,.t........_ c*f ...._.que G:a. por et0 a mi .._,.C. ..... T aw qa ll, Cf1C scriiUII t.e. abldt., acltftl

EOIII 6-1 Me 1 8-. JO lo t~ p:ro ~» CS10J m ........... ..,. pMa d ldor ,........._ No a p:s&a .ab r quaia pa.. e

EOIII ~ lrrk No ..,. p:jla _.. T ..-fl ,_.. -rllim. p tt ~a..

"'-

EOtll E-4 01

fOil! fHie E()lll e.¡ So

'"·

•ruMA" 10 A 1111 nc fldtAn 101 WJIIIN•IQS, )'O creo ~ la hislori:l csd Uma

diiCdKiJ llf.ot;, ¡dl7, iOY Wlll dlica joven pero 1 mf me lltltAR CIQ:I C'dOS, aot I)Cqldo!J Qe!Q,S q\JC dc:mUQUa;n bos1

fw• q111 le al¡~ alkl rru al'.o. pero )'11 1c lli¡o. na '"' a~tan CfOII &lardu de Va!, Prbnero, ese romperse la ¡;u¡11

rM lllSltrla 119

EOIII 8-v Cl A H_.y una1.11tlma precuru:a ll"C mt llliUirfa h~t«Mc, Ol¡a, a w COI'IWbia. ala c:oruult.a ele lo

EOIIIlW Cu Mec~arla tlbu, dice 'l"ff tú baJ ~ tml¡o de Xn. ¿CJ

EOIII &1 Ed A S,,"" c~H~arra htOer ~ cCinlltntarios t'I'W ft:fml*i • eie U

EO 111 a.¡ Me l. )'1 lo ctoer. Mea 111n IIICmallO d ~ XM. pM) 111 t111 p.Marla ln-viür ~ M6ur Cor6a. Fei'IUI'I6o Xu. Meoftio G~

"" IM&'U61' t

EOIII E-& Me Yooott-. •aJc:*u r • ,_.,a. pdblaJ ttd..., lib....,_ T. -.e. a 00121 e..a.llo .._._....,...._...._.tllilckldcllqo•.,CV5 .. --.l1'/I,.JUdq.c41ijo-.-.eoJIIIC*bdlcr

E0t2l E-1 So H 8--. JO a Solla b C'C*Id r ..- a-16 _.....,,._._,..,_tosas 110& ~e ~~~~cal• 1111 w

EOI'll E-1 So .. o..-.. COil'JO' lb~ 'flllt: 11> ptml-r !lito. 1M p:t;Ñ .. ~O.W. *l!l.oke ICidG. JIORPlC xn que tip

1101 ti-tU• 10

EOJ 11 e. .. Ec ~ros ck: .,¡,¡: en csaa avca!klra, que a 11> mejor 1'10 oos ¡utta qU& •lf-9M. A Fwdona LuiSa. tn. ac ttllll que acud

EOII) e.ll Po Es dcc:it, no nM CUita q.._ que los pM1idos poiA~ se pe¡um. ... B Pe

EOII) e.v Ro hcdtC) An.uens.io 6jindose en los Mpeet~ poritiv~», ltOS 1~• que 110 tcJ dip que la vida es &o rr.cjor que ~t.ncmos

EOII) e.1 So et~.lillll dónde q UUWIOI lk p r o tenemos ctuo que no not , ..... cl1twDdo como os" o que no nosln.111rt, pero. no !it

EOII" S.v Cl

'"· '"*IID1arr.a S

1!01 13 S.l C. lt11en0 todo e.J M-.lrid de kl$ Avslriu y 1:1uen0r. pvc~ no~au.urla, nos a.\UW'I'a p que hl tenido UsiCd la ¡cnlikz

EOIIl S.t C. 1 Madñlt 4e b A.m. y WMo, fUe' nos psawfl., '* ptttrú Yl .. bi.IO!Iklo ullcd b ~de eompam%i

55

Page 18: Utilidad de los corpus lingüísticos en el aula de español para ......En este caso es patente la utilidad de los listados de frecuencia. 3.2. Aplicaciones prácticas de los listados

E0114 Eol 01 NIM ,...LII'ta que 111M dijenn de qui 1iM11i1rS no 11tmcK '**lo, q

EOill E.• P'V A N0J tlaciamol:- pn:pu p!ller:al 1 lk UO lllllllatlat'b q.ai'!Ja:l e-l p:lll O:.W" ck t.o.o pon. ese. • HoiiJ lotC• Jo 01. R UIÍ6CIIe ~,.,. a.l19- J .. cip qtll .. 801 ptüf'b ... kticitacioaa, petO.~ cpoW .. 'QA. 1•

WC11'4a ll

1!0111 &~Me ALOI' kPI'a .... Cih.ObdM~Miaistnde~Soal

ISOI t 1 8-1 Me ck anJpw (:Q llieno y ea !tro, ¿4p6 a 10 .- .., ce l illiU •li 01 la vick1 ¡c::lDOti so. tus~. 1 ..,t

OOI If J!..• Q Es unjut.&o de,..._"'*' u EW'• fftlldlo tuca. D No.d prol::llctN ea cnqt,~~t 10CSo tiC

EOIIf P..-1 01 ea primer Ju¡ar, picma la pteq-..e: á cru. q.e 11 te e••• IIJ,uidl como S4e.chot M3US. inmed~ p1truM q

"'·

EOI I4 E·l So

H0003MJC

1-101 14 MC· $o

l tl CUJIU 2

A Que~ los q...e n\llt le Jll.stiLn • ú. O Los nji1os de l\1 can. A Los ojos ~01

pt:m, Cuantkl le II.II.)IIUI 1.1.~ eMa'- ec ~e• u.t'IIO. quo putck., brillar, ¡ j te

ti ·~itDtill

B Q\ll &ftlbl. pul!ll, q"' le IIIUitlr'a a 11 dc-411.)'UMr. A Chile con hu~ 8 01& eue ti

La enseñanza de la lengua para flnes especiflcos ba acaparado la aten· ción en los últimos años. Y con toda razón, ya que muchos discentes de un idioma extranjero lo son precisamente porque lo necesitan para comuni­carse mejor en el ámbito de una determinada profesión, como la medicina, la electrónica, la informática, los negocios, etcétera. En estos casos es toda­vfa más necesario contar con dos ingredientes, tanto en los materiales de clase como en el enfoque docente: los listados de léxico y estructuras espe­cíficas y los contextos en los que ambos elementos se dan. Para el logro de tales objetivos es inestimable la ayuda que puede ofrecer un corpus: fi abili­dad de los recuentos léxicos por sectores y contextos (oracionales y textua­les). El utensilio ha nacido y empieza a ser conocido. Sólo resta ampliar su uso y perfeccionar su accesibilidad al usuario; en este caso, el profesor.

7. Los textos de un corpus como fuente de ejercicios

Los repertorios textuales no constituyen por sí mismos un conjunto de ejercicios o actividades que el profesor puede aplicar directamente a la clase. Sería equivocado aproximarse a ellos desde esta perspectiva. Los corpus constituyen, sin embargo, un conjunto de materiales lingüísticos susceptibles de convertirse en una fuente inagotable de referencia e inspira­ción para autores y profesores.

Uno de los inconvenientes habituales que acechan a autores y a profe­sores es la carencia de variedad en el uso de formas y palabras o en el uso de textos contextuali7..ados en s ituaciones determinadas. El corpus puede paliar esta dificultad propiciando que los ejercicios no se refieran siempre a lo que hacen los alumnos cada dfa o en cada clase. Con la ayuda

56

Page 19: Utilidad de los corpus lingüísticos en el aula de español para ......En este caso es patente la utilidad de los listados de frecuencia. 3.2. Aplicaciones prácticas de los listados

del corpus es fácil ampliar el horizonte situacional y formal. Además, la ti­pología de ejercicios habituales en el aula es susceptible de ampliarse a materiales del corpus. Piénsese, por ejemplo, en algunos modelos , como los siguientes:

a . Presentar un texto del cual se han extraído determinadas palabras -al azar - buscando formas determinadas (concordancias, adjetivos, ver-

bos ... )

b. Presentar un texto con lagunas, listando las palabras extractadas. c. Presentar un texto con lagunas y opciones de sinonimia para las

voces extractadas. Este tipo de ejercicio puede ser más sofisticado si lo hacemos con or­denador y éste cuenta con un diccionario de sinónimos y antónimos.

d. Reconstruir palabras en oraciones tomadas del corpus. e. Reconsnuir o:raciones del corpus a las que se les ha extractado la

parte final. f. Elaborar una gran variedad de ejercicios sobre preposiciones, ad­

verbios y similares, mediante el simple recurso a la eliminación y reconstrucción de estos elementos.

g. Organizar un texto que ha sido desorganizado. También esto puede hacerse de manera automática con la ayuda del ordenador, tanto para reconstruir como para deshacer.

Además, el profesor encontrará ayuda para:

- elaborar listados de palabras con terminaciones iguales o parecidas en los aspectos definidos,

- listar palabras acabadas en -as -as, -iz/a, ele, ... - listar palabras de igual longitud, - listar palabras acabadas en una determinada secuencia o que empie-

zan por una secuencia especial, - identificar palabras masculinas, femeninas, .. . - aislar palabras que contengan h, g, gue, güe .. . - seleccionar textos en los que aparezca un determinado número de

palabras: economía, casa, medicina, automóvil, ...

Parte de los ejercicios reseñados se generarán de manera automática mediante el correspondiente programa, el cual incluirá las pautas para eli­minar una de cada x palabras, que el alumno debe reconstruir; o para elimi­nar ciertas terminaciones.

De igual manera puede ser manipulado con vistas a la sustitución de plurales por singulares o viceversa, hacia el cambio de un tipo de oración

57

Page 20: Utilidad de los corpus lingüísticos en el aula de español para ......En este caso es patente la utilidad de los listados de frecuencia. 3.2. Aplicaciones prácticas de los listados

en otra, hacia la búsqueda de sinónimos o antónimos (mediante la ayuda de un diccionario interno), etcétera. Se trata, en todos los casos, de ejercicios estructurados que pueden revestir una gran variedad, dentro de la rígida ló­gica a la que están condicionados por el programa informático.

8. Los corpus etiquetados

Actualmente los corpus pueden ofrecer mayores posibilidades mediante la ayuda de la etiquetación. Etiquetar un corpus consiste en añadir a cada palabra una etiqueta con determinada información sobre ella. De esta ma­nera el ordenador es capaz de identificar, mediante las órdenes oportunas, si lo que en el texto es una secuencia de caracteres separada de las demás secuencias por un espacio en blanco es, además, un nombre, un adjetivo, un tiempo de pasado del verbo <<Ser», etc. Las etiquetas pueden revestir una

. gran complejidad: todo depende de las decisiones que se tomen a la hora de anotar la cantidad de información que deseamos consignar. El etique­tado para la clase de ElLE empieza a ser rentable con infonnación que contenga las partes de la oración. A partir de ahí un etiquetado será tanto más aprovechable en el aula cuanta mayor información pueda recabarse de cada palabra. He aquí un ejemplo de un etiquetado básico en el cual los elementos lingüísticos aparecen unidos a su categoría gramatical mediante un guión:

EI_ART Consejo_NP de. PREP Universidades_NP h~VHABER dejado. PART claro_ADV que_CONJ los_ART préstamos_N avalados..ADJ por.PREP ei..ART Estado_NP para que_CONJ los_ART estudiantes_N puedan_ V cursar.:VINF carreras_N universitarias_AOJ ,_PUNT son_VSER incompatibles..ADJ conYREP ei_ART d isfrute_N de. PREP cualquier_QUANT beca..N .• PUNT SegúnYREP este_DEM organlsmo_N ,_PUNT los..ART créditos_N se.PRON conciben_ V ccmo_CONJ una_ART retribución_N ~PREP

los..ART estudlantes_N con_PREP buenas_AOJ calificaciones_N académicas..ADJ ,_PUNT pero. CONJ con_PREP un_ART nivel_N de_PREP renta_N familiar..AOJ que_REL les_PRON impide_ V acceder_ VlNF a_PREP una..ART beca_N ._PUNT Por lo tanto_CONJ .YUNT se_PRON estima_ V que_CONJ en_PREP ei..ART periodo _N comprendido..AOJ entre_PREP los_ART años_N 1995_NUM y_CONJ 2004_NUM ,_PUNT unos_ART 250000_NUM estudiantes_N pueden_ V recibir_VINF un_ART crédlto_N · avalado_ADJ por_PREP ei..ART sector_N público..ADJ ._PUNT Con.PREP ei..ART préstarno_N concedido_ADJ ,_PUNT estas_DEM personas_N podrlan_V d isponer_VINF anualmente..ADV de_PREP 500000_NUM pesetas_N para,_PREP sufragar_VINF los_ART gastos_N que_REL ocasion~V estudiar_VINF un~ART carre~N universitaria..ADJ ._PUNT Los..ART mismos..AOJ prestatarios_N dispondrán_ V de_PREP un..ART periodo_N de_PREP carenci~N par11..PREP devolver_VINF ei..ART crédito_N ,_PUNT asociado_AOJ ai_CNTR momento_N en_PREP que_REL llogren_V encontrar_VINF empleo_N ;_PUNT en_PREP este_DEM sentido_N ,_PUNT las_ART adminlstraclones_N públicas_ADJ destinarán_ V casi_ADV 43_NUM millones_IN de_PREP pesetas_N par~PREP la..ART subvención_N de_PREP intereses_N y_CONJ avales_N ._PUNT

58

Page 21: Utilidad de los corpus lingüísticos en el aula de español para ......En este caso es patente la utilidad de los listados de frecuencia. 3.2. Aplicaciones prácticas de los listados

Con textos anotados de esta manera, el profesor ya puede pedir al orde­nador que substituya o elimine de un texto los nombres, las formas verba­les en infinitivo, los adjetivos, etcétera. Sobre esta base se incrementa noto­riamente la calidad y variedad de los ejercicios. El texto anterior podría dar origen a ejercicios como: Sustituye los nombres/preposiciones/artícu­los ... que faltan en el texto, Reconstruye los nombres/verbos ... con sus correspondientes terminaciones, etcétera.

Los corpus no tienen por qué ser considerados como algo cerrado y fi. nalizado. El profesor tiene la posibilidad de añadir sus propios textos a un corpus que ya posea. Sobre esos textos añadidos le será posible elaborar también ejercicios, aumentando las posibilidades de trabajo y, sobre todo, ajustándose mejor a los fines especiales de cada clase o temática.

Una última ventaja que debe atribuirse a los corpus reside en el hecho de que reflejan de manera más sobresaliente el uso lingüístico, mientras que los manuales suelen poner el énfasis en lo que es gramaticalmente co­rrecto. Esta realidad presenta también sus peligros: los corpus, en cuanto que son reflejo del lenguaje usado, pueden contener usos poco rigurosos en relación con lo que las gramáticas y manuales catalogan como 'correcto'. En tal caso el profesor tendría que ser capaz de tomar las decisiones opor­tunas para no introducir en el aprendizaje elementos que lo distorsionasen o entorpeciesen. No obstante, tal problema suele eliminarse de antemano si la empresa que comercializa un corpus restringe el ámbito de uso a lo que es gramaticalmente correcto y aceptado, objetivo con el que hasta el mo­mento se han hermanado las muestras publicadas.

Bibliografía

GAACIA Hoz, V. (1953), Vocobu/orío 1U11a/, común y fundomtnto/, Madrid, CSIC. INsmuro CERvANTES (1995),1nforme sobre Recursos Ungülsticos poro el Español, Alcalá

de Henares, Instituto Cervantes. INSTITUTO CERvANTES (1996), Informe sobre Recursos Ungiifsricos poro el Español (11):

Corpru escritos y orales disponibles y en desarrollo en Espar1o, Alcalá de Henares. Ob· servatorio Español de Industrias de la Lengua, Instituto Cervantes.

MÁRQUEZ VILLEGAS, L. ( 1975), Vocabulario del espG1íOI hablado, Madrid, SGEL. SANCHEZ, A., y otros ( 1995), Cumbre. Corpus lingiifsrico del espoflol contemporáneo. Fwr·

tlamenros, merodologfa y aplicaciones, Madrid, SGEL. SANCIIEZ, A., y CANTos, P. ( 1997), Sub-corpus 'Cumbre' ctiquerado poro 111 investigación y

práctico lingüística, Madrid, SGEL (de próxima aparición). SANCIIEZ LoBATO, J., y AoutRRE, B. (1992), Uxico fundamental del español, Madrid,

SGEL.

59

Page 22: Utilidad de los corpus lingüísticos en el aula de español para ......En este caso es patente la utilidad de los listados de frecuencia. 3.2. Aplicaciones prácticas de los listados

LOS MÉTODOS EN LA ENSEÑANZA DE IDIOMAS

AQUILINO SÁNCHEZ

Descripción detallada y analítica de los principales métodos que, a lo largo de la historia,

se han utilizado en la enseñanza de lenguas extranjeras:

MÉTODO INTERLINEAL, VfA MEDIA,

MÉTODO DE LA DOBLE TRADUCCIÓN, MÉTODO DIRECTO,

MÉTODO DEL SILENCIO, MÉTODO SUGESTOPÉDICO, MÉTODO AUDIO-ORAL. ..

SOCIEDAD GENERAL ESPAÑOLA DE LIBRERÍA, S.A.