dos pruebas de amplitud de memoria operativa para el razonamiento

29
Dos pruebas de Amplitud de Memoria Operativa para el Razonamiento Two working memory measures for reasoning Autores: Francisco Gutiérrez Martínez , Juan Antonio García Madruga , Nuria Carriedo López , José-Oscar Vila y José María Luzón Encabo , Localización: Cognitiva , ISSN 0214-3550, Vol. 17, Nº 2, 2005 , pags. 183-210 Correspondencia: Francisco Gutiérrez Martínez. Dpto. Psicología Evolutiva y de la Educación. Facultad de Psicología. U.N.E.D. c/ Juan del Rosal, 10 . Ciudad Universitaria. 28040 MADRID Tfno.: 91- 3987948 Fax.: 91-3987951- e-mail: [email protected]

Upload: truongdiep

Post on 06-Jan-2017

225 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Dos pruebas de amplitud de memoria operativa para el razonamiento

Dos pruebas de Amplitud de Memoria Operativa para el Razonamiento

Two working memory measures for reasoning

Autores: Francisco Gutiérrez Martínez, Juan Antonio García Madruga, Nuria Carriedo López, José-Oscar Vila y José María Luzón Encabo,

Localización: Cognitiva, ISSN 0214-3550, Vol. 17, Nº 2, 2005 , pags. 183-210

Correspondencia: Francisco Gutiérrez Martínez. Dpto. Psicología Evolutiva y de la Educación. Facultad de Psicología. U.N.E.D. c/ Juan del Rosal, 10 . Ciudad Universitaria. 28040 MADRID Tfno.: 91- 3987948 Fax.: 91-3987951- e-mail: [email protected]

Page 2: Dos pruebas de amplitud de memoria operativa para el razonamiento

1

Resumen

La concepción de la memoria a corto plazo como una memoria operativa (MO) ha permitido analizar e interpretar en forma productiva las diferencias individuales que se observan en la ejecución de tareas cognitivas complejas, como el razonamiento o la comprensión lectora. Sin embargo, permanecen sin resolverse algunas dificultades relativas a la medida de la MO, principalmente la forma de involucrar el doble componente de almacenamiento-procesamiento que se le atribuye. En este estudio se proponen dos nuevas medidas de la amplitud de la memoria operativa para el razonamiento. La estimación se realiza a partir de un índice de recuerdo, según un procedimiento semejante al propuesto por Daneman y Carpenter, (1980) en su ya clásica “Prueba de Amplitud Lectora”. Sin embargo, en lugar de utilizar una tarea de lectura como tarea secundaria, las pruebas de amplitud de razonamiento se basan en una tarea de inferencia –bien con analogías verbales, bien con anáforas–. La demanda de un procesamiento más profundo y semántico y específicamente ligado a las capacidades de razonamiento permite hipotetizar que estas nuevas pruebas serán más sensibles a las diferencias individuales existentes en el razonamiento deductivo. Los resultados muestran que las pruebas de amplitud de razonamiento, y en particular la prueba de analogías, correlacionan mejor con la ejecución en diversas tareas de razonamiento deductivo que la prueba de amplitud lectora. La diferente implicación del Ejecutivo Central en las diversas pruebas de memoria se utiliza como marco explicativo básico de este estudio.

Palabras clave: memoria operativa, razonamiento, prueba de amplitud lectora.

Page 3: Dos pruebas de amplitud de memoria operativa para el razonamiento

2

Abstract

The conception of short-term memory as a working memory (WM) has allowed a productive analysis and interpretation of individual differences in a diversity of complex cognitive tasks, such as text comprehension and reasoning. However, important problems related to the measurement of WM remain, particularly those concerning how to account for its dual processing-storage function. Two new WM measures for reasoning are proposed in this work. Their rationale is similar to that of Daneman and Carpenter’s (1980) classical “Reading Span Test” (RST). However, instead of using a reading task as a secondary task, our Reasoning Span Test employs an inferential task based on verbal analogy or anaphora. These new tests demand deeper semantic processing usually involved in the ability to reason. We therefore hypothesize an increased sensitivity to individual differences in reasoning abilities given these new reasoning span measures. Our results confirm this by showing that reasoning span measures, particularly analogy, correlate with the diverse reasoning measures better than the RST. We discuss the results as reflecting different processing demands placed upon the Central Executive for reasoning versus reading span measures. Key Words: working memory; reasoning; Reading Span Test.

Page 4: Dos pruebas de amplitud de memoria operativa para el razonamiento

3

Introducción

Como bien es sabido, el concepto de “memoria operativa” (MO) se introdujo en la Psicología Cognitiva fundamentalmente a partir del trabajo de Atkinson y Shiffrin (1968, 1971), en el que comienzan a contemplar la denominada “memoria a corto plazo” (MCP) como una memoria activa –una memoria “en funcionamiento”– y no únicamente como un almacén de información; lo que supone la superación de la visión tradicional puramente estructuralista del sistema de memoria humana. Posteriormente, Baddeley y Hitch (1974) consolidarían este nuevo enfoque al proponer un modelo en el que, reconociendo y enfatizando la naturaleza activa de la MCP, ésta se analiza explícitamente en términos de una memoria “operativa” o “de trabajo” (working memory) dentro del funcionamiento cognitivo general; en concreto, se concibe como la capacidad que permite manipular y mantener temporalmente la información que se va necesitando durante la realización de cualquier tarea cognitiva.

En referencia a este planteamiento básico, cabe destacar dos aspectos relacionados que han tenido –y siguen teniendo– particular trascendencia dentro del campo. Por un lado, el modelo de Baddeley y Hitch (1974; véase también Baddeley, 1986) se opone a la inicial visión de la MO como una capacidad simple de carácter general, presentándose como un sistema complejo constituido por un “ejecutivo central” y dos subsistemas esclavos: el “retén fonémico” (que después denominarían “lazo articulatorio o lazo fonológico”), y un componente periférico análogo, pero encargado de la información viso-espacial. Por otro lado, desde el punto de vista funcional se asume que este sistema tripartito de memoria no sólo se ocupa del almacenamiento temporal de la información sino que también interviene de forma simultánea en su control y procesamiento activos. Este es el sentido en que se le atribuye una naturaleza "operativa", si bien el modelo reconoce limitaciones estructurales en cuanto a capacidad y permanencia de la información en el sistema.

Precisamente, en relación con el manejo de estas limitaciones, el “ejecutivo central” (EC, en adelante) es el que se postula como componente central o “director”, pues no sólo se encargaría de controlar y coordinar los otros subsistemas, sino también de llevar a cabo los procesos de control implicados en las estrategias de codificación y recuperación de la información, los procesos atencionales y la manipulación del material mantenido en los sistemas subsidiarios. Además, sería también el encargado de controlar y poner en marcha los procesos necesarios para la transferencia de la información al almacén a largo plazo (MLP), así como la recuperación e integración de la información proveniente de éste almacén; si bien –tal y como se propone en una última revisión del modelo (véase Baddeley, 2000)–, estos procesos se realizarían por mediación de un nuevo componente, el denominado “retén episódico” (episodic buffer; véase la Figura 1).

******Insertar la Figura 1 por aquí****** Memoria operativa y diferencias individuales

Con este modelo básico de MO se ha pretendido dar cuenta de múltiples datos y fenómenos no sólo sobre el funcionamiento de la memoria (Baddeley, 1990, 1992), sino también sobre como ésta interviene dentro de la cognición en general (véase p. ej., Richardson et al., 1996); lo que explica que actualmente el concepto de MO se haya convertido en un referente central dentro de los modelos de funcionamiento cognitivo y tanto en relación con las habilidades de pensamiento más generales, como en relación con tareas específicas. Sin embargo, junto a este claro consenso sobre el importante papel de la MO en la cognición, también se ha producido un notable desacuerdo sobre la mejor manera de conceptualizarlo, habiéndose desarrollado y propuesto un amplio número de teorías que difieren tanto en su rango de aplicación como en sus postulados concretos (véase Miyake y Shah, 1999). Por supuesto, estos nuevos desarrollos se alejan en mayor o menor medida del modelo original de Baddeley; si bien, desde un punto de vista general, se ha seguido reconociendo la utilidad de una propuesta que combina distintos componentes especializados con un control ejecutivo central y en la que se destaca su capacidad limitada como principal fuente de restricciones en la ejecución (Miyake y Shah, 1999). En particular, este último supuesto –la idea de una

Page 5: Dos pruebas de amplitud de memoria operativa para el razonamiento

4

capacidad limitada– es compartido por la mayoría de los modelos y constituye, de hecho, el punto de partida de la amplia línea de investigación que se ha generado con el fin precisar el papel de la MO como posible fuente de las diferencias individuales observadas en la ejecución cognitiva. Sencillamente, desde este enfoque diferencial, se asume que la capacidad limitada de la MO impone restricciones de manera variable entre los individuos, lo que explicaría –al menos, en parte– su mejor o peor desempeño en tareas con fuertes demandas cognitivas.

Muchos de los estudios empíricos realizados según este planteamiento tienden a mostrar, en efecto, una relación clara entre las estimaciones de la MO de los sujetos y su ejecución en distintas tareas; lo cual se ha puesto especialmente de manifiesto respecto a las diferencias individuales observadas en ámbitos particularmente demandantes, como el de la comprensión lectora y también en el del razonamiento. En conjunto, sin embargo, los resultados obtenidos no ofrecen un patrón completamente consistente; lo que ha llevado a poner en evidencia las dificultades metodológicas existentes en torno a la evaluación de la amplitud, supuestamente variable, de la MO (véase p. ej., Phillips y Forsaw, 1998). En función de los diferentes modelos teóricos de partida se han propuesto distintos tipos de medidas no estandarizadas que, por tanto, no ofrecen garantías acerca de su fiabilidad y validez (véase p. ej., Waters y Caplan, 1996). De hecho, las correlaciones encontradas entre las mismas han sido relativamente pobres (Gilinsky y Judd, 1994; Elosúa, García Madruga, Gutiérrez, Luque y Gárate, 1997), con lo que resulta dudoso que todas ellas incidan en el mismo tipo de capacidad. Esto es lo que explica en parte el hecho de que aún se mantenga muy viva la controversia acerca de una cuestión capital dentro del campo: la naturaleza general o específica de la MO. Mientras que los resultados de algunos estudios sugieren la intervención de una capacidad general independiente de las tareas concretas a las que se aplica o con las que se evalúa, en la línea del EC de Baddeley (véase p. ej., Kyllonen y Christal, 1990), otros parecen reflejar la actuación de dispositivos de procesamiento más específicos; en concreto y en correspondencia con los subsistemas del modelo de Baddeley, se ha barajado la hipótesis de un doble ejecutivo, uno especializado en la representación y manejo de la de la información simbólico-verbal y otro encargado de la información espacial (Daneman y Tardif, 1987; Shah y Miyake, 1996). En la actualidad, no obstante, esta controversia parece tender a suavizarse al reconocerse la incidencia de ambos tipos de factores (generales y específicos) en la ejecución y, consecuentemente, la necesidad de que los modelos de MO integren múltiples componentes con diferentes funciones (véase Baddeley y Logie, 1999; Capon, Handley y Dennis, 2003; Engle, Kane y Tuholski, 1999; Rosen y Engle, 1997).

La raíz del problema, obviamente, es de orden teórico y tiene que ver con la dificultad de articular en las medidas la doble función (de almacenamiento y de procesamiento) que se atribuye a la MO en la tradición abierta por el modelo de Baddeley y Hitch; sobre todo al no estar claramente –o unilateralmente– repartidas entre los componentes del modelo. Obviamente, sólo a partir de medidas independientes de la carga que suponen ambas funciones puede establecerse si los aspectos del procesamiento específicos de las tareas, están o no contribuyendo significativamente en las estimaciones de amplitud; y, consecuentemente, sólo así puede decidirse si la ejecución depende o no de capacidades de MO específicas. Sin embargo, puesto que se asume que ambos aspectos se mantienen a partir de (compiten por) los mismos –y limitados– recursos, su relación será de transacción o “balance” (trade-off) en su consumo, con lo que resultará difícil separar ambos componentes en las medidas obtenidas. Precisamente, ha sido en la perspectiva diferencial que estamos considerando en la que se ha enfatizado, no tanto la limitación global de los recursos disponibles en la MO –que se asumen relativamente constantes–, como la consecuente necesidad de compartirlos y gestionarlos adecuadamente para las funciones simultáneas del almacenamiento y del procesamiento. En este sentido, se ha partido de la idea de que la amplitud y funcionalidad de la MO no atañe a una capacidad absoluta, sino relativa a la eficacia con que se realicen las operaciones

Page 6: Dos pruebas de amplitud de memoria operativa para el razonamiento

5

específicas de las tareas: cuanto más eficaz sea el procesamiento menos recursos consumirá, lo que se traduciría en una ampliación funcional de la capacidad de almacenamiento.

La “Prueba de Amplitud Lectora”

Este tipo de planteamiento es el que subyace a una gran parte de la investigación sobre el papel de la MO en la cognición y, de hecho, constituye el fundamento en el que se apoya el tipo de medida que se ha utilizado predominantemente y cuyo principal referente sigue siendo la “Prueba de Amplitud Lectora” (en adelante, PAL) de Daneman y Carpenter (1980; véase la adaptación española en Elosúa, Gutiérrez Martínez, García Madruga, Luque y Gárate, 1996; véase asimismo Gutiérrez-Calvo, Jiménez y Castillo, 1996). Frente a las medidas tradicionales de memoria a corto plazo –que sólo implican demandas de almacenamiento–, esta prueba constituye un intento explícito por involucrar los dos componentes de la MO, procesamiento y almacenamiento, en su dinámica interdependiente –y mutuamente restrictiva– combinando dos tareas. En su versión más clásica, los sujetos deben leer una serie de frases no relacionadas y al final tratan de recordar (en orden) la última palabra de cada una de las frases leídas. El número de frases aumenta progresivamente (de 2 hasta 6 frases), de manera que el máximo número de palabras finales que el sujeto es capaz de recordar (entre 2 y 6), se toma como un índice apropiado de la amplitud de su MO. Obviamente, en este contexto, se asume que la lectura de las frases carga el componente de procesamiento, mientras que la recuperación de las palabras incidiría sobre la capacidad de almacenamiento. Puesto que ambas funciones compiten por unos recursos limitados, se supone que los buenos lectores, al ser más eficientes en su procesamiento, podrán dedicar más recursos al almacenamiento, lo que se reflejará en un mayor número de palabras recordadas; de ahí que los autores propusieran esta prueba como una medida de la MO específica para la comprensión lectora.

Ciertamente, se han encontrado significativas correlaciones entre la PAL (en diferentes versiones) y diversas medidas de comprensión lectora (véase Baddeley et al., 1985; Carpenter, Miyake y Just, 1994; Daneman y Carpenter, 1980, 1883; Daneman y Tardif, 1987; García Madruga et al., 1997); y ha servido incluso para establecer relaciones entre la MO y aspectos específicos de la comprensión, tales como la integración de la información o la elaboración de inferencias (véanse p. ej., los estudios de Estévez y Gutiérrez-Calvo, 2000; Gutiérrez-Calvo, Castillo y Espino, 1996). Pero la capacidad predictiva de PAL respecto a la comprensión, se ha confirmado también independientemente del contenido de la tarea –p. ej., utilizando material numérico en vez de verbal (véase Oakhill, Yuill y Parkin, 1986, Yuill, Oakhill, y Parkin 1989; García Madruga et al, 1997)–. Y, por otro lado, la medida también se ha mostrado predictiva de otros aspectos del funcionamiento cognitivo, especialmente aquellos que tienen que ver con la adquisición de nueva información y su posterior recuerdo (Engle, 1996); todo lo cual sugiere que se trata de una estimación de la capacidad de algún componente central de la MO y no de susbsistemas específicos (Baddeley, 1990; Baddeley y Hitch, 1994; Conway y Engle, 1994; Engle y Conway, 1998). A fin de cuentas, incluso si asumimos la hipótesis de una capacidad de MO relativa a la eficacia del procesamiento específico, el balance y adecuada gestión de los recursos para las dos funciones simultaneas –procesamiento y almacenamiento– también reclama fundamentalmente el control y coordinación por parte de un EC de dominio general. En este sentido, algunas recientes propuestas defienden la idea de que la ejecución en la PAL y pruebas similares probablemente refleja el funcionamiento del EC en relación con alguna de sus funciones. Concretamente, se ha considerado como posible índice de control atencional –en términos de capacidad de inhibición (Engle y Oransky, 1999; Rosen y Engle, 1998) o susceptibilidad a la interferencia (Withney, Arnett y Driver, 2001)–, aunque también se ha sugerido que puede estar relacionada con aspectos relativos a la velocidad de procesamiento, sobre todo en estudios evolutivos sobre las diferencias que se producen con la edad (Byrne, 1998; Fry y Hale, 1996; Salthouse y Meinz, 1995).

Page 7: Dos pruebas de amplitud de memoria operativa para el razonamiento

6

Lo cierto, en cualquier caso, es que también existen múltiples estudios en los que o bien no se han encontrado las correlaciones esperadas entre los índices obtenidos con la PAL y medidas de comprensión (Baddeley, Logie, Nimmo-Smith y Brereton, 1985; Caplan y Waters, 1999; Light y Anderson, 1985), o bien no han sido mayores que las encontradas con tareas de amplitud simples (de memoria inmediata) que supuestamente sólo inciden en el componente de almacenamiento (véase Engle, Carullo y Collins, 1991). Los resultados quizá hayan sido particularmente inconsistentes en el campo del razonamiento (véase Logie y Gilhooly, 1998), si bien las relaciones entre razonamiento y PAL resultan claras cuando se comparan los sujetos más extremos (altos y bajos en MO; véase Meilán, García Madruga y Vieiro, 2000).

Memoria operativa y razonamiento

Las principales teorías sobre razonamiento, han reconocido explícitamente el papel de la MO en los procesos de inferencia. En particular, la teoría de los "modelos mentales" (TMM) incorpora la MO como base de sus principales planteamientos y predicciones (véase Johnson-Laird, 1983; Johnson-Laird y Byrne, 1991, 2000). Según esta teoría, el razonamiento es un proceso esencialmente semántico por el que el sujeto trata de representar los “modelos de la situación” compatibles con el significado de las premisas, a fin de derivar una conclusión informativa. Estos modelos mentales se construyen, se mantienen y se manipulan dentro de la MO, de manera que su amplitud limitada se identifica como la principal fuente de restricciones en la ejecución: cuanto mayor sea el número de modelos a construir para establecer la conclusión, más difícil será el problema (véase en la Tabla 1 la representación prevista en relación con las principales conectivas en el razonamiento proposicional). Siendo así, en ciertos casos podría comprometerse la capacidad disponible o incluso excederse; de ahí que se postule, adicionalmente, la necesidad de un procesamiento “estratégico” que permita manejar eficazmente la información dentro de los límites de la MO. En este sentido, se asume que el razonador sigue, en general, un principio de economía cognitiva por el que sólo representa explícitamente la mínima información necesaria para dar una respuesta.

******Insertar la Tabla 1 por aquí****** A partir de este planteamiento, la teoría permite dar cuenta de gran parte de la evidencia recogida en torno a la ejecución con tareas de razonamiento deductivo y, particularmente, de razonamiento proposicional, en las que el razonador debe hacer inferencias a partir de premisas que incluyen las principales conectivas lógicas (conjunción, disyunción, condicional, etc.). Por ejemplo, la teoría predice acertadamente que los problemas de conjunciones –cuya representación requiere sólo un modelo– serán más fáciles que los problemas de condicionales –que usualmente requieren construir múltiples modelos– (véase la Tabla 1). De acuerdo con el principio de economía cognitiva, la teoría postula que al interpretar premisas condicionales (Si p, entonces q) el razonador inicialmente tiende a representar de forma explícita sólo el primer modelo (P Q); con lo que también puede explicar el hecho de que las inferencias derivadas a partir de este primer modelo –la correcta “Modus Ponens” (MP: p, luego q) y la falacia de “Afirmación del Consecuente” (AC: q,

luego p) sean significativamente más frecuentes que las derivadas a partir del despliegue de los otros dos modelos restantes (¬P Q; ¬P ¬Q) relativos a la negación del antecedente: la inferencia correcta “Modus Tollens” (MT: no q, luego no p) y la falacia de “Negación del Antecedente” (NA: no p, luego no q). Dicho de otro modo, la TMM predice acertadamente que realizar la inferencia válida MP y la falacia AC será relativamente fácil, dado que sólo reclaman representar el primer modelo. Por el contrario, realizar la inferencia correcta MT y evitar las falacias (AC y NA), será más difícil puesto que requieren necesariamente desplegar los modelos relativos a la negación del antecedente (véase p. ej., García-Madruga et al., 2001; Gutiérrez et al., 2002).

Obviamente, este tipo de planteamiento, en cuanto implica representaciones semánticas y una actuación estratégica, resulta acorde con la idea de que es la capacidad del Ejecutivo Central la que está más comprometida en los procesos de inferencia y, por tanto, la

Page 8: Dos pruebas de amplitud de memoria operativa para el razonamiento

7

más directamente involucrada en las diferencias individuales observadas. De hecho, múltiples estudios realizados con el denominado paradigma de la doble-tarea, han mostrado el efecto disruptor que en las tareas de razonamiento tienen otras tareas concurrentes que supuestamente detraen recursos del EC (Baddeley, 1986, 1990, 1996; Toms, Morris y Ward, 1993; Klauer, Stegmaier y Meiser, 1997), siempre que la carga que suponen sea lo suficientemente alta (véase Halford, Bain y Maybery, 1984; Gilhooly, Logie, Whetherick y Whynn, 1993). En este sentido, y en relación con los problemas de razonamiento proposicional, la predicción general ha sido que los razonadores con mayores recursos de MO, tenderán a realizar mayor número de respuestas inferenciales correctas y menor número de falacias, que aquellos con menor amplitud de MO, lo que estará relacionado con su mayor capacidad para representar y manejar múltiples modelos. Por el contrario, los sujetos con una MO baja mostrarán mayor tendencia a respuestas basadas en estrategias de procesamiento poco demandantes –como la comentada anteriormente– o directamente no inferenciales –por ejemplo, en los condicionales se pueden dar respuestas simétricas respecto a la premisa categórica, que solo implican emparejar superficialmente los términos del enunciado–.

Estas hipótesis se han comprobado de forma directa en estudios como los de Meilán, García Madruga y Vieiro (2000), en los que se compararon las respuestas de sujetos Altos y Bajos en MO respecto a dos diferentes tipos de problemas condicionales (con formulaciones “si-entonces” y “a menos que”); o los de Gilhooly et al. (véanse Gilhooly, Logie, Wetherich y Wynn, 1993; Gilhooly, Logie y Wynn, 1999) en los que se exploraban las distintas estrategias utilizadas por los sujetos en el razonamiento silogístico en relación con la amplitud de MO. Este tipo de evidencia, sin embargo, no se ha visto claramente confirmada en los estudios correlacionales, en los que con frecuencia diversas medidas similares a la PAL de Daneman y Carpenter, se han mostrado poco estables o escasamente predictivas de la ejecución en razonamiento (véanse García Madruga, Gutiérrez, Carriedo, Luzón y Vila, 2004; Markovits, Doyon y Simoneau, 2002). Un caso aparte es el estudio de Barrouillet y Lecas (1999; véase asimismo Barrouillet, 1996; Kyllonen y Cristal, 1990) en el que se encontró un correlación alta entre MO y razonamiento condicional, aunque los sujetos estudiados eran niños y adolescentes quienes suelen mostrar intercorrelaciones más altas entre diversos componentes cognitivos (véase, García Madruga et al., 1997).

De acuerdo con lo dicho, pensamos que las dificultades de PAL en este contexto, pueden tener un doble origen. En primer lugar, si las diferencias relevantes en relación con el razonamiento atañen a algún aspecto del funcionamiento del Ejecutivo Central –como suponemos–, la tareas para la medida de la MO implicada deben suponer suficiente carga en el componente de procesamiento a fin de que se pongan de manifiesto las diferencias existentes. Esto, sin embargo, no está garantizado en la PAL en su versión clásica, dado que la lectura de frases puede realizarse de forma puramente superficial –no semántica– al solicitar el recuerdo de una palabra arbitrariamente seleccionada; y decimos “arbitrariamente” en el sentido de que no es estrictamente relevante a ese procesamiento semántico: la última palabra de una frase no tiene –en principio– ningún valor especial desde el punto de vista de la comprensión; con lo que el sujeto puede dedicar sus recursos directamente al almacenamiento de esa última palabra sin necesidad de una procesamiento comprensivo de la frase como tal. Es decir, el hecho de que la demanda se centre en una palabra concreta, hace posible que la lectura se realice de forma mecánica –no comprensiva– y, por tanto, no necesariamente se producirá la diferencial carga de la capacidad de procesamiento que se pretende. De hecho esta es la razón por la que algunas de las versiones de PAL que se han utilizado, incluyen algún tipo de control de la lectura comprensiva, generalmente a partir de cuestiones de verificación de las frases utilizadas (véase p. ej., Daneman y Carpenter, 19801; Gutiérrez- Calvo, Jiménez y Castillo, 1996).

Pero por otro lado, si es, en efecto, la mayor o menor eficiencia en el procesamiento el que marca las diferencias –en el sentido de comprometer más o menos recursos de control y atencionales del EC–, la tarea implicada en la medida debe ser relevante en el ámbito en el

Page 9: Dos pruebas de amplitud de memoria operativa para el razonamiento

8

que trata de ser predictiva, aunque las capacidades del EC involucradas (p. ej., la capacidad para inhibir asociaciones irrelevantes) sean inespecíficas. En este sentido, obviamente, la tarea de lectura es pertinente para predecir comprensión pero no necesariamente lo es para predecir razonamiento. Por todo ello, y a fin de corregir ambos tipos de dificultad hemos investigado dos nuevas medidas que obligan a un proceso de razonamiento: los sujetos deben realizar una serie de inferencias para posteriormente recordarlas. A continuación describimos estas nuevas pruebas y presentamos los resultados de un primer estudio sobre su valor predictivo en torno a la competencia en razonamiento proposicional.

1. Dos Pruebas de Amplitud para el Razonamiento (PAR) Las nuevas pruebas que hemos desarrollado mantienen la estructura de la PAL, en el sentido de que la amplitud de la MO se sigue estimando a partir de una tarea de recuerdo organizada en varios niveles de dificultad creciente según el número de elementos-palabras a recordar (de 2 a 5). Sin embargo, la naturaleza de esos elementos-palabras es muy diferente: mientras que en la PAL, como hemos explicado, lo que los sujetos deben retener y recuperar es una palabra no relevante al proceso de comprensión que se pretende, en las nuevas pruebas lo que se debe recordar es el resultado directo de un proceso de razonamiento; en concreto, las inferencias realizadas al tratar de resolver bien una analogía verbal o bien una anáfora pronominal. En ambos casos el problema se plantea a través de un frase inicial seguida de algunas alternativas de respuesta, entre las cuales el sujeto debe seleccionar la correcta. El siguiente es un ejemplo de la tarea con analogías: Cortar es a tijeras, como dibujar es a ... lápiz papel

Puesto que la relación que se plantea en primer término es “servir para” o “hacer con”, la respuesta correcta es “lápiz”. Como en este caso, el distractor (“papel”) siempre guardaba alguna relación semántica con la situación de referencia pero no coincidente con la relación analógica planteada.

Las anáforas2 se plantean de forma similar: Pablo lo dibujó al amanecer, cubierto de una espesa niebla.

bosque selva pastor

En este caso la respuesta correcta es “bosque” por ser la única alternativa que concuerda con el pronombre “lo” de la frase, tanto desde el punto de vista semántico como gramatical. En contraste, como puede apreciarse, cada uno de los distractores sólo mantiene una de estas concordancias.

Del mismo modo que en la PAL, estos problemas se presentan en series crecientes (de 2 a 5) con tres ensayos en cada una de ellas (véase en el Apéndice el conjunto completo de problemas para cada serie y ensayo). El sujeto debe leer en voz alta las frases iniciales, seleccionando después la respuesta que considera correcta; y al final de la serie trata de recordar en el orden adecuado las respuestas que ha dado. De este modo, aunque la carga del componente de almacenamiento es idéntica a la que se produce en la PAL, la carga en el componente de procesamiento se hace a través de una inferencia y no de la mera lectura; es decir, puesto que las palabras a recordar son el producto de una inferencia, la tarea requiere un procesamiento semántico, de carácter profundo. Así, de acuerdo con la idea de transacción entre ambos componentes, puede suponerse que los buenos razonadores necesitarán dedicar menos recursos a este procesamiento, con lo que mostraran mayor capacidad de almacenamiento. Es decir, siguiendo la misma lógica que en la PAL, el máximo número de inferencias correctamente recordadas, tanto en la tarea de analogías como en la de anáforas, puede tomarse como un índice de la amplitud de la MO para el razonamiento; y de ahí que las hayamos denominado respectivamente, Prueba de Amplitud para el Razonamiento con

analogías (PAR-anl) y Prueba de Amplitud para el Razonamiento con anáforas (PAR-anf). Se ha argumentado que este tipo de medida de la MO resulta circular, ya que se

pretende obtener una estimación de la MO, predictiva de la competencia en razonamiento, a partir de una tarea que ya es de razonamiento (véase Philips y Forshaw, 1998). Sin embargo,

Page 10: Dos pruebas de amplitud de memoria operativa para el razonamiento

9

no necesariamente existe este inconveniente ya que para ambas pruebas se seleccionaron inferencias simples con muy escaso nivel de dificultad. En concreto, sólo se utilizaron en la elaboración de las pruebas problemas que fueron resueltos por más del 95% de los participantes. Es decir, aisladamente la tarea de razonamiento no se mostró discriminativa respecto a la habilidad de razonamiento de los sujetos, tal y como pudimos confirmar posteriormente en el estudio que enseguida presentaremos. Desde un punto de vista racional, por tanto, la tarea sí resulta apropiada y su utilidad como predictor o no del razonamiento debe resolverse empíricamente. A continuación presentamos un primer estudio realizado con este propósito.

Planteamiento e hipótesis A fin de comprobar la utilidad de las nuevas pruebas (PAR-anl y PAR-anf) como medidas de MO y su valor predictivo con respecto a la capacidad de razonamiento, hemos llevado a cabo un estudio correlacional en el que las hemos comparado con la PAL. El objetivo, lógicamente, era contrastar su validez en los dos sentidos relevantes: como medidas de MO esperábamos que correlacionaran positivamente con PAL (validez de constructo); pero como medidas de la MO específicamente involucrada en las tareas de razonamiento, esperábamos que sus correlaciones con la ejecución observada en estas tareas fuesen significativamente mayores que las obtenidas con la PAL (validez de criterio). Entre sí, por el contrario, no esperábamos, en principio, que mostrasen diferencias significativas en esta capacidad predictiva, ya que –como hemos explicado– las dos pruebas están construidas con la misma lógica desde un punto de vista racional.

Para contrastar, pues, estas hipótesis además de aplicar las tres pruebas de MO, examinamos a los sujetos en una tarea de razonamiento proposicional. En concreto, se les presentaron un conjunto de problemas en los que debían generar una conclusión a partir de dos premisas dadas. La primera premisa era en unos casos una sentencia condicional (si p

entonces q)3 y en otros una disyunción incluyente (p o q o ambos). La segunda premisa en todos los casos era categórica al afirmar o negar uno de los términos (p, q, no-p, y no-q) lo que, en el caso de los condicionales, suponía presentar las cuatro formas inferenciales clásicas ya mencionadas: MP, AC, NA y MT (véase en la Tabla 2 un ejemplo de cada tipo).

*****Insertar la Tabla 2 por aquí***** Situándonos en el marco de la TMM y de acuerdo con lo dicho en el punto anterior, la

principal hipótesis en relación con esta tarea fue que PAR-anl y PAR-anf alcanzarían correlaciones significativas y más altas que PAL con la ejecución correcta global. Pero, en particular, esperábamos que este contraste fuese más marcado con respecto a la ejecución derivada de la representación de múltiples modelos, dado que deben suponer mayor carga en la MO. Por otra parte, esperábamos también que las respuestas erróneas que implican un procesamiento superficial, sin carga de memoria operativa, serían producidas preferentemente por los sujetos con una menor amplitud de MO; es decir, hipotetizábamos también correlaciones negativas entre las pruebas de MO –especialmente las pruebas PAR–, y las respuestas erróneas superficiales.

Para el enunciado condicional “si entonces”, las respuestas que exigen modelos mentales múltiples son las inferencias NA y MT, que requieren desplegar la representación inicial y acceder al modelo (¬P ¬Q); así como las respuestas correctas de “No hay conclusión” que suponen el rechazo de las falacias NA y AC, para lo cual es necesario representar asimismo el modelo (¬P Q). Como respuesta errónea superficial puede darse la inferencia AC, ya que también resulta accesible mediante el mero emparejamiento de los valores del enunciado: si p entonces q y q, luego p. En este sentido, obviamente, la respuesta correcta a MP puede también alcanzarse por esta vía superficial.

En el caso de la disyunción (“ p ó q, ó ambos”) , todas las respuestas válidas exigen la representación de dos o tres modelos. Como puede verse en la representación completa de la Tabla 1, para las premisas categóricas afirmativas (p y q), la respuesta válida "No hay conclusión", proviene de considerar los dos modelos alternativos que existen en cada caso: (P

Page 11: Dos pruebas de amplitud de memoria operativa para el razonamiento

10

Q) y (P ¬Q) en caso de afirmarse p; y (P Q) y (¬P Q) en caso de afirmarse q. Asimismo, para las premisas categóricas negativas (no p y no q), las respuestas válidas inversas (q y p, respectivamente) sólo pueden derivarse teniendo presentes los tres modelos (P Q), (P ¬Q) y (¬P Q), en cuanto permiten comprobar la inexistencia de un modelo de doble negación (¬P ¬Q) que lleva a evitar tanto la respuesta “No hay conclusión” como la tendencia a respuestas simétricas (no p, luego no q; y no q, luego no p). Por el contrario, las simétricas a partir de las premisas categóricas afirmativas ( p ó q, ó ambos; y p, luego q; y q, luego p), pueden ser derivadas directamente a partir del emparejamiento superficial de los valores mencionados en el enunciado. Por tanto, estas dos respuestas pueden ser consideradas como errores superficiales.

Método

Participantes

En el estudio participaron 104 estudiantes universitarios de segundo ciclo, de los cuales fueron eliminados 15, bien por no haber realizado todas las tareas o bien porque no alcanzaron un nivel mínimo en las pruebas de MO –probablemente, debido a una escasa implicación en la tarea–. De esta forma, la muestra final estuvo compuesta por 89 participantes. Para la realización de la tarea de razonamiento se seleccionaron al azar un tercio de la muestra inicial, 30 participantes.

Materiales

Como ya hemos avanzado, como medida independiente de la MO se utilizó la prueba clásica de Daneman y Carpenter (1980) en la adaptación española (PAL) de Elosúa y cols. (1996). Por su parte, las nuevas pruebas –como también ya hemos dicho–, se diseñaron siguiendo la estructura de la PAL, con cinco niveles de dificultad. Así, en ambos casos, el conjunto de la prueba incluía 42 problemas de inferencia (bien analogías o bien anáforas), distribuidos en series de 2, 3, 4 y 5 problemas con tres ensayos en cada uno de estos niveles (6+9+12+15=42). Previamente a este conjunto de problemas de prueba o experimentales, cada participante recibía instrucciones sobre la tarea que incluían una fase de entrenamiento con tres ensayos del nivel 2, es decir otros 6 problemas.

La selección de los problemas utilizados en ambas pruebas se realizó a partir de un estudio previo en el que se aplicó una amplia muestra como simples problemas de inferencia. A partir del mismo no sólo se seleccionaron según el índice de dificultad (a partir del 95 % de aciertos), sino también en función de un riguroso control de otros aspectos que pudieran tener algún efecto; por ejemplo, el grado de familiaridad de las palabras que constituían la respuesta correcta a las inferencias o el orden en el que aparecían dentro de las alternativas planteadas (véase en el Apéndice el material completo empleado en cada una de las dos pruebas, así como un cuadro-resumen donde se recogen los controles que se hicieron en estas pruebas). En cuanto a la tarea de razonamiento, incluyó 24 problemas con condicionales y disyunciones del tipo ya descrito, con 2 casos para cada tipo de premisa categórica. Así, en concreto, se presentaron 8 problemas de disyunciones y 8 de condicionales en su formulación canónica (si p entonces q). El orden se contrabalanceó de manera que cada formulación (condicional o disyuntiva) apareciera –en cuestionarios diferentes– con cada una de las premisas categóricas, lo que supuso presentar la tarea en 4 ordenes distintos.

Diseño y procedimiento

El diseño fue intrasujeto: todos los participantes realizaron las tres pruebas de MO (PAL, PAR-anl y PAR-anf), si bien, tal y como ya hemos mencionado, sólo un tercio de la muestra global (30 participantes), realizaron la tarea de razonamiento. Ésta siempre se aplicó en último lugar, mientras que el orden de aplicación de las pruebas de MO fue contrabalanceado.

Las sesiones fueron individuales con una duración aproximada de una hora y media. Cada participante realizaba sucesivamente las tres pruebas de MO, lo que le ocupaba entre 30 y 45 minutos; y, tras un periodo de descanso de unos 10 minutos, se le entregaban unos

Page 12: Dos pruebas de amplitud de memoria operativa para el razonamiento

11

cuestionarios que contenían únicamente los ítem de anáforas y analogías utilizados previamente con el fin de comprobar que su índice de dificultad era mínimo.

En una segunda sesión se aplicó la tarea de razonamiento a los 30 participantes seleccionados al azar dentro del conjunto de la muestra. Esta aplicación fue colectiva y tuvo una duración de 30 minutos aproximadamente.

Tanto PAL como PAR-anl y PAR-anf, se aplicaron a través de ordenador en una versión informatizada. Cada frase o problema se presenta en el centro de la pantalla del ordenador (caracteres negros sobre fondo blanco) y el participante hace una lectura en voz alta. Cuando acaba la tarea de procesamiento –de lectura en la PAL (o sea, al leer la última palabra) o de inferencia en las PAR (o sea, al elegir una de las alternativas de respuesta)–, el experimentador presenta de inmediato una nueva frase o problema pulsando la tecla “intro”. Al final de cada serie de frases o problemas (según los niveles ya precisados), aparece una interrogación –"?"– para indicar al sujeto que debe tratar de recordar la última palabra de cada frese leída –en la PAL– o las respuestas dadas a los problemas de inferencia –en las PAR–. El paso de un nivel a otro se señalizaba mediante una pantalla indicativa intermedia, de manera que el sujeto podía utilizarla como una "pausa" antes de continuar. La prueba se daba por concluida en el nivel en el que el participante fracasaba en la tarea de recuerdo (manifestaba un recuerdo nulo o incompleto) de forma reiterada en los tres ensayos.

Por lo que se refiere a la tarea de razonamiento, se presentó como una prueba de "lápiz y papel" en la forma de un cuestionario. Tras las dos premisas de cada problema (véase Tabla 2) aparecía de forma explícita la pregunta ¿Qué se puede concluir?, y una línea en blanco donde el participante debía escribir su respuesta.

Criterios de puntuación

Se siguió el criterio de puntuación desarrollado por Elosúa y cols., (1997) en su adaptación de la PAL –denominado criterio integrado–, aunque adaptado al planteamiento de las nuevas pruebas. Este criterio supone aplicar una puntuación entera que refleja el nivel que alcanza la ejecución del participante (por tanto, entre 2 y 5) y una puntuación decimal que matiza la actuación manifestada dentro de ese nivel, teniendo en cuenta los distintos ensayos. En concreto, puede describirse en referencia a las siguientes pautas: − No se consideran las respuestas a la tarea de recuerdo en un determinado ensayo cuando

la tarea de procesamiento se ejecutaba incorrectamente; lo que, en el caso de las PAR supone no contabilizar los ensayos en los que alguna de las inferencias fuera incorrecta.

− Cada ensayo en el que el recuerdo era correcto (completo y en orden) se registra como "positivo" (+) y si fallaba en el orden, como "negativo" (–); el recuerdo incompleto no se tuvo en cuenta (∅).

− La puntuación de nivel, se consideraba alcanzada cuando dentro de los tres ensayos se registraban al menos uno positivo y otro negativo (+, –, ∅ ) o los tres negativos (–, –, –). Por ejemplo, un sujeto que recupere las tres inferencias en desorden en los tres ensayos del nivel tres –pero no en el nivel subsiguiente–, se le aplica la puntuación entera "3" como puntuación de nivel.

− La ejecución inferior (∅,∅,∅), (–,∅,∅), (–,–,∅), (+,∅,∅), no permitía alcanzar el nivel correspondiente pero servía como bonificación para computar el decimal en el nivel inmediatamente inferior, que, lógicamente, habría sido el alcanzado.

− Asimismo la ejecución superior (+,+,∅), (+,–,–), (+,+,–), (+,+,+), servía igualmente para bonificar la puntuación de nivel, implicando distintos incrementos proporcionales. La suma de ambos tipos de bonificaciones configuraban un rango de puntuación

decimal entre 0,1 y 0,9; con lo que la puntuación en su conjunto tenía un carácter continuo y manejable a "nivel de razón" (para más detalles puede consultarse Elosúa y cols., 1997).

Resultados y discusión Como puede observarse en la Tabla 3, las frecuencias encontradas para las distintas inferencias condicionales resultaron completamente acordes con las predicciones de la TMM, que consideran su dificultad en función del número de modelos involucrado. En este sentido,

Page 13: Dos pruebas de amplitud de memoria operativa para el razonamiento

12

cabe destacar que los porcentajes de respuesta de las inferencias MP y AC son claramente más altos que los de MT y DA. Estos resultados confirman la idea de que los razonadores tienden preferentemente a responder sobre la base de un solo modelo inicial (P Q) a partir del cual se accede a las inferencias MP y AC, evitando la sobrecarga que puede suponer el despliegue de los dos modelos necesarios para acceder a las inferencias MT y DA.

*****Insertar la Tabla 3 por aquí***** Del mismo modo, los resultados encontrados con los problemas de disyunciones

(véase la Tabla 4), también son interpretables de acuerdo con las previsiones de la TMM. Lo más destacable es la proporción de respuestas de "No hay conclusión", que se situó en torno al 50% en todos los casos. Para los problemas con las premisas categóricas afirmadas (p y q), como vimos más arriba ésta es la respuesta correcta, lo que sugiere que probablemente gran parte de los razonadores son capaces de representar los dos modelos relevantes para la resolución de estos problemas. No obstante, también encontramos que un porcentaje relevante de participantes dan respuestas simétricas incorrectas, que, como vimos, implican probablemente un ‘emparejamiento’ con los valores mencionados en el enunciado; así, a partir de “ p ó q, ó ambos” y “p”, los sujetos darán como respuesta “q”, y al revés.

En el caso de las premisas categóricas negadas (no p y no q), la respuesta correcta es la inversa (q y p, respectivamente), lo que supone una dificultad mayor al reclamar, como vimos, la representación simultánea de los tres modelos; de ahí que sea menor la proporción de participantes que respondan correctamente con las inversas, y tiendan sobre todo a dar la respuesta de "No hay conclusión", que implica un trabajo semántico no exhaustivo, incompleto (véase García Madruga, Gutiérrez, Carriedo, Vila y Luzón, 2004, para una análisis más detallado de estos resultados en relación con las predicciones de la TMM). *****Insertar la Tabla 4 por aquí*****

Pero, a fin de valorar la utilidad de las nuevas pruebas que hemos desarrollado, los resultados más importantes son los relativos al estudio correlacional. De entrada, tal y como esperábamos, PAL ofrece una estimación de la MO de los 89 participantes (Media =3,15; Desv. Típica = 0,61) significativamente superior a la obtenida a partir de las nuevas pruebas: M = 2,76 (dt = 0,55) para PAR-anf [t (88)= 6,03; p<0,0001; una cola]; y M = 2,70 (dt = 0,46) para PAR-anl [t (88) = 0,61; p<0,0001; una cola]. Comparadas entre sí, sin embargo, las PAR muestran una diferencia que no es significativa [t (88)= 0,97; p = 0,33; dos colas]. Además, de acuerdo con lo previsto, las correlaciones de Pearson entre las tres medidas de MO fueron positivas y significativas: entre PAL y PAR-anf de 0,46 (p < 0.001); entre PAL y PAR-anl de 0,38 (p < 0.001); y entre PAR-anf y PAR-anl de 0,35 (p < 0.001).

Sobre la base de nuestros planteamientos, interpretamos que las PAR cargan más el componente de procesamiento a través de la inferencia, con lo que globalmente resultan más difíciles y arrojan una estimación específicamente ligada a la competencia en razonamiento de los participantes. Las correlaciones entre ellas –positivas y significativas como acabamos de precisar–, tienden a confirmar esta interpretación, si bien, curiosamente, PAL es la que mejor correlaciona con cada una de las PAR –especialmente con PAR-anf–, mientras que la correlación que éstas guardan entre sí es la menor.

Estos datos, por un lado, apoyan la validez de constructo de las pruebas; es decir, las correlaciones ponen de manifiesto el hecho de que, en efecto, todas ellas son estimaciones de la amplitud de la MO de los sujetos. Además, puesto que la tarea de procesamiento es distinta en la PAL y en las PAR, estas correlaciones sugieren que probablemente ambos tipos de medidas inciden en algún componente inespecífico de la MO. Dicho de otro modo, las relaciones encontradas entre las medidas son consistentes con los modelos de MO de capacidad general que ponen énfasis en el papel de algún dispositivo central que gestione los recursos (p. ej., en la línea del control atencional que se defiende en las propuestas de Engle o Cowan; véase Conway y Engle, 1994; Engle y Conway, 1998 Engle y Oransky, 1999; Rosen y Engle, 1998). Pero, por otro lado, tanto la diferencia significativa encontrada entre los dos tipos de pruebas en cuanto a dificultad, como el concreto patrón de correlaciones observado –

Page 14: Dos pruebas de amplitud de memoria operativa para el razonamiento

13

pese a no haber diferencias significativas entre ellas–, también sugieren que se trata de medidas distintas. En concreto, creemos que estos resultados tienden a reflejar las diferencias existentes en la implicación del componente de procesamiento relevante al razonamiento y, en este sentido, también apoyarían la idea de que en el funcionamiento de la MO, además de los procesos generales de control ejecutivo, interviene asimismo alguna capacidad de carácter específico, relativa a la eficacia de los procesos que implican las tareas concretas.

En relación con nuestras propias tareas, los resultados parecen confirmar que PAL –tal y como esperábamos– es la tarea que menos carga el componente de procesamiento relevante al razonamiento; obviamente porque no implica –como las PAR– un proceso explícito de inferencia sino de lectura. Pero también porque parte de la ejecución posiblemente no dependa de un procesamiento profundo y comprensivo –como ya explicábamos–. Todo ello explicaría que PAL haya mostrado una dificultad significativamente menor que las PAR. Atendiendo a las correlaciones, sin embargo, esta interpretación no parece compatible con el hecho también observado de que precisamente la correlación entre PAL y PAR-anf sea la mayor, aunque no haya diferencias significativas entre ellas.

A este respecto, hemos de hacer notar una particularidad de PAR-anf; y es que, aunque en principio depende –como PAR-anl– de una inferencia, es posible que la estructura y contenido de la prueba permita resoluciones más o menos profundas (o más o menos superficiales), en función de la cantidad de información de la frase que es necesario procesar para resolver la anáfora. De hecho, como podrá observarse, en algunos ítems basta con leer y comprender el par pronombre-verbo de las frases, para seleccionar la opción de respuesta sintáctica y semánticamente compatible. En otros casos, la búsqueda de la doble concordancia requiere mayor información, pero muy pocos ítems reclaman una lectura comprensiva completa de toda la frase. Esto explicaría su mayor cercanía a PAL como índice de MO, ya que también esta prueba implica la lectura de frases con un procesamiento que puede ser más o menos profundo. La diferencia, no obstante, sigue estando en que sobre la base de mayor o menor información, PAR-anf obliga a una inferencia, mientras que PAL no lo hace.

Así pues, y de acuerdo con los planteamientos sobre la amplitud funcional de la MO ligada la eficacia en el componente de procesamiento, PAR-anl sería más capaz de reflejar consistentemente esta dinámica en relación con la competencia en razonamiento, y en relación, asimismo, con la mayor o menor demanda de control por parte del EC que puede reclamar según sea el nivel de esa competencia en cada individuo. En la medida en que parte de la ejecución en PAL y en PAR-anf se deba a estrategias de procesamiento menos profundas o superficiales, no se estaría cargando consistentemente el componente de procesamiento y, por tanto, el almacenamiento tampoco dependería rigurosamente ni del balance de los recursos entre ambas funciones (o sea, de la capacidad específica ligada a la eficacia de ese procesamiento) ni de su adecuada coordinación (o sea, de la capacidad general ligada al control atencional por parte del EC). En este sentido, cabe pensar que su fiabilidad como índices de MO podría ser menor que la de PAR-anl.

Este tipo de análisis es consistente con los resultados encontrados sobre la validez predictiva de las tres pruebas con respecto al razonamiento. Como puede apreciarse en la Tabla 5, en general las correlaciones respecto a la ejecución correcta en ambas conectivas (condicional y disyunción) medida por el total de aciertos, son claramente mayores con las nuevas pruebas (PAR) que con la clásica PAL. De hecho, esta correlación llega a ser significativa con Anáforas (PAR-anf) en los problemas condicionales (r = 0,37; p < 0,05) y con Analogías (PAR-anl) en los problemas con disyunciones (r = 0,39; p < 0,05); y asimismo, las correlaciones entre las dos nuevas medidas (PAR- anf. y PAR- anl.) y los aciertos totales (r = 0,40 y r = 0,34 respectivamente) son en ambos casos significativas (p < 0,05).

*****Insertar las Tablas 5 aquí***** El patrón de conjunto, sin embargo, requiere de nuevo una interpretación más

matizada, pese a que las diferencias entre las correlaciones no llegaron a ser significativas. Así, en relación con los problemas condicionales, en efecto, PAR-anf parece resultar

Page 15: Dos pruebas de amplitud de memoria operativa para el razonamiento

14

claramente predictiva de la ejecución (r = 0,37), frente a la falta de correlación observada con PAL (r = 0,05). Sin embargo, tampoco se encontró correlación con la medida arrojada por PAR-anl (r = –0,04), como cabía esperar. Este resultado podría de nuevo relacionarse con la distinta implicación que ambas pruebas suponen en el componente de procesamiento (tal y como explicábamos anteriormente) y con el hecho de que parte de la ejecución correcta en los problemas condicionales –en particular la inferencia MP– puede derivarse –como vimos– de estrategias que implican procesamiento poco profundo (en concreto, la inferencia correcta MP desde la representación del modelo inicial) o incluso a través de estrategias puramente superficiales (p. ej. a través del simple emparejamiento de términos). Por consiguiente, quizá no cabe considerar completamente fiables los resultados obtenidos sobre las respuestas correctas en estos problemas condicionales. De hecho, como puede apreciarse en la misma tabla, las correlaciones mejoran claramente en relación con los problemas de disyunciones, en los que ninguna de las cuatro inferencias válidas pueden derivarse a partir de estrategias no inferenciales e implican la construcción de dos o tres modelos.

Esta línea de interpretación se ve claramente avalada por los resultados reflejados en las dos últimas columnas de la Tabla 5, en las que se tiene en cuenta, no tanto la ejecución correcta como tal, sino el grado de demanda que sobre la MO cabe atribuir a las respuestas dadas por los razonadores; en particular, las respuestas que implican modelos mentales múltiples y, por tanto, una mayor carga de memoria. Como se recordará, nuestras predicciones apuntaban a encontrar correlaciones positivas entre las medidas de MO y las respuestas de modelos mentales múltiples, y negativas entre la MO y los errores superficiales. Pues bien, de acuerdo con lo esperado, frente a PAL las PAR mostraron una mayor correlación positiva con las respuestas derivadas de representaciones de modelos múltiples y una mayor correlación negativa con respecto a la ejecución atribuible a estrategias poco profundas o superficiales. En este sentido, destacan en particular las altas y significativas correlaciones encontradas con PAR-anl, siendo positiva con la ejecución que implica múltiples modelos (r = 0,39; p < 0,05) y negativa con las respuestas erróneas superficiales (r = -0, 42; p < 0,01). En relación, pues, con este tipo de ejecución, que tiene en cuenta la dificultad de los problemas (en términos representacionales) y las estrategias de afrontamiento de los razonadores (semánticas o superficiales), se confirma claramente que PAR-anl es la medida de MO que parece funcionar de forma más apropiada, con correlaciones altas y significativas en ambos casos.

Un análisis de regresión múltiple (por pasos sucesivos) con las tres pruebas de MO como variables independientes confirmó y matizó los resultados anteriores. Así, mientras que PAR-anf se mostró como la única predictiva respecto a los aciertos directos en la prueba de razonamiento [R2=0,160; F(1, 28)=5,323, MCe= 0,028, p<0.05], PAR-anl lo fue para los tipos de respuesta que reflejan la mayor o menor carga de la MO involucrada; en concreto, para las respuestas más demandantes o de modelos múltiples [R2=0,152; F(1, 28)=5,009, MCe= 0,038, p<0.05], y para las menos demandantes, basadas en estrategias superficiales [R2=0,179; F(1, 28)=6,091, MCe= 0,045, p<0.05]. En contraste, PAL fue en todos los casos eliminada de las ecuaciones de regresión al no contribuir de manera significativa a explicar la varianza de ninguna de las tres variables dependientes.

En definitiva, entendemos que, de acuerdo con lo esperado, las PAR predicen mejor que PAL la ejecución en la tarea de razonamiento, y entre ellas parece existir una clara tendencia a favor de PAR-anl. Pero ello no significa, a nuestro juicio, que la PAL sea una medida no válida de MO. A fin de cuentas, lo que éste y otros estudios sugieren es que este tipo de pruebas para ser más precisas requieren adaptaciones en función de las habilidades cognitivas que se supone puede estar sustentando y en relación con las cuales, por tanto, se supone que las diferencias en la MO de los sujetos pueden resultar predictivas de la ejecución. En este sentido, por ejemplo, parece claro que frente al tipo de procedimiento utilizado en nuestro estudio, las versiones de PAL que incorporan algún control del proceso de comprensión de las frases (véase Daneman y Carpenter, 1980; Gutiérrez-Calvo, Jiménez y

Page 16: Dos pruebas de amplitud de memoria operativa para el razonamiento

15

Castillo, 1996), producirán estimaciones más fiables de la MO implicada en la comprensión lectora. Lo que está en cuestión, por consiguiente, no es tanto la utilidad y el fundamento teórico de la PAL, relativo a la necesaria transacción entre el almacenamiento y el procesamiento en el consumo de unos recursos limitados, como la forma de incorporar y manejar esta supuesta dinámica a partir de las tareas concretas que se utilicen, de modo que se pongan en juego adecuadamente los componentes generales (ligados a las capacidades de control del EC) y específicos (ligados al ámbito de competencia y al dominio de la tarea) que parecen intervenir.

Esta es de hecho la principal idea que entendemos apoya nuestro estudio, en consonancia con los planteamientos teóricos más recientes, tal y como indicamos en la introducción (véanse Conway y Engle, 1994; Engle y Conway, 1998; Engle y Oransky, 1999; Rosen y Engle, 1998; Withney, Arnett y Driver, 2001): en su doble función de almacenamiento y procesamiento, resulta plausible pensar que la capacidad de la MO depende específicamente de la habilidad y de la experiencia en el dominio de la tarea, por cuanto supondrá mayor o menor eficacia en el procesamiento y, por tanto –como se viene tradicionalmente asumiendo–, permitirá liberar más o menos recursos para la otra función de almacenamiento. Pero esto no puede ser independiente de la actuación de algún dispositivo central o EC, que necesariamente debe intervenir para distribuir de hecho los recursos y coordinar eficazmente ambas funciones, lo que supondrá demandas sobre sus capacidades generales de control y atencionales.

En este sentido, en el diseño de nuevos procedimientos de medida parece necesario, por un lado, utilizar tareas que aseguren suficiente carga de procesamiento relevante al dominio de interés –tal y como hemos reiterado–, a fin de poner en juego esa dinámica interactiva natural que cabe asumir entres ambos tipos de componentes, los específicos y los generales. Pero para ello, sobre todo habrán de tenerse en cuenta algunos aspectos más sobresalientes, especialmente en relación con los distintos papeles que cabe atribuir al EC. Como señalan estudios recientes (véase p. ej., Whitney et al., 2001) las diversas medidas de MO reflejan probablemente diferentes implicaciones del funcionamiento del EC. Nuestra hipótesis es que el incremento en las pruebas PAR de las demandas de procesamiento en la tarea secundaria, implica también mayores demandas atencionales y de control, ya que el sujeto debe regular y alternar su foco de atención entre dos tareas que requieren individualmente de un control para su adecuada realización. En cualquier caso, y como muestran los resultados de este trabajo, es necesario explorar nuevos instrumentos de medida que traten de incidir en los distintos dispositivos de memoria involucrados (p. ej., teniendo en cuenta el posible papel de algún componente de memoria a largo plazo en la MO; véase Ericsson y Kintch, 1995; Baddeley, 2000), así como separar los distintos efectos relevantes (p. ej., la particular implicación de procesos de activación-inhibición; Engle y Oransky, 1999; Miyake, Friedman, Emerson, Witzki y Howerter, 2000) dentro del sistema ejecutivo central.

2. Conclusiones El estudio llevado acabo sugiere que frente a la prueba clásica de “amplitud lectora” de Daneman y Carpenter, las nuevas pruebas que proponemos –las PAR– constituyen una estimación más apropiada de la MO implicada en el razonamiento; lo que presumiblemente tiene que ver con el hecho de que la tarea secundaria –una tarea inferencial– asegura un procesamiento semántico más profundo en el ámbito de competencia relevante. Con ello entendemos que el estudio sustenta el planteamiento que hemos realizado en torno a las dificultades metodológicas que plantea la medida de la MO, al tiempo que pone de manifiesto la necesidad de abordarlas de forma consistente con los planteamientos teóricos en que se apoya. En este sentido, tal y como hemos discutido en el punto anterior, las principales ideas que entendemos apoya el presente estudio son las que siguen:

1- La implicación de la MO en tareas cognitivas complejas –como las que demandan la comprensión o el razonamiento– probablemente atañe de manera esencial a la capacidad de algún mecanismo central de procesamiento –del tipo del EC de

Page 17: Dos pruebas de amplitud de memoria operativa para el razonamiento

16

Baddeley– que distribuya adecuadamente los recursos disponibles para las funciones simultaneas del procesamiento y del almacenamiento.

2- La mayor competencia en un ámbito de actuación específico, supondrá mayor eficacia en la ejecución de las operaciones de procesamiento, las cuales, por tanto, detraerán menos recursos del EC; es decir, su “capacidad operativa” será relativa a la mayor o menor eficacia con que se ejecuten los procesos –ya sea en función de un mejor control atencional o en virtud de una mayor rapidez operacional–, lo que se traducirá en una mayor amplitud en el componente de almacenamiento.

3- Consecuentemente, la estimación de esa capacidad en relación con un determinado ámbito de competencia debe realizarse a partir de tareas que carguen el componente de procesamiento de manera específica, pero asegurando una demanda suficiente sobre las capacidades generales del EC. Como hemos visto, las PAR ilustran este modo de proceder en el ámbito de

competencia del razonamiento. Por supuesto, es necesario recabar más datos en esta dirección que nos permitan precisar la carga de procesamiento que suponen distintos tipos de tareas y, consecuentemente, a partir de ello explicar las diferencias en las estimaciones que se derivan, tales como las encontradas en el presente estudio entre PAR-anl. y PAR-anf. Por otro lado, como hemos apuntado, la memoria operativa es un constructo teórico complejo con múltiples componentes, funciones y facetas que en la actualidad están siendo diferencialmente atendidas y elaboradas por distintos modelos teóricos. Los procedimientos de medida, por tanto, deberán también ser consecuentes con estas propuestas alternativas precisamente para posibilitar su contraste y su puesta a prueba desde el punto de vista empírico.

Page 18: Dos pruebas de amplitud de memoria operativa para el razonamiento

17

Referencias Atkinson, R. C. y Shiffrin, R. M. (1968). Human memory: A proposed system and its control proceses. En K. W.

Spence y J. T. Spence (Eds.), The psychology of learning and motivation: Advances in research and theory.

Vol. 2, (pp. 89-195). New York: Academic Press. Atkinson, R. C. y Shiffrin, R. M. (1971). The control of short-term memory. Scientific American, 225, 82-90. Baddeley, A. D. (1986). Working Memory. Oxford: Clarendon Press. Baddeley, A. D. (1990). Human Memory. Theory and Practice. Hillsdale, Erlbaum. Baddeley, A. D. (1992). Is Working memory working? The Fifteenth Bartlett Lecture. The Quarterly Journal of

Experimental Psychology, 44 A, 1-31. Baddeley, A. D. (1996). Exploring the central executive. Quarterly Journal of Experimental Psychology, 49A. 5-

28. Baddeley, A. D. (2000). The episodic buffer: A new component of working memory? Trends in Cognitive

Sciences, 11, 417-423. Baddeley, A. D. y Hitch, G. (1974). Working memory. En G. A. Bower (Ed.), The psychology of learning and

motivation, Vol. 8 (pp. 47-89). New York: Academic Press. Baddeley, A. D. y Hitch, G. (1994). Developments in the concepts of working memory. Neuropxychology, 8,

485-493. Baddeley, A. D. y Logie, R. H. (1999). Working memory: The multi-component model. En A. Miyake y P. Shan

(Eds.), Models of working memory: Mechanisms of active maintenance and executive control (p. 28-61). Cambridge: Cambridge University Press.

Baddeley, A. D., Logie, R., Nimmo-Smith, I. y Brereton, N. (1985) Components of fluent reading. Journal of

Memory and Language, 24, 119-131. Baddeley, A. D., Logie, R., Nimmo-Smith, I., y Brereton, N. (1985). Components of fluent reading. Journal of

Memory and Language, 24, 119-131. Barrouillet, P. (1996). Transitive inferences from set inclusion relations and working memory. Journal of

Experimental Psychology, 6, 1408-1422. Barrouillet, P. y Lecas, J. F. (1999). Mental models in conditional reasoning and working memory. Thinking and

Reasoning, 5 (4), 289–302. Byrne, M. D. (1998) Taking a computational approach to aging: The SPAN theory of working memory.

Psychology and Aging, 13, 309-322. Byrne, M. D. (1998). Taking a computational approach to aging: The SPAN theory of working memory.

Psychology and Aging, 13, 309-322. Caplan, D. y Waters, G. S. (1999). Verbal working memory and sentence comprehension. Behavioral and Brain

Sciences, 22, 77-126. Capon, A., Handley, S. y Dennis, I (2003). Working memory and reasoning: An individual differences

perspective. Thinking and reasoning, 9 (3), 203-244. Carpenter, P. A., Miyake, A. y Just, M. A. (1994). Working memory constraints in comprensión: Evidence from

individual differences, aphasia, an aging. En M. A. Gernsbacher (Ed.), Handbook of psycholinguistics (pp. 1075-1122). Sandiego, CA: Academic Press.

Conway, A. R. A. y Engle, R. W. (1994). Working memory and retrieval: A resource-dependent inhibition model. Journal of Experimental Psychology: General, 123, 354-373.

Daneman, M. y Carpenter, P. (1980). Individual differences in working memory and reading. Journal of Verbal

Learning and Verbal Behaviour, 19, 450-466. Daneman, M. y Carpenter, P. (1983). Individual differences in integrating information between and within

sentences. Journal of Experimental Psychology: Learning, Memory and Cognition, 9, 561-584. Daneman, M. y Tardif, T. (1987). Working memory and reading skill reexamined. En M. Coltheart (Ed.),

Attention and performance XII. The psychology of reading (pp.491-508). Hillsdale, NJ: Earlbaum. Elosúa, M. R., García Madruga, J. A., Gutiérrez, F., Luque, J. L. y Garate, M. (1997). Un estudio sobre las

diferencias evolutivas en la memoria operativa: ¿Capacidad o eficiencia?. Estudios de Psicología, 58, 15-27. Elosúa, M. R., Gutiérrez, F., García Madruga, J. A., Luque, J. L. y Gárate, M. (1996). Adaptación española del

“Reading Span Test” de Daneman y Carpenter. Psicothema, 2,383-395. Engle, R. W. (1996). Working memory and retrieval: an inhibition-resource approach. En J. T. Richardson, R.W.

Engle, L. Hasher, R. H. Logie, E. R. Stoltzfus and R. T. Zacks, Working Memory and Human Cognition (p. 89-119). Oxford: Oxford University Press.

Engle, R. W. y Conway, A. R. A. (1998). Working Memory and Comprehension. En Robert H. Logie y Kenneth J. Gilhooly (Eds.), Working Memory and Thinking (pp. 67-91). Hove, East Sussex: Psychology Press.

Engle, R. W. y Oransky, N. (1999). Multi-store versus dynamic models of temporary sotorage in memory. En R. J. Sternberg (Ed.), The nature of cognition (pp. 515-555). Cambridge, MA: MIT Press.

Engle, R. W., Carullo, J. J. y Collins, K. W. (1991). Individual differences in working memory for comprensión and following directions. Journal of Educational Research, 84, 253-262.

Page 19: Dos pruebas de amplitud de memoria operativa para el razonamiento

18

Engle, R. W., Kane, M. J., y Tuholski, S. W. (1999). Working memory and controlled attention. En A. Miyake y P. Shah (Eds.), Models of working memory: Mechanism of active maintenance and executive control (p. 102-134). Cambridge: Cabridge University Press.

Ericsson, L. A., y Kintsch, W. (1995). Long-term working memory. Psychological Review, 102, 211-245. Estévez, A. Gutiérrez-Calvo, M. (2000). Working memory capacity and time course of predictive inferences.

Memory, 8 (1), 51-61. Fry, A. F. y Hale, S. (1996) Processing speed, working memory, and fluid intelligence: Evidente for a

developmental cascade. Psychological Science, 7, 237-241. García Madruga, J. A., Gutiérrez, F., Carriedo, N., Luzón, J. M. y Vila, J. O., (2004). “Working memory and

propositional reasoning: Searching for new working memory tests”. En V. Girotto and P. N. Johnson-Laird (eds.), The shape of reason. Essays in honour of Paolo Legrenzi (p. 69-89). London: Psychology Press.

García-Madruga, J. A., Gárate, M., Elosúa, R., Luque, J. L. y Gutiérrez, F. (1997). Comprensión lectora y memoria operativa: un estudio evolutivo. Cognitiva, (9) 1, 99-132.

García-Madruga, J. A., Moreno, S., Carriedo, N., Gutiérrez, F. y Jonson-Laird, P. N. (2001) Are conjunctive inferences easier than disjunctive inferences. Quarterly Journal of Experimental Psychology, 54A (2), 613-632.

Gilhooly, K. J., Logie, R. H. y Wynn, V. (1999). Syllogistic reasoning tasks and working memory: evidence from sequential presentation of premises. European Journal of Cognitive Psychology, 11 (4), 473-498.

Gilhooly, K. J., Logie, R. H., Wetherick, N. E. y Wynn, V. (1993). Working memory and strategies in syllogistic-reasoning tasks. Journal of Memory and Cognition,21(1), 115-124.

Gilinsky, A. S. y Judd, B.B. (1994). Working memory and bias in reasoning across the lifespan. Psychology

and Aging, 9, 356-371. Gutiérrez, F., García Madruga, J. A., Jonson-Laird, P., y Carriedo, N., (2002). Razonamiento con condicionales

múltiples. La perspectiva de los modelos mentales. Anuario de Psicología. Vol. 33 (1), 3-24. Gutiérrez-Calvo, M., Castillo, M. D. y Espino, O., (1996). Memoria operativa y procesos de integración en la

comprensión de textos. Anuario de Psicología, 70, 3-18. Gutiérrez-Calvo, M., Jiménez, A. y Castillo, M. D. (1996). Medida de la memoria operativa: Versión

informatizada y adaptación al castellano de la tarea de “Reading Span”. Psicológica, 17, 215-228. Halford, G. S., Bain, J. D. y Maybery, M.T. (1984). Does a concurrent memory load interfere with reasoning?

Current Psychological Research and Reviews, 3, 14-23. Johnson-Laird, P. N. (1983). Mental Models. Cambridge, UK: Cambridge University Press. Johnson-Laird, P. N. y Byrne, R. M. J. (1991). Deduction. Hillsdale, NJ: Lawrence Earlbaum Associates. Johnson-Laird, P. N. y Byrne, R. M. J. (2000). Mental models and pragmatics. Behavioral and Brain Sciences,

Volume 23, Number 2, 284-285. Killonen, P. C. y Christal, R. E. (1990). Reasoning ability is (little more than) working memory capacity?

Intelligence, 14, 389-433. Klauer, K. C., Stegmaier, R. y Meiser, T. (1997). Working memory involvement in propositional and spatial

reasoning. Thinking and Reasoning, 3(19), 9-47. Light, L. L. y Anderson, P. A. (1985). Working memory, capacity, age, and memry for discourse. Journal of

Gerontology, 40, 737-747. Logie, R. H. y Gilhooly, K. J. (1998). Working Memory and Thinking. Hove, East Sussex: Psychology Press. Markovits, H., Doyon, C. y Simoneau, M., (2002). Individual differences in working memory and conditional

reasoning with concrete and abstract content. Thinking and reasoning, 2002, 8 (2), 97-107. Meilán, E., García-Madruga, J. A. y Vieiro, P. (2000). Memoria operativa y procesos de razonamiento

condicional. Cognitiva, 12, 135-151. Miyake, A. y Shah, P. (1999). Toward unified theories of working memory: Emerging general consensus,

unresolved theoretical isssues, and future research directions. En A. Miyake y P. Shah (Eds.), Models of

Working Memory, pp.442-481. New York: Cambridge University Press. Miyake, A., Friedman, N. P., Emerson, M. J., Witzki, A. H. y Howerter, A. (2000). The unity and diversituy of

executive functions and their contributions to complex “frontal lobe” tasks: A latent variable analysis. Journaal of Cognitive Psychology, 4(1), 49-100.

Oakhill, J., Yuill, N. y Parkin, A. (1986). On the nature of the difference between skilled and less skilled comprehenders. Journal of Research in Reading, 9, 80-91.

Philips, L. H. y Forshaw, M. J. (1998). The role of working memory in age differences in reasoning. En R. H. Logie, y K. J. Gilhooly. Working Memory and Thinking. (pp. 23-45). University of Aberdeen, Scotland, UK. Psychology Press.

Richardson, T. E., Engle, R. W., Hasher, L., Logie, R. H., Stolzfus, E. R., y Zacks, R. T. (1996). Working

memory and human cognition. Oxford, U.K.: Oxford University Press. Rosen, V. M. y Engle, R. W. (1997). The role of working memory capacity in retrieval. Journal of Experimental

Psychology: General, 126, 211-227. Rosen, V. M. y Engle, R. W. (1998). Working Memory Capacity and Suppression. Journal of Memory and

Language, 39, 418-436.

Page 20: Dos pruebas de amplitud de memoria operativa para el razonamiento

19

Salthouse, T, y Meinz, E. J. (1995). Aging, inhibition, working memory and speed. Journals of Gerontology:

Psychological Sciences, 50B, P297-P306. Shah, P. y Miyake, A. (1996). The separability of working memory resources for spatial thinking and language

processing: An individual differences approach. Journal of Experimental Psychology, 125, 4-27. Toms, M., Morris, N., y Ward, D. (1993). Working memory and conditional reasoning. Quarterly Journal of

Experimental Psychology, 46 A, 679-699. Waters, G. S. y Caplan, D. (1996). The measurement of verbal working memory capacity and its relation to

reading comprehension. The Quarterly Journal of Experimental Psychology, 49 A, 51-79. Witney, P., Arnett, P. A y Driver, A. (2001). Measuring Central Executive Functioning: What´s in a Reading

Span?. Brain and Cognition, 45, 1-14. Yuill, N., Oakhill, J. y Parkin, A. (1989). Working memory, comprehension ability and the resolution of text

anormaly. The British Journal of Psychology, 80, 351-36.

Page 21: Dos pruebas de amplitud de memoria operativa para el razonamiento

20

FIGURAS Y TABLAS

Figura 1. Modelo de memoria operativa de Baddeley (2000).

Model of Working Memory proposed by Baddeley (2000).

Tabla 1. Modelos Mentales iniciales y desplegados para las principales conectivas lógicas según la TMM.

The Mental Models and the Fully Explicit Models of the Major Sentential Connectives proposed by

Mental Model theory.

Conectiva Modelos Mentales Iniciales Modelos Explícitos Completos

p y q p q p q

p o q p q

p ¬ q ¬ p q p q

Si p entonces q

p q . . .

p q ¬ p q ¬ p ¬ q

Nota: “¬” significa negación, y “. . .” señala los modelos implícitos. Cada línea representa un modelo.

Tabla 2. Ejemplos de los problemas de condicionales y disyunciones en la prueba de razonamiento

Exemplars of conditional and disjunction problems in the reasoning test.

Condicional Disyunción incluyente

Premisa inicial

Si Juan va a León entonces Eva va a Madrid. O Juan va a León o Eva va a Madrid o ambos.

Premisas categóricas

Juan va a León (Modus Ponens) Juan no va a León (Negación del Antecedente) Eva va a Madrid (Afirmación del Consecuente) Eva no va a Madrid (Modus Tollens)

Juan va a León Juan no va a León Eva va a Madrid Eva no va a Madrid

Conclusión ¿Qué se puede concluir? ……… ¿Qué se puede concluir? ………

EJECUTIVO CENTRAL REGISTRO RETÉN LAZO VISO-ESPACIAL EPISÓDICO FONOLÓGICO SEMÁNTICO MLP EPISÓDICA LENGUAJE VISUAL

Las áreas sombreadas representan los sistemas cognoscitivos "cristalizados capaces de aumentar el conocimiento a largo plazo (como el lenguaje y el conocimiento semántico)", mantenidos en sistemas de almacenamiento permanentes. Las áreas transparentes representan las capacidades "fluidas" (como la atención y el almacenamiento temporal), estas no propician un aprendizaje duradero. Baddeley, (2000).

SEMÁNTICO MLP EPISÓDICA LENGUAJE VISUAL

Page 22: Dos pruebas de amplitud de memoria operativa para el razonamiento

21

Tabla 3. Porcentaje de respuestas en los problemas condicionales (la respuesta correcta está marcada en

negrita). N = 30

The percentajes of responses in conditional problems. (correct responses are in bold).

MP AC NA MT

Respuestas Inferenciales No conclusión Otras

100

0 0

82 15

3

54 46

0

53

45 2

Tabla 4. Porcentaje de respuestas en los problemas de disyunciones (la respuesta correcta está marcada en

negrita). N = 30

The percentajes of responses in disjunction problems. (correct responses are in bold).

Premisa Categórica p

Premisa Cat. q

Premisa Cat. No-p

Premisa Cat. No-q

Respuestas Simétricas

(q)

38 (p)

29 (no-q)

3 (no-p)

3

No conclusión 48 52 53 53 Respuestas Inversas

(no-q)

5

(no-p)

9

(q)

43

(p)

42 Otras

9

10

1

2

Tabla 5. Correlaciones entre las pruebas de MO y las respuestas en la prueba de razonamiento.

Correlations between WM and diverse reasoning responses.

Resp. Correctas “Si entonces”

Resp. Correctas “Disyuncion”

Total respuestas correctas

Resp. Modelos Múltiples

Resp. Erróneas Superficiales

PAL 0,05 0,27 0,27 0,30 -0,25

PAR-anf 0,37* 0,25 0,40* 0,34* -0,21

PAR-anl -0,04 0,39* 0,34* 0,39* -0,42**

** p < 0.01; * p < 0.05

Page 23: Dos pruebas de amplitud de memoria operativa para el razonamiento

22

APÉNDICE

Material de las PAR En las dos pruebas (PAR-anf y PAR-anl), las primeras pantallas presentan un conjunto de instrucciones que se van leyendo en voz alta y que explican la forma de realizar la tarea. A continuación se presentan una serie inicial de práctica y las series de prueba que, en cada uno de los casos, fueron las que siguen: Prueba de Amplitud de Razonamiento-Anáforas (PAR-anf)

Series de prácticas 2.a. Emma, aunque no lo buscara de forma expresa, sí lo valoraba. (decorador, elegancia, éxito) Carolina la había regañado porque hizo unos comentarios muy groseros (ofensa, niña, tío) 2.b. Leo se emocionó porque la recordó de repente al probar el bizcocho. (camisa, madre, amigo) Jorge vio como caía de la mesa porque el ventilador lo movió. ( folio, hoja, bebé) 2.c. Alejandro lo encontró cara a cara en el portal de su casa. ( portero, directora, viento) Roberto la pintó de blanco antes de que llegara el verano. ( tejado, novia, fachada) Series de dos frases 2.1 Manuel lo encontró en un cortocircuito de la antena de radio (perito, fallo, avería) Enrique la denunció ante el juez por sus reiteradas calumnias. (constructor, demanda, redactora) 2.2 Roberto lo colocó en la baca del coche al salir de vacaciones. (maleta, cocinero, paquete) Félix la aconsejó acerca de posibles planes de pensiones interesantes. (tía, inversión, jubilado) 2.3. Carmen la encontró en el aula donde la había perdido. (cuaderno, hermana, carpeta) Sol no pudo terminar el informe porque lo pintaron ese día. (despacho, puerta, mecánico) Series de tres frases 3.1 Laura la oyó decir que cualquier tiempo pasado fue mejor. (memoria, profesora, traductor) Edu lo enganchó al saltar la valla y se rasgo completamente. (sastre, pantalón, camisa) Montse la telefoneó desde la comisaría después de su detención. (pistola, padre, suegra) 3.2 Silvia la esperó a la entrada del cine mientras sacaba las entradas. (cartelera, cuñado, amiga) Celia lo llevó al taller de tapicería del pueblo más cercano. (sofá, obrero, butaca) Paz la amenazó con la posibilidad de despedirla del trabajo. (oficina, sobrina, compañero) 3.3 Jaime lo cogió al asustarse por el extraño ruido nocturno. (alarma, conserje, revólver) Carlota la llamó para felicitarla a su casa de campo. (prima, planta, entrenador) Rosa lo rompió en mil pedazos porque no le gustaba. (retrato, padrastro, corbata) Series de cuatro frases 4.1 Lucía entró en la habitación porque lo oyó romperse en mil pedazos. (cristal , vecino, vitrina)

Page 24: Dos pruebas de amplitud de memoria operativa para el razonamiento

23

Alicia la trató de forma totalmente inadecuada a pesar de su edad. (anciana, cocinera, hospital) Lola dijo que lo tuvieron que remolcar a causa de la nieve. (camión, moto, esquiador) Sandra la denunció porque no hizo bien el cambio de moneda. (panadero, cajera , multa ) 4.2 Cosme, con ayuda de una grúa, lo puso en la ría. (marino, bote, red) Eladio la animó mucho a que interpretara aquel papel tan exigente. (carrera, actriz, esquiador) Patricia lo intentó eliminar de sus principales recetas de cocina. (ajo, cocinero, cebolla) Fernando la propuso como candidata al premio de fin de curso. (pizarra, bedel, alumna) 4.3 Ángela se levantó emocionada del sillón y lo hojeó lentamente. (niño, revista, álbum ) Andrés la escribió para que fuera a la fiesta de cumpleaños. (frutero, cuñada, tarta) Paco, el experto mecánico que lo identificó, dijo que provenía del motor. (ruido, tuerca, ladrón) Petra la criticó con dureza por enfadarse delante del jefe. (secretario, riña, becaria) Series de cinco frases 5.1 Javier comprobó que no pudo aterrizar porque lo desviaron antes. (controlador, avión, avioneta) Marisa lo activó sin querer cuando hizo saltar la alarma. (sonido, bombero, luz) Ignacio la acusó ante la policía de robar un bolso. (delito, niñera, cartera) Rodrigo vio cómo lo arrojaron los albañiles para ensuciar la furgoneta. (poeta, tierra, cemento) Bruno, en su cumpleaños, la recogió para comer en un restaurante. (hija, suegro, carta) 5.2 Marta, quedo tan contenta, que la invitó a su boda. (pulsera, modista, chofer) Cándido lo vio después de ser restaurado mientras visitaba el museo. (pintor, escultura, cuadro ) Alberto la dejó en el centro comercial para que hiciera la compra. (criada , bolsa, alumno) Pepa, después del pinchazo, indicó que la cambiaran lo antes posible. ( humo, agua, rueda) Pablo lo dibujó al amanecer, cubierto de una espesa niebla. (bosque, selva, pastor) 5.3 Ricardo lo eligió para el equipo porque tenía muy buenas referencias. (coche, jugador, limpiadora) Germán la sorprendió mirando a hurtadillas a través de la ventana. (maceta, enfermo, casera) Paloma lo entrevistó nada más llegar al aeropuerto de Madrid. (diario, senador, panadera ) Sara la condujo por los diversos pasillos del recinto ferial. (tómbola, hermano, abuela) Inés dedujo que el viento lo había introducido en el mecanismo. (arena, buzo, polvo)

Page 25: Dos pruebas de amplitud de memoria operativa para el razonamiento

24

Prueba de Amplitud de Razonamiento-Analogías (PAR-anl) Series de Prácticas 2.a Bolígrafo es a escribir, como medicina es a .......... (Curar, Pinchar) Sol es a seco, como agua es a .......... (Lluvia, Mojado) 2.b Atacar es a defender, como comprar es a .......... (Pagar, Vender) Oveja es a rebaño, como árbol es a .......... (Bosque, Pino) 2.c Embutido es a rodaja, como tarta es a .......... (Dulce, Porción) Pan es a harina, como tortilla es a .......... (Sartén, Huevo)

Series de dos analogías 2.1 Vaso es a beber, como plato es a .......... (Romper, Comer) Traje es a sastre, como novela es a .......... (Escritor, Regalar) 2.2 Médico es a paciente, como profesor es a .......... (Alumno, Conserje) Funda es a sofá, como guante es a .......... (Lana, Mano) 2.3 Feliz es a triste, como delgado es a .......... (Gordo, Rubio) Navegar es a barco, como volar es a .......... (Nube, Avión) Series de tres analogías 3.1 Párpado es a ojo, como persiana es a .......... (Ventana, Puerta) Bodega es a vino, como jardín es a .......... (Flores, Estanque) Arriba es a abajo, como izquierda es a .......... ( Brazo, Derecha) 3.2 Televisión es a ver, como radio es a .......... (Oír, Locutor) Maestro es a escuela, como médico es a .......... (Operación, Hospital) Elecciones es a votos, como vendimia es a .......... (Uvas, Campo) 3.3 Planta es a savia, como humano es a .......... (Pulmón, Sangre) Desván es a Chalet, como cima es a .......... (Montaña, Nevada) Margarita es a flor, como manzana es a .......... (Roja, Fruta) Series de cuatro analogías 4.1 Patatas es a comestible, como pantalón es a .......... (Bolsillo, Ropa) Amar es a odiar, como llenar es a .......... (Vaciar, Guardar) Fatiga es a dormir, como triste es a .......... (Cantar, Llorar) Perseguir es a alcanzar, como competir es a .......... (Jugar, Ganar) 4.2 Desayuno es a mañana, como merienda es a ..........

Page 26: Dos pruebas de amplitud de memoria operativa para el razonamiento

25

(Tarde, Bocadillo) Tenedor es a cubierto, como armario es a .......... (Madera, Mueble) Paleta es a albañil, como pincel es a .......... (Pintor, Manchar) Vivo es a muerto, como olvidar es a .......... (Soñar, Recordar) 4.3 Aprender es a colegio, como musculación es a .......... (Gimnasio, Fuerza) Saturno es a planeta, como elefante es a .......... (Grande, Animal) Limpiar es a frotar, como aprobar es a .......... (Saltar, Estudiar) Canción es a disco, como capítulo es a .......... (Libro, Cuento) Series de cinco analogías 5.1 Delante es a detrás, como antes es a .......... (Ayer, Después) Hielo es a frío, como sol es a .......... (Calor, Luz) Cristal es a frágil, como seda es a .......... (Jersey, Suave) Azada es a cavar, como aguja es a .......... (Coser, Rasgar) Roma es a ciudad, como Duero es a .......... (Orilla, Río) 5.2 Atento es a descuidado, como fuerte es a .......... (Pesas, Débil) Claro es a oscuro, como pobre es a .......... (Rico, Hambre) Viejo es a joven, como alto es a .......... (Feo, Bajo) Pintura es a artes, como física es a .......... (Ciencias, Químicas) Tejado es a casa, como sombrero es a .......... (Gorra, Cabeza) 5.3 Nieve es a invierno, como playa es a .......... (Sombrilla, Verano) Tractor es a granjero, como avioneta es a .......... (Piloto, Aire) Hoja es a verde, como cielo es a .......... (Estrella, Azul) Hemorragia es a sangrar, como carcajada es a .......... (Agradar, Reír) Ola es a agua, como duna es a .......... (Arena, Palmera)

Page 27: Dos pruebas de amplitud de memoria operativa para el razonamiento

26

Aspectos controlados en la construcción y selección de los ítem en las PAR

- Con el fin de asegurar uniformidad en las respuestas, los problemas se construyeron presentándolos

como una tarea de reconocimiento, en la que la inferencia-palabra correcta debía ser seleccionada dentro de un conjunto de alternativas dadas (3 para anáforas y 2 para analogías).

- El orden de las opciones de respuestas se contrabalanceó de manera que la respuesta correcta y los distractores ocuparan el mismo número de posiciones en cada serie y evitando, asimismo, que aparecieran más de dos veces consecutivamente en la misma posición.

- Los problemas se construyeron de modo que incluyera distintos tipos de analogías y anáforas sencillas, seleccionado como resultado de la inferencia palabras con un índice de frecuencia alto y no más de tres sílabas.

- Partiendo de un estudio en el que se probó una amplia muestra de problemas, se seleccionaron aquellos con un índice de acierto igual o superior al 95 %.

ANÁFORAS ANALOGÍAS - Las anáforas se construyeron con los

pronombre «la» y «lo». El pronombre “le” no se utilizó a fin de evitar dificultades derivadas del posible “leísmo” ó “laísmo” en el uso del castellano.

- Las tres opciones de respuesta se construyeron según los siguientes principios: - Siempre se hace referencia una persona masculina (PM), una persona femenina (PF) y un objeto en el que el género viene definido en función de la frase: objeto masculino (OM) u objeto femenino (OF). - Si la frase está compuesta por «la persona»: PF; PM; OF - Si la frase está compuesta por «la objeto»: OF; OM; PF - Si la frase está compuesta por «lo persona». PM; PF; OM - Si la frase está compuesta por «lo objeto».

OM; OF; PM

- Las dos opciones de respuestas de las

analogías se construyeron según los siguientes principios: - Ser palabras cercanas semánticamente. - Ser verbos o nombres.

Page 28: Dos pruebas de amplitud de memoria operativa para el razonamiento

27

NOTAS

1) En su estudio inicial Daneman y Carpenter (1980) ya incluyeron una versión de PAL

con control de verificación, justamente para asegurar el procesamiento completo de cada frase y evitar que el sujeto se concentrara solamente en la última palabra. Sin embargo, esta prevención en realidad no se consideraba necesaria en la versión oral, ya que se asumía que la lectura en voz alta obligaba ya un procesamiento completo y profundo de la frase. De hecho, sólo se introdujo en un segundo estudio para hacer la prueba comparable a otras versiones (de lectura en voz baja y de escucha de las frases) en las que sí parecía probable la estrategia superficial mencionada y, por tanto, necesaria su prevención. Pese a que la semejanza de los datos correlacionales que se obtuvieron con ambas versiones orales confirmaron la idea de que la lectura en voz alta era suficiente para asegurar el procesamiento, nos parece cuestionable que esto realmente sea así, entendiendo que siempre caben resoluciones estratégicas más o menos profundas, precisamente, en función de las habilidades lectoras de los participantes.

2) Como puede apreciarse, en realidad, la prueba plantea relaciones catafóricas o anáforas ‘hacia atrás’. No obstante, hemos mantenido la denominación de “anáforas” ya que éste es el término genérico que en la literatura se suele utilizar en un sentido global, es decir, para hacer referencia tanto a las anáforas hacia delante (anáforas en sentido estricto) como a las anáforas hacia atrás (catáforas).

3) Además de la formulación canónica del condicional, “si p, entonces q“, la prueba incluía problemas con la formulación equivalente “no p a menos que q”. No obstante, aquí sólo haremos referencia a la primera ya que a fin de valorar la utilidad de las dos nuevas pruebas la segunda resulta innecesaria. Un análisis más detallado de los resultados encontrados, que incluye los relativos a la formulación "a menos que", pueden verse en García Madruga, Gutiérrez, Carriedo, Luzón y Vila (2004).

Page 29: Dos pruebas de amplitud de memoria operativa para el razonamiento

28

Extended Summary

The concept of equating short-term memory with working memory (WM) has allowed

the fruitful analysis and interpretation of individual differences in a diversity of complex cognitive tasks, such as text comprehension and reasoning. However, important problems related to the measurement of WM still remain, particularly those concerning how to account for its dual processing-storage function. In this respect, Daneman and Carpenter’s (1980) “Reading Span Test” (RST) continues to be the main instrument within the field, as it constitutes an explicit attempt to integrate both components (processing and storage). It does this by combining one task, sentence reading in a growing series (which implicates the processing component), with a subsequent task that involves the retrieval of the most recent word read in each of the series (which implicates the storage component). The model’s basic assumption is that a trade-off exists for each component’s consumption of WM’s limited resources, such that a more effective reading process (secondary task) will reflect an improved retrieval index (primary task). A number of studies have shown high correlations between RST with other diverse measures of reading comprehension as well as, in effect, been able to predict other aspects of general cognitive functioning. Nevertheless, it has also come against inconsistent results. Particularly, RST does not seem to be a good predictor in the execution of reasoning tasks.

Within this framework, we present a study in which we propose two new tests that seek to measure WM while participants are engaged in reasoning tasks. The rationale of the new measure is similar to that of Daneman and Carpenter’s (1980) classical “Reading Span Test.” However, whereas their secondary task was reading, our reasoning span test will use an inferential task, based on verbal analogy or anaphora, in its place. The Reasoning Span Test demands deeper semantic processing. Because this usually comprises the ability to reason, we therefore hypothesize an increased sensitivity to individual differences in reasoning abilities for these new measures. Our results confirm this hypothesis and show that reasoning span measures, particularly the one based on verbal analogy, correlate with the diverse reasoning measures better than the RST.

The results are discussed with respect to the differential involvement the Central Executive has when processing reasoning span as opposed to reading span measures. We believe the increased processing demands participants experience with the secondary anaphora and analogy tasks implicate more attentional and control demands. That is, participants must now both regulate and alternate their focus of attention between two tasks each of which individually require attentional control for their adequate fulfillment. Thus, as the new reasoning span test illustrates, we conclude that in order to obtain valid WM measures, it is necessary for tests to take into account both the general (i.e., those related to control capacities of the Central Executive) and specific (i.e., those related to the task domain) components that seem to direct its proper functioning.