marco teorico del aprendizaje

Tema 2: Marcos teóricos del Aprendizaje

Luis JiménezOctubre, 2006

TEMA 2: Marcos Teóricos del Aprendizaje.

1. Principios conductistas del aprendizaje: El aprendizaje por asociación.1.1. Asociacionismo.1.2. Ambientalismo y principio de correspondencia.1.3. Equipotencialidad y sus limitaciones.

2. Aproximaciones constructivistas: el aprendizaje por reestructuración.2.1. Constructivismo: el papel del conocimiento previo.2.2. El papel del sujeto y la toma de conciencia.2.3. Aprendizaje significativo y reestructuración.

3. Cognitivismo simbólico: Aprendizaje y computación.3.1. Procesamiento de información y teorías generales.3.2. La teoría ACT y el aprendizaje.

3.2.1. Estructuras de memoria y formatos de representación.3.2.2. Mecanismos de aprendizaje.

3.3. La teoría Pragmática de la Inducción.3.3.1. Tipos de reglas y formatos de representación.3.3.2. El aprendizaje en la teoría pragmática de la inducción.

4. Conexionismo: reestructuración desde la asociación.4.1. La metáfora del cerebro.4.2. Procesamiento distribuído y en paralelo.4.3. Representación distribuída.4.4. El aprendizaje y sus limitaciones en los sistemas conexionistas.

Lecturas Recomendadas:

-Pozo, J.I. (1989). Teorías Cognitivas del Aprendizaje. Madrid: Morata. Capítulo 2: El conductismo como programa de investigación.

Capítulos 3:El procesamiento de la información como programa de investigaciónCapítulo 6: Teorías computacionales.Capítulo 7: Teorías de la reestructuración.

-Pozo, J.I. (1996). Aprendices y Maestros: La nueva cultura del Aprendizaje. Madrid: Alianza.

Capítulo 2: Las teorías del aprendizaje: De la asociación a la construcción.

-McClelland, J.L., Rumelhart, D.E. & Hinton, J. (1986/1992). El atractivo del procesamiento distribuido en paralelo. En D.E. Rumelhart, J.L. McClelland y el grupo PDP, Introducción al Procesamiento Distribuido en Paralelo. Madrid: Alianza.

1. Principios conductistas del aprendizaje: Aprendizaje por asociación

• el papel del sujeto y del medio• el uso de constructos representacionales.• el carácter explícito o implícito del conocimiento resultante.

• conductismo vs. constructivismo:

• Objetivismo anti-mentalista. "La psicología, tal como la ve el conductista, es una rama puramente objetiva de la ciencia de la naturaleza. Su meta teórica es la predicción y control de la conducta. La introspección no forma parte esencial de sus métodos, y el valor científico de sus datos no depende de la presteza con que se plieguen a ser interpretados en términos de conciencia.

• Presupuesto de continuidad filogenética....En sus esfuerzos por conseguir un esquema unitario de la respuesta animal, el conductista no reconoce ninguna línea divisoria entre el hombre y el bruto. Con todo su refinamiento y complejidad, la conducta del ser humano constituye tan sólo una parte de su esquema total de investigación" (Watson, 1913, p.158, traducción en Leahey, 1994).

• Pozo (1989) destaca tres principios:• concepción asociacionista de los procesos psicológicos• principio de correspondencia entre lo aprendido y la realidad • principio de equipotencialidad

• Principio asociacionista: Surge directamente del compromiso objetivista: si sólo contamos con lo observable (estímulos y respuestas) y debemos explicar la dinámica de sus relaciones, los principios de la asociación parecen buenos candidatos para desempeñar esta función (Pavlov los aplica para explicar los reflejos condicionados, y Thorndike, para explicar la selección instrumental de las respuestas).

• Principio de correspondencia: La realidad (el medio) organiza y controla la conducta de los organismos. El sujeto sólo recibe la influencia del medio.

• no hay un agente independiente que module esa correspondencia (materialismo)• no implica una completa ausencia de influencia de las características del individuo

(aprendizajes preparados, diferencias entre especies...)

• Principio de equipotencialidad: Las leyes son universales, y se aplican a todo tipo de estímulos, respuestas e individuos. No obstante, la generalidad de los principios de aprendizaje no implica una completa homogeneidad de su funcionamiento.

1. Principios conductistas del aprendizaje: Aprendizaje por asociación (cont.)

• El papel del conocimiento previo: La exposición a una misma situación puede producir efectos diferentes en distintos sujetos: cada estímulo no es un átomo que se asocie con otros, sino una estructura cuya interacción afecta a la estructura global de conocimiento del sujeto de manera diferente en función de su estado previo.

• El papel del sujeto: Las distintas corrientes constructivistas (Gestalt, Piaget, Vigotski, Ausubel) destacan el papel del sujeto en la dinámica del aprendizaje: en el aprendizaje por insight, en los procesos de acomodación, en la toma de conciencia de los conceptos espontáneos, o en el aprendizaje significativo.

• Reestructuración: Se postula la existencia de un elemento discontinuo que genera el crecimiento cualitativo de nuestro conocimiento. Este es el punto de tensión y el mayor riesgo de estas aproximaciones: cómo explicar la discontinuidad sin reducirla a procesos mecánicos esencialmente continuos, y sin delegar en un “homúnculo” (i.e., una estructura interna que se encarga de llevar a cabo la tarea, pero cuyo funcionamiento no queda explicado).

2. Aproximaciones constructivistas al aprendizaje: Aprendizaje por reestructuración

• Psicología de la Gestalt: Los sujetos no aprenden de manera gradual, sino a saltos: La experiencia se acumula sin producir efectos aparentes hasta que, de repente, surge el insight: Nos damos cuenta (e.g., de las características de un concepto)

• Piaget: El aprendizaje consiste en un proceso de equilibrio en el que la información del medio se va asimilando (i.e., encajando) en los esquemas del aprendiz hasta que surge un conflicto que exige una acomodación de esos esquemas. La asimilación está guiada por el medio, pero la acomodación tiene un potente componente interno: toma de conciencia...

• Vygotsky: En la cadena E-R incluye respuestas que el sujeto usa como herramientas para alterar esos estímulos con propósitos de hacerlos más comprensibles. Además, algunos de estos instrumentos son aún más potentes, porque consisten en sistemas de signos que permiten internalizar el entorno y comprenderlo. En este proceso es fundamental la labor de los semejantes mediante la INSTRUCCIÓN.

• Ausubel: Distingue entre aprendizaje y enseñanza en función de la existencia de instructores. En ambos casos plantea otra distinción ortogonal entre aprendizaje memorístico y significativo, en función del grado de integración que se logre entre lo aprendido y el resto del conocimiento del aprendiz.

2. Aproximaciones constructivistas al aprendizaje: Algunos ejemplos

✔ Conductismo: Procesos mecánicos máximamente simples (i.e., asociación). Las representaciones no son necesarias, o se asume que son meros análogos a los estímulos y respuestas observables.

✔ Constructivismos: Las representaciones pueden empezar siendo simples y se van haciendo más complejas para captar mejor la estructura del medio. Los procesos son máximamente complejos y se describen pero no se explican (por ejemplo, el agente “detecta” desequilibrios y los solventa, pero ¿cómo?).

✔ Cognitivismo simbólico: Las representaciones tienen una cierta estructura inicial (son símbolos) y pueden modificarse y hacerse más complejas siguiendo un conjunto de procesos formales (i.e., no guiados por un agente que accede al contenido sino por la propia estructura de las representaciones).

✔ Conexionismo: Las representaciones iniciales son aún más simples en el inicio (subsímbolos), y los procesos son menos formales y más asociativos. El reto es demostrar que, cuando las representaciones se pueden auto-organizar por medio de estos procesos, se puede obtener la impresión de una compleja construcción simbólica.

El lugar de las distintas perspectivas teóricas en el continuo procesos vs. representaciones

3.1. Psicología de procesamiento de la información vs. arquitecturas cognitivas:

– La psicología de procesamiento de información asume una postura débil respecto a la metáfora computacional: Asume que la cognición es procesamiento de símbolos, pero no se compromete con una imagen completa del sistema: trata más bien de diseñar modelos plausibles de tareas concretas.

– Las arquitecturas cognitivas parten de una serie de presupuestos generales sobre cómo son las representaciones, cómo se relacionan entre sí y por qué medios se modifican. Una vez hecho esto, intentan explicar cómo distintos fenómenos cognitivos podrían explicarse desde esa arquitectura global.

• SOAR (Newell, 1990)• ACT (Anderson, 1983)• Teoría Pragmática de la inducción (Holland et al, 1986)

las tres tienen en común el uso de un formato representacional parecido (producciones)

3. Cognitivismo simbólico: Aprendizaje y computación

✔ Formatos de representación y estructuras de memoria en la ACT*.

3.2. La teoría ACT y el aprendizaje

MEMORIA DECLARATIVA

MEMORIA PROCEDIMENTAL

MEMORIA DE TRABAJO

codificación acción

recuperación

almacenamiento emparejamiento ejecución

aplicación

una red de chunks:conocimiento factual del

sujeto, tanto episódico (hechos)como semántico (conceptos)

un conjunto de producciones:estructuras condicionales (Si... Entonces...)que funcionan un poco como cadenas E-R cognitivas: siempre que se satisfagan unas

condiciones, se dispara una acción.

representaciones operativas en un momento dado

• La ACT es el resultado de la acumulación de un largo recorrido teórico: modelo asociativo de memoria semántica (Anderson & Bower, 73); memoria procedimental (ACTE, Anderson, 76), procedimientos de adquisición de habilidades (ACT*, 1983), y análisis racional de los procesos (ACT-R, Anderson & Lebiere, 1998)

✔ Formas de aprendizaje en la ACT*:– aprendizaje declarativo: cada experiencia cambia la activación temporal de los

contenidos de la memoria declarativa, y produce o refuerza las asociaciones entre chunks.

– compilación: A partir de una experiencia nueva, se producen y combinan producciones que transforman el conocimiento declarativo en procedimental:

• procedimentalización: creación de una producción partiendo del conocimiento declarativo, de modo que en ocasiones posteriores el sistema pueda actuar automáticamente.

• composición: creación de una producción partiendo de un conjunto de ellas que se activan en secuencia.

– ajuste: Una vez que han actuado los procesos de compilación, otra serie de procesos de ajuste optimizan las condiciones de aplicación de las producciones:.

• Generalización: Aumento del campo de acción de una producción, por la introducción de una variable donde había una constante.

• -Discriminación: Disminución del campo de acción de una producción, cuando su aplicación produce resultados erróneos (p.e., limitación del rango de una variable...)

• -Fortalecimiento: disminución del tiempo de disparo que se produce cada vez que una producción se ejecuta con éxito.

3.2. La teoría ACT y el aprendizaje (cont.)

3.3. La TPI y el aprendizaje

✔ Todo el conocimiento se estructura como reglas de producción:– “si es pequeño, rayado, y vuela, puede ser una avispa”

✔ En cada momento, la representación de la situación consiste en un “Modelo Mental”, un conjunto estructurado de reglas de producción que caracterizan tanto la situación como las metas específicas del sujeto en ese momento.

– “si es pequeño, rayado, y vuela--> puede ser una avispa”– “si es una avispa, me recuerda a una abeja”– “si es parecido a una abeja--> puede picarme”– “si ha entrado una avispa en el coche-->parar el coche”– ...

✔ Tipos de reglas: 1) empíricas: (describen el medio)

– sincrónicas: información descriptiva típica de la memoria semántica.• categoriales: si es pequeño, rayado y vuela --> puede ser una avispa• asociativas: si es una avispa-->me recuerda a una abeja.

– diacrónicas: información sobre cambios esperables o recomendables• predictoras: si es una avispa-->puede picarme.• efectoras: si ha entrado una avispa en el coche -->parar

2) de inferencia: (se aplican para refinar las empíricas)– regla de especialización:(discriminar fallos)

• si una predicción falla-->crear una regla especializada que lo prediga...

– regla de lo inusual: (atención a lo sorprendente)• si una situación tiene una propiedad inusual-->prepararse para usar esa propiedad como condición en una

nueva regla.

– regla de los grandes números: (generalización proporcional a la muestra observada)• si observo que una propiedad se da con cierta regularidad en una muestra, crear una regla que atribuya esa

misma regularidad a toda la población, con una fuerza (grado de confianza) proporcional al tamaño de la muestra.

– esquemas de regulación: (similares a los principios lógicos de razonamiento, pero con contenido más pragmático).

• e.g. esquema de permiso: “si quieres hacer X, tienes que hacer Y” “sin hacer Y no puedes hacer X”

3.3. La TPI y el aprendizaje (cont.)

e.g., tarea de Wason

3) principios operativos: (procedimientos necesarios para activar las reglas relevantes, y para que éstas evolucionen)

– procesos de competición entre reglas:• correspondencia grado en que lo descrito en la regla ocurre.• especificidad: grado en que la regla describe completamente lo que ocurre.• fuerza: grado en que la regla fue útil en el pasado.• apoyo: grado en que la regla es compatible con el resto de las reglas activadas.

– procesos de cambio:• asignación de crédito: cuando se alcanza una meta, se distribuye una cierta cantidad de fuerza entre las

reglas activadas, en función de su fuerza previa y del grado de expectativa de éxito generada.• acoplamiento: asociación de reglas sincrónicas, formando clusters que dan lugar a categorías, o

secuencias, que dan lugar a predicciones.• generación de nuevas reglas: basados en la aplicación de las reglas de inferencia, producirían

básicamente efectos de generalización y especialización.• instrucción:inserción directa de reglas: Una vez en el sistema, su funcionamiento es análogo al del resto

de las reglas generadas por otros medios.

✔ Valoración: El hecho de que los procesos de cambio dependan del contenido de las reglas introduce una limitación pragmática en los procesos de inferencia, pero no responde al problema del origen de todas esas reglas.

3.3. La TPI y el aprendizaje (cont.)

4. Conexionismo: ¿Reestructuración desde la asociación?

✔ Andy Clark: MIND vs. Brain: El cognitivismo simbólico aborda el estudio de la cognición como un sistema:

– Maduro: se plantea los problemas abstractos de la cognición, ignorando los aspectos evolutivos.

– Internalista: Da poca importancia al medio como diseñador de soluciones.– Nítido: Se plantea problemas discretos, lógicos, sin tener en cuenta elementos borrosos,

restricciones probabilísticas...– Diseño: Influido por la IA, le preocupa más diseñar un sistema capaz de llevar a cabo la

tarea, que descubrir cómo esa tarea se lleva a cabo realmente en los sujetos humanos.

✔ Como alternativa, se plantea estudiar la cognición usando la metáfora del cerebro, más que la de la computación.

✔ Esto no significa convertir la psicología en neurociencias, sino hacer psicología tomándose el sustrato neural un poco más en serio.

4.1. La metáfora del cerebro: (Rumelhart & McClelland, 1986)

✔ Las neuronas son lentas: Un millón de veces más lentas que los ordenadores: Procesamiento paralelo y lento vs. serial y rápido.

✔ El cerebro tiene muchas unidades de procesamiento: (1011).

✔ Una neurona se relaciona con muchas otras: La computación cerebral es más estadística que lógica.

✔ El cerebro acumula información de manera redundante: un daño no colapsa el sistema, sino que la degradación es gradual.

✔ El aprendizaje en el cerebro es originalmente asociativo: Los cambios a largo plazo son cambios en los patrones de conectividad.

✔ No parece que exista un lugar para el ejecutivo central: más que una supervisión central del procesamiento, existen conjuntos de subsistemas que interactúan buscando “estados de relajación”, representaciones que satisfagan un gran número de restricciones débiles.

El sistema cognitivo es un aparato compuesto por multitud de unidades que propagan activación o inhibición de forma masivamente paralela, sin que ninguna estructura ejerza el control ejecutivo sobre las demás. Los cambios derivados de la experiencia se producen en forma de modificaciones de las conexiones existentes entre ellas.

4.2. Procesamiento distribuido y en paralelo

✔ En un sistema conexionista, una unidad puede tomarse como una neurona o un grupo de ellas.

Y

zX

✔ Una unidad puede representar un objeto, una acción, un rasgo, o nada en especial: es el patrón de actividad de un sistema lo que acaba representando algo.

✔ Individualmente, una unidad sólo integra activaciones de entrada, y produce una salida que envía a sus vecinas. La capacidad computacional del sistema viene determinada por el conjunto de muchos procesos simples en paralelo.

4.2. Procesamiento distribuido y en paralelo (cont.)

✔ unidades

Ox=f(ax)

Ay

Ax

netz=OWAz=F(netz)

Y

z

X

✔ estados de activación

✔ función de salida (generalmente, función umbral)

✔ patrón de conectividad

✔ regla de propagación

✔ regla de activación (generalmente cuasi- lineal)

✔ un ambiente (conjunto de estímulos)

✔ regla de aprendizaje (cómo modificar los patrones en función de la experiencia)

wxz

wyz

Ox

Oy

4.2. Procesamiento distribuido y en paralelo (Cont.2)

O’Reilly & Munakata(2000) han planteado la existencia de dos tipos de aprendizaje necesarios, pero contrapuestos: – Model learning: el sistema debe captar las regularidades existentes en el medio para

crear un modelo que le permita predecir y anticiparse al medio.

– Task learning: el sistema debe captar las demandas momentáneas de la situación, y responder a ellas de manera progresivamente más eficiente.

...como respuesta a estas dos demandas, habría dos reglas de aprendizaje: – una regla de aprendizaje por coactivación (los pesos de la asociación entre unidades se

modifican en función del producto de sus activaciones: aprendizaje hebbiano) – una regla de aprendizaje por error (los pesos de la asociación entre unidades se modifican

en función de la discrepancia entre la activación obtenida y la demandada: regla delta).

4.2. Procesamiento distribuido y en paralelo (Cont.3)

✔ Regla de Hebb: El cambio en el peso de la conexión entre una unidad i que envía un output a otra unidad j depende del producto de la fuerza del output de i por la activación de j:

Wij=oiaj

se puede demostrar que esta función acaba produciendo un grado de asociación entre unidades igual a la correlación existente entre los objetos representados.

✔ Regla Delta: La regla delta es muy parecida a la anterior, excepto porque se aplica en situaciones en las que puede asumirse que el sistema dispone de una señal (feedback) que le indica cuál habría sido la activación deseada en esa unidad. En este caso, el cambio depende del output entrante desde i, pero no de la activación absoluta de j, sino de la diferencia entre la activación demandada por la tarea y la activación obtenida:

Wij=oi(tj-aj)

se puede demostrar que esta función minimiza el error obtenido en la tarea

✔ Regla Delta Generalizada (retropropagación): La regla delta no puede aplicarse directamente a las capas internas de una red, pero existe una derivación de la misma que sí puede hacerlo.

4.3. Representación distribuida

• Las unidades aisladas resultan muy limitadas pero, en conjunto, los principios de representación distribuida, junto con los mecanismos locales y simples de aprendizaje, garantizan un modo de representación:

– flexible (nace de un patrón aleatorio y se va adaptando en función de la experiencia).

– sistemático (una representación se distribuye entre muchas unidades, pero una unidad participa también en muchas representaciones, de modo que estímulos parecidos acabarán siendo representados por patrones de activación similares).

– autónomo: el sistema va asimilando nueva información y acomodándose a ella sin ningún controlador central.

4.4. El aprendizaje y sus limitaciones en los sistemas conexionistas.

• Nivel equivocado de análisis:• es un análisis funcional, aunque microestructural: las descripciones

simbólicas son útiles, pero la comprensión de los sistemas cognitivos podría alcanzarse mejor partiendo de los principios del conexionismo.

• El algoritmo más usado (retropropagación):• no tiene plausibilidad biológica

• versiones plausibles del algoritmo• respuesta funcional

• produce interferencia catastrófica.• Esa interferencia es menor si el entrenamiento es entremezclado.• pueden existir dos tipos de representación con mecanismos distintos de

aprendizaje:uno para la captación lenta de regularidades, y otro para el almacenamiento temporal de episodios.

• es demasiado lento.• sólo uno de esos dos mecanismos es necesariamente lento, y lo es por buenas

razones.

Nicholas Wade

Une los nueve puntos con cuatro trazos rectos, sin levantar el lápiz.

Vygotsky:

E R

herramienta

mediador

signo

instrucción (importancia de los conceptos de andamiaje y de zona de desarrollo potencial)

Ausubel:

Incorporación sustantiva, no arbitraria, de conoc imientos en la estructura previa

Esfuerzo deliberado d e relación con conceptos preexistentes de nivel superior

Aprendizaje relacionado con experiencias, hechos y objetos

Aprendizajesignificativo

Implicación afectiva para relacionar los nuevos conoc imientos .

Incorporación no sustantiva, arbitraria, de conoc imientos

Ningún esfuerzo de integración

Aprendizaje desvinculado de experiencias, hechos y objetos

Aprendizajememorístico

Ningun a implicación afectiva para relacionar los nuevos conoc imientos .

Cognitivismo simbólico vs. conexionismo:

ser vivocrecer

vivo

planta animal

árbol flor pájaro pez

pino roble rosa margarita petirrojo canario sunfish salmón

moverse

piel

aletas

escamas

nadar

PUEDE

ESTÁ

ES UNES UN

ES UN(A) ES UN(A) ES UN(A)ES UN(A)

ES UN

ES UN

ES UN(A)ES UN(A) ES UN

ES UNES UN ES UN

verde alto hojas roja amarilla rojo amarillo amarillo rojo

ES ES ES ES ES ES ES ESTIENE

TIENETIENE

PUEDE

corteza

grande ES

TIENE

volarPUEDE

PUEDE

TIENE

TIENEraices

Cognitivismo simbólico vs. conexionismo: ser vivoplantaanimalarbolflorpájaropezpinoroblerosamargaritapetirrojocanariosunfishsalmónhermosoaltovivoverderojoamarillo

crecermoversenadarvolarcantar

cortezapétalosalasplumasescamasaletasraícespiel

pinoroblerosamargaritapetirrojocanariosunfishsalmón

ES UN(A)ESPUEDETIENE

Item Representación U. Ocultas

Atributo

Relación

Rumelhart & Todd, 1993

Tarea de Wason: ¿Qué cartas hay que levantar para comprobar que “Si hay una vocal en un lado, debe haber un número par en el otro”?

B A3 2

esquema de regla bicondicionalesquema de permiso

esquema de permiso

Tarea temática de permiso: “La película es para mayores, si quiere verla, debe ser mayor de edad.

No quiere verla

Sí quiere verla

16 años

25 años

marco teorico del aprendizaje

Travel