aprenentatge i condicionament (apunts)
Post on 10-Oct-2014
1.586 Views
Preview:
DESCRIPTION
TRANSCRIPT
1
Tema 1: Conceptes previs
1.1 Concepte i definició d’aprenentatge
Aprenentatge: Canvi relativament permanent en els mecanismes de conducta, resultat de
l’experiència (coses que puc o no puc fer) amb els esdeveniments ambientals. L’aprenentatge
pot fer/generar canvis interns en l’organisme, conseqüentment, no s’observa directament sinó
a través de la conducta. En resum: L’aprenentatge és:
- Un canvi relativament permanent.
- Que afecta als mecanismes de conducta.
- Resultant de l’experiència.
Conducta/comportament: Existeixen dos tipus:
Conducta heretada (innata) o conducta no apresa. Una persona neix amb certes
formes de coneixement. Responem de manera reflexa. Aquest tipus de conducta ajuda
a la supervivència primària.
Conducta apresa. Les persones, en funció de la seva pròpia experiència, responem
d’una manera o una altra. A partir de l’experiència es modifiquen o es tenen unes
determinades conductes. L’aprenentatge té com a funció/objectiu l’adaptació a les
circumstàncies que nosaltres afrontem. L’aprenentatge dóna flexibilitat a la nostra
conducta.
1.2 Aprenentatge i execució
Execució (contrari a aprenentatge): accions o respostes observables d’un organisme en un
moment concret. Gràcies a l’execució i als canvis observables de conducta deduïm
l’aprenentatge, ja que aquest no és observable.
Existeix també l’aprenentatge latent: quelcom que aprens però que no manifestes directament
i de manera immediata.
1.3 Aprenentatge i altres causes dels canvis de conducta
Perquè sigui aprenentatge , el canvi en la conducta ha de ser:
Relativament permanent (podem oblidar): l’aprenentatge no és transitori. Si una
conducta es modifica i després torna a ser com abans (en poc temps) no existeix
aprenentatge.
2
Resultat de l’experiència amb els esdeveniments ambientals. Aprendre implica tenir
experiència.
Que afecta als mecanismes de la conducta.
L’aprenentatge s’estudia inferint-lo de la conducta, a través de les execucions. No obstant,
també pot haver-hi aprenentatge sense que es doni un canvi de conducta (no és l’únic que
modifica la conducta). No observarem canvi de conducta quan:
1. La fatiga. La fatiga disminueix la conducta, però el canvi que provoca no és degut a
l’aprenentatge, ja que, quan els subjecte ha descansat, la conducta torna a recuperar-
se. És a dir: el canvi produït és transitori.
2. Alteracions de l’estat motivacional, emocional o fisiològic de l’organisme. La fam o la
set, per exemple, originen canvis en l’execució que no són deguts a un aprenentatge,
sinó una necessitat. Quan els organismes necessiten menjar o beure, fan conductes
que no s’observen en altres moments i que desapareixen així que la necessitat ha
quedat satisfeta. Per tant, aquest canvi també és transitori.
3. Altres:
- No hi ha instruments que ens permeten observar-lo.
- No es donen les condicions adequades
La maduració al llarg del cicle vital provoca canvis no transitoris de conducta però, no
requereixen d¡experiència, per tant, la maduració no és aprenentatge. Aquests factors
maduratius poden ser o no necessaris per a l’execució d’una acció.
1.4 Tipus d’aprenentatge
Trobem dos tipus:
1. Aprenentatge no associatiu: en el qual intervé un únic estímul que desencadena una
resposta reflexa i la resposta que elícita va variant.
a. Habituació: es tracta de la disminució de la resposta reflexa produïda per la
presentació repetida de l’estímul; dit d’una altra manera, el que fem és
aprendre a ignorar estímuls que no són importants . Amb això ens permet
adaptar-nos en l’ambient.
3
b. Sensibilització: es tracta del increment de la resposta reflexa produïda per la
presentació repetida de l’estímul. Normalment són estímuls aversius,
perillosos, amenaçant.
Que nosaltres habituem o sensibilitzem la resposta a un estímul depèn de:
Les característiques de l’estímul: si és irrellevant l’habituem, si és rellevant,
perillós, aversiu el sensibilitzem.
L’estat d’activació de la persona.
Normalment es dóna una habituació.
Habituació Sensibilització
(Per exemple amb una descàrrega dèbil) (Per exemple amb descàrrega intensa)
Les aplicacions de l’habituació són les següents:
- Identificació de l’autisme en nens.
- Avaluació de disfuncions funcionals.
- Publicitat.
2. Aprenentatge associatiu: associem dos estímuls, és a dir, s’aprenen relacions de
predicció entre dos o més fets. Trobem:
a. Condicionament clàssic: en aquest condicionament canviem la conducta en
base a la relació apresa. L’aparició de la RC (resposta condicionada) evidencia
l’establiment de l’aprenentatge.
L’aplicació d’aquest condicionament pot ser per a: publicitat, tractaments clínics de fòbia, pel
condicionament de la resposta immunològica (permet l’administració de menors quantitats de
fàrmacs actius), etc.
4
b. Condicionament instrumental: en aquest condicionament s’aprenen relacions
de predicció entre resposta i conseqüències. Aprenem a controlar certs
aspectes del medi mitjançant la nostra conducta. La conseqüència de la
conducta provoca un canvi en la seva probabilitat de presentació.
L’aplicació d’aquest condicionament por servir per a : l’escola, l’esport, l’entrenament
d’animals per ajudar a persones, el moldejament de conductes senzilles en persones amb
minusvalidesa...
Dins aquest condicionament trobem el condicionament operant (Skinner), que es diferencia
d’aquest en el fet que no hi ha assajos.
CONDICIONAMENT CLÀSSIC
(predicció)
CONDICIONAMENT INSTRUMENTAL
(control)
Associació EC-EI Associació resposta-conseqüències
La RC és resultat de predicció La R determina les conseqüències
*EC= estímul condicionat (la campana a l’experiment del gos de Paulov)
*EI = estímul incondicionat (el menjar en l’experiment del gos de Paulov)
1.5 Aspectes metodològics
Utilització de models animals: els principis i les lleis de l’aprenentatge són comuns a
totes les espècies.
Avantatges d’utilització d’animals:
o Coneixement de les característiques biològiques
o Menys problemes derivats de la interacció subjecte-experimentador
o Menys problemes ètics
1.6 Objecte d’estudi de l’aprenentatge com a disciplina científica
L'aprenentatge com a disciplina científica té com a objectiu conèixer:
a) les condicions de l’aprenentatge quan s’aprèn, en quines situacions es produirà
l'aprenentatge;
5
b) els mecanismes de I'aprenentatge: com s’aprèn, quin és el sistema o procediment
mitjançant el qual s'adquireixen determinats continguts en determinades situacions;
c) els continguts de l'aprenentatge: què s’aprèn, què és el que els organismes
adquireixen com a resultat d'un aprenentatge;
d) els determinants de I'execució: quins elements fan que I'aprenentatge es manifesti o
no i que ho faci mitjançant una execució o una altra.
6
Tema 2: Aprenentatge no associatiu. Conducta elicitada/heretada/innata
2.1 Concepte de conducta elicitada
La conducta elicitada no requereix aprenentatge previ. Un estímul, si es presenta, provoca una
resposta de manera involuntària/automàtica (cas de l’acte reflex). Aquesta inclou dos
conductes diferents:
Els reflexos: tenen una estructura neural mínima i són a base de l’aprenentatge no
associatiu.
Els mecanismes d’orientació o tropismes;
o Indirectes (kínesis)
o Directes (tàxies): tropisme direccional; quan apareix un estímul, el subjecte es
dirigeix cap a ell o fuig.
Les pautes d’acció modal (patrons d’acció modal o pautes d’acció fixes): són un
conjunt de respostes encadenades.
Totes aquestes conductes tenen una base heretada, però això no vol dir que no siguin
modificables per l’aprenentatge.
Esquema genèric de les conductes elicitades: E R (diferent de l’aprenentatge)
2.2 Els reflexos
2.2.1 Definició
Pautes uniformes d’acció (moviments característics d’aquell reflex) desencadenades de forma
involuntària en un temps molt breu i degudes a l’aplicació d’un estímul molt definit (alta
especificitat) a un determinat receptor.
Esquema genèric de les conductes reflexes: E elicitador (estímul determinat que provoca una
acció determinada i que s’ha de provocar en un determinat receptor) R específica/elicitada.
L’especificitat en la relació de l’estímul i la resposta reflexa és una conseqüència de
l’organització del sistema nerviós:
Neurona aferents Interneurona Neurona eferent = arc reflex
7
Sempre que es presenta un estímul elicitador apareix la mateixa resposta reflexa, que podrà
tenir característiques diferents en funció de les característiques del subjecte i de la situació
concreta o del moment en què apareix. Hi ha, per tant, variabilitat interindividual i variabilitat
intraindividual en relació amb les respostes reflexes.
Recordatori - període de latència de resposta: temps des del inici de l’estímul fins el inici de la
resposta.
2.2.2 El reflex d’orientació
No compleix amb les normes dels reflexos anteriors perquè és inespecífic pel que fa l’estímul
ja que són estímuls nous, i pel que fa les respostes, que són variades i no estan ficades.
Conjunt de respostes (preparen l’organisme per a l’acció). Part de les respostes elicitades són:
A. Respostes musculars: augment de la tensió muscular; moviments d’orientació.
B. Respostes vegetatives. Disminució o pausa (apnea) de la freqüència respiratòria;
alteracions de la freqüència cardíaca i de la pressió arterial; increment de la sudoració
(RED); dilatació pupil·lar.
C. Respostes centrals: desincronització de les ones electroencefalografies (EEG)
cerebrals. Ja no hi ha un estat continu en les ones alfa i passaríem a unes ones beta.
Característiques definitòries:
Reflex d’orientació o també anomenat d’ensurt i de defensa. Aquest reflex s’utilitza
com a indicador atencional.
Conjunt de respostes elicitades per un estímul nou o per la modificació d’un estímul
familiar.
És un reflex inespecífic.
És important pels psicòlegs perquè s’habitua (habituar-se = forma d’aprenentatge més
simple) de forma ràpida i total.
2.2.3 Mesures de la resposta reflexa
- Magnitud
Intensitat (potència): el punt màxim de canvi.
Durada: el temps des de l’inici fins al final de la resposta.
8
- Latència: el temps des de que comença l’estímul fins que s’inicia la resposta. Estímul intens
latència curta.
- Facilitat d’habituació (habituabilitat): si s’habitua en pocs assaigs reflex dèbil.
- Llindar (Umbral): intensitat mínima de l’estímul que desencadena la resposta. El valor del
llindar ens diu si el reflex es més fort o més dèbil, depenent de si es necessita un llindar
d’estímuls més alts o més baixos (estímuls baixos reflex fort). Indicador de la força del reflex.
9
Tema 3: Aprenentatge no associatiu: Habituació i sensibilització
3.1. Concepte d’habituació
3.1.1 Definició
Consisteix en una disminució de la resposta reflexa, causada per la repetida presentació de
I'estímul elicitador. En alguns casos, com en el reflex d'orientació, la resposta reflexa pot
arribar a desaparèixer si el nombre de presentacions de l'estímul elicitador és suficient.
La disminució de resposta que podem observar quan presentem repetidament un estímul no
és regular, sinó que a mesura que transcorren els assaigs la disminució de la resposta generada
per cada assaig particular, i que se suma a la generada pels assaigs anteriors, és cada cop
menor. Malgrat tot, no és infreqüent que en els primers assaigs aparegui un petit increment de
la resposta (sensibilització) i tot seguit és quan comença el decrement de resposta característic
de I'habituació.
3.1.2 Altres respostes de decrement de la resposta
A més de I'habituació, la fatiga i l'adaptació sensorial són altres fenòmens que poden provocar
el decrement de la resposta reflexa. Tot i la seva similitud quant a la forma de manifestar-se,
les causes que les originen són diferents:
- Adaptació sensorial Disminució de la sensibilitat dels receptors sensorials Procés
perifèric No és aprenentatge. (arc reflex)
- Habituació Canvis en el SNC com a conseqüència de l’experiència repetida amb l’estímul
Procés central És aprenentatge.
- Fatiga muscular Esgotament dels músculs efectors Procés perifèric No és
aprenentatge.
Exercici. Habituació, fatiga i adaptació sensorial: anàlisi de casos:
- Identifica i raona en cada cas de quin d’aquests fenòmens es tracta.
Cas de soroll de projector que deixem de prestar-li atenció conscient. Exemple
d’habituació. No pot ser ni adaptació sensorial ni fatiga muscular perquè és un procés
central (en el SNC). A més, l’estímul es deixa de percebre de manera específica, no
perdem directament l’audició per complert (seguim seguint al professor i escoltant-lo).
10
Cas de l’enlluernament provocat per la llum del power point que ens fa no veure ve en
els moments posteriors. Exemple d’adaptació sensorial. Adaptació perquè no és
específica la pèrdua de visió, no només no veiem el power point, tampoc podem veure
al company o els apunts.
Totes fan que la resposta vagi disminuint però l’únic que ve de l’aprenentatge és l’habituació.
3.2 Propietats de l’habituació
- Especificitat muscular: quan jo m’habituo, m’habituo a UN estímul. És especifica a l’estímul.
- Generalització: som capaços de generalitzar una cosa que l’hem aprés en un context específic
a un altre context. Ex. mi fa sol la si do re (gradient de generalització).
- Retenció:
Recuperació espontània: tornar a l’estat d’abans; com si faig un assaigs i m’hi he
habituat, deixem passar un temps tornem als assaigs recuperem l’estat inicial, però
normalment no és total sinó moderada.
Tipus: habituació a curt termini (dura un temps de segons o minuts) i habituació a llarg
termini (durada de hores, dies, setmanes, anys). (Leaton)
- Potenciació de l’habituació: Les habituacions repetides a un mateix estímul són cada vegada
més fàcils i duradores, és a dir, que requereixen menys assaigs i s'endarrereix la recuperació
espontània de la resposta.
- Deshabituació: no es deixa passar cap temps perquè sinó seria recuperació espontània; el que
es fa es que en el interval entre estímuls es presenta un estímul nou i diferents (estímul
deshabituador). Així la resposta a l’estímul habituador augmenta.
Exercici.
Volem dur a terme un experiment amb l’objectiu d’estudiar so les persones amb trastorn límit
de la personalitat mostren un reflex d’orientació alterat enfront d’imatges d’alt contingut
emocional negatiu, en comparació amb un grup control de participants sans.
- Indica dues respostes reflexes que es podrien avaluar en aquesta recerca i, per a cadascuna
d’elles, especifica una possible mesura de la seva força.
Sudoració i dilatació pupil·lar.
11
1. Latència: quan comença a sudorar i magnitud durada des q comença fins q s’acaba.
2. Magnitud
3.3 Variables de l’habituació
- Intensitat de l’estímul: a major intensitat de l’estímul elicitador, més difícil i lenta resultarà
l’habituació. Un cop aconseguida l’habituació, la retenció és més duradora. D'altra banda, a
més intensitat de l’estímul, major és la retenció de I'habituació.
- Freqüència de presentació de l’estímul (IEA: interval entre assaig): a major freqüència de
presentació de l’estímul, més fàcil i ràpida serà l’habituació però, a curt termini. Per tant, quan
la freqüència és més baixa, més durarà l’habituació.
Exercici. Grup A i grup B. En el grup A: 8 assaigs / 60 dB /IEA = 30s. En el grup B: 8 assaigs /
80dB / IEA = 30s. En el grup A els assaigs 7 i 8 tenen un valor de RED de 0. En el grup B quins
valors es podrien presentar? Doncs valors més grans que 0 perquè augmenta la intensitat de
l’estímul i disminueix la freqüència.
3.4 Concepte de sensibilització treballat a Conferència. Mirar llibre de Michael Domjan.
Consisteix en un increment de la resposta reflexa, causat per la repetida presentació de
l'estímul elicitador.
Els estímuls que provoquen sensibilització són els estímuls rellevants per a l'organisme,
intensos, aversius, amenaçadors. En general són estímuls que assenyalen perill i per això és
important per a l'organisme estar aler,ta- Aquests estímuls, com també l'acció de determinats
fàrmacs i altres factors, poden portar l¡organisme a un estat que comporti que pugui mostrar
respostes desproporcionadament intenses a estímuls nous i diferents dels que van provocar la
sensibilització, encara que aquests estímuls nous no siguin estímuls que indiquin perill.
El procés de sensibilització forma part del sistema de defensa dels individus, i com a tal és
normal que la resposta elicitada per un estímul que implica aquest sistema no s’habituï
fàcilment i que incrementi la reacció del subjecte davant la repetida presentació de l'estímul
fins a un límit fisiològicament acceptable.
3.5 Propietats i variable de la sensibilització (Es tracta del increment de la resposta reflexa
produïda per la presentació repetida de l’estímul. Normalment són estímuls aversius,
perillosos, amenaçant)
12
- Baixa especificitat estimular. Exemple: cine pel·lícula de por en què apareixen sons inesperats
que provoquen respostes d’ensurt. El primer cop t’espantes, i el següent (si la pel·lícula és bona)
encara ens farà més por perquè estem ficats en l’argument.
- Generalització. Un cop habituat un estímul, si es presenta un altre diferent respondrem de
manera semblant. Exemple de la por amb una pel·lícula de terror: si estem ja espantats i ens
toquen per darrera responem de la mateixa manera que si aparegués a escena d’ensurt en la
pel·lícula.
- Intensitat de l’estímul: a major intensitat de l’estímul, major efecte de sensibilització.
- Freqüència de presentació de l’estímul: a major freqüència de presentació de l’estímul,
major efecte de sensibilització.
- Curs temporal:
Curs temporal de la sensibilització: l’increment de la tendència a respondre
normalment té vida curta. Per exemple, una rata exposada a un so durant 25 min,
només va incrementar la reactivitat durant 10 o 15 min. La durada està determinada
per la intensitat de l’estímul. Els estímuls més intensos produeixen major increments
en la tendència a respondre i a una sensibilització més persistent.
Curs temporal de l’habituació: hi tant habituació a llarg termini com a curt termini.
Veiem-ho amb un experiment. La recuperació espontània es característica de la de a
curt termini i mai es completa per la de a llarg termini.
El efectes de l’habituació a curt i llarg termini queden clarament il·lustrats en l’experiment de
Leaton sobre la resposta de sobresurt de les rates.
- L’estímul de prova és un to agut (durant 2 sec.). Primer es permet als animals a que
s’acostumin al recinte experimental sense cap tipus de so; després la rata rep (en un únic
assaig) el to una vegada al dia durant 11 dies. Degut a la longitud d’interval (24 h) qualsevol
disminució de la resposta consistirà en una habituació a llarg termini. En la següent fase rep
300 presentacions seguides (cada 3 sec.) i serà habituació a curt termini. Les rates, finalment,
reben una única presentació de l to cada cadascun dels tres dies següents per mesurar la
recuperació de l’efecte de l’habituació a curt termini. La reacció més intensa s’observa el
primer cop i va disminuint la resposta progressivament.
13
- Especificitat
Especificitat de l’estímul en la habituació: una resposta a un estímul prèviament
habituada pot manifestar-se plenament alterada alguna característica important de
l’estímul. Per exemple, després que ens hem habituat al so del rellotge de la paret, es
probable que tornem a prestar-li atenció si funciona malament.
Encara que l’habituació es específica a un estímul, pot donar-se certa generalització. Si
ens hem habituat a un determinat soroll y apareix un que si assembla molt a l’original
hi haurà una generalització de l’estímul de l’habituació. Tot i així l’organisme mostrarà
una menor habitació o una supressió de la resposta davant aquest nou estímul.
Especificitat de l’estímul en la sensibilització: no és molt específica; si un animal
s’activa o sensibilitza per alguna raó, la seva activitat augmenta per tota la varietat
d’estímuls.
També podrem parlar de deshabituació quan la resposta habituada pot restablir-se
sensibilitzant amb l’exposició a un estímul extern. Aquest terme fa referència a la recuperació
de la resposta al estímul prèviament habituada.
*Experiment: atenció visual amb bebès (Kaplan, Werner i Rudy).
Els bebès foren exposats a un patró de tauler d’escacs 4x4 i en els 8 primer assaigs van mostrar
ja una habitació. A l’assaig 9 es va fer el mateix y es la introduir un so, mentre un altre grup
continuava com inicialment. La presencia del so va augmentar la resposta notablement i es va
veure que es mantingué elevada durant els següents assaigs, durant els quals ja no hi havia so.
3.6 Teories sobre l’aprenentatge no associatiu
3.6.1. Teoria del doble procés (aprenentatge no associatiu)
Diuen que l’habituació i sensibilització necessiten una certa estructura neural per poder-se
donar. En aquest intervenen:
- Sistema E-R: és la via neural més curta entre l’estímul elicitador i la resposta elicitada
resultant. Està compost per les estructures neurals de l’arc reflex (neurona sensorial,
interneurona, neurona motora) arc reflex.
S’activa sempre que un estímul elicita una resposta. La repetida utilització d’aquest sistema
provoca una disminució en la tendència a respondre.
14
- Sistema d’Estat: consisteix en tots els processos neuronals que no són part integrant
del sistema E-R però que influeixen en la seva reactivitat. És el responsable de l’estat
d’activació o d’alerta de l’organisme.
Per tant, aquest sistema és el responsable de l¡increment de “responsivitat”.
Únicament participa en circumstàncies especials (events excitadors), provocant un increment
en la tendència a respondre.
Activació repetida del sistema E-R procés d’habituació
Estímul
Possible activació del sistema d’estat procés de sensibilització
La resposta observable dependrà de la força dels processos generats per l’estímul.
3.6.2. Teoria del procés oponent (estudi de les respostes emocionals)
Inicialment hi ha una etapa en la qual hi ha una gran manifestació emocional, aquesta resposta
disminueix però encara es manté quan l’estímul està present. En el moment en que l’estímul
desapareix, desapareix la resposta emocional forta i finalment es cau en el caire contrari i
posteriorment es torna a la normalitat.
També van observar que la resposta emocional era menys intensa si aquest estímul es donava
en més ocasions.
15
Postulats de la teoria:
Les reaccions emocionals són bifàsiques
La reacció primària s’afebleix amb l’exposició a l’estímul
L’afebliment de la reacció primària va acompanyada d’un enfortiment del postefecte
(procés oponent)
És una teoria homeostàtica.
Gràfic: resposta afectiva/ processos oponents:
El procés A determina el tipus de resposta que hi ha i és invariant. El procés B canvia amb
l’experiència (s’enforteix). De la suma d’aquests processos surt “l’evolució” de l’emoció, la
corba.
- Un estímul que produeix un estat emocional (procés a) produeix també l’efecte oposat
posterior (procés b) l’inici del qual es posterior.
- El procés a és el responsable de l’estat emocional i el procés b genera la reacció
emocional oposada.
- La intensitat i durada de a és fixa i ve determinada per les característiques de l’estímul.
El procés a comença quan l’estímul apareix i acaba quan aquest finalitza.
- El procés b és variable. Les repetides exposicions a l’estímul l’enforteixen (s’activa més
ràpidament, la seva intensitat màxima augmenta i es deteriora més lentament).
Postulats de la teoria:
Els canvis emocionals observats quan es presenta un estímul i després es retira, se
suposa que reflecteixen el resultat net d’aquests dos processos (a i b)
La reacció emocional observable provocada per a primera presentació de l’estímul
disminueix si l’estímul es presenta amb una certa freqüència, com a conseqüència de
l’enfortiment del procés b
El desequilibri, cada cop menor, entre el processos a i b, explicaria l’habituació de la
resposta emocional
16
Els canvis del procés b, també depenen del temps entre les successives presentacions
de l’estímul. Si són molt espaiades, no ocorreran canvis en el procés b, o seran mínims
i no s’habituarà la resposta emocional.
EXPERIMENTS
Atenció visual en els bebès (Habituació i deshabituació)
2 grups de bebès. Al primer li presenten un estímul visual (com un joc d’escacs) de 4x4, i al
segon un e 12x12. La presentació és repetidament , 8 vegades en intervals de 10 segons. El
resultat va ser que:
- L’atenció visual provocada per l’estímul més senzill (4x4), es redueix a mida que van passant
els assajos.
- L’atenció visual provocada per l’estímul més complex (12x12), incrementa durant els primers
assajos i després es comença a reduir.
IMATGE PÀGINA 37!!!
Deshabituació: en l’assaig 9, un grup de bebès reben un so conjunt amb l’estímul visual,
mentre que l’altre grup només rep l’estímul visual. El to va augmentar la resposta i per tant va
recuperar la resposta de l’estímul prèviament habituat (visual).
IMATGE PÀGINA 48!!!
Salivació i avaluació del sabor en humans (Adaptació sensorial)
El gust del menjar elicita la salivació com a resposta reflexa. El que es va fer era mesurar la
salivació de 8 dones davant el suc de llimona i el suc de llima. En els 10 primers assajos hi havia
un sabor, i a partir de l’11 es canviava per l’altre sabor. A mida que l’estímul es repetia, perdia
eficàcia per elicitar respostes, però quan es canviava el sabor, recuperava la resposta.
IMATGE PÀGINA 38!!!
Resposta de sobresalt en rates (Habituació i sensibilització)
Mitjançant una càmera establimètrica, es controla la resposta de sobresalt en rates. Dos grups
de rates: a un se li aplica un soroll quan escolten una melodia amb un so ambiental semblant al
de l’aigua (60db), i al segon igual però amb el so de l’aigua a 80db. Es repeteixen els sons.
17
Resultats: per a les rates exposades al so ambiental suau, les repeticions del soroll van
provocar un sobresalt cada vegada més dèbil. En canvi, a les rates amb un so ambiental alt, les
repeticions del soroll provocaren reaccions de sobresalt cada vegada més rigoroses.
Leaton (efectes de l’habituació a curt i llarg termini)
Experiments sobre rates. Primer se les deixa experimentar el lloc sense cap to agut e intens, i
després s’aplica aquest (durant 2 segons):
1. Un cop al dia durant 11 dies (procés d’habituació a llarg termini)
2. Tres-centes presentacions de l’estímul cada 3 segons durant 11 dies (procés
d’habituació a curt termini)
3. Un cop al dia
Conclusions:
1. l’habituació a llarg termini no va provocar una completa pèrdua del reflex d’orientació.
2. l’habituació a curt termini va provocar una disminució de la resposta més ràpida
3. la resposta d’ensurt es va recuperar al nivell del 11è dia de l’experiment; aquesta
recuperació és la recuperació espontània (principal característica de l’habituació a llarg
termini).
Experiment amb l’invertebrat
Estudien la resposta reflexa de la retracció de la brànquia d’un invertebrat.
Aquesta investigació ha demostrat que l’estimulació repetida de la neurona sensorial no
provoca canvis en els potencials d’acció generats per la neurona sensorial, sinó que redueix la
quantitat de transmissor alliberada, donant lloc al fenomen de l’habituació.
La sensibilització, en canvi, involucra la interneurona facilitadora, que produeix un canvi en la
neurona sensorial que li permet alliberar més neurotransmissor. Donat això, les neurones
motores s’activen més i la resposta de retracció de la brànquia és més intensa. Per tant, i en
resum, la sensibilització conductual ocorre degut que descàrrega en la cua potencia
l’alliberació de neurotransmissor per part de la neurona sensorial.
18
Tema 4: Els fonaments del condicionament clàssic. Aprenentatge associatiu
4.1 Els descobriments inicials de Pavlov – Conferència 2 (ben explicats en el llibre de text de
Domjan)
La investigació sobre el condicionament clàssic va començar amb el treball de Pavlov, que va
estudiar com aprenien els gossos a anticipar l’administració de menjar.
A diferència de l’habituació i sensibilització, que permetien canvis en les respostes que ja es
troben al repertori de respostes de l’organisme, el condicionament clàssic permet també
l’aprenentatge de noves respostes o de respostes a nous estímuls.
Aprenem relacions, establim associacions. En el condicionament clàssic aprenem relació entre
estímuls. És un aprenentatge d’anticipació, de predicció, de tal manera que ens ajuda a ajustar
el nostre comportament a l’ambient.
En resum: el condicionament clàssic és el mecanisme més simple pel qual els organismes
poden aprendre sobre les relacions entre estímuls i canviar la seva conducta en conformitat
amb les relacions.
4.1.1 Aportacions de Paulov a l’estudi del condicionament clàssic
- Observació sistemàtica del fenomen (1903): estudi característiques, variables.
- Procediments: de presentació d’estímuls, de mesura de la RC.
- Estudi de diferents fenòmens: aprenentatge extinció, generalització, discriminació,
condicionament inhibitori, condicionament de 2on ordre...
- Aportació teòrica: teoria de la substitució de l’estímul.
4.1.2 Condicionament salival: preparació experimental
Es mira quant saliven els gossos a través d’una cànula (llibre Domjan).
- Ei (estímul incondicionat): carn en pols
- En (estímul neutre): auditius, visuals, olfactius, tàctils...
- RI (resposta incondicionada): salivació
- RC (resposta condicionada): salivació
19
La resposta salival es pot extingir i és més ràpida.
4.1.3 Altres autors
Pavlov
- Estudi de les secrecions gàstriques (premi Nobel de fisiologia 1904)
- Estudi de propietats del sistema nerviós: força, equilibri i mobilitat.
- Tipologies animals seguint la classificació clàssica galeno-hipocràyica (colèric, sanguini,
flemàtic, melancòlic).
Vladimir Beixterev
Va introduir:
- El condicionament clàssic de respostes musculars
- la utilització d’EEII aversius.
John B. Watson
Estén el condicionament clàssic a les respostes emocionals.
Vul’fson
Va estudiar la resposta salival de varies substàncies situades a la boca, com el menjar sec,
humit, l’aigua àcida y arena. Després que els gossos haguessin experimentat la sensació
provocada per aquestes substàncies a la boca, la mera visió de les mateixes provocaven la
salivació.
Snarskii
Va expandir allò que havia fet Vul’fson a substàncies artificials com aigua àcida d’un color
negre; l’animal va acabar salivant només amb la visió de l’aigua negra o d’una ampolla amb
líquid negre.
Ambdós (Vul’fson & Snarskii)
Les substàncies també provocaven en la boca sensacions de textura y sabor característics. Això
es denominà estímuls orofaringis, les quals el gos va aprendre a associar-les amb
20
característiques visibles aprenentatge d’objecte (associar diferents característiques a un
mateix objecte.
4.1.4. Tipus de condicionament clàssic
EI apetitiu EI aversiu
EC + presència EI Excitatori apetitiu Excitatori aversiu
EC- absència EI Inhibitori apetitiu Inhibitori aversiu
- Base de tractaments clínics (tractament de fòbies, etc)
4.2 El paradigma i els termes del condicionament clàssic
- Fase A (situació inicial):
EI (estímul incondicionat: menjar) RI (resposta incondicionada: salivació)
En (estímul neutre: so metrònom) no provoca salivació
- Fase B (adquisició de l’aprenentatge):
En - ->(“seguit de”) EI RI
- Fase C (fase de prova, provo si s’ha arpés):
EC (estímul condicionat: so metrònom) RC (resposta condicionada: salivació)
L’estímul neutre associat al menjar ha adquirit valor informatiu i es converteix en un estímul
condicionat.
Nota: consultar el glossari per a la definició dels termes del condicionament clàssic.
4.3 Fenòmens bàsics del condicionament clàssic
4.3.1 L’adquisició
Procediment: presentació repetida de l’EC i de l’EI associats (EC - -> EI).
Resultat:
o A nivell d’aprenentatge: adquisició força associativa (intensitat de l’associació
o relació existent entre l’EC i l’EI) per part de l’EC;
21
o A nivell d’execució: enfortiment de la RC (s’adquireix força associativa);
o Curs de l’adquisició.
RC (salivació)
Assaigs
4.3.2 L’extinció (aprenem a inhibir però, no eliminem aprenentatge):
Procediment: presentació repetida de l’EC sol després del condicionament (EC - ->).
Resultat: debilitament gradual de la força de la RC.
- Resistència a l’extinció (Rext): nombre d’assaigs d’extinció necessaris per a la desaparició de
la RC.
- Recuperació espontània: reaparició de la RC i l’EC després d’un temps de descans.
- Interpretació: l’extinció com a aprenentatge d’inhibició de la RC (inhibició extintiva):
Recuperació espontània (reaparició de la RC a l’EC després d’un temps de descans);
Desinhibició: reaparició de la RC per la presentació d’un estímul nou (ED: estímul
desinhibidor) conjuntament amb l’EC durant l’extinció (té els mateixos efectes que la
pausa però el procediment de la desinhibició és diferent) Trenca el procés
d’aprenentatge en curs;
Renovació: reaparició de la RC al presentar l’EC en el context d’adquisició original
(l’extinció la portem a terme en un context diferent a l’original). Aquest efecte sorgeix
perquè la memòria d’extinció és específica de les claus que estaven presents durant la
fase d’extinció. Això succeeix que la RC és més forta o duradora que l’extinció.;
Restabliment: reaparició de la RC i l’EC per la reexposició a l’EI després de l’extinció. Es
presenta l’EI sol (menjar en l’exemple de salivar) i després tornes a presentar l’EC. El
condicionament contextual facilita l’efecte de restabliment.
Tots aquests fenòmens tenen en comú que es fa desaparèixer part de l’aprenentatge però si es
torna a presentar l’estímul, es dóna la resposta condicionada.
22
- Oblit: debilitament d’una resposta apresa degut al pas del temps. L’extinció és més eficaç
pels aprenentatges inhibitoris que l’oblit. Deixo passar el temps un cop adquirit l’aprenentatge
(no segueixo el procediment d’extinció). En molts casos, l’oblit es confon degut que es
presenten estímuls semblants entre ells que fan que el primer estímul quedi borrós.
- Implicació: tractament de les fòbies. Per eliminar-la podem utilitzar l’extinció però, el
subjecte ho passa malament ja que el presentem a l’EC (un objecte que en un principi no crea
por). No podríem eliminar les fòbies amb l’oblit.
4.3.3 La generalització és la tendència natural a respondre als estímuls que són similars a l’EC.
En aquest cas, el gradient de generalització és invers a la generalització en l’habituació ( )
Gradient de generalització
Ex: petit Albert, el condicionen a tenir por a les rates blanques, i el nen quan li presenten un
conill blanc, generalitza l’estímul i igualment dóna una resposta.
4.3.4 La discriminació: Per extingir la generalització presentem els estímuls semblants a l’EC
sense l’EI i quan presentem l’EC presentem també l’EI.
Procediment: EC - -> EI alternat a l’atzar (sense un ordre concret perquè si no s’aprèn)
amb E’ - ->
Resultat: EC RC ; E’ - ->
o Neurosis experimentals (Shenger-Krestovnikova, 1921): va dissenyar un experiment en
què la discriminació s’anava complicant en gossos. Quan ja era molt complicat
discriminar i es presentava un altre cop els estímuls inicials (EC i E’ que eren
relativament més diferents), els gossos es tornaven agressius i els costava molt
discriminar els estímuls.
Exercici. Anomena els procediment i fenòmens de condicionament clàssic descrits en la taula
següent
1. Nombre d’assaigs de presentació de l’EC sol necessaris er a la desaparició de la RC –
Resistència a l’extinció.
2. Reaparició de la RC prèviament extingida per la presentació de l’EC després d’un temps
de descans – Recuperació espontània.
23
3. Debilitament d’un aprenentatge degut al pas del temps – Oblit.
4. Reaparició de la RC per la presentació durant l’extinció d’un estímul nou conjuntament
amb l’EC – Desinhibició.
5. Presentació de l’EC sense l’EI després de l’adquisició – Extinció.
4.4 Condicionament clàssic en la nostra vida
Normalment s’estudia en un laboratori, però això no vol dir que només aparegui en situacions
de laboratori. El condicionament clàssic sempre té lloc que un estímul precedeix regularment a
un altre.
Una àrea d’investigació interessant es per a explicar els judicis de causalitat humana, és a dir,
com apareixen les causalitats que establim a la nostra vida quotidiana (el saber que si reguem
una flor creixerà). També Per a les preferències i aversions alimentaries (si alguna cosa ens a
provocat malestar al menjar-la tendirem a tenir aversió d’ella), per a les respostes de por. I
finalment, també les podem veure a part de en la conducta sexual, en les respostes dels nens i
les mares per a que la seva alimentació (bebés) es doni.
24
Tema 5: Metodologia d’estudi del condicionament clàssic
5.1 La qualificació de la RC
5.1.1 Mesures
Intensitat (amplitud màxima de canvi) Magnitud
Durada (des de l’in. Fins al final de la RC)
Latència (només la tenen les respostes, no els estímuls): Temps des de que començo a
presentar l’estímul condicionat fins el principi de la RC.
Resistència a l’extinció (Rext.)
Percentatge d’assaigs amb RC. Aquesta mesura és vàlida quan hem de realitzar
centenars d’assaigs i no uns pocs. Només és útil en respostes de condicionament lent.
5.1.2 Tècniques de mesura
Per evitar la interferència de la RI tinc dos tipus de tècniques:
- Assaig de prova (un cop donat el condicionament clàssic, faig aquest assaig):
Es presenta l’EC sol;
=> Extinció (inconvenient ja que debilito la RC)
- Anticipació (en els assaigs que vull mesurar la RC, continuo presentant el so el menjar, EC i EI,
però deixo passar un temps entre els estímuls)
S’augmenta la durada del interval entre estímuls (IEE).
=> Inhibició de demora (la RC es donarà cada cop més tard, és a dir, salivarà més tard i,
per tant, augmentarà la seva latència. Finalment es sobreposarien les dues respostes,
la RC i RI).
R RI
EI RC
EC
Tots dos procediments debiliten la RC, no hi ha cap de millor o pitjor.
25
5.2 Els procediments de presentació temporal dels estímuls
Demora (EC abans de l’EI): és un procediment eficaç per generar condicionament
clàssic. En algun moment del temps han de coincidir els estímuls (mirar imatge).
Traça (huella): interval o període de traça (temps entre les dues presentacions de
l’estímul). Genera condicionament clàssic però, degenera aquest condicionament.
Temporal (presento l’EI cada poc temps però regularment): en aquest cas el temps es
converteix en l’EC i la RC apareixeria just abans l’EI. no hi ha un estímul explícit que
anticipi, sinó un estímul implícit que és l’interval entre la presentació de l’estímul. (ex:
salivació del gos: es presenta cada 5 minuts l’estímul el gos acaba salivant abans
dels 5 minuts). Presentem l’estímul incondicionat en intervals regulars de temps.
Aleatori (presento l’EC i l’EI a l’atzar): en aquest cas, l’EI no té cap relació amb l’EC i la
RC no es donarà (no genera condicionament).
Cap endarrera (retroactiu o retrògrad): primer apareix l’EI (menjar) i després l’EC (so).
Provoca alleujament i es produeix un condicionament inhibitori: l’EC prediu l’absència
de l’EI.
Simultani (presentar al mateix temps l’EI i l’EC): no hi ha unanimitat en aquest
procediment ja que al presentar al mateix temps els estímuls no es produeix
condicionament però, existeixen experiments que han donat resultats de
condicionament inhibitori. Això es pot explicar mirant el final de la presentació de
l’estímul, ja que quan s’acaba l’EC es prediu que l’EI no es continuarà presentant.
5.3 El control experimental
Hem dut a terme un condicionament clàssic: com podem estar segurs que la RC és realment
deguda al condicionament (això és, a l’associació EC-EI), i no fruit de la casualitat o d’un procés
aliè al mateix condicionament?
En els experiments de condicionament clàssic, aquest important problema metodològic
s’afronta comparant els resultats del grup experimental (grup de subjectes als quals
s’administra el condicionament) amb els resultats del grup control (grup de subjectes als quals
es presenten igualment l’EC i l’EI, però sense possibilitat de condicionament).
26
- El pseudocondicionament
S’utilitza per comparar dos grups per tal de saber si realment hi ha hagut un condicionament.
El que necessitarem serà un grup control. Si en el grup experimental hi ha RC i en l’altre grup
(grup control) també direm que hi ha hagut un pseudocondicionament (aparent
condicionament). Però llavors no podré dir que es una RC sinó que hi ha un
pseudocondicionament.
- Grups de control. S’han proposat diferents estratègies de presentació dels estímuls per al
grup control, les quals es poden utilitzar complementàriament en un mateix experiment:
1. Els procediments de control de l’EC aïllat i de control de l’EI aïllat consisteixen a
presentar al grup de control l’EC sol o bé l’EI sol. Encara que informatius, aquests
tractaments no es poden considerar plenament satisfactoris, ja que els subjectes del
grup control no tenen una experiència amb els dos estímuls comparable a la que reben
els subjectes del grup experimental.
2. Procediment de control vertaderament aleatori del pseudocondicionament: el que
faríem seria un condicionament aleatori, ja que es van posant aleatòriament EC i EI i
no hi ha possibilitat que aparegui condicionament. En principi, això garanteix que els
subjectes del grup control reben un tractament idèntic al dels seubjectes del grup
experimental, excepte per la impossibilitat teòrica d’establir una associació entre EC i
EI. Per això el procediment aleatori no podria ser bo, perquè si el nombre de
presentacions és petit, ja que podem tenir de traça o de demora, que siguin realment
de condicionament (el que volem descartar), per això si hi ha un nombre d’assaigs gran
no hi hauria cap tipus de condicionament i seria un grup de control bo.
3. Procediment control explícitament no aparellat (control desaparellat explícit): es
presenten l’EC i l’EI separats per un període de temps suficient per evitar el
desenvolupament de l’associació.
Control discriminador (inhibició diferencial): es un disseny intrasubjecte; agafo els
subjectes experimentals, tenim dos estímuls EC i EI (so i llum) un associar-lo al menjar i
l’altre no. El primer serà l’experimental i l’altre serà la de control; 30 d’un tipus i 30
d’un altre però en el mateix grup de subjectes. En un assaig presento els dos junts i hi
ha una resposta condicionada per tant, no pot ser-ho i hi haurà un
pseudocondicionament. En un altre participant el que faríem seria contrabalancejar
(canviar els estímuls a l’inversa per tal de descartar o no el condicionament).
Normalment no s’utilitza un aïllat dels procediments sinó més d’una a la vegada.
27
5.4 Les situacions experimentals de condicionament clàssic
Modernament s’han desenvolupat diferents situacions o tècniques experimentals per a
l’estudi del condicionament clàssic, que han substituït el condicionament salival i altres
preparacions experimentals utilitzades pels pioners en l’estudi del condicionament clàssic.
5.4.1 Condicionament palpebral (tancament de la parpella reflex)/ condicionament de la
membrana nictitant en conills.
Es desenvolupà inicialment als anys seixanta amb subjectes humans, però aviat alguns
avantatges metodològics van fer que es tendís a substituir pel condicionament de la
membrana nictitant en el conill albí, una tècnica desenvolupada principalment per Isidor
Gormezano.
S'associen un EC (so, llum, estímul tàctil) i un EI que provoca de manera reflexa la resposta de
tancament de la membrana nictitant, com ara un buf d'aire o una descàrrega elèctrica lleu.
Tots dos estímuls es presenten durant un temps molt breu amb un procediment de demora
curta. No cal utilitzar cap tècnica de mesura de la RC particular, ja que la latència de la RC és
també molt breu i, consegüentment, no se sobreposa a la posterior RI.
Es tracta d'un condicionament molt lent: generalment cal dur a terme centenars d'assaigs
d'adquisició per assolir un percentatge elevat d'assaigs amb RC.
- EC (que no faci tancar la parpella nictitant, i amb una durada curta)
- EI (un buf a l’ull o descàrrega elèctrica)
Just després de la finalització del so apareix EI. Seria de demora, en un cas extrem. No cal
utilitzar procediments de prova o anticipació. Necessita molts assaigs.
5.4.2 L’automoldejament o seguiment del signe
Observat per P. L. Brown i H. M. Jenkins l'any 1968. Se sol dur a terme amb coloms amb una
motivació de menjar ja que han estats provats de menjar en la caixa d'Skinner.
Els assaigs d'adquisició associen la il·luminació de la tecla amb l'entrega d'una petita quantitat
de menjar (o d'aigua). La RC consisteix que quan la tecla s’il·lumina el colom s'hi aproxima i la
picoteja. Habitualment la força de la RC es mesura per la taxa de resposta (freqüència o
nombre de respostes per minut). La llum on està la tecla ha adquirit un significat informatiu i el
colom segueix aquest signe informatiu i s’apropa a la tecla i la picoteja, però això no vol dir que
28
quan picoteja aparegui menjar. Ex. En humans mirar les llum pel pis que vas en l’ascensor que
es l’estímul informatiu i el que volem aconseguir es arribar al nostre pis.
S'adquireix amb uns trenta-cinc o quaranta assaigs. Aquesta tècnica mostra com els estímuls
que ens informen de l'aparició de conseqüències rellevants atreuen poderosament la nostra
atenció i n'estimulen el seguiment.
Rep el nom d'automoldejament perquè s'aconsegueix que el colom picotegi la tecla sense
necessitat d'una intervenció elaborada per part de l'experimentador (vegeu el tema 10).
5.4.3 L’aversió condicionada al gust
EC un gust (normalment dolç = aigua amb sacarina i es nou)i l’EI els hi donen una cosa que
provoca malaltia interna; s’agafa als animals i després de haver consumit per primera vegada
la solució amb sacarina i després se’ls els posa la substancia que provoca malestar, amb un
assaig es suficient. Han aprés a relacionar amb aquest gust que els hi provoca malestar, ja no
veuen a penes:
- Es pot aprendre amb un únic assaig.
- S’aprèn amb un interval de temps fins i tot d’hores.
- Es extraordinàriament resistent a la extinció.
5.4.4 El condicionament de la por
Per mesurar la por: tècnica de supressió condicionada o resposta emocional condicionada
(REC) (Estes i Skinner, 1941): les rates quan tenen por es queden “congelades”, sense fer res, i
és aquesta la forma amb la qual es mesura la por. Fan a la rata aprendre a apretar la palanca
quan per tal de tenir menjar (amb condicionament instrumental). Quan l’animal està apretant
la palanca per obtenir menjar es presenta l’EC si l’animal continua apretant la palanca és
que no té por, si deixa d’apretar-la té por.
- EI (descàrrega, xoc elèctric) RI (por).
- EC(so o llum): es presenta durant un temps perllongat (fins 2-3 min).
Normalment s’utilitza un procediment de demora, i la descàrrega és molt curta.
Índex o raó de supressió (A/A+B)
- A: nombre de respostes a la palanca durant l’EC
- B: nombre de respostes a la palanca abans de l’EC.
29
Interpretació:
0 = màxima por condicionada (supressió total de la resposta a la palanca durant l’EC)
0,5 = absència de por condicionada (no alteració de la resposta a la palanca durant l’EC):
50 vegades
--------------
50 + 50
Entre 3 i 8 assaigs és fàcil adquirir el condicionament a la por.
Totes les situacions en condicionament clàssic són condicionament excitatori perquè l’EC
s’associa amb l’aparició de l’EI.
5.4.5 El condicionament farmacològic
L’EI és un fàrmac o droga, de manera que els seus efectes fisiològics constitueixen la RI.
L’administració de I'EI és precedida sistemàticament per un determinat EC, inicialment sense
cap activitat fisiològica particular. A través del condicionament, I'EC adquireix la capacitat de
provocar una RC relacionada amb els efectes fisiològics del fàrmac.
El condicionament clàssic de les respostes fisiològiques als fàrmacs suposa un de mecanismes
psicològics que podrien explicar l'efecte placebo.
30
Tema 6: El condicionament clàssic inhibitori
6.1 El concepte de condicionament inhibitori
El condicionament inhibitori apareix sempre que un estímul desconfirma l’expectativa de
conseqüència generada per un altre estímul.
És important poder predir quan no apareixerà un estímul aversiu. La majoria dels estudis sobre
inhibició són sobre condicionament aversiu. Es parla d’aversius perquè la majoria d’estudis
s’han fet amb aquests estímuls.
Perquè hi hagi un condicionament inhibitori cal que la absència de l’EI tingui lloc en un context
excitatori, és a dir, en una situació en la qual el subjecte tingui algun motiu per esperar la
possible aparició de l’EI. L’EC és igualment informatiu i útil per al subjecte tant en el excitatori
com en l’inhibitori. La relació EC-noEI només es informativa si s’espera la presentació d’EI.
6.2 Procediments que generen condicionament inhibitori
6.2.1. Procediment estàndard
Es presenten aleatòriament dos tipus d’assaigs:
A) (excitatori) Si EC no EC + i si EI. B) (inhibitori) Si EC+ Si EC- NO ei
Aquest permet predir el moment precís de l’aparició de l’EI, també permet predir quan no
apareixerà l’EI. Aquest procediment permet la codificació temporal de l’absència de l’EI
31
6.2.2 Procediment d’inhinició diferencial (o discriminació simple)
Es presenten aleatòriament dos tipus d’assaigs.
A) EC+ i EI en els excitatoris. B) EC- i no EI en els inhibitoris.
El resultat és el mateix que en el procediment anterior.
Tanmateix, tots els procediments difereixen quan a la seva eficiència per generar el
condicionament inhibitori, resultant clarament superior el procediment estàndard. Ja que el
desenvolupament d’un condicionament inhibitori requereix la presència en els assaigs
inhibitoris de claus excitatòries (que generin l’expectativa d’una possible presentació de l’EI),
aquest paper el desenvolupa amb major eficiència l’EC i en el procediment estàndard, que no
pas els estímuls contextuals en el procediment d’inhibició diferencial.
6.2.3 Contingència o correlació negativa entre EC i EI
No hi ha un EC + explícit.
A)situació habitual: no EC+ i si EI. B) si EC- i no EI
Resultat: EC- RC-
Una correlació contingència negativa indica que l’EI és menys probable després de l’EC que en
un altre moment. Per tant, l’EC senyala una reducció de la probabilitat que aparegui l’EI. L’EI
apareix periòdicament aïllat, però l’EC prediu l’absència de l’EI durant un temps.
32
6.2.4 Procediment de discriminació
En el procediment estàndard i en el procediment d’inhibició diferencial es presenten assaigs
excitatoris i assaigs inhibitoris.
A la discriminació:
- L’EC – s’assembla a l’EC+.
- Els assaigs tenen la finalitat de fer desaparèixer la generalització i en últim terme crear
inhibició.
Als procediments d’inhibició que presenten assaigs excitatoris i inhibitoris:
- No és necessari que l’EC – s’assembli a l’EC+.
- Els assaigs tenen, des del principi, la finalitat de crear inhibició.
6.3 Les tècniques de mesura del condicionament inhibitori
Quan l’EC prediu l’absència de l’EI (EC--->EI). L’EC provocarà alleujament.
EC- RC-
- Quan la RC- origina canvis en l’execució de sentit antagònic o oposat als que origina la
RC+ tècniques directes.
Normalment la resposta condicionada inhibitòria és no fer res, per tant és difícil mesurar-la.
Per això cal utilitzar unes tècniques indirectes:
- Quan la RC- no es manifesta en uns canvis d’execució directament observables i
mesurables tècniques indirectes.
Trobem dos tipus de tècniques indirectes
33
6.3.1 Prova de sumació (prova de l’estímul compost)
Ex: condicionament salival: so = menjar; llum = absència de menjar. Es fa un assaig en què es
presenta l’EC+ sol, i un segon assaig en què es presenten conjuntament l’EC+ i l’EC-, i es
mesuren en totes dues ocasions la força de la RC.
EC + RC+ (so => salivació de 3ml)
EC+/EC- (simultàniament) RC (< RC+?) (so + llum => menys salivació)
Atribuirem la disminució a la RC inhibitòria degut al condicionament inhibitori previ. Però
podria ser deguda a qualsevol altre factor, com per exemple: la distracció del gos mirant la
llum. És per això que introduïm un altre assaig.
EC+/En RC (=RC+?)
Si en aquest assaig es dóna una resposta reduïda com en l’anterior però amb un estímul
neutre, direm que s’ha produït un pseudocondicionament inhibitori. En canvi, si no es
produeix cap reducció de la RC inhibitòria s’haurà produït el condicionament.
Experiment: Cole, Barnet & Miller (1997)
L’experiment es realitzà utilitzant el procediment de supressió de llepament en rates de
laboratori mitjançant descàrregues. Els resultats afirmen que hi ha una inhibició de la por
condicionada que es limità a l’estímul (X) que havia participat en l’entrenament d’inhibició
condicionada; també els resultats mostren que X fou capaç d’inhibir la por condicionada no
només davant de l’excitador pel que va ser entrenat (A) sinó també davant d’un altre excitador
(B) que mai s’havia presentat junt amb X durant l’entrenament.
6.3.2 Prova de retard en l’adquisició
Es compara el nombre d’assaigs necessaris per condicionar excitatòriament en En nou i
presumpte EC-, tot associant-los en cada cas a l’EI.
En-- > EI: agafo En que no ha participat en el condicionament, fins que esdevingui EC i
provoqui RC (EC+RC+)
En- ->EI EC+ RC+ n assaigs
EC-- > EI EC+ RC+ n assaigs (>En?)
34
Si l’EC- costa més de condicionar que l’estímul neutre, això vol dir que produïa una resposta
condicionada inhibitòria. Si volem demostrar que ha sigut degut al condicionament inhibitori,
contrabalancegem els estímuls. Hauríem de fer un grup de control.
Si el nombre d’assaigs és similar, no hi ha condicionament inhibitori; si, contràriament, el
nombre d’assaigs és major per l’EC- que per l’En, aquesta diferència s’interpreta com un
indicador indirecte de la força RC-.
En principi, s’aconsella utilitzar simultàniament totes dues proves – sumació i retard- per poder
concloure el caràcter inhibitori d’un estímul condicionat.
Cole i col·laboradors realitzaren un experiment amb aquesta prova.
35
Tema 7: Variables que afecten l’adquisició del condicionament clàssic
Quines característiques de l’EC i de l’EI fan que es produeixi millor el condicionament.
7.1. La magnitud de l’estímul condicionat
A major magnitud (intensitat i/o durada) de l’EC, major velocitat d’adquisició de la RC; no
afecta pas a l’efecte del condicionament final.
El més important és la discriminabilitat de l’EC: el grau en què sobresurt dels estímuls
contextuals, la perceptibilitat de l’EC en relació als estímuls contextuals.
- Inhibició transmarginal: impediment de l’associació EC - EI amb magnituds de l’EC
excepcionalment elevades. És a dir, amb un estímul molt intens, no es produeix
condicionament.
7.2. La magnitud de l’estímul incondicionat
La magnitud de l’EI afecta tant la velocitat d’adquisició de la RC com el nivell de
condicionament finalment assolit.
A major magnitud (intensitat i/o durada) de l’EI, major velocitat d’adquisició de la RC i també
afecta al resultat final del condicionament clàssic.
El que més afectarà el condicionament clàssic és la magnitud de l’estímul incondicionat.
7.3 La naturalesa de l’estímul incondicionat
Exemple: vídeo del colom picat per a obtenir menjar i aigua.
La naturalesa (“qualitat”) de l’EI pot afectar la topografia o morfologia de la RC. Ex: el colom
posava el bec d’una forma diferent per obtenir menjar que per obtenir aigua.
7.4 La novetat dels estímuls condicionat i incondicionat
L’impacte conductual d’un estímul depèn de la seva novetat. Un estímul familiar no elicita una
resposta tan vigorosa com ho fa un estímul nou (habituació). El coneixement previ dels
estímuls que associarem modifica l’efectivitat del procediment.
La novetat de l’estímul és important pel condicionament clàssic. Si l’EC i/o l’EI són coneguts, el
condicionament clàssic es desenvolupa més lentament que si fossin nous. Observar el paper de
la novetat de l’estímul implica dues fases: la preexposició i el condicionament posterior.
36
En els experiments de condicionament clàssic, generalment l’EC i l’EI resulten nous per al
subjecte en el moment d’iniciar-se l’experiment. No obstant això, en moltes situacions reals,
quotidianes, de condicionament clàssic, sovint el subjecte ja ha tingut algun tipus d’experiència
amb els estímuls que participen en el condicionament. Com afecta aquesta preexposició dels
estímuls al seu posterior condicionament?
7.4.1 La inhibició latent
Efecte de la inhibició latent (o efecte de preexposició de l’EC): la presentació aïllada de l’EC,
abans del condicionament, dificulta la seva posterior associació amb l’EI.
L’efecte de la inhibició és més fort a major nombre d’assaigs de preexposició i a major
magnitud de l’EC.
La inhibició latent mostra una gran dependència del context: si el context experimental de
preexposició de l’EC no és el mateix en què té lloc el condicionament posterior, l’efect
d’inhibició latent es veu significativament reduït.
La inhibició latent es manifesta tant en el condicionament excitatori com el inhibitori. La seva
interpretació teòrica és: és com si, al presentar-se repetidament sol, l’EC perdés al seva
associabilitat, de forma que la seva adquisició posterior de qualsevol significat senyalitzador
ens resultaria pertorbada (mecanismes d’inferència associativa). Les hipòtesis diverses
d’autors com N.J. Mackintosh, A.R. Wagner o R.E. Lubow van en el sentit anterior. D’altres
autors consideren que en l’explicació dels fenòmens de preexposició també podrien intervenir
mecanismes d’interferència de la memòria, com proposa la hipòtesi del fracàs de recuperació
de R.R. Miller.
37
Les proves d’inhibició latent s’utilitzen per detectar dèficits d’atenció. Els subjectes amb dèficit
d’atenció no mostren inhibició latent (retard en condicionar-se).
El condicionament aversiu al gust s’assoleix amb un sol assaig. En canvi, si el gust és conegut
(preexposició a l’EC = gust), calen més assaigs.
7.4.2 El bloqueig contextual
El bloqueig contextual o efecte de preexposició a l’EI fa referència a la presentació aïllada de
l’EI, abans del condicionament, dificulta la seva associació posterior amb l’EC. Mostra una gran
dependència del context i la interpretació teòrica que fem és que es considera un cas
particular del fenomen general del bloqueig.
Context A: casa dels avis on sempre tinc caramels al meu abast (EI):
- Ve de visita la senyora A (EC) i em porta caramels (EI). Associació lenta entre senyora
A (EC) i caramel (EI).
Context B: casa dels pares on no tinc caramels al meu abast (EI):
- Ve de visita la senyora A (EC) i em porta caramels (EI. Associació ràpida entre la
senyora A (EC) i el caramel (EI).
7.4.3 La irrellevància apresa
La presentació aleatòria (descorrelacionada) de l’EC i l’Ei abans del condicionament, dificulten
la seva posterior associació.
38
Com ha demostrat principalment Mackintosh, la irrellevància apresa és més que la suma dels
efectes d’inhibició latent i bloqueig contextual.
La interpretació teòrica que fem és que durant la fase de preexposició el subjecte aprèn que
els dos estímuls són mútuament irrellevants, cosa que dificultaria l’establiment ulterior de
qualsevol tipus de relació predictiva entre ambdós estímuls (excitatòria o inhibitòria).
7.5 L’interval entre estímuls
7.5.1 El concepte de contigüitat temporal
- Interval entre estímuls o interval entre EC-EI. Es pot anomenar de les tres maneres.
7.5.2 Hi ha un interval entre estímuls òptim?
Depèn del tipus de resposta, dels estímuls i de l’especia. NO existeix un punt universal.
L’interval entre estímuls per tant es variable.
Per exemple en el reflex palpebral el nivell òptim entre estímuls seria de 450 milisegons, però
varien el milisegons, i al sortit d’aquí el condicionament es deteriora.
En general, sol ser molt breu (de dècimes de segon a uns pocs segons) entre l’EC i l’EI; sol ser
més breu per condicionament de les respostes musculars que pel condicionament de les
respostes vegetatives. Quan condicionem una resposta muscular l’interval òptim es molt més
curt que en les vegetatives.
7.6 El principi de selectivitat associativa: la rellevància causal o pertinència entre l’EC i l’EI
El principi d’equipotencialitat, defensat per Pavlov, sostenia que qualsevol En tindria la
mateixa facilitat per esdevenir Ec ates a la seva presentació en contigüitat temporal amb un
determinat EI.
39
Garcia i Koelling van mostrar resultats incompatibles amb els principis d’equipotencialitat. La
<<naturalesa>> de l’EC (el tipus d’EC) pot influir, fins i tot decisivament, en la seva
associabilitat amb un EI concret. Aquests resultats han donat lloc al principi alternatiu de
selectivitat associativa o associació selectiva, segons el qual hi ha parells d’estímuls (EC i EI)
que s’associen amb gran facilitat (fins i tot amb un únic assaig i un IEE prolongat, com la versió
condicionada al gust en rates); d’altres, en canvi, no s’associen o ho fan amb una gran dificultat
(p.ex. estímuls audiovisuals en relació amb malestar intern en rates). En el primer cas, diem
que els EE mostren una elevada rellevància causal o pertinència entre si (mentre que aquestes
serien òbviament baixes en el segon cas). La rellevància causal també depèn, però, de l’espècia
animal amb la qual estem treballant.
Experiment sobre selectivitat associativa (Garcia & Koelling)
Si gust i malaltia van junts, el grup que ha rebut CILi presentarà major aversió a la sacarina que
l’estímul audiovisual TL.
Experiment sobre l’aversió condicionada al gust. Associació selectiva o rellevància causal
(Garcia & Koelling)
Les rates que reben verí CILi disminuirein el consum de sacarina. Les rates que reberen xoc
disminuirien el consum d’aigua brillant i sorollosa. Aquest experiment suggereix que el gust
s’associa més ràpidament amb la malaltia que amb el xoc (dolor perifèric) i que els estímuls
audiovisuals (LS) s’associen més ràpidament amb el dolor/xoc que amb la malatia.
ASSOCIACIÓ SELECTIVA
40
L’associació selectiva també es dóna en altres espècies. Algunes aus localitzen l’aliment per les
seves característiques visuals, en comptes de per el gust,
En els subjectes que al test podien triar entre aigua blava o normal es provà si manifestaven
aversió al color (propietat visual de l’aliment) i els que reberen aigua amb gust o no normal
l’aversió al gust.
Les rates mostraren una forta aversió al gust agre i poca aversió a les propietats visuals
de l’aliment.
Un patró oposat es pot veure en les aus: forta aversió a l’aigua blava però poca aversió
al gust agre.
L’EC que és condicionat més fàcilment és el que els animals usen per procurar-se
aliment.
Les rates usen gust i olor per procurar-se aliment.
Les aus usen indicis visuals per procurar-se aliment.
41
7.7 L’interval entre assaig
En general, els intervals entre assaig (IEA) llargs donen lloc a un condicionament més fort. La
durada òptima de l’IEA està en relació a la durada de cada assaig: l’IEA ha de ser notablement
més llarg que l’IEE (efecte de l’aïllament).
42
Tema 8: Fenòmens especials en el condicionament clàssic
8.1 Contracondicionament
L’En és un EC o un EI (no hi participen En). Els estímuls que poden fer de En són qualsevol
estímul aversiu. S’associa un EC o un EI de valor emocional i/o motivacional contrari.
EI aversiu EI apetitiu. EI apetitiu EI apetitiu
RC apetitiva (apareix una R de signe contrari) RC apetitiu
El contracondicionament és més lent que el condicionament directe amb un En.
Experiment de Konorski i Szwejkowska
Resultats del contracondicionament (Konorski i Szwejkowska, 1956)
Tractament basat en el contracondicionament
Desensibilització sistemàtica: Associació
d’un EC aversiu (ansiogen) amb un
estímul (EI) que provoca una resposta de
tranquil·litat i relaxació.
43
Aquesta RC apetitiva apareixerà sempre i quan la R esperada pel primer estímul sigui menor a
la R generada pel segon.
Ítems utilitzats en un tractament de desensibilització sistemàtica (cas de persona que li
provoca ansietat volar- Els ítems estan presentats per nivell d’ansietat que creen en el
subjecte):
1. Em diuen que he de fer un viatge
2. Cada vegada falta menys pel viatge
3. Estic preparant les maletes
4. Agafo el cotxe per anar a l’aeroport
5. Sóc a l’aeroport
6. Em criden per embarcar
7. Estic asseguda a la butaca de l’avió
8. Durant el vol
9. S’enlaira l’avió
10. Aterra l’avió
8.2 Condicionament de segon ordre
No cal usar EI, s’utilitza un EC. Presentem un estímul inicialment neutre (EC2) seguit per un EC1
i la conseqüència és que l’EC2 provoca una RC2. L’EC1 prové d’un condicionament previ, és a
dir, tot condicionament de segon ordre prové d’un condicionament previ. S’acaba aprenent
que EC2 està associat amb l’EI de la fase 1.
44
Molts assaigs en la fase 2 deteriora la RC2 perquè en aquesta fase, es presenta un EC1 que
provoca un RC1 intensa i en la segona fase ja no es present l’EI de la fase 1, per tant, es perd
força. Són possibles condicionaments de tercer i quart ordre (apareixen principalment en
condicionaments aversiu).
A la nostra vida hi ha molts EC poderosos i significatius. És difícil concebre que cada un hagi
desenvolupat la seva força després d’haver-se associat amb un EI. Molts poden haver adquirit
la seva força a través del condicionament de segon ordre, és a dir, associant-se amb un altre EC
fort, no amb un EI.
Aquest condicionament proporciona un mecanisme per establir associacions sense necessitat
de presentar EI.
RC2 similar a RC1 (menys forta).
La màxima RC2 (condicionament de segon ordre) apareix després de pocs assaigs (si
augmentem el nombre d’assaigs, RC2 es debilita): a cada assaig l’EC2 és associat a un
EC1 (...)
Variables d’aquest condicionament:
A. La magnitud de l’EI;
B. L’interval entre estímuls EC1/EI i EC2/EC1;
C. La similitud entre els EC de primer i de segon ordre;
D. La contigüitat espacial entre EC2 i Ec1 afavoreix el condicionament de segon ordre.
Experiment Rizley i Rescorla
45
8.3 Precondicionament sensorial
L’associació es pot establir entre dos E neutres. Mostra que és possible l’associació entre dos
estímuls qualsevol.
A la fase 1 s’assoleix un aprenentatge latent o un condicionament sense RI manifesta.
S’aprèn que: EC1 EC2 EI
Com a conseqüència: EC1 RC1
FASE 1 FASE 2 PROVA
En1 En2 EC2 EI EC1 RC1
La possibilitat d’associar estímuls neutres amplia el rang d’elements ambientals que poden ser
associats. Igual que el condicionament clàssic.
Variables:
A. A la fase 1 (associació Eneutres) l’interval òptim entre estímuls ha de ser curt (4 segons
aprox.). Millor si coincideixen en part.
B. La força màxima del precondicionament s’assoleix en pocs assaigs, com en el cas de
condicionament de segon ordre (quatre associacions entre Eneutres aprox.)(habituació
amb més?).
C. La motivació (gana, set) durant el precondicionament afavoreix l’associació entre els
En.
Aquest procediment té dos resultats:
1) el primer, completament previsible, és el condicionament del'EC2: EC2 RC2.
46
2) el segon, potser més inesperat, és que, si ara presentem de nou el primer estímul
(En1), també aquest provocarà la nova resposta condicionada: ECl RC1.
Què ens indica aquest segon resultat? Posa de manifest en l'execució l'aprenentatge que
realment havia tingut lloc durant la primera fase del precondicionament sensorial (un
aprenentatge latent o un condicionament sense RI manifesta).
I què havia aprés el subjecte en aquesta primera fase? Com és habitual en el condicionament
clàssic, l'existència d'una relació predictiva entre els estímuls, és a dir, que el primer estímul
(EC1) prediu l'aparició del segon (EC2). Mentre el segon estímul no provocava cap resposta
biològica potent (fase 1), aquest aprenentatge restava latent; però, quan s'ha condicionat
aquest segon estímul amb un EI potent (fase 2), l'aprenentatge s'ha traduït finalment en
execució: l'EC1 indica la propera presentació de l'EC2, el qual genera l'expectativa de I'E1,
donant així lloc a l'aparició de la RC1.
Entre les variables que afecten el precondicionament sensorial es troben: c) L’interval entre
estímuls, òptim en diferents situacions de condicionament prop d'uns 4 segons durant la fase l;
i b) el nombre d'assaigs, tot assolint el precondicionament sensorial la seva força màxima amb
uns quatre assaigs de condicionament a la fase I (amb més assaigs es donaria una habituació
de les respostes d'orientació als estímuls neutres).
El precondicionament sensorial és també un fenomen important des d'un punt de vista pràctic,
ja que mostra la possibilitat d'associació entre dos estímuls qualssevol, encara que cap
d'aquests no provoqui una resposta biològica intensa (p. ex., imatges o paraules en humans).
Experiment: Control del precondicionament sensorial (Rizley i Rescorla, 1972)
8.4 El condicionament amb estímuls condicionats compostos
El condicionament amb estímuls condicionats compostos fa referència a les situacions de
condicionament clàssic -comunes en la pràctica- en què l'EC no és un únic estímul, sinó un
conglomerat de diversos estímuls que es presenten simultàniament, i que formen el que
s'anomena un estímul condicionat compost.
47
Suposem que duem a terme un procediment de condicionament d'un EC compost format per
dos elements (EC1/EC2):
EC1/EC2 ---> EI R1
En principi, el resultat teòricament esperable d'aquest procediment seria un condicionament
similar dels diferents elements que configuren el compost, de forma que cadascun d'ells
adquiriria una part proporcional de la força associativa total:
ECl RCl (RC total / 2)
EC2 RC2 (RC total / 2)
EC1/EC2 RC total (RC1 + RC2)
La RC total constitueix un valor invariable, de tal manera que si posteriorment al
condicionament amb l'EC compost s'alteren el valor predictiu i la força de la RC corresponents
a un dels elements del compost (p. ex., associant-lo en solitari amb l'EI, o extingint-lo), l'altre
element veurà automàticament corregida la força de la seva RC en sentit contrari.
8.4.1 L’emmascarament
L'emmascarament constitueix una excepció (d'altra banda, prou freqüent) del resultat general
que tot just acabem d'enunciar: en l'emmascarament únicament es condiciona un dels
elements del compost, el qual, al mateix temps, impedeix el condicionament dels altres
elements. És a dir, que, tot i que si aquests altres elements s'haguessin associat en solitari amb
l'EI s'haurien condicionat amb tota normalitat, la presència simultània en el compost de
l'element <<emmascarador>> n'impedeix el condicionament.
Per tant, podríem representar el resultat de l'emmascarament de la forma següent:
EC1 RC1 (RC total)
EC2 no RC
EC1/EC2 RC total (RC1).
Quan es produeix emmascarament? Quan un dels elements del compost és: a) més intens (o
més discriminable); o b) té major rellevància causal amb I'EI.
48
8.4.2 El bloqueig
En el bloqueig, el condicionament previ d'un dels elements de l'EC compost impedeix el
condicionament dels altres elements.
Es tracta, per tant, d'un procediment en dues fases:
- En la primera fase s'associa en solitari un element de l'EC compost (EC1) amb l'EI, fins a
assolir el seu condicionament asimptòtic (màxim):
ECI ---> EI RI.
Com a resultat:
EC1 RC1
En la segona fase s'associa l'EC compost complet amb el mateix EI:
EC1/EC2 ---> EI RI
El resultat és que es manté el condicionament del primer element, mentre que el segon no es
condiciona:
EC1 RC1
EC2 no RC.
Anàlisi del bloqueig
- Anàlisi teòrica: segons Kamin, perquè l’EC i l’EI s’associïn, l’EI ha de constituir un
esdeveniment inesperat o “sorpresiu”. Només així estimularà l’<<esforç mental>> (cognitiu)
necessari per a la formació de l’associació EC - EI. Recordar que en la fase II del bloqueig, l’EI ja
no serà tan sorpresiu perquè en la fase I s’haurà produït un condicionament clàssic i, per tant,
l’EC1 prediu l’EI. No s’estimularà llavors l’adquisició del condicionament en l’EC2.
Existeix un fenomen que dóna suport empíric a aquesta concepció (EI sorpresiu) anomenat
desbloqueig. En la segona fase, modifiquem alguna característica de l’EI (més intents, més
dèbil...) i per tant, l’EI tornarà a ser sorpresiu i es donarà el condicionament (EC1 RC1; EC2
RC2)
Recordatori: L’estímul incondicionat ha de ser un fet rellevant. Si un EI no és rellevant, no
podrà produir condicionament.
49
8.4.3 El condicionament serial
- Definició: presento els elements del compost (EC) de forma seqüencial o successiva.
- Procediment: EC1- - > EC2 - -> EI RI
- Resultat:
L’EC que més es condicionarà serà l’EC1 ja que hi haurà més valor informatiu i predomina el
valor informatiu per sobre de la contigüitat temporal.
L’EC1 es condiciona més que si no s’hagués presentat després l’EC2 (potenciació). Si
no es presentés l’EC2 es donaria un procediment de traça, ja que hi ha un interval de
traça entre l’EC1 i l’EI. Exemple: temps d’espera de notícies importants que generen
patiment l’EC2 ens fa de pont i genera la percepció de que el temps d’espera no és
tan llarg.
L’EC2 es condiciona menys que si no s’hagués presentat abans l’EC1 => contigüitat
temporal vs valor informatiu.
50
Tema 9: Anàlisi teòrica del condicionament clàssic
9.1 Introducció
9.2 Les condicions de l’aprenentatge. Quan s’aprèn?
- La contigüitat temporal. Per Paulov, l’EC era un “substitut” de l’EI, podrem afirmar que la
seva teoria era bàsicament mecanicista: pel simple fet de posar dos estímuls (l’EC o En amb
l’EI) temporalment junts es produïa un condicionament. Llavors, el nivell de condicionament
adquirit per l’EC depèn de:
1. La durada del interval EC - EI.
2. El nombre d’aparellaments/assaigs EC - EI (quantes vegades l’EC es seguit per l’EI)
o EC - -> EI (Adquisició; condicionament excitatori)
o EC
Limitacions (degut a fenòmens que es van descobrir als anys 60 després de Paulov) a la
contigüitat temporal com a condició:
1. Necessària: en el cas de l’aversió condicionada al gust no és necessari que es doni la
contigüitat temporal ja que es presenta el gust i en 30 minuts es dóna l’EI.
2. Suficient: en el del condicionament serial, el bloqueig i el emmascarament es dóna
contigüitat temporal però no un condicionament. El procediment simultani seria
també un exemple (no hi ha condicionament encara que els dos estímuls es presenten
a l’hora).
Robert A. Rescorla (1968): la presentació no senyalada de l’EI deteriora el
condicionament. Paulov només considerava la presentació de l’EC amb l’EI o només el
EC, en Robert tenia en compte també la presentació de l’EI sol. Lo important no és la
contigüitat temporal sinó el valor predictiu (informatiu) d’aquest.
=> p(EI/noEC), això ens informa, en un condicionament clàssic, que l’EI no està
associat amb l’EC ja que aquest primer es presenta sol, sense l’EC.
=> Valor predictiu de l’EC.
- El principi de la contingència (Rescorla, 1968)
Contingència: Probabilitat de l’EI amb presència de l’EC contrastada amb l’EI amb la no
presència de l’EC. Només hi haurà condicionament si les dues probabilitats difereixen.
1. Contingència positiva: p(EI/EC) > p’(EI/noEC).
P (EI/EC) = 1
51
Condicionament excitatori: serà màxim quan la p sigui 1 i la p’ sigui 0. Si la p és 0’7 i
la p’ és 0’3, existirà condicionament excitatori però menys que en el primer cas. La
força del condicionament excitatori serà més fort quan més allunyades estiguin les
probabilitats.
2. Contingència negativa: p (EI/EC) < p’(EI/noEC)
Condicionament inhibitori. Sempre que la primera probabilitat sigui menor que la
segon, l’EC predirà una absència de resposta i es produirà una inhibició (un
alleujament en el cas de la descàrrega ja que per exemple, el so pot indicar l’absència
de l’EI).
3. Contingència nul·la (o zero): P(EI/EC) = p’(EI/noEC)
Absència de condicionament (impredictibilitat).
Espai contingencial:
P(EI/noEC) No cond (impredictibilitat)
Cond. Inh Cond. exc
P(EI/EC)
La teoria de la contingència té limitacions: el bloqueig (en l’EC2 es presenta l’EI però no hi ha
RC encara que sí que hi ha una contingència positiva), per solucionar això, afegim a la idea de
Rescorla la de Kamin, que l’EI sigui sorpresiu. (Mirar la resta de limitacions en Domjan).
Podem concloure que per a que hi hagi condicionament clàssic:
- Contigüitat temporal
- Contingència
(- El component sorpresiu en EI)
52
Exercicis
1.
Variables Hospital 1 Hospital 2 Hospital 3 Hospital 4
TLP (EI) després
abusos sexuals
(EC)
70% 80% 20% 50%
No TLP després
d’abusos sexuals
30% 20% 80% 50%
TLP sense
abusos sexuals
20% 80% 70% 30%
- Quina/es variables són necessàries per determinar la capacitat predictiva dels abusos sexuals
en la incidència de TLP? La 1 (probabilitat de patir TLP després de patir abusos) i la 3
(probabilitat de patir TLP sense abusos sexuals).
- En quin dels 4 hospitals els abusos sexuals prediuen millor la incidència de TLP? En l’hospital
1 ja que la diferència entre les dues probabilitats (presentar TLP en funció dels abusos sexuals)
és major que la resta (0’7-0’2=0’5).
- Quina conclusió podem treure pel que fa a la relació entre els abusos sexuals i la incidència
de TLP a l’hospital 2? I a l’hospital 3? En l’hospital 2, els abusos sexuals no tindrien res a veure i
la contingència seria nul·la. En el cas de l’hospital 3, la contingència seria negativa perquè la
primera probabilitat és més petita que la segona.
9.3 Els mecanismes l’aprenentatge. Com s’aprèn?
El model de Rescorla i Wagner: Parteix de la idea de Kamin de que l’efectivitat d’un EI ve
determinada pel seu grau de “sorpresivitat” .(QUANT podem aprendre: com més sorprenent
sigui la EI, més i millor serà processat pel subjecte, de manera que més força associativa
adquirirà l’EC). El que s’aprèn en un assaig de condicionament clàssic és: El que podem
aprendre (depèn de la sorpresivitat del EC)–el que sabem ja (força associativa que ja adquirit
aquest EC).
53
Increment ( ) de força associativa (V) de l’EC (A) en un assaig determinat (n). *EI:1+ *Y= el
màxim que s’aprendrà+ Els estímuls que son salients (discriminalitat i rellevància causal)
s’associen amb gran facilitat A la formula ho fa amb constants αA β1.
VAN= αA β1 (Y1 -VA ). Quan tenim tot l’aprenentatge, la diferència serà 0.
Exemple: Seguiment del signe (llum menjar). αA= 0.5 β1= 1 i Y1= 10 (10 respostes
per minut es el màxim de respostes que es pot donar en aquesta situació.
Calcula l’increment de la força associativa del llum en els cinc primers assaig de
condicionament.
AVAN = 0.5* 1 (10-0)=5 Va1=5
AVAN= 0.5*1 (10-5)=2.5 Va2=7.5
AVAN= 0.5*1 (10-7.5)= 1.25 Va3=8.75
AVAN= 0.5*1 (10-8.75)=0.625 Va4=9.375
AVAN=0.5*1 (10-9.375)=0.3125 Va5=9.6875
Aquest model explica molts fenòmens, com per exemple:
El límit asimptòtic de l’aprenentatge (que arribi un moment que no es pot aprendre
més)= Quan Va = Y1.
El bloqueig: l’EI ja resulta predit per l’estímul prèviament condicionat (VA= Y1) de
manera que, (Y1-VA+B)= 0.Com que el primer ja ha adquirit tota la força associativa, B
no es condiciona.
L’extinció: l’EC genera excés d’expectativa de l’EI (Va> Y1= 0), de manera que l’EC perd
valor associatiu fins que aquest arriba a 0. En un primer assaig el resultat serà negatiu,
i la força associativa s’anirà reduint. EN una extinció Y1 serà 0 (mínim aprenentatge).
Però en l’extinció, mai serà 0 (no es perd l’aprenentatge del tot, perquè si el tornem a
condicionar, serà més fàcil).
Aquest model ha permès descobrir fenòmens: Per exemple, la sobreexpectativa: Ex:
Seguiment del signe (llum verd 1 bola de menjar). De forma independent, faig un altre
associació (llum vermell 1 bola de menjar). Segons la lògica, fi faig un assaig amb llum verd i
vermell, el subjecte predirà dues boles de menjar.
54
El model de Rescorla i Wagner ens prediu que quan faci un assaig amb el compost la resposta
serà 1 bola de menjar, Pero el subjecte predirà 2, i això ens donarà resultat negatiu. La força
associativa s’anirà reduint. *Reducció del valor associatiu de dos EECC, prèviament associats de
forma independent amb un mateix EI, quan aquests se segueixen presentant com a EC
compost associat a aquell mateix EI].
9.4 Els continguts de l’aprenentatge. Què s’aprèn?
Quin és el contingut que s’aprèn del condicionament clàssic? En la visió tradicional de Pavlov,
els continguts de l’aprenentatge s’expliquen d’una forma mecànica: presentem un EC seguit en
contigüitat d’un EI (de forma innata provoca una RI) i el fet de posar-los junts succeeix que les
propietats de l’EI es traslladen a l’EC, és a dir, l’EC provoca una RC.
El condicionament clàssic com a:
Noves connexions entre estímuls i respostes (aprenentatge E-R) Connexionisme.
Noves associacions entre estímuls (aprenentatge E-E) Cognitivisme. L’EC adquireix
la capacitat de generar l’expectativa de que a continuació apareixerà EI. Aquesta
expectativa genera la RC. L’EC genera una representació mental de l’EI.
Els experiments de devaluació de l’EI: Holand i Rescorla (1975) (Domjan pp. 108-109)
Grup Fase 1 Fase 2 Fase Prova
Experimental To (EC) - - > menjar (EI)
To (EC) augment activitat motora (RC)
Els deixem menjar
el que vulguin
To (EC)
disminució
RC?
Control To (EC) - - > menjar (EI)
To (EC) augment activitat motora (RC)
--- To (EC) RC
Com que els so no té una ubicació espacial concreta, la forma de la rata a prestar atenció a l’E
informatiu, és moure’s. Saciant els animals (fase 2 grup experimental) fa que es predi el valor
informatiu de l’EC. Segons la RC en la fase de prova, podrem observar quin tipus d’associació
han après els animals.
Segons el model E-E, la presentació de l’EC activa la imatge de l’EI, la qual desencadena
una resposta que, en produir-se davant la presència de l’EC, esdevé la Rc. El resultat
dels experiments sobre els efectes de la devaluació de l’EI donen suport als postulats
d’aquest model.
55
Si han après una associació entre estímuls, si la visió cognitiva és certa, el so generarà
l’expectativa de que a continuació apareixerà menjar. Quan el menjar tenia valor, es
movien, però ara que estan saciats, els animals no es mouran.
El RC baixa, per tant: condicionament clàssic = aprenentatge E-E (cognitivisme).
Hi ha excepció: el condicionament de segon ordre. En aquest, associem Ec1 - - > EI; en la fase
22 agafem EC2 - -> Ec1; per tant EC2 RC2- Què passarà amb aquest condicionament de
segon ordre, si llavors presentem l’EC1?
- Si l’EC2 RC2 és perquè hem après que l’EC2 anticipa EC1, i aquest anticipa l’EI. Per tant,
sabem que EC2 anticipa EI. Si extingim la RC de primer ordre, també3 s’hauria d’extingir la de
segon ordre (cognitivista).
9.5 Els determinants de l’execució.
Quins factors expliquen per què apareix una RC i no una altra?
Model de substitució de l’estímul (Pavlov): l’EC es converteix en un substitut de l’EC i provoca
una RC que no és la mateixa que produïa l’EI.
D’acord amb Pavlov, quan es presenta un EI, hi ha un àrea neuronal específica que processa
aquest estímul i de forma innata (conducta reflex – Arc reflex) es processat pel sistema nerviós
i dóna lloc a una RC.
Si presentem un En, aquest serà processat per una altra àrea del cervell però no es presenta la
RI. En el cervell es formen noves connexions degut a la presentació de l’En i l’EI contigus
(recordar la contigüitat estimular) que donen com a resultat un connexió entre l’EC i la
resposta que dóna l’EI, és a dir, EC RC.
Als anys 70, Siegel realitzà experiments amb rates aplicant morfina i produint així un efecte
incondicionat analgèsic. El que fa és, abans d’injectar la morfina, presentar a la rata un so i un
llum i tot seguit la morfina. Una vegada s’associa, fa un assaig de prova i presenta només l’EC.
El resultat és contrari a la teoria de Pavlov, és a dir, les rates presenten hiperalgesia (més dolor
enlloc de analgèsia).
El problema d’aquest experiment és que està mal definit. La psicologia estudia processos
mentals i conductes. Aquests experiments (també el de la glucosa) no es basen en processos
mentals sinó en bases fisiològiques i respostes fisiològiques. Això no és psicologia, perquè no
es basa en processos psicològics. Exemple glucosa corregit:
56
(glucosa ) Augment de sucre (EI) alliberació insulina i disminució de sucre (RI)
EC (glucosa ) Augment sucre (EI) alliberació insulina i disminució de sucre (RI)
EC alliberació insulina i disminució del sucre (RC)
El condicionament farmacològic va semblar que es contraposava el model de substitució de
l’estímul, però realment, l’efecte que es produeix de forma condicionada és la resposta
fisiològica. Moltes vegades, les drogues i fàrmacs produeixen desviacions de l’equilibri
homeostàtics i el cervell produeix correccions, aquesta correcció homeostàtica seria la
resposta condicionada.
Per exemple, en el cas de les drogues: quan una persona es pren una droga en un determinat
context i ho fa de manera repetida, quan deixa de prendre la droga i es troba en el context
determinat, la resposta no serà la mateixa que el fàrmac sinó la síndrome d’abstinència.
La tolerància a les drogues, a part de tenir una base farmacològica, té base psicològica. Quan
es consumeix la droga en un ambient determinat de manera repetida, l’ambient produeix la
síndrome d’abstinència però l’efecte de la droga canviarà i acabarà sent menor si segueix
prenent la droga en aquest ambient.
Siegel va proposar: una persona consumeix heroïna en els mateixos llocs amb els mateixos
estímuls contextuals sempre, cada cop la droga produeix un efecte menor i la persona ha de
consumir més. Va comprovar que en un ambient diferent de l’habitual, amb la dosi gran, en
consumir la droga moria per sobredosis perquè no tenia els mecanismes compensatoris dels
estímuls contextuals sempre presents.
Malgrat que es coneixen diferents aspectes de l’EC i l’EI que semblen actuar com a
determinants de la forma que adquirirà la RC, cap teoria actual no pot explicar
satisfactòriament com interactuen entre si, ni tampoc no pot explicar el complex conjunt de
resultats de què disposa. Un element que pot ajudar a comprendre una mica millor per què
manifestarà una RC o una altra en un condicionament clàssic és el que s’anomena teoria dels
sistemes de conducta (Timberlake).
Segons aquesta teoria, el procediment de condicionament clàssic activa el sistema de conducta
relacionat amb l’EI que s’utilitza. Aquest enfocament posa l’èmfasi en els aspectes evolutius
(teoria ecològica i adaptatius de l’aprenentatge: un EI alimentari activarà el sistema
d’alimentació, i un EI aversiu activarà el sistema de defensa. Com que aquests sistemes
impliquen diferents conductes integrades, l’EC podrà donar lloc a una (o més) d’aquestes
conductes, en funció d’altres paràmetres com, per exemple, l’interval EC-EI. D’aquesta
57
manera, un mateix EC i un mateix EI presentats amb un interval entre estímuls diferents,
poden donar lloc a respostes condicionades diferents.
58
Tema 10: Condicionament instrumental
10.1 Introducció al condicionament instrumental
El condicionament instrumental és el segon tipus d’aprenentatge associatiu. Mentre que en el
condicionament clàssic s’aprèn, bàsicament, una associació predictiva entre l’EC i l’EI, en el
condicionament instrumental l’associació que s’estableix és entre una conducta o resposta i les
seves conseqüències (associació resposta-conseqüències). Així doncs, en el condicionament
instrumental és necessari que aparegui una conducta que faci d’instrument per aconseguir que
es donin una sèrie de fets consegüents. Per tant, el condicionament instrumental permet
aprendre a controlar l’aparició d’unes determinades conseqüències ambientals.
L’estudi del condicionament instrumental ens permetrà conèixer les particularitats d’aquestes
conseqüències i els canvies que provoquen sobre la probabilitat d’aparició de la conducta.
10.2 Antecedents històrics del condicionament instrumental: E. L. Thorndike (1874-1949) i B.
F. Skinner (1904-1990)
Thorndike i la llei de l’efecte
Thorndike va ser pioner en l’estudi experimental del condicionament instrumental amb
animals. Els seus primers estudis tenien com a objectiu demostrar que els animals no utilitzen
el raonament per sortir-se de determinades situacions, sinó que simplement aprenen per
assaig i error.
Tot i que, inicialment, en els seus treballs va utilitzar pollets que havien de resoldre laberints
construïts amb llibres, els experiments més sistemàtic els va dur a terme en les anomenades
caixes problema dissenyades per ell mateix. Eren caixes de fusta on situava un gat privat de
menjar, i aquest havia d’aprendre quina era la resposta més adequada perquè s’obrís la porta
de la caixa i en conseqüència pogués accedir al plat de menjar situat a l’exterior. Thorndike
registrava el temps que trigava l’animal a fer la resposta correcta i, a continuació, el tornava a
tancar dins de la caixa.
Els resultats van mostrar una disminució gradual de les latències de resposta, i aquest procés
gradual d’aprenentatge va se interpretat per Thorndike com un aprenentatge per assaig i error
on una de les respostes realitzades dóna lloc, per atzar, a unes conseqüències satisfactòries. A
més a més, va inferir que aquestes conseqüències satisfactòries servien per enfortir,
gradualment, una hipotètica associació entre l’estímul de l’interior de la caixa i la resposta
correcta.
59
Aquest aprenentatge associatiu entre l’estímul i la resposta configura la base de la llei de
l’efecte formulada per Thorndike l’any 1891: si una resposta executada en presència d’un
estímul va seguida d’un fet satisfactori, l’associació entre l’estímul i la resposta s’enforteix. Si la
resposta va seguida d’un fet molest, l’associació es debilita.
Skinner i la llei del reforçament
Skinner va formular a partir de la llei de l’efecte, la llei del reforçament, amb el propòsit de
mesurar i objectivar al màxim tant la resposta instrumental com les conseqüències derivades
d’aquesta. Segons aquesta llei, els organismes aprenen a fer determinades conductes en
certes situacions perquè aquestes conductes han estat seguides de conseqüències agradables
per l’organisme (reforçament). Una conducta que ha estat reforçada, augmentarà la seva
probabilitat d’ocurrència en el futur.
Skinner va posar en pràctica la llei del reforçament instaurant el procés de condicionament
operant amb la gàbia dissenyada per ell mateix i anomenada caixa d’Skinner. Aquesta gàbia
possibilitava que animals com la rata o el colom aprenguessin a executar una conducta nova
(pitjar una palanca o picotejar un disc, respectivament) sempre que la conseqüències
d’aquesta conducta fos la presentació de menjar.
Els aspectes més destacats de la caixa d’Skinner són: una palanca amb un mecanisme
incorporat el qual permetrà que, automàticament, cada cop que és accionada la palanca es
dispensi una petita fracció d’aliment que apareixerà dins de la menjadora situada al costat. La
caixa d’Skinner també disposa d’un mòdul addicional que fa el registre gràfic i acumulatiu tant
de la freqüència de resposta de l’animal, com de l’administració del menjar al llarg d’una
sessió.
10.3 Procediment de condicionament operant i la gàbia d’Skinner
La caixa d’Skinner està composada per:
Manipulandum: la tecla o palanca que s’acciona.
Dispensador: “pellet” (mejar-boletes).
Menjadora.
Registre acumulatiu: aparell fora de la gàbia que representa gràficament la taxa de
respostes per minut.
60
Les respostes es van acumulant. Podem llegir el pendent. Si la taxa de resposta és alta, la
pendent serà pronunciada (i viceversa).
Un procediment típic de condicionament operant amb una rata consta dels passos següents:
1. Privació: l’animal ha d’haver estat privat de menjar fins que es trobi al 80% del seu pes
habitual.
2. Adaptació a la gàbia: se situa l’animal dins de la gàbia d’Skinner per tal d’habituar les
respostes d’orientació, i establir una línia base operant abans de començar el
condicionament.
3. Entrenament al dispensador de menjar: en aquesta fase, l’animal aprèn una associació
clàssica entre el so (EC) que emet entre el mecanisme dispensador del menjar, i la
presència de l’aliment (EI) dins de la menjadora.
4. Moldejament per reforçament diferencial de les aproximacions successives: és el que
s’ha d’aplicar quan volem instaurar un reforçament. Des de conductes inicials (que
l’animal sí que fa), anem reforçant-se fins obtenir la conducta final desitjada.
Fem aproximacions successives (experiment rata):
a. Primer apropar-se al menjador.
b. Ficar el morro.
c. Tocar la palanca amb les potes.
d. Apretar la palanca amb prou força.
Un cop observem taxa de resposta alta en la primera (apropar-se al menjador), passem
a la segona conducta (ficar el morro). És a dir, anem realitzant aproximacions
successives.
10.4 Anàlisi dels elements del condicionament instrumental
10.4.1 La resposta instrumental: R o RC
Podem condicionar instrumentalment molts tipus de conceptes: respostes condicionades,
cognicions (imaginació), respostes fisiològiques,etc.
61
10.4.1 Les conseqüències de la resposta
Existeixen dos efectes:
- Reforçament: Els estímuls que segueixen a una resposta operant, que l’efecte que tinguin
sigui reforçar (enfortir) la resposta. Existeix, llavors, l’estímul reforçador: qualsevol
esdeveniment que augmenta la freqüència futura d’emissió de la resposta a la qual segueix.
Qualsevol estímul no és un estímul reforçador, serà reforçador quan el presentem i la
conducta posterior augmenti de freqüència.
- Càstig: En aquest cas, la presentació dels estímuls que segueixen una resposta operant
produeixen un efecte contrari al reforçament, és a dir, disminueixen la freqüència de la
resposta. Per tant, la conducta es fa menys probable.
10.4.3 Tipus d’estímuls reforçadors
- Estímuls incondicionats/primaris/innats: Existeixen estímuls que, sense necessitat de cap
aprenentatge previ, actuen com a reforçadors. Per tant, actuen de manera innata.
- Estímuls condicionats/secundaris/apresos: Aquest tipus d’estímuls provenen d’un
aprenentatge previ, és a dir, d’un condicionament clàssic a partir d’estímuls reforçadors
primaris.
- Estímuls generalitzats: són estímuls reforçadors apresos però, a diferencia dels secundaris,
no han estat a un estímuls reforçador primari sinó a més d’un.
10.5 Procediments bàsics de condicionament instrumental
Els quatre procediments bàsics de condicionament instrumental es classifiquen en funció del
tipus d’estímul que es manipuli (apetitiu o aversiu) i del fet que aquest tipus d’estímul es
presenti o es retiri com a conseqüència de la resposta realitzada (contingència positiva o
contingència negativa).
E. APETITIU (conductes
d’apropament)
E. AVERSIU (conductes de
rebuig)
PRESENTACIÓ (contingència
positiva)
Reforçament positiu (augment de la
conducta operant)
Càstig positiu (disminució de la
conducta operant)
RETIRADA/NO PRESENTACIÓ
(contingència negativa)
Entrenament per omissió/Càstig
negatiu (disminució de la conducta
operant)
Reforçament negatiu: Fugida o
Evitació (augment de la conducta
operant)
62
Recordar: Un estímul pot ser aversiu o apetitiu i es pot presentar o no però, un no-E apetitiu
no vol dir un E aversiu, i un no-E aversiu no és un E apetitiu.
Exercici
- Caminar mirant a terra (conducta operant o instrumental) i trobar un bitllet de 50 €
(conseqüència).
Contingència positiva => Reforçament positiu.
- Agafar un camí alternatiu (conducta operant o instrumental) quan sentim la ràdio que més
endavant ens trobarem un embús (el no embús és la conseqüència).
Contingència negativa => Reforçament negatiu => Evitació.
- Fer tard (conducta operant) a una cita i trobar-nos que l’altra persona ha marxat
(conseqüència).
Contingència negativa => càstig positiu.
- Treure un tema de conversa (conducta operant) i rebre crítiques (conseqüències).
Contingència positiva => Càstig positiu.
- Administrar-se un heroïnòman una dosi per deixar de patir la síndrome d’abstinència.
Contingència negativa => càstig negatiu => Fugida.
63
Tema 11: El reforçament positiu I: procediments i variables
11.1 Procediments i mesures de la resposta en el reforçament positiu
11.1.1 Procediments d’assaigs discrets
Aquest procediment es caracteritza perquè únicament permet una resposta instrumental a
cada assaig. Thorndike va ser l’autor pioner en utilitzar aquest procediment i actualment
s’aplica en determinats aparells com ara els següents:
Corredor recte: format per un únic passadís amb una caixa de sortida en un extrem, i
una caixa d’arribada a l’extrem oposat. Un assaig s’inicia col·locant ‘animal dins de la
caixa de sortida i acaba quan entra dins de la caixa d’arribada, on, normalment, es
troba amb el reforçador.
Laberints en forma de Y i T: estan formats per un corredor central que es bifurca en
dos braços. Un assaig s’inicia col·locant l’animal dins de la caixa de sortida i acaba
quan entra dins de la caixa d’arribada d’un dels braços del laberint. L’animal realitza
un assaig correcte quan gira cap al braç que conté el reforçador.
Mesures de la resposta:
1. Latència de resposta: temps transcorregut des que es posa l’animal a la caixa de
sortida fins que inicia el recorregut.
2. Temps de carrera.
3. Velocitat de carrera.
4. Percentatge d’assaigs amb resposta correcta (només en els laberints en forma de Y i T).
11.1.2 Procediment d’operant lliure
Procediment dissenyat per Skinner (fa servir la caixa d’Skinner) i es caracteritza perquè permet
l’execució lliure i repetida de la resposta operant. Les mesures més usuals de la gàbia d’Skinner
són:
1. Taxa de resposta: nombre de vegades que l’animal pitja la palanca per fracció de
temps.
2. Latència de resposta: des de que comença la sessió fins que emet la primera resposta.
3. Topografia de la resposta operant: forma en què l’animal pitja la palanca.
4. Intensitat de la resposta: força que aplica l’animal en accionar la palanca.
64
11.2 Variables que afecten el reforçament positiu
11.2.1 Variable relativa al subjecte: motivació
S’estableix una relació de “U” invertida entre el grau de motivació i l’aprenentatge assolit.
Aquesta motivació es determina amb el nivell de privació, és a dir, les formes més comunes i
objectives que s’utilitzen per mesurar el nivell de motivació són:
A major motivació, menor aprenentatge:
APR.
MOT.
11.2.2 Variables relatives al reforçador
Magnitud: fa referència a la quantitat (a major quantitat de reforçador, millor
execució) i a la qualitat de l’estímul reforçador. Experiment de Hurt: rates amb
diferents quantitats i tipus de reforçadors. Les rates corren més ràpid per aconseguir
reforçadors majors i més gustosos.
Canvis en la magnitud: l’eficàcia d’una determinada magnitud de reforçament,
presentada darrere d’una determinada conducta, està en funció de les experiències
prèvies amb altres magnituds de reforçament diferents. Aquestes experiències prèvies
determinaran que l’efecte de contrast (descrit per Crespi l’any 1942) entre la quantitat
de reforçament anterior i la quantitat actual sigui positiu (donarà lloc a un augment del
rendiment) o negatiu (amb disminució de rendiment). Perquè hi hagi un contrast
positiu, la magnitud de reforçament actual ha de ser més gran que l’anterior. En el cas
contrari, es produirà un contrast negatiu.
Petita Gran
65
11.2.3 Variables relatives a l’associació resposta-reforçador
a) Contigüitat temporal:
Temps entre l’emissió de la resposta i l’obtenció del reforçador (demora de
reforçador). En principi s’estableix una relació negativa entre demora i nivell
d’aprenentatge.
La introducció d’un temps de demora en la presentació de l’ER perjudica de forma clara
l’execució de la R, específicament quan:
o La magnitud de reforçament és petita;
o El cost de la resposta és alt;
o No existeixen estímuls reforçadors secundaris entre la R i el reforçador.
El paper de les respostes competitives (aquelles que apareixen entre la resposta
operant, la que té relació de contingència amb l’aparició del menjar, i l’estímul
reforçador). Aquestes dificulten establir l’associació entre la resposta-reforçador. És
possible que l’última resposta competitiva es vegi reforçada i augmenti de freqüència.
Les conductes supersticioses (derivades del explicat en el punt anterior de les
respostes competitives): experiment de superstició (Skinner) reforçament accidental o
adventici; creences il·lusòries.
L’autocontrol: aprendre a esperar i preferir la conseqüència demorada sobre la
immediata.
En l’exemple del ludòpata, el que importa realment per a que la persona segueixi fent una
determinada conducta (gastar-se diners en la màquina escurabutxaques) és la immediatesa de
les conseqüències.
b) Contingència resposta operant – estímul reforçador: relació de control entre l’emissió de
resposta i el reforçador. [p(ER/R) vs. P’(ER/no R)]
Si la primera probabilitat és més probable que la segona Reforçament positiu
Si la segona probabilitat és menys probable que la segona Reforçament diferencial
d’altres conductes (RDO) (Tema 16, càstig negatiu)
66
Si les probabilitats són iguals absència de condicionament (manca de control).
Quan, per exemple, a un nen li regalem sempre alguna cosa quan fa o no una conducta
inapropiada
Exercici
Quatre fàbriques de joguines han contractat temporalment uns grups d'operaris (Grups 1 a 4)
per tal de col·locar el material ja fabricat dins de contenidors. La taula següent especifica el sou
que ha rebut cada grup de treballadors en les dues campanyes de Nadal en què han participat:
1. En la segona campanya de Nadal els temps que aquests grups de treballadors han trigat a
omplir cada contenidor han estat els següents: 180, 210, 240 i 270 minuts. Indica en la darrera
columna de la taula (Rendiment Final) a quin grup de treballadors correspon cadascun
d'aquests valors.
1. 180 (millor rendiment): grup 4
2. 210: grup 3
3. 240: grup 1
4. 270: grup 2
2. Quin o quins grups calen per posar de manifest la relació existent entre la magnitud del
reforçament i el rendiment? El 1 i el 3.
3. Quin o quins grups calen per posar de manifest el fenomen de Contrast Positiu? El grup 4
(com a grup experimental) amb el 3 (grup control).
4. Quin o quins grups calen per posar de manifest el fenomen de Contrast Negatiu? El 2
respecte de l’1.
67
Tema 12: El reforçament positiu II: programes de presentació del reforçament
12.1 El reforçament intermitent
- Reforçament continu (RFC), allò que s’utilitza quan s’ha d’ensenyar una nova conducta
(procés de moldejament):
La R és seguida per l’ER cada vegada que s’emet;
Adquisició de noves conductes;
Baixa resistència a l’extinció;
Taxa de resposta moderada i relativament constant, amb pauses breus i
impredictibles.
- Reforçament intermitent o parcial (exemple de les màquines escurabutxaques, no sempre
obtinc el “premi”, només a vegades):
La R sols és seguida per l’ER en algunes ocasions;
Manteniment de les conductes ja apreses;
Alta resistència a l’extinció.
Aquest tipus de reforçament funciona de manera que no totes les emissions de la conducta
queden reforçades.
El programa de reforçament es la regla que especifica, en una situació de reforçament
intermitent, en quines ocasions la resposta és reforçada.
12.2 Programes simples de reforçament intermitent
- Programes simples de raó: el reforçament depèn del nombre de respostes:
Programes de raó fixa (RF): el nombre de respostes perquè es presenti l’ER és sempre
el mateix (per exemple: RF 5 cal apretar la palanca 5 vegades per obtenir l’estímul
reforçador). Hi ha una taxa de resposta alta i sostinguda.
Pauses
68
Programa de raó variable (RV): el nombre de respostes perquè es presenti l’ER és
variable i impredictible. El valor del programa de raó variable (per exemple RV5) indica
el nombre mitjà de respostes al llarg de la sessió. Per exemple, la persona que juga a
les màquines, la persona no sap quan surt el premi; qui programa la màquina diu que
cada 50 vegades de tirar monedes s’ha de donar un premi. El subjecte respondrà de
manera compulsiva i sense pauses si el premi surt abans de les 50 monedes que s’han
de fer servir per arribar al premi.
- Programes d’interval: el reforçament depèn del temps per obtenir l’ER cal emetre la R
després d’un període mínim de temps des de l’anterior R reforçada. Si el subjecte respon en el
període de temps que hem determinat (l’interval), no se li presenta l’estímul; si el subjecte
respon per primera vegada després de l’interval, rebrà l’estímul reforçador.
Programa d’interval fix (IF): el període de tremps és sempre el mateix (per exemple IF
3 min). Quan passin tres minuts i el subjecte faci la resposta operant, se li presenta el
reforçament; si es fa la resposta operant en l’interval, no es presentarà l’estímul
reforçador.
Llarga pausa postreforçament i taxa de resposta progressivament accelerada a mesura que
s’apropa la fi de l’interval (“festó” de l’interval fix).
Programa d’interval variable (IV): el període de temps és variable i imprevisible. El
valor del programa (per exemple IV 3 min) indica el temps mitjà que ha de passar.
Potser hi ha un interval de 30 segons, un altre de 4 minuts, etc. però, en mitjana, és 3.
Taxa de resposta moderada i sense pauses (molt constant i estable).
- Programes de reforçament de taxes de resposta: en aquests programes s’exigeix una
determinada taxa de resposta per obtenir el reforç. El reforç es pot rebre per emetre taxes
elevades de conducta –reforçament diferencial de taxes altes (RDA)- o per emetre taxes
baixes de conducta –reforçament diferencial de taxes baixes (RDB).
12.3 L’extinció de la resposta reforçada positivament
El procediment d’extinció consisteix a suspendre el reforçament després d’una resposta, de
manera que el subjecte no pot obtenir recompensa, sigui quina sigui la seva conducta. Així, en
aquest cas, la probabilitat que es presenti el reforçador darrere de la resposta és igual a 0.
69
El resultat que produeix l’extinció és una disminució progressiva de la freqüència de la
resposta. Després d’un període de descans es pot produir una recuperació espontània de la
resposta, de forma similar a com s’observa a l’habituació de la resposta reflexa i a l’extinció del
condicionament clàssic. Experiment de Rescorla amb rates: el que va realitzar en el seu
experiment fou introduir un període de descans posterior a l’extinció (R-No descans) que va
produir una recuperació substancial en la resposta, il·lustrant el fenomen de la recuperació
espontània.
- Efectes de l’extinció a nivell conductual:
Efecte paradoxal de l’extinció: La corba de l’extinció no descriu una disminució
progressiva i homogènia de la resposta instrumental, sinó que en els primers assaigs es
produeix un major nombre de respostes, que, a més a més, són més intenses. Exemple
del nen i les rebequeries.
Més períodes de no-resposta: disminueix la taxa de resposta i apareixen pauses.
Les respostes canvien de topografia.
- Efectes de l’extinció a nivell emocional:
L’extinció pot induir frustració i reaccions agressives degut a l’omissió d’un
reforçament esperat. Experiment amb coloms d’Azrim (1956): En primer lloc es reforça
a un colom per picotejar una tecla de resposta, mentre que l’altre animal es troba
subjecte a una cantonada de la cambra experimental. L’ocell que picoteja la tecla
ignora pràcticament l’altre mentre se li proporcionen reforçadors però, quan
s’introdueix l’extinció i s’acaba el reforçament, l’ocell prèviament reforçat és probable
que ataqui al seu innocent company. Es dóna una agressió semblant si es situa un
model de drap en lloc d’un animal real en la gàbia d’Skinner.
12.3.1 Variables relatives a l’estímul reforçador
- Procediment del reforçament previ:
Efecte del reforçament parcial en l’extinció: les respostes que han estat sotmeses a un
programa de reforçament intermitent presenten, posteriorment, més resistència a
l’extinció que les respostes que han estat sotmeses a un reforçament continu.
Els programes de reforçament variable generen més resistència a l’extinció.
70
- Excepcions d’aquest procediment. En general, un major nombre de reforçaments i uns
reforçaments de major magnitud provoquen més resistència a l’extinció. No obstant, la relació
entre aquestes variables pot dependre d’altres factors, com el programa de reforçament:
Efecte de la magnitud del reforçament en l’extinció: Així, en el reforçament continu
una quantitat de recompensa elevada disminueix la resistència a l’extinció.
Efecte del sobreentrenament en l’extinció: un major nombre d’episodis de
reforçament amb una magnitud de reforçament alta disminueix també la resistència a
l’extinció.
12.3.2 Variables relatives al subjecte (a la seva motivació)
Hi ha una relació positiva entre el nivell de privació (nivell alt => més difícil l’extinció) i la
resistència a l’extinció.
L’experiència prèvia en situacions d’extinció facilita l’extinció.
12.3.3 Variables relatives a la resposta
A major cost (l’esforç que li suposa al subjecte emetre la resposta operant), menor resistència
a l’extinció. Més alt cost de la resposta, més fàcil l’extinció (és a dir, menys resistència a
l’extinció).
12.3.4 Variables relatives al procediment
- si el procediment d’extinció es dóna en un context diferent al del condicionament
instrumental, la resposta es recuperarà quan s’exposi al subjecte de nou al context on ha rebut
el reforçament positiu. Aquest fenomen s’anomena efecte de renovació de la resposta
prèviament extingida.
- A major IEA (en els procediments d’assaigs discrets), major resistència a l’extinció.
- La pràctica massiva (tant en la fase d’aprenentatge com durant l’extinció) afavoreix l’extinció;
en canvi, la pràctica distribuïda la dificulta.
71
Tema 13: el reforçament positiu III: anàlisi teòrica
13.1 Introducció
Què és un estímul reforçador?
La definició bàsica que respon a aquesta pregunta (explicada ja anteriorment: un reforçador és
una conseqüència que incrementa la probabilitat que aparegui la conducta la qual segueix, i
aquesta increment la seva probabilitat d’aparició perquè ha estat reforçada per la presentació
d’un determinat estímul) és circular, operativa i poc satisfactòria pel que fa l’aspecte teòric. No
ens explica res, ens defineix els fets.
Des d’un punt de vista teòric, s’ha de mirar les causes i característiques de l’estímul per poder
veure i anticipar els seus possibles efectes sobre la conducta.
Existeixen diferents perspectives que donen respostes més teòriques:
- Perspectiva biològica: els reforçadors considerats com a estímuls. No tots els estímuls són
reforçadors.
- Perspectiva conductual: estímuls reforçadors com a conductes. Els estímuls reforçadors en
realitat no són estímuls, el que és reforçant és la conducta consumatòria (conductes
consumatòries: aquelles finalitzen una seqüència instintiva de conductes).
13.2 Els reforçadors considerats com a estímuls
Diferents teories ens diuen que ha de tenir un estímul per a que pugui ser estímul reforçador:
- Llei de l’efecte de Thorndike: Tipus especial d’estímuls que produeixen un “estat satisfactori”
per a l’organisme (llei de l’efecte de Thorndike). Aquesta definició té un caràcter subjectiu ja
que cada persona considera o no una determinada conducta com a satisfactòria.
- Llei de la reducció del impuls de Hull: Tots els reforçadors primaris són estímuls que
redueixen alguna necessitat biològica essencial per a la supervivència de l’organisme, i tots els
estímuls que redueixin una necessitat biològica actuaran com a reforçadors (teoria de la
reducció de l’impuls de Hull). Els estímuls reforçadors són estímuls que la propietat que tenen
és que són necessaris per a la supervivència de l’organisme. En aquesta segona afirmació
també existeixen excepcions, com, per exemple, el cas de la sacarina: segons Hull, hauria de
ser un reforçador primari però, aquest, “no alimenta”, no proporciona nutrients al cos i per
tant, no contribueix a la supervivència de l’organisme.
72
13.3 Els reforçadors considerats com a conductes
Aquest punt de vista considera que el que pot actuar com a reforçador no és l’accés a un
determinat estímul, sinó la possibilitat de fer determinades conductes. Dins d’aquesta
perspectiva, podem considerar que hi ha quatre aproximacions que donen explicacions
progressivament més complexes, però tampoc no arriben a oferir una explicació amb una
validesa universal.
13.3.1 La teoria de la resposta consumatòria (Fred Sheffield)
- El que actua com a reforçador és la possibilitat de dur a terme les respostes consumatòries
(respostes que culminen una seqüència instintiva de conductes). És a dir, el reforçador no seria
el menjar sinó la conducta de menjar.
13.3.2 El principi de Premarck (principi de la probabilitat diferencial – David Premarck)
Considera que les conductes reforçants no són un determinat tipus de conducta.
Afirma que existeixen conductes de major probabilitat que actuaran com a reforçadors de les
conductes menys probables.
R instrumental (conducta de baixa probabilitat) Reforçador (possibilitat de fer una nova
conducta d’alta probabilitat.
Si, per exemple, un nen prefereix jugar a pilota abans que fer trencaclosques i el fem fer
trencaclosques abans de jugar a pilota, la conducta de jugar a pilota (més probable) reforçarà
la conducta de fer trencaclosques (menys probable).
13.3.3 La hipòtesi de la privació de resposta (Timberlake i Allison)
Aquesta hipòtesi afina una mica més la teoria de Premarck, ja que aquests dos autors estan
d’acord en moltes de les idees de Premarck.
Afirmen que el que converteix una conducta en reforçant no és la seva alta probabilitat, sinó el
fet que es trobi privada.
És a dir, en l’exemple del nen que prefereix jugar a la pilota, quan el nen reforça la conducta de
realitzar trencaclosques es produeix aquest efecte degut que la conducta de jugar a pilota es
troba privada.
73
D’acord amb aquesta hipòtesi, la conducta de fer trencaclosques també pot arribar a ser
reforçant ja que s’acaba realitzant la conducta amb major probabilitat per tal d’aconseguir
altres conductes.
13.3.4 L’enfocament basat en la regulació conductual
Hi ha diferents punts de vista que podem agrupar sota aquest títol, atès que comparteixen una
idea en comú: L’organisme tendeix a aconseguir una homeostasi conductual, i, quan
s’introdueix una contingència instrumental que altera aquest equilibri, l’organisme
redistribueix el seu repertori conductual tractant d’apropar-se com més millor al punt preferit
d’equilibri conductual o punt òptim. El que farà l’organisme depèn de les diferents estratègies
i conductes substitutives que pugui tenir a l’abast. Si no hi ha alternatives disponibles, com
succeeix en les situacions de laboratori, la contingència instrumental pot actuar de forma molt
poderosa. Si la situació permet diferents alternatives (com succeeix habitualment fora de
laboratori, en situacions naturals), la contingència instrumental no pot regular la conducta
d¡una manera tant potent i pot ocórrer que les conductes finals no siguin, ni de bon tros, les
que les contingències resposta-reforçador volien aconseguir.
13.4 Conclusions
Com ja hem avançat a la introducció, cap dels punts de vista exposats no pot explicar tots els
fenòmens observats. Això és lògic si tenim en compte que cada plantejament parteix de
supòsits molt diferents, la qual cosa els fa arribar a conclusions molt diferents.
Malgrat tot, sembla que el plantejament que ens ofereix una visió més àmplia és el que
considera que la situació de condicionament instrumental provoca una restricció de la
conducta lliure de l’organisme, a la qual aquest respon reorganitzant els seus comportaments
tot cercant una recuperació de l’homeostasi conductual. Aquesta reorganització pot fer que
augmenti la conducta la qual la contingència de condicionament instrumental li ha atribuït el
paper de resposta instrumental. Si això té lloc en un ambient molt controlat (situació de
laboratori), serà més probable que la resposta instrumental augmenti.
74
Tema 14: El reforçament negatiu i (fugida i evitació): procediments variables
14.1 Reforçament negatiu
Procediment de condicionament instrumental en el qual la resposta augmenta com a
conseqüència de:
1. La retirada d’un estímul aversiu (ER-): FUGIDA.
2. La no presentació d’un estímul aversiu (ER-): EVITACIÓ.
14.2 Procediment de la resposta de fugida
Esquema:
E av. - -> Augmenta la probabilitat de resposta de fugida Retirada E av.
(A mesura que passen presentacions de l’estímul av. la latència d ela resposta de fugida va
disminuint).
- Situacions experimentals en què s’estudia aquesta resposta
Respostes locomotrius:
o Corredor recte, laberints.
o Caixa de dos compartiments: compartiment de perill i compartiment de
seguretat.
o Roda d’activitat
Respostes manipulatives:
o Caixa de Skinner: la resposta de prémer la palanca amb l’estímul aversiu
tindria com a conseqüència la finalització de prémer la palanca.
- Estímuls aversius:
Descàrrega elèctrica d’intensitat moderada.
Immersió en aigua freda.
Visió d’un depredador específic de l’espècie. Amb això busquem més valor ecològic en
l’experiment.
75
En humans:
o Estimulació sensorial intensa o emocionalment desagradable (international
affective pictures system).
o Exposició CO2: provoca sensació molesta ja que es té la sensació de manca
d’oxigen.
14.3 Mesures de la resposta de fugida
- Percentatges d’assaigs amb resposta de fugida (NO són útils).
- Nombre de respostes de fugida.
- Latència de la resposta de fugida.
- Magnitud de la resposta: velocitat de la resposta (respostes locomotrius) i intensitat de la
resposta (resposta manipulativa).
14.4 Variables que afecten a la fugida
Variables Reforçament positiu Reforçament negatiu (fugida)
Motivació Nivell de privació del l’ER+ Com d’intens és l’estímul aversiu.
Magnitud del
reforçament Quantitat i qualitat del ER+
- El percentatge o grau de disminució en la
magnitud de l’estímul aversiu.
- El temps que triga en aparèixer un altre
cop (interval entre assaigs).
Demora del
reforçament
Demora de la presentació de
l’ER+
Demora en la retirada de l’estímul aversiu.
- Intensitat de l’estímul (variable que determina el grau de motivació del subjecte per fer la
resposta): a major intensitat de l’estímul aversiu, menor latència de la resposta de fugida.
- Reducció de la intensitat de l’estímul rere la resposta: a major percentatge de reducció de
l’estímul aversiu, major força de la resposta de fugida. A major IEA major força de la resposta
de fugida.
76
- La demora en retirar l’estímul aversiu: a major demora en la retirada de l’estímul aversiu,
adquisició més lenta i nivell final d’execució de la resposta de fugida més baix; la presència
d’estímuls reforçadors secundaris immediats atenuen l’efecte de la demora de la retirada de
l’estímul aversiu.
14.5 Procediments de la resposta d’evitació discriminada
- Procediments d’evitació:
Evitació discriminada (o senyalada): un estímul o senyal d’avís (o d’alarma) indica el
moment en què cal emetre la resposta (procediment amb assaigs discrets). L’estímul
d’avís NO provoca la resposta d’evitació, ja que és una resposta lliure voluntària, sinó
que indica que és un moment apropiat per fer-la. Aquest estímul és un exemple
d’estímul discriminatiu.
L’estímul discriminatiu (ED): indica que, si en la seva presència s’emet la resposta instrumental,
s’obtindrà el reforçament. Per exemple: el to del mòbil.
Esquema:
E d’avís Augment de la probabilitat de la resposta d’evitació No presentació de l’E av.
Aquest tipus de conductes són difícils d’aprendre (entre 40 i 80 assaigs). Alguns subjectes no
arriben a aprendre la conducta (20%).
- Si el subjecte fa la resposta d’evitació quan encara és present l’estímul aversiu, això és una
fugida de la resposta.
Primer aprenem a fugir i després a evitar.
77
- Quan fa la resposta abans de l’estímul aversiu el que passarà és que no es presentarà
l’estímul. Llavors, ja sí que seria una autèntica resposta d’evitació. A aquest tipus
d’aprenentatge també se’l pot anomenar, llavors, com aprenentatge de fugida-evitació.
Evitació no discriminada i d’operant lliure: no hi ha estímul d’avís, sinó que la resposta
es pot emetre en qualsevol moment (procediment d’entrenament continu).
Esquema:
Aquest aprenentatge es realitza en una gàbia d’Skinner i es basa en dos tipus d’intervals:
Interval D-D: és l’interval entre descàrregues en absència de resposta;
Interval R-D: és l’interval entre la resposta d’evitació i la propera descàrrega
programada. Aquest és el temps de seguretat.
- Situacions experimentals d’evitació discriminada:
Respostes locomotrius:
o Evitació de vaivé (evitació shuttle). La resposta és anar d’un costat a un altre
de la gàbia (enlloc dels dos compartiments, el de seguretat i perill).
o Roda d’activitat.
o Evitació de salt. L’animal ha de saltar en una altra plataforma lleugerament
més alta i si salta a la plataforma no es presenta la descàrrega.
o Evitació d’un sentit: caixa de dos compartiments; el posem en el de perill, es
presenta l’estímul d’avís i es presenta la descàrrega. Si quan se li presenta la
descàrrega, abans ja marxa cap a la caixa de seguretat, ha après resposta
d’evitació.
Respostes manipulatives:
o Evitació de manipulandum.
78
14.6 Mesures de la resposta d’evitació discriminada
- Latència de la resposta d’evitació: temps transcorregut des que es presenta senyal d’alarma
fins que comença a fer la conducta d’evitació.
- Percentatge d’assaigs amb resposta d’evitació: fa referència a la proporció de respostes
d’evitació que s’han donat en una sessió o en un determinat nombre d’assaigs.
- Nombre d’assaigs consecutius amb resposta d’evitació. Així, per exemple, en la gàbia
shuttle, normalment es fixa el criteri d’aprenentatge en quatre o cinc respostes d’evitació
consecutives.
14.7 Variables que afecten l’evitació discriminada
- Nombre d’assaigs d’aprenentatge: situacions experimentals “fàcils”: evitació amb roda
d’activitat, evitació de salt, evitació d’un sentit (s’aprèn amb menys de 10 assaigs); situacions
experimentals “difícils”: evitació de vaivé, evitació de manipulandum. No tothom aprèn
conductes d’evitació, tot i que de fugida sí.
- Intensitat de l’estímul aversiu: relació directa (+/+) en l’evitació amb roda d’activitat i en
l’evitació d’un sentit; relació inversa (+/-) en l’evitació de vaivé en rates i l’evitació de
manipulandum; relació en forma d’U invertida (fins arribar a un punt que baixa) en l’evitació
de vaivé en gossos.
- Demora en la retirada de l’estímul d’avís: la demora en la retirada de l’estímul d’avís
perjudica de clara l’aprenentatge d’evitació discriminada.
14.8 Controlabilitat i interferència de l’aprenentatge: indefensió apresa
Sempre hi ha una contingència entre la conducta que fem i la conseqüència que té associada.
Què passa quan un subjecte experimenta manca de control? És a dir, unes conseqüències que
no depenen de la resposta operant (contingència entre conducta i conseqüències inexistent)?.
- Incontrolabilitat o manca de control: dificulta l’adquisició de nous aprenentatges
instrumentals. Aquest efecte s’anomena l’efecte d’indefensió apresa.
Aquest efecte fou descobert per Seligman, Overmier i Maier (1967): en gossos, l’exposició a
descàrregues elèctriques inescapables i inevitables dificulta l’adquisició posterior d’un
aprenentatge de fugida-evitació de vaivé (Domjan, pp. 152-153).
79
Segons Seligman, la indefensió apresa constituiria una síndrome que inclouria dèficits a nivell:
D’aprenentatge
Cognitivo-motivacional
Emocional
Seligman va proposar la hipòtesi d’indefensió apresa: quan un subjecte experimenta una
situació de manca de contingència entre conducta i conseqüència adquirim una cognició (una
expectativa) de manca de control. Aquesta cognició seria la que explicaria que posteriorment
es donés la dificultat de l’aprenentatge instrumental.
Si una persona experimenta situacions de control no es desenvoluparà la indefensió apresa.
80
Tema 15: El reforçament negatiu II (fugida i evitació): anàlisi teòrica
15.1 Introducció
La qüestió central que ha guiat les principals teories sobre l'aprenentatge d’evitació ha estat
conèixer quines són les conseqüències que segueixen a la conducta d’evitació que
proporcionen algun tipus de reforçament instrumental responsable de l’augment d’aquesta
conducta. És a dir, esbrinar quin a és la font de reforçament o allò que motiva l’individu a fer la
conducta d'evitació. D'altra banda, aquesta qüestió queda sense interès quan es tracta de
valorar l'aprenentatge de fugida. Aquest tema se centrarà en l’anàlisi teòrica de l'evitació
discriminada i en el seu procediment d'extinció.
1. En l’evitació discriminada, quines són les conseqüències que reforcen la conducta
d’evitació? “Com s’aprèn” finalització E avís.
2. Quan s’ha adquirit la conducta d’evitació discriminada, l’estímul aversiu ja no es presenta:
perquè no s’extingeix llavors la resposta d’evitació?
Exemples d’intervenció
Conductes d’evitació en els trastorns fòbics.
Trastorn obsessiu-compulsiu (TOC).
15.2 Teories de l’evitació
15.2.1 Teoria bifactorial de Mowrer
- Teoria bifactorial o teoria dels dos processos.
Mowrer (1947)
Miller (1951)
En l’aprenentatge, un factor que intervé és un condicionament clàssic: Estímul avís associat
amb EI aversiu procés condicionament clàssic. Predirà la presentació de la descàrrega
provocarà resposta condicionada (R+) de por, seguidament, evitar sensació de por.
En l’evitació discriminada intervindrien 2 factors:
1. Condicionament clàssic: l’estímul d’avís (so) s’associa a la presentació de l’estímul aversiu
(EI: xoc elèctric) de manera que esdevindria un EC+ que provocaria un RC+ de por.
81
Evitar estímul d’avis, no por.
2. Condicionament instrumental: la por proporcionaria la motivació per a la resposta
d’evitació, ja que aquesta seria reforçada negativament per la finalització “de l’estímul avís”
(EC) i la no-presentació de l’EI (xoc). Quan el so desapareix, desapareix també la por
condicionada. La desaparició de la por condicionada és el reforçador que manté la conducta
d’evitació, essent considerada la no-presentació de l’EI com un fenomen secundari. Segons
això, allò que reforça l’execució de la resposta és la retirada d’un EC+ aversiu.
SUPORT EXPERIMENTAL: BROWN I JACOBS (1949) (Domjan pp. 284-288)
El que prediu la teoria bifactorial és un cicle indefinit de fases alternades d’extinció i de
recondicionament de la por i de la resposta d’evitació.
SUPORT EXPERIMENTAL
L’existència d’aquests cicles no sempre s’ha pogut confirmar empíricament. Contràriament, en
moltes ocasions, s’ha pogut observar que, encara que l’estímul aversiu ja no es presenti, la
resposta d’evitació es pot mantenir de manera indefinida. A més, en alguns casos quan la
conducta d’evitació es troba ben establerta, la por a l’estímul d’avís es pot reduir, però no
obstant es manté la resposta d’evitació.
CONCLUSIÓ: La teoria bifactorial explica de forma satisfactòria com s’adquireixen les respostes
d’evitació discriminada, però no com es mantenen una vegada apresses.
15.2.2 La hipòtesi del senyal de seguretat
- Bolles i Grossen (1969)
- Weisman i Litner (1972)
Segons la teoria bifactorial:
La resposta d’evitació seria reforçada negativament per la retirada de l’estímul d’avís (un
senyal de perill: EC+ associat a la presentació de l’EI aversiu) i la consegüent reducció de la RC+
de por.
82
Segons la hipòtesi del senyal de seguretat:
La resposta d’evitació també podria ser reforçada positivament per la presentació de senyals
de seguretat (EC- que indica l’absència de l’EI aversiu), els quals provocarien respostes
condicionades inhibitòries d’aullejament, seguretat i relaxació.
Quins estímuls podrien actuar com a senyals de seguretat?
La finalització de l’estímul d’avís.
Les claus retroalimentadores o propioceptives que acompanyen l’emissió de la resposta
d’evitació.
CONCLUSIÓ: la hipòtesi del senyal de seguretat complementa la teoria bifactorial explicant de
forma satisfactòria el manteniment de les respostes d’evitació discriminada quan l’estímul
aversiu ja no es presenta.
15.3 Anàlisi de l’extinció de la conducta d’evitació discriminada
Els diferents procediments emprats per extingir una conducta reforçada negativament s’han
de basar, necessàriament, en una postura teòrica sobre quin és l’element o elements que
reforcen negativament la conducta. A partir d’aquí, el procediment d’extinció que s’utilitzi ha
d’anar encaminat a retirar o no presentar l’element reforçador, tal com es fa en l’extinció del
reforçament positiu. Però, a diferència de les conductes reforçades positivament, és ben
complex identificar quin o quins són els elements reforçadors de la conducta d’evitació. Per
aquest motiu s’han dissenyat diferents procediments que presenten característiques pròpies.
15.3.1 L’extinció ordinària
La conseqüència de l’extinció de la resposta d’evitació consisteix en deixar de presentar
l’estímul aversiu. Això produeix el mateix efecte que la mateix conducta d’evitació.
No es dóna un canvi aparent de les conseqüències de la resposta, de manera que la seva
eficàcia és molt reduïda.
83
15.3.2. Càstig de la resposta d’evitació
·consisteix en presentar l’estímul aversiu quan es fa la resposta d’evitació
·tot i que pot resultar molt eficaç, presenta els inconvenients dels procediments de càstig
positiu (veure tema 16).
15.3.3. La inundació
Es fonamenta en els supòsits de la teoria bifactorial de Mowrer.
Consisteix en mantenir la presentació de l’estímul d’avís, és a dir, fer inoperant la
resposta d’evitació o impossibilitar-la.
Té dues variants:
1. Inundació tipus 1 o extinció verdadera de Katzev: consisteix a fer que la resposta
d’evitació no elimini l’EC i que tampoc no es presenti l’EI.
- La resposta d’evitació es pot emetre, però resulta inoperant de manera que no finalitza la
presentació de l’estímul d’avís.
- És més adequada quan els senyals d’avís són estímuls auditius i/o visuals (p.ex. evitació de
vaivé)
2. Inundació tipus 2 (bloqueig o prevenció de la resposta, comprovació de la realitat):
consisteix a, a més de no eliminar l’EC, impossibilitar la resposta d’evitació.
Evidentment, tampoc no es presenta mai al subjecte l’estímul aversiu.
- S’impossibilita “físicament” l’execució de la resposta d’evitació, presentant-se de forma
continuada l’estímul d’avís.
- És més adequada quan els estímuls d’avís són senyals de lloc o estímuls contextuals (p.ex.
evitació d’un sentit).
Els experiments o tractaments basats en la inundació inclouen 3 fases:
1. Adquisició de la resposta d’evitació (prèvia al tractament en el cas de les intervencions
terapèutiques) (nivell basal)
2. Aplicació de la inundació (intervenció)
3. Observació de l’extinció ordinària (fase de prova)
84
L’eficàcia de les tècniques d’inundació està directament relacionada amb el temps d’exposició
a l’estímul condicionat aversiu (sigui amb una pràctica massiva o distribuïda).
Els procediments d’inundació demostren una certa independència entre la conducta d’evitació
i la resposta emocional de por. En aquest sentit, s’ha vist que és més fàcil eliminar l’execució
de la resposta d’evitació que la resposta de por condicionada davant l’EC, que, d’altra banda,
s’aconsegueix fer desaparèixer amb sessions addicionals d’inundació.
85
Tema 16: El càstig: procediments i variables
16.1 Procediments de càstig: càstig positiu i càstig negatiu
Els procediments de càstig donen lloc a disminució de la conducta. Es diferencien dos tipus de
càstig en funció que s’estableixi una contingència positiva o negativa entre la conducta i les
seves conseqüències:
Càstig positiu; s’estableix una relació positiva entre la presentació d’una conducta i
l’aparició d’un estímul aversiu. Aquesta contingència disminuirà la probabilitat
d’aparició de la conducta.
Càstig negatiu: s’estableix una relació negativa entre la presentació d’una conducta i
l’aparició d’un estímul apetitiu. En aquest tipus de càstig, l’aparició de la conducta
provoca la retirada o la no-presentació d’un estímul apetitiu que s’esperava en aquest
moment.
Dos procediments relacionats amb el càstig negatiu són:
1. El reforçament diferencial d’altres conductes (RDO), en què una resposta que fins ara
permetia obtenir un determinat estímul reforçador deixa de tenir aquesta
conseqüència, la qual en canvi es pot continuar obtenint de forma periòdica sempre i
quan s’emetin d’altres conductes diferents. Per exemple: nen amb rebequeries amb
pares que presenten massa atenció, al retirar l’atenció el que segueixen és un
procediment d’extinció i no de càstig negatiu. En el càstig negatiu trec un reforçador
que abans no reforçava res, en l’extinció retiro el reforçador que estava reforçant.
2. El procediment de temps fora: en què la resposta té com a conseqüència un període
de temps durant el qual el subjecte no té disponibles les fonts de reforçament
habituals. Amb aquesta finalitat, a vegades el subjecte és retirat físicament de la
situació en què podia obtenir reforçadors per dur a terme determinades conductes.
16.2 Aparells experimentals i mesures
El primer que fem en un experiment és una fase I d’adquisició de la resposta mitjançant
reforçament positiu o negatiu (nivell basal). Tot seguit, una fase II: càstig de la resposta. Les
mesures per identificar l’eficàcia del càstig fem servir:
Percentatge o grau de disminució de la probabilitat o de la taxa de resposta després
d’aplicar el càstig: és a dir, la quantitat de supressió que obtinc. Aquest percentatge de
disminució pot ser total o parcial.
86
Temps de durada de la supressió: pot ser permanent o temporal.
En alguns casos la supressió temporal o parcial no és útil, ja que es pot produir un efecte
d’habituació degut que el subjecte s’habitua a la presentació de l’estímul aversiu. Per exemple:
nen de les rebequeries que ja no fa cas dels crits del pare.
L’efecte de facilitació és aquell efecte que es produeix quan un estímul aversiu passa a ser un
estímul reforçador de la conducta operant (en el cas del nen de les rebequeries, conducta
inapropiada).
Esquema:
Resposta operant (rebequeries nen) Estímul reforçador positiu (atenció dels pares)
Resposta operant (rebequeries nen) Estímul aversiu (crits) que inicialment suprimeix la
conducta, finalment es converteix en un estímul reforçador secundari condicionat
- Situacions experimentals de càstig:
D’assaigs discrets:
o Corredors rectes
o Laberints simples
o Caixa de dos compartiments
o Gàbia shuttle
Operant lliure:
o Caixa d’Skinner
16.3 Variables del càstig positiu
16.3.1 Motivació per respondre
Com més gran sigui la motivació per fer la resposta que es vol castigar, menor serà l’efectivitat
del càstig.
16.3.2 Intensitat i durada de l’estímul aversiu
Com més gran és la intensitat de l’estímul aversiu, més gran és la supressió de la conducta
observada.
En general, la durada de l’estímul aversiu no afecta de manera dràstica el grau de supressió
de la resposta.
87
Ara bé, durades molt llargues de l’estímul aversiu perjudiquen la supressió de la conducta, ja
que poden facilitar aprenentatge de fugida. En el Domjan s’explica que a més durada més
supressió, i no és així. Per exemple: nen que fica els dits a l’endoll (la presentació de l’estímul
aversiu és molt curta) i ja no els torna a ficar mai més.
16.3.3 Forma d’introducció
EL càstig és més eficaç si l’estímul punitiu es presenta en tota la seva intensitat de forma
sobtada que no pas si es presenta de forma gradual.
La forma d’introduir l’estímul aversiu pot donar lloc a dos fenòmens diferents:
La tolerància comportamental al càstig: l’exposició inicial a un càstig suau redueix els
efectes d’un posterior càstig intens. Així doncs, els subjectes als quals se’ls va
incrementant de forma paulatina la intensitat de l’estímul aversiu que reben després
de realitzar la conducta, disminueixen menys l’execució, que els subjectes que han
rebut inicialment, i d’un sol cop, l’estímul aversiu a la seva màxima intensitat.
Sensibilitat comportamental al càstig: l’exposició inicial (de manera sobtada) a una
estimulació aversiva abusiva augmenta els efectes supressors d’un posterior càstig
suau. Per exemple: un professor que crida fort i de manera sobtada al veure que la
gent parla; posteriorment la gent callarà simplement quan el professor els miri o avisi.
El professor que comença amb crits suaus però acaba amb un crit fort no produeix
l’efecte de sensibilització (produeix habituació).
16.3.4 Immediatesa del càstig (efectes de demora)
S’estableix una relació negativa entre la demora en presentar l’estimulació aversiva
contingentment a la resposta i el nivell de supressió de conducta que s’obté. A major demora d
ela presentació de l’estímul punitiu, menor eficàcia del càstig (molt menor eficàcia).
Conlusió de les variables
Per què un càstig sigui eficaç s’han de donar aquestes condicions sobre l’estímul aversiu:
Intens
No prolongat
Inescapable (no hi ha possibilitat
de perdó)
Sobtat
Immediat
Consistent o continu (una
característica nova però que també
afecta a l’eficàcia del càstig).
88
16.4 Efectes emocionals del càstig negatiu
El càstig pot donar lloc a efectes secundaris emocionals del càstig no desitjats, com per
exemple: por, angoixa, etc. Pot provocar respostes emocionals incondicionades de por o
ansietat, les quals:
Es poden condicionat clàssicament a d’altres estímuls o persones presents la situació, i
posteriorment generalitzar-se a d’altres estímuls o persones similars;
Poden motivar conductes de fugida i/o d’evitació no desitjades..
També pot induir respostes emocionals incondicionades d’ira, hostilitat o agressivitat.
Per tal de minimitzar els efectes perniciosos del càstig, principalment quan s’aplica a les
persones, és recomanable, sempre que la situació ho permeti, començar per un procediment
d’extinció de la conducta. Tanmateix, també és important garantir la possibilitat de realitzar
respostes alternatives a la castigada que permetin rebre reforçament positiu; aquesta operació
provoca una major supressió de resposta castigada i permet utilitzar un estímul aversiu menys
intens i durant un temps més breu sense perdre eficàcia.
Resum d’alternatives al càstig positiu:
Extinció
Càstig negatiu
RDO
Temps fora
Inundació (en l’evitació discriminable)
top related