etapas en la elaboración de un instrumento (tavella)

-Se ha dicho con insistencia oue un test no puede ser mcjor que los Ilems que lo componen. Todas las caracteristicas exigibles a un buen insúumento psicome&ko se deriván '-1 --eso usado er: su elaf~ración. La confiabilidad, la valiCrez, b efkiencia predidiva, la homogeneidad, el nivel de dificuffad, la variabilidad de los puntajes y fa f m a de la distribución de los mismos

- - depenrlm de las wopiedades de los ftems uue compone;, el test. g/ análisis detallado de la est/udura, el contenido y e! mmpafarniento de los ítems es la Única vla abierla al mejora mi en!^ progresivo de b s iniirumentos de mrdici6n que usamos en Psicología.

Si bien Ics oojetivos del análisis de ilems y algcmos de los pr~~edimientos usados cambiaí, según el tipo de variable que ir:stru,nen(; p-etenda medir a secún el uso al cua! estS destinad^, íos conceptos y procedimientos básicos en que se fundamenta el análisis de los Iferns y los esfadisticos que se ~amputan en e l curso de este análisis son cxmunes a la rnayoria de los instrumentos psimmefricos. "

l.- ETAPAS EN L A ELABORACION DE UN INSTRUMENTO PSICOMETRICO (Tavella, 19781

7.7- E TAPA PREPA RATO R;A

La necesidad de contar con ur! instrumento de medición. al menos los utilizado9 en el campo de la Psivologia. tiene origen en 12s siguientes altemativas:

a) Efectuar mediciones en las variables independiente y dependiente destinadas a refutar una hipót~tsis heurística.

ZhapKiel

Text Box

Tavella y Sánchez (2003) Análisis Estadístico de los Items y la Prueba Total. Mimeografiado. Escuela de Psicología, Universidad Central de Venezuela, Venezuela

b) Efectuar mediciones de variables psicológicas con el propósito de uiilizsr esos datos para deskbir, clasificar, calificar. diagnosticar y10 predecir la conducta de un individuo o de un conjunto de Individuos.

Cualesquiera sean esas alternativas darán origen a la construcción o adaplacidn de una escala psicológica para medir las variab!es de una escala psicológica para medir las variaMes.obse~aMes involucradas. Esa decisión inicia b t3APA PREPARATORIA del proceso de elaboración de la escala O

escalas, a travCs de dos actividad&:

a) Delimitación del dominio de medir (constnicción y10 variables observables) y de la pohlacidn a ser medida. cún las consiguientes definiciont3. b) Caracteñtaci6n de la escala de medición y de los objetivos que se persiguen con e!la o ellas. esto $timo en caso de una baten'a de escalas.

Cumplidos los aspectos a) y b), que acabamos de señalar, se estar3 en condiciones de determinar la naturaleza y el número de itrms adecuados .a desamollar. Consecueniemente, se inicia la izrea de Tpxatar G e!egir los Ííems que ccntendrá cada una do las escalas en constmcci6n, con la precaución de contar con el doble o el triple de los items que ingresarán en la versión final del inctnimerito.

El cuadro ilustra gráficamente este proceso en la e!apa prepantnria, se tnte de la ipreciaciCn cuantitativa de una mnstnicci6n cr Se la medidbn de una variable ohseivable, para lo cual se habr2 constitiiido un2 "UNI@Aü INTERDISCiPLINARIA' integrada por IGS investigadores o estudiosos que necesitan la escala o la batería y por .un miembro de la UNIDAD DE PSICOhilETRIA del Centro. Conviene seiíalar que en esta etapa preparatoria la pa;ticipaciór: de 10s especialistas en el domlnio de medir es fundamental, pirestc que poseen los miioamientos necesaiios para escoger las variaEes c+:rva9!es y e! contenido (í!cms) de !as esca:as.

1.2- ETA Pi4 =ORA TORIA

U.- ETAPA EXPU3XATORIA Apkación&la olas&tuna 7-- musha k~o;mói de la p o ~ ~ c i ~ n a ia cual

La etapa exploratona se caraderiza, básicamente por la aplicación de cada escala, con el doble o triple de los ítems a escoger. a una muestra infr~rrná1:de la población a ia cual esta destinada la escala. Es necesario, entonces, determinar el tamaño de.esa rruestra informal, para lo cual pesara, entre otras cosas. el grado de homogeneidad de la población destina&ria del instrumento psimmCtrico. El paso sipuiente consiste en la aplicación de la versión provísoria de cada escala a la muestra informal.

Mediante los datos recogidos y con el auxilio de un proSrama computarizado (Como Mimitem, Leílap. Mettix Engine, 'etc). se analiza el comportamiento de cada escala, tanto el Punto de vista de las puntuaciones totales mmo de los ítems, incluyendo las instrucciones para los examinandos y 10s examinadores.

El análisis aplicado a las puntuaciones (escala) proporcionará la infomaci6n que nos ayuda^ a tomar decisiones soba%:

a) La calidad de las instnicciones para los examinandos y los examinadores. b) Tiempb de aplicaaóo que demanda la escala. c) La distribuci6n de frecuencias de los puntajes (media, dzsviación típica, asimetria o Kufiosis). d) Las características de los ítems omitidos (satteados y no alcanzados).

El análisis de las items nos pmporcionará ahora. :a infomiaci6n necesaria para tomar decisiones sobre:

a) Tendencia centrzl de cada ítem. en t6minos de proporción @). Distribucibn de las frewenaas de 10s dir?intos valcres de "p". b) La variabilidúa de cada ítem expresada pcr @a] la variarka y por @qj la desviaci6n típica. C) Las correlaciones inter-ítern (9) para deteminar el grado de homogeneidad de la e-wla. d) Correlacicnes ítem-escala (rpb) y (rb) para determinar la capacidad discrimin~tiva de los ítents ?amades uno por vez. e) Comportamiento de las cpciones (alternativas) que nos informa sobre el grado de eficiencia de Ius distractores. t) Confizbi!idad de consislericia interna ae lo -!a a través de los ítenis que la componen.

Con el curso de toda infomacibri obtenida, la unidad interdisuplinaria conjuntamente con la Unidad de Psicomet~a pmceden a desechar los ítems inadecuados, ajustar las instrucciones, en resumen, efectuar tudas las modificaciones que se consideren pertinentes y confeccionar la versi6n experimental de cada uns de ias escalas.

1 . 3 ETAPA EXPERlMENTAL

m.- EXPERIMENTAL Puesta a p e b a de i adawdi f>aáavcn ióa

I . -\

1 Al iniciarse la etapa experimental se cuenta con una versi6n modificada del proyedo de escala que '

ya se prob6 en muestra informal. Ahora ha llegado el momento de obtener una muestra aleatoria adecuada de la poblaci6n a la cual está destinado el instrumento psicom6trico. Esta muestra la llamamos formal porque es el resultado de un disefio de aleatorizaci6n por estratos y proporcional. .

I '

Al terminar el tamaAo de Ic muestra conviene estaMecer cuál será el tamafio del estrato con menor número de individuos a los efectos de que en cada estrato se encuentre el número de individu& necesarios para reducir a su mínima expresión los emres típicos (muestrales) de todos los estadísticos utilizados en el análisis de la escala y de sus iterns.

Resuelto el problema de la muestra se procede a aplicar la versión experimental de la escala, siempre can un número mayor de ítems (doMe o triple) a los que quedadn en la versión definitiva.

Tal como puede apreciars. en el Cuadro III el proceso,que se currtple en esta etapa experimen!al inLoiucra los mismos análisis que hicieron en la etapa exploratoria, pero agregando la obtención de los errores típicos de todos los estadísticos que resultan de la muestra formal escogida.

Los dntos resultantes de este nuevo andlisis, en cierto modc mds ñguroso que el realizado en la etapa exploratoria, determinarán si las modificaciones a realizarse son de escasa importancia o sustanciales. Cuando son iigeras o de poca monta se redada la versión définitiva del instmmento-en construc~ón. Por e: contrario, si las mcclifiacioncs s ~ n mnsiclerables debe regresarse a la Etapa explcratoria. y. a veces. z la p~paratoria pira repetir los análisis efectuados en eilas.

1.4- FORMA DEFINITIVA

N- FORMA DEFrnrnVA F 7 = 7 1 Coni~abilidad 1 Normas 1 Validez 1

Una vez que se hzn utilizado los resultados de la etapa experimental se procede e redactar la foma definitiva de la escala (o batería), la cual se a p l i ~ r á nuevamente a una muestra fcmal o a la población a la cual está destinado el instrumento psicarn6triw con el prapósito de obtener las nomas, validez y canfiabilidad de la pnrebz.

La etapa que hemqs denominado REVISIONES se distingue de las anteriores en el sentido de que t las cuatro ya descritas sc.1 circunstanciales y no permanentes. Por el contrario. la etapa de revisiones

pemianente y a ella contribuye, de una manera u otra, no 5610 el autor o autores del instmmento sino también los usuarios.

El cuadro V puntualiza que la etapa denominada REVISIONES toma d i v e ~ s modilidades W n sea la magnitud de las revisiones y los objetivos planteados. Si las revisiones son sustanciales puede &dar el contenido (ítems) y la estructura de 12 escala .o inst~rr ient~. requiriendo un nuevo análisis que amje la información necesaria a través de la repetición parcial o total de los p m s característicos de las e!apas l. 11. III y IV. En el caso de revisiones menores, con ajustes ligeros, sólo se requerirá reiniaar los análisis al nivel de la etapa experin;ental.

2- ESTAD~STICOS DE LOS ~TEMS.

En el proceso de construcción o revisión dc un test psicoldgico, el anhlisis estadístico de sus k;rw es una actividad sumamente importante ya que permite obtener la información necesaria para evaluar hasta que punto dichos items cúntribuyen a la estmcturación de una hdecuada escala para la medición d r la correspondiente variable picobgica. (Sánchez. 3999).

Los ítems son ias midades básicas que wnfiguran el material o contenido de un' instrumento de medición. Esta unidad. o sea el ítem se compone de la formulación del problema o situación y de !a o las respuestas al mismo. Adoptan formas muy diferentes, pero en todos los casos originari una o más respuestas, que serán cuantificadas de acuerdo cur, uria fórmula preestablecida. Ejemplos:

A. El 60% de un conjunto de 39 lápices, equivalen a 18 lápices: Cierto - Falso. -.

La respuesta correda es "cierto' y a quien la responda así: se le otorga iin punto.

B. €1 60% de un conjunto cie 30 Iiipices es:

A. 100 !ápices R. 96 lápices C. 18 Iápices D. 15 lápices

La respuests correcta es la 'Cm y a quien la responda asíj se le otorya un punto.

C. El 60% de un conjunto de 30 lápices equivale a Izipies.

La respuesta correcta se produce cuando el alumno coloca 18 sobre la llnea de punios y por ello re !e otorga un punto.

El análisis de los ítems tiene por objeto ccnocer el cgmportamiento de cada una de esas unidades Msicas y el de su uc?njunto, utilizando recursos estadísticos y la interpretación de ec3 infwrnación para asegurar la v~lidez. confiabilidad, eficiencia. preúidiva. etc., del instrumento de wnstiuciin.

En ese traSajjo ncs referiremos s61o al análisis esradistico de ítems de naturaleza objetiva y. por 10 tanto. de calificación binaria. es decir, que admiten 5610 una respuecia correcta a la cual se adjudica un puntaje igua: a 1 (UNO). Cualquier otra respuesta se considera incorrecta y se le asigna un puntáje de 6 (Cero).

Una vez aplicada la prueba, se 'alifica cada íiem (1 correcto, O incorrecto) rer.wndido por cada examinado y los resultados de un grupo pueden ser presentados en una matriz items-individuos.

\

Ejemplo: Se administró una prueba de 10. (diez) ítems a 12 (doce) individuos. Los resultados fueron los siguientes:

En las hileras de la matriz se presenta el &npatamiento de cada individuo en los (10) items. La sumaioria de los valo= de cada hilela determina el pmtaje (t,) en la prueba de cada individuo. De tal manera, los puntijes totales de IGS sujetos son !OS que se preso,ntan en !a ultims coltimna de la siguiente tabla: S

fJsicometrio I - Unrdod 11 - I

Construcn& ¿e un ~~nslrumcnlo Psicomilnco. Etapas y E s r o d i ~ ~ ~ ~ ~ . ~

Las columnas de la matriz muestran los resultados por items. La suma de los valores de cada columna indicará la frecuencia ( f i ) de individuos que contestó corredamente cada uno de los reactivos. En la siguiente tabla aparecen las frecuencias de respuestas de cada item en la ultima fila:

2.7. f - Diñcuitad del ítem (p):

La aificultsd de los items es el concepto empírico que se refiere al dominio del contenido de Iá Pr'Ueba por parte del grupo de personas a las c u a ! ~ se la administró la misma. Se basa en el jmfcentaje de individuos que lo contestan correctamente. En este sentido. el mejor inciicadcr de la difiu~ltad del item es el vzior de p. el cual representa la pmp0~6r : de personas que lo mntestamn correctanieflte y puede interpretarse coino la media aritmetica dcl item. Se calcu!a ,mediante la fbmula siguiente:

C

Donde: . . f , 6. p=- freaRnaa de personas que contestaron el iiern <nrrectarrRnte

N N = número total de ind~duos que respndió el test.

Los valores de p (que oscilan entre O y 1) tienen relación inversa con la dificultad del k m . Esto quiere decir que mientras más alta es la p su dificultad es menor y mientras mas baja la dificultad es mayor. Tambibn se podría estimar la proporción de personas que contestan incorrectamente el ítem (q), cuyo valor es el complemento a 1 con respecto a la correspondiente p, es decir, 1- p.

El oden en que se disponen los items de muchas pruebas psicológicas sigue el aitsrio de la dificuitad creciente. Esta fcma de configuración de las pruebk se justifica básicamente paca evitar que las personas que se ubican en la parte baja de la dimensión m&:da se frustren al abordar items difíciles desde b el inicio de la prueba. Para efectos prácticos se manejan los siguientes niveles o categorías de dificultad:

Psicomctrio ! Unidad !l ,y Construccion de un instrumento Ps1cometnco. l 3 a p i j . E s t a d i ~ t , ~ ~ ~

Para el ejemplo que venimos analizando, los valores de p de los ítems son los presentadss en la ultima fila de la sigdiente tabla:

CATEGOR~A DE MFICULTAO

Muy diales

Debido a que el grado de difiadtad, y p r tanto. la cantidad de respuestas ccrredzs de una pmeh pueden estar influidas en gran medida por los aciertos al azar, es preciso corregir la subestimación que se le puede estar dando a la dificultad de los ítems y por lo tanto del test. Seguidamente se explicm algunos métodos para corregir la iniluencia que puede tener el azar sobre los valores obtenidos de p.

Rango de p

P { 0.20

1.1.2- í%reccio.ws de p por azar.

Un ítem binario tiene dos o más opciones, de las cuales s6lo una es correda. Cuando un individuo no Sabe la respuesta correda e intenta acertada (sea que las instrucciones se IG sugieran o no) tiene una detenninada probabilidad de obtener el puntaje correspondiente. Este puntaje ac.egado afecta !a dificultad del item (se subestima) el puntaje del individuo (se sobrestima) y por supuesto, los estadísticos del ítem y de los puntajes totales.

Si fuese posible elaborar el item de tal manera que cada opción tuviese la misma probabilidad de ser seleccionada por los individuos que no saben la respuesta correda. se podría estimar la probabilidad que tiene un item de ser acertado al azar y se podría obtener un modelo para estudiar la distribución de 10s puntajes al azar (su media y desviación típica) de un test específico. Igualmente. se podría estimar el

,k

puntaje inferior a partir del cual podemos afirmar, con una probabilidad de emr baja, que no es atribuible al azar.

Un item objetivo binano (evaluabie con 1 6 0) con sólo dos atternativas tiene una Qrnbabilidad de 0.50 (p= 0.50) de ser respocdidr, al azar por quienes no conocen la respuesta correda del mismo. Y. en general, la probabilidad de contestar corredamente por azar uii item cuya respuesta no es conocida por el individuo, es igual a l.k, o sea, el recíproco de alternativas de un ítem objetho binario.

Si k = 4, p = 0.25; si k = 5, p =O ,2C; si k = 8,-p = 0.125, etc.

Al analizar p en items binarios y de respuestas múttiples. se impme la corrección de dicho índice, Para tener en cuenta la influencia sobre el mismo de los aciertos por azar. Guilfoíd (1954), ofrece una tabla, que reprducimos. para corregir p y que resulta de aplicar la siguiente fórmula:

donde: @ - 1

pc = - pc= pmpwcih de rcqw&s r ~ ~ e c t a s cocregidas por &dos al azar.

k - 1 !F númefo de aitemat&as del km. p= p.orciónderespi;esbsaxrectas.

Tarnbidn ofrece una fh-rnula para obtener pc directaniente del número de iespuestas&-redas e inwrrecas que reciben un item:

Davis (Educitiofial Measiirement. Editor Lindquis!. pág. 280) propone una f6rmlila que toma en cuenta el númrrc de individrios que no alcanza a responder el item por falta de tiempo. La presentamos Iigzr,mente modificada para calcular p en Iugar de porcentajes:

Donde: WT 4- PT=proporci6n&-m~enhmuestaEornaiidoencwtabsmosporararyta K, - 1 o m * & d e i ~ * & t í e m p o . ..

PT = NT - NR,

ñT = el nknero de examinados en ia me&a q~e contestan e! Heira corredamente. WT= el niimerr! de examinados en h muestra que contestan incorredameife d item. Ki= d número de aitemaüvas del k m . F J r = el número de úidiuoc en ia muestra. AlRr = el n ú m de i n d i i m la rnuesúa que no akxrzxocl d item por lalla de tiempo.

Horst (19693.. al referirse a la corrección de p sostiene que la proporción de quienes conocen la respuesta correda es igual a la proporción de los que marcaron la respuesta correda, menos la proporción de quienes marcaron el distrador más atradivo. Esto se compagina con el hecho de que, en la práctica, reStdta dificil encontrar distradores para un item, todos los cuales tengan la misma atracci6n. Propone una fórmula para corregir p, sobre la base de este hecho que se da en la prádica:

'~jemplo: kem 1. Respuesta correcta B N=100.

N que ia escogieron:

Nota: Todos los individuos intentaron el ítem. -

2 1.3- Varianza del ítem.

La varianza es al índice estadístico que informa sobre las diferencias individuales en las respuestas que dan los sujetos a los ítems. En este sentido, puede afirmarse que la varianza proporciona infomiación sobre la capacidad disctirninaliva de cada item, errtendiendo capacidad di-wirriinativi como ia posibilidaci que tiene el ítem de detectar las diferencias individuales en la variable medida. De esta forma, una alta vanana indica una alta capacidad disuirninativa.

La vatiarpa de un ítem binsrio es igucl al pro0ucto dc la praporciCln de respuestas coirectas @) por la proporción de respuestas incorrectas (q), y se calcuia de la siguiente manera:

sf = p.q donde q = 1 -p

En nuestro ejempio:

Es importante destacar que mediante el calculo de la varianza a partir de la formula p.q se obtienen los mismos resultados que al utilizar la fórmula tradicional de la varianza, que se piesenta seguidamente:

*

PsicomeIria 1 - Unidad 11 1 1 Construccich de un Instrumento Psicomitnco. Etapas y fitadistims

Asi por ejemplo, si calculam~s la varianza del item 3 mediante dicha fórmula, se obtiene lo siguiente:

Los items de los tests realizan ei mayor ntímero de discriminaciones entre pares de individuos, zuanuo su nivel de dificultad es tal que son resueltos satisfac!oriamente por el SG por ciento de !os individuos. (Yeia. 1956).

Con reladón a los índices de dificultad, Yela nos dice: "La dificultad de los items es:óptima hacia el wntm de !a a m a (zona comprendida entre las ordenadas correspondientes a! 25% y 75% de individuos que lo. adertari). Ssgh esto; !os ítems deberi tener una dificu!tad de aproximadamente el 50 'por 100" (Yela. 1 S S ) .

E i l (1979) señala que los items que se encuentran entre -30 I p I -70 vienen a ser buenos did.minadores como los items w n p= -50; además demostró que con un promedio de dificultad de -50 de los ítems la pmeba resiika con una dispersión amplia de los punt~jes.

Taveiia prcocjne un ~*eric de distribución de las p para lograr una Wena distribución de puntajes totales que es ciei 25% de los items wr! p entre 9.20 y .40 , 50% eritre 3 4 2 y 0.80 y 2576 de -61 ii más. ;.en Eecerra. 1977:84 -85j.

2.1.4; Relación entre la vananza y la d;YicuYad.

Dado que en ios items Enanos, la varianza rcsu!ta del producto de la propción de respuestss w W < s w) Wr la proporcidn de las inconedas (q), dichos valores estan estrechamente relacionados con el inciicádc?r de la capacidad discriminativa de los items. En este sentido, a medida que la p del item se apnxime a 0.5 la varianza será mayor, y por lo tanto. dicho ítem tendd mayor capacidad discriminativa. Por el contrario. esta empobrece uiando la p se aproxima a 1 6 a O. Esta relación entre varianza y dificultad se aprecia más daramente en el siguiente gráfico:

22- ESTAD~S~COS DE DOS (2) IEMS BlNARlOS

22.1- i%vanvanama en&? dos Rems binafios

Representa una medida no tipificada del grado de asociación entre dos variables, o en nuestro caso entre dos Items, que resutta de la sumatwia del producto de los desvíos respecto al media del Hem, entre el número de sujetos que respondió el test; tal como se expresa cn la siguiente fófmula:

SI a esta covarianza la dividimc?~ entre sI produdo de las desviaciones típicas de :as dos series ae puntajrs, obiendiemos la correlación entre esas series de puntajes.

De tal manerz que

Si calculamos la covarianza sntre ios ítems de los ítems de los ejempios anteriores, se obtiene la siguien te Ma3iz de Varianias y Covarimzas.

Psimmetna i - Unidad I f I j Consirucci6n de nn ININmenIo Psicodrrico. EIapsy Esfadistioos

Puede observarse que en la diagonal central de la matriz anterior. se ubican las varianzas obtenidas en cada uno de los Items: (Compare estas varianzas coz las calwlzdas en los ejemplos anteriores).

Para obtener la correlación entre dos items binanos suele utilizarse el coeficiente de correlación phi.(p). Dicho eSadistico permite comparar dos variables de tipo dicotómicas (como lo son los iterns binarios). U coeficiente phi es análogo al coeficiente de correlaci6n de Pearson, por lo que sus valores varían entre -1 y +l. En este sentido. cuando se obtiene una correlación positiva perfzda (+1), todas las personas que responden correctamente un determinado item 'A'. igualmente esponden correctamente otro ítem '8'; a la vez, todos los individuos que responden errheamcnte el ítem 'A', también responden err6neamente el ítem 'a'. Par el contraric, wando se mmigue una correiación negativa perfecta (-1) todos los indíviilco.~ que responden corredamente un item 'A', resp~nden incorrectamente un ítem 'B', y viceversa. En casc de o b t e ~ e ~ un valor de cero (O) en el cálcu!o de la comlsaón, puede afinarse que indicaría que no existe ielación dlguna enire los puntajes. El Coeticiente de Correl~ción Phi se calcu!a de la siguiente manera:

Donde.- S--

'J p = - S,= Com-kruaentrebs h i y j.

S,S, $=Desvkjó,tipicatie4%emi. . * = ~ t i p i c a c í e ! f t m j .

,Donde.-

& =J$ -P,pj = b de 'indium que contestan oorrectamente a m b items. p.= p dei Rem i p,=pddítenj

En nuestro ejemplo, calcu!aremos 1as.intercorrelaciones entre los ítems 1 y 8 de la matriza con que hemos venido trabajándo:

I T E M S

S,, = 0.25 - (0.25).(0.33) = O. 17

Siguiendo este procedimiento se obtienen las siguientes posibles intercorplaciones entre los ¡ter&.

Matriz de phi I T E M S

Una correlación positiva peifeda entre dos items biriarios se obtiene cuando pl = p2 (conaiaón necesaria, pero no suficients) y y = p12 y pL = pI2. ES decir, cuando pl = = p12. f3t0 se da aandc todas las personas que responden correctamente el item 1 igualmente responden correctamente el ítem dos y. a la vez, todos los individucs que respmden erróneamente el ítem el ítem 1. tarr~bién responden erróneamente el item 2.

Una correlación negaiiva perfecta mtre dos ítercs binarios se logra cuando pl = p2 (condiciór, necesat%, pero n3 suficiente) y p12 = O. Esto .si? da cuando las personas que responden correctamente al ítem 7 responden incmrestamente el i!em 2 y viceversa.

Ejemplo:

Coíre!ación Pcsitiva Perfecla: Correlación Neaaiiva Perfecta:

~sicol~lctria 1 - Unidad 11 15 Construccibn de un Instrumento Psicomitriro. Etapas y fitad;siicos

Aunque anteriormente se afirmó que cuando pl = p2 = P I ~ se ~rodu* una correlación positiva perfecta y que cuando pl = p2 y plz = O. se obtiene una correlación negativa Perfe~ta; existen dos casos excepcionales en los que esto no ocurre. Dichos casos se presentan en el siguiente ejemplo:

Gorrelación Positiva Perfecta: Cowlación Neaativa Perfecta:

De los ejemplos antefiorss puede coficluirse que para obtener una correladón positiva perfecta no solc es necesario qiie tcdas las personas que respondimn correctamente un iiem 1. tzmbien ccnteden de fmma awrtads el item 2; sino que tambiEn es necesario que exisian sujetos que cuando respondan de forma equivocada el item í fallen en el item 2. Lo contrai~ se ap!ica para la correlación negativa perfecta.

En todo caso el signo de p está determinado pcr el signo de .Sy; y la magnitud de p. depende de la, rnagnitud.de S,,, Recuémese que al dividir Sij entre el produdo de las desviaciones de S, y S,, se transforma

'

Si a una escaia que va desde +1 hasta -1. Si S,, x SiS,. p será 1. . ..

Para poder evaluar el valor de la covarianza obtenido entre dos items, es necesario cornporarlo con el valor de la covarianza máxima que pucde darse entm dichos items. La mvirianza mihima entre dos <

ltems binanos está detenninada por los valores respedivos de p:

Donde: 4 = propoca6n de m que el Rem un d maya i d ¡ ¡ de ddiadtad. C , = Pj - Pi Pj p , = ~ d e p e r r o n a ~ q ~ e r e s p o n d i e n x i i ? ( ~ ( ~ a n e l m e n ~ r i n d ~ d e ~ m a n t a d .

Si dos items tienen p= 0.25 y p= 0.75 (iterns 1 y 2 de de la matriz con que venimos trabajando): 1

Pstcometria 1 - Unidad II 16 Corrrbvonorrrbvon6n de un I ~ e v m ~ t o Psicomhrnco. & p v y EriodLti~o~

Las covarianzas máximas que puede darse entre los ítems delnejemplo con el cual se viene trabajando. sori presentadas en la siguiente matriz:

2 2 4- Correlacibn Máxima

Una manera de interpretar q, es comparándola con la correlación máxima: este es ur? ccncepto referid3 al limiie superior de la correfaadii entre dos ítem que Cenen determinada p. En este sentjrlo, pude afirmarse que la conelaadn empírica corresponle con la conelaaór! máxima cuando &=R.

- Pj - PiPj Qi, -

SiSr

que es igual a: . ..

La correlaci6n máxima entre los items 1 y 2 de nuestro ejemplo es:

Las correiaaones máximas que existen entre los items con que venimos .trabajando. son presentados en la rnatñz siguiente:

a

Psicomelna 1 - Unidad II 17 Consrnicci& de un Inslrnmenfo Paicoméfr~co. Efapory Estadisticoa

Matriz de ohi(max)

2.3- CORRELACIÓN DEL ~TEM CCN LA PRUEBA TOTAL

En e¡ a s o de iccms bir~an'oj; y á los efectos de obtener la wrreiación de caaa iren; con el pun!aje total que arroja el test para d a uno de los individuos, se han utilizado dos coeficientes de correlación: el bisenai y el punto biserial. Mediante la información que propxcionan estos estadísticos se aprecia la denominada capacidad discnminativa de cada uno de los ítems.

23.f- &eficiente de mmlscíón punfo biserial.

Acalizarernos primero el comportamiento del coeficiente de wrreíación punto bisenal. Una de sus ventajas sobre la correlación bisenal es que media;;:e su aplicación se obtienen los mismos valores que con la correlación produdo momento de Fearson. Una de las fórmulas utilizadas para calcular la correlación punto biseria! es ¡a siguiente:

Donde:

rpb = M , -4 ~ p q M p = n * a r & i o r ~ @ > j a b s q u e a p N e b a n d i l e m .

S. M, = trdi ck los pinbjes >j de los q ~ e no aprueban el item.

st = deshada &dani de los pcnbjes X. en toda la mi& o grupo. p = p r O p W Ú h d e i O S ~ ~ ~ a p r u o b a n . q=pcopocdbideIcs ldviáws que no aprueban.

Otra de las ventajas importantes de la correlación punto bisenal es que no requiere suposición alguna acerca de la distnbuci6~ de la variable dicotom.mda. En realidad un' item binano (X = 1 6 0) representa solamente dos puntos en la linea base de una distribuci6n de frecuencias. .

Calculemos. como ejemplo, la correlación entre el item 1 y los puntajes tcfales de la matriz ítems - individuos que venimos manejando:

El rm nos pmporciona como infomaci5n el grado de relación existente entre el ítern y la prueba total. Comc plantea la diferencia en los puiitajes totales entre quienes lo respande corredanente y !os que no (Mp - Mq) es un índice de la capacidad discriminativa del ítem. Para la evaliiación de la capacidad discriminativa de los items, Ebel (1979) pmpone las siguientes categorías:

2.3.2- CoeWnte de correlación punto bismial, exduyendo el ffem conie1acior;ado. (rM ormgido)

El puntaje de un individuo en un test, surge de la suma de sus puntuaciones en cada uno de los Hems. Por lo tanto. la varianza de los puntajes tatales no es independiente de la varia- de cada uno de los items tomados individualmente. Esto determina que la correlación entm ifem y puntaje total sea Stqeri0r

*

. . Psicornelria 1 - Unidad II 19 Cons/rucción de un Instrunienm I'sicomelnco. Etapary Es~adisr,cos

al real. En otras palabras, la lógica del estadistim esta en que al estar incluido el ítem en el puntaje total, hay una sobreestimación en la relación cn:re el ítem y dicho puntaje; 'por 10 cuál necesita corregirse dicha sobreestimación para obtener el verdadem valor del r-. El aumento es de mayor magnitud cuando el númera de items es pequeiio. Por lo tanto, la corrección sólo adquiere importancia. cuando el instrumento cuenta con pocos items o cuando el subtest que se analiza. desde este punto de Yista, cuenta con pocos Items. Se calcula median te la formula presentada seguidamente:

En el caso del ítem 1 de nuestro ejemplo. su'correlación sería la siguiente:

2.3.3- Goeticiente de correlación biserial.

Se aplica cusndo, pcr a!guna ~ z ó n , una dc, las dcs van'iblcs sontinuas y ncrma:es se dicotcjmiza. Pero es importante destacar que el requisito de la distribuaón normal se refiere a la población, aunque en la muestra o grupo utilizado, !a variable presenta una distribución asin6tnca o platikúrtica. Si no existen evidencias suficientes acerca de la forma de la distribución en la población de la variable a dicc!omizar, lo prudente es preferir el coeficiente de wrrelaci3n piin!o biserial. Debe advertirse, adeniAs, qua en distribuciones bimodales, el coeficiente, de,correlacibn biserial puede alcanzar valores que exceden a 1 .OO. En general, no es aconsejable salvo que razones poáerosas irripongan su cmpleo.

Se obtiene con la fómu!a:

Donde M. Mq, p.q y 6 poseen el rnkmc? s~nifictWo que los mismos símbolos ~$ilizados en k~ fórmuh de la mire:ación punto biser;'al.

y= valor de la ordenada en la curva de distribución normal, en el punto de la abscisa que divide a p de q.

El error standard de la correlációr, biseiial puzde obtenerse mediante la siguiente fórmula:

De todas maneras. conviene advertir qcie :a correlación biserial es menos confiabie que la comlación producto momento de Pearson. En cuanto ai procedimiento más aconsejable para dicotomizar la variable, es obtener la mediana de la distribución y euxger como punto de separación el coincidente con dicho estadistim. Esto pennite que p = q, con lo dll el fador pqíy alcanza su máximo valor. La tabla siguiente ilustra este aserto:

Valores de pqly .para distintos valores de p:

Pstcomefrio f - Unidod If 20 Construccron de un Instrumento Psicometricu. Etopary &sto¿isticos

Utilizando esta informadón y ia que 30s proporciona la tabla siguiente. permite señalar una modalidad interesünte de la correlación biserial comparada con, la de punto biserial.

\'alores de p.q para disiintcs valores de p

La diferencia entre los valores de W y cuando p = 0.5 y p = 0.9 es de 0.1049, en tanto qile la diferenci2 entre los valores de p.q mando p = 0.5 y D = 0.9'es de 0.2009. Esto indica de manera dara, que !a cocela~ibr' biserial es nienos'sznsi51e a las diferencias que se regMan en las distribuciones de grupos o muesms diferentes. Las consecuencias para el analisis de ítems son evidentes. La dificxltad de un ítem puede variar sensibiemente en muestms al azar de una misma poblaubn, por el fenómeno de la fluduacibn de ¡as mbestras.

Cuando se obtienen los' índices de difiwkad de los Rerns, los mismos f ludua~n, con sus efectos sobri? los valores de p. de manera tal que un mismo item puecI.de exhibir diferentes hdices de capacidad discriminativa en muestras diferentes'de una misma población. Cuando se emplean varias muestras de una misma poblaci6n para deteminar los índices de capacidad discriminativa de un instrumento psicométrico, es preferible utiliza el coeficiente de correlación biserial. Si, por el contrario, el tamafio de la muestra por azar simple o de la muestra estratificada, es grande. entona% debe preferim el coeficiente de correlación punto biserial.

2.3.4- El Comportamiento de los DisCradores.

4

Los distradores son todas tas aíternativas de un item binario. diferentes a la opción correcta o Clatre del hem. El an6lisis de I'os mismos es de suma impoiiancia ya que nos puede indicar si existen problemas en la construcción del ítem. como por ejemplo: colocar dos respuestas correctas, incluir una alternativa que no se entiende o que no tiene sentido. entre otros.

Los distradores de un ítem pueden ser analizados en base a dos indicadores: los valores de Mp, Y los valores de la p de: item:

Psicomerria 1 - Unidad 11 21 Cons~ruccron de u n Inslrumenlo f's~conielrico. Eropos y Estadisticor

- Análisis de los Distractores en Base a los Valores de MP

Mp representa la media aritmética de los puntajes de los sujetos que seleccionaron una o ~ d b n determinada. En este sentido, cuando uno o varios de los distractores del item poseen un valor de Mp superior 81 de la respuesta correda. quiere decir que'el o los distractores están concebidos de tal manera que los alumnos con mayor capacidad se siente, en thnino medio. atraídos por ellos. Esto podría implicar que el ítem posee mas de una respuesta correcta, por lo wál debe ser cometido a revisión.

Aquí se cibserv claramente que el distractor P está concebido de ta! manera' (o el item y sus distradores) que !os alumnos superiores en capacidad al tém~ino medio se sientes a t~ idos por él. W.o impmz la iñvisióii del item. Estas situacicnes ponen de re!ieve la necesidad de contar c m una cantidad mucho mayor de items (el doble o triple) que el ncmero proyectado para la prueba definitiva. La revisión de un ítem puede modificar sustancialmente la distribucón de los individuos, que no mnocen la respuesta, en los diferentes distractores y aumentar o disminuir la proporcíón de Ics que cligen la respuesta ccrrecta. Si se disponen muchos items, es posible eliminar aq~ellos qus presen!an czracterísiicas no deseables.

Veamos el siguiefite caso:

, .En casa contrado s r . impne su modificación y aueva zplicación experimental, pu-S las

consec~encias de la revisión de un item sor: dificiles de prever, en genera¡.

Aparentemente existiría otra iitemativai ~qilizar items con un mayor niymero de distradores de los que i uqo se adoptada para la prueba definitiva. Sin embargo, cuando sl_ipríniéramcis Íos distfacto~s indeseables, no sabriamoc.cómo se dist6boirían los ali~mnos, en los definitivos. al desapa~cer aquelios.

E (me-)

40

526 A

I -

% de idhiáuos que exogen altemahas:

Wia M d punta+ totd dri g ~ p o de indiiucs F que cogieran ias akernah

- An,llisi.s de los Gistradom er! Base a los Ualor~s di? D. Y ..

Te6riczmente, todos los distradores deben ser igualmente atractivos para aquellos sujetos que no conocen la respuesta correda, es decir, todos deben tener la misma probabilidad de ser seleccionados (deben ser eqiiiprobables). Por ejemplo:

A

10

kern con p = 0.40 #

Respuesta Correcta A: 40% de los individuos la escogen. Distrador 8: 15% de los individuos lo escogen. Distrador C:15% . ídem. DiArador D: 15 % ídem. Distrador E: 15 !+ ídem.

i En h práctica no m'tta fácil conseguir un modelo de esta dase para los kems de un test. Por lo

tanto pueden presentase diferencias apreciables en las propordones de Ips individuos que eligen las diferentes altemativas erróneas.

O

18

8

20

31 3

c

12

17.3 1 54.8 s.1

En este sentido. cuando el valor de p de alguna altemativa es evidentemente inferior a la del resto de Ics dislractores, puede afiimarse que 91 mismo es 'poco atractivo'. y por tanto debe ser revisado o eliminado del test para ser sustituido por otro. Por el contrario, cuando alguna de las altemativas tiene un valor de p excesivamente alto en comparaci6n al resto de los distradores. puede decirse que el mismn es 'muy atradivo', por lo cual debe someterse a revision. Lógicamente, es imposible delimitar un valor determinado de p a partir del cuál afirmar que una altemativa es muy'atradiva o poco atractiva. ya que los valores de p de !os distradores van a depender del valor de p de la opci6n correda. (mientras mayor sea el la p de la respuesta correcta, mencres serán las proporciones del resto de las alternativas).

3.- ESTAD~TICOS DE LA PRUEBA TOTAL

Sumado al andlisis de cada ítem. las pruebas psicológicas deben ser previamente analizadas como conjunto antes de establecese como instrumento de medicióii de una variable de?enn:nzda. Los estadisticos de una serie de puntajes provenientes de ítems binarios dependen directamente de los estadisticos de dichos items, incluyendo el número de ellos.

A continuación veremos cómo 13 media y la varianza de un conjunto de puntajes de un test depende de la media , vananza y covananza de los ítems. El análisis general de la calidad y de las características de la prueba puede realizarse en base a los puntos que des~,iSiremos seguidamente

3.1- DIFICULTAD DEL TEST

Como se mencionó previamente, la dificultad es el concepto empírico que hace referencia al grado en que dominan la prueba las personas a quienes se les aplica. Er! la medida er! que mayor riúrnero de personas conteste corredamente un mayar número de ítems se dice que la prueba es fácil pam dicho grupo; y al coctrario, si pocas personas logran contestar corredamente los items de la prueba, se dice que esta es dificil para el grupo. De es?a forma, pdernos obtener el valor de !a dificultad sumacdo los valores de todas las p de los ítems (proporción de sujetos que contestan corredamente), y10 calculando la Media Aritm6tica de los pun!ajes obtenidos por el grupo- A medida que la media es mayor. la dificultad de la pnieba es menor. Veamos dichos cálculos en el siguiente ejemplo:

No obstante, hay que tomar en consideraci6n los siguientes factores que influyen en estos estadísticos para ponde'rar la dificuttad de la prueba, especialmente cuando vaii a ser comparadas dos o más pruebas en cuanto a su-dificultad:

a) DificoiYad de los Items: 8i un test incluye ítems con p bsjas (difíciles) evidenternenie ¡a Media AritmBtica será baja. Si l i s p soti altas (fáciles) la niedia será al!a. MAS exactamente: .

Si tenemos las siguientes matrices ítems-individuos:

TEST A: TEST 8:

En el test B las p son más aitas y Mb > Ma. El valor de la media aritmetica de un test está deteminadb por los iridices.de dificultad de !os ítems que contiene dicho test.

bj Número de items: Al haber mAs íterns en una prueba la inedia aumentará necesafiarnente, por ello se debe reladonar el número de ítems con el índice de dificul:ad de los ítems porque- si? podría .estar incumando en errores cie sub c s b r e estimací6n. No es lo mismo referimos a m s M x = 20 cuando el númem de 'tenis es 180 o cuendo &e es de 50. Evidentemente para el grupo del p i i : i ~ r caso (10C ítems) la prueba fue más dificil. Si se agregan ítems a un test, la media de la prueba aumentaría (siempre que p>O) poque como ya vimos Mx=Cp.

c) Tiemm de administración de la wueba: Generaimente toda pnieba tiene un ,limit2 de tiempo. Hay que tener en claro cuales son los propósitos del test poque existen diferencias entre :as pruebas de velocidad y las de coiiccimiento. Si el tiempo es demasiado corto, el test se transformard er: una prueba d% velocidad. En un test de velocidad ningún examinado tiene tiempo para conteslar todos los ítems. En cambio en un test de potencia el factor tiempo es de importancia secundaria y se establece un límite de tiempo suficientemente amplio para contestar todos los ítems de la prueba.

4

La frecuencia de personas que no alcanzan a contestar los ítems finales de un ;.%si es mayor en los test de velocidad. Por lo tanto. en los test de velocidad, los ítems finales de la prueba tienen una dificuttad . alta poque muchas personas no alcanzan a contestarlos. Si se hubiese dado un tiempci mayor, la dificuttad observada disminuiría. Asi mismo, se obtienen medias del test bajas cuando el limite dt! tiempo es corto; al aumentar este limite, la media aumenta.

, . , . ' . . . . . .

. . . . Psicomc~ria I - Unidad 11 4 Construcción d e un InsIrumenIo Psicomktrico. E ~ a p s y E s ~ o d i ~ < i ~ ~ ~

d) Número de oDciones IK): En la medida que hay mas altemativas en los ítems, el test se vuele mas difícil. A medida que el número de alterativas de los items es mayor, la probabilidad de acertar al azar es menor. Si dos test (X e Y) tienen un misno número de ítems (n=100), pero c m diferente número de alternativas [kx = 2 y ky = S], como la mbabilidad de contestar cada ítem del primer test es mayor (h = 0.50 y p, = 0.20 ; px> p,) la media de este test contendrá una mayor proporción de puntajes al azar.

La media de los puntajes al azar es igual a: M=- = n x p -; es de 50 para el test A (1 Wx0.50) y de 20 para el test 8 (103xü.20). Si se nos informase que ambos test fueron administrados a un grupo y que se obtuvo una media aritn?ética de 50 en ambos. podemos concluir que el test A fue mas dificil !a pesar de que tienen la misma media) pues coincide con la media que hubiese obtenido un grupo de sujetos que mntestase todos los ítems al azar; en cambio el test B supera ampliamec:e su media de puntaies al azar y la diferencia entre Mx y la M azar puede ser atribuida a la variable que mide el test.

Con el cbjetivo de riiinimizar la infi iiencia de los factores mencionad~s, especifbmente el numerc de íteins, es adecuado utiiizrir como indicador de la dificu!!ad del test. la Medra Rilm6tica de los valores de p obtenidos en cada item, tal y a m o se muestrz en el siguiente ejemplo (calculado can los datos de la matriz del primer ejemplo):

L6gicameate. si promediamos los valores de p er! vez de sumarios al calcuiar le dificultad de la prueba, el número de items no debería irifluit en dicha dificultad.

3.2- CAPAClDkD D!SCRIhf!NATIVA DEL TEST

Siendo uca de las finalidades del test psico!bgicr, la de obtener una desApción de la característica. Sue se eA4 midiendo tal y corno S? da en ia realidad, es de suponer que dicha característica presentak 3erta var¡abi!idad eii !a población, y si una pmeba logra una a!ta dispersión entre los puntajcs estará a SU

vez logrando una satisfactoria descripción de las diferencias iridividuales, lo cual equivalaría a dear que el test posee una optima capacidad para discriminar. (Sanchez, 1999).

El iamaño de !a varianza de la pmeba puede utilizarse como indicador de su capacidad distxiinii~ativa. A rneCida que la varianzs del tes: sea mayor, mayor será la capacidad disuirninativa y vifeversa. Ei hech de que e: valor de la varianza se tome alto o bajo va a depender de: (a) la variaoza de cada ítem 0. @) las covarianzas entre los ítems (9 y (c) las intercorrelaciones entre esos iterns. La fórmula para calcular es la siguiente:

El valor mínimo de sx2 es O (nunca es negativo) mientras que la vaflanza maxima se obtiene cuando las ccvarianzas alcanzan su mAximo valor ( S, A, dado determinados valores de p de los items.

, - Entonces, al retomar ciuestra definiaón de cápaadad discn'minativa debemos señalar que las

covarianzas entre los ítems son sus principales indicadons y tambien es de hacer notar que la relación entre estos dos conceptos en la prádica obedece a una funcidr! lineal, es decir. a mayor wvarianza, mayo1 capacidad disuirninaliva de la prueba y viceversa.

Veamos los siguientes casos:

TEST M: TEST N:

Veamos a continuación las i.espe-\~as matrice de varianzas y wvarianzas:

TEST M:

1 ITEMS 1

TEST M: ---

2 ~ S J =0.14+0.22+0.25=0.6I

2 c Sij = (2x4056 - 0.085 - 0.0 165) = 4.6 1 2 2

Sx = c S j + 2 x S j j =0.ó1+(-0.61)=0

TEST N:

1 ITEMS 1

TEST N:

En el Test M C.$ = 2CS, (sin tomar en cuenta (11 signo)y la S: .=O. Este test no tiene ninguna \

capacidad disaiminativa (observe que todos los sujetos obtienen igual puntaje).

Psicometna 1 - Unidad 11 26 Construccibn de un Instrumento Ps~comelnco. E t a p i y EstadisfiCO,

En el Test N las covarianzas son las máximas (S, = S i j d y se obliene la varianza total maxima (Si-) posible con tres items cuyas p son los indicadores (0.17, 0.33 y 0.50).

De esta manera conduimos que a mayor wvarianza. maycr intercorrelación. mayor S: y, por lo tanto, . mayor capacidad disuirninativa de la prueba.

Una mejor discaiminación a lo largo del continuo se logra cuando la forma de distribuciór; de los puntajss es sim6trica y mesokúrtica. Esta se obtiene si se incluyen en la prueba items con índices de dificuttaa moderados o con vaid- de p graduadas (2546 con F, < 0.40; 50% ccn p entre 0.40 y 0.60; y 25% con p > O.!X) y con vananzas interitems íS,J wyos valores se aproximan a sus "covarianzas, máxiiiias" (S i jd .

Para cier!as aecisiones intemsa disuiminar a!gún grupo del conjunto de sujetos qae se examinan. Por ejemplo, se quiere seleccionar el 10% superior (aquellos sujetos que obtienen un pcxentil igual G superior al 90). En este caso no se requlere un test que discrimine a lo largo del continuo, sino en ese punto establecido. Si qcvremos discriminar esos sujetos superiores. incluiremos en el iest items tari dificiles que sólo ellos lo respondan ccrrectarnente. Más exactamente. el tes! debe estar ccjnfonado con items cÜyo indice de r'ificul?ad esté cercano a la proporción de selección.. Er: nliestro ejemplo, la proporción de selección es de 0.10. se requieren ítems con p = 0.10.

Guilford (1954) distingue dos clases de fórmulas para el puntaje de un Individuo: las a priori. destinadas a corregir los efecios del acierto por azar sobre el puntaje total y las empiricas, desarrolladas pan maximizar la. validez de un tea corno predidor de un criterio.

La fórmula m& comente para mrr&ir los puntajes originales. pan tomar en cuenta los acr'er!os al azar es:

W Donde:

x , = R - - - >C = pmtaje áei i d ¡ wrregido por azar. .k - 1 W = núnero de respwsbs incwrectas.

ñ = n ú m de respwstas corredas.

k = número de aitematbas dñ' item

La í6rniula supone que iodos los individuos que ignorar? 12 respuesta correcta a un ítem Intentaíi suerte tratando de acertar p r u a r y que todos 19s distraztores son bualmente atractivos. Esta sítuación dificilmente se presenta en la pz4dica. En virtud de las diferencias individuales frenle a un test. hay casos on que la fórmula comge con exceso y en otros se da lo contrario.

1) Supongamos que uri individuo no conoce la respuesta correcta a un ítem dv alternativas mÚWplcs, pero que uno o mas de !as attemativas puede ccer fáaimente descartadas. Si e¡ ítem tiene cinco d!emativss, al haber descartado una, adivinará entre cuatro y p será 1/4=0.25, de acertar por azar, en lugar de ~ 0 . 2 0 . Si dos de estas attemativas son descartables, el valor de p será igual a 0.33. Observando ¡a ecuación sé advierte Que tal como funciona, en eslos casos, la corrección es menor de lo que debiera ser.

2) Si las alternativas de un ítem objetivo scn demasiado atradivas, es muy probable que los . alumnos buenos fallen. aunque no adivinen, aumentando con ello el número de sus respuestas inarredas. Pero estas respuestas incorredas no son el produdo del azar, pero entonces la fórmula sobrecorrige. al considerarlas como tales.

De todas maneras. el uso de la corrección de los puntajes por efedo del azar es recomendable, Pues su probabilidad no queda eliminada por cualquier tipo de instrua56n que'se formule a los examinados. Atn con buenas instrucciones, en el senüdo que desalienta los adertos por azar, si se intmduce el lador

Pskometriu 1 - Unidad 11 27 Construcción de un Iruír~mcnto Psicodtrico. ~tap& y fi~adistico~

limite de tiempo o no se introduce. siempre puede darse esa tendencia. El lector puede preguntarse ¿por qué se imponen límites al tiempo en los tests de dificultad. Uno de los motivos es disminuir la inversión del tiempo que demanda la aplicación de un test. En nuestra opinian es lamentable que se invoque esta razón, pues la medición suele tener consecuencias imponantes para quienes sor? evaluados ae acuerdo can ellas. Otra razón radica en la necesidad de obiener una distribucibn aproximada aormal con los puntajes de un test. Cuando dicha distribución es asimetrica negativa es posible en muchos casos, corregirla acortando el tiempo de la prueba, con lo cual el test se hace mas difícil.

Desde mirchos puntos d é vista este recurso es ilegítimo y debiera evitarse definitivamente. Si los ítems escogidos no logran disuiminar a lo lawo del continuo, como lo desea el autor de una prueba, lo corredo es reemplazarlo por otros.

Aunque se tomarac todos los recaud~s del caso. no siempre se logrará que la suma de las respuestas correctas e incorrectas iguale el númeic de ítems que ccjntiene el Por lo tanto, como lo advierte Gulliksen (1974) y o:ms autores. wando el número de ítems no respondidos varia considerablemente de un2 persona a otra, el pur32je corregido de cada persona puede obtecerse con la siguiente iórmrile:

B= no rcspmdidos. O= leídos, pero no contestados.. U= e9 intentados por fa!ta de iiempo.

De acueido con Sánchez (1999) en el abordaje teóricc de la variable medir por uri test se enuncian, implícita o explicitamente. hip6tesis sobrp la forma de distribución de esa variable en la pblaaón. Este mncspto esfa rrlacjonado con la ~presentadCr! gráfica de la distribución de frecueticias de los puctajes. Existen dos aspectos, inds.ndientes entre si, que describen la fwma de la distribuabn y que seron expkados seguidamen!e: ¡a asirnetrfa y la kurtosis.

La dimensión sicetría-asirrietría de una Eyun se refíere al gíacio en que coinciden geometricamente partes de un todo. En el caso de la distribución de frecuencias de los puntajes obtenidos por los sujetos en ur! test. la simetris ',+a= referencia a la comsponds~cia; en la forma de la parte supiicr de la distribución (cola derecha) con la parte inferior (cola izquienia) tomzndo corno eje una perpendicular trazada desde el punto correspondiente a la media.

Una distribución dc pun!ajes. puede S r simétrica (como en el caso de ia distribución S de la Figura 1) o asim4trica (ramo la distrib~ció~ A)- Ciando no existe esa mrrespondencia se dice que hay asimetría, que puede ser positiva o neg'&ra (Ver fqura 2). -

La estimaci6n del índice de asimetría (a, ) se hace de la siguiente manes:

Psicomemia I - Unidad II 26 Conrirucci& de un Instrumento Plicomeirico. Etapas y Estadisticos

Figura 1:

Figura 2:

r - Skewness- - i.W

F--,

-3 -2 - 1 O + 1 +2 + 3

La distribución es simétrica cuando la medía de los desvíos al cubo @x3!n) es cero (O). Si es diferente a cero, la asimetría tendrá el sigrio de esta media. Igualmente, e! tamaiío de esta media detemina el grado de asirnetrla. Cíiándo la asiníetrfa es fiegaiha la 'co!an !arga de la distribución está ubirAa hacia los puntajes m3s bajos. Se puede decir que en este caso la prueba es fASI pan el grupo. N contrario, cuando es positiva, la cola larga la encontramos en los puntajes mas altos. En este caso, la prueba ha sido dificil para el grupo.

Como se dijo anteriorniente. se obtienen di¡"bucion& sim6t"cas de puntajes cuando se balancean ias p de los ítems (25% con p 0.40; 50% mn p entre 0.40 y 0.60; y 25% con p > 0.50). En general si el : . Promedio de las p es de 0.50, (kji tiende a O, y por lo tanto la distribución es sim6trica; y la prueba es

t moderadamente difícil, Si el promedio de p es mayor que 0.50 (&) tiende a ser menor que O y, por lo tanto, , la forma de distribución es asim6trica negativa; la prueba es fácil para el gnipo. Si el promedio de p es menor que 0.50. (k3 tierde a tener un valor mayor que O. o sea, que la forma de distribución es asim6Gca

positiva; por tanto. la p ~ e b a es difícil para el grupo. En conclusión, el índice de dificultad de los ftems tiene importancia en la foma de distribución de los puntajes y para la dificultad de la prueba tota!.

Este cuncepto se refiere al grado de curvatura (o achatamiento) de la forma de distrib~ción de los puntajes. producido por la tendencia de estos a distribuirse en foma pareja a lo largo (achatado) o por - -,

empinamiento en cierta región de la escala. Si se p r e ~ n t a esa foma apuntada, la forma de dlstribuci6n * - tenderá un alto grado de curvatura (Laptokiirtica). Si su distriSuci6n es pareja en lz amplitud de la escala, el grado de xmatura es leve y más bien !a encontramos schatada platikúrtica). Entre estas dos existe un gmdo moderado de curvatura que corresponde a las distribuciones Mzsokúrtica. En la Figura 3 se ilustran los tipos de cuvas antes mencionados.

El grado'de achatamiento (e) se p u d e estimar de la sisuiente rianera:

Si el indice resulta positivo nos informo que la distribución es Leptokúrtica. Si a 4 -0, la distribución es Mesokúnica. Si el índice resulta negativc la distribución es Platikúrtica. En la figura 1 la distribudón A es muy Leoickhtica, en cambio la distribiición 6 es lgvernente PlatikurZira.

Generalmente la di-y>ersión de los puntajes es mayor en las distribuciones Platikú~icas. Una mayor varianza..esta relacionada con altas covananzas (w e intercorrelaciones (L) entre items. Podemos concluir que t es i que contengan fiems con atlas covarianzas producen una alta dispersión de los puntajes y ksta se relaciona con formas de d ibuc i6n Platikúrticas.

De abemo con Sánchez (1999). una buena discriminacii)n a lo largo del continuo se logra con una distribución simetrica y mesokúrtica. Esias caradedslicas se asocian a tests con dificultad moderada, t promedio de .valores de p igual a 0.50 y moderadas covananzas Inter.-items.

3.5- HOMOGENEIDAD DE LA PRUEBA

Un test pafedamente homogeneo de acuerdo con Lxvinger (1947, C.p. Guilford, 1954) es aquel que mide un fador común en todos los sujetos y en todos sus ítems. Un test. perfectamente heterogeneo es aquel cuyos ítems son independientes estadísticamente, es decir, cada item mide algo que no miden los demás. Son deseables test homogéneos va que permiten una interpretaci6n ds las puntuaciones del test relativamente sencilla: sujetos con el mismo puntaje en un test homogt5nco probablemente tienen un grado similar de habilidad en el área medida; sujetos con el mismo puritaje en un test hetrogenco pueden tener habilidades diferentes. (Cohen, SweFdlik y Phillips, 1996; c.p. Sánchez, 1999).

De esta forma, para considerar como máxima la homogeneidad de una pnieba, debe da= la condicidn de que los sujetos qus responden corredaniente los itenis de mayor dificiiltad deben hacedo igualmente con los más fáciles. Clianto niás un cor;junto de iiems satisfaga &la condición, m4s hornogeneos se consideraran. Esta situación descrita anteriormente nos da lo que Gurirnan ha denominado un 'simplexm. En thninos de la teoría de Guttman, tal si;uaci6n nos prcporciofia lo qué @ría considerarse una escaia perfecta. El la siguiente matriz iterns-sujetos se presenta esle caso:

En este caso, las covananzas ob?enidas (S,,) carrespoden con las covananzas máximas (Sq ,,,& y se obtiene la varianza maxima del test constíluiao por n ítems cm de?erminados valores p (0.32, 0.83, 0.75, 0.57.0.58. 0.50, 0.42, 0.42, 0.33, 0.25). Aunque no es de espera= que el simplex perfecto se nos dé en la práti~ca, puede ser considerado un ideal a alcanzar.

Horst (1366) propone la siguiente fórmula para estimar la homogeneidad de una prueba: S

Dade: 3; h, = S: = varianraoc4mida \

=vPrtriamWmc Sr(-,

Psicometria 1 - Unidad 11 31 Construcdn de un Instrumento Psicomefnco. Efapas y Erradistims

2 La varianza máxima , de la f6miula anterior puede hallarse de la siguiente manera:

Cuando la varianza del test es igual a la varianza máxima del mismo, la homogeneidad es la más alta (+1) . El valor mínimo la homogeneidad de la prueba por este procedirnicnto es cero (O).

El concepto de homcgeíieidcrd ha sido a menudo confundido con de cc'nfiabilibad de ccnslste~cia intema. t-lorst (1 966) ssñala que es importante dist',nguir.entre estos dos conceptos. Los iterns pueden tener baja intercomlación poqze son inconfiables c bien porque son he!erogéneos (nc midvr! la misma cosa). En todo caso. !GS ítems c m alía intemrrelaci5n son, por dofinicibn. items homcgeneos.

Similar confusión han preseritado !os conceptos de homgzneidad y pder discriminativo de los ítems. Eri general se dice que un ítem posee pder discriminativo cuando tiene alta correlacibn con el puntaje total: esto simplemente significa que un item tiene un ano grada de homogeneidad con e! resto de los ítems.

EI? t4rminos generales se puede wnduir qJe a mayor covarianza. mayor es la varianza y por lo tanto mayor homogeneidad. Igualmente, a mayor covarianza, mayor intercorrelación entre los items y par lo tanto mayor confiabilidad de corisistencia intema. Tests altamente homogkneos tienen aHos índices de consistencia intema.

Se &nsidera deseable que los tests sean,homogkneos por diversas razones:

yr Psnniten una interpretaaán m& racional de los puntajes. ry Perniteri una mayor dispersión de Ics puritajes. y Permiten una mayor cocfiabiIidad.de contenido (de consistencia interna).

3.6 CONSISTENCIA INTERI'JA DE U PRUEBA

Knder y Richardson (1937, c.p. Magiiussor;. 10C5) desarrollaron un procedimiento de confiabilidad de consistencia i~terna de la p ~ e b a hsada en la ejecusi5n de cada ítems. Este coeficiente de cmfiabilidad es la media de todos los coeficientes de confiabilidad de las n posibles divisiones por mitades (Cronbach, 1951; c.p. Magnusson. 1905).

,% . Conviene en este punto recordar que la varianza de los puntajes totales &un test compuesto por

ftems Mnarios es igual a la sumatoda de las v a r i a m de los items más dos veces la sumatoria de las covarianzas.

I'srcometna 1 - Unidad 11 j_' Construccron de un Inslmntenlo I'sicometric~. Ecapas y &tadirticos

Si despejamos el t&mino de la wvananza de los ítems tenemos:

Se observa que Cste es justamente el numerador del segundo t&mino de lz fórmula 20 de Kuder- Richarson presentada anteriormente, el cual presenta la covarianza de los írems. Es la covarianza de los items la que constituye varianza en los índices de confiabilidad de consistencia interna. Al dividir este termino entre la varianza total se satisface la definicjón basica de la coiifiabilidad: proporción de varianza total que es varianza verdadera. Visto de otra forma, m e cociente nos informa sobre la proporción de la varianza total que está consthido por las covzrianzas.

Ei fanior rún-1 es una corrección qc.5 se introduce para tomar en cuenta e: hecho de que el numerador del segundo término (las zovarianzas) nunca podrá alcanzar el monto de S: pues nunca será cero y, por consiguiente el valor de la iracción no podría llegar a í.

Para el cálculu de este weficierite nos podemos basa; en !a matiiz de varianza v cova;ianza. En nuestro primer ejemplo:

Matriz de s2j y Sij T E M S

Se observará que los estimados de confiabilidad de consistencia interna, tales como los obtenidos a {!aves de las fórmulas de Kudei-Richarson están basados en la covafianza entre los Items. Como se sabe, la covananza es mayor cuando los lierns son 6e igual dificultad. Por consiguiente, la confiabilidad de consistencia interna es mayor cuanto mas homrgéneos sean los Hems y cuando mas pareados sean sus t índices de dificultad. Las fómulas Kuder Richa ,+m están basadas en el supuesto de que los items tienen similar grado de dificultad e intemrreiaci6n. Cuando éste no es el 'caso coeficiente obtenido a través de dichas f6rmulas se subestima la conf~abilidad.

. . . . . .

Psrcomeln'a 1 - Unidad 11 24 Construcción de un Inslnuwenro i'sicomerrtco. Etapas )rEstadistico~

b) Varianza especifica: que es exclusiva de este test y no la posee ningún otro.

C) Varianza de error.

La varianza común y la especifica constituyen varianza verdadera. La validez'criterial está basada en la vananza común compartida por el test y el criterio.

En getxrai se ha cmsiderado que la validez m'teriai de un test, permailecen constantes todos ¡os restantes factores, es directamente pnporciona! a su mnfiabilidaa. Cuanto más confiabla es un test, más válido seh e¡ mismo Cuando mayor sea la varianza de error da un test mefios cabida habr3 para la varianza de factor común y &a es la fuente de la validez.

Existen sin embargo, importantes exwpciones a la relación citada entre validez y confiabilidad. Si un test es hetercgérieo, pudi6ramos tener una muy baja confiabilidad de consistencia interna. y sin embargo, urja muy alta validez aiterial. Si un test es homogeneo, sena posible incrementarsu confiabilidad sin afectar su validez. La canfiabilidad incrementada pudiera significar la decisión de varianza er: un factor corníin el cual F.O tiene rela66n con ei cr3eric. La adición de varianza de factor común a un test, inci-ementará lb validez criterial del mismo, solo cuando ese ntievo tipo de vafianza esie iambién presentada en el criterio.

Si no hubiera varianza válida en un test para empezar. ningún incremento de la confiabilidad le dará validez, a menos que la varianza adicionada este en relaci4n con ei uiieiio.

. . , Les objeWos de la confiabi!idad de consistencia iniema y de ¡a validez cri!erial pueden a veces ser

incampatib!es. Cuando vamos a u'dlizar m soco t cs? y deseamos que este psea alta confiabiiidad de ccnsistencia intcma a ia vez que buena validez @.erial (predictiva o concurrente). podemos encontramos con metes incompatibles en la %lección del fems que favorezca ambas condiciones.

Para alcanza;. la máxima cunfiabilidad de consistencia interna se requiere de items homogéneos y de similar grado de dificultad. (Se recordará que estos son los requisitos para estimar la confiabilidad a través de la fbrmula K~der- Richarson). Para xáxima va:idez &,erial se requieren k m s heterogéneos (que midan !os diversos íast$es presentes en el criterio) y de diversos grados de dificultad.

'Esto último es deseable a fin de ordenar a los individuos a lo largo de un continuo de habilidad er, lugar de obtener una distribución en forma de 'U'.

De lo dicho anteriormente se desprende que, si se va a utilizar un solo test para predecir, es preciso llegar a una so!udón cc?nciliatoi<a. enbe las metas de coiifiatjiiidad y validez. Guilford (1954) cita tina iíivestigación de Tucker quien demostró que items con intercorrelaciones moderadas (r* entre -30 y .80) son capaces de proporcionar una confiabilidad satisfadoria y una validez adecuada.

Sin embargo, la solución más satisfactoria para hacer compatibles las metas de la validez y confiabilidad la ofrecen \a batería de pniebas integradas por sus test altamente homogéneos y confiables que midan cada una un cspedo diferencial del criterio. Es muy recomendable que cada tes! este destinado a medir un solo factor común.

t Este test debe 'ser univoco, su contribua'6n Jebe ser Única. En esta forma se garanüza una

intercorrelación mínima entre los test. lo cual satisface uno de los pn'napios más Importantes de la regresión múltiple. El test univoco tendrá una correlación mas baja con el cnterio que el test heterogheo, pero lo que

IJsrcomeiria I - Unidad II 35 Consiruccr~n de un lnsirurnenio I's~coméinco. Eiapas y I.:siadifirco,

se pierde en validez en un solo test queda más compensado al formarse la batería que cubre los diversos factores a predecirse en una fomia más ncional.

. .

6.- PROCESAMIENTOS ELECTRÓNICOS

Anteriormente hari sido expiicados, entre otras cosas, los diferentes estadísticos utilizados par? evaliiar los items en la construcción de un instrumento psicomCtrico. En 13 actualidad, el cálculo ae dichos estadísticos se realiza mediante diversos prooramas ~mputar iZad0~ que reaiizan el trabajo de forma sumamcnta veloz y efectiva. Por ello, es fundamental tener conocimiento de estcs programas, ya que en la práctica. nos veremos obligados a rewmr a ellos. más que a engorrosos cálculos iiianuales.

Sin embargo, no debe subestimarse la ulilidad ael cálkulo manual de los estadísticos de los ilems y de la prueba total, ya que @os permiten a! estudiaate comprender la lógica que íundamenta cada unc de los estadísticos.

Existen numerosos sohare ccmo LERiAP, Metñx Engine, MTuritem, entre m~;chísiincs otros: que pueden ser utilizados para facilitar el trabajo en el área de la piicometna. Sin embargo, a continuación solo serán descritos algunos de los resultados proporcionados por Mimitem 3.0 para W i n F s . ya que dicho programa es el que esta m5s accesible para Ics estudiantes l e ¡a Universidad Central.

6.1- CORRECCI~N DE TEST BiNARlOS

Al trabajar con test de tipo binanos, es decir, 'aqueilos en los que exigen respuestas correctas e incorr~stis, luego de realizar los diferentes procedimientos para mrregir la prueba, el programa generará para cada uno de los items una tabla como la que se presenta seguidamenk

SUBPRUEBA # 1 ITEM # 1 SUBPRUEBA > 1

ALT. Pn N P Pc DES Rpb Rpb-1 FP m RpbT pbT-1 Mp-T Mq-T

Como puede apreciarse, la tabla esta integrada p% los siguientes componentes: ALT. 1 Pn 1 N / P / Pc / DES / Rpb / Rpb? 1 Mp 1 Mq 1 RpbT 1 RpbT-1 1 %pT 1 Mq-T. Dichcs coniponentcis sedn brevemente descritos a coatinuación:

y ALT.: Indica el número de la opción o la altemativa del ítem a la cual corresponden los diferentes estadísiicos.

y Pn: Representa la ponderac.¡& del ítem, es decir, la cantidad de puntos quc. se les va a dar en la pmeba a los sujetos que seleccionen la opción correcta o alguno de los -distraUores (opciones diferentes a la correda). Para pruebas definidas como binanas, el programa +temáticamente realiza la ponderación otorgando un punto '1' a los sujetos que seledonen la altema:iva correcta, y cero 'O' para los que contesten los distradores. En el caso de detener un test de Hems no Mnarios. pueden ser modificadas eslas ponderadones en los diferentes items de la prueba. ,

y N: Muestra el número de sujetos que eligieron una aitemativa determinada- *

Psicomcfria I - Untdad II 36 Consfruccion de un Insfrumcnfo Psicom¿frico. Etapas y Esfadistico~

P: lndica la proporción de sujetos que contestaron una alternativa determinada

Pc: lndica el valor de corregida por azar con la fórmula de Guilford (1954) mencionada en la pAgina 10. DES: lndica al va.lor de la desviación tipica de cada a;tema:iva.

Rpb: Representa el vaior del coeficiente da correlación punto biserial. Rpb-1: Propciciana el valor del coeficiente de mrreiacióri punto biserial exciuyendo el item correladonado, es decir, el r~ corregido. Mp: lndica la m&ia de los puntajes obtenidos en el test por todos los sujetos que seieccionaron-¡a opcibn. Mq: Contrario al valor de Mp. el Mq reprzsenta la media de los puntajes ~btenidos en el test en el caso de de todos !os sujeios que id0 selcccionaron la opción. RpbT: A diferencia del RpS que mrrelacions el puntaje del subtest con una altemativa del ítem. el valor del Rpb T proporciona e¡ meficiente de correlación punto biserial entre la opción y el puntaje total en el test. Evidentemente. si el test solo esta compuesto por un subtest. los valores de Rpb y Rpb T serSn similares. (ramo en el caso de !a tabla del ejemplo inicial). RpST-1: Indica !o mismo que el Rpb-l. p r o en vez de representar la carrelación entre una alternativa del ftem y el puntaje total del subtest excluyendo dicho item; muestra la conelación de la aheinativa con el p~ctaje del test total. LCgicanente. si el test consta de un solo subtest, los valores dc Rpb-1 y Rpb T-1 serán exaciamente iguales. FAp-T: lndica la media de los puntajes obtenidos en el test total. por todos..los sujetos que selecciocaron la alternativa. Obviernente, si el t& total psee un Único subtest, los valares de Mp (explicado anteriolxente) y MpT serán iguales. Se caicula de manera similar a Mp, pem tomandc en cuenta los p~ntajes obtenidos en el test total en vez de los dei subtest. Mq-T: Representa la media aritmética de las puntuaciones obteílidos en el test total, por todos los sujetos que NO eligieron la opción. Al iguai que para MpT, cuando el test consta de un rolo subted. los valores de Mq y Mq-T seriin sirr.i!ares. Puede calculase de manera similar a Mq, pero tomando en cueilta los puntajes obtenidos en el test total en vez de los del subtest.

Por último, es sumamante importzate destacar que en el caso de los Test BinaBos (los que poseen ítems con respuestas wrrectas c incorrectas), pr;.ncipa!menie deben ser tomados en cuenta los diferentes estadísticos de la opción correda (la alternativa que en la tabla aparece con un asterisco), ya que estGs son los que reflejan el comportamiento del item.

Si se esta trab~jando con un test binario, al seleccionar en el programa la opción para e!w!ar la Correlaciór; Interifems, se genenrá una tabla como la que se presenta a continuación. para cada uno de los reac?ivos de la prueba.

En la taMa anterior se muestran una serie de resuitados de la correlación entre el item 1 y el resto de los ítems de la pnieba, presentados de la siguiente manera: 2~667.1.. .2&. El número que se enatentra ..

Psicomeiria 1 - Unidad 11 57 Conrfruccion de un Iruirumuiio Psicomelrico. Eiopas y Esiadisricos

fuera del parhtesis (el 2 en nuestro ejemplo). indica el item con el wsl se esta correlacionando el ltem 1. El primer número, de izquierda a derecha. que se presenta dentro de los padntesis (-667 en nuestro ejemplo) representa el valor del Coeficíente de Correlación PHI obtenido entre el ítem 1 y el 2. El segundo número dentro del parentesis (el 1 en el ejempio) refleja el valor Máx~mo del Coefraente de Colrelacidn Ptii, que puede resuttar entre el item. 1 y e1 2 El tercer número de izquierda a derecha dentro del parhtesis (.24 en el ejemplo) muestra el valor de la Covahnza entre el ítem 1 y el 2.

3

Poseyendo Iw valores de PHI (e), PHI máximo (-4 y las covarianzas (S?) entre todos los items pmporclonados por el programa, pueden estructs-rarse las matrice respectivas tal y comc; se presentaron con anterioridad. (EII la sección de-los Estadísticos de los !terrts).

6.3- ESTA& ~ C O S Di TENDENCIA CENTRAL Y VARIABIUDAD

Los estadísticos de tendencia cenirai obteriidos mediante Micrc4em. son presentados en una tabia similar a la siguiente:

-----------------------------------------------------------------------.------------------------

MEDIA= 2 5 - 5 0 VARIñNZA= 4 7 - 4 7 D E S . T I P . = 6 . 8 5 MODO= MULT IKODAL DEVI C) DER= 1 0 . 0 O MEDIANF.= 2 5 . 5 0 PERC. 25= 2 1 . 7 5 PERC. 75= 28 .75 3 . S . I = 3 . 5 0 T M S F . =LINEAL C. 'JAR.= 0 . 2 7 ASIMETRIA= 0 .62 KüRTOSIS= 1 . 1 1 M3DIAI?EX= 5 0 . 0 0 1J= 18

. G o m ~ puede apreciarse. los componeiites de ia tabla anterior son los siguientes: MEDIA 1 VARIANZA / DES-TIP MODO / !E40 DER'I MEDIANA / PERC. 25 / PERC. 75 / D.S.1 / TRANSF. / C.VAR / ASlMETRlA / KURTOSIS / MEDIA DER 1 N. A coniinuacion sc:i explicados estos elemantos.

\ir MEDIA: Representa el valor de la media aritmCtica. la cual es igual a la suma de los wntajes de los sujetos entre el !iúmero de casos.

y VARIANZA: Indica la medida en que Ics puntajes se alejan de la media, es decir, indica cuan dispersos se encuentran los mismos. Se calcula mediante !a fórmula siguiente:

&ande: X= El puritaje obtenido Zn el test por mdz sujeío. -

3 z(x-;Y 0- = - X = media a&n&a de ks puntajjes de Ics sujetos.

II n= iiúrnero total de ináiMdu<rs que respondi6 el test.

yr DES.TIP: Ai igual que la varianza. iodica el grado de la dispersión de los puntajes de !as sujetos en tomo a la medis, y se obtiene a partir de la raíz cuadrada de la varianza. mmo se indica a continuación: -

D x d e : X= El puntaje ob(mido en el test por cada sujeto. - X=meú¡aaribneticadekspmtajesdeks~cts. n= m b e m Wl de indmduos que respondió e! test

a

\)r NODO: La Moda representa e: valor que aparece coi.mayor frecuencia entre los puntajes obtenidos por los sujetos en el test. En este sentido. si varos valores cornprten la mayor frecuencia de aparición. cada uno de ellos será una moda. a

y D N l O DER: Rewesenta el Desvío Derivado. es decir, el valor de la desviaadn típica tomado para realizar alguna Iransfomadbn lineal de los punta@. Asf por ejemplo. en el caso de la TmsfmacEón de Puntales Z, la desviacidn derivada es igual a 50.

I'srcomctria 1 - Unidad 11 38 Construccion de un Insirurricnto Psicomelrrco. Etapas y Estodisticos

MEDIANA: Muestra el valor por encima y por debajo del cual se encuentran la mitad de los puntajes obtecidos por los sujetos; es decir, su valor representa el percentil 50 de los puntajes. Es importante destacar que esta medida de tendencia central no es sensible a los valores extremos de los puntajes, ya que no representa un promedio de los mismos. Cuando el numero de iridividuos a los que se ies aplica el test es par, la mediana es igual al promedio de las dos observakones centr2les. una vez que han sido ordenadas de manera ascendente o descendente; mientras que en el caso de un número de observaciones impar, la mediana es simplemente la puntuaci6n que se encuentra en la mitad cuando están ordenadas de forma ascente o descendente. PERC. 25: Señala el valor del percentil 25, S decir, el puntaje por debajo del cuál se encuentran el 25% de los puntajes obtenidos p<ir los sujeios en ei test; o en otras palabras. el vaior por encima del cual se encuentran el 75% de los ptintajes obtenidos por los sujetcs. P u d e obtenerse. segur. Glsss y Stanley (1986) con la siguiente fórmula:

Donde: L= limite inrenor real & b puntuación dr?l hteivab de langtwl . q i ~ ~[k-itienr h

0,25rr - Cfa) - cuarta parte de ias frecwncias. partiendo del extremo inferior de b dibucibn. PZ5 = L + - .i

fa = es ia frrcUencia acumubda hasta L. f-: fi-cwncK cid intervab en el que se halb ia cuarta parte de n. el total de frecuenciac.

PERC. 75: Representa el valor del percentil 75, o sea. el puntaje por debajo del cuál se encuentran e l 75% de los puntajes obtenidos p r los sujetos en SI test; o lo que es lo mismo, el valor por encima del cua! se encuentran el 25% de los puntajes cbtenidos por los sujetos. Puede obienerse, de acuerdo a Glass y Stanley (19%). a paitir de 13 fórmula siguiente:

Donde: L= limite inferior real de La puntuacih de4 intervab de bng'todl .que &ntiene b cuarta parte de las frec-. partiendo dd extremo inferior de b distn'bvckh.

O 75n - (já) -- fa = es ta frecuencia acumulada hasta L. P,5 = L. + -'

f C frecuencia dd inteivalo en el que se halla la cuarta pi te de n. el total de fretxrencias.

C.S.!: Representa el velor de la desviació~ sem.iinterccartílica, y da cuenta del punto medio de !a distancia entre el primer y el tercer cuartil. En este sentidc, la desviación va a reflejar SI existe mucha o poca distancia entre esos d<is cuartiles. DS acuerdo con Silva (1992). Cuando dos conjuntos de valores tienen un mismo valor de desviación semiintercuartílica, es muy probab!e qiie los patrones de heterogerieidad de los mismos se asemejen entre sí. Puede obtenerse de la siguienie manera:

Donde:

Q3 - 01 a = desviación s€;niitefarartíüca. o= C, = es el tercer cuarta (percentil25). 2 O, = es el primer wartil (percentil75)-

TRANSF.: Indica el tipo de transformación que se les esta aplicando, o que el programa esta pedeteminado para zplicar a los puntajes. En este sentido, la versión 3.0 ale Microitem solo realiza Transfomaci~nes Lineales de los puntajes. C-VAR: Muestra el valor del Coeficiente de Variabilidad, el c u A l es un índice de variau6n relstiva. ya que la expresa como un porcentaje, por medio de la transformación de la desviaci6n típica como porcentaje da la media. La ventaja de esta medida de variabilidad con respecto a otras. es que - resuha en un indice cuantitativo independiente de la unidad de medida. {Silva, 1992). El Coeficiente de i/anabilic!ad se calcula a partir de la siguiente fórmula?

Psrcomerria 1 - Unrdad 11 39 Consrruccion de un Inslrumenro I'rrcom¿<nco. Eqmsy Es~adisricos

y ASIMETRIA: lndica el valor de la asimetría de la distribuci6n de puntajes del test, calcc!sdo tal y corno se indiw en la página 28.

y KURTOSIS: lndica el valor de la kurtosis de la distribuci6n de puntajes del test, calculado tal y,como se indica en la ptígína 30.

yr MEDIA DER: Representa la Mediz Derivada. es decir. el valor de la Media tomado para realizar alguna transfomaci6n lineal de los puntajes. Es; p r ejemplo, en el caso de !a Tfansformacibn de Puntajes 2, la Media es igual a 103.

yr N: Es el número total de individuos que respondió el test.

. . E k l . R.L. (1 979). Essentia;~ o i educatimal mcasurement. Tercera edicibn. Eiiglrwcod Cliífs, NJ: Preniice

Hall.

Glass, G. y Stanley, J. (1 968). M6todos Estadisficos Aplicados a las Ciensias Socia!es. México: Preritice- Hall Hispanoamericana.

Guilford, J.P. (1954). Psychomsb-íc hlethods. New York: Mc Graw Hill.

G~lliksen, H. (1 974). mear)- of ment;il tests. New York: J o h ~ ?Viley & Sot~s.

Horst, P. (1 966). Psychologíc~l meastirement and pdictfon. Belmont: Wasworth Bublishing.

Magnusson, D. (1995). Teoría de b s Test. México: Trillas.

Sbnchez, J. (1399). AndIi~is Psicorn6b7co de los Tesis de Habiiidades tiszaos ,para la r-e.7tacibn vocacianai er, la Facufizd de Humanidades y Educacidn. Caracas: Univesidad Central de Veriezuela.

Silva, A. (1 992). M6todos Cuarititatjlos en Psblcgía. México: Trillas.

Tavella, N. (1378). El análisis de los ítems en la con-stnrcci6n de insúumentos psicom6tMs. Caracas: Publicaciones Esmela de Psicoiogía, U.C.V.

*

Yela, M. (1 965). Psim!ogía de la kp&'udes. México: Tdlas.

Vavis (Ediicationil Measurernent, Editor I-indqiiict, ?ag. 280)

Becerra. 1 i77:34-85

nh

nh

hh

hh

hh

h

n

-.e

n

hh

/. h

.C4h

h

n

nn

n

hh

h

h

n

n

5

5

%.;S 5

55

5

5

5 5

5

55

5

55

5

5 5

5

l. 1.

l 1

.1

1

11

1

l

l. 1

1

11

1

1

II

'.

1

,1

11

11

11

1

r

~4 ~

14

th

&&

o &

8

r

cJ 66

60

0

.~

~j

&~

k$

dc

o'

~&

~

r

r

rrr rrr

*.r

NN

N

NC

d

NN

C

Vc

9

Psicomcrria 1 - Unidad 11 . 41 Cons~ruccibn de un Insrmnwnro Psicomirrico. lapa;^ Erradircicos

La warianza máxima de un test se da cuandu se obtiene una estrudura 'simplex' en la matriz Item-individuo. Si se obtuvo una distribución asim4trica negativa se puede decir que le test fue dificil para los sujetos. Si' se reduce el tiempo concedido para desarrollar la prueba se obtendrtn medias aritm4ticas mayores. Si se aumenta el número de alternativas se puede esperar una media arítmética menor. Un test que tiene correlación negativ:: con un criterio nc puede ser utilizado como predidor. Si se reduce el tiempo concedido para desarrollar la prue.ba se obtende una media aritmética del test menor. - La varianza del test está deteminada por lz varianza de cada ítem y la covaflanza entre ellos: La eficiencia p d i d i v a es mayor en test homogéneos. A mayo; varianza, mayor homogenr3dad del test. A medida que la varianza obtenida se aproxima a la varianza máxima, se obtendrá una mayor nomogeneidad del test. Cuai?do la probbiiidad de awRar o1 azar los ítems es máycr, Ia media aritmética del test será meiior. La eficiencia predictiva es mayor en test hererog6neos. Se puede hacer el test más fácii agregando ítems con p alta. A mayor covarianza interitems, mayor dispersión de los puntajes. A mayor vaiianza, mayor hetcrcgeneidad del test. A msyor vadanza del test, mayor exactitud en la discriminación. A mayor covafianza in tw items, mayor hetergsnsidad del test? A maycjr homogeneidad, mayar dispersión en los puntajes. A mayor homogeneidad. mayor confiabilidad de consi9encia interna. Si se aumenta el número de items dificiles, la media aritmética del test disminuirá. A mayor covarianz~ interitems, mayor homogeneidad del test. Las respuestas al azar se deber? ai insuficiente lapso concebido pan responder la pregunta. Se puede esperar una media arítm4tica mayor cuando se agregan ítems con valores de p mayoms a (3. Un items cuya p = O su rd = 1 La probabilidad de acertar al azar ~ t r i items está afectada por el número de alternativas- Si M, es menor a M,se obtendrá un r, positivo. A medida que aumenta ei número de altema!ivas. 13 media de las rzspuestas al azar es menor. La media aritmética es mayor en test con atta wnfiabilidad. La formula de Kuder- Richarson para estimar la wnfiabilidad supone quz los items son paralelos. Un 4ems cuya p =G, su r, = 0,00 La media aritm&ica es menor en test homogéneos. Un items cuya p =O debe ser eliminado. A medida de que el número de altemativas es mencr, la media de las respuestas al azar es mayor. Si se eliminan items de un tes! ayas p son mayores a 0; se obtendrá una media aritm4tic-a menor. Si se aumenta el numero de items fáciles es obtendrá una media del test menor. La varianza es máxima cuando todos los sujetos obtienen el mismo puntaje. Si se disminuye el número de altemativas se puede esperar una media aritm4tica mayor. Una correlación alta y negativa entre un test y el criterio produce una alta eficiencia predictiva. Si se agregan nuevos items fdciles, la media aritmética del test no se altera. El método Kuder- Richarson para estimar la consistencia intema del test, está basado en el supuesta de que los itenis tienen similar grado de dificuttad e intercorrelaaón. La varianza de un test está relacionada diredamente con el tamaiío de las p de los Hems. Un items cuya p= 1, su r,= 0,00

siempre que pI2=0. la correlacián será negativa. Siempre que pl= q2. la covarianza es positiva. A medida que la p del item se aproxime a 0.5, su covarianza con otros items será mayor. La homogeneidad del test esta diredamente relacionada con las lntercorrelaaones entre los items. Un test altamente confiable es homogkneo. Una manera de hacer el test m& homogéneo es eliminando iterns con correlacicnes negativas con el resto de los ¡tenis. Lo idea! es contar con items que tengan altas correlaciones. Tesis con aita homogeneidad tienen buena capacidad dixñmin2:iva. La p del i?em puede tomarse como un íridice de la capacidad disuimina:iva del item. La varianza de los iterns esta relacionada con sus p. Un item cuya p=O. su correlación con otra item es igual a O. . Un item cuya p=l. su com!aciCn cm otro item es igual a 1. Un test altamente confiable es homogheo. La varianza m%ma de un ies? está esta re:acionada con las p ds los items. A mayor nomcgeneidad del test, mayor dispersión de ¡os puntajes. Son cieseab!es tesi que mntierien items altamente homc&rieos entre si.

- E&R~c~o * 2

A partir de la matriz items-sujetos aaexa, respnda las siguien!es preguctas:

1. Evalúe la cápacidad discriminativa de la prueba de cuerdo a los rpb Se los items:

2. Indique si la prueba discrimina a lo largo del continao a en un punto dado del continuo:

3. Describa la forma de distri~ucl6n de los puntzjs:

4. Describa la dificultad de la prueba: a

Ps~cvmetnd 1 - Unidad II 13 Conrhuccidn de un Insírumcnro I~sicomIrica. Eropai y Eiíadisri~~s

6. ¿Bajo que supuestcs se aplica la fórmula de Guilford para corregir la influencia del azaR: l

5. Comja la p del item 7 quitando la influencia de los puntajes obtenidos al azar:

7. Calcule 13 correlación entre los items 4 y 5:

6. Interprete el resultado obtenido en 5:

I

( 8. lnterprete la correlación entre ¡os items 4 y 5:

9. ¿?o; que la correladón entre los items 4 y 5 no es positiva perfecta?: ,

10. Ca!cule d rpb d d item 8: 11. Interprete el risuitado obtenido en 10:

12. Corrija el rpb del item 8: r . .

. .

13. lnterprete el resultado obtenido en 12:

16. La matriz iterns-sujetas. ¿es una 'matriz simples' según lo desGo por Guttman?. Oiga por que:

14. por qué es necesario corregir el rpb de los items?:

¿Qué información propcrcicna d 19. Interprete e! resultado obtenido en la pregunta 17.

I

15. ¿Es aplicable el coeficiente de correlaci6n biserial?. Razone su respuesta:

* el coeficiente & de la ' 21. 18. ¿Qu6 inbrmaci6n proporciona] 23. Interprete el resultado obtenido en 1 el coeficiente & ? la pregunta 20:

C

. . 23. Si :e eliminan los itcms ccn rpb inadecuaaos de acuerdo a los criterios de Ek l :

123.1.- La media del test:

i a) Aumenta. b) Disminuve.

I c) Permanece igu21.

l Arqumente su respuesta: l Si su respuesta es a) o b), ¿Cuál es 13 nuwa media del test?:

I I Si su respuesta es a) o b), ¿Cuál es la nueva dificultad del test?:

23.2.- La dificultad del test:

a) Aumenta. b) Disminuye. c) Permanece igual.

Arqumente su respuesta: .

\

23.3.- La variada del test:


bumente su respuesta: Si su respuesta es a) o b), ¿Cual es la nueva varianza del test?:

23.4.- La confiabiiidad de consistencia interna:

a) Aumenta. b) Disvinuye. c) Permanece igual.

Argumente su respuesta: Si :!J respuesta es a) o b), ¿Cual es 13 nueva confiabilidad de consistencia interna del test?:

23.5.- La homogeneidad del test:


23.6.- La asimetría áel test:

a) Cambia. b) Permanece igua!.

Arq~mente SU respuesta:

1 Arqurnerite su respuesta:

I Si su respuesta es a) a b), ¿Cuál es la I nueva homogeneidad del test?: I

Si su respuesta es a) o b), ¿Cuál es la nueva asimetría del test?:

1 23.- La kurtosis del test:

I a) Cambia. b) Permanece igual.

Arcumente su respuesta: Si su respuesta es a) o 5). ¿Cuál es !a nueva kurtosis del test?:

etapas en la elaboración de un instrumento (tavella)

Documents