unidad i y ii

TOMÁS PEDRO PABLO CAYCHO RODRÍGUEZ

Universidad Inca Garcilaso de la Vega

Facultad de Psicología y Trabajo Social

ELABORACIÓN DE PRUEBAS

TOMÁS PEDRO PABLO CAYCHO RODÍGUEZ

1


ÍNDICE

1. Índice……………………………………………………………………………………………..

2

2. Introducción…………………………………………………………………………………..

5

3. Orientaciones Metodológicas………………………………………………………..

7

4. Primera Unidad: Fundamentos de la Medición Psicológica y las Pruebas Psicológicas……………………………………………………………………..

10

4.1 Lección I: Conceptos, características y escalas de la medición psicológica……………………………………………………………….

14

Medición…………………………………………………………………………………..

14

Sistema numérico empleado en la medición psicológica: Características, escalas de la medición…………………………………

16

Propósitos de la medición psicológica……………………………………

21

Diferencias entre medición y evaluación……………………………….

22

4.2 Lección II: Concepto de Test Psicológico: Características y aplicaciones……………………………………………………….……………………

23

Test Psicológico………………………………………………………………………

23

Clasificación de los test psicológicos…………………………………….

24

Aplicación de los test psicológicos. Normas generales…………

28

4.3 Lección III: Concepto de Test Psicométrico y sus características

30

Paradigmas 30

2


psicométricos……………………………………………..

Test Psicométrico……………………………………………………… 33

5. Segunda Unidad: Elaboración del Test Psicométrico……………….

46

5.1 Lección I: Propósito del Test Psicológico……………………………

50

Consideraciones previas al proceso de construcción de una prueba….

50

Especificación de la finalidad de un test psicológico……………

51

5.2 Lección II: Traducción de la finalidad del test en términos operacionales. 55

Contenido del test……………………………………………………… 55

Formato del test………………………………………………………............

60

5.3 Lección III: Elaboración del Pre-test………………………………….. 61

Pretest…………………………………………………………………………………..

61

Ítem………………………………………………………………………………………

61

Construcción Provisional del Cuestionario……………………………

61

6. Tercera Unidad: Validación del Instrumento Psicométrico……… 78

6.1 Lección I: Análisis de Ítems………………………………………………

82

Índice de Dificultad…………………………………………………………………

83

Índice de Homogeneidad………………………………………………………

85

Análisis del poder de discriminación…………………………………….

89

Índice de Validez…………………………………………………………………..

89

Selección de ítems para el formato final del test………………… 90

6.2 Lección II: Confiabilidad. Concepto, características y aplicaciones………………………………………………………………………………….

92

3


Confiabilidad como estabilidad temporal………………………………

94

Confiabilidad por consistencia interna………………………………..

95

Confiabilidad por el método de formas paralelas…………………

99

Estimación del error típico de medida………………………………….

100

Factores que afectan la confiabilidad……………………………………

102

6.3 Lección III: Validez. Concepto, características y aplicaciones……… 122

Concepto………………………………………………………………………………

122

Validez de contenido…………………………………………………………….

123

Validez de constructo……………………………………………………………

124

Validez Predictiva………………………………………………………..........

136

7. Cuarta Unidad: Normatividad del Instrumento Psicométrico……

153

7.1 Lección I: Baremos. Conceptos y clasificación………………….

157

Baremos Cronológicos………………………………………………………….

157

Baremos Percentiles…………………………………………………………….

158

Puntuaciones típicas……………………………………………………………..

160

7.2 Lección II: Determinación del Baremo…………………..……….

165

Obtención de percentiles…………………………………………………….. 165

Obtención del rango percentilar…………………………………………..

167

Obtención de eneatipos………………………………………………………..

168

Equivalencias entre puntajes T; CI; eneatipos; percentiles; nivel y rango 169

8. Glosario………………………………………………………………………………………..

179

4


INTRODUCCIÓN

La actividad profesional del psicólogo, no sólo en nuestro país sino en muchas otras latitudes, requiere, en muchos momentos, de la utilización y/o construcción de test que pretenden evaluar determinados constructos psicológicos no susceptibles a un proceso de medición directa. Resulta usual, por ejemplo, en el ámbito de la Psicología Educativa, la aplicación de test de inteligencia, hábitos de estudio, desempeño lector o intereses vocacionales. En el terreno de la psicoterapia, un psicólogo aplica determinadas pruebas para diagnosticar los problemas depresivos o ansiosos de un cliente. Los psicólogos centrados en la selección de personal utilizan también diversos test para determinar, en un periodo inicial, qué personas, de un grupo de aspirantes, pueden desempeñar mejor un determinado puesto de trabajo.

Hoy en día, es cada vez es mayor el número de test disponibles en el mercado para su utilización, lo cual lleva al psicólogo a la necesidad de conocer las posibilidades de cada uno de estos instrumentos, la información que aporta, cómo se interpretan las puntuaciones que proporciona, en qué

5


grado podemos fiarnos de estas puntuaciones, para qué tipo de personas resulta apropiada su aplicación, etc. Sin embargo, los profesionales no se encuentran con todos los instrumentos que pueden necesitar para su actividad laboral cotidiana. Es así que, no resulta extraño, por ejemplo, que un psicólogo tenga que construir un test concreto para evaluar y conocer la actitud que tiene una determinada población hacia grupos marginados, que un psicólogo escolar necesite elaborar un test para conocer la opinión de los estudiantes hacia el desempeño docente o que un psicólogo clínico precise de una prueba concreta para evaluar determinados aspectos de la calidad de las relaciones sexuales de su paciente.

Parece razonable, por tanto, y por tanto necesario, que un psicólogo adquiera las destrezas necesarias para valorar la información psicométrica que incluyen diversos test y, además, que conozca los métodos y técnicas fundamentales para diseñar una prueba concreta con fines específicos. En las siguientes páginas se tratará de brindar ayuda al respecto. En el libro, y a lo largo de los 16 capítulos, tratamos de describir el proceso natural que se sigue en la construcción de un test, y que básicamente se resume en las siguientes fases: 1. Definición del constructo; 2. Construcción del test provisional; 3. Aplicación a una muestra; 4. Análisis de ítems; 5. Estudio de la fiabilidad del test; 6. Estudio de la validez del test y; 7. Baremación.

Las cuatro primeras fases se refieren a estrategias lógicas, con fundamento estadístico, que nos conducen a seleccionar la forma y los contenidos más apropiados del test. Las fases 5 y 6 se refieren a la comprobación empírica de las garantías psicométricas que la prueba manifiesta como instrumento de medición. Básicamente, estas garantías se refieren a su precisión (confiabilidad) y a la comprobación práctica del contenido auténtico que estamos evaluando (validez). La denominada Teoría Clásica de los Test (TCT), permite abordar estos problemas con cierto rigor. Una vez que disponemos de la versión definitiva del test, aplicada a una muestra representativa de la población de personas a la que va dirigido, se procede a la fase de baremación, que sirve para interpretar una puntuación concreta en relación con las que obtiene la muestra seleccionada.

Quisiera agradecer a muchas personas que de una u otra forma me han ayudado y permitido elaborar este manual. Nombrarlos a todos, sin embargo sería muy largo. Pero no puedo dejar de mencionar al Dr. Ernesto Pollitt por el apoyo y muestras de amistad brindado, y por haberme permitido trabajar a su lado. Mucho de lo que he conseguido académicamente se lo debo a él. También quiero agradecer al Dr. Reynaldo Alarcón, que me facilitó valiosa bibliografía al respecto, A la Dra. Noemí Sotelo, por su confianza y muestras de amistad; así como al Lic. Christian Jibaja, por su colaboración con una parte de la Unidad III. Pero sobre todo, quisiera agradecer a Rita, mi madre, por su compañía y apoyo. Su presencia es indispensable para que yo pueda trabajar.

6


Tomás Caycho Rodríguez, 2011

ORIENTACIONES METODOLÓGICAS

SUMILLA DEL CURSO

DESCRIPCIÓN DE LAS UNIDADES DEL TEXTO

7

La asignatura corresponde al área de formación básica y es de naturaleza teórico – práctica que busca desarrollar competencias y destrezas para la construcción y estandarización de diversos instrumentos psicológicos y su aplicación en la investigación científica de las diferentes áreas de la psicología. Se examinará los principales procedimientos empleados en la elaboración del pretest, análisis de ítems, índices de validez y confiabilidad, normas, baremos y elaboración del manual.

I Unidad: Fundamentos de la Medición Psicológica y las Pruebas Psicológicas

La unidad describe los diferentes tipos de escalas de medición empleados en la investigación psicológica. Ahonda, así mismo, en el concepto de test psicológico y test psicométrico, sus características y aplicaciones y los diferentes paradigmas psicométricos.

II Unidad: Elaboración del Test Psicométrico

La unidad describe la finalidad del test psicométrico para su aplicación en la investigación psicométrica, destacando la utilidad de la misma con sentido crítico. Presenta, de igual manera, el proceso de construcción de un instrumento psicométrico.


OBJETIVO DEL CURSO

8

I Unidad: Fundamentos de la Medición Psicológica y las Pruebas Psicológicas

La unidad describe los diferentes tipos de escalas de medición empleados en la investigación psicológica. Ahonda, así mismo, en el concepto de test psicológico y test psicométrico, sus características y aplicaciones y los diferentes paradigmas psicométricos.

II Unidad: Elaboración del Test Psicométrico

La unidad describe la finalidad del test psicométrico para su aplicación en la investigación psicométrica, destacando la utilidad de la misma con sentido crítico. Presenta, de igual manera, el proceso de construcción de un instrumento psicométrico.

IV Unidad : Normatividad del Instrumento Psicométrico

La cuarta unidad hace referencia al concepto y clasificación de los baremos, presentando además el proceso de obtención de baremos percentilares, rango percentilar, eneatipos, diversas equivalencias (puntajes t, CI, etc.). Así, se emplean datos empíricos y criteriales para construir normas de interpretación de las diferencias individuales que permitan evaluar el desempeño de sujetos con instrumentos de medición.

Desarrollar competencias y destrezas conceptuales, procedimentales y actitudinales para la adecuada construcción y estandarización de instrumentos psicométricos de evaluación psicológica, así como su aplicación en la investigación científica de las diferentes áreas de la psicología (clínica y de la salud, educativa, organizacional, social-comunitaria, etc.).


CRITERIOS DE EVALUACIÓN

Sugerencias para el estudio:

Recuerda:

1. Para aprender es necesario un aprendizaje activo y reflexivo para lo cual tienes que.

a. Activar la información previa que tienes en relación al tema y sobre la base de ella iniciar la construcción de tu aprendizaje: ¿Qué sé sobre este tema?, ¿Qué tarea me solicitan, es fácil o difícil?; ¿Qué materiales necesito?

b. Al finalizar tu estudio la pregunta siempre debe ser: ¿Qué de nuevo aprendí?

9

Se evaluará las actividades de autoaprendizaje, las cuales serán enviadas al tutor, quién los revisará y aprobará.

Se evaluará la presentación, el contenido, el análisis, síntesis y elaboración de las actividades de autoaprendizaje.

Puede también orientar su trabajo a partir del texto para estudio. El alumno debe presentar por lo menos 2 avances de su trabajo a su cuenta de

correo durante el semestre académico. Es importante no copiar y pegar contenidos de Internet, pues ello implicaría

desaprobar esta parte de la evaluación.


PRIMERA

UNIDAD

Fundamentos de la medición psicológica y las pruebas

psicológicas

“Hay muchas ventajas en ser un elaborador de pruebas, pero la más importante es que puedo proporcionar herramientas

que nos permitan hacer nuestro trabajo. Las pruebas psicológicas son las herramientas del oficio, entre mejor es la herramienta,

podemos ser más efectivos…”

Jack A. Naglieri, Ph.D.Extracto del Test Developer Profile publicado en Cohen (1999)

y en internet en www.mayfieldpub.com/psychtesting

10

RECUERDA QUE PARA TENER ÉXITO NECESITAS SER UN ALUMNO AUTORREGULADO


¿Qué es medición?

¿Cuáles son las características de la medición psicológica?

¿Qué es un test psicológico y cuáles son sus características?

¿Qué es un test psicométrico y cuáles son sus características?

Competencias

CONCEPTUALES:

Define de la medición en diferentes campos de la actividad humana.

Identifica las características de la medición en psicología.

PROCEDIMIENTALES:

Aplica la medición en las actividades diarias. Utiliza los test psicológicos en actividades para

constatar su necesidad en la medición de las características de las personas.

ACTITUDINALES:

Valora la medición como instrumento que hace de la psicología una ciencia.

11


Valora la utilidad de efectuar mediciones psicológicas adecuadas.

CONTENIDO TEMÁTICO

Lección I: Conceptos, características y escalas de la medición

psicológica

Medición.

Sistema numérico empleado en la medición psicológica: Características, escalas de la medición.

Propósitos de la medición psicológica.

Diferencias entre medición y evaluación.

Lección II: Concepto de Test Psicológico: Características y aplicaciones

Test Psicológico.

Clasificación de los test psicológicos.

Aplicación de los test psicológicos: Normas generales.

Lección III: Concepto de Test Psicométrico y sus características

12


Paradigmas psicométricos.

Test Psicométrico.

ESQUEMA CONCEPTUAL

13

MEDICIÓN

Rasgos PsicológicosDiferenciar y clasificar

Estados Psicológicos


Lección I

Conceptos, características y escalas de la medición psicológica

1. Medición

Según Alarcón (1998), la definición más difundida y popular sobre el concepto de medición, corresponde a Stevens: “medición, en un amplio sentido, es asignar numerales a objetos o eventos de acuerdo a reglas” (Stevens, 1951; 1970). El término numeral refiere símbolos, como 1, 2, 3… I, II, III… o A, B, C; comprende al número y éste expresa la cantidad en relación a una unidad. Básicamente, la medición psicológica utilizando test, consiste en asignar números a una variable de la conducta, cuya ejecución se cuantifica, siguiendo reglas específicas. Se trata según Brown (1980) de un continuo que mide algunas dimensiones y procuramos situar al sujeto en un lugar de dicho continuo.

Es claro que cada ciencia tiene una propia clase de objetos y la diferencia de la naturaleza de ellos, determinará diferencias en las clases de medición de los objetos. La longitud de un cuerpo se mide yuxtaponiendo el instrumento de medida al objeto medible. Pero este no es el caso de la medición psicológica ni tampoco de muchas magnitudes físicas, accesibles solamente a la medición indirecta. En ésa se hacen inferencias acerca del funcionamiento de una conducta a través de sus efectos. El tiempo se mide por el ángulo de las manecillas del reloj, la corriente eléctrica por el voltímetro y la temperatura por la longitud de la columna de mercurio. La inteligencia se mide por el rendimiento de un individuo ante determinados estímulos; es decir, se infiere su nivel a través de sus efectos. En la medición indirecta, a la que corresponde la medición psicológica, son siempre efectos o factores del mundo objetivo los que se observan y a través de ellos se infiere el estado de la conducta.

En realidad, no es muy cierto cuando se dice que se miden objetos o eventos, lo que se mide son propiedades de los objetos que se prestan a

14

CONCEPTOS CLAVE

Medición, constructo, diferenciación, clasificación, regla, variable, escala nominal, escala ordinal,

escala de intervalo, escala de razón.


la observación empírica o, mejor aún, indicadores de las propiedades de los objetos. El concepto propiedad, atributo que caracteriza a personas y objetos, es de capital importancia en la medición. En principio, cada objeto tiene muchas y diferentes propiedades; los objetos físicos poseen propiedades como longitud, peso y volumen; los seres humanos, además de esas propiedades, poseen, por ejemplo, pensamiento, alegría, memoria, angustia, motivación. La medición, para llevarse a cabo, requiere que se disponga de una clara concepción de la propiedad y de una clasificación rigurosa y específica de ella. En la investigación psicológica es usual definir la propiedad mediante una definición operacional que la describa por sus indicadores. Los indicadores reflejan las notas dominantes de una propiedad, se identifican a través de observaciones empíricas, especificando las condiciones bajo las cuales la observación fue realizada.

Algunas propiedades son fáciles de medir, sus indicadores no ofrecen dificultad para ser identificados y las reglas para asignar números fácilmente pueden formularse. La longitud de un cuerpo es un atributo que puede medirse siguiendo sencillas reglas. Aún así, la medición de atributos psicológicos requiere mayor grado de dificultad, sea porque a menudo una misma propiedad no es definida por los mismos indicadores, o bien porque se carga el énfasis en algunas características en desmedro de otras. Ahora bien, lo que se va a medir reposa en la noción que se tenga del atributo y si son diferentes las definiciones, es natural que las medidas que se obtengan mantendrían esas diferencias. Este es el caso de algunas variables del comportamiento que son conceptuadas, por más de una teoría, de manera distinta.

La inferencia de una propiedad a través de sus efectos, implica aceptar la relación entre efecto y propiedad. En el caso de la temperatura hay una relación entre dinámica termal y la altura de la columna de mercurio. Sin embargo, la relación no es tan clara cuando se atribuyen valores sucesivos, como 1, 2, 3,4… a reacciones ante ítems, tal como sucede en las escalas de actitudes del tipo Likert. Si bien se mantiene constante la distancia de una unidad entre los valores, no hay seguridad par afirmar que las diferencias entre las magnitudes de la actitud sean similares a la unidad de la escala medida. Lo que se ha hecho es asociar nominalmente el numeral 5 a las respuestas “completamente de acuerdo” y el numeral 1 a las respuestas “completamente de desacuerdo”. De esta manera, si el sujeto A obtiene 5 y el sujeto B alcanza 1, no significa que A posea una actitud cinco veces más favorable que B. No se ha hecho otra cosa que establecer una escala ordinal que jerarquiza y clasifica a los sujetos en términos favorable-desfavorable hacia hechos, ideas y personas. Pero no ofrece información para inferir en “cuanto” es más favorable que otro sujeto. En suma: La atribución de numerales a conceptos comparativos es de orden puramente nominal (Bunge, 1973).

15


En resumen, en psicología, se trata de medir aspectos que no son físicos ni directamente observables. La medición, según Nunnally (1987), consiste en reglas para la asignación de números a objetos1 en tal forma que representen cantidades de atributos. En psicología, medir es dar la magnitud de cierta propiedad o atributo, por ejemplo, la inteligencia, la extraversión, el razonamiento verbal, de una o más personas, con ayuda del sistema numérico. Los test psicométricos los instrumentos que se utilizan en psicología para la medición de los atributos psicológicos.

2. Sistema numérico empleado en la medición psicológica

2.1 Características

El sistema numérico que se emplea en la medición psicológica es el concerniente a los números reales, los cuales tiene las siguientes características:

a. Origen: La serie de números (1, 2, 3,…n) tiene un origen único llamado “cero”.

b. Orden: Los números están ordenados (después del 1 viene el 2, etc.).

c. Distancia: La diferencia entre dos números, es decir, la diferencia entre dos pares de números puede ser “mayor que” (5 es mayor que 2), “igual que” (2 es igual que 2), o “menor que” (3 es menor que 6).

Un ejemplo de estas tres características, en la teoría de la medición, la tenemos en la noción de isomorfismo. Hay relación isomorfa cuando se establece correspondencia unívoca entre los elementos de dos conjuntos. El conjunto A, B, C y D, es isomorfo al conjunto 1, 2, 3 y 4 ambos tiene la misma cantidad de elementos. Asimismo, cada uno de los elementos de un conjunto pueden ser sustituidos por los elementos del segundo conjunto.

Kerlinger (1965), planeta el problema del isomorfismo en los términos siguientes: ¿Tiene los procedimientos de medición que se usan, correspondencia racional o empírica con la realidad? Y agrega, la única dificultad es que raramente descubrimos el grado de correspondencia de nuestras mediciones con la realidad. “Ciertamente, a menudo ni siquiera conocemos si estamos midiendo lo que tratamos de medir” (Kerlinger, 1965). Esto es importante, si tenemos en cuenta, por ejemplo, que bajo el término “inteligencia” se midan sólo algunos de sus factores o la totalidad de ellos.

También se puede plantear la existencia de isomorfismo a) entre un atributo y los indicadores que lo representan; b) entre un sistema

1 Aquí, la palabra “objeto” se usa en un sentido amplio e incluye personas

16


ordenado de ítems (test) y la conducta que se pretende medir y; c) entre la estructura de la medición y la estructura numérica, de modo que los números sean susceptibles de análisis por medio de operaciones. En suma, todo parece indicar, que el principio del isomorfismo, tan necesario en la medición, no está totalmente presente en la medición psicológica utilizando test.

2.2 Escalas de Medición

Un tema a destacar es la ubicación de la medición mediante test entre los niveles de medición. La asignación de numerales da lugar a cierto isomorfismo entre las relaciones cuantitativas de los objetos que se miden y las relaciones entre las cantidades representadas por los numerales. Cada una de las cuatro escalas de medición que veremos (nominal, ordinal, intervalos y razón), corresponden a un nivel de medida diferente, siendo la escala nominal el nivel más elemental y la escala de razón la más exigente y elaborada (Stevens, 1970). Los niveles o escalas de medición se originan en el hecho de que los números que se asignan a las cantidades de las propiedades de los objetos reflejan dos o tres de las características del sistema numérico. De acuerdo con ello, los números llevarán diferentes cantidades de información (desde una información pobre a otra más útil)

Las mediciones realizadas mediante test, escalas e inventarios, se basan en la escala ordinal o en la de intervalos, advirtiéndose un claro interés por utilizar el tipo de escala más rigurosa y exigente.

Escala Nominal

Es aquella que se usa en la medición de variables estrictamente cualitativas o categóricas y que por lo tanto lleva hacia las clasificaciones, es decir, en esta escala los números o símbolos asignados sólo permiten clasificar los objetos. Por ejemplo: El sexo, admite dos clases: Masculino-Femenino; la clase social, admite tres clases: Alta, Media y Baja; el lugar de procedencia, admite varias clases, según el número de Departamentos; clasificar a las personas en fumadoras y no fumadoras; clasificar a las personas en profesionales y no profesionales, etc. Es decir, los números se asignan únicamente para identificar las categorías donde se encuentran incluidas las personas o cosas. Estas clasificaciones pueden ser de una sola clase, como los números en camisetas de jugadores para identificarlos, o pueden aplicarse a grupos de personas, como cuando damos un número de código 1 a las mujeres y 2 a los hombres, o la letra D para identificar a todas las personas nacidas en Lima y la E a las nacidas en Ica. En cuanto queden de esta manera, los objetos pueden ser clasificados y contados,

17


autorizándose a considerar la asignación de números como un procedimiento de medición.Este tipo de escala sólo nos dice que dos cosas son diferentes. Nombra los objetos, pero no dice nada acerca del tamaño o tipo de diferencia existente entre ellos. En la escala nominal, la única relación que hay entre los sujetos (u objetos) y los numerales que se les ha asignado es la de equivalencia, esto quiere decir que todos los miembros a los cuales se la ha asignado el mismo numeral son iguales. Esta relación se simboliza con (=). La relación de equivalencia puede ser reflexiva (x=x), simétrica (x=y, entonces y=x) y transitiva (si x=y, y=z, entonces x=z).

1. Reflexividad: La relación se extiende al objeto mismo. Todo objeto es equivalente a sí mismo (Si Juan está inscrito en el curso, entonces Juan está inscrito en el curso).

2. Simetría: La relación se extiende de la misma manera en ambas direcciones. Si Juan está inscrito en el mismo curso de María, entonces María debe estar inscrita en el mismo curso de Juan.

3. Transitividad: La relación pasa a través de los objetos. Si Juan y María están inscritos en el curso y María y Pedro están inscritos e el curso, entonces Juan y Pedro están inscritos en el curso.

De acuerdo con las propiedades mencionadas, la única operación aritmética posible con los numerales en esta escala es la de contar, no se puede realizar otras operaciones aritméticas.

Escala Ordinal

En esta escala los numerales son asignados a los objetos, reflejando un orden que corresponde a la magnitud del atributo que se mide. Este orden se expresa mediante el término “mayor que”. En mediciones de rasgos psicológicos las personas pueden jerarquizarse en esta forma: A>B>C>D. Esta relación se interpreta en el sentido, por ejemplo, que A es más agresivo que B y B es más agresivo que C. Las letras pueden reemplazarse por números y podemos asignarles 1, 2, 3, que representan el orden de los sujetos según su nivel de agresividad. Los números ordinales de los sujetos indican orden de posición, no indican cantidades absolutas, ni que los intervalos entre ellos son iguales. La atribución de los números 2 y 4 a los sujetos B y C sólo significa que B es más agresivo que C, pero no quiere decir que es doblemente agresivo. No puede asumirse que la propiedad medida que representan los numerales esté igualmente espaciada.

En lo que respecta a las propiedades formales de la escala ordinal, la relación jerárquica “mayor que” es transitiva: si “a” es mayor que

18


“b” y “b” es mayor que “c”, luego “a” es mayor que “c”. El axioma de transitividad, fundamental en la escala ordinal, ampliamente se cumple en las mediciones físicas: si “a” pesa más que “b” y “b” pesa más que “c”, entonces “a” pesa más que “c”. Sin embargo, en algunas variables conductuales no se aplica con la misma nitidez. Tomemos el ejemplo de la conducta dominante: “a” (esposa) domina a “b” (esposo), “b” a “c” (hijo), pero no siempre la madre “a” puede dominar a su hijo “c” (Kerlinger, 1975). Según Magnusson (1969), cuando medimos variables psicológicas no llegamos a un nivel superior de la escala ordinal; sin embargo, ofrece información suficiente en muchas situaciones de importancia práctica para la psicología.

Escala de Intervalos

Aquí los objetos medidos se ordenan como lo hace la escala ordinal. Pero, a diferencia de ésta, posee distancias o intervalos numéricos iguales entre los valores que se asignan a los objetos con respecto a la magnitud del atributo medido. Si los números 10, 13, 15, 18, representan magnitudes de una propiedad medida, de los sujetos A, B, C, D, podemos decir que la diferencia entre A y B es la misma que hay entre C y D. Para medir en el nivel de una escala de intervalo, es necesario tener unidades iguales en la escala; por tanto, podremos determinar las diferencias entre las posiciones de los objetos y compararlos entre sí. En tanto estamos interesados en conocer la magnitud de las diferencias entre los individuos en un mismo continuo (diferencias interindividuales) o la posición de un solo individuo en diferentes continuos (diferencias intraindividuales), será necesario medir la magnitud de los rasgos de escalas de intervalos (Magnusson, 1969). En psicología, por ejemplo, un CI de 115 y uno de 120, representan la misma diferencia que hay entre uno de 120 y 125, pero el cero de la escala es arbitrario y no se puede decir que una persona que tiene un CI de 120, tenga el doble de inteligencia de alguien que tiene un CI de 60.

En física también se usan escalas de intervalos iguales con 0 arbitrario, por ejemplo en la medición de la temperatura. El 0 en grados centígrados de la escala Celsius, corresponde a la temperatura de congelación del agua, aunque se hubiera podido poner en cualquier otro punto. Por ejemplo, en la escala de temperatura de Fahrenheit el nivel de congelamiento del agua es de 32 grados. En resumen, la unidad de medición es el grado y el 0 es arbitrario en ambas escalas de temperatura, pero ambos sistemas nos dan la misma información y están relacionados de modo lineal, de modo que una escala puede transformarse en otra mediante la ecuación y=a+bx. En la ecuación y=a+bx, x representa la variable independiente; y la variable dependiente, en tanto que a y b son

19


constantes. En el caso de transformar grados centígrados a grados Fahrenheit la ecuación es F=32+9/5 C. Ejemplo, si queremos conocer cuántos grados F son 20º C tenemos: F=32+9/5x20=68.

Los psicólogos se han interesado por construir escalas de intervalo, el problema por superar fue encontrar el método para establecer unidades iguales. El esfuerzo fue logrado cuando menos en algunas áreas, por ejemplo, los puntajes naturales de las pruebas de inteligencia son convertidos en puntajes estándar, que expresan la distancia de un puntaje con respecto al rendimiento medio del grupo, en función de la desviación estándar de la distribución. Se obtiene, de esta manera, unidades iguales y constantes que facilitan establecer comparaciones. La construcción de instrumentos para medir variables psicológicas sobre una escala de intervalos, se apoya en la verificación empírica de la distribución normal que adoptan los puntajes de variables de ejecución. La distribución normal y las puntuaciones derivadas, como Z y T, solucionan el problema de unidades iguales; sin embargo, no resuelven el problema del punto cero en la base de la escala. Al respecto, Guilford (1954) observó que el cero absoluto es deseado, pero no esencial en la medición psicológica. Brown (1980) ha resumido en dos puntos el debate en torno a la medición en el nivel de escala de intervalo: “(1) aun cuando los procedimientos de construcción de pruebas no garantizan escala de intervalos, cuando menos se aproximan a ellas; (2) el tratar calificaciones de pruebas como si se encontraran en escala de intervalos produce resultados útiles.

Escala de Razón

La escala de razón es aquella que tiene todas las características de una escala de intervalos iguales. Es la escala de medición ideal en ciencia pues permite todo tipo de cálculos matemáticos al tener entre sus valores un cero real, es decir la ausencia de la propiedad que se está midiendo. En una escala de razón o proporción, la relación o cociente entre dos puntos cualesquiera de la escala es independiente de la unidad de medida. Cortada (1999), señala que en este caso, decimos “dos puntos” y no “dos intervalos o diferencias entre dos puntos”. En la práctica, medimos peso, longitud, velocidad, presión atmosférica, volumen, etc., mediante escalas de razón.

En la escala de razón o proporción, todas las operaciones aritméticas están permitidas y por lo tanto también las estadísticas, incluyendo la media geométrica. Esto hace posible la aplicación de las propiedades de la multiplicación (y la división) base de los números fraccionarios. En psicología, casi nunca podemos emplear

20


este nivel de medición aunque existen algunas escalas de sensaciones como las propuestas por la Ley de Stevens.

La clasificación de las escalas de medición, propuesta por Stevens (1970) fue una contribución valiosa a la teoría de la medición. Sin embargo, algunas de sus proposiciones han sido cuestionadas. Dos observaciones son importantes: 1) Las propiedades de la escala de medida determinan el tipo de análisis estadístico; ahora se sostiene que los procedimientos estadísticos no requieren de las propiedades específicas de las escalas, es decir, no hay relación entre el tipo de escala y las técnicas estadísticas recomendadas por Stevens. 2) Los tipos de escala, propuestos por Stevens (1970), representan un incremento de la potencia de la escala, habiendo despertado el interés por utilizar la más potente. La mayoría de las mediciones psicológicas corresponden a la escala ordinal, aunque la aspiración ha sido construir instrumentos en escala de intervalos. Pero muchas medidas psicológicas son simplemente recuento de frecuencias y quizás no sea necesario mayores niveles de medición. Lo fundamental sería establecer el tipo de evidencia que ofrece cada tipo de escala, determinar el significado de cada escala, el tipo de predicciones que pueden hacerse, o cuál de ellas es la correcta.

3. Propósito de la medición psicológica

El propósito de la medición es proporcionar una base objetiva, exacta y comunicable para describir, diferenciar y clasificar las características y conductas de las personas. Por ejemplo, las puntuaciones correspondientes a percentiles son diferenciaciones cuantitativas que permiten clasificar a las personas de acuerdo a sus potencialidades intelectuales, temperamentales o actitudinales, según sea los casos.

Para poder clasificar, primero se debe diferenciar, por lo tanto la diferenciación antecede a la clasificación. En psicometría, para diferenciar a los sujetos sobre la base de una determinada variable se deben cumplir con los siguientes requisitos:

a. Se debe dar una definición de la variable, por ejemplo, “inteligencia”, “aptitud”, “hábitos”, “temperamento”, etc.

b. Se debe dar una regla o un conjunto de ellas, por la cual se establezcan las operaciones que permitirán diferenciar entre los sujetos.

La definición de la variable es generalmente abstracta mientras que las reglas son definidas operacionalmente. Técnicamente, cuanto más específica es la regla, más exacta es la medición.

21


4. Diferencia entre medición y evaluación

De acuerdo a Delgado, Escurra, & Torres (2006), la medición es un proceso por el cual se determina la cantidad que posee una persona respecto a una característica dada (aprovechamiento, habilidad, rasgos, etc.). En cualquier campo de la actividad, el medir consta de tres pasos:

a. Señalar y definir la cualidad o atributo a medir o determinar.b. Un conjunto de operaciones en virtud de las cuales el atributo pueda

manifestarse o hacerse perceptible.c. Establecer una serie de procedimientos para traducir las observaciones

a enunciados cuantitativos de grado o cantidad.

Por el proceso de medición, se establece una correspondencia entre una serie de funciones, objetos o personas, con un conjunto de números, según ciertas normas establecidas.

Por otro lado, la evaluación psicológica se ocupa de la exploración y análisis del comportamiento de un individuo o un grupo de personas, con distintos objetivos básicos o aplicados (descripción, diagnósticos, selección/predicción, explicación, cambio y/o valoración) a través de un proceso de toma de decisiones (Fernández-Ballesteros, 1994). La evaluación psicológica puede darse en diferentes contextos, así se tiene la evaluación de personal, clínica, educativa. Es importante tener en cuenta que la evaluación psicológica no se reduce a la aplicación de pruebas, sino que supone la observación conductual, la integración de los datos brindados por las calificaciones de las pruebas y otras fuentes (como la entrevista, la historia clínica, etc.) utilizadas por el evaluador para la toma de decisiones (Cohen y Swerdilk, 2000). Debe quedar claro que las pruebas psicológicas y psicopedagógicas son sólo una de las herramientas que pueden emplearse en el proceso de evaluación.

Lección II

Concepto de Test Psicológico Clasificación y aplicación

La medición con test psicológicos se propone determinar la posición de un individuo sobre un continuo en relación con otros individuos. La idea que preside esta medición es el antiguo principio de las diferencias interindividuales, que reconoce entre las personas no solamente diferencias físicas, sino también psicológicas. En este sentido, la función básica de los

22


test consiste en medir diferencias entre los individuos o entre las reacciones del mismo individuo en distintas ocasiones (Anastasi, 1978).

1. Test Psicológico

Test es un término inglés que puede traducirse como “prueba”, “probar”, “comprobar”, y lo que recoge es la apreciación de alguna característica, cuantitativa o cualitativa, de una persona que permite compararla con otras. En líneas generales, un test psicológico, podemos definirlo, como el conjunto de reactivos, seleccionados y organizados, destinados a medir una variable específica del comportamiento. Como conjunto homogéneo, es una estructura coherente de reactivos y, como tal, es más que cada uno de sus elementos (ítems). Por ello, la estimación de la ejecución del examinado, se efectúa sobre el conjunto de ítems que integran el test.

El objetivo básico de los test consiste en medir diferencias entre las personas o en la misma persona en distintas situaciones, y son utilizados para fines diversos. Aunque el origen de los test se pierde en la antigüedad, uno de los primeros problemas (y aún hoy importante) que se intentó abordar con los test psicológicos fue la identificación de los deficientes mentales.

Su uso a mayor escala se encuentra en las escuelas, donde sirve a propósitos variados, tales como la identificación de los retrasos escolares y deficiencias mentales, la canalización al tipo de escolarización idónea, la orientación vocacional, etc. Otras aplicaciones clínicas y sobre todo educativas han hecho popularizarse estos instrumentos, prestando un importante servicio en la investigación sobre cambios evolutivos, así como en la valoración de los efectos de la intervención clínica y educativa. Por otra parte, la selección de personal es una de las aplicaciones, más sobresalientes de los test, y éste es el uso más frecuente en el mundo de la empresa. Su utilidad y eficacia en la selección y clasificación del personal industrial ha supuesto una gran proliferación de pruebas específicas que pretenden medir las características determinadas en el perfil del puesto de trabajo. También la investigación social hace uso de los test de modo sistemático en la investigación de los factores culturales, para la identificación de rasgos y pautas de comportamiento de grupo, etc.

1.1Clasificación de los test psicológicos

Existen diferentes tipos de test que tratan de medir una amplia gama de características psicológicas, basándose en diferentes concepciones teóricas y construidas con diversas finalidades. Las clasificaciones son numerosas, sij que exista un esquema clasificatorio exhaustivo de categorías excluyentes que permita integrar los

23


diferentes tipos, teorías y objetivos de los test. Algunos siguen criterios metodológicos para diferenciar los tipos de test, otras de finalidad, de rasgos o bien de contenido. En función del contenido que miden, Cronbach (1972) divide los test en:

a. Test de Rendimiento Máximo. Este es el caso de los test de inteligencia, pues intentan establecer la ejecución máxima del sujeto. Este tipo corresponde en gran medida con los denominados test psicométricos (siguiendo un criterio de clasificación metodológico), que son numerosos y variados. Dentro de estos test, se englobarían tres grandes tipos:

Test de inteligencia general, que se basan en una concepción unitaria de la inteligencia. Pueden contener elementos de tipo simbólico o verbal (analogías, series de números, vocabulario, frases incompletas, etc.), de tipo gráfico (laberintos, comparación de rostros, trazado de líneas, etc.) o también de tipo manipulativo (rompecabezas, repetición de ritmos, manipulación, cubos, etc.). Las escalas de inteligencia abarcan subtest verbales y manipulativo. Estas escalas presentan una gran variedad de elementos para estimar las más diversas funciones mentales, con predominio de elementos referidos a los procesos cognitivos superiores. Por lo general, su aplicación es individual, y sus normas de valoración toman como referencia la edad cronológica, de la que se extrae una puntuación global de inteligencia (cociente intelectual, CI). Las más famosas son las escalas de Wechsler para preescolar y primaria (WPPSI), niños (WISC) y adultos (WAIS). Otros test de uso más reciente son el TONI-2 de Browh, Sherbeou y Johsen y el WISC-R, que unifica en parte los test de esta escala dirigidos a niños de preescolar y escolar (Tabla 1).

Tabla 1Descripción de test utilizados para la obtención del CI (tomado de Muñoz y García, 2006 pp. 91)

WISC-R K-BIT TONI-2Autores D. Wechsler

(2001).A. S. Kaufman y N. L. Kaufman (1999).

L. Browh, R. L. Sherbenou y S. K. Johsen (1995).

Descripción Medida de la inteligencia general.

Medida de la inteligencia verbal, matrices y general.

Medida de la inteligencia general (matrices).

Aplicación Individual. Individual. Individual y en

24


grupos reducidos.

Tiempo aproximado

Variable entre 60 y 90 minutos.

20 minutos. 20 minutos.

Test de aptitud general o aptitudes específicas, que pretenden predecir el éxito académico o profesional y son utilizados sobre todo en selección de personal y orientación vocacional (PMA o Test de Aptitudes Mentales Primarias de Thurstone, DAT o Test de Aptitudes Diferenciales de Bennett, Seashore y Wesman). Los test de aptitudes son los que miden características específicas de la inteligencia, ya sea tomando la forma de a) test o baterías de aptitudes generales (por ejemplo, el PMA), que suelen basarse en teorías de la inteligencia basadas en el análisis factorial, o b) test de aptitudes específicas, que exploran aptitudes mecánicas, burocráticas, artísticas, creativas, etc. Su finalidad es pronosticar los futuros logros académicos o seleccionar según la adecuación a un perfil profesional.

Test de rendimiento académico o escolar, que permiten conocer los logros académicos del alumno, así como controlar los efectos de determinados tratamientos o programas. Los Test de Aprendizaje Escolar para tres niveles académicos (TEA-A, TEA-2 y TEA-3) son un buen ejemplo de ello. Otros test de uso más reciente para los niveles de la enseñanza primaria obligatoria son los test BADIG, BETA y el test EVALÚA, así como los test de rendimiento escolar (TRES), la Batería Pedagógica número 3 (BP-3), las Baterías de Contenidos Escolares de Educación Primaria (BACEP 1, 2 y 3) y los instrumentos VANCOC para la valoración del nivel de competencia curricular del alumno (véase tabla 2). Por regla general, los test de rendimiento máximo pueden clasificarse en test de nivel, velocidad o mixtos. Los de nivel pretenden establecer el nivel máximo de dificultad al que puede llegar la persona. Los de velocidad evalúan la rapidez de ejecución en tareas determinadas (test de atención como el de discriminación de caras de Yela, Test de Toulouse Pieron), y los mixtos, que son los más utilizados, pretenden medir los dos aspectos anteriores, estableciendo un máximo de tiempo para la solución de los ítems o preguntas.

b. Test de Ejecución Típica. Tratan de conocer lo que el sujeto hace normalmente, dando por sentada la estabilidad de la conducta a través del tiempo y de las situaciones. Por tanto, miden

25


la personalidad. Podemos distinguir (Grzib Schlosky, 1985), los siguientes tipos:

Inventarios autodescriptivos. Pueden ser a) cuestionarios de ajuste, que intentan detectar sujetos para la intervención como fin general; b) cuestionarios construidos según criterios exteriores, generalmente psiquiátricos, como ocurre con el MMPI (Inventario Multifactorial de la Personalidad de Minnessota); c) cuestionarios sobre rasgos, basados generalmente en análisis factorial; d) cuestionarios de intereses, empleados frecuentemente en orientación vocacional, como los test de preferencias vocacionales, y e) cuestionarios de actitudes, usados sobre todo en la investigación de mercado y en los sondeos de opinión, que tratan de medir la tendencia a reaccionar ante determinados estímulos.

Tabla 2Evaluación de la competencia escolar mediante test (tomado de Muñoz y García, 2006 pp. 92-93)

26


Técnicas proyectivas, que pretenden revelar aspectos de la personalidad con la finalidad de establecer un diagnóstico mediante un análisis cualitativo de las respuestas. Suelen contener elementos como escenas, dibujos, manchas de

27

Test Autor(es) Alumnos Observaciones

Test BADYG (Batería de aptitudes diferenciales y generales)

BADYG-1Yuste (1999)

1er y 2do grado de primaria

Miden a la vez que los conocimientos académicos un factor “G” de inteligencia, distinguiendo la madurez intelectual verbal y no verbal.

BADYG-2

Yuste

(1999)

3er y 4to grado de primaria

BADYG-3

Yuste

(1999)

5to y 6to grado de primaria

Test BetaMartín y Ortega (1996)

Para cada grado desde 1ro hasta 6to de primaria

Factor verbal-educativo (verbal, numérico, abstracto y memoria).Factor técnico-mecánico (espacial, mecánico y atención-percepción).

EVALÚAGarcía y González (1996)

Evaluación final de cada uno de los grados de primaria.

Aportan información del potencial de aprendizaje, de la competencia curricular del alumno y de su conducta adaptativa.

Test de rendimiento escolar (TRES)

Jiménez y Sellers (1995)

5to y 6to de primaria

Rendimiento escolar en cuanto a inteligencia del vocabulario, cálculo y procesamiento lector.


tinta, colores, palabras, etc. Estas técnicas pueden clasificarse (Fernández Ballesteros, 1980) en:

Test estructurales, en los que el sujeto debe interpretar estímulos visuales poco estructurados (Test de Psicodiagnóstico de Rorschach, Test “Z” de Zulliger).

Test temáticos, ante cuyos elementos el sujeto debe inventar una historia (TAT o Test de Apercepción Temática para adultos, CAT o Test de Apercepción Temática para niños).

Test expresivos, en los que el sujeto realiza generalmente un dibujo (Test de la Figura Humana de K. Machover, Test del Árbol de Kohs).

Test constructivos, en los que el sujeto debe construir algo (Test del Pueblo).

Test asociativos, entre los que son frecuentes los de asociación de palabras.

1.2 Aplicación del test. Normas Generales

No es nuestro propósito en este capítulo extender todo lo que sería necesario sobre la discusión de cuestiones específicas y procedimientos deseables a la hora de aplicar un test, ya que esto podría ser objeto de un manual completo y porque entendemos que la formación en las técnicas de aplicación de la amplia tipología de test debe realizarse en marcos específicos. Nos limitaremos pues a apuntar aquellos aspectos generales a tener en cuenta en cualquier caso, ya sea que se trate de test colectivos o individuales, ya sea que tengan unos objetivos clínicos o educativos, ya sea que posean una finalidad diagnóstica o terapéutica.

La preparación previa del examinador es el requisito más importante para la correcta aplicación de un test. Como señala Anastasi (1978), en la aplicación de un test no pueden surgir imprevistos, y esto sólo se asegura preparando previamente las sesiones. Es esencial, en primer lugar, recordar las instrucciones de memoria, ya que eso permite una actuación más natural, así como preparar los materiales necesarios para la aplicación de la prueba. Otro requisito es el ensayo del procedimiento, realizando aplicaciones de prueba para entrenarse, realizando aplicaciones de prueba para entrenarse y para solventar dudas y problemas que puedan surgir a lo largo de la aplicación, máxime cuando se trate de un test colectivo, en el que quienes examina y quienes vigilan deben estar familiarizados con las funciones que va a realizar cada uno de ellos.

28


Deben respetarse las instrucciones del correspondiente manual de aplicación tanto en lo que se refiere a las consignas que se dan a los sujetos como al tiempo de aplicación de cada prueba, ya que hay que tener en cuenta que las normas de interpretación del test han sido construidas según las reglas de aplicación que aparecen en dicho manual. Por otra parte, deben cuidarse las condiciones en que se aplica. La situación ambiental es una parte del procedimiento tan importante como las instrucciones y el material. Debe procurarse que la administración del test se lleve a cabo en una habitación libre de ruidos y distracciones, provista de iluminación adecuada y espacio suficiente para trabajar. Asimismo, deben prevenirse las interrupciones mediante señales de aviso en la entrada u organizando algún tipo de vigilancia. En el caso de test con hojas de respuesta, se debe vigilar muy de cerca la correcta anotación de las respuestas por parte del sujeto, ya que esto va a garantizar también la adecuada corrección. Pero no sólo deben cuidarse estas condiciones de aplicación, sino que también es necesario el entrenamiento en cómo proporcionar la información derivada del test. Debe procurarse que esta información se adecue en estilo y léxico a las personas a las que va dirigida, ya sea el propio sujeto o sus padres. También se debe ser cauteloso para prevenir los efectos emocionales que tal información puede ocasionar. En conclusión, la aplicación de un test y su interpretación deben ser realizadas por profesionales preparados para ello, requiriendo una formación muy específica tanto en la práctica como en la teoría de los test.

Lección III

Concepto de test psicométrico y sus características2

2 Texto basado en Abad, F., Garrido, J., Olea J. & Ponsoda, V. (2006). Introducción a la Psicometría. Teoría Clásica de los Test y Teoría de Respuesta al Item. Madrid: Universidad Autónoma de Madrid.

29


1. Paradigmas Psicométricos

Generalmente los modelos formales sobre los que se basan la construcción de los test son de naturaleza matemático-estadística. Mucho de lo que se tratará en este capítulo es tratado con profundidad en otros textos de la materia (Muñiz, 1996), pero el tema de este manual obliga a que se pase revista a los fundamentos y prácticas en que se apoya la “Teoría Clásica de los Test” (TCT).

Son ciertamente dos enfoques en la teoría de los test; la Teoría Clásica de los Test dio vida al movimiento de los test y a la medición psicológica utilizando estos instrumentos; la Teoría de Respuesta al ítem, aparece en orden a superar las limitaciones conceptuales y prácticas que presentaba la teoría clásica. Ambos enfoques no son opuestos, más bien el segundo complemente al primero, supera las limitaciones de la teoría clásica y amplía los horizontes de la Psicometría con nuevos desarrollos en la teoría general de los test, lo que es normal en el desarrollo dialéctico de la ciencia. Aquí nos referiremos a la TCT pues es hasta hoy el modelo más empleado en la construcción de instrumentos psicométricos.

1.1 Teoría Clásica de los Test (TCT)

El primer modelo de puntuación observada, a través del cual se intentó tratar el problema de la incertidumbre o error inherente a cualquiera de las medidas realizadas mediante la aplicación de un test, fue el presentado por Spearman en 1904, donde planteó el clásico Modelo Lineal de Puntuaciones. La teoría basada en el modelo de Spearman, fue denominada también Teoría de las Puntuaciones Verdaderas o Teoría Clásica de los Test.

Denominamos Teoría Clásica de los Test a la matriz de principios teóricos y métodos cuantitativos en los que se basa la construcción de test psicológicos; incluye la elaboración de reactivos, el establecimiento de los criterios de confiabilidad y la validez y las técnicas de escalamiento (Alarcón, 1998).

En sus inicios, la construcción de pruebas psicológicas estuvo dominada por la preocupación de determinar las propiedades estadísticas del test y sus elementos, fue una etapa pragmática en que estuvieron casi ausentes teorías acerca de los rasgos psicológicos que se intentaban medir. En su desarrollo posterior, se advierte el predominio del análisis factorial, interesado en analizar la estructura de conductas complejas; los test se construyen sobre la base de los

30


factores descubiertos estadísticamente, considerándose que una prueba poseía validez de constructo en la medida en que medía dichos factores.

Las hipótesis básicas de la teoría clásica de los test (TCT) son las de un modelo aditivo lineal, donde la variable endógena o dependiente es la que corresponde a la puntuación observada en las pruebas; y la variable exógena o independiente es la correspondiente a las puntuaciones verdaderas de los sujetos.

Hipótesis

1. Hipótesis Fundamental: Cualquier puntuación observada X es función de dos componentes, que son la puntuación verdadera V del sujeto y el error e.

X = V + e

En esta relación, X juega el papel de una variable aleatoria sobre una población P de individuos que toma valores V = vg sobre g personas de una población de tamaño N. La variable V es otra variable aleatoria asociada que toma valores V = vg sobre P.

2. Hipótesis de nulidad de los errores: Los errores, en promedio, se anulan. Por lo tanto, en el modelo hay que suponer que la media aritmética de los errores es cero. Esto indica que su esperanza matemática es cero:

E (e) = 0

Además de ésta, se pueden hacer considerar otras hipótesis acerca de los errores pues para hacer inferencias se supone además que los errores se distribuyen según una ley normal y que el modelo es homostástico, es decir, que para cualquier i , j las variancias de los errores son iguales.

3. No existe correlación entre las puntuaciones verdaderas y el error en una misma prueba.

4. No existe correlación entre los errores:

5. No existe correlación entre las puntuaciones verdaderas y los errores en formas distintas de un mismo test o en tests diferentes:

31


De las hipótesis del modelo lineal de Spearman se deducen las siguientes relaciones:

a) El valor esperado de la puntuación verdadera es igual al valor esperado de la puntuación observada:

E (V) = E(X)

Es decir, bajo los supuestos del modelo, las medias de las puntuaciones observadas y las verdaderas coinciden.

b) La ecuación de regresión de la puntuación observada sobre la puntuación verdadera es la ecuación de una línea recta que pasa por el origen y que tiene pendiente unidad.

c) La variancia de las puntuaciones observadas es igual a la suma de la variancia de las puntuaciones verdaderas más la variancia de los errores.

s2X = s2V + s2e

Esta es una consecuencia inmediata de la hipótesis de no correlación entre la puntuación verdadera y el error.

d) El cuadrado del coeficiente de correlación lineal entre las puntuaciones observadas y sus correspondientes puntuaciones verdaderas, es igual a la razón de la variancia de las puntuaciones verdaderas con respecto a la variancia de las observadas.

e) De la expresión del coeficiente de determinación, como razón entre variancias, y de S2X=S2V + S2e se deduce otra expresión para r2 XV:

f) El cuadrado de la correlación entre la puntuación observada y el error es igual a la razón de la variancia de los errores con respecto a la variancia de las puntuaciones observadas:

g) Una nueva relación es la complementariedad a uno del cuadrado de ambos coeficientes de correlación.

2. Test Psicométrico

32


De acuerdo con Aliaga (2007), un test psicométrico puede ser definido como un procedimiento estandarizado compuesto por ítems seleccionados y organizados, con el objetivo de provocar en el individuo una serie de reacciones registrables en cuanto a su complejidad, duración, forma, expresión y significado.

2.1 Requisitos de un test psicométrico

Para que un test pueda ser clasificado como test psicométrico, debe cumplir con una serie de requisitos (Aliaga, 2007):

a) El contenido y la dificultad de los ítems están sistemáticamente controlados mediante el proceso de construcción del test.

b) El proceso de administración del test, el ambiente en el cual se administra y el material del test, debe estar bien definido y debe ser reproducida idénticamente para todos los sujetos examinados con el test.

c) El registro del comportamiento evocado en el sujeto examinado debe ser preciso y objetivo. En este sentido, las condiciones del proceso de registro deben estar bien definidas y cumplidas rigurosamente.

d) El comportamiento registrado debe ser evaluado estadísticamente con respecto al de un grupo de individuos llamado grupo de referencia o normativo.

e) Los sujetos examinados son clasificados en función de normas resultantes del examen previo del grupo de referencia o normativo (baremo).

f) Las respuestas a las interrogantes planteadas dan una medida correcta del comportamiento al que se refiere el test (validez).

g) Si las condiciones no cambian, una reevaluación, con el mismo test, debe conducir siempre al mismo resultado, o a otro muy próximo (confiabilidad).

2.2 Clasificación de los test psicométricos

Encontramos varias clasificaciones. Aliaga (2007, p. 89) nos presenta la siguiente:

Tabla 3.Clasificación de los Test Psicométricos (tomado de Aliaga, 2007, p. 89)

CRITERIO CLASIFICACIÓN1. Por su forma de dar instrucciones.

Orales. Escritos (aunque en algunos casos

hay que ejemplificar lo que se quiere que el sujeto realice en la tarea, como en el caso de personas con problemas auditivos.

33


2. Por su administración Individual. Colectiva. Autoadministrada.

3. Por la forma o tipo de respuesta que exigen

Objetivas. Subjetivas.

4. Por el material de la prueba Lápiz y papel Verbal completamente De ejecución (material, manual,

visomotor) De aparatos especiales Combinación de los tres primeros

(Ej.: WAIS)

5. Por su forma de calificación Manual Electrónica

6. Por sus edades límites de aplicación

Pruebas para infantes (baby test) Pruebas para preescolares Pruebas para escolares Pruebas para adolescentes Pruebas para adultos

7. Por su libertad de ejecución Pruebas de poder (power test) Pruebas de rapidez (speedy test)

2.3 Aplicaciones del test psicométrico

En su labor cotidiana, el psicólogo debe tomar variadas decisiones, ya sea en el diagnóstico o en investigación científica. En este sentido, los resultados derivados de la aplicación del test psicométrico pueden brindar apoyo para una mejor toma de decisiones en los siguientes campos:

- En la selección de personal, la decisión, por ejemplo, recae en aceptar o rechazar a un postulante o solicitante para un determinado puesto de trabajo.

- En el diagnóstico, clínico o educativo, la decisión estriba respecto al tipo de tratamiento psicopedagógico o psicoterapéutico a seguir.

- En investigación, los resultados de la aplicación del test psicométrico se utilizan para tomar decisiones acerca de la elaboración de hipótesis, formulaciones teóricas, recolección de la información necesaria, etc.

34


- En evaluación, ayuda en la decisión de otorgar, por ejemplo, la calificación que se merece un alumno o el punto hasta el cual un determinado procedimiento es o no eficiente (Brown, 1980).

2.4 Limitaciones en el uso de un test psicométrico

Los test psicométrico pueden presentar las siguientes limitaciones en su uso:

1) La aplicación de un test debe dirigirse solamente a la apreciar de los aspectos para las cuales se ha elaborado.

2) Las normas (o baremos) de una prueba no tienen validez universal. Sólo son válidas si los individuos a quienes se aplica un determinado test poseen características similares a las de los sujetos que formaron la muestra que sirvió para obtener dichas normas.

3) Se deben construir normas para los grupos en los cuales se usará el test, si esos grupos difieren de aquellos en los cuales se hicieron los baremos que aparecen en el manual de la prueba.

4) Un test permite apreciar el proceso psicológico medido tal como se dan en el individuo en el momento de aplicación de la prueba. Si las condiciones que influyen sobre el individuo se modifican, existe la posibilidad de que tales cambios influyan en los puntajes resultantes del test.

5) Los resultados de un test no deben emplearse para diagnosticar estados patológicos específicos. Deben considerarse como elementos de información que juiciosamente analizados e integrados con otros elementos de información ayudarán al diagnóstico.

6) Las categorías descriptivas (como, inteligencia muy superior, superior, etc.) deben utilizarse solamente para los test cuyos puntajes le dieron origen. Por ejemplo, la tabla de categorías del WAIS sólo debe ser utilizada con este test y no con otro (Anastasi, 1978).

2.5 Partes de un test psicométrico

Un test psicométrico generalmente presenta las siguientes secciones o partes:

1. El test propiamente dicho.

2. El manual del test. Es el documento que contiene los siguientes capítulos o partes:

a) Exposición de los objetivos de la prueba, referida a la indicación acerca de qué mide la prueba. Esta sección

35


generalmente inicia con un resumen mostrado en la denominada ficha técnica.

b) Una descripción de las características estructurales del test (sus partes y componentes).

c) Instrucciones generales sobre la manera de administrar la prueba, así como del tipo de población en la cual es aplicable.

d) Descripción del material de la prueba propiamente dicha, instrucciones detalladas para la aplicación del test o de cada uno de los subtests.

e) Instrucciones para la calificación de las respuestas obtenidas en cada uno de los subtests.

f) Información estadística y psicométrica acerca de las propiedades de la prueba como instrumento de medida, vale decir, confiabilidad y validez.

g) Información acerca del proceso de estandarización o tipificación.

h) Indicación de las tablas de normas o baremos con los puntajes directos y convertidos para los diferentes grupos de edades y poblaciones. Los puntajes convertidos son, usualmente presentados en percentiles y puntajes estándar (Cronbach, 1972).

TEXTO SELECCIONADO 1

MEDICIÓN: ALGUNAS CONSIDERACIONES METODOLÓGICAS3

El proceso de medición forma parte de la práctica diaria de todos los profesionales de salud; está presente por ejemplo, en la evaluación de la capacidad funcional de los adultos mayores, en la detección de actitudes hacia el beber problema, o en la valoración del dolor subjetivo de un paciente. La aplicación de cuestionarios o escalas generan mediciones que muchas veces determinan importantes decisiones pronosticas y terapéuticas; sin embargo, en la mayoría de los casos se desconoce el origen y capacidad real del instrumento para evaluar la condición bajo estudio.

Medición es simplemente el proceso de asignar valores a ciertos eventos de la realidad. La dificultad del proceso radica al menos en dos aspectos: que el valor represente realmente el evento que se quiere medir, y que el evento sea expresado en toda su complejidad. En medicina, los

3 Extracto de: Ana, Alarcón & Muñoz (2008). Medición en salud: Algunas consideraciones metodológicas. Revista Médica de Chile. 136 (1), 125-130

36


instrumentos para determinar la condición biológica de un paciente han experimentado tal desarrollo tecnológico, que han logrado disminuir la incertidumbre de los resultados de una medición. No obstante, es la medición de salud como fenómeno psicosocial que requiere refinar la precisión de sus instrumentos, dado que el objetivo principal en este campo de la salud es recoger, en forma válida y confiable, la percepción subjetiva de los pacientes.

Generación y selección de ítems de un instrumento de medición en salud. La etapa inicial en la construcción de un cuestionario o escala que tenga por objetivo recoger la percepción u opinión de los pacientes, implica los siguientes pasos: a) definir con máxima precisión el objeto de la medición, b) atribuir a los objetos o eventos de salud ciertos indicadores que expresen conceptualmente las propiedades del objeto que se pretende medir, y c) reflejar la variabilidad entre los sujetos que están siendo objeto de medición. Habitualmente el investigador parte de ideas que provienen de su experiencia clínica, del análisis de literatura científica, y de diálogos con sus pacientes y colegas, de esta forma produce una conceptualización que le permite identificar dimensiones y variables de su objeto de estudio.

Este proceso implica la construcción y reconstrucción del concepto que se quiere medir en la población; tomemos como ejemplo la definición del concepto "calidad de vida", y la identificación de sus propiedades manifiestas, tales como, "estar bien", "sentirse feliz", "dormir bien", "visitar amigos", entre otras; son justamente estas propiedades o características las que contribuirán a reconstruir el concepto "calidad de vida" como objeto de medición.

En esta fase, que podríamos llamar exploratoria, la incorporación de métodos y técnicas cualitativas de investigación tales como, entrevistas en profundidad, observaciones no estructuradas, y grupos focales constituyen herramientas esenciales para indagar en la condición subjetiva de los pacientes, produciendo descripciones y explicaciones a procesos, contribuyendo a delimitar marcos teóricos, y mejorando la comprensión del contexto en que se produce el evento de salud". En consecuencia, son las representaciones de los sujetos, más las propias del investigador clínico, las que se configuran como ítems en un cuestionario. Estas formas de obtención de ítems equivalen a las fuentes de datos necesarios para lograr una muestra representativa de los ítems.

Consideraciones sobre el diseño del instrumento de medición. El diseño de un instrumento de medición -sea éste escala o cuestionario-, depende de múltiples factores entre los que podemos mencionar: el objetivo para el cual se propone el instrumento, los recursos financieros para su construcción y prueba, acceso a la información, edad y educación de los pacientes quienes serán objeto de medición, y el nivel de precisión de la medida que se pretende obtener. El conjunto de estos factores determinará la extensión

37


del instrumento, el formato, y su presentación; sin embargo lo más relevante en el diseño es la decisión del investigador clínico sobre el nivel de medida de sus variables. Por ejemplo, es diferente decirle a un paciente -cualquiera sea su patología-, que construya una lista con sus síntomas, que elija de una lista aquellos que presenta con mayor frecuencia, o que ordene de una lista que el médico le presenta, aquellos que le provocan mayor molestia. La decisión por una u otra forma dependerá tanto de los intereses del clínico en profundizar sobre los síntomas de sus pacientes, de la aplicación de los resultados; como de la calidad de sus variables, es decir, hasta dónde su variable le permite variar en respuesta. En resumen, lo que se intenta es representar la variabilidad de respuestas entre los pacientes a los que se les aplicará finalmente el instrumento7.

Calidad y pertinencia de un instrumento: temas de validez y confiabilidad. La determinación de la calidad de un instrumento implica plantearse preguntas tanto de la exactitud con que mide el fenómeno bajo estudio, la estabilidad de la medición o resultado, como de la pertinencia del instrumento para los sujetos o realidad en que se aplican las mediciones. Por ejemplo, un clínico que evalúe la calidad de vida de sus pacientes sea ésta en forma específica o genérica, se enfrenta a la incertidumbre de si los valores obtenidos a través del cuestionario reflejan o no la condición del paciente, si el instrumento es capaz de detectar diferencias entre los sujetos, si cambios en los resultados de la medición en un paciente son consecuencia de cambios en su condición de salud, y finalmente si las preguntas del cuestionario fueron respondidas comprensivamente por el paciente.

Determinación de la validez de un instrumento. La validez de un instrumento se refiere a la pertinencia de las inferencias realizadas a partir de las mediciones; en otras palabras, validez significa cuán bien un resultado obtenido refleja al fenómeno bajo estudio, o la capacidad del instrumento para medir la cualidad para la que fue construido. Por ejemplo, un test que mida depresión en un paciente debe dar cuenta de la calidad y magnitud de ese fenómeno, y no del stress de ese paciente; por lo tanto, cuando un investigador clínico construya un cuestionario o intente aplicar alguno ya existente debe -en primer término-examinar con profundidad la naturaleza del evento que desea medir (llámese depresión, stress, angustia, calidad de vida, etc.), y al mismo tiempo, examinar si las variables del cuestionario representan en forma precisa el fenómeno que desea medir.

Existen diversas formas de determinar la validez de un instrumento, no obstante la distinción entre ellas, refleja más una necesidad operativa que conceptual para el investigador. Entre éstas se encuentran la validez de: a) criterio, b) constructo, y c) contenido.

38


ACTIVIDADES DE AUTOAPRENDIZAJE

1. Compara tu concepto acerca de medición psicológica y de los expuestos en el presente capítulo y escribe a continuación el concepto sobre medición psicológica.

2. Elabora un cuadro comparativo acerca de los niveles de medición nominal, ordinal, de intervalo y de razón.

ESCALA CARACTERÍSTICAS EJEMPLO

Escala Nominal

Escala Ordinal

39


Escala de Intervalo

Escala de Razón

AUTOEVALUACIÓN 1

1. Relacionar en qué consiste la medición en ciencia físicas y la medición en psicología:a) Medición directa. 1) Medición físicab) Medición indirecta.c) Objeto concreto. 2) Medición psicológicad) Constructo

2. El tipo de escala que permite hacer todo tipo de cálculos estadísticos es:a) Nominal.b) Ordinal.c) Intervalo.d) Razón.

3. Las características y conductas que pueden tomar diferentes valores cuantitativas o cualitativas se denominan.a) Medición.b) Variable.c) Evaluación.d) Definición.

4. Cuando diferenciamos a las personas en relación a ser religioso o no religioso estamos:a) Realizando una medición ordinal.b) Creando orden.c) Estableciendo una categoría.d) Ninguna de las anteriores.

40


5. Marca verdadero (V) o falso (F)

a. La aplicación de un test debe dirigirse a apreciar todos los aspectos de la conducta humana. ( )

b. Se deben construir normas específicas para los grupos en los cuales se usará el test. ( )

c. El comportamiento registrado debe ser evaluado cualitativamente con respecto al de un grupo de individuos llamado grupo de referencia o normativo. ( )

6. Según Stevens, la medición, en general es:a) Asignar símbolos solamente a eventos psicológicos.b) Asignar numerales a objetos o eventos de acuerdo a reglas.c) Asignar numerales solamente a eventos objetivos.d) Contar objetos o eventos de acuerdo a reglas.

7. La medición psicológica, utilizando test, consiste en:a) Describir conductas.b) Asignar números a una variable de conducta no importando el

empleo de reglas específicas.c) Asignar números a una variable de la conducta, cuya ejecución se

cuantifica, siguiendo reglas específicas.d) Relacionar conductas específicas.

8. La medición en psicología busca:a) Medir solamente aspectos físicos y directamente observables.b) Medir sólo las conductas anormales de las personas que sean

observables.c) Relacionar conductas observables entre dos personas.d) Medir aspectos que no son físicos ni directamente observables.

9. Los test de inteligencia general son:a) Test de rendimiento máximo.b) Test de ejecución típica.c) Inventarios autodescriptivos.d) Técnicas proyectivas.

10. No es una parte de un test psicométrico:a) El manual del test.b) Instrucciones generales sobre la manera de administrar la prueba.c) Indicación de las tablas de normas o baremos.d) Resumen curricular de los autores del test.

41


EXPLORACIONES ON-LINE

BIBLIOGRAFÍA

Ana, Alarcón & Muñoz (2008). Medición en salud: Algunas

consideraciones metodológicas. Revista Médica de Chile. 136 (1), 125-130.

Alarcón, R. (1998). La Teoría Clásica de los Test. Logros y limitaciones. En Universidad de San Martín de Porres (Ed.) Nuevos modelos en la medición psicológica (pp. 9-30). Lima: Autor.

Aliaga, J. (2007). Psicometría: Tests Psicométricos, Confiabilidad y Validez. En A. Quintana & W. Montgomery (Eds.) Psicología. Tópicos de actualidad (pp. 85-108). Lima. Universidad Nacional Mayor de San Marcos.

42

RESPUESTAS: a1; b2; c1; c2. 2) d. 3) b. 4) c. 5) aF; bV; cF. 6) b. 7) c. 8) c. 9) a. 10) d.

http://www.claudiogutierrez.com/Ciencia.html http://www.uv.es/meliajl/Research/LibroCP/CPindex.htmhttp://www.conocimientoysociedad.com/sentidocomun.htmlhttp://www.salvador.edu.ar/publicaciones/pyp/15/La_Investigacion_Cientifica_en_Psicologia_%20un_Desarrollo_Historico.pdfhttp://www.arp-sapc.org/articulos/psicologia.htmlhttp://www.visionlearning.com/library/module_viewer.php?mid=45&l=shttp://www.comminit.com/es/node/24555/37http://www.cneq.unam.mx/cursos_diplomados/diplomados/basico/educien0607/porta/equipo2/Modelocientifico.htm


Anastasi, A. (1978). Test Psicológicos. Madrid: Aguilar.

Brown, F. (1980). Principios de la medición en psicología y educación. México: Ed. Manual Moderno.

Bunge, M. (1973). La investigación científica. Barcelona: Ariel.

Cortada, N (1999). Teorías psicométricas y construcción de test. Buenos Aires: Lugar Editorial.

Cohen, R., & Swerdlik, M. (2001). Pruebas y Evaluación Psicológicas: Introducción a las pruebas y a la medición (4ta ed.). México: McGraw-Hill.

Cortada, N (1999). Teorías psicométricas y construcción de test. Buenos Aires: Lugar Editorial.

Cronbach, L. (1972). Fundamentos de la exploración psicológica. Madrid: Biblioteca Nueva.

Delgado, A., Escurra, M. & Torres, W.

(2006). La medición en psicología y educación. Teoría y aplicaciones. Lima: Ed. Hozlo.

Fernández-Ballesteros, R. (1994). Psychological Assessment. Applied Psychology. An International Review, 43, 157-175.

Grzib Schlosky, G. (1985). Los test psicológicos. En J. Morales (Coor.) Metodología y teoría de la psicología. Madrid: UNED.

Guilford, J. (1954). Psychometric methods (2 ed.). New York:McGraw-Hill Book Company.

Kerlinger, F. (1965). Foundations of behavioral research. New York: Holt, Rinehart & Winston.

Kerlinger, F. (1975). Investigación del comportamiento. Técnicas y metodologías. México: Interamericana.

Magnuson, D. (1969). Teoría de los test. México: Trillas.

Muñiz, J. (1996). Psicometría. Madrid: Universitas.

Muñoz, A. & García, M. (2006). Instrumentos de evaluación psicológica en el contexto escolar. En M. Trianes & J. Gallardo (Eds.) Psicología de la educación y del desarrollo en contextos escolares (pp. 85-98).

43


Madrid: Pirámide.

Nunnally, J. (1987). Teoría psicométrica. México: Ed. Trillas.

Spearman, C. (1904). General intelligence objectively determined and measured. American Journal of Psychology, 15, 201–293.

Stevens, S. (1951). Handbook of experimental psychology. New York: Wiley.

Stevens, S. (1970). Measurement, statistics and schemapiric view. En d., Forcese & S. Richer (Eds.) Stages of social research, contemporary perspectives (pp. 76-92). New York: Prentice-Hall.

44

BIBLIOGRAFÍA COMENTADA

Martínez Arias, R.; Hernández, M. & Hernández, M. (2006). Psicometría. Madrid: Alianza Editorial.

En el libro se exponen conceptos, métodos y procedimientos para la construcción, evaluación y aplicación de instrumentos de medida en Ciencias Sociales. Se describen los fundamentos de la medición y las principales teorías en que se basan dichos instrumentos. Lo anterior permite fundamentar las inferencias y usos de la aplicación de test. Se exponen diversas maneras de interpretación de las puntuaciones referidas a normas y criterios. El libro incluye una cantidad abundante de ejemplos procedentes de bases de datos reales, estando acompañados del tratamiento informático oportuno.


Segunda

UNIDAD

Elaboración del Instrumento Psicométrico

“El consejo más importante para los futuros elaboradores de pruebas es poner cualquier esfuerzo y recursos que se requieran para hacer bien el trabajo,

incluso si los resultados en el proceso toman más tiempo de lo deseado o anticipado. Hacer bien el trabajo en las primeras etapas de planeación y elaboración

propiciará que su trabajo sea mucho más fácil posteriormente y de seguro dará como resultado propiedades psicométricas más sólidas para su pruebas”

Kenneth W. Merrell, Ph.D.Extracto del Test Developer Prrofile publicado en Cohen (1999)

y en internet en www.mayfieldpub.com/psychtesting

¿Cuál es el propósito de un test psicométrico?

45


¿Por dónde debemos empezar a elaborar nuestro test

psicométrico?

¿Cuál es el formato que debemos darle a nuestro test

psicométrico?

Competencias

CONCEPTUALES:

Define el propósito del test psicométrico. Identifica los principios que orientan la traducción del

test en términos operacionales

PROCEDIMENTALES:

Aplicar la investigación psicométrica y las diferentes teorías de la medición psicológica en el análisis de investigaciones, destacando la utilidad de la misma con sentido crítico.

Diseña el proceso de construcción de un instrumento y elabora proyectos de construcción de pruebas.

ACTITUDINALES:

Valora la necesidad de conocer los principios y etapas en los que se basa para la elaboración del pretest.

Valora la importancia de la aplicación del pretest como paso previo del proceso de construcción del test psicométrico.

46


CONTENIDO TEMÁTICO

Lección I: Propósito del Test Psicológico.

Consideraciones previas al proceso de construcción de una prueba

Especificación de la finalidad de un test psicológico

Lección II: Traducción de la finalidad del test en términos operacionales.

Contenido del testFormato del test

Lección III: Elaboración del Pre-test

Pretest.Ítem.

Construcción Provisional del Cuestionario.

47


ESQUEMA CONCEPTUAL

Lección I

48

Traducción a términos Operacion

ales

Propósito del Test

Psicológico

Elaboración del Pre Test

CONCEPTOS CLAVE

Definición conceptual, definición operacional, Pretest, ítems, constructo, variable,

tabla de especificaciones


Propósito del Test Psicológico

El diseño y construcción de test psicométrico es una tarea que requiere de capacidad creatividad e imaginación así como de ensayos experimentales elaborados de parte del constructor o constructores. Un test psicométrico bien construido y adecuadamente utilizado constituye un valioso instrumento auxiliar o de ayuda para el trabajo profesional del psicólogo, que hace bien en rechazar o dejar de lado pruebas que no han sido cuidadosamente elaboradas en base a las normas o reglas pre-establecidas por la psicometría.

1. Consideraciones previas al proceso de construcción de una prueba.

El profesional psicólogo antes de iniciar el proceso de construcción de una prueba psicológica debe tener en cuenta algunos puntos importantes, que en muchas ocasiones, se pasan por alto con mucha frecuencia.

a. En muchas ocasiones, una prueba psicológica debe considerarse sólo una entre varias técnicas posibles de obtención de la información que se desea. Por ejemplo, si queremos evaluar el desarrollo motor grueso de infantes de 2 a 24 meses de edad, podemos hacerlo mediante una prueba construida explícitamente para esto, del mismo modo, podemos solicitarle a los padres que califiquen el desarrollo motor grueso de sus hijos. Es decir, hay más de una manera de poder evaluar un determinado fenómeno, y si existe algún otro método más preciso o práctico para obtener la información que se desea, se deberá utilizar de preferencia a un test. En caso de que lo mencionado anteriormente no exista, recién de deberá optar por construir una prueba.

b. Se debe considerar que existen publicaciones disponibles e incluso pruebas listas para ser utilizadas en la mayoría de los campos de la actividad psicológica. En tales casos, el psicólogo puede emplear una prueba existente en lugar de construir otra nueva; pudiendo también adaptar una prueba de acuerdo a sus necesidades. El mayor inconveniente que podría surgir es que, no hayan pruebas publicadas que sean óptimas para una determinada tarea, que es la que le interesa a determinado psicólogo-, y que por lo tanto se vea en la necesidad de elaborar una prueba. Frente a esta situación, se debe considerar que el profesional psicólogo debe estar informado acerca de la bibliografía respectiva.

2. Especificación de la finalidad de un test psicológico

49


Previa a la construcción del test debe quedar perfectamente definido el propósito del test, así como las características de los sujetos a quien esta dirigida la prueba psicológica.

2.1 Propósito del test psicológico

El psicólogo debe fundamentar teóricamente el test psicológico que va a construir, así como presentar, de manera explícita y completa, la finalidad o propósito de la prueba.

Fundamentación teórica del test psicológico

Los fundamentos psicológicos de un test se reflejan en su contenido y en lo que se propone medir. Al referirnos a la función psicológica o conducta que se propone medir generalmente se realiza lo siguiente:

a. Explicar la naturaleza de la conducta a medir, su probable relación con otras conductas, así como la importancia de su conocimiento para una adecuada interpretación de determinados aspectos de las aptitudes, capacidades, rasgos, etc.

b. Describir los recursos de que se ha valido para poner de manifiesto lo que se propone medir, la naturaleza de los procesos psicológicos que comprenden esos recursos y su vinculación con los criterios, especialmente externos, que es el objetivo final del examen psicológico.

Definición del constructo

El primer paso para la construcción de un test psicológico consiste en proporcionar una definición operacional del constructo o rasgo que pretendemos medir. Por ejemplo, si hablamos de dogmatismo, debemos establecer los diversos componentes o manifestaciones del mismo: dogmatismo ante la política, ante la educación de los hijos, ante la religión, en las relaciones familiares, etc.

Constructo

En la elaboración de teorías que expliquen los mecanismos subyacentes a la conducta, los científicos suelen acudir a la creación de constructos. Este término, por tanto, hace referencia a conceptos que han sido postulados con un propósito científico. A veces se los llama constructos hipotéticos para indicar que no se les considera como objetos y eventos reales. La mayoría de las teorías acerca de la conducta incluyen constructos tales como inteligencia, motivación, aprendizaje, etc. Hay que tener en cuenta que estas palabras pueden poseer una doble acepción. Por ejemplo, a un nivel observacional nosotros podemos hablar de inteligencia, partiendo de las

50


puntuaciones obtenidas en un test X e indicar qué niños son más inteligentes que otros. Sin embargo, como constructo científico, el término inteligencia puede usarse para explicar la variabilidad de los sujetos en la resolución de problemas a pesar de utilizar en el aprendizaje métodos similares.

Variables

El término variable hace referencia a una propiedad o característica que puede adoptar distintos valores. En medición, una variable, por tanto, es un símbolo al que pueden serle asignados valores numéricos o modalidades diversas.

De acuerdo a Sánchez y Reyes (2006), toda variable de estudio debe tener dos características importantes: a) tener una referencia conceptual y, b) la posibilidad de ser cuantificable. En relación a la primera de las características, las variables se derivan de un concepto o constructo teórico, los cuales manifiestan un conocimiento de la realidad a un nivel esencial, general y abstracto. En relación a al segunda, las variables requieren ser cuantificables para poder operar sobre una realidad concreta. La cuantificación posibilita un mejor control y manipulación de las variables. Variables importantes en psicología son el sexo, inteligencia, clase social, motivación, etc. De ellas, unas reflejan una variación cuantitativa como los diferentes CI obtenidos en un test de inteligencia; otras señalan una variación cualitativa como pueden encontrarse al referirnos al sexo o a la clase social.

Al intentar construir un test psicológico, una de las dificultades primeras que se presentan es definir de manera correcta las variables con las que deseamos trabajar. Ello implica indicar claramente lo que queremos medir. En psicología, la dificultad aumenta por la complejidad de los procesos en los que interviene múltiples variables y el esfuerzo para salvar la distancia entre lo que pretendemos medir y lo que realmente medimos. Cuando se afirma: “La madurez lectora influyó en la rapidez para el aprendizaje de la lectura en mayor medida en niños que en niñas” debería preguntarme: “¿Qué se entiende por madurez lectora? O ¿ A qué tipo de aprendizaje lector se está refiriendo?”

Existen dos formas de definir las variables con las que trabajamos. El primero sería utilizar palabras que expliquen en qué consiste el fenómeno a estudiar, es decir, utilizando otros constructos en la definición. El segundo asignaría significados a la variable especificando las actividades u operaciones que han de realizarse para medirla. El primer tipo de definición se denomina constitutiva y

51


el segundo operativa u operacional. Las diferencias entre ambos son considerables.

Una definición constitutiva tiene un objetivo más ambicioso y rico. Pretende mostrarnos la esencia del fenómeno. Intentará, por tanto, presentárnoslo en sus características fundamentales. Muchas veces, en cambio, este tipo de definiciones se reserva a los constructos hipotéticos que, directamente, no son susceptibles de un control riguroso. En la medida que una variable ha sido definida constitutivamente, la generalización se vuelve más fácil y las conclusiones pueden transferirse a otros planteamientos científicos. Sin embargo, existe un riesgo inminente: La validez de esas mismas conclusiones. En efecto, ¿es realmente cierto que mi test esta midiendo las mismas variables tal como han sido definidas?

Las definiciones operacionales pueden ser de dos clases: medidas y experimentales. Las primeras describen cómo la variable va a ser medida. En el ejemplo anterior, podría definir la madurez lectora como las puntuaciones obtenidas en un test de madurez lectora de primer grado. Una definición operacional experimental explica en forma clara los detalles u operaciones de las manipulaciones que efectúa el investigador con una variable. Por ejemplo, la inteligencia puede ser definida como la respuesta original y efectiva que manifiesta una persona al resolver un problema o un reactivo nuevo que se le presenta.

Muy relacionada con esta definición operativa es la cuestión del establecimiento de los objetivos que se pretenden conseguir con el cuestionario. También es necesario especificar el tipo de población al que va a aplicarse la prueba y las decisiones que se pretenden tomar a partir de las puntuaciones que ofrezca. Resulta muy diferente, y determinará su contenido, que un test de inteligencia se vaya a aplicar a personas de la población general o a personas con problemas intelectuales. Un cuestionario de depresión puede utilizarse con fines científicos en una investigación o para decidir el ingreso en un centro psiquiátrico de personas con problemas depresivos.

Finalidad o propósito del test psicológico

Aquí se responde a la pregunta qué mide el test psicológico. Esto también se relaciona con la declaración explícita de los límites que el test se autoimpone.

Por ejemplo, la finalidad del TSA Test de desarrollo de la morfosintaxis en el niño (Aguado, 2005), es evaluar los elementos

52


sintácticos que determinan funciones semánticas secundarias nominales (singular-plural, masculino-femenino, etc.) y verbales (morfemas de modo y tiempo), así como algunos elementos de superficie que unen proposiciones. También evalúa ciertos elementos sintácticos que determinan funciones semánticas primarias (pasividad, negación, etc.), pero sólo roza lo que ha dado en llamarse la gramática de casos (roles de agente, paciente, poseedor, etc.). Estos están presentes en los ítems, claro está, ya que las frases propuestas significan algo. Pero lo que se pretende explorar es la estructura formal de las fases en las dos vertientes de comprensión y expresión.

Característica de los sujetos a evaluarse.

Aquí se trata de responder a la pregunta: ¿A quiénes está dirigido el test? La respuesta a esta pregunta es muy importante y necesaria ya que se refiere a las características y la composición del grupo de sujetos al que se destina la prueba. Esta respuesta dependerá también del tipo y la finalidad de la prueba, así como de algunas variables como:

a. Edad de las personas a quienes está dirigido el test.b. Nivel intelectual.c. Grado educativod. Nivel socioeconómico.e. Nivel cultural.f. Nivel de lectura.g. Nivel de audición, etc.

Lección II

Traducción de la finalidad del test en términos operacionales

En esta sección, la finalidad del test debe ser traducido en términos operacionales. Es decir, en términos que especifiquen las operaciones que se realizarán en la construcción del test. Esta especificación se realizará en dos área: a) el contenido y, b) el formato del test.

53


1. Contenido del test

La determinación del contenido del test variará en función de que el test sea de rendimiento, de aptitud o de selección.

1.1 Contenido del test si es de rendimiento

Los test de rendimiento deben tener validez de contenido o validez curricular. La validez de contenido constituye el grado en el que los ítems de la prueba constituyen una muestra representativa del universo de reactivos del contenido que se estudia (Nunally, 1973). Existen varias maneras de realizar este tipo de validez:

a. Análisis lógico de los ítems y de la estructura de la prueba.

Consiste en representar, utilizando medios como cuadros y tablas, de modo claro el universo o dominio conductual que le interesa al psicólogo y, a la vez, estudiar de manera lógica y racional los ítems, explicitando en vista del dominio conductual porqué se incluyen en el instrumento (Brown, 1980, Anastasi, 1978).

b. Análisis por criterios de jueces.

Consiste en recibir ayuda de un conjunto de personas calificadas con amplios conocimientos de la temática evaluada, quienes se constituirán en jueces, que evaluarán el grado en que los reactivos concuerdan con los planteamiento realizados por el constructor. El grado de acuerdo de los jueces respecto de los reactivos a incluirse puede ser cuantificado por medio de diferentes coeficientes (Brown, 1980).

Especificando el contenido del test por medio de cualquiera de los procedimientos propuestos en el párrafo anterior, se debe especificar seguidamente las habilidades que se van a medir. En efecto, al medir el contenido del test de rendimiento no sólo debemos hacerlo por la memorización de hechos concretos sino que debemos medir procesos cognitivos más complejos del pensamiento.

Por ejemplo, Feuerstein (1997) propone una taxonomía de operaciones y funciones de pensamiento. Las tabla 4 y 5 permiten tener una visión panorámica de las operaciones del pensamiento en los que se pueden identificar un continuo de operaciones desde simples a complejas y superiores.

Tabla 4

54


Operaciones mentales (Tomado de Tapia & Luna, 2008, p. 8)

Operaciones

Razonamiento lógico Pensamiento divergente Razonamiento silogístico Razonamiento transitivo Razonamiento hipotético Razonamiento analógico Inferencia lógica Análisis-Síntesis Proyección de relaciones virtuales Codificación-Decodificación Clasificación Comparación Transformación mental Representación mental Diferenciación Identificación.

Tabla 5Funciones cognitivas (Tomado de Tapia & Luna, 2008, p. 9)

Funciones de entrada

Funciones de elaboración

Funciones de salida

1 Percepción clara y precisa

1 Percibir el problema y definirlo con claridad.

1 Comunicación descentralizada.

2 Comportamiento exploratorio sistemático

2 Facilidad para distinguir datos relevantes e irrelevantes.

2 Proyección de relaciones virtuales.

55


3 Uso de vocabulario-conceptos apropiados.

3 Ejercitar la conducta comparativa espontánea.

3 Expresión (sin bloqueo) en la comunicación de respuestas.

4 Orientación espacial eficiente.

4 Amplitud y flexibilidad mental.

4 Respuestas certeras (sin ensayo y error).

5 Orientación temporal eficiente

5 Percepción global (no episódica de la realidad).

5 Uso de instrumentos verbales adecuados.

6 Constancia, permanencia del objeto.

6 Uso de razonamiento lógico.

6 Precisión y exactitud en la comunicación de respuestas.

7 Recopilación de datos con precisión y exactitud.

7 Interiorización del propio comportamiento.

7 Eficacia en el transporte visual.

8 Considerar dos o más fuentes de información a la vez.

8 Ejercicio del pensamiento hipotético diferencial.

8 Conducta controlada, no impulsiva.

9 Trazar estrategias para verificar hipótesis.

10 Conducta planificada.

11 Elaboración de categorías cognitivas.

12 Aplicación de la conducta sumativa.

13 Facilidad para establecer relaciones virtuales.

En resumen para establecer el contenido de un test de rendimiento se debe tener en consideración lo siguiente: a) Tener cuidado de que los ítems constituyan una muestra representativa del universo de reactivos del tema o temática que se quiere evaluar. Por ejemplo, ¿Cómo determinaría usted el contenido de un test de analogías para alumnos de 5to grado de secundaria?; b) Precisar el contenido y estableciendo las habilidades a evaluar.

1.2 Contenido del test si es de aptitud

Para determinar el contenido de la prueba de aptitud, teniendo en cuenta lo dicho acerca de la validez de constructo y la relación con el criterio, se debe realizar un muestreo de conductas del dominio conductual. Así podemos indicar cinco niveles:

56


a. Nivel 1: Variable (Inteligencia).b. Nivel 2: Definición conceptual (Capacidad para aprender a partir

de la experiencia)c. Nivel 3: Variables contenidas en la definición (memoria,

capacidad para generalizar y otras variables)d. Nivel 4: Universo de indicadores (Siguiendo el ejemplo, para la

memoria, por ejemplo, repetir números, reproducir dibujos, dar información, etc.; Para la capacidad de generalizar, está el predecir consecuencias, inferir causas, etc.).

e. Nivel 5:Muestra representativa de indicadores (ítems del test)

1.3 Contenido si el test es de selección

Estos test son diseñados para elegir sujetos para una determinada finalidad. En este sentido, las pruebas de selección deben tener validez relacionada con el criterio, lo que implica el disponer de criterios externos independientes del test para evaluar su utilidad mediante un proceso de seguimiento.

El análisis del puesto de trabajo proporciona las bases tanto para la construcción del test como para la elaboración de los criterios. Cuando los test de selección están orientados al criterio (existen otras estrategias para utilizar los test en selección), generalmente presentan un contenido mixto y lo que evalúan no tiene gran importancia si logran una eficiente predicción del éxito e el puesto de trabajo o curso de formación para el cual está siendo utilizado el test. Por tanto, en los test de selección es vital la realización de un análisis de puesto de trabajo para determinar que cualidades son más importantes para el puesto y cómo debe ser evaluadas.

1.4 Tabla de Especificaciones

Establecidos el contenido y las habilidades, se procede a construir una tabla de especificaciones. Esta tabla considera los tópicos que cubrirán el test y las habilidades cognitivas que se medirán en el test, junto con la importancia relativa que se atribuye a cada categoría de contenido y habilidad. La tabla de especificaciones es en el plano del test, especifica con claridad las relaciones entre los objetivos (habilidades) y el contenido temático.

La tabla de especificaciones sirve para dos fines: a) en la etapa de elaboración de reactivos, indica la cantidad y el tipo de ítems a elaborar y, b) cuando se tiene la versión final del test, se puede comparar la distribución real de los ítems con lo establecido en el plan de construcción. Esta prueba nos ayudará, por otra vía, a

57


determinar si los reactivos fueron un muestreo adecuado del universo temático.

Tabla 6Tabla de especificaciones para un test de Algebra

CONTENIDOS

OBJETIVOS

CONOCE la terminología

COMPRENDE principios y generalizaciones

APLICA principios y generalizaciones

ANALIZA principios y gráficos

SELECCIONA técnicas y métodos adecuados

TOTAL

Conjuntos 2 6 2 - - 10

Variables 2 6 2 - - 10

Propiedades numéricas

4 2 2 2 5 15

Operaciones aritméticas

4 2 2 2 5 15

Razón y porcentaje

- - 5 5 - 10

Empleos de números en la medición

4 2 6 8 - 20

Números reales

4 2 6 8 - 20

TOTAL 20 20 25 25 10 100

2. Formato del Test

Al especificar el formato del test, se determinará:

a. El tipo de test: ¿el test será de lápiz o papel, o se requerirá algún tipo de aparato?b. El tipo de ítem: ¿Los ítems serán tipo verdadero y falso o de selección múltiple?c. El tiempo: ¿El test tendrá tiempo límite?, o ¿será un test de velocidad?d. La modalidad de administración del test: ¿El test se aplicará

individualmente, colectivamente, o autoadministrado?e. La extensión del test: ¿Cuántos ítems tendrá el test? Como sabemos la

extensión del test esta relacionada con la confiabilidad, entre otras cosas. Esta decisión dependerá de:

El propósito del test. Los test que brindarán información para tomar decisiones individuales deben tener la más alta confiabilidad y

58


validez, por ello deben tener una razonable longitud. En igualdad de otros factores, los test más largos son más confiables. Por otro, en el pretest se debe elaborar por lo menos el triple de ítems que se ha decidido tenga la versión final.

El tiempo disponible para la aplicación. Que a su vez se encuentra relacionado con: 1) la estructura semántica y el índice de dificultad tentativo, estos aspectos inciden en el tiempo de lectura y resolución de los ítems, que será más elevado que aquellos ítems que apelan sólo a la memoria; 2) el tipo de ítem, los ítems de respuesta breve requieren más tiempo para su resolución que los ítems de selección múltiple; 3) nivel de capacidad de la muestra de sujetos, los ítems pueden ser más fáciles para unas muestras y muy difíciles para otras en igualdad de condiciones. En las muestras de menor capacidad el tiempo de resolución para el test debe ser mayor.

En términos generales, para determinar el formato de la prueba, el psicólogo debe apreciar con exactitud las características de los sujetos que han de tomar la prueba y debe tener en cuenta características de orden práctico.

Lección III

Elaboración del Pre-test

1. Pre-test

Es la versión del test cuando se encuentra en proceso de construcción, generalmente consta del triple de reactivos que tendrá el test en su versión final.

2. Ítem

Es el reactivo o estímulo de un test (o pre-test) cuya resolución correcta determina el incremento de la puntuación total del mismo. A cada ítem se le asigna una determinada puntuación. El incremento de la puntuación de cada ítem bien resuelto se encuentra en relación con el hecho de que el ítem debe medir la misma característica que los demás, y que dicho

59


incremento se fundamenta en el empleo del modelo lineal (Nunally, 1987).

3. Construcción Provisional del Cuestionario

De acuerdo a Abad, Garrido, Olea & Ponsoda (2006) la definición operacional del constructo y de la delimitación de sus componentes debemos llegar a establecer un conjunto de elementos o ítems (frases, preguntas, tareas, etc.) que representen las conductas mediante las que se manifiestan los diversos componentes del constructo. Si, por ejemplo, pretendemos evaluar la tolerancia hacia los grupos marginales, un ítem podría ser el siguiente: “Deberíamos facilitar la integración de las comunidades indígenas en nuestro país” Parece razonable suponer que una persona tolerable estaría de acuerdo con esta afirmación, mientras que otra intolerable estaría en desacuerdo.

Construir provisionalmente un cuestionario implica elaborar los ítems iniciales de la prueba haciendo uso de diversas técnicas, las cuales dependen del tipo de objeto de medición. La redacción de ítems es una etapa crucial para el proceso de construcción de pruebas, de ahí que sea necesario tener el máximo de información posible acerca de las características tanto teóricas como empíricas del campo a ser estudiado. En relación con la construcción de los ítems existen dos temas importantes a tener en cuenta: el formato de respuesta y las normas de redacción de los ítems.

3.1 Formato de respuesta

En los test de rendimiento óptimo (pruebas de rendimiento y de inteligencia) se pretende medir el rendimiento máximo al que llega cada persona ante una serie de preguntas o tareas. Usualmente, el formato de respuesta de estos ítems se ajusta a uno de los siguientes tres formatos:

a) Elección binaria: De dos alternativas, se elige la que se considera correcta (Sí o No; verdadero-falso). Una pregunta de verdadero y falso es una declaración afirmativa; la tarea del examinado es determinar si la frase es correcta o no (verdadera o falsa). Por ejemplo, un ítem de un test de rendimiento en Historia Moderna puede ser:

"Salaverry fue uno de los presidentes de la República del Perú" V F

En esencia, quien se somete a la prueba evalúa la veracidad de la frase. Si cualquier parte del enunciado es incorrecta, el

60


concepto será falso. Algunos lineamientos para escribir reactivos de VERDADERO –FALSO son:

Los reactivos se deben basar en hechos significativos, conceptos o principios apropiados. Cada uno debe enfocarse en una sola idea.

El elemento crucial de la proposición debe resultar evidente al alumno. La verdad del enunciado no deberá reposar en detalles triviales ni frases capciosas.

Expresar los reactivos con claridad y en forma sencilla, con palabras cuyo significado sea definido, preciso y conocido por el alumno.

Los enunciado debe ser claramente verdaderos o falsos, no parcialmente verdaderos o parcialmente falsos.

Evitar las repeticiones simples o las variaciones menores de las palabras. No crear conceptos falsos, insertando una negación en un enunciado del texto.

Evitar los determinantes específicos, palabras tales como: siempre, nunca o a veces, que pueden dar indicios sobre la respuesta correcta.

Incluir números aproximadamente iguales de enunciados verdaderos o falsos. Asegurarse que las respuestas correctas no presenten un patrón.

Cuando los reactivos se refieren a materias controvertidas o a temas de opinión o valor, citar la autoridad cuya opinión se utiliza.

b) Elección múltiple: Entre más de dos alternativas se elige la que se considera correcta. Es sin duda el formato de respuesta más utilizado, entre otras por razones de objetividad y otras de tipo operativo. La tarea consiste en seleccionar la alternativa, de entre las distractoras (respuestas incorrectas), que conteste correctamente a la pregunta o complete la oración. Por ejemplo, un ítem de un test de aptitud verbal puede ser:

"Automóvil es a volante como bicicleta es a....”a) Pedalb) Timónc) Asientod) Parrilla

El enunciado de la pregunta debe presentar el problema con suficientes detalles para que no haya ambigüedades respecto a su naturaleza; las alternativas proporcionan la base para inferir si el estudiante, posee o no los conocimientos deseados. Algunos lineamientos para escribir reactivos de elección múltiple son:

61


Debe haber una sola respuesta correcta. Esta alternativa deberá ser claramente correcta.

Las alternativas tiene que ser homogéneas en la forma y la estructura gramatical.

Siempre que sea posible, se deberá utilizar nuevas situaciones y nuevos ejemplos.

Cada pregunta tiene que ser independiente. Un reactivo no deberá ayudar a responder a otro de la prueba.

Evitar los reactivos formulados en forma negativa. Tratar de evitar el uso de: todo lo anterior, nada de los anterior o parte de lo anterior.

Evitar dar indicios poco relevantes sobre la respuesta correcta, mediante su longitud, la repetición de palabras clave, las asociaciones comunes o la construcción gramatical.

Si las alternativas caen en un orden lógico (por ejemplo, alfabéticamente o por magnitud), ponerlas en ese orden. De otro modo, hacer que sean al azar las posiciones de las repuestas correctas, para que no caigan en un patrón.

Tratar de que cada reactivo someta a prueba sólo una idea o concepto central.

c) Emparejamiento: Consiste en encontrar las parejas entre dos conjuntos de conceptos. Por ejemplo, un ítem de un cuestionario sobre conocimientos de políticos peruanos contemporáneos puede ser:

"Enlace mediante una línea el nombre del político con el partido político al que pertenece"

José Carlos Mariátegui APRA Víctor Raúl Haya de la Torre Acción Popular Fernando Belaunde Partido Comunista del Perú

Algunos lineamientos para escribir reactivos de emparejamiento o correspondencia son:

Todas las partes de un solo reactivo de correspondencia deben tener un contenido homogéneo; todas se deben referir a fechas, todas a nombres, todas a lugares, etc.

Si las dos listas contiene frases de diferente longitud, hacer que las frases más largas sirvan como reactivos y las cortas como respuestas.

Cada lista debe contener no más de cinco o siete reactivos. Cuando sea posible, incluir una o dos respuestas más que reactivos. Dar instrucciones a los alumnos sobre si cada respuesta se puede utilizar más de una vez o una sola.

62


Cada reactivo debe llevar asociada una sola respuesta; esto es, debe haber solo una respuesta correcta para cada uno.

Mediante las pruebas de rendimiento típico se quiere reflejar el comportamiento ordinario de las personas, no teniendo sentido el concepto de rendimiento máximo dado que el objeto de la evaluación es algún tipo de opinión, actitud o rasgo de personalidad. El formato de respuesta de los cuestionarios de rendimiento típico se ajusta a alguno de los siguientes:

a) Opción binaria: La persona debe manifestar si está de acuerdo o en desacuerdo con una afirmación. Por ejemplo, un ítem de un cuestionario sobre la actitud de los padres hacia los profesores de sus hijos puede ser:

"En realidad, los profesores en el colegio hacen poco más que cuidar a nuestros hijos cuando nosotros trabajamos"

Acuerdo ( ) Desacuerdo ( )

b) Categorías ordenadas: El formato establece un continuo ordinal de más de dos categorías, que permite a la persona matizar mejor su respuesta. Normalmente, este continuo está formado por 5 ó 7 categorías ordenadas, con una categoría central para indicar la valencia neutra y a partir de la cual posicionarse en uno u otro sentido. Por ejemplo, un ítem sobre la actitud de los adolescentes hacia el consumo de drogas, podría ser el que sigue:

"Las drogas pueden realmente resolver problemas de uno mismo"

( ) Muy en Desacuerdo( ) Bastante en Desacuerdo( ) Neutral( ) Bastante de Acuerdo( ) Muy de Acuerdo

A veces, se establecen nominalmente los dos extremos del continuo, dejando señaladas las restantes categorías del mismo:

MD ____ ____ ____ ____ ____ MA

o se ordenan numéricamente las categorías sucesivas:

1 2 3 4 5 6 7

c) Adjetivos bipolares: Este formato es típico de lo que se denomina "diferencial semántico", un instrumento formado por

63


pares de adjetivos opuestos, cada uno de los cuales representa un continuo bipolar con varias categorías, y que permite estudiar el significado semántico que se atribuye a determinados constructos, personas o instituciones.

Por ejemplo:

Alegre ________ ________ ________ __ TristeListo ________ ________ ________ __ TontoSimpático ________ ________ ________ AntipáticoFeliz ________ ________ ________ __ Infeliz

3.2 Redacción de ítems

Algunas de las recomendaciones generales en la redacción de ítems en pruebas de rendimiento óptimo son las siguientes:

- La idea principal del ítem debe estar en el enunciado.- Simplicidad en el enunciado.- Evitar los conocimientos excesivamente triviales o excesivamente

“rebuscados”.- Evitar dar información irrelevante en el enunciado.- Evitar dar indicios sobre la solución.- Evitar cuestiones sobre opiniones.- No encadenar unos ítems con otros.- Anticipar la dificultad e incluir preguntas de todo rango de

dificultad (casi siempre conviene más preguntas de dificultad media).

- La dificultad no debe estar en la comprensión del ítem.- Minimizar el tiempo de lectura.- Evitar el uso de negaciones (si se incluyen, subrayarlas), errores

gramaticales y ortográficos.

Respecto a la manera de formular las cuestiones en test de rendimiento típico (declaraciones o afirmaciones ante las cuales se debe opinar), se han propuesto algunas sugerencias que pueden ayudar a su correcta redacción:

- Utilizar el tiempo presente.- Deben ser “relevantes”, en el sentido de que su contenido debe

relacionarse claramente con el rasgo.

64


- Contenido claro, evitando excesiva generalidad. Frases cortas, simples e inteligibles.

- Evitar incluir dos contenidos en un ítem.- Tener en cuenta que lo que se dice en la declaración pueda ser

asumido por alguien, y no por todos.- En escalas de actitudes, no plantear la existencia o no de hechos,

sino el posicionamiento personal sobre la afirmación. Redactar ítems que discriminen entre los de actitud positiva y los de actitud negativa.

- Para minimizar la aquiescencia (tendencia a responder afirmativamente, independientemente del contenido por el que se pregunta) conviene redactar ítems de modo directo e inverso (declaraciones tanto en sentido positivo como en sentido negativo). A posteriori, se puede comprobar cómo una persona ha respondido a los ítems directos e inversos. También puede comprobarse que la correlación entre ambos tipos de ítems es alta.

- Evitar el uso dobles negaciones (no, ninguno, nunca,...) y de universales (todo, siempre, nada,...).

- En lo posible, aunque no es fácil, se debe minimizar la posibilidad de deseabilidad social (emitir respuestas socialmente aceptables para transmitir una imagen positiva). Puede deberse a varias cosas: desajuste psicológico, insinceridad consciente,... El grado de deseabilidad social que manifiestan los ítems puede evaluarse mediante jueces, y comparar las respuestas de una persona con estas valoraciones. En test de personalidad puede incluirse una escala de sinceridad.

El número de categorías que se suelen incluir en este tipo de ítems es usualmente de cinco ya que, a partir de ese número de categorías no mejoran las propiedades psicométricas de los ítems. Además, un número muy elevado de categorías (siete u ocho) lleva a inconsistencias en las respuestas, que es una fuente de error. Un número muy reducido (dos ó tres) lleva a poca discriminación (menor variabilidad) y a reducir la fiabilidad, aunque siempre puede compensarse con un mayor número de ítems. No obstante, en poblaciones especiales (niños, discapacitados, mayores…) se aconseja el uso de un menor número de categorías.

3.3 Cuantificación de las respuestas

Una vez establecido el formato de respuesta que se considera más apropiado para el caso, y de cara al estudio psicométrico de la prueba, es preciso decidir la manera de cuantificar los posibles resultados a las cuestiones. En general, para los ítems de cuestionarios de rendimiento óptimo se cuantificará con 1 el acierto y con 0 el error, de tal manera que la puntuación directa de

65


un sujeto en un cuestionario determinado será igual al número de ítems que ese sujeto acierta.

Por ejemplo, para un ítem con formato de respuesta de opción binaria (acuerdo/desacuerdo) puede cuantificarse el acuerdo como 1 y el desacuerdo como 2, o viceversa. Depende de que el ítem esté planteado para medir de manera directa o inversa el constructo de interés. Estos pueden ser 2 ítems de un cuestionario de actitud ante al aborto voluntario:

Ítem A: "Abortar es matar". De acuerdo ( ) En desacuerdo ( )

Ítem B: “El bienestar de la madre también importa”. De acuerdo ( ) En desacuerdo ( )

En el ítem A, el acuerdo se puntuaría con 1 y el desacuerdo con 2, ya que estar en desacuerdo con esa afirmación indica una actitud más positiva hacia el aborto voluntario. En el ítem B, sin embargo, el acuerdo se puntuaría con 2 y el desacuerdo con 1, ya que estar de acuerdo con esa afirmación indica una actitud más positiva hacia el aborto.

Si el formato de respuesta es de “n” categorías ordenadas, las diversas categorías se cuantificarán normalmente desde 1 hasta n, teniendo en consideración (como en el caso anterior) la dirección de la afirmación o cuestión. Por ejemplo, para 5 categorías, las dos posibles cuantificaciones serán:

También se puede asignar el 0 a la categoría central, valores negativos a las categorías que se encuentran a la izquierda y positivos a las que se encuentran ubicada a la derecha. En estos casos, la puntuación directa de un sujeto en un test (o subtest) resulta de sumar las cantidades asignadas por el constructor de la prueba a las diferentes respuestas que el sujeto ha emitido; según esto, convendría cuantificar las diversas alternativas con valores entre 1 y n para evitar una puntuación directa negativa.

3.4 Estimación a priori del grado de dificultad de los reactivos

Terminada la elaboración de los ítems del pretest, se deberá adaptar el grado de dificultad de los reactivos a los sujetos para quienes han sido hechos. En este caso, le será de utilidad la información acerca de los antecedentes y de la calidad de los procesos mentales de los evaluados. Se debe tener presente que, en el caso de los reactivos de opción múltiple, la dificultad de un

66


elemento es función no solamente de la cuestión que se trate, sino también del grado de diferenciación de las opciones o alternativas que se presenten. Con los ítems redactados a la vista, el psicólogo les otorgará un grado de dificultad a priori de acuerdo al siguiente detalle.

Tabla 7Grado de dificultad a priori (Tomado de Delgado, Escurra y Torres, 2006, p. 64)

Grado de dificultad a priori (pretest) (antes de realizar el análisis de los ítems)

Nº aproximado

Límites aproximados de los índices de dificultad.

(MF) Muy Fáciles 10% De 0.75 a 0.99(F) Fáciles 20% De 0.55 a 0.74(M) Medios 40% De 0.45 a 0.54(D) Difíciles 20% De 0.25 a 0.44(MD) Muy Difíciles 10% De 0.05 a 0.24

67


TEXTO SELECCIONADO 2

DESARROLLO DEL ANALISIS FACTORIAL PARA EL ESTUDIO DE ITEM DICOTOMICOS Y ORDINALES4

Si se revisan los estudios de personalidad donde se utiliza el análisis factorial estándar, se observa generalmente que se supone que los datos están en un nivel de intervalo, de acuerdo con los supuestos estadísticos básicos del modelo del análisis factorial. Sin embargo, en realidad casi ninguno de los datos obtenidos cumple estos supuestos. A lo sumo, se aproximan a datos continuos sumando información de unidades, como respuestas a ítem en clusters o valores de escalas.

Se han propuesto varias soluciones para el estudio de ítems dicotómicos u ordinales. Christoffersson (1978) ideó un método para analizar factorialmente los ítems dicotómicos usando correlaciones tetracóricas. Muthén (1984) extendió este método para proporcionar una forma computacional menos compleja. El modelo del análisis factorial estándar implica dos niveles diferentes de variables: factores inobservables e indicadores observables de estos factores (ítem). El método generalizado de los mínimos cuadrados para el análisis factorial de datos dicotómicos requiere un nivel intermedio entre los datos observados y la variable latente. Este nivel corresponde a las variables latentes de respuesta, una para cada dicotomía observada, que son cortadas en puntos de umbral correspondientes a juicios observados como verdadero-falso. Recuérdese que la correlación tetracórica supone la relación entre dos variables latentes continuas que han sido dicotomizadas en determinados puntos umbral. El análisis factorial puede entonces aplicarse directamente porque se está trabajando con indicadores continuos aunque inobservables. En este tipo de análisis hay dos niveles de abstracción: ítem observados dicotómicos u ordinales, que se relacionan con variables de respuesta no observables a través de las correlaciones tetracóricas o policóricas. Luego, estas variables

4 Extraído de: Richaud, M (2005). Desarrollo del análisis factorial para el estudio de ítem dicotómico y ordinal. Interdisciplinaria 22 (2)

68


de respuesta latentes sirven de indicadores de los factores. Por lo tanto, en este modelo los factores resumen las relaciones entre variables de respuesta latentes más que directamente entre las variables observadas.

Por otra parte, la factibilidad del método generalizado de los cuadrados mínimos está relacionada inversamente con el número de ítems observados: a medida que los ítems observados aumentan, disminuye la factibilidad debido al aumento del tamaño de la matriz de pesajes utilizada en el cálculo.

Otro método propuesto para el caso de los ítems dicotómicos u ordinales es el de máxima verosimilitud que opera bajo un principio de datos perdidos que en el contexto del análisis factorial, puede verse como un intento de estimar factor scores contra los que se puede hacer una regresión de las variables observadas.

Este método parte también de las correlaciones tetracóricas entre los ítem pero, a diferencia del método de los cuadrados mínimos, el método de máxima verosimilitud se aproxima a una función integral de una distribución de observaciones supuestamente normal, usando sumas ponderadas. En este método, a diferencia del primero en el que la complejidad aumenta a medida que aumenta el número de ítem, la complejidad numérica y computacional del análisis factorial aumenta, a medida que se incrementa el número de factores hipotéticos que subyacen a un determinado conjunto de ítem.

Existen también los llamados programas de análisis paralelo que producen conjuntos de datos basados en números aleatorios distribuidos normalmente, generados por la computadora. Los autovalores de los datos brutos a nivel del ítem basado en información dicotómica o de tipo Likert, no se pueden comparar apropiadamente con los autovalores generados en el análisis paralelo, que se sustentan en números aleatorios de distribución normal. En lugar de ello, primeramente se debería determinar el número de factores o componentes, hallando los autovalores para la matriz de correlaciones tetracóricas o policóricas, y luego comparar estos autovalores contra los producidos aleatoriamente por la computadora. Y, de hecho, las subsecuentes factorizaciones se deberían hacer sobre la matriz de correlaciones tetracóricas o policóricas, y no sobre las correlaciones de Pearson.

El análisis paralelo también se puede hacer sobre permutaciones aleatorias de los datos directos o brutos, en que las distribuciones del ítem/va-riables son idénticas a aquellas provenientes de los datos reales. No se debería usar este método de análisis paralelo en datos a nivel de ítem, pues pueden surgir factores por la semejanza de la distribución de los ítems bajo análisis.

69


ACTIVIDADES DE AUTOAPRENDIZAJE

1. Elabora un mapa conceptual acerca del proceso de elaboración del Pretest.

2. Elabora un cuadro descriptivo-comparativo acerca de los diferentes tipos de reactivos o ítems

3. Revisa el test 16 PF y el Test de Personalidad de Eysenck. Analiza los ítems y clasifícalos de acuerdo a lo señalado en el texto.

70


AUTOEVALUACIÓN 2

1. Diga si las siguientes afirmaciones referidas al índice de dificultad (Dj) son verdaderas o falsas:a) Sólo tiene sentido su cálculo en pruebas de rendimiento óptimo.b) Se deben seleccionar sólo aquellos ítems con Dj próximos a 1.c) Si un ítem tiene una alta varianza, su índice de dificultad será alto.d) A un ítem de baja varianza le corresponde necesariamente un índice de dificultad bajo.

2. A continuación se ofrece una matriz ítems por sujetos:a) ¿Cuál es el ítem más fácil?b) ¿Cuál es el más difícil?c) ¿Cuál es el ítem en el que las personas muestran más variabilidad?d) ¿Cuál es en el que muestran menos variabilidad?

3. La tabla de especificaciones sirva para:a) Comparar la distribución de los ítems con criterios que no están

establecidos en el plan de construcción.b) Indicar la cantidad y el tipo de ítems a elaborar.c) Indicar la estabilidad de las puntuaciones.d) Indicar si la prueba mide lo que dice medir.

4. El pre test es:a) Una propiedad o característica que puede adoptar distintos valores.b) Es el reactivo o estímulo de un.c) Es la versión del test cuando se encuentra en proceso de construcción.d) Es la versión final del test.

5. Es verdad con respecto a los ítems:a) Sólo tiene dos alternativas.b) Una propiedad o característica que puede adoptar distintos valores.c) Indica si la prueba mide lo que dice medir.d) A cada ítem se le asigna una determinada puntuación.

6. No es verdad con respecto a la redacción de los ítems de pruebas de rendimiento óptimoa) La idea principal del ítem debe estar en el enunciado.

71


b) Evitar cuestiones sobre opiniones.c) Maximizar el tiempo de lectura.d) No encadenar unos ítems con otros.

7. No es verdad con respecto a la redacción de los ítems de pruebas de rendimiento típico a) Contenido claro, evitando excesiva generalidad. Frases cortas, simples

e inteligibles.b) Utilizar el tiempo presente.c) Contenido claro, evitando excesiva generalidad.d) Incluir dos contenidos en un ítem.

8. Es verdad respecto al grado de dificultad a priori a) Ítems Muy Fáciles tienen índices de dificultad de 0.75 a 0.99.b) Ítems Muy Fáciles tienen índices de dificultad de 0.25 a 0.44.c Ítems Difíciles tienen índices de dificultad de 0.75 a 0.99.d) Ítems Muy Difíciles tienen índices de dificultad de 0.55 a 0.74

9. Un constructo es a) Un término que hace referencia a conceptos que han sido postulados

con un propósito científico.b) Una propiedad o característica que puede adoptar distintos valores.c) Un ítem.d) Una parte del manual del test

10. No es verdad con respecto a las variables a) Debe tener una referencia conceptual.b) Las variables no requieren ser cuantificables para operar sobre una

realidad concreta.c) Debe tener la posibilidad de ser cuantificable.d) La cuantificación posibilita un mejor control y manipulación de las

variables

Respuestas

1. a) Verdadero b) Falso c) Falso d) Falso

2. Tal y como se desprende de la tabla siguiente:

a) El ítem más fácil es el número 2, ya que todos los sujetos lo aciertan.b) El ítem más difícil es el número 6, ya que nadie lo acierta.c) El ítem en el que hay más variabilidad es el número 4, porque presenta la mayor varianza.d) Los ítems de menos variabilidad son los números 2 y 6, porque la

varianza es nula en ambos.

72


3) b. 4) c. 5) d. 6) c. 7) d. 8) a. 9) a. 10) b.

EXPLORACIONES ON-LINE

73


BIBLIOGRAFÍA

Abad, F., Garrido, J., Olea J. & Ponsoda, V.

(2006). Introducción a la Psicometría. Teoría Clásica de los Test y Teoría de Respuesta al Item. Madrid: Universidad Autónoma de Madrid.

Aguado, G. (2005). El desarrollo de la morfosintaxis en el niño. Manual de evaluación del T.S.A. Madrid: CEPE.

Anastasi, A. (1978). Test Psicológicos. Madrid: Aguilar.

Brown, F. (1980). Principios de la medición en psicología y educación. México: Ed. Manual Moderno.

Christofferson A. (1978). Two-step weighthed leats squares factor analysis of dichotomized variables. Psychometrika, 40, 5-32.

Delgado, A., Escurra, M. & Torres, W.

(2006). La medición en psicología y educación. Teoría y aplicaciones. Lima: Ed. Hozlo.

Feuerstein, R. (1997). Teoría de la Modificalidad Cognitiva Estructural. En Asociación Europea del Aprendizaje Mediado y de la Modificalidad Cognitiva (Ed.). ¿Es modificable la inteligencia? Madrid: Ed. Bruño.

Muthén, B. (1984). A general structural equation model with dichotomous ordered categorical and continuous latent variable indicators. Psychometrika, 49, 115-132.

Nunnally, J. (1973). Introducción a la medición psicológica. Buenos Aires: Ed. Paidós.

Nunnally, J. (1987). Teoría psicométrica. México: Ed. Trillas.

Richaud, M (2005). Desarrollo del análisis factorial para el estudio de ítem dicotómico y ordinal. Interdisciplinaria 22 (2).

74

http://www.assess.com/softmenu.htmlhttp://www.shrinktank.com/http://www.apa.org/science/standars.html.http://www.uv.es/meliajl/Psicomet1.htmlhttp://www.uv.es/facpsi/analesps.htmlhttp://www.uniovi.es/user_htm/herrero/REMA.htmlhttp://www.uniovi.es/UniOvi/Apartados/Departamento/Psicologia/metodos/tutor.1indice.html


Sánchez, H. & Reyes, C. (2006). Metodología y Diseños en la Investigación Científica. Lima: Ed. Visión Universitaria.

Tapia, V. & Luna, J. (2008). Procesos cognitivos y desempeño lector. Revista de Investigación en Psicología, 11(1), 37-68.

75

BIBLIOGRAFÍA COMENTADA

Delgado, A., Escurra, L. & Torres, W. (2006). La medición en Psicología y Educación: Teoría y aplicaciones. Lima: Editorial Hozlo.

En el libro se exponen, de manera didáctica y clara, el marco conceptual-conceptual, la metodología y aplicación de los aspectos centrales de la medición en psicología y educación. Se incide en la clasificación de las pruebas psicológicas o educativas, desarrollando los procesos de análisis de la confiabilidad, la validez y la importancia que debe atribuírsele a las normas o baremos.

unidad i y ii

Documents