sesion 8 - confiabilidad y validez[1].pdf

Mg. IRMA LUZ YUPARI AZABACHE

Requisitos de

la Medicin

Validez Confiabilidad

Validez de

Contenido

Validez de

Criterio

Validez de

Constructo

Factores Que Atentan Contra La Validez Y Confiabilidad

Tirador 1: Ni

confiabilida

d ni validez

Tirador 3:

Confiabilidad y

validez

Tirador 2:

Confiabilidad,

pero no validez

RELACIN ENTRE LA CONFIABILIDAD Y VALIDEZ

Un instrumento de medicin puede ser confiable pero no

necesariamente vlido (un aparato puede ser consistente en lo

resultados que produce pero puede no medir lo que pretende).

La confiabilidad responde a la pregunta con cuntaexactitud los tems, reactivos o tareas representan al

universo de donde fueron seleccionados?.

Un cuestionario, es confiable cuando su aplicacinrepetida al mismo sujeto u objeto, produce los mismos

resultados y es operativo cuando su vocabulario es

entendido en un sentido unvoco, o sea exactamente con

el significado definido por el diseador del instrumento.

CONFIABILIDAD DEL INSTRUMENTO DE

RECOLECCIN DE DATOS:

Los procedimientos ms utilizados son:

1. Test-retest( Medida de Estabilidad) Un mismoinstrumento es aplicado dos o ms veces a un mismogrupo de personas en condiciones similares. Si lacorrelacin entre los resultados de las diferentesaplicaciones es altamente positiva, el instrumento seconsidera confiable.

2. Medidas paralelas o formas equivalentes (Dosversiones diferentes pero equivalentes, se administra aun mismo grupo de personas ).

3. Divisin por mitades o mitades partidas (Una pruebafragmentada en dos partes equivalentes).

4. Alfa de Cronbach y Kuder Richarson

Mtodo Nmero de veces

que el instrumento es administrado

Nmero de versiones diferentes

del instrumento

Nmero de participantes que proveen los datos

Inquietud o pregunta que

contesta

Estadstico a usar

Estabilidad (test-retest)

Dos veces en tiempos distintos

Una versin

Cada participante responde al instrumento dos veces

Responden los individuos de una manera similar a un instrumento si se les administra dos veces?

Coeficiente de Correlacin

Formas alternas

Dos veces al mismo tiempo o con una diferencia muy corta

Dos versiones diferentes pero equivalentes

Cada participante responde a cada versin del instrumento

Cuando dos versiones de un instrumentos son similares Hay convergencia o divergencia en las respuestas a ambas versiones?


Formas alternas y prueba-posprueba

Dos veces en tiempos distintos

Dos versiones diferentes pero equivalentes

Cada participante responde a cada versin del instrumento

Cuando dos versiones de un instrumentos son similares Hay convergencia o divergencia en las respuestas a ambas versiones?


Mitades partidas

Una vez

Una fragmentada en dos partes equivalentes

Cada participante responde a la nica versin

Son las puntuaciones de una mitad del instrumento similares a las obtenidas en la otra mitad?


Medidas de consistencia interna(alfa y KR20 y21)

Una vez

Una versin

Cada participante responde a la nica versin

Las respuestas a los tems del instrumento son coherentes?

Coeficiente de Alfa de Cronbach y de KR

En este caso, el anlisis se realizo a travs del Alpha de Cronbach (10% de

la poblacin objeto de estudio ):

Para el puntaje de los tems, se utiliz la escala de Likert, de la siguiente

forma:

Totalmente De Acuerdo: 5 puntos

De Acuerdo: 4 puntos

Neutral: 3 puntos

En Desacuerdo: 2 puntos

Totalmente en Desacuerdo: 1 punto

Tabla: Escala de Valoracin del Alfa de Cronbach

Valor Alfa de Cronbach Apreciacin

[0.95 a + > Muy elevada o Excelente [0.90 - 0.95> Elevada

[0.85 - 0.90> Muy buena [0.80 - 0.85> Buena

[0.75 - 0.80> Muy Respetable [0.70 - 0.75> Respetable

[0.65 - 0.70> Mnimamente Aceptable [0.40 - 0.65> Moderada

[0.00 - 0.40> Inaceptable

Fuente: De Vellis (1991)

RESULTADOS DEL PROCESAMIENTO DE LA

CONFIABILIDAD DEL INSTRUMENTO DE

RECOLECCIN DE DATOS:

Estadsticos de fiabilidad

.790 10

Alfa de

Cronbach

N de

elementos

Estadsticos total-elemento

35.3500 25.818 .637 .750

35.0000 25.263 .756 .738

34.9500 23.945 .829 .724

35.0000 25.263 .650 .747

35.0000 27.474 .595 .760

34.5500 31.839 .063 .806

35.0500 26.155 .677 .748

35.0500 24.787 .572 .756

34.9500 24.576 .623 .749

35.6500 36.661 -.363 .879

P1

P2

P3

P4

P5

P6

P7

P8

P9

P10

Media de la

escala si se

elimina el

elemento

Varianza de

la escala si

se elimina el

elemento

Correlacin

elemento-tot

al corregida

Alfa de

Cronbach si

se eleimina

el elemento

Sin embargo se puede observar que si se elimina la pregunta 10, el

alfa de cronbach aumentara pero por decisin del autor se decidi

conservar la pregunta dado que era importante para el test.

Se alcanzo un Nivel de

Confiabilidad Muy

Respetable con un Alpha

= 0.79, siendo este test

consistente y adecuado

para el estudio


.756 10

Alf a de

Cronbach N de elem entos


31.6475 22.259 .549 .718

31.3597 23.348 .520 .725

31.4604 23.424 .535 .724

31.7698 23.526 .513 .726

31.5252 23.382 .439 .734

31.5396 23.018 .464 .730

31.7914 22.514 .544 .719

31.8561 22.588 .423 .736

31.8417 22.337 .490 .726

32.4748 27.396 -.055 .813

P1

P2

P3

P4

P5

P6

P7

P8

P9

P10

Media de la

escala si se

elim ina el

elemento

Varianza de

la escala s i

se elim ina el

elemento

Correlacin

elemento-total

corregida

Alf a de

Cronbach si

se eleimina

el elem ento


.825 5

Alf a de

Cronbach N de elementos


14.8921 7.256 .500 .829

14.6043 7.009 .710 .765

14.7050 7.267 .673 .776

15.0144 7.377 .633 .787

14.7698 6.932 .614 .792

P1

P2

P3

P4

P5

Media de la

escala si se

elimina el

elemento

Varianza de

la escala si

se elimina el

elemento

Correlacin

elemento-total

corregida

Alfa de

Cronbach si

se eleimina

el elemento

Al comprobar la fiabilidad para los elementos con todos los datos

se obtiene lo siguiente:

Para la motivacin intrnseca:


.623 5

Alf a de

Cronbach N de elementos


13.0432 7.926 .338 .588

13.2950 7.470 .456 .535

13.3597 6.435 .548 .473

13.3453 6.894 .499 .506

13.9784 8.413 .120 .709

P6

P7

P8

P9

P10

Media de la

escala si se

elim ina el

elemento

Varianza de

la escala s i

se elim ina el

elemento

Correlacin

elemento-total

corregida

Alf a de

Cronbach si

se eleimina

el elem ento

Estadsticos de la escala

16.7554 10.606 3.25675 5

Media Varianza Desviacin tpica N de elem entos

Para la motivacin extrnseca :

En el caso de instrumentos con coeficientes de confiabilidad

moderados como en este caso (0.623), una manera de saber hasta

dnde los mismos pueden ser aceptables, consiste en comparar

la desviacin estndar de la distribucin de puntajes (Sy) con el

error estndar de medicin (EEM) (Carlos Ruiz Bolvar,), cuya

frmula es:

EEM = error estndar de medicin.

Sy = Desviacin estndar de la distribucin de puntajes totales.

rtt = Coeficiente de confiabilidad.

En estos casos se recurre al criterio del error estndar de

medicin para decidir sobre la aceptabilidad de un coeficiente de

confiabilidad moderado, se requiere que se cumpla la condicin

de que Sy > EEM.

Como se puede observar, en el caso el EEM(1.9045) no excede el valor de la Sy(3.257); es

decir, que se cumple la condicin de

aceptabilidad sealada anteriormente. (Sy >

EEM). En consecuencia, el instrumento puede

ser utilizado

VALIDEZ DEL INSTRUMENTO DE RECOLECCIN DE

DATOS:

- Segn Hernndez, la validez se refiere, al grado en que uninstrumento (cuestionario) realmente mide las variables que pretende

medir.

-Una pregunta es vlida si estimula informacin exacta y relevante.

-La seleccin y la redaccin influyen en la validez de la pregunta.

- Algunas preguntas que son vlidas para un grupo de personas,

pueden no serlo para otro grupo.

- Entre menos tenga que reflexionar el sujeto, ms vlida ser la

respuesta. La validez implica congruencia en la manera de plantear

las preguntas.

La validez puede ser :

De contenido De criterio De constructo

VALIDEZ DE CONTENIDO

Se refiere al grado en que el test presenta una muestra

adecuada de los contenidos a los que se refiere, sin

omisiones y sin desequilibrios de contenido.

La validez de contenido se utiliza principalmente con tests

de rendimiento, y especialmente con los tests educativos y

tests referidos al criterio. En este tipo de tests se trata de

comprobar los conocimientos respecto a una materia o un

curso.

La validez de contenido descansa generalmente en el

juicio de expertos (mtodos de juicio). Se define como el

grado en que los tems que componen el test representan

el contenido que el test trata de evaluar.

Para este anlisis se ha utilizado el programa Excel

Versin 2007,y se aplic la tcnica estadstica

denominada Coeficiente de Proporcin de Rangos (CPR)

basado en el mtodo a juicio de expertos, que consiste

en un examen sistemtico de cada de uno de los tems -

preguntas del mismo, para determinar si miden las

variables que se espera medir, la pertinencia del

contenido, la claridad de los enunciados de cada uno de

ellos, y el nivel de concordancia entre los evaluadores.

Se sigui el siguiente procedimiento:

Se solicit la colaboracin de tres expertos de la carrera

de psicologa, con el objeto de determinar la pertinencia

de contenido de los tems del instrumento. Se les entreg

el cuestionario y la informacin necesaria y se obtuvo la

evaluacin del cuestionario de cada uno de los expertos.

TESIS: RELACIN ENTRE LA MOTIVACIN Y EL RENDIMIENTO

ACADMICO DEL CURSO DE ESTADSTICA EN ESTUDIANTES

DEL CUARTO CICLO DE LA FACULTAD DE DERECHO DE LA

UNIVERSIDAD CSAR VALLEJO EN EL SEMESTRE 2008-II

OBJETIVOS DE LA INVESTIGACION:

Objetivo General:

Determinar el nivel de relacin existente entre la motivacin de

los estudiantes de la facultad de derecho de la UCV y el

rendimiento acadmico del curso de estadstica.

Objetivos especficos:

Determinar el nivel de relacin existente entre la motivacin

intrnseca del alumno y el rendimiento acadmico en estadstica.

Determinar el nivel de relacin existente entre la motivacin

extrnseca del alumno y el rendimiento acadmico en

estadstica.

ANEXO B: VALIDACION DEL CUESTIONARIO

FORMATO PARA EVALUACIN DEL CUESTIONARIO

Datos del Evaluador:

Apellidos y Nombres: .

Nmero de Colegiatura:..

Profesin:.

Lugar de Trabajo:.

Cargo que desempea:

rea:

tems-

Preguntas

Objetivos

Especficos

Escala Evaluativa Observaciones

A B C

1,2,3,4 y 5 1

6,7,8,9 y 10 2

ESCALA EVALUATIVA DE CORRESPONDENCIA ITEMS- OBJETIVOS:

A: TOTALMENTE DE ACUERDO

B: DE ACUERDO

C: DESACUERDO

La informacin proporcionada por cada uno de los expertos se

proces y analiz calculando el coeficiente de proporcin de

rango corregido.

TABLA B1: TABULACIN DE LOS DATOS RESPECTO A LA EVALUACIN

DEL INSTRUMENTO

ITEM PREGUNTASEVALUADORES

1 2 3

I 1, 2, 3, 4, 5 A A A

II 6, 7, 8, 9, 10 A B A

Fuente: Clculos Propios

Segn los especialistas, existe una muy alta validez y

concordancia de los mismos, esto se evidencia al calcular el

Coeficiente de Proporcin de Rango que alcanz un 87 %.

TABLA B2:

TABULACION SEGN ESCALA EVALUATIVA DE LOS ITEMS

ITEM PREGUNTASEVALUADORES

1 2 3

I 1, 2, 3, 4, 5 3 3 3

II 6, 7, 8, 9, 10 3 2 3

Puntaje escala Evaluativo de los tems:

A: Totalmente De Acuerdo : 3 puntos

B: De Acuerdo : 2 puntos

C: Desacuerdo: 1 punto


PromedioProporcion

de Rangos

ITEM PREGUNTAS 1 2 3 ri de cada item

I 1, 2, 3, 4, 5 3 3 3 9 3 1.00 0.037

II 6, 7, 8, 9, 10 3 2 3 8 2.667 0.89 0.037

TOTALES 6 5 6 0 17 5.667 1.89 0.074

EVALUADORESS ri Pe

j

rii

Pr

)Pr

(Prk

iiP

K= Numero

de rangos

de la escala

evaluativa

j

jPe

1

Promedio de Rangos

para cada tem

Proporcin de Rangos para cada tem i: Es el

promedio de rangos de cada tems individuo

dividido entre el puntaje mximo de la escala

evaluativo de los tems (coeficiente de validez de

cada tem)

Correccin:

J: Nmero de jueces : 3

NiPCPR

Pr

Coeficiente de Proporcin de Rangos:

CPR : 0.944

CPRc: 0.944-0.074

CPRc: 0.870 Muy Alta

Coeficiente de Proporcin de Rangos

Corregido :

N= Numero de tems

CPRc: CPR - Pe

INTERPRETACION

Mayor que Menor igual que Validez y concordancia

0 0.4 Baja

0.4 0.6 Moderada

0.6 0.8 Alta

0.8 1 Muy Alta

2

89.1CPR

VALIDEZ DE CONSTRUCTO

Se refiere al grado en que el instrumento de medida cumple

con las hiptesis que cabra esperar para un instrumento de

medida diseado para medir precisamente aquello que

deseaba medir. Se puede considerar un concepto general

que abarcara los otros tipos de validez.

El trmino constructo hace referencia a un concepto

terico psicolgico inobservable (ej. la inteligencia, cada

factor de personalidad, las aptitudes, las actitudes, etc.)

La definicin operativa de estos constructos presenta

considerables dificultades en la prctica, ya que no son

directamente observables. Debido a esto, la validacin de

un constructo es un proceso laborioso y difcil.

En resumen, las tcnicas correlacionales o de la o

consistencia interna relativa empleados en la validez

de constructo son procedimientos de correlacin

entre:

Item Test

Item Escala (Subtests)

Escala Test o Test Subtests

TECNICAS CORRELACIONALES

ESCALA DE VALORACIN PARA INTERPRETAR LA CORRELACIN EN LA VALIDACIN

ri.t Nivel de discriminacin 0.40 a ms Muy bueno 0.30 0.39 Bueno 0.20 0.29 Deficiente

0 0.19 Insuficiente Fuente: Elosua Oliden y Bully Garay ( 2012), Pg. 58.

ANLISIS FACTORIAL

El anlisis factorial nos indica cmo tienden a

agruparse los tems o variables. Examinando el

contenido conceptual de los tems que pertenecen al

mismo factor podemos comprender qu factores [o

constructos] subyacentes explican las correlaciones

entre los tems. El anlisis factorial de un

instrumento de medicin ayuda a establecer la

validez de constructo de lo que estamos midiendo,

en el sentido de que nos analiza la estructura del

constructo que estamos pretendiendo medir.

EL ANLISIS DE COMPONENTES PRINCIPALES

Segn Johnson(2000), el ACP comprende un

procedimiento matemtico que transforma un conjunto de

variables correlacionadas de respuesta en un conjunto

menor de variables no correlacionadas llamadas

componentes principales . Tambin menciona que la

mayora de libros sobre Mtodos Multivariados sugieren

que los objetivos principales de un ACP son :

1) Reducir la dimensionalidad de un conjunto de datos,

2) Identificar nuevas variables significativas subyacentes

Uriel, E. y Aldas (2005) plantean que el mtodo de

Componentes Principales tiene por objeto transformar

un conjunto de variables , a las que denominan

variables originales , en un nuevo conjunto de variables

denominadas componentes principales. Estas ltimas

se caracterizan por estar intercorrelacionadas entre s.

Agregan que como medida de la cantidad de

informacin incorporada en una componente se utiliza

su varianza.

PROCEDIMIENTO PARA HALLAR LOS

COMPONENTES PRINCIPALES

1.- Analizar si los datos cumplen con las condiciones

mnimas para la aplicacin de la prueba (Prueba KMO y

de Esfericidad de Bartlett)

2.- Hallar comunalidades, es decir , la proporcin de la

varianza del indicador que es explicada por los

componentes o factores comunes.

3.- Obtencin de los componentes principales.

4. Seleccin del Nmero de Componentes

5. Interpretacin de los Componentes

6.Aplicacin de los resultados al anlisis

Para realizar esta prueba es necesario analizar si los datos

cumplen las condiciones mnimas para la aplicacin de la

tcnica:

Podemos comprobar que se presenta una buena adecuacin

muestral a los datos, ya que el estadstico de Keiser-Meyer-Olkin

(KMO), que nos indica la proporcin de la varianza que tienen en

comn las variables analizadas, presenta un valor de 0,802,

coeficiente cercano a la unidad que es lo ms aconsejado para

este tipo de anlisis, y la prueba de esfericidad de Bartlett que

comprueba las variables estn correlacionadas. Esto nos indicarauna buena adecuacin de los datos a un modelo de anlisis

factorial.

KMO y prueba de Bartlett

.802

438.374

45

.000

Medida de adecuacin muestral de

Kaiser-Meyer-Olkin.

Chi-cuadrado

aproximado

gl

Sig.

Prueba de esfericidad

de Bartlett

TABLA :VARIANZA TOTAL EXPLICADA


EN EL GRFICO SE

PUEDE OBSERVAR

QUE EXISTEN 2

COMPONENTES CON

AUTOVALORES

SUPERIORES A 1

TABLA MATRIZ DE COMPONENTES ROTADOS

. Al llevar a cabo la rotacin de factores, encontramos que

los dos componentes con autovalores mayores a uno

explicaron el 55.01 % de la varianza total


1 2

P1 1 0.52 0.47

P2 1 0.80 0.13

P3 1 0.78 0.19

P4 1 0.76 0.16

P5 1 0.79 0.07

P6 2 0.39 0.47

P7 2 0.28 0.69

P8 2 0.02 0.81

P9 2 0.13 0.72

P10 2 0.44 0.42

PREGUNTAS DIMENSIN

Componente

Las rotaciones son transformaciones lineales que facilitan la interpretacin sin alterar

la proporcin de varianza explicada por los factores

VALIDEZ DE CRITERIO

Se establece al validar un instrumento de medicin alcompararlo con algn criterio externo que pretende medir

lo mismo.

Si el criterio se fija en el presente de manera paralela sehabla de validez concurrente (los resultados se

correlacionan con el criterio en el mismo momento o punto

de tiempo).

Si el criterio se fija en el futuro se habla de validezpredictiva( ejem: una prueba para determinar la capacidad

gerencial de candidatos a ocupar puestos ejecutivos se

validara comparando los resultados con el desempeo

posterior de los ejecutivos)

Escala de valoracin del coeficiente de correlacin de Pearson

Valor de r Grado de correlacin

-1.00 Correlacin negativa Perfecta

-0.90 Correlacin negativa Muy fuerte

-0.75 Correlacin Negativa Considerable

-0.50 Correlacin Negativa Media

-0.25 Correlacin Negativa dbil

0.00 No existe correlacin alguna entre las variables

+0.10 Correlacin Positiva Muy Dbil

+0.25 Correlacin Positiva Dbil

+0.5 Correlacin Positiva Media

+0.75 Correlacin Positiva Considerable

+0.90 Correlacin positiva Muy fuerte

+1.00 Correlacin positiva Perfecta

Hernndez, Fernndez y Baptista ( 2010)

La improvisacin. Algunas personas creen que elegir uninstrumento de medicin o desarrollar uno es algo fcil y que norequiere de supervisin alguna.

La traduccin, an cuando adaptemos los trminos a nuestrolenguaje no es ni remotamente validarlo.

La inadecuacin o falta de empata. Hay instrumentos que tienenun lenguaje muy elevado para el entrevistado o no toma en cuentadiferencias de sexo, edad, nivel ocupacional y educativo.

Las condiciones de aplicacin. El ruido, presionar para que unapersona conteste un instrumento largo en un perodo de tiempocorto, el hambre o falta de motivacin para responder influirnegativamente en la validez y confiabilidad de la medida.

Los aspectos mecnicos. Que el instrumento tenga instruccionesprecisas, que se lea bien (si se trata de un cuestionario escrito), queno le falten pginas, que haya un espacio adecuado para contestar.

Factores que pueden afectar la confiabilidad y la

Validez

sesion 8 - confiabilidad y validez[1].pdf

Documents