spss ejemplos paso a paso

Upload: epuente

Post on 02-Mar-2016

86 views

Category:

Documents


0 download

DESCRIPTION

Ejemplos de Inferencia Estadística utilizando SPSS. Diferencia entre medias, Chi-cuadrada, Intervalos de confianza.

TRANSCRIPT

  • EJERCICIOS DE SPSS PASO A PASO.

    ELABORADO POR: DR. ELEAZAR PUENTE R.

    I. RELACIN DE UNA VARIABLE CUALITATIVA CON UNA CUANTITATIVA.

    VARIABLE INDEPENDIENTE: GNERO (CUALITATIVA)

    VARIABLE DEPENDIENTE: TV (CUANTITATIVA)

    OBJETIVO: Probar estadsticamente si el tiempo dedicado a ver la TV depende del sexo de

    la persona.

    HIPTESIS NULA: El sexo de la persona no influye en el tiempo dedicado a ver TV, o El

    tiempo dedicado a ver TV es independiente del sexo de la persona.

    PROCEDIMIENTO.

    1. Seleccionar el procedimiento de prueba t para diferencia entre medias de dos

    muestras independientes.

    2. Seleccionar las variables, variable dependiente es tv la variable independiente es la

    variable de agrupacin genero en este caso.

  • 3. Identificar los grupos.

    NOTA: EN ESTE PROCEDIMIENTO LA MUESTRA SE PUEDE DIVIDIR SOLAMENTE EN 2

    GRUPOS, YA SEA CON 2 CLAVES ESPECFICAS, O LOS QUE QUEDEN ARRIBA Y DEBAJO

    DE UN CIERTO LMITE.

    En este caso los valores que toma la variable son solamente 1 o 2, por eso los grupos

    se definen de acuerdo a esos valores.

    La opcin de Punto de corte se selecciona cuando los grupos se definen dividiendo

    la muestra a partir de un valor (punto de corte) y se separa entre los que son menores

    o iguales que ese valor y los que son mayores, de manera que este procedimiento

    siempre separa solamente en 2 grupos.

    Si se tienen ms de 2 grupos se utilizar otro procedimiento (ANOVA).

    4. Realizar el procedimiento. (Aceptar)

  • 5. RESULTADOS.

    INTERPRETACIN

    Hay 342 respuestas de hombres y 367 de mujeres. El promedio de horas de TV de los

    hombres es de 11.24 y de las mujeres 10.87. En primera instancia parece ser que los

    hombres ven ms TV que las mujeres, as lo indican los resultados de la muestra. En

    los resultados de la siguiente tabla veremos si la diferencia es estadsticamente

    significativa.

    En esta tabla se muestran dos renglones diferentes, uno suponiendo que los grupos tienen

    varianzas iguales en esa variable (TV) y el otro suponiendo varianzas diferentes.

    En este caso podemos suponer que las varianzas son iguales, porque la prueba de igualdad de

    varianzas no rechaza la hiptesis nula (varianzas iguales), el valor de significancia es 0.835 (NO es

    menor que el 0.05 necesario para rechazar la hiptesis nula).

    Por lo tanto observaremos el primer rengln. Ah se puede leer el valor de la significancia

    estadstica de la diferencia, es donde dice Sig. (bilateral) que ese en este caso 0.481, este valor

    NO es menor que 0.05, por lo tanto se deduce que la diferencia entre las medias de las horas de

    TV no es significativa. A pesar de que las medias son 11.24 y 10.87 la diferencia no es

    estadsticamente significativa. Tambin se muestra un intervalo de confianza para la diferencia

    entre las medias. En este ejemplo el intervalo para la diferencia va de -0.662 a 1.403, esto quiere

    decir que con un 95% de confianza podramos decir que la diferencia se encuentra en ese rango.

    Podemos observar que el intervalo de confianza incluye al cero, o sea, no se puede descartar que

    la diferencia puede ser cero, esto confirma la conclusin de que no hay diferencia significativa

    entre las medias.

    Estadsticos de grupo

    genero N Media Desviacin tp. Error tp. de la

    media

    tv Hombre 342 11.24 7.118 .385

    Mujer 367 10.87 6.886 .359

  • II. RELACIN DE UNA VARIABLE CUALITATIVA CON UNA CUANTITATIVA.

    VARIABLE INDEPENDIENTE: RELIGIN (CUALITATIVA)

    VARIABLE DEPENDIENTE: HIJOS2 (CUANTITATIVA)

    OBJETIVO: Probar estadsticamente si el nmero de hijos que una persona deseara tener

    depende de sus creencias religiosas.

    HIPTESIS NULA: Las creencias religiosas de las personas no influyen en el nmero de

    hijos que desearan tener, o El nmero de hijos que desea tener una persona es

    independiente de sus creencias religiosas.

    Se utilizar el procedimiento ANOVA porque en este caso la variable religin tienen ms

    de 2 valores por lo tanto se forman ms de 2 grupos.

    El procedimiento ANOVA solamente es vlido cuando las varianzas son estadsticamente

    iguales. Si las varianzas no son homogneas se tendra que dividir la muestra en solo 2

    grupos (por ejemplo catlicos y no-catlicos) y hacer la prueba t para diferencia de

    medias de 2 muestras independientes.

    PROCEDIMIENTO.

    1. Seleccionar el procedimiento ANOVA de un factor (ANOVA = Analysis Of Variance =

    Anlisis de Varianza). Este procedimiento es til para probar diferencias entre medias

    cuando la poblacin (y por lo tanto la muestra) se divide en ms de 2 grupos.

  • 2. Seleccionar las variables. La variable dependiente es hijos2 que tiene la descripcin

    Le gustara tener (hijos). La variable independiente es religin.

    3. En Opciones seleccionar estadsticos Descriptivos y Prueba de homogeneidad de

    las varianzas. Continuar.

  • 4. Ejecutar el procedimiento. Aceptar.

    5. Resultados.

    INTERPRETACIN.

    En esta tabla se observa que la media en el nmero de hijos que les gustara tener va desde 2.19

    para quienes son indiferentes a la religin, 2.20 para los no creyentes hasta 2.56 para los catlicos.

    Tambin se muestra la desviacin estndar tpica de cada grupo, y los intervalos de 95% de

    confianza para la media del nmero deseado de hijos para cada grupo. Tambin en los intervalos

    de confianza observamos que el grupo que le gustara tener mayor nmero de hijos son los

    catlicos, y los que desean menos hijos son los no creyentes o indiferentes.

    En las tablas posteriores tendremos elementos para probar estadsticamente si esas diferencias

    observadas en las muestras son estadsticamente significativas y se pueden extrapolar a la

    poblacin.

  • En la tabla de arriba se est probando si las varianzas de los diferentes grupos son iguales.

    Concluimos que S son iguales, porque la hiptesis nula es que las varianzas son iguales, y con la

    significancia de 0.096 no se alcanza a rechazar la hiptesis nula. Para rechazar la hiptesis de

    varianzas iguales, la significancia tendra que ser menor que 0.05.

    Con esta conclusin de varianzas iguales llegamos a la conclusin de que s es vlido interpretar los

    resultados de ANOVA (analysis of variance).

    De la tabla de ANOVA se concluye que las diferencias en las medias del nmero de hijos deseados

    S son estadsticamente significativas. Esto lo sabemos porque el valor de la significancia es 0.025,

    valor que es menor que 0.05.

    La hiptesis nula es que no existe diferencia en las medias, como 0.025 < 0.05 se rechaza la

    hiptesis nula y concluimos que el nmero de hijos que desea tener S depende de las creencias

    religiosas de la persona.

    NOTA. Este procedimiento tambin se puede hacer como:

    pero no sale la prueba de igualdad de varianzas.

  • III. INTERVALO DE CONFIANZA PARA UNA MEDIA.

    VARIABLE: Ingreso 3 (Aportaciones familiares).

    Para hacer esta prueba es necesario que la variable sea cuantitativa y mtrica.

    OBJETIVO. Estimar un intervalo de confianza del 95% para la media poblacional de una variable a

    partir de los datos de una muestra.

    PROCEDIMIENTO.

    1. Seleccionar el procedimiento (prueba t para una muestra).

    2. Seleccionar las variables:

    3. Ejecutar el procedimiento (Aceptar).

    4. Analizar resultados.

  • INTERPRETACIN.

    Las tablas muestran que se analizaron 652 casos vlidos, obteniendo una media de aportaciones

    de 19.02 en la muestra. Con un 95% de confianza podramos afirmar que la media poblacional se

    encuentra entre 17.11 y 20.93.

    NOTA. El procedimiento utilizado se aplica tambin para hacer la prueba de hiptesis de que la

    media tenga un cierto valor, en este ejercicio como solamente nos interesa el intervalo de

    confianza para la media poblacional dejamos el valor hipottico como cero.

  • IV. RELACIN DE UNA VARIABLE CUALITATIVA CON OTRA CUALITATIVA.

    VARIABLE INDEPENDIENTE: GNERO (CUALITATIVA)

    VARIABLE DEPENDIENTE: AMOR (CUALITATIVA)

    OBJETIVO: Probar estadsticamente si la situacin afectiva actual depende del sexo de la

    persona.

    HIPTESIS NULA: El sexo de la persona no influye en su situacin afectiva actual, o La

    situacin afectiva es independiente del sexo de la persona.

    PROCEDIMIENTO. Para probar la relacin entre 2 variables cualitativas se utilizar el

    mecanismo de tablas cruzadas o tablas de contingencia, con la prueba estadstica Chi-

    cuadrada.

    1. Seleccionar el procedimiento (tablas de contingencia).

    (NOTA: En SPSS hay distintos caminos para llegar a una prueba Chi-cuadrada, este es uno

    de ellos solamente)

  • 2. Seleccionar las variables. Variable independiente genero, variable dependiente

    amor.

    3. En Estadsticos seleccionar Chi-cuadrada (continuar):

  • 4. En Casillas seleccionar Esperado y Observado. Esto nos mostrar en cada celda

    de la tabla las frecuencias esperadas y las observadas en la muestra. Las frecuencias

    esperadas son las que cabra esperar si la hiptesis nula es vlida, es decir si no hay

    dependencia entre las variables. Continuar.

    5. Ejecutar el procedimiento con Aceptar. Ver los resultados.

    Hay 649 casos en los que se tiene informacin vlida en ambas variables gnero y amor.

  • En la tabla se muestran las frecuencias esperadas (asumiendo que una variable NO influye en la

    otra) y las frecuencias observadas. Por ejemplo hay en la muestra 126 hombres que tienen novia

    formal, y se esperaran 141 si las variables fueran independientes. Tambin hay 37 mujeres en la

    muestra que nunca han tenido una relacin afectiva especial, y se esperaban 35 en el caso de

    independencia.

    Observamos diferencias entre las frecuencias esperadas y las observadas, con la informacin de la

    siguiente tabla podremos ver si estas diferencias son estadsticamente significativas.

    En esta tabla nos interesa el valor de significancia de la Chi-cuadrada de Pearson. El valor de la

    significancia es de 0.072, este valor NO es menor que 0.05 por lo que concluimos que NO podemos

    rechazar la hiptesis nula (independencia de las variables), de esta manera nuestra conclusin es

    que las variables genero y amor son independientes, lo que significa que el sexo de la persona

    no est influyendo en lo que declaran con respecto a su situacin afectiva. Hombres y mujeres se

    estn comportando igual en ese aspecto.

    NOTA: Aunque el valor de 0.072 es muy cercano al valor de 0.05, la muestra es bastante grande y

    es suficiente evidencia para NO rechazar la hiptesis de independencia.

  • V. RELACIN DE UNA VARIABLE CUALITATIVA CON OTRA CUALITATIVA. OTRO EJEMPLO.

    VARIABLE INDEPENDIENTE: GNERO (CUALITATIVA)

    VARIABLE DEPENDIENTE: OCIO (CUALITATIVA)

    OBJETIVO: Probar estadsticamente si las actividades recreativas que llevan a cabo las

    personas dependen del sexo de la persona.

    HIPTESIS NULA: El sexo de la persona no influye en el tipo de actividades que realiza en

    su tiempo de ocio, o El tipo de actividades recreativas que realiza es independiente del

    sexo de la persona.

    PROCEDIMIENTO. Para probar la relacin entre 2 variables cualitativas se utilizar el

    mecanismo de tablas cruzadas o tablas de contingencia, con la prueba estadstica Chi-

    cuadrada.

    RESULTADOS.

  • CONCLUSIN. El valor de significancia estadstica que se muestra para el estadstico Chi-cuadrada

    de Pearson es 0.000 y aunque no se muestran ms decimales es claro que el valor es mucho

    menor que 0.05, por lo tanto sin duda rechazamos la hiptesis de independencia de las variables y

    llegamos a la conclusin de que el sexo de la persona S influye en el tipo de actividades que

    realiza en su tiempo de ocio, o sea, hombres y mujeres difieren en el tipo de actividades

    recreativas que llevan a cabo.

  • VI. RELACIN DE UNA VARIABLE CUANTITATIVA CON OTRA CUANTITATIVA.

    VARIABLE INDEPENDIENTE: SUMAINGR SUMA DE INGRESOS (CUANTITATIVA)

    VARIABLE DEPENDIENTE: TV HORAS DE TV (CUANTITATIVA)

    OBJETIVO: Probar estadsticamente si el nivel de ingreso familiar (suma de todos los

    ingresos) influye significativamente en el nmero de horas dedicadas a la TV.

    HIPTESIS NULA: El ingreso familiar no influye en el nmero de horas que se dedican a

    ver TV, o El tiempo dedicado a ver TV es independiente del nivel de ingresos familiares.

    PROCEDIMIENTO. Para probar la relacin entre 2 variables cuantitativas se utilizar el

    procedimiento de correlacin lineal.

    1. Seleccionar el procedimiento (correlaciones bivariadas).

    2. Seleccionar las variables.

  • 3. En Opciones seleccionar Medias y Desviaciones Tpicas (continuar).

    4. Correr el procedimiento y ver los resultados.

    5. CONCLUSIONES.

    El coeficiente de correlacin es muy bajo -0.09. Recordemos que los valores cercanos

    al 1 indican una muy fuerte correlacin positiva entre las variables, un valor cercano

    al -1 indica una correlacin negativa muy fuerte, y los valores cercanos al cero, como

    en este caso, indican una ausencia de correlacin entre las variables.

    Para ver si estadsticamente la correlacin es significativa o no, analizamos el valor de

    Significancia, en este caso el valor es 0.023, que es menor que 0.05 por lo que

    concluimos que S se puede rechazar la hiptesis nula, y tenemos que decir que el

    nivel de ingreso familiar S influye de manera significativa en el tiempo que le dedican

    a ver la TV. A pesar de que el valor aparente de la correlacin es bajo, vemos que

    estadsticamente es significativo. El signo negativo del coeficiente de correlacin nos

    indica que hay una relacin negativa entre las variables, mientras ms elevado es el

    nivel de ingresos, menos tiempo se le dedica a ver la TV.

  • VII. RELACIN DE UNA VARIABLE CUANTITATIVA CON OTRA CUANTITATIVA. OTRO

    EJEMPLO.

    VARIABLE INDEPENDIENTE: HORAS HORAS DE OCIO (CUANTITATIVA)

    VARIABLE DEPENDIENTE: TV HORAS DE TV (CUANTITATIVA)

    OBJETIVO: Probar estadsticamente si el nmero de horas libres de que dispone una

    persona influye significativamente en el nmero de horas dedicadas a la TV.

    HIPTESIS NULA: El nmero de horas de ocio de una persona no influye en el nmero de

    horas que se dedican a ver TV, o El tiempo dedicado a ver TV es independiente del

    nmero de horas libres que tenga la persona.

    PROCEDIMIENTO. Para probar la relacin entre 2 variables cuantitativas se utilizar el

    procedimiento de correlacin lineal. Analizar Correlaciones Bivariadas.

    RESULTADOS.

    El promedio de horas de TV es de 11.05 y el promedio de horas de tiempo libre es de

    21.05, esto significa que en promedio la mitad del tiempo libre se dedica a ver TV.

    En la tabla se observa que existe una correlacin moderada 0.228 entre las variables. El

    valor de Sig. (bilateral) nos indica que la correlacin es estadsticamente significativa y

    rechazamos la hiptesis nula. El valor de la significancia es 0.000 y aunque no muestra

    ms decimales es claramente menor que 0.05, de manera que tenemos que rechazar la

    hiptesis nula, y concluir que el nmero de horas libres que tiene una persona S influye

    de manera significativa en el nmero de horas que dedica a ver TV.

  • VIII. RELACIN DE UNA VARIABLE CUALITATIVA CON UNA CUANTITATIVA. CON PUNTO DE

    CORTE PARA AGRUPAR.

    VARIABLE INDEPENDIENTE: ESCALA POSICIN POLTICA IZQ DER (CUALITATIVA)

    VARIABLE DEPENDIENTE: INGRESOS1 INGRESO PERSONAL (CUANTITATIVA)

    OBJETIVO: Probar estadsticamente si el nivel de ingresos de una persona depende de su

    auto-clasificacin como de izquierda o de derecha en el mbito poltico.

    HIPTESIS NULA: La posicin poltica de izquierda o derecha no contribuye a predecir el

    nivel de ingreso de la persona, o El ingreso personal de un individuo es independiente

    de su posicin poltica de izquierda o de derecha.

    PROCEDIMIENTO.

    1. Seleccionar el procedimiento de prueba t para diferencia entre medias de dos muestras

    independientes. En este caso como se va a utilizar la prueba t (no ANOVA) la muestra

    debe separarse en solamente 2 grupos. Vamos a utilizar la prueba t con los grupos

    definidos con respecto a un punto de corte de los valores de la variable de agrupacin.

    2. Seleccionar las variables (ingresos personales, escala posicin poltica).

  • 3. En la variable escala hay que definir los grupos. Como los valores de escala (posicin

    poltica) pueden ir desde 1 (extrema izquierda) hasta 10 (extrema derecha), vamos a

    poner el punto de corte en 6, as los que hayan contestado 6 o ms se irn a un grupo que

    consideraremos de derecha, los de 5 o menos se irn al otro que consideraremos de

    izquierda. Esto se hace en el botn Definir Grupos. Continuar.

    4. Correr el procedimiento. Aceptar. Ver resultados.

    Se observa que hay muchas ms personas (411) que se auto clasifican como de izquierda que

    como de derecha (156). Contrario a lo que nos indicara el sentido comn, las personas con

    tendencia de derecha tienen en promedio menores ingresos personales (25.63) que quienes se

    clasifican como de izquierda (31.02).

    La prueba de igualdad de varianzas pasa marginalmente, ya que el valor de Significancia 0.053 est

    apenas por encima del valor de 0.05, se pueden asumir varianzas iguales. La significancia de la

    diferencia entre las medias es 0.282, que NO es menor que 0.05, por lo que no se puede rechazar

    la hiptesis nula. Por lo tanto se concluye que la diferencia entre las medias no es significativa.

    Aunque en la muestra existe una diferencia notable en el ingreso promedio, en favor de las

    personas de izquierda, la diferencia no alcanza a ser significativa, y no podemos generalizar el

  • resultado de la muestra. Por eso concluimos que el ingreso promedio es estadsticamente igual

    para los de derecha que para los de izquierda en la poblacin.