spss

6
 Breve gui´ on para las pr´ acticas con SPSS de la asignatura M´ etod os Est ad ´ ı st icos 1 Introducci´ on al SPSS El programa SPSS est´ a organizado en dos bl oques: el editor de datos  y el  visor de resultados . En la barra de men´ u (arriba de la pantalla) aparecen diversas opciones, de las cuales algunas ( Archivo ,  Edici´ on ,  Ver ,  Ventana  y  Ayuda ) son comunes a muchos prog ramas basad os en Windows, y ot ras son espec´ ıficas del SPSS. Datos  Permite denir y manejar variables. Transformar  Permi te realizar operacion es con los datos, generar n´ umeros aleatorios, etc. Analizar  Contiene el men´ u de las op eraciones netamente estad´ ısticas que se pueden realizar con los datos. En particular, aqu´ ı se encuentran los pro cedimientos de an´ alisis que nosotros usaremos. Gr´ aficos  Permite generar diversas representaciones gr´ acas de los datos (diagramas de dispersi´ on, de caja y bigotes, etc.). 1.1 El editor de dato s El editor de datos tiene dos vistas diferentes:  vista de datos  y  vista de variables . La primera tiene una estructura similar a la de una hoja de c´ alculo (Excel), y se usa para introducir los datos que se quieren analizar. El SPSS maneja los datos en t´ erminos de variabl es, cada una de las cuales correspo nde a una columna de la pantalla. Esto quiere decir que si quere mos in troducir unos datos, cada vari able debe ir en una columna: la variable respuesta, cada uno de los factores, o cada una de las variables regresoras, deben ocupar una columna del visor de datos. Al introduci r los datos en el visor de datos, p odemo s pensar en que estamos relle nando una “encuesta”: cada ınea horiz ontal de la cuadr´ ıcula ser´ a un “encuestado” ( caso), al que le corresponde un valor de cada una de las variables que intervienen en el problema (columnas). Hay que tener en cuenta a la hora de introducir los datos que el SPSS entiende los decimales con comas. Esto depende de la conguraci´ on regional de Windows (para usar el punto decimal hay que cambiarlo ah´ ı, no se puede cambiar desde el SPSS). En cuanto al  visor de variables , nos permite guardar informaci´ on adicional sobre las variables que manejamos. En  Nombre  podemos escribir para cada variable un nombre descriptivo de lo que es, en  Tipo  especicar si son num´ ericas o de cadena, denir cu´ antas posiciones totales y decimales le reservamos a los datos en cada casilla (Anchura y  Decimales), escribir un comentario explicativo de la variable en  Etiqueta, y poner nombres a los valores en Valores. En realidad la informaci´ on contenida aqu´ ı no interviene en el an´ alisis. Es interesante conservar una explicaci´ on de las variables, y jar unos nombres para los valores, para que sea m´ as sencillo entender el an´ alisis una vez que el SPSS genere tablas, diagramas, etc. Para guardar los datos, ir a  Archivo   Guardar  o  Guard ar Como  y seleccionar un nombre de archivo. 1

Upload: patricia-rodas

Post on 03-Nov-2015

224 views

Category:

Documents


0 download

DESCRIPTION

manaul

TRANSCRIPT

  • Breve guion para las practicas con SPSSde la asignatura Metodos Estadsticos

    1 Introduccion al SPSS

    El programa SPSS esta organizado en dos bloques: el editor de datos y el visor deresultados. En la barra de menu (arriba de la pantalla) aparecen diversas opciones,de las cuales algunas ( Archivo , Edicion , Ver , Ventana y Ayuda ) son comunesa muchos programas basados en Windows, y otras son especficas del SPSS.Datos Permite definir y manejar variables.Transformar Permite realizar operaciones con los datos, generar numeros aleatorios,etc.Analizar Contiene el menu de las operaciones netamente estadsticas que se puedenrealizar con los datos. En particular, aqu se encuentran los procedimientos de analisisque nosotros usaremos.Graficos Permite generar diversas representaciones graficas de los datos (diagramasde dispersion, de caja y bigotes, etc.).

    1.1 El editor de datos

    El editor de datos tiene dos vistas diferentes: vista de datos y vista de variables. Laprimera tiene una estructura similar a la de una hoja de calculo (Excel), y se usa paraintroducir los datos que se quieren analizar. El SPSS maneja los datos en terminosde variables, cada una de las cuales corresponde a una columna de la pantalla. Estoquiere decir que si queremos introducir unos datos, cada variable debe ir en unacolumna: la variable respuesta, cada uno de los factores, o cada una de las variablesregresoras, deben ocupar una columna del visor de datos. Al introducir los datos enel visor de datos, podemos pensar en que estamos rellenando una encuesta: cadalnea horizontal de la cuadrcula sera un encuestado (caso), al que le correspondeun valor de cada una de las variables que intervienen en el problema (columnas).

    Hay que tener en cuenta a la hora de introducir los datos que el SPSS entiende losdecimales con comas. Esto depende de la configuracion regional de Windows (parausar el punto decimal hay que cambiarlo ah, no se puede cambiar desde el SPSS).

    En cuanto al visor de variables, nos permite guardar informacion adicional sobrelas variables que manejamos. En Nombre podemos escribir para cada variable unnombre descriptivo de lo que es, en Tipo especificar si son numericas o de cadena,definir cuantas posiciones totales y decimales le reservamos a los datos en cada casilla(Anchura y Decimales), escribir un comentario explicativo de la variable en Etiqueta,y poner nombres a los valores en Valores. En realidad la informacion contenida aquno interviene en el analisis. Es interesante conservar una explicacion de las variables,y fijar unos nombres para los valores, para que sea mas sencillo entender el analisisuna vez que el SPSS genere tablas, diagramas, etc.

    Para guardar los datos, ir a Archivo Guardar o Guardar Como y seleccionarun nombre de archivo.

    1

  • Tambien se pueden importar datos de otros formatos (Excel, ASCII, Lotus, DBase,etc.). Para ello, ir a Archivo Abrir Datos y seguir con cuidado las instruc-ciones del Asistente para la importacion de texto.

    1.2 El visor de resultados

    El visor de resultados es donde se muestran las tablas y graficos generados por SPSS.Presenta dos paneles: en el izquierdo aparece un listado de los titulares del contenido(que podemos mostrar u ocultar a nuestro gusto), y en el derecho las tablas, graficosy resultados de texto. Desde el visor de resultados se puede modificar las propiedades(dimensiones, presentacion, colores, etc.) de las tablas y los graficos que se generan.Para ello, basta pulsar el boton derecho del raton sobre la tabla o el grafico a modificar,seleccionando Objeto tabla pivote u Objeto grafico, y luego Abrir y apareceranel Editor de Tablas o Editor de Graficos, que nos permiten cambiar diversasopciones. Tambien se puede exportar los resultados y los graficos del SPSS a otrasaplicaciones.

    2 Analisis descriptivo: graficos, estadsticos descrip-

    tivos

    2.1 Generar graficos

    Una vez que uno tiene los datos introducidos en el visor de datos, se pueden generardiversas representaciones graficas de los mismos. Entre otras, podemos tener

    Diagramas de caja y bigotes: seleccionar Graficos Diagramas de caja y luegoSimple (si solo queremos representar los diagramas de caja de una variable) o Agrupado(cuando queremos construir los diagramas para mas de una variable). En el cuadro dedialogo que aparece, pasar a Variable (o eje Y) la variable que queramos representary al Eje de categoras (o eje X) el factor (o variable) segun la cual queramos quedivida en poblaciones la variable a representar (de este modo, obtenemos un diagramacon una caja para cada nivel del factor).

    Diagramas de dispersion, de sectores, de barras, histogramas, etc.: todos se generan delmismo modo, solicitando Graficos Dispersion , por ejemplo, y luego Simple(si solo queremos una variable frente a otra, el resto de las opciones se refieren adibujar varios diagramas de dispersion juntos de una u otra manera), y en el cuadrode dialogo que sale, elegir la variable del eje X y la del eje Y. Cabe destacar que deesta forma no podemos generar histogramas por nivel del factor.

    Para suplir esto, podemos usar el procedimiento

    Analizar Estadsticos Descriptivos Explorar .En el cuadro de dialogo que aparece, definimos la variable respuesta y los fac-

    tores segun cuyos niveles hara el analisis. En Estadsticos, podemos definir que

    2

  • estadsticos descriptivos nos va a mostrar, y en Graficos, podemos solicitar los Di-agramas de caja (con niveles de factores juntos), los Diagramas de Tallo y Hojas ylos Histogramas (que apareceran por niveles del factor), y los Graficos con prueba denormalidad (graficos Q-Q normales, etc.).

    A menudo, en los cuadros de Opciones se nos preguntara que queremos hacercon los casos o valores perdidos o casillas no rellenas del visor de datos. En general,dejaremos la opcion que viene por defecto en el SPSS.

    3 Analisis de la varianza con un factor

    El procedimiento para realizar el Analisis de la Varianza con un factor se encuentraen

    Analizar Comparar medias ANOVA de un factorEn el cuadro de dialogo que aparece, llevar a la casilla Dependientes la variable

    respuesta a estudiar, y a la casilla Factor, la variable que contenga los niveles delfactor. Veamos que seleccionar en cada uno de los cuadros de los que dispone SPSS.

    Contrastes : con esta opcion el SPSS nos permite hacer contrastes a priori, que novamos a manejar. Se deja en blanco y Continuar.

    Post hoc : las pruebas Post hoc son lo mismo que los contrastes multiples a posteriori(para detectar donde se encuentran las diferencias entre medias). Se nos permite elegirdiversos metodos de control del error (elegimos Bonferroni, que es el que manejamosen clase, asumiendo igualdad de varianzas) y el nivel de significacion (total) para loscontrastes.

    Opciones : resultan de utilidad los Descriptivos (si antes no hemos realizado el

    procedimiento Explorar, ya que nos proporciona estimaciones de las medias por nivel)y la Prueba de homogeneidad de varianza (o prueba de Levene: segun el p-valorque nos proporcione el contraste aceptaremos o rechazaremos la hipotesis nula de quelas varianzas en todos los niveles del factor coinciden). En Valores perdidos debeaparecer con la opcion por defecto, como comentabamos antes.

    4 Analisis de la varianza con varios factores

    El procedimiento para realizar el Analisis de la Varianza con varios factores se en-cuentra en

    Analizar Modelo lineal general UnivarianteEn el cuadro de dialogo que aparece, llevar a la casilla Dependiente la variable

    respuesta a estudiar, y a la casilla Factores fijos, las variables que contengan losfactores que queramos incluir en el analisis. La casilla Factores aleatorios corre-sponde a factores con diseno aleatorio (en el que no se fijan los niveles de antemano;nosotros tenemos fundamentalmente datos referidos a diseno con factores fijos, nodisenos aleatorios). En Covariables y Ponderacion MCP no ponemos nada, porque

    3

  • corresponden a analisis de covarianza y con factores pesados, respectivamente, que nomanejaremos. Veamos que seleccionar en cada uno de los cuadros de los que disponeSPSS.

    Modelo : es donde podemos especificar que tipo de estudio de los datos queremos. Pordefecto, el estudio se hace segun un modelo Factorial completo, es decir, se incluyentodos los factores y todas las posibles interacciones entre ellos. Si no queremos estetipo de modelo, podemos marcar Personalizado, y pasar al lado de la derecha losfactores (marcando cada factor y pasandolo a la derecha con la flecha, por separado)y las interacciones que queremos estudiar. Para especificar una interaccion, debemosmarcar los factores involucrados (dos, tres, o los que sean) y pasarlos juntos a laderecha (apareceran con un asterisco entre ellos). En el cuadro debajo de la flechadebe aparecer Interaccion, en Suma de cuadrados Tipo III, y marcado el cuadroIncluir interseccion en el modelo.

    Contrastes : con esta opcion el SPSS nos permite hacer contrastes a priori, que novamos a manejar. Se deja en blanco y Continuar.

    Graficos : este cuadro nos permite generar graficos de perfil, en los que se representanlas medias de la variable dependiente dividida segun los niveles de uno de los factoresfrente a los distintos de niveles de otro (cada punto del grafico que aparece es la mediaen el correspondiente cruce de niveles). En el Eje horizontal debemos poner el quequeremos que tenga este ultimo papel, y en Lneas distintas el otro. Estos graficosson utiles para detectar interaccion entre factores.

    Post hoc : las pruebas Post hoc son lo mismo que los contrastes multiples a posterioripara la diferencia de los efectos i, j, etc.. Elegimos para que factores queremos queaparezcan los intervalos de confianza (pasandolos a la derecha) y Bonferroni comometodo de control del error. SPSS no permite hacer pruebas post hoc para los efectosde las interacciones ()ij, etc..

    Guardar : permite almacenar diversas variables generadas por SPSS. Este proced-imiento resultara de mayor utilidad y mas facil explicacion cuando se aplique a mod-elos de regresion.

    Opciones : resulta de interes el calculo de las Medias marginales, GLOBAL y para

    cada uno de los factores (en cada nivel, nos dara la media correspondiente). Si mar-camos Comparar los efectos principales y en el cuadro inferior seleccionamosBonferoni, obtenemos los intervalos multiples que en las pruebas post hoc para losfactores. Tambien son de utilidad los Descriptivos (si antes no hemos realizado elprocedimiento Explorar, ya que nos proporciona lod estadsticos por cruce de nivelesy por nivel), la Prueba de homogeneidad de varianza (o prueba de Levene: segunel p-valor que nos proporcione el contraste aceptaremos o rechazaremos la hipotesisnula de que las varianzas en todos los cruces de niveles del factor coincide; es utilcuando tenemos replicacion del experimento) y los Graficos de dispersion pornivel (tambien para datos con replicacion). Por ultimo, podemos elegir el nivel designificacion total que se usara en todos los intervalos de confianza.

    4

  • 5 Analisis de regresion lineal (simple y multiple)

    El procedimiento para realizar el analisis de regresion lineal se encuentra en

    Analizar Regresion LinealEn el cuadro de dialogo que aparece, llevar a la casilla Dependiente la variable

    respuesta a estudiar, y a la casilla Independientes, las variables regresoras que quer-amos incluir en el analisis. La casilla Metodo corresponde a elegir de que maneravamos incorporando las variables al analisis, y la dejamos en Introducir. El resto delas casillas las dejamos vacas. Veamos que seleccionar en cada uno de los cuadros delos que dispone SPSS.

    MCP>> : no ponemos nada, porque corresponde a un analisis en el que el efecto decada variable recibe un peso distinto; no manejaremos este tipo de analisis.

    Estadsticos : aparecen diversos subcuadros:

    Coeficientes de regresion: Estimaciones nos proporcional las estimacionesde los coeficientes del hiperplano de regresion, con su error tpico, coeficientestipificados, el valor del estadstico t asociado a cada coeficiente y el p-valordel test bilateral asociado a dicho estadstico. Intervalos de confianza nosda los intervalos de confianza para los coeficientes del hiperplano de regresion.Matriz de covarianzas nos da una matriz de varianzas-covarianzas entre loscoeficientes de regresion.

    Ajuste de modelo: da una lista de variables introducidas, el coeficiente decorrelacion de Pearson r para cada una de ellas, r2, r2 corregida, error tpico dela estimacion y tabla ANOVA del analisis de la varianza.

    Cambio en R2: cuando hay varias variables regresoras, da el ajuste del modelocuando se van eliminando variables.

    Descriptivos: proporciona el numero de casos validos, la media y la desviaciontpica insesgada para cada variable en el analisis. Tambien muestra una matrizcon las correlaciones entre variables.

    Correlaciones parcial y semiparcial: estudia las correlaciones entre vari-ables segun diversas tecnicas.

    Diagnosticos de colinealidad: muestra los autovalores de la matriz de pro-ductos cruzados, no centrada y escalada. Sirve para detectar relacion lineal entrevariables regresoras.

    Residuos: si marcamos Durbin-Watson, se nos proporcionara el valor del es-tadstico de Durbin-Watson, que es una prueba sobre la independencia de losresiduos. Se suele aceptar que no hay razon para suponer que los residuos noson independientes (es decir, que falle la hipotesis de independencia), si el es-tadstico da un valor entre 1.5 y 2.5. Diagnosticos por caso nos da un listadode todos los residuos que se alejan de 0 (el valor esperado para los mismos) mas

    5

  • del numero de desviaciones tpicas que le especifiquemos. Ademas, aparece unatabla resumen con los estadsticos descriptivos de los residuos.

    Graficos : este cuadro nos permite generar graficos de dispersion de residuos frente avalores pronosticados o frente a la variable dependiente. DEPENDENT es la variable de-pendiente, ZPRED son los pronosticos tipificados, ZRESID son los residuos tipificados,DRESID son los residuos eliminados o corregidos (calculados haciendo el analisis deregresion sin esa observacion; utiles para detectar atpicos influyentes), ADJPRED sonlos pronosticos corregidos, SRESID son los residuos estudentizados y SDRESID son losresiduos corregidos. Tambien podemos generar histogramas de residuos y graficos deprobabilidad normal, para comprobar la normalidad de los datos. La opcion Generartodos los graficos parciales da una serie de graficos en los que, para cada vari-able regresora Xi, se representan los residuos de la variable dependiente en un analisisde regresion sin esa variable regresora frente a los residuos de la regresion en la quela variable dependiente es Xi, y las independientes el resto de las variables regreso-ras (sirven para comprobar linealidad: aslan la relacion entre variable dependiente yregresora).

    Guardar : salvamos como nuevas variables los residuos, valores pronosticados, estima-ciones de efecto palanca (distancias de Cook y Mahalanobis), etc. como variables (creanuevas columnas en el visor de datos). En particular, Intervalos de pronosticonos proporciona los extremos inferiores (lmci# y lici#) y superiores (umci# y uici#)para los intervalos de confianza para el pronostico medio y el pronostico individual(respectivamente). Nos da las bandas de confianza.

    Opciones : dejamos todas las opciones por defecto, ya que se refieren al metodo de

    incorporacion de variables al analisis de regresion (sirve para detectar que variablesinfluyen de manera significativa en el ajuste del modelo).

    6