Universidad Nororiental Privada Gran Mariscal de Ayacucho.Facultad de Ciencia Económicas y Sociales.
Escuela de Administración de Empresa.Núcleo El Tigre.
Trabajo de Estadística General
Profesor EstudiantesHamlet Mata Elias Hernández 28.095.997
26/03/2018
INTRODUCCIÓN
Uno de los programas de Análisis Estadístico más extendidos en la práctica es el
SPSS, debido a que está disponible en diferentes entornos, para diferentes sistemas
operativos.
Statistical Package for the Social Sciences (SPSS) es un programa estadístico-
informático muy usado en las ciencias sociales y las empresas de investigación de
mercado. Fue creado en 1968 por Norman H. Nie, C. Hadlai (Tex) Hull y Dale H.
Bent. Entre 1969 y 1975 la Universidad de Chicago por medio de su National
Opinión Research Center estuvo a cargo del desarrollo, distribución y venta del
programa. A partir de 1975 corresponde a SPSS Inc.
Originalmente el programa fue creado para grandes computadores. En 1970 se
publica el primer manual de usuario del SPSS por Nie y Hall. Este manual populariza
el programa entre las instituciones de educación superior en EE. UU. En 1984 sale la
primera versión para computadores personales.
El programa comprende desde técnicas descriptiva básicas hasta técnicas
avanzadas de forma que cubre la mayor parte de las necesidades de los investigadores
aplicados en campos tan diversos como las Ciencias Sociales, la Biología, la
Medicina etc. Como programa estadístico es muy popular su uso debido a la
capacidad de trabajar con bases de datos de gran tamaño. Es por ello que hemos
expuesto en el presente manual el funcionamiento básico de este programa teniendo
en cuenta la perspectiva del usuario que necesita solamente el manejo de opciones
sencillas para el trabajo diario.
Comenzaremos con el concepto del SPSS versión 13.0, sus características, su
funcionalidad así como también su aplicación para resolver problemas estadísticos.
Desarrollo
PROGRAMA ESTADÍSTICO –INFORMÁTICO SPSS
SPSS 13.0 es un sistema global para el análisis de datos para ordenadores
personales de tipo modular. SPSS puede adquirir datos de casi cualquier tipo de
archivo y utilizarlos para generar informes tabulares, gráficos y diagramas de
distribuciones y tendencias, estadísticos descriptivos y análisis estadísticos
complejos.
CARACTERÍSTICAS DEL SPSS
SPSS para Windows es muy sencillo de utilizar, pues proporciona una amplia gama
de capacidades para todo el proceso analítico, incluyendo las etapas de planificación,
recogida y acceso a los datos, tratamiento de la información, análisis, reporte y
utilización de los resultados.
Este programa presenta una serie de características importantes entre las cuales
tenemos:
Mejores capacidades para presentar resultados.
La nueva versión SPSS para Windows ofrece:
-Mayores capacidades para la presentación de resultados y generación de
informes.
-Los nuevos tipos de gráficos y mejoras en la presentación, proporcionan más
opciones a los usuarios.
-El nuevo módulo opcional SPSS Tablas™ ofrece más capacidades de gestión de
categorías, que permiten a los usuarios un mayor control de los datos presentados.
-Además, las tablas y gráficos pueden exportarse fácilmente desde SPSS a
Microsoft® PowerPoint®, ahorrándoles tiempo y mejorando la precisión a la hora
de reportar los datos.
Las capacidades de visualización de los datos que ofrece SPSS 13.0 no tienen
precedentes.
Nuevos módulos adicionales que permiten al usuario una mejor
identificación de grupos.
-El nuevo módulo adicional Classification Trees™ (Árboles de Clasificación),
crea árboles de clasificación y decisión que trabajan directamente en el entorno
SPSS para ayudar a los usuarios a identificar grupos, descubrir relaciones entre
grupos y predecir eventos futuros.
Gestión de los datos más potente.
-Las novedades de SPSS para la gestión de los datos permite al usuario ahorrar
tiempo, a la vez que mejora la precisión y la fiabilidad de sus datos. Se consigue
que la información contenida en las cadenas de texto muy largas no se corte ni se
pierda al trabajar con preguntas abiertas o datos exportados desde otros programas
que permiten cadenas de datos largas.
El nuevo Asistente de Fechas y Horas hace más fácil la importación de fechas
y horas desde diversas fuentes simplificando una serie de tareas comunes
asociadas a estas variables.
El Editor de datos mejorado incluye nuevos controles de partición –un
sistema similar a una hoja de cálculo que permite introducir y mostrar
datos- consiguiendo que el usuario analice fácil y rápidamente grandes
volúmenes de datos.
Análisis predictivo para el análisis de encuestas.
La nueva funcionalidad, Modelo Lineal General (CSGLM), del módulo
Muestras Complejas, permite a los usuarios construir modelos de regresión
lineal, análisis de varianza (ANOVA) y de covarianza (ANCOVA) y evaluar
y predecir resultados numéricos. El módulo también incorpora regresión
logística que permite a los usuarios analizar y calcular resultados
categóricos.
El nuevo módulo de muestras complejas de SPSS ofrece una estructura de
resultados predictivos a partir de diseños muéstrales complejos.
-SPSS Muestras Complejas es un módulo excepcional que permite predecir
resultados de forma precisa basándose en los datos de una encuesta
INSTALACIÓN DEL SPSS PASO A PASO
A continuación se presenta la instalación del programa SPSS versión 13 paso a
paso.
1. Introducir el CD y seleccionar la opción 'Instalar SPSS'. Presione 'Siguiente'.
2. Seleccionar 'Lic. de sede'. Presione 'Siguiente'.
3. Aceptar los términos del contrato de la licencia. Presione 'Siguiente'
4. Leer la información. Presione 'Siguiente'.
5. Introducir el nombre de usuario y el de la organización, con 'UMU' vale y el
número de serie, que no es lo mismo que el número de licencia. En realidad si no
se desea registrar la copia se puede poner aquí cualquier cosa. Presione
'Siguiente'.
6. “Carpeta de destino”, se puede seleccionar otra ubicación para la
instalación. Presione 'Siguiente'
7. “Preparado para Instalar el programa”. Presione 'Instalar'
8. “Instalando....”, este paso puede tardar unos minutos. Presione 'Siguiente'.
9. “Licenciar SPSS ahora”. Se puede hacer ahora o no. 'Aceptar'.
10. Seleccionar 'Inicio'. Presione 'Siguiente'.
11. Seleccionar la primera opción. Presione 'Siguiente
12. Introduzca un 'Código de Autorización' valido y presione 'Siguiente'.
13. Puede tardar unos instantes.
14. Finalmente Presione 'Finalizar'. Reinicie el producto SPSS.
ESTRUCTURA DEL SPSS
El SPSS funciona mediante menús desplegables y cuadros de diálogo que permiten
hacer la mayor parte del trabajo utilizando el puntero del ratón. Al iniciar una sesión
con el SPSS aparece una ventana de aspecto similar al de una hoja de cálculo: el
Editor de datos la cual representa la ventana principal del SPSS, pero no la única.
Tipos de ventanas SPSS
Existen ocho tipos de ventanas SPSS. Las dos ventanas principales son el Editor de
datos, y el Visor de resultados, Tres de las ocho ventanas (los editores de texto,
tablas y gráficos) se encuentran dentro del propio Visor de resultados. Y otra de las
ventanas no es más que una versión borrador del Visor. Las dos ventanas restantes
son el Editor de sintaxis y el Editor de procesos.
El Editor de Datos
Contiene el archivo de datos sobre el que se basa la mayor parte de las acciones que
es posible llevar a cabo con el SPSS y se abre automáticamente
El Visor de Resultados
Recoge la información (tablas, gráficos, etc.) que el SPSS genera como
consecuencia de las acciones que lleva a cabo. Los resultados del Visor adoptan tres
formatos distintos: tablas, gráficos y texto. El SPSS dispone de un editor para cada
uno de estos tres formatos básicos:
• El Editor de tablas. Ofrece múltiples posibilidades de edición de los resultados
presentados en formato de tabla pivotante (un tipo de formato propio de SPSS).
• El Editor de gráficos. Permite modificar los colores, los tipos de letra, las etiquetas,
la posición de los ejes y muchos otros detalles de los gráficos del Visor.
• El Editor de texto. Permite modificar los diferentes atributos (tipo, tamaño, color,
etc., de las fuentes) de los resultados tipo texto: títulos, subtítulos y notas.
Una cuarta ventana corresponde al Visor en formato borrador: el Borrador del
Visor de resultados. Ofrece la misma información que el Visor, pero en formato
texto, es decir, con un aspecto menos depurado y sin las posibilidades de edición
propias del Visor (no es posible, por ejemplo, pivotar tablas o editar gráficos).
El Editor de Sintaxis
Permite utilizar las posibilidades de programación del SPSS. Las acciones que el
SPSS lleva cabo como resultado de las selecciones hechas en los menús y cuadros de
diálogo se basan en un conjunto de sentencias construidas con una sintaxis propia del
SPSS.
Es posible tener abiertas simultáneamente varias ventanas de sintaxis. Aunque el
Editor de sintaxis no es imprescindible para trabajar con el SPSS, su capacidad para,
entre otras cosas, automatizar trabajos repetitivos, lo convierte en una ventana de
especial utilidad.
El Editor de Procesos
Un proceso (script) es una secuencia de sentencias que sirve para personalizar y
automatizar algunas tareas SPSS, especialmente en lo relacionado con el contenido y
el aspecto de las tablas de resultados.
Cuadros de Diálogo
Además de las ventanas SPSS ya descritas, existe también otro tipo de ventanas
llamadas cuadros de diálogo. Estas ventanas son las que el SPSS utiliza para que el
usuario pueda llevar a cabo cualquier acción: son las ventanas que permiten al usuario
dialogar con el SPSS para darle instrucciones sobre lo que desea hacer; permiten
utilizar la mayoría de las funciones del SPSS simplemente utilizando el puntero del
ratón.
Cuadro de diálogo Abrir archivo
Contenido del cuadro de diálogo Frecuencias
Cuadro de diálogo Descriptivos
Subcuadros de Diálogo
Estos cuelgan del cuadro de diálogo principal y permiten seguir seleccionando
opciones no contenidas en éste hasta conseguir personalizar al máximo la ejecución
de un determinado procedimiento. Por lo general, los subcuadros de diálogo
contienen tres botones: Continuar, Cancelar y Ayuda. El botón Continuar permite
volver al cuadro de diálogo principal tras marcar las opciones deseadas.
Subcuadro de diálogo Descriptivos: Opciones
Barra de Menús
Las barras de menús contienen una serie de menús desplegables que permiten
controlar la mayoría de las acciones que el SPSS puede llevar a cabo. Se encuentran
situadas en la parte superior de cada ventana, inmediatamente debajo del nombre de
la ventana. Cada tipo de ventana SPSS tiene su propia barra de menús, con opciones
particulares para las funciones relacionadas con ella. Algunos de estos menús, como
Estadísticos, Gráficos o Ventana, se repiten en todas las ventanas. Otros menús son
específicos de un tipo particular de ventana. A continuación se describen todos ellos,
indicando a qué ventanas pertenecen y en cuáles no están disponibles:
Archivo. Permite crear un nuevo archivo SPSS, abrir uno existente, grabar, leer datos
creados con otras aplicaciones, etc.
Edición. Contiene las opciones habituales de Windows para copiar datos, pegar,
buscar, etc.
Ver. Permite personalizar la barra de estado, visualizarla o no, visualizar las etiquetas
o los valores de las variables, visualizar o no la cuadrícula de la base de datos, etc.
Datos. Contiene opciones para hacer cambios que afectan a todo el archivo de datos
(unir archivos, transponer variables y casos, crear subconjuntos de casos, etc.). Estos
cambios son temporales mientras no se guarde explícitamente el archivo.
Transformar. Las opciones de este menú permiten crear variables nuevas y cambiar
los valores de las variables ya existentes poniendo a disposición del usuario una gran
cantidad de funciones.
Insertar. Disponible en el Visor de resultados, en el Editor de tablas y en el Editor
de texto. Contiene opciones para insertar texto, gráficos, títulos, encabezamientos,
notas, saltos de página, objetos de otras aplicaciones, etc.
Pivotar. Sólo disponible en el Editor de tablas. Permite modificar la ubicación de las
entradas (filas, columnas, capas) de las tablas de resultados.
Galería. Sólo disponible en el Editor de gráficos. Permite seleccionar diferentes
tipos de gráficos para unos mismos datos.
Diseño. Sólo disponible en el Editor de gráficos. Contiene múltiples opciones para
controlarlas características de un gráfico: la escala y los rótulos de los ejes, los títulos
y las leyendas, los tipos de letra, los colores, etc.
Series. Sólo disponible en el Editor de gráficos. Desde este menú es posible
seleccionar las categorías que se desea mostrar/ocultar en el eje de abscisas. También
es posible optar entre gráficos de barras, de líneas y de áreas para una misma serie de
datos.
Proceso. Sólo disponible en el Editor de procesos. Sirve para crear nuevas funciones
y rutinas de procesamiento, acceder a un editor de cuadros de diálogo, ejecutar
procesos previamente definidos, controlar el color y el tipo de letra de las palabras
clave y de los comentarios de los archivos de proceso, etc.
Depurar. Sólo disponible en el Editor de procesos. Permite depurar procesos básicos
y acceder a un editor de objetos.
Formato. Disponible en el Visor de resultados y en sus tres editores (texto, gráficos
y tablas). En el Visor de resultados permite cambiar el alineamiento de los objetos.
En el Editor de tablas contiene opciones para controlar el formato y las propiedades
de las tablas y de sus casillas, ajustar automáticamente las dimensiones de la tabla,
rotar las cabeceras de las filas y de las columnas, etc. En el Editor de gráficos,
permite controlar el color y la trama del relleno, el estilo de las líneas y de las barras,
y el tipo de letra; también permite intercambiar los ejes de un gráfico, efectuar
rotaciones 3D en los diagramas de dispersión, desgajar uno o más sectores de un
diagrama de sectores, etc. En el Editor de texto, sirve para modificar el tipo de letra
(fuente, tamaño, aspecto) y el alineamiento de los objetos de texto.
Analizar. Contiene todos los procedimientos estadísticos. Desde este menú es posible
generar todo tipo de gráficos: de barras, de líneas, de sectores, diagramas de
dispersión, histogramas, gráficos de control de calidad, etc.
Utilidades. No disponible en el Editor de gráficos. Permite obtener información
sobre las variables o sobre el archivo de datos, controlar las variables que aparecen en
las listas de variables de los cuadros de diálogo, ejecutar procesos (o crear y editar
auto- procesos desde el Visor de resultados) y editar las barras de menús. En el Visor
de resultados y en el Editor de sintaxis, ofrece la posibilidad de cambiar de ventana
designada.
Ejecutar. Sólo disponible en el Editor de sintaxis. Contiene varias opciones para
ejecutar total o parcialmente las sentencias de un archivo de sintaxis.
Ventana. No disponible en el Editor de gráficos. Permite cambiar de una ventana a
otra dentro del SPSS y minimizar todas las ventanas abiertas.
Ayuda. Ofrece ayuda general sobre las funciones más importantes del SPSS y
proporciona acceso a la página principal de SPSS en Internet. También contiene el
Tutorial y el Asesor estadístico
El Editor de Menús
El Editor de menús del SPSS sirve para personalizar las barras de menús de las
principales ventanas SPSS. Mediante el Editor de menús es posible añadir (o
eliminar) uno o varios menús nuevos a las barras de menús disponibles y añadir (o
eliminar) uno o varios elementos de menú a los menús ya existentes. Aunque no es
necesario conocer el Editor de menús para utilizar correctamente el SPSS, su uso
podría facilitar, en ocasiones, la ejecución de tareas repetitivas no incluidas en los
menús del sistema.
Barra de Herramientas
Una barra de herramientas es un conjunto de botones-iconos que permiten ejecutar
algunas de las funciones del SPSS de forma rápida y sencilla. Cada ventana tiene su
propia barra de herramientas, con botones específicos adaptados a sus funciones
básicas. Al pasar con el puntero del ratón (sin pulsar ningún botón) por encima de una
herramienta, se abre automáticamente un pequeño recuadro de ayuda pista ofreciendo
una breve descripción de la función asociada a esa herramienta.
Barra de herramientas del Editor de datos con un ejemplo del recuadro de ayuda
pista que aparece al situar el puntero del ratón sobre el botón-icono de la
herramienta Guardar archivo
El resto de las barras de herramientas son similares a ésta algunas de las
herramientas son, incluso, las mismas.
Abrir archivo. Muestra el cuadro de diálogo Abrir archivo, el cual permite abrir un archivo SPSS de cualquier tipo. Con esta herramienta, los archivos listados
por defecto son archivos de datos en formato SPSS con extensión; sin embargo, el
cuadro de diálogo contiene opciones que permiten seleccionar el tipo de archivos que
se desea ver listados.
Guardar archivo. Guarda el archivo de datos. Si el archivo no tiene nombre, abre el cuadro de diálogo Guardar archivo, el cual permite asignar nombre y
ruta al archivo de la ventana activa.
Imprimir. Abre el cuadro de diálogo Imprimir documento, el cual permite
imprimir el archivo completo o sólo una parte seleccionada.
Recuperar cuadros de diálogo. Muestra una lista con los últimos cuadros de diálogo abiertos y permite elegir cualquiera de ellos.
Deshacer/rehacer. Deshace o rehace las últimas acciones de edición llevadas a cabo: borrar o introducir un dato, o una variable, o un caso, cambiar el
nombre de una variable, etc.
Ir a gráfico. Convierte en ventana activa la ventana del Editor de gráficos.
Ir a caso. Abre el cuadro de diálogo Ir a caso, el cual permite desplazar el cursor a un caso concreto del archivo de datos.
Variables. Abre el cuadro de diálogo Variables, que contiene información sobre el formato, las etiquetas y los valores perdidos de las variables del archivo de
datos.
Buscar. Abre el cuadro de diálogo Buscar datos, el cual permite buscar valores concretos en la variable en la que se encuentra el cursor.
Insertar caso. Inserta una fila nueva delante de la fila en la que se encuentra situado el cursor.
Insertar variable. Inserta una columna nueva delante de la columna en la
que se encuentra situado el cursor.
Segmentar archivo. Abre el cuadro de diálogo Segmentar archivo, el cual permite dividir el archivo de datos en grupos (segmentos) utilizando una o más
variables.
Ponderar casos. Abre el cuadro de diálogo Ponderar casos, el cual permite utilizar una variable para ponderar los casos del archivo de datos.
Seleccionar casos. Abre el cuadro de diálogo Seleccionar casos, el cual permite seleccionar una parte del archivo de datos utilizando diferentes criterios
(pueden establecerse filtros, extraer una muestra aleatoria, etc.).
Mostrar etiquetas de valor. Hace que las celdas del Editor de datos muestren las etiquetas de los valores. Al presionarlo de nuevo, las celdas muestran los valores.
Usar conjuntos. Abre el cuadro de diálogo Usar conjuntos, el cual permite seleccionar conjuntos de variables previamente definidos.
ARCHIVOS DE DATOS
Los archivos de datos pueden tener formatos muy diversos, y este programa ha
sido diseñado para trabajar con muchos de ellos.
Apertura de un archivo de datos
Además de los archivos guardados en formato SPSS, puede abrir archivos de Excel,
Lotus 1-2-3, dBASE y archivos delimitados por tabuladores sin necesidad de
convertirlos a un formato intermedio ni de introducir información sobre la definición
de los datos.
Para abrir archivos de datos
Elija en los menús: Archivo….Abrir……Datos...
En el cuadro de diálogo Abrir archivo, seleccione el archivo que desea abrir.
Pulse en Abrir.
Si lo desea, tiene la posibilidad de:
Leer los nombres de las variables de la primera fila en las hojas de cálculo y
en los archivos delimitados por tabuladores.
Especificar el rango de casillas que desee leer en los archivos de hojas de
cálculo.
Especificar una hoja dentro de un archivo de Excel que desee leer.
Creación de un Archivo de Datos
Para crear un nuevo archivo de datos debemos seleccionar la opción Introducir
Datos en la ventana que aparece al abrir el SPSS. Si el programa ya está abierto y
queremos crear un nuevo archivo de datos, basta con ir al menú archivo y seleccionar
Archivo… Nuevo… Datos. El Editor de Datos aparecerá en blanco, entonces
procederemos a la introducción de la información.
Introducción de Datos
Es importante empezar por definir en la vista de variables las variables que va a
incluir nuestro archivo, así como sus características.
Es posible teclear los datos directamente en la vista de datos, de manera que el
programa crea las variables y sus características automáticamente. Sin embargo hay
que tomar en cuenta que se habrá de revisar dichas características para asegurarnos de
que son las que nos interesan.
En la vista de variables de la ventana del Editor de Datos cada fila representa una
variable y cada columna hace referencia a una característica de la misma.
Estas características son:
Nombre: nombre de la variable. Debe cumplir con las siguientes condiciones:
- Debe comenzar por una letra y no terminar en un punto.
- No puede contener ni espacios ni caracteres especiales.
- No puede haber dos nombres repetidos.
- No se distinguen mayúsculas de minúsculas.
Tipo: tipo de variable; numérica, cadena, fecha…
Anchura: número máximo de cifras o longitud máxima de la cadena.
Decimales: número de decimales que se mostrarán.
Etiqueta: descripción más detallada de la variable.
Valores: asignación de valores numéricos a categorías dentro de la variable.
Perdidos: valores que el usuario define como tales.
- Se pueden introducir hasta tres valores perdidos (individuales) de tipo
discreto, o un rango de valores perdidos o un rango más un valor de tipo
discreto.
- Solo pueden especificarse rangos para las variables numéricas.
- No se pueden definir los valores perdidos para variables de cadena larga
(variables de cadena de más de ocho caracteres).
En el caso de los variables de cadena se considera que son válidos todos los
valores de cadena incluido los valores vacios o nulos, a no ser que se definan
explícitamente como perdidos. Para definir como nulos o vacios los valores
perdidos de una variable de este tipo, debemos escribir un espacio en blanco
en uno de los campos debajo de la selección Valores perdidos discretos.
Columnas: número de columnas que se visualizarán en la Vista de datos.
Alineación: tipo de alineación de los datos en las columnas.
Medida: puede ser de tres tipos:
- Escala : los valores de la variable son numéricos en una escala de intervalo
o de razón (Ejemplo: los valores de la edad o de la talla)
- Ordinal : los valores de la variable representan categorías con un cierto
orden intrínseco (Ejemplo: alto, medio, bajo). Pueden ser valores de
cadena (orden alfabético) o números que representan categorías (de menor
a mayor).
- Nominal : los valores de la variable representan categorías sin un orden
intrínseco (Ejemplo: hombre, mujer). Pueden ser valores de cadena o
números que representen categorías.
Si al introducir los datos dejamos alguna casilla vacía, el programa la considerará
un valor perdido por el sistema en el caso de variables numéricas, y como una cadena
de caracteres vacía en el caso de variables cadena.
En SPSS se distinguen dos tipos de valores perdidos o missing: los valores omitidos
por el usuario y los valores perdidos por el sistema. Los omitidos por el usuario son
valores que se etiquetan para que sean tratados como missing en la Columna
Perdidos en la Vista de Variables. Los valores perdidos por el sistema corresponden
a datos numéricos desconocidos (campos numéricos vacios o resultado de cálculos
que no pueden realizarse).
Hay que tener en cuenta que SPSS excluye de la mayoría de los cálculos y análisis
los casos con missings en alguna de las variables. Sin embargo a la hora de efectuar
buena parte de los análisis es posible utilizar las opciones Excluir casos según lista,
que trabaja solamente con los casos completos (no considera los registros con
missings en alguna de las variables) y Excluir caso según pareja, que trabaja con los
casos que están completos para las variables que se van a considerar en el análisis
concreto.
Lectura de Archivos Externos de Datos
Como hemos visto anteriormente los archivos de datos pueden crearse directamente
en SPSS o importarse ya creados de otro programa.
Además de los tipos de ficheros propios, SPSS también es capaz de leer ficheros
procedentes de otras aplicaciones: Excel, dBase, Sylk, Sas, Systat, y archivos ASCIL.
Para abrir un fichero seleccionamos Archivo… Abrir… Datos, y aparecerá una
ventana en la que indicamos el tipo de archivo que queremos abrir así como su
localización.
Lectura de Hojas de Cálculo Excel
Una vez seleccionado el tipo de archivo, en este caso Excel (*-xls), y el fichero
concreto que nos interesa, hacemos clic sobre el botón abrir y aparecerá la ventana
Apertura de Fuente de Datos de Excel. En esta ventana debemos seleccionar la hoja
de archivo Excel donde se encuentran los datos que pretendemos leer, si no nos
interesa el total de datos de la hoja, en la casilla rango podemos indicar exactamente
cual es el rango que queremos leer. Hay que tener en cuenta que si la primera fila de
la hoja o el rango seleccionado contiene los nombres de las variables, debe estar
seleccionada la casilla Leer nombre de variables de la primera fila de datos.
Lectura de Ficheros de Texto
Una vez seleccionado el tipo de archivo, en este caso texto, (*-txt), y el fichero
concreto que nos interesa, hacemos clic sobre el botón abrir y se carga el asistente
para la importación de texto. Podemos aplicar un formato predefinido (guardado con
anterioridad desde el asistente para la importación de texto) o seguir los pasos del
asistente para especificar como deseamos que se lean los datos.
En el paso siguiente debemos indicar como están organizadas las variables en el
archivo de texto: delimitadas por algún carácter concreto o con ancho fijo, es decir
cada variable localizada en la misma posición de columna en todos los casos.
A continuación vamos siguiendo los pasos del asistente seleccionando las opciones
referentes a las variables y los casos que caracterizan el archivo que importamos,
hasta llegar al último paso. En este último paso podemos guardar el formato de
archivo para hacer uso de él cuando importemos archivos de datos de texto con la
misma estructura. También es posible pegar la sintaxis generada por el Asistente
para la Importación de Texto en una ventana de sintaxis.
Asistente para la importación de texto
EDITOR DE DATOS
Esta es la ventana principal del sistema y cerrarla significa cerrar el sistema. Es la
que se abre automáticamente cuando se inicia una sesión del SPSS y nos muestra los
contenidos del archivo de datos actual. Su aspecto es similar al de una hoja de cálculo
y proporciona un método similar para la creación y edición de archivo de datos. No es
posible tener más de un archivo de datos abierto al mismo tiempo.
El Editor de datos proporciona dos vistas de los datos.
Vista de datos. Muestra los valores de datos reales o las etiquetas de valor
definidas. En esta vista cada columna es una variable única y cada fila un
caso individual, una observación.
Vista de datos
Vista de variables. Muestra la información de definición de variable, que incluye las
etiquetas de la variable definida y de valor, tipo de dato (por ejemplo, de cadena,
fecha y numérico), nivel de medida (nominal, ordinal o de escala) y los valores
perdidos definidos por el usuario. En esta vista cada fila representa una variable del
archivo y cada columna hace referencia a una característica de la misma.
Vista de variables
En ambas vistas, se puede añadir, modificar y eliminar la información contenida en
el archivo de datos.
TRANSFORMAR DATOS
Transformar es realizar cambios en determinadas variables del fichero de datos y
también para crear nuevas variables basadas en los valores de variables ya existentes
El programa SPSS 13.0 puede realizar transformaciones de los datos de todo tipo,
desde tareas sencillas, como la agrupación de categorías para su análisis posterior,
hasta otras más avanzadas, como la creación de nuevas variables basadas en
ecuaciones complejas e instrucciones condicionales. A continuación se presentan
distintos procedimientos para la transformación de datos:
Cálculo de variablesUtilice el cuadro de diálogo Calcular para calcular los valores de una variable
basándose en transformaciones numéricas de otras variables.
Cuadro de diálogo Calcular variable
Para calcular variables:
Elija en los menús: Transformar…Calcular...
Escriba el nombre de una sola variable de destino. Puede ser una variable
existente o una nueva que se vaya a añadir al archivo de datos de trabajo.
Para crear una expresión, puede pegar los componentes en el campo Expresión o
escribir directamente en dicho campo.
Puede pegar las funciones o las variables de sistema utilizadas habitualmente
seleccionando un grupo de la lista Grupo de funciones y pulsando dos veces en
la función o variable de las listas de funciones y variables especiales (o seleccione
la función o variable y pulse en la flecha que se encuentra sobre la lista Grupo de
funciones). Rellene los parámetros indicados mediante interrogaciones (aplicable
sólo a las funciones). El grupo de funciones con la etiqueta Todo contiene una
lista de todas las funciones y variables de sistema disponibles. En un área
reservada del cuadro de diálogo se muestra una breve descripción de la función o
variable actualmente seleccionada.
Las constantes de cadena deben ir entre comillas o apóstrofos.
Si los valores contienen decimales, debe utilizarse una coma (,) como indicador
decimal.
Para las nuevas variables de cadena, también deberán seleccionar Tipo y etiqueta
para especificar el tipo de datos.
Calcular variable: Si los casosEl cuadro de diálogo Si los casos permiten aplicar transformaciones de los
datos para subconjuntos de casos seleccionados utilizando expresiones
condicionales. Una expresión condicional devuelve un valor verdadero, falso o
perdido para cada caso.
Cuadro de diálogo Calcular variable: Si los casos
Si el resultado de una expresión condicional es verdadero, se incluirá el caso
en el subconjunto seleccionado.
Si el resultado de una expresión condicional es falso o perdido, no se incluirá
el caso en el subconjunto seleccionado.
La mayoría de las expresiones condicionales utilizan al menos uno de los seis
operadores de relación (<, >, <=, >=, =, and ~=) de la calculadora.
Las expresiones condicionales pueden incluir nombres de variable, constantes,
operadores aritméticos, funciones numéricas y de otros tipos, variables lógicas
y operadores de relación.
Calcular variable: Tipo y etiqueta
Por defecto, las nuevas variables calculadas son numéricas. Para calcular una
nueva variable de cadena, deberá especificar el tipo de los datos y su ancho.
Etiqueta. Etiqueta de variable descriptiva y opcional de hasta 120 caracteres. Puede
escribir el texto de una etiqueta o bien utilizar los primeros 110 caracteres de la
expresión de cálculo.
Tipo. Las variables calculadas pueden ser numéricas o de cadena (alfanuméricas). Las
variables de cadena no se pueden utilizar en cálculos aritméticos.
Cuadro de diálogo Tipo y etiqueta
FuncionesSe dispone de muchos tipos de funciones, entre ellos:
Funciones aritméticas
Funciones estadísticas
Funciones de cadena
Funciones de fecha y hora
Funciones de distribución
Funciones de variables aleatorias
Funciones de valores perdidos
Funciones de puntuación (sólo servidor de SPSS)
Si desea obtener una lista completa de las funciones, busque funciones en el índice
del sistema de Ayuda en pantalla.
Valores perdidos en funciones
Las funciones y las expresiones aritméticas sencillas tratan los valores perdidos de
diferentes formas. En la expresión: (var1+var2+var3)/3, el resultado es el valor
perdido si un caso tiene un valor perdido para cualquiera de las tres variables.
En la expresión:
MEAN (var1, var2, var3), el resultado es el valor perdido sólo si el caso tiene valores
perdidos para las tres variables.
En las funciones estadísticas se puede especificar el número mínimo de argumentos
que deben tener valores no perdidos. Para ello, escriba un punto y el número mínimo
de argumentos después del nombre de la función, como en:
MEAN.2 (var1, var2, var3)
Generadores de números aleatoriosEl cuadro de diálogo Generadores de números aleatorios le permite seleccionar el
generador de números aleatorios y establecer el valor de secuencia de inicio de modo
que pueda reproducir una secuencia de números aleatorios.
Generador activo. Hay dos generadores de números aleatorios disponibles:
Compatible con SPSS 12. El generador de números aleatorios utilizado en
SPSS 12 y versiones anteriores. Utilice este generador de números aleatorios
si necesita reproducir los resultados aleatorizados generados por versiones
previas basadas en una semilla de aleatorización especificada.
Tornado de Mersenne. Un generador de números aleatorios nuevo que es
más fiable en los procesos de simulación. Utilice este generador de números
aleatorios si no es necesario reproducir resultados aleatorizados
correspondientes a SPSS 12 o anteriores.
Inicialización del generador activo. La semilla de aleatorización cambia cada vez
que se genera un número aleatorio para utilizarlo en las transformaciones (como las
funciones de distribución aleatorias), el muestreo aleatorio o la ponderación de los
casos. Para replicar una secuencia de números aleatorios, establezca el valor de
inicialización del punto de inicio antes de cada análisis que utilice los números
aleatorios. El valor debe ser un entero positivo.
Cuadro de diálogo Semilla de aleatorización
Para seleccionar el generador de números aleatorios y establecer el valor de
inicialización:
Elija en los menús:
Transformar… Generadores de números aleatorios
Contar apariciones de valores dentro de los casosEste cuadro de diálogo crea una variable que, para cada caso, cuenta las
apariciones del mismo valor, o valores, en una lista de variables. Por ejemplo, un
estudio podrá contener una lista de revistas con las casillas de verificación sí/no para
indicar qué revistas lee cada encuestado. Se podría contar el número de respuestas sí
de cada encuestado para crear una nueva variable que contenga el número total de
revistas leídas.
Cuadro de diálogo Contar apariciones de valores dentro de los casos
Para contar apariciones de valores dentro de los casos
Elija en los menús:
Transformar… Contar apariciones...
Introduzca el nombre de la variable de destino.
Seleccione dos o más variables del mismo tipo (numéricas o de cadena).
Pulse en Definir valores y especifique los valores que se deben contar.
Si lo desea, puede definir un subconjunto de casos en los que contar las apariciones
de valores.
Re- codificación de valoresLos valores de datos se pueden modificar mediante la re-codificación. Esto es
particularmente útil para agrupar o combinar categorías. Puede re-codificar los
valores dentro de las variables existentes o crear variables nuevas que se basen en los
valores re-codificados de las variables existentes.
Re-codificar en las mismas variablesEl cuadro de diálogo Re-codificar en las mismas variables le permite reasignar los
valores de las variables existentes o agrupar rangos de valores existentes en nuevos
valores. Por ejemplo, podría agrupar los salarios en categorías que sean rangos de
salarios.
Puede re-codificar las variables numéricas y de cadena. Si selecciona múltiples
variables, todas deben ser del mismo tipo. No se pueden re-codificar juntas las
variables numéricas y de cadena.
Cuadro de diálogo Recodif. en mismas var.
Para re-codificar los valores de una variable
Elija en los menús:
Transformar…Re-codificar en las mismas variables.
Seleccione las variables que desee re-codificar. Si selecciona múltiples
variables, todas deberán ser del mismo tipo (numéricas o de cadena).
Pulse en Valores antiguos y nuevos y especifique cómo deben re-codificarse
los valores.
Si lo desea, puede definir un subconjunto de los casos para su re-codificación. El cuadro de diálogo Si los casos para esto es igual al que se describe para Contar apariciones.
Re-codificar en distintas variablesEl cuadro de diálogo Re-codificar en distintas variables le permite reasignar los
valores de las variables existentes o agrupar rangos de valores existentes en nuevos
valores para una variable nueva. Por ejemplo, podría agrupar los salarios en una
nueva variable que contenga categorías de rangos de salarios.
Puede re-codificar las variables numéricas y de cadena.
Puede re-codificar variables numéricas en variables de cadena y
viceversa.
Si selecciona múltiples variables, todas deben ser del mismo tipo. No
se pueden Re-codificar juntas las variables numéricas y de cadena.
Cuadro de diálogo Re-codificar en distintas variables
Para re-codificar los valores de una variable en una nueva variable
Elija en los menús: Transformar…Re-codificar en distintas variables...
Seleccione las variables que desee re-codificar. Si selecciona múltiples variables,
todas deberán ser del mismo tipo (numéricas o de cadena).
Introduzca el nombre de la nueva variable de resultado para cada nueva variable
y pulse en Cambiar.
Pulse en Valores antiguos y nuevos y especifique cómo deben re-codificarse los
valores.
Si lo desea, puede definir un subconjunto de los casos para su re-codificación. El
cuadro de diálogo Si los casos para esto es igual al que se describe para Contar
apariciones.
Asignar rangos a los casos
El cuadro de diálogo Asignar rangos a los casos le permite crear nuevas variables
que contienen rangos, puntuaciones de Savage y normales, y los valores de los
percentiles para las variables numéricas.
Los nombres de las nuevas variables y las etiquetas de variable descriptivas se
generan automáticamente en función del nombre de la variable original y de las
medidas seleccionadas. Una tabla de resumen presenta una lista de las variables
originales, las nuevas variables y las etiquetas de variable.
Si lo desea, tiene la posibilidad de:
Asignar los rangos a los casos en orden ascendente o descendente.
Organizar los rangos en subgrupos seleccionando una o más variables de
agrupación para la lista Por. Los rangos se calculan dentro de cada grupo, y los
grupos se definen mediante la combinación de los valores de las variables de
agrupación. Por ejemplo, si selecciona sexo y minoría como variables de
agrupación, los rangos se calcularán para cada combinación de sexo y minoría.
Cuadro de diálogo Asignar rangos a los casos
Para asignar rangos a los casos
Elija en los menús:
Transformar…Asignar rangos a casos...
Seleccione la variable o variables a las que desee asignar los rangos. Sólo
se pueden asignar rangos a las variables numéricas.
Si lo desea, puede asignar los rangos a los casos en orden ascendente o descendente
y organizar los rangos por subgrupos.
Re-codificación automática
El cuadro de diálogo Re-codificación automática le permite convertir los valores
numéricos y de cadena en valores enteros consecutivos. Si los códigos de la categoría
no son secuenciales, las casillas vacías resultantes reducen el rendimiento e
incrementan los requisitos de memoria de muchos procedimientos. Además, algunos
procedimientos no pueden utilizar variables de cadena y otros requieren valores
enteros consecutivos para los niveles de los factores.
Cuadro de diálogo Re-codificación automática
La nueva variable, o variables, creadas por la re-codificación automática
conservan todas las etiquetas de variable y de valor definidas de la variable
antigua. Para los valores que no tienen una etiqueta de valor ya definida se utiliza
el valor original como etiqueta del valor re-codificado. Una tabla muestra los
valores antiguos, los nuevos y las etiquetas de valor.
Los valores de cadena se re-codifican por orden alfabético, con las mayúsculas
antes que las minúsculas.
Los valores perdidos se re-codifican como valores perdidos mayores que
cualquier valor no perdido y conservando el orden. Por ejemplo, si la variable
original posee 10 valores no perdidos, el valor perdido mínimo se re-codificará
como 11, y el valor 11 será un valor perdido para la nueva variable.
Asistente para fecha y hora
El Asistente para fecha y hora simplifica ciertas tareas comunes asociadas a las
variables de fecha y hora.
Para usar el Asistente para fecha y hora
Elija en los menús: Transformar…Fecha/hora...
Seleccione la tarea que desee realizar y siga los pasos para definir la tarea.
Pantalla principal del Asistente para fecha y hora
Aprender cómo se representan las fechas y las horas en SPSS
Esta opción ofrece una pantalla en la que se presenta una breve descripción de las
variables de fecha/hora en SPSS. El botón Ayuda también proporciona un vínculo
para obtener información más detallada.
Crear una variable de fecha/hora a partir de una cadena que contiene una
fecha o una hora.
Use esta opción para crear una variable de fecha/hora a partir de una variable de
cadena. Por ejemplo, dispone de una variable de cadena que representa fechas con el
formato mm/dd/aaaa y desea crear una variable de fecha/hora a partir de ella.
Crear una variable de fecha/hora fusionando variables que contengan partes
diferentes de la fecha u hora.
Esta opción permite construir una variable de fecha/hora a partir de un conjunto de
variables existentes. Por ejemplo, dispone de una variable que representa el mes
(como un número entero), una segunda que representa el día del mes y una tercera
que representa el año. Se pueden combinar estas variables en una única variable de
fecha/hora.
Calcular con fechas y horas.
Use esta opción para añadir o sustraer valores a variables de fecha/hora. Por
ejemplo, puede calcular la duración de un proceso sustrayendo una variable que
represente la hora de comienzo del proceso de otra variable que represente la hora de
finalización del proceso.
Extraer una parte de una variable de fecha/hora.
Esta opción permite extraer parte de una variable de fecha/hora, como el día del
mes de una variable de fecha/hora, con el formato mm/dd/aaaa.
Asignar periodicidad a un conjunto de datos
Esta opción presenta el cuadro de diálogo Definir fechas, que se usa para crear
variables de fecha/hora compuestas por un conjunto de fechas secuenciales. Esta
característica se usa generalmente para asociar fechas con datos de serie temporal.
Nota: Las tareas se desactivan cuando el conjunto de datos carece de los tipos de
variables necesarias para completar la tarea. Por ejemplo, si el conjunto de datos no
contiene variables de cadena, la tarea de creación de una variable de fecha/hora a
partir de una cadena no se aplica y se desactiva.
Transformaciones de los datos de serie temporalSe incluyen diversas transformaciones de datos de gran utilidad en los análisis de
series temporales:
Generar variables de fecha para establecer la periodicidad y distinguir entre los
períodos históricos, de validación y de predicción.
Elaborar nuevas variables de series temporales como funciones de variables de
series temporales existentes.
Reemplazar valores definidos como perdidos por el usuario y perdidos del
sistema con estimaciones basadas en uno de los diversos métodos existentes.
Una serie temporal se obtiene midiendo una variable (o un conjunto de variables)
de manera regular a lo largo de un período de tiempo. Las transformaciones de los
datos de serie temporal suponen una estructura de archivo de datos en la que cada
caso (fila) representa un conjunto de observaciones para un momento diferente y la
duración del tiempo entre los casos es uniforme.
Cuadro de diálogo Crear serie temporal
Para crear una nueva variable de serie temporal
Elija en los menús: Transformar…Crear serie temporal...
Seleccione la función de serie temporal que desea utilizar para transformar la
variable o variables originales.
Seleccione la variable o variables a partir de las cuales desee crear
nuevas variables de serie temporal. Sólo se pueden utilizar variables
numéricas.
Puntuación de datos con modelos predictivos
El proceso de aplicar un modelo predictivo a un conjunto de datos se denomina
puntuación de los datos. SPSS, Clementine y AnswerTree disponen de
procedimientos para la creación de modelos predictivos como los modelos de
regresión, conglomeración, árbol y red neuronal. Una vez creado un modelo, sus
especificaciones se pueden guardar como un archivo XML que contenga toda la
información necesaria para reconstruirlo. La versión de servidor de SPSS permite leer
un archivo de modelo XML y aplicar el modelo a un archivo de datos.
Ejemplo. El riesgo de una solicitud de crédito se evalúa basándose en diversos
aspectos del solicitante y el préstamo en cuestión. La puntuación del crédito obtenida
a partir del modelo de riesgo se usa para aceptar o rechazar la solicitud de préstamo.
La puntuación se trata como una transformación de los datos. El modelo se expresa
internamente como un conjunto de transformaciones numéricas que se deben aplicar a
un determinado conjunto de variables, las variables predictoras especificadas en el
modelo, con el fin de obtener un resultado predictivo. En este sentido, el proceso de
puntuación de los datos con un modelo dado es, inherentemente, igual que la
aplicación de cualquier función, como puede ser una función de raíz cuadrada, a un
conjunto de datos.
El método de puntuación sólo está disponible en la versión de servidor de SPSS y
requiere el uso de sintaxis de comandos de SPSS.
MODIFICAR ARCHIVOS DE DATOS EN EL SPSS
Los archivos de datos se pueden organizar de acuerdo a las necesidades específicas
del usuario. Entre las muchas posibilidades de transformación de archivos disponibles
se encuentran las siguientes:
Ordenar casos.
Transponer casos y variables.
Fundir archivos.
Seleccionar subconjuntos de casos.
Agregar datos.
Ponderar datos.
Reestructurar datos.
Ordenar casosSpss permite ordenar los casos del fichero de datos en función de una o varias
variables, ya sea en orden ascendente o descendente. Para ello en el menú Datos
seleccionamos la acción Ordenar Datos y elegimos la variable o el conjunto de
variables del que queremos que se realice la ordenación, así como el orden de
clasificación para cada una de ellas.
Hay que tener en cuenta que si ordenamos los datos respecto a variables con valores
no numéricos, éstos serán organizados alfabéticamente. Por ejemplo si ordenamos el
archivo de datos “Encuesta General U.S.A 1991. Sav” los casos del fichero quedarán
ordenados en primer lugar respecto a la variable sexo de forma ascendente: en primer
lugar Hombre y a continuación Mujer.
Cuadro de diálogo Ordenar casos
Transponer casos y variablesSpss dispone de una opción que permite crear un archivo de datos nuevo en el que
se transponen las filas y las columnas del archivo de datos original de manera que los
casos (las filas) se convierten en variables, y las variables (las columnas) se
convierten en casos. Para transponer un archivo debemos seleccionar: Menú…
Datos…Transponer. A continuación debemos seleccionar las variables que deseamos
transponer incluyéndolas en el cuadro variables. Si lo deseamos podemos utilizar una
variable de nombre, que indique cuales queremos que sean los nombres de las
variables en el archivo transpuesto. Esta variable debe tener valores únicos (no
pueden repetirse).
En el nuevo fichero de datos se crea automáticamente una variable llamada
case_lbl, que contiene los nombres de las variables del archivo original.
Si el archivo de datos de trabajo contiene una variable de identificación o de
nombre con valores únicos, podrá utilizarla como variable de nombre: sus valores se
emplearán como nombres de variable en el archivo de datos transpuesto. Si se trata de
una variable numérica, los nombres de variable comenzarán por la letra V, seguida de
un valor numérico.
Hay que tomar en cuenta que los valores perdidos definidos por el usuario se
convierten valores perdidos por el sistema en el archivo de datos transpuesto. Para
conservar cualquiera de estos valores, se debe cambiar la definición de los valores
perdidos en la vista de variables del Editor de datos.
Fundir archivosSpss permite combinar en un solo fichero los datos de archivos diferentes. Existen
dos posibilidades de combinación o fusión:
Añadir casos
Añadir variables:
AÑADIR CASOS: consiste en combinar archivos que contienen las mismas
variables para casos diferentes.
Cuadro de diálogo Añadir casos
Variables desemparejadas: Muestra las variables que se van a excluir del nuevo
archivo de datos fusionado. Las variables del archivo de trabajo se identifican
mediante un asterisco (*); las del archivo externo presentan un signo más (+).
Para fundir archivos de datos con las mismas variables y casos diferentes se hace
el siguiente procedimiento:
Abra uno de los archivos de datos. Los casos de este archivo aparecerán
primero en el nuevo archivo de datos fusionado.
Elija en los menús: Datos… Fundir archivos… Añadir casos...
Seleccione el archivo de datos que desee fundir con el archivo de datos
abierto.
Elimine de la lista Variables en el nuevo archivo de datos de trabajo las
variables que no desee incluir.
Añada parejas de variables de la lista Variables desemparejadas que
representen la misma información registrada con nombres diferentes en los
dos archivos. Por ejemplo, la fecha de nacimiento podría tener el nombre de
variable fechnac en un archivo y nacfech en el otro.
Para seleccionar una pareja de variables desemparejadas:
Pulse en una de las variables en la lista Variables desemparejadas.
Mantenga pulsada la tecla Ctrl mientras selecciona la otra variable de la lista
con el ratón (pulse al mismo tiempo la tecla Ctrl y el botón izquierdo del
ratón).
Pulse en Casar para desplazar el par de variables a la lista Variables en el
nuevo archivo de datos de trabajo. El nombre de variable del archivo de
datos de trabajo se empleará como el nombre de variable del archivo
fusionado.
AÑADIR VARIABLES: consiste en combinar archivos que contienen los mismos
casos pero variables diferentes.
Cuadro de diálogo Añadir variables
Variables excluidas. Muestra las variables que se van a excluir del nuevo archivo de
datos fusionado. Por defecto, la lista contiene los nombres de variable del archivo
externo que duplican los del archivo de trabajo. Las variables del archivo de trabajo
se identifican mediante un asterisco (*); las del archivo externo presentan un signo
más (+). Si desea incluir en el archivo fusionado una variable excluida con un
nombre duplicado, cámbiele el nombre y añádala a la lista de variables que se van a
incluir.
Nuevo archivo de datos de trabajo. Variables que se van a incluir en el nuevo
archivo de datos fusionado. Por defecto, se incluyen en la lista todos los nombres de
variable únicos que existan en ambos archivos de datos.
Variables clave. Si algunos casos de un archivo no se emparejan con los del otro
archivo (es decir, si faltan casos en un archivo), utilice las variables clave para
identificar y emparejar correctamente los casos de ambos archivos.
Para fundir archivos con los mismos casos pero variables diferentes se debe:
Abra uno de los archivos de datos.
Elija en los menús: Datos… Fundir archivos… Añadir variables...
Seleccione el archivo de datos que desee fundir con el archivo de datos
abierto.
Para seleccionar variables clave:
Seleccione las variables entre las variables del archivo externo (marcadas con
el signo +) en la lista Variables excluidas.
Seleccione Emparejar los casos en las variables clave para los archivos
ordenados.
Añada las variables a la lista Variables clave.
Seleccionar subconjuntos de casosEn ocasiones podemos necesitar seleccionar un subconjunto de casos para realizar
un análisis específico, sin que el resto intervenga en el mismo. El SPSS permite filtrar
temporalmente el conjunto de datos, basándose en criterios que incluyan variables y
expresiones complejas. También es posible seleccionar una muestra aleatoria de
casos.
Para seleccionar un subconjunto de casos
Elija en los menús: Datos… Seleccionar casos...
Seleccione uno de los métodos de selección de casos.
Especifique los criterios para la selección de casos.
Cuadro de diálogo Seleccionar casos
Las distintas opciones de selección de casos que podemos usar son:
Todos los casos. Desactiva el filtrado y utiliza todos los casos.
Si se satisface la condición. Se utiliza una expresión condicional para seleccionar los
casos. Si el resultado de la expresión condicional, es verdadero, el caso se selecciona.
Si el resultado es falso o perdido, entonces el caso no se selecciona.
Muestra aleatoria de casos. Se selecciona una muestra aleatoria basada en un
porcentaje aproximado o en un número exacto de casos.
Basándose en el rango del tiempo o de los casos. Selecciona los casos basándose en
un rango de los números de casos o en un rango de las fechas/horas.
Usar variable de filtro. Se utiliza como variable para el filtrado la variable numérica
que seleccionemos entre las existentes en el archivo de datos. Se seleccionan los
casos con cualquier valor distinto del 0 o del valor perdido para la variable
seleccionada.
Casos no seleccionados. Puede filtrar o eliminar los casos que no reúnan los criterios
de selección. Los casos filtrados permanecen en el archivo de datos pero se excluyen
del análisis. Seleccionar casos crea una variable de filtro, filter_$, para indicar el
estado del filtro. Los casos seleccionados tienen un valor de 1; los casos filtrados
tienen un valor de 0. Estos últimos también se indican con una barra transversal sobre
el número de fila en el Editor de datos. Para desactivar el filtrado e incluir todos los
casos en el análisis, seleccione Todos los casos.
Si guarda el archivo de datos después de eliminar casos, no podrá recuperar los casos
eliminados.
Agregar datosConsiste en agrupar varios casos en uno solo. La opción agregar crea un nuevo
archivo de datos en el que cada nuevo caso representa a un conjunto de casos del
archivo de datos original. Por tanto, un archivo agregado tiene menos casos que el
archivo original.
Para agregar un archivo de datos debemos:
Elija en los menús: Datos… Agregar...
Seleccione una o más variables de segmentación que definan cómo deben
agruparse los casos para crear datos agregados.
Seleccione una o más variables agregadas.
Seleccione una función de agregación para cada variable agregada
Cuadro de diálogo Agregar datos
Variables de segmentación. Los casos se agrupan en función de los valores de las
variables de segmentación. Cada combinación única de valores de variables de
segmentación define un grupo. Al crear un archivo de datos agregados nuevo, todas
las variables de segmentación se guardan en el archivo nuevo con sus nombres y la
información del diccionario. La variable de segmentación puede ser tanto numérica
como de cadena.
Agregar variables. Las variables de origen se utilizan con funciones agregadas para
crear variables agregadas nuevas. El nombre de la variable agregada viene seguido de
una etiqueta de variable opcional entrecomillada, el nombre de la función de
agregación y el nombre de la variable de origen entre paréntesis. Para las funciones
de agregación, las variables de origen deben ser numéricas.
Puede anular los nombres por defecto de las variables agregadas con nuevos nombres
de variable, proporcionar etiquetas de variable descriptivas y cambiar las funciones
empleadas para calcular los valores de los datos agregados. También puede crear una
variable que contenga el número de casos en cada grupo de segmentación.
Ponderar datosConsiste en hacer que un registro (caso) represente a más de un caso. El resultado
de la ponderación es justamente el inverso de la agregación. Ponderar casos exige
utilizar una variable de ponderación que es justamente la que contiene los pesos que
serán asignados a cada caso.
Para ponderar casos debemos:
Elija en los menús: Datos… Ponderar casos.
Seleccione Ponderar casos mediante.
Seleccione una variable de frecuencia.
Los valores de la variable de frecuencia se utilizan como ponderaciones de los
casos. Por ejemplo, un caso con un valor 3 para la variable de frecuencia representará
tres casos en el archivo de datos ponderado.
Cuadro de diálogo Ponderar casos
Los valores de la variable de ponderación deben indicar el número de observaciones
representadas por casos únicos en el archivo de datos. Los casos con valores perdidos,
negativos o cero para la variable de ponderación se excluyen del análisis.
Los valores fraccionarios son válidos; se usan exactamente donde adquieren sentido
y, con mayor probabilidad, donde se tabulan los casos.
Si aplica una variable de ponderación, ésta seguirá vigente hasta que se seleccione
otra o se desactive la ponderación. Si guarda un archivo de datos ponderado, la
información de ponderación se guardará con el archivo. Puede desactivar la
ponderación en cualquier momento, incluso después de haber guardado el archivo de
forma ponderada.
Ponderaciones en las tablas de contingencia. El procedimiento Tablas de
contingencia cuenta con diversas opciones para el tratamiento de ponderaciones de
los casos.
Ponderaciones en los diagramas de dispersión y los histogramas. Los diagramas
de dispersión y los histogramas tienen una opción para activar y desactivar las
ponderaciones de los casos, pero dicha opción no afecta a los casos que tienen un
valor negativo, un valor 0 o un valor perdido para la variable de ponderación. Estos
casos permanecen excluidos del gráfico incluso si se desactiva la ponderación desde
el gráfico.
Reestructurar datosEsta opción permite reordenar total o parcialmente el archivo de datos a través de
un asistente. El asistente sustituye el archivo actual con un archivo nuevo
reestructurado. El asistente puede:
Reestructurar variables seleccionadas en casos: Seleccione esta opción cuando
disponga, en los datos, de grupos de columnas relacionadas y desee que aparezcan en
el nuevo archivo de datos como grupos de filas. Si elige esta opción, el asistente
mostrará los pasos para Variables a casos.
Reestructurar casos seleccionados en variables: Seleccione esta opción cuando
disponga, en los datos, de grupos de filas relacionadas y desee que aparezcan en el
nuevo archivo de datos como grupos de columnas. Si elige esta opción, el asistente
mostrará los pasos para Casos a variables.
Transponer todos los datos: Seleccione esta opción cuando desee transponer los
datos. Todas las filas se convertirán en columnas y todas las columnas en filas, en el
nuevo archivo de datos. Esta opción cierra el Asistente de reestructuración de datos
y abre el cuadro de diálogo Transponer datos.
Para reestructurar datos procedemos como sigue:
Elija en los menús: Datos… Reestructurar...
Seleccione el tipo de reestructuración que desea realizar.
Seleccione los datos que se van a reestructurar.
Si lo desea, tiene la posibilidad de:
Crear variables de identificación, que permitirán un seguimiento de un valor
del nuevo archivo a partir de un valor del archivo original.
Ordenar los datos antes de la reestructuración.
Definir opciones para el nuevo archivo.
Pegar la sintaxis de comandos en una ventana de sintaxis.
VISOR DEL SPSS
Es la ventana en la que se muestran todos los resultados de las operaciones
estadísticas realizadas. Es posible editar los resultados y guardarlos para emplearlos
posteriormente.
El Visor se puede usar para:
Examinar los resultados.
Mostrar u ocultar tablas y gráficos seleccionados.
Cambiar el orden de presentación de los resultados moviendo los elementos
seleccionados.
Mover elementos entre el Visor y otras aplicaciones.
La ventana del visor se abre automáticamente la primera vez que se ejecuta un
procedimiento que genera resultados.
El Visor se divide en dos paneles:
El panel izquierdo muestra una vista de titulares del contenido.
El panel derecho contiene tablas estadísticas, gráficos y resultados de texto.
Visor
SPSS cuenta con dos tipos diferentes de Ventanas de resultados, el primero es el
Visor de Resultados donde se muestra de forma interactiva los resultados de los
procesos y los organiza en forma jerárquica de acuerdo con el orden que se hayan
realizado; la segunda ventana Visor de Borrador la cual muestra los resultados en
formato de texto, el cual podemos abrir por medio de cualquier lector de texto.
La principal diferencia de estas dos ventanas, es que en el visor de Borrador no se
puede modificar el formato de los resultados, además se pierden las propiedades
interactivas de los objetos. Mientras que en el visor de Resultados puedo ordenar y
editar los resultados o inclusive generar nuevos procesos.
La ventana de resultados está dividida en tres partes. La primera de ellas es el
navegador de resultados, está sección nos permite explorar los resultados que
hemos obtenido a través de los diferentes análisis realizados; la segunda es el
visualizador de resultados en el cual obtenemos la imagen de los resultados y la
tercera es las opciones de ventana, en la cual encontramos los diferentes
procedimientos del paquete.
Uso del Visor de borrador
Si prefiere ver los resultados en formato de sólo texto en lugar de como tablas
pivote interactivas, utilice el Visor de borrador.
Para utilizar el Visor de borrador:
Seleccione en cualquiera de las ventanas las siguientes opciones de los menús:
Edición… Opciones...
En la pestaña General, pulse en Borrador para determinar el tipo de
resultados.
Para modificar las opciones de formato de los resultados del Visor de
borrador, pulse en la pestaña Visor de borrador.
Mostrar y ocultar resultados
En el Visor, puede mostrar y ocultar de forma selectiva las tablas o los resultados
individuales de todo un procedimiento. Resulta de utilidad cuando desea reducir la
cantidad de resultados visibles en el panel de contenidos.
ARCHIVOS DE SINTAXIS
Casi todas las ventanas de SPSS cuentan con un botón que permite hacer el pegado
del proceso que el usuario desea realizar. Lo anterior genera un archivo de sintaxis
donde se van guardando todas las instrucciones que llevan a cabo los comandos del
SPSS. Este archivo es susceptible de ser modificado por el usuario. Muchos de los
primeros usuarios del SPSS suelen escribir estos archivos en vez de utilizar el sistema
de pegado del programa.
Se pueden generar estos archivos de sintaxis con la ayuda del programa mismo,
pues en casi todas las ventanas donde se realizan tareas en el SPSS existe un botón
"Paste". Este botón cierra la ventana en cuestión y guarda la sintaxis de las acciones
seleccionadas en dicha ventana. Una vez salvado este archivo es susceptible de
modificación.
La sintaxis tal cual se presenta a continuación fue producida directamente con el
SPSS. Este programa le da un formato legible a la sintaxis, formato que el software
en algunos casos no requiere para su correcto uso.
Otra peculiaridad de las sintaxis del SPSS es que no son "case sensitive". Ante lo
cual es común ver sintaxis escritas en solo mayúsculas, solo minúsculas o bien una
combinación propia de cada usuario. Esta situación se modifica para aquellas
personas que hacen uso de Python dentro de sus sintaxis, pues este es un lenguaje
sensitivo a las variaciones entre mayúsculas y minúsculas. Esto obliga a estos
usuarios a escribir sintaxis con mayor cuidado.
El siguiente ejemplo ilustra como abrir un fichero de datos mediante sintaxis y como
llevar a cabo una frecuencia y una tabla de contingencia con datos de uno de los
archivos de ejemplo que instala el programa.
*Este es un comentario, debe ir precedido por un asterisco y finalizado por un punto.
*Abre el archivo Tomato.sav. GET
FILE='C:\Program Files\SPSS\Tomato.sav'.
*Genera una tabla con las frecuencias de la variable fertilizante.FREQUENCIES
VARIABLES=fert/ORDER= ANALYSIS.
ANALISIS ESTADISTICO CON EL SPSS
Existe un conjunto de pasos básicos en el análisis de datos, por consiguiente al
cumplir con estos pasos el análisis de datos con SPSS es fácil; simplemente se tiene
que:
Introducir los datos en SPSS. Es posible abrir un archivo de datos de SPSS
previamente guardado, leer una hoja de cálculo o un archivo de datos de texto,
o introducir los datos directamente en el Editor de datos.
Seleccionar un procedimiento. Seleccione un procedimiento de los menús
para cálculos estadísticos o crear un gráfico.
Seleccionar las variables para el análisis. Las variables del archivo de datos
se muestran en un cuadro de diálogo para el procedimiento.
Ejecute el procedimiento y observe los resultados. Los resultados se
muestran en el asesor estadístico (el asesor estadístico es un Método de
asistencia para orientarle en el proceso de búsqueda del procedimiento que
desea utilizar).
Si no está familiarizado con SPSS o con los procedimientos estadísticos que ofrece,
el asesor estadístico (Statistics Coach) puede ayudarle solicitándole información
mediante preguntas simples, utilizando un lenguaje no técnico y ejemplos visuales
que le ayudarán a seleccionar las funciones básicas de los estadísticos y los gráficos
más apropiados para sus datos.
Para utilizar el Asesor estadístico, elija en los menús de cualquier ventana de SPSS:
*Genera una tabla de contingencia con las variables altura inicial y fertilizante.
CROSSTABS/TABLES=initial BY fert/FORMAT= AVALUE TABLES
/CELLS= COUNT/COUNT ROUND CELL.
El Asesor estadístico cubre sólo un subconjunto selecto de procedimientos del
sistema Base de SPSS. Está diseñado para proporcionar una asistencia general para
muchas de las técnicas estadísticas básicas que se utilizan habitualmente.
Tras realizar una serie de selecciones, el Asesor estadístico abre el cuadro de
diálogo para el procedimiento estadístico, de generación de informes o de creación
de gráficos que cumple los criterios seleccionados. El Asesor estadístico proporciona
acceso a la mayoría de los procedimientos estadísticos y de generación de informes
en el sistema Base y en los procedimientos de creación de gráficos.
Análisis en Modo Distribuido
El análisis en modo distribuido permite utilizar un ordenador que no es el local (o
de escritorio) para realizar trabajos que requieren un gran consumo de memoria.
Debido a que los servidores remotos utilizados para análisis distribuidos son
normalmente más potentes y rápidos que los ordenadores locales, una utilización
correcta del análisis en modo distribuido puede reducir significativamente el tiempo
de procesamiento del ordenador. El análisis distribuido con un servidor remoto puede
ser útil si el trabajo trata:
Archivos de datos, en particular lecturas de datos de fuentes de bases de datos.
Tareas que requieren un gran consumo de memoria. Cualquier tarea que tarde
bastante tiempo en el análisis en modo local será una buena candidata para el análisis
distribuido.
El análisis distribuido sólo afecta a las tareas relacionadas con los datos, como
lectura de datos, transformación de datos, cálculo de nuevas variables y cálculo de
estadísticos. No tiene ningún efecto sobre tareas relacionadas con la edición de
resultados, como la manipulación de tablas pivote o la modificación de gráficos.
Nota: El análisis distribuido está disponible sólo si ambos equipos tienen una versión
local y acceso a una versión de servidor con licencia del software instalado en un
servidor remoto.
Análisis distribuido respecto al análisis local
A continuación, se enumeran algunas normas para elegir entre el análisis en modo
distribuido o en modo local:
Acceso a bases de datos. Los trabajos que llevan a cabo consultas en la base de
datos se ejecutarán con mayor rapidez en modo distribuido si el servidor dispone de
un acceso superior a la base de datos o si el servidor se está ejecutando en la misma
máquina que el motor de base de datos. Si el software necesario para acceder a la
base de datos sólo está disponible en el servidor o si el administrador de red no
permite descargar grandes tablas de datos, sólo podrá acceder a la base de datos en
modo distribuido.
Relación entre cálculos y resultados.
Los comandos que realizan gran cantidad de cálculos y generan pocos resultados de
salida (por ejemplo, tablas pivote pequeñas y pocas, breves resultados de texto, o
pocos y sencillos gráficos) son los que más aprovechan la ejecución en modo
distribuido. El grado de mejora depende sobre todo de la capacidad de cálculo del
servidor remoto.
Trabajos pequeños.
Los trabajos que se ejecutan con rapidez en modo local, siempre se ejecutarán más
lentamente en modo distribuido debido a la carga general inherente al
cliente/servidor.
Gráficos.
Los gráficos orientados a los casos, como los diagramas de dispersión, los gráficos
de residuos de regresión y los gráficos de secuencia, necesitan que los datos brutos se
encuentren en el ordenador local. Para archivos de datos y tablas de bases de datos
grandes, esto puede repercutir en un descenso del rendimiento en el modo distribuido
debido a que los datos deben enviarse desde el servidor remoto al ordenador local.
Otros gráficos se basan en datos resumidos o agregados y deben realizarse de forma
adecuada ya que la agregación se lleva a cabo en el servidor.
Gráficos interactivos.
Como es posible guardar los datos brutos con los gráficos interactivos (un ajuste
opcional), esto puede producir que se transfieran grandes cantidades de datos desde el
servidor remoto al ordenador local, incrementando de forma significativa el tiempo
que se tarda en guardar los resultados.
Tablas pivote.
Las tablas pivote grandes pueden tardar más en crearse en el modo distribuido.
Esto es particularmente cierto para el procedimiento Cubos OLAP y para las tablas
que contienen datos sobre los casos individuales, como las disponibles en el
procedimiento Resumir.
Resultados de texto.
Cuanto más texto se produzca, más lento será en modo distribuido, ya que este
texto se genera en el servidor remoto y se copia al ordenador local para ser
visualizado. Sin embargo, los resultados de texto tienen una carga general pequeña y
suelen transmitirse rápidamente.
Disponibilidad de procedimientos en análisis en modo Moda
En el análisis en modo distribuido, sólo están disponibles aquellos procedimientos
instalados en la versión local y en la versión del servidor remoto. No se pueden
utilizar procedimientos instalados en el servidor y que no lo están en la versión local,
ni tampoco procedimientos instalados en la versión local y que no lo están en el
servidor remoto.
Mientras esta última situación puede ser poco probable, es posible que se disponga
de componentes opcionales instalados en el ordenador local que no están disponibles
en el servidor remoto. Si este es el caso, cambiar del ordenador local a un servidor
remoto provocará la eliminación de los procedimientos Todos los procedimientos
afectados se restaurarán al cambiar de nuevo al modo local. Afectados de los menús y
la sintaxis de comandos relacionada generará errores.
Acceso al servidor
El cuadro de diálogo Acceso al servidor permite seleccionar el ordenador para
procesar comandos y ejecutar procedimientos. Podrá ser el ordenador local o un
servidor remoto.
Cuadro de diálogo Acceso al servidor
Se pueden añadir, modificar o eliminar servidores remotos de la lista. Los
servidores remotos requieren normalmente un ID de usuario y una contraseña;
también puede ser necesario un nombre de dominio. Póngase en contacto con el
administrador del sistema para obtener información acerca de servidores, ID de
usuario y contraseñas, nombres de dominio disponibles y demás información
necesaria para la conexión. Puede seleccionar un servidor por defecto y guardar el ID
de usuario, nombre de dominio y contraseña asociados a cualquier servidor. De esta
manera, se conectará de forma automática al servidor por defecto en el momento de
iniciar la sesión.
Análisis Discriminante
El análisis discriminante resulta útil para las situaciones en las que se desea
construir un modelo predictivo para pronosticar el grupo de pertenencia de un caso a
partir de las características observadas de cada caso. El procedimiento genera una
función discriminante (o, para más de dos grupos, un conjunto de funciones
discriminantes) basada en combinaciones lineales de las variables predictoras que
proporcionan la mejor discriminación posible entre los grupos. Las funciones se
generan a partir de una muestra de casos para los que se conoce el grupo de
pertenencia; posteriormente, las funciones pueden ser aplicadas a nuevos casos que
dispongan de medidas para las variables predictoras pero de los que se desconozca el
grupo de pertenencia.
Nota: La variable de agrupación puede tener más de dos valores. Los códigos de la
variable de agrupación han de ser números enteros y es necesario especificar sus
valores máximo y mínimo. Los casos con valores fuera de estos límites se excluyen
del análisis. Ejemplo. Por término medio, las personas de los países de zonas
templadas consume más calorías por día que las de los trópicos, y una proporción
mayor de la población de las zonas templadas vive en núcleos urbanos. Un
investigador desea combinar esta información en una función para determinar cómo
de bien un individuo es capaz de discriminar entre los dos grupos de países. El
investigador considera además que el tamaño de la población y la información
económica también pueden ser importantes.
El análisis discriminante permite estimar los coeficientes de la función
discriminante lineal, que tiene el aspecto de la parte derecha de una ecuación de
regresión lineal múltiple. Es decir, utilizando los coeficientes a, b, c y d, la función
es:
D = a * clima + b * urbanos + c * población + d * producto interior bruto per cápita
Si estas variables resultan útiles para discriminar entre las dos zonas climáticas, los
valores de D serán diferentes para los países templados y para los tropicales. Si se
utiliza un método de selección de variables por pasos, quizás no se necesite incluir las
cuatro variables en la función.
Estadísticos. Para cada variable: medias, desviaciones típicas, ANOVA univariado.
Para cada análisis: M de Box, matriz de correlaciones intra-grupos, matriz de
covarianzas intra-grupos, matriz de covarianzas de los grupos separados, matriz de
covarianzas total. Para cada función discriminante canónica: autovalores, porcentaje
de varianza, correlación canónica, lambda de Wilks, chi-cuadrado. Para cada paso:
probabilidades previas, coeficientes de la función de Fisher, coeficientes de función
no tipificados, lambda de Wilks para cada función canónica.
Datos. La variable de agrupación debe tener un número limitado de categorías
distintas, codificadas como números enteros. Las variables independientes que sean
nominales deben ser recodificadas a variables dummy o de contraste.
Supuestos. Los casos deben ser independientes. Las variables predictoras deben
tener una distribución normal multivariada y las matrices de varianzas-covarianzas
intra-grupos deben ser iguales en todos los grupos. Se asume que la pertenencia al
grupo es mutuamente exclusiva (es decir, ningún caso pertenece a más de un grupo) y
exhaustiva de modo colectivo (es decir, todos los casos son miembros de un grupo).
El procedimiento es más efectivo cuando la pertenencia al grupo es una variable
verdaderamente categórica; si la pertenencia al grupo se basa en los valores de una
variable continua (por ejemplo, un cociente de inteligencia alto respecto a uno bajo),
deberá considerar el uso de la regresión lineal para aprovechar la información más
rica ofrecida por la propia variable continua.
Para obtener un análisis discriminante:
Elija en los menús:
Analizar…
Clasificar…
Discriminante...
Cuadro de diálogo Análisis discriminante
Seleccione una variable de agrupación con valores enteros y pulse en
Definir rango para especificar las categorías de interés.
Seleccione las variables independientes o predictoras. Si la variable de
agrupación no tiene valores enteros, la opción Recodificación automática
en el menú Transformar creará una que los tenga.
Seleccione el método de introducción de las variables independientes:
- Introducir independientes juntas. Método de entrada forzada. Todas las
variables independientes que satisfacen el criterio de tolerancia se
introducen de forma simultánea.
- Usar método de inclusión por pasos. Utiliza el análisis por pasos para
controlar la entrada y la salida de variables.
Si lo desea, tiene la posibilidad de seleccionar casos mediante una variable de
selección.
Análisis discriminante: Definir rango
Cuadro de diálogo Análisis discriminante: Definir rango
Especifique los valores mínimo y máximo de la variable de agrupación para el
análisis. Los casos con valores fuera de este rango no se utilizan en el análisis
discriminante, pero sí se clasifican en uno de los grupos existentes a partir de los
resultados que obtengan en el análisis. Los valores mínimo y máximo deben ser
números enteros.
Análisis discriminante: Seleccionar casos
Cuadro de diálogo Análisis discriminante: Establecer valor
Para seleccionar los casos para el análisis, pulse en Seleccionar, en el cuadro de
diálogo principal, elija una variable de selección y, a continuación, pulse en Valor
para introducir un entero como valor de selección. Sólo se utilizan los casos con ese
valor en la variable de selección para derivar las funciones discriminantes. Tanto
para los casos seleccionados como para los no seleccionados se generan resultados de
clasificaciones y estadísticos. De esta forma, se ofrece un mecanismo para clasificar
casos nuevos basados en datos previos o para dividir los datos en subconjuntos de
contraste y comprobación para realizar procedimientos de validación en el modelo
generado.
Análisis discriminante: Estadísticos
Cuadro de diálogo Análisis discriminante: Estadísticos
Descriptivo Descriptivos. Las opciones disponibles son: Medias (que incluye las
desviaciones típicas), ANOVAs univariados y prueba M de Box.
Medias (Análisis discriminante). Muestra la media y desviación típica
totales y las medias y desviaciones típicas de grupo, para las variables
independientes.
ANOVAs univariados (Análisis discriminante). Realiza un análisis de
varianza de un factor sobre la igualdad de las medias de grupo para cada
variable independiente.
M de Box. Contraste sobre la igualdad de las matrices de covarianza de los
grupos.
Para tamaños de muestra suficientemente grandes, un valor de p no
significativo quiere decir que no hay evidencia suficiente de que las matrices
difieran. Esta prueba es sensible a las desviaciones de la normalidad
multivariada.
Coeficientes de la función. Las opciones disponibles son: Coeficientes de
clasificación de Fisher y Coeficientes no tipificados.
Clasificación de Fisher (Análisis discriminante). Muestra los coeficientes
de la función de clasificación de Fisher que pueden utilizarse directamente
para la clasificación. Se obtiene un conjunto de coeficientes para cada grupo,
y se asigna un caso al grupo para el que tiene una mayor puntuación
discriminante.
Sin estandarizar (Análisis discriminante). Muestra los coeficientes de la
función discriminante sin estandarizar (los coeficientes brutos).
Matrices. Las matrices de coeficientes disponibles para las variables
independientes son las de: Correlación intra-grupos, Covarianza intra-grupos,
Covarianza de grupos separados y Covarianza total.
Correlación intra-grupos. Muestra la matriz de correlaciones intra-grupos
combinada, que se obtiene de promediar las matrices de covarianza
individuales para todos los grupos antes de calcular las correlaciones.
Covarianza intra-grupos. Muestra la matriz de covarianza intra-grupos
combinada, la cual puede diferir de la matriz de covarianza total. La matriz se
obtiene de promediar, para todos los grupos, las matrices de covarianza
individuales.
Covarianza de grupos separados. Muestra las matrices de covarianza de
cada grupo por separado.
Covarianza total. Muestra la matriz de covarianza para todos los casos, como
si fueran una única muestra.
Análisis discriminante: Método de inclusión por pasos
Cuadro de diálogo Análisis discriminante: Método de inclusión por pasos
Método. Seleccione el estadístico que se va a utilizar para introducir o eliminar
nuevas variables. Las alternativas disponibles son la lambda de Wilks, la varianza no
explicada, la distancia de Mahalanobis, la menor razón F y la V de Rao. Con la V de
Rao se puede especificar el incremento mínimo de V para introducir una variable.
Lambda de Wilks. Método para la selección de variables por pasos del análisis
discriminante que escoge las variables para su introducción en la ecuación basándose
en cuánto contribuyen a disminuir la lambda de Wilks. En cada paso se introduce la
variable que minimiza la Lambda de Wilks global.
Varianza no explicada. En cada paso se introduce la variable que minimiza la suma
de la variación no explicada entre los grupos.
Distancia de Mahalanobis. Medida de cuánto difieren los valores de un caso en las
variables independientes respecto al promedio para todos los casos. Una distancia de
Mahalanobis grande identificará a un caso que tenga valores extremos en una o más
de las variables independientes.
Menor razón F.Método para la selección de variables en los análisis por pasos que
se basa en maximizar la razón F, calculada a partir de la distancia de Mahalanobis
entre los grupos.
V de Rao. Medida de las diferencias entre las medias de los grupos. También llamada
traza de Lawley-Hotelling. En cada paso, se introduce la variable que maximiza el
incremento en la V de Rao. Después de seleccionar esta opción, introduzca el valor
mínimo que debe tener una variable para entrar en el modelo.
Criterios. Las alternativas disponibles son Usar valor de F y Usar probabilidad de F.
Introduzca valores para introducir y eliminar variables.
Usar valor de F. Una variable se introduce en el modelo si su valor de F es mayor
que el valor de entrada, y se elimina si su valor de F es menor que el valor de salida.
La entrada debe ser mayor que la salida y ambos valores deben ser positivos. Para
introducir más variables en el modelo, disminuya el valor de entrada. Para eliminar
más variables del modelo, eleve el valor de salida.
Usar probabilidad de F. Una variable se introduce en el modelo si el nivel de
significación de su valor de F es menor que el valor de entrada, y se elimina si el
nivel de significación de su valor de F es mayor que el valor de salida. La entrada
debe ser menor que la salida y ambos valores deben ser positivos. Para introducir más
variables en el modelo, eleve el valor de entrada. Para eliminar más variables del
modelo, disminuya el valor de salida.
Mostrar. Resumen de los pasos muestra los estadísticos para todas las variables
después de cada paso; F para distancias por parejas muestra una matriz de razones F
por parejas para cada pareja de grupos.
Análisis discriminante: Clasificar
Cuadro de diálogo Análisis discriminante: Clasificar
Probabilidades previas. Estos valores se utilizan para la clasificación. Puede
especificar que las probabilidades previas sean iguales para todos los grupos o dejar
que los tamaños de grupo observados en la muestra determinen las probabilidades de
la pertenencia al grupo.
Mostrar. Las opciones de presentación disponibles son: Resultados por casos, Tabla
de resumen y Clasificación dejando uno fuera.
Resultados para cada caso. Se muestran, para cada caso, los códigos del grupo real
de pertenencia, el grupo pronosticado, las probabilidades posteriores y las
puntuaciones discriminantes.
Tabla de resumen. Número de casos correcta e incorrectamente asignados a cada
uno de los grupos, basándose en el análisis discriminante. En ocasiones recibe el
nombre de la “Matriz de Confusión”.
Clasificación dejando uno fuera. Se clasifica cada caso del análisis mediante la
función derivada a partir de todos los casos, excepto el propio caso. También
conocido como método-U.
Reemplazar los valores perdidos con la media. Seleccione esta opción para
sustituir la media de una variable independiente para un valor perdido sólo durante la
fase de clasificación.
Usar matriz de covarianzas. Existe la opción de clasificar los casos utilizando una
matriz de covarianzas intra-grupos o una matriz de covarianzas de los grupos
separados.
Intra-grupos. Se utiliza la matriz de covarianza intra-grupos combinada para
clasificar los casos.
Grupos separados. Para la clasificación se utilizan las matrices de covarianza de los
grupos separados. Dado que la clasificación se basa en las funciones discriminantes y
no en las variables originales, esta opción no siempre es equivalente a la
discriminación cuadrática.
Diagramas. Las opciones de gráficos disponibles son: Grupos combinados, Grupos
separados y Mapa territorial.
Grupos combinados. Crea un diagrama de dispersión, con todos los grupos, de los
valores en las dos primeras funciones discriminantes. Si sólo hay una función, en su
lugar se muestra un histograma.
Grupos separados. Crea diagramas de dispersión, de los grupos por separado, para
los valores en las dos primeras funciones discriminantes. Si sólo hay una función se
muestra un histograma en su lugar.
Mapa territorial. Gráfico de las fronteras utilizadas para clasificar los casos en
grupos a partir de los valores en las funciones. Los números corresponden a los
grupos en los que se clasifican los casos. La media de cada grupo se indica mediante
un asterisco situado dentro de sus fronteras. No se mostrará el mapa si sólo hay una
función discriminante.
Análisis discriminante: Guardar
Cuadro de diálogo Análisis discriminante: Guardar nuevas v
Es posible añadir variables nuevas al archivo de datos activo. Las opciones
disponibles son las de grupo de pertenencia pronosticado (una única variable),
puntuaciones discriminantes (una variable para cada función discriminante en la
solución) y probabilidades de pertenencia al grupo según las puntuaciones
discriminantes (una variable para cada grupo).
También se puede exportar información del modelo al archivo especificado en
formato XML (PMML). SmartScore y la versión de servidor de SPSS (un producto
independiente) pueden utilizar este archivo de modelo para aplicar la información de
modelo a otros archivos de datos con fines de puntuación.
ANÁLISIS FACTORIAL
El análisis factorial intenta identificar variables subyacentes, o factores, que
expliquen la configuración de las correlaciones dentro de un conjunto de variables
observadas. El análisis factorial se suele utilizar en la reducción de los datos para
identificar un pequeño número de factores que explique la mayoría de la varianza
observada en un número mayor de variables manifiestas. También puede utilizarse
para generar hipótesis relacionadas con los mecanismos causales o para inspeccionar
las variables para análisis subsiguientes (por ejemplo, para identificar la colinealidad
antes de realizar un análisis de regresión lineal). El procedimiento de análisis factorial
ofrece un alto grado de flexibilidad: Existen siete métodos de extracción factorial
disponibles.
Existen cinco métodos de rotación disponibles, entre ellos el oblimin directo y el
promax para rotaciones no ortogonales.
Existen tres métodos disponibles para calcular las puntuaciones factoriales; y las
puntuaciones pueden guardarse como variables para análisis adicionales.
Ejemplo. ¿Qué actitudes subyacentes hacen que las personas respondan a las
preguntas de una encuesta política de la manera en que lo hacen? Examinando las
correlaciones entre los elementos de la encuesta se deduce que hay una superposición
significativa entre los diversos subgrupos de elementos (las preguntas sobre los
impuestos tienden a estar correlacionadas entre sí, las preguntas sobre temas militares
también están correlacionadas entre sí, y así sucesivamente).
Con el análisis factorial, se puede investigar el número de factores subyacentes y,
en muchos casos, se puede identificar lo que los factores representan
conceptualmente. Adicionalmente, se pueden calcular las puntuaciones factoriales
para cada encuestado, que pueden utilizarse en análisis subsiguientes. Por ejemplo, es
posible construir un modelo de regresión logística para predecir el comportamiento
de voto basándose en las puntuaciones factoriales.
Estadísticos. Para cada variable: número de casos válidos, media y desviación
típica.
Para cada análisis factorial: matriz de correlaciones de variables, incluidos niveles
de significación, determinante, inversa; matriz de correlaciones reproducida, que
incluye anti-imagen; solución inicial (comunalidades, autovalores y porcentaje de
varianza explicada); KMO (medida de la adecuación muestral de Kaiser-Meyer-
Olkin) y prueba de esfericidad de Bartlett; solución sin rotar, que incluye
saturaciones factoriales, comunalidades y autovalores; solución rotada, que incluye
la matriz de configuración rotada y la matriz de transformación; para rotaciones
oblicuas: Para las rotaciones oblicuas: las matrices de estructura y de configuración
rotadas; matriz de coeficientes para el cálculo de las puntuaciones factoriales y
matriz de covarianzas entre los factores. Gráficos: gráfico de sedimentación y gráfico
de las saturaciones de los dos o tres primeros factores.
Datos. Las variables deben ser cuantitativas a nivel de intervalo o de razón. Los
datos categóricos (como la religión o el país de origen) no son adecuados para el
análisis factorial. Los datos para los cuales razonablemente se pueden calcular los
coeficientes de correlación de Pearson, deberían ser adecuados para el análisis
factorial.
Supuestos. Los datos deben tener una distribución normal bivariada para cada pareja
de variables y las observaciones deben ser independientes. El modelo de análisis
factorial especifica que las variables vienen determinadas por los factores comunes
(los factores estimados por el modelo) y por factores únicos (los cuales no se
superponen entre las distintas variables observadas); las estimaciones calculadas se
basan en el supuesto de que ningún factor único está correlacionado con los demás, ni
con los factores comunes.
Para obtener un análisis factorial
Elija en los menús: Analizar…Reducción de datos…Análisis factorial...
Seleccione las variables para el análisis factorial.
Cuadro de diálogo Análisis factorial
Selección de Casos en el Análisis Factorial
Cuadro de diálogo Análisis factorial: Establecer valor
Para seleccionar los casos para el análisis, elija una variable de selección y pulse en
Valor para introducir un entero como el valor de selección. En el análisis factorial,
sólo se usarán los casos con ese valor para la variable de selección.
ANÁLISIS DE CONGLOMERADOS EN DOS FASES
El procedimiento Análisis de conglomerados en dos fases es una herramienta de
exploración diseñada para descubrir las agrupaciones naturales (o conglomerados) de
un conjunto de datos que, de otra manera, no sería posible detectar. El algoritmo que
emplea este procedimiento incluye varias atractivas funciones que lo hacen diferente
de las técnicas de conglomeración tradicionales:
Tratamiento de variables categóricas y continuas. Al suponer que las variables son
independientes, es posible aplicar una distribución normal multinomial conjunta en
las variables continuas y categóricas.
Selección automática del número de conglomerados. Mediante la comparación de
los valores de un criterio de selección del modelo para diferentes soluciones de
conglomeración, el procedimiento puede determinar automáticamente el número
óptimo de conglomerados.
Escalabilidad. Mediante la construcción de un árbol de características de
conglomerados (CF) que resume los registros, el algoritmo en dos fases puede
analizar archivos de datos de gran tamaño.
Ejemplo. Las empresas minoristas y de venta de productos para el consumidor
suelen aplicar técnicas de conglomeración a los datos que describen los hábitos de
consumo, sexo, edad, nivel de ingresos, etc. de los clientes. Estas empresas adaptan
sus estrategias de desarrollo de productos y de marketing en función de cada grupo de
consumidores para aumentar las ventas y el nivel de fidelidad a la marca.
Estadísticos. El procedimiento genera criterios de información (AIC o BIC) según el
número de conglomerados de la solución, las frecuencias de los conglomerados para
la conglomeración final y los estadísticos descriptivos por conglomerado para la
conglomeración final.
Diagramas. El procedimiento genera gráficos de barras para las frecuencias de los
conglomerados, gráficos de sectores para las frecuencias de los conglomerados y
gráficos de la importancia de las variables.
Cuadro de diálogo Análisis de conglomerados en dos fases
Estadísticos. Este grupo proporciona opciones para la presentación de tablas con
los resultados de la conglomeración. Se generan los estadísticos descriptivos y las
frecuencias de los conglomerados para el modelo de conglomerados final, mientras
que la tabla de criterio de información muestra los resultados correspondientes a
varias soluciones de conglomerados.
Descriptivos por conglomerado. Muestra dos tablas que describen las variables de
cada conglomerado. En una tabla, se informa de las medias y las desviaciones típicas
para las variables continuas por conglomerado. La otra tabla informa de las
frecuencias de las variables categóricas por conglomerado.
Frecuencias de los conglomerados. Muestra una tabla que informa del número de
observaciones existentes en cada conglomerado.
Criterio de información (AIC o BIC).Muestra una tabla que contiene los valores
de AIC o BIC, dependiendo del criterio elegido en el cuadro de diálogo principal,
para diferentes números de conglomerados. Sólo se proporciona esta tabla cuando el
número de conglomerados se determina automáticamente. Si el número de
conglomerados es fijo, se ignora este ajuste y no se proporciona la tabla.
Archivo de datos de trabajo. Este grupo permite guardar las variables en el archivo
de datos de trabajo.
Crear variable del conglomerado de pertenencia. Esta variable contiene un
número de identificación de conglomerado para cada caso. El nombre de esta
variable es tsc_n, donde n es un número entero positivo que indica el ordinal de la
operación de almacenamiento del archivo de datos de trabajo realizada por este
procedimiento en una determinada sesión.
Archivos XML. El modelo de conglomerados final y el árbol CF son dos tipos de
archivos de resultados que se pueden exportar en formato XML.
Exportar modelo final. También se puede exportar el modelo de conglomerado
final al archivo especificado en formato XML (PMML). SmartScore y la versión de
servidor de SPSS (un producto independiente) pueden utilizar este archivo de modelo
para aplicar la información de modelo a otros archivos de datos con fines de
puntuación.
Exportar árbol CF. Esta opción permite guardar el estado actual del árbol de
conglomerados y actualizarlo más tarde utilizando nuevos datos.
ANÁLISIS DE CONGLOMERADOS
Este procedimiento intenta identificar grupos relativamente homogéneos de casos (o
de variables) basándose en las características seleccionadas, mediante un algoritmo
que comienza con cada caso (o cada variable) en un conglomerado diferente y
combina los conglomerados hasta que sólo queda uno. Es posible analizar las
variables brutas o elegir de entre una variedad de transformaciones de
estandarización.
Las medidas de distancia o similaridad se generan mediante el procedimiento.
Proximidades. Los estadísticos se muestran en cada etapa para ayudar a seleccionar
la mejor solución.
Ejemplo. ¿Existen grupos identificables de programas televisivos que atraigan a
audiencias similares dentro de cada grupo? Con el análisis de conglomerados
jerárquico, podría agrupar los programas de TV (los casos) en grupos homogéneos
basados en las características del espectador. Esto se puede utilizar para identificar
segmentos de mercado. También puede agrupar ciudades (los casos) en grupos
homogéneos, de manera que se puedan seleccionar ciudades comparables para probar
diversas estrategias de marketing.
Estadísticos. Historial de conglomeración, matriz de distancias (o similaridades) y
pertenencia a los conglomerados para una solución única o una serie de soluciones.
Gráficos: dendrogramas y diagramas de témpanos.
Datos. Las variables pueden ser cuantitativas, binarias o datos de recuento
(frecuencias). El escalamiento de las variables es un aspecto importante, ya que las
diferencias en el escalamiento pueden afectar a las soluciones de conglomeración.
Si las variables muestran grandes diferencias en el escalamiento (por ejemplo, una
variable se mide en dólares y la otra se mide en años), debería considerar la
posibilidad de estandarizarlas (esto puede llevarse a cabo automáticamente mediante
el propio procedimiento Análisis de conglomerados jerárquico).
Orden de casos. Si hay distancias empatadas o similitudes en los datos de entrada o
bien se producen entre los conglomerados actualizados durante la unión, la solución
de conglomerado resultante puede depender del orden de los casos del archivo. Puede
que desee obtener varias soluciones distintas con los casos ordenados en distintos
órdenes aleatorios para comprobar la estabilidad de una solución determinada.
Supuestos. Las medidas de distancia o similaridad empleadas deben ser adecuadas
para los datos analizados. Asimismo, debe incluir todas las variables relevantes en el
análisis. Si se omiten variables de interés la solución obtenida puede ser equívoca.
Debido a que el análisis de conglomerados jerárquico es un método exploratorio, los
resultados deben considerarse provisionales hasta que sean confirmados mediante
otra muestra independiente.
Análisis de Conglomerados de K-medias
Este procedimiento intenta identificar grupos de casos relativamente homogéneos
basándose en las características seleccionadas y utilizando un algoritmo que puede
gestionar un gran número de casos. Sin embargo, el algoritmo requiere que el usuario
especifique el número de conglomerados. Puede especificar los centros iniciales de
los conglomerados si conoce de antemano dicha información. Puede elegir uno de
los dos métodos disponibles para clasificar los casos: la actualización de los centros
de los conglomerados de forma iterativa o sólo la clasificación. Asimismo, puede
guardar la pertenencia a los conglomerados, información de la distancia y los centros
de los conglomerados finales. Si lo desea, puede especificar una variable cuyos
valores sean utilizados para etiquetar los resultados por casos. También puede
solicitar los estadísticos F de los análisis de varianza. Aunque estos estadísticos son
oportunistas (ya que el procedimiento trata de formar grupos que de hecho difieran),
el tamaño relativo de los estadísticos proporciona información acerca de la
contribución de cada variable a la separación de los grupos.
Ejemplo. ¿Cuáles son los grupos identificables de programas de televisión que atraen
audiencias parecidas dentro de cada grupo? Con el análisis de conglomerados de k-
medias, podría agrupar los programas de televisión (los casos) en k grupos
homogéneos, basados en las características del televidente. Esto se puede utilizar para
identificar segmentos de mercado. También puede agrupar ciudades (los casos) en
grupos homogéneos, de manera que se puedan seleccionar ciudades comparables para
probar diversas estrategias de marketing.
Estadísticos. Para la solución completa: centros iniciales de los conglomerados, tabla
de ANOVA. Para cada caso: información del conglomerado, distancia desde el centro
del conglomerado.
Datos. Las variables deben ser cuantitativas en el nivel de intervalo o de razón. Si las
variables son binarias o recuentos, utilice el procedimiento Análisis de
conglomerados jerárquicos.
Orden de casos y centro de conglomerados iniciales. El algoritmo por defecto para
elegir centros de conglomerados iniciales no es invariable con respecto a la
ordenación de casos. La opción Usar medias actualizadas del cuadro de diálogo Iterar
hace que la solución resultante dependa potencialmente del orden de casos con
independencia de cómo se eligen los centros de conglomerados iniciales. Si va a
utilizar alguno de estos métodos, puede que desee obtener varias soluciones distintas
con los casos ordenados en distintos órdenes aleatorios para comprobar la estabilidad
de una solución determinada. La especificación de los centros de conglomerados
iniciales y la no utilización de la opción Usar medias actualizadas evita los problemas
relacionados con el orden de casos. No obstante, la ordenación de los centros de
conglomerados iniciales puede afectar a la solución en caso de haber distancias
empatadas desde los casos a los centros de conglomerados. La comparación de los
resultados de los análisis con las distintas permutaciones de los valores de centros
iniciales se puede utilizar para evaluar la estabilidad de una solución determinada.
Supuestos. Las distancias se calculan utilizando la distancia euclídea simple. Si desea
utilizar otra medida de distancia o de similaridad, utilice el procedimiento.
Para obtener un análisis de conglomerados de K-medias
Elija en los menús: Analizar… Clasificar… Conglomerado de K medias...
Cuadro de diálogo Análisis de conglomerados de K-medias
Seleccione las variables que se van a utilizar en el análisis de conglomerados.
Especifique el número de conglomerados. Este número no debe ser inferior a
dos ni superior al número de casos del archivo de datos.
Seleccione Iterar y clasificar o Sólo clasificar.
Si lo desea, puede seleccionar una variable de identificación para etiquetar los
casos.
.ANÁLISIS DE CONGLOMERADOS JERÁRQUICOS
El escalamiento de las variables es una consideración importante; si sus variables
utilizan diferentes escalas (por ejemplo, una variable se expresa en dólares y otra en
años), los resultados podrían ser equívocos. En estos casos, debería considerar la
estandarización de las variables antes de realizar el análisis de conglomerados de k-
medias (esto se puede hacer en el procedimiento Descriptivos). Este procedimiento
supone que ha seleccionado el número apropiado de conglomerados y que ha
incluido todas las variables relevantes. Si ha seleccionado un número inapropiado de
conglomerados o ha omitido variables relevantes, los resultados podrían ser
equívocos.
Para obtener un análisis de conglomerados jerárquico
Elija en los menús: Analizar…Clasificar…Conglomerados jerárquicos...
Cuadro de diálogo Análisis de conglomerados jerárquico
Si está aglomerando casos, seleccione al menos una variable numérica. Si está
aglomerando variables, seleccione al menos tres variables numéricas.
Si lo desea, puede seleccionar una variable de identificación para etiquetar los
casos.
Análisis de conglomerados jerárquico: Método
Cuadro de diálogo Análisis de conglomerados jerárquico: Método
Método de conglomeración. Las opciones disponibles son: Vinculación inter-
grupos, Vinculación intra-grupos, Vecino más próximo, Vecino más lejano,
Agrupación decentroides, Agrupación de medianas y Método de Ward.
Medida. Permite especificar la medida de distancia o similaridad que será empleada
en la aglomeración. Seleccione el tipo de datos y la medida de distancia o similaridad
adecuada:
Datos de intervalo. Distancia euclídea, Distancia euclídea al cuadrado, Coseno,
Correlación de Pearson, Chebychev, Bloque, Minkowski y Personalizada.
Datos de frecuencias. Las opciones disponibles son: Medida de chi-cuadrado y
Medida de phi-cuadrado.
Datos binarios. Las opciones disponibles son: Distancia euclídea, Distancia euclídea
al cuadrado, Diferencia de tamaño, Diferencia de configuración, Varianza,
Dispersión, Forma, Concordancia simple, Correlación phi de 4 puntos,
Lambda, D de Anderberg, Dice, Hamann, Jaccard, Kulczynski 1, Kulczynski 2,
Lance y Williams, Ochiai, Rogers y Tanimoto, Russel y Rao, Sokal y Sneath 1,
Sokal y Sneath 2, Sokal y Sneath 3, Sokal y Sneath 4, Sokal y Sneath 5, Y de Yule y
Q de Yule.
Transformar valores. Permite estandarizar los valores de los datos, para los casos o
las variables, antes de calcular las proximidades (no está disponible para datos
binarios). Los métodos disponibles de estandarización son: Puntuaciones z, Rango -1
a 1, Rango 0 a 1, Magnitud máxima de 1, Media de 1 y Desviación típica 1.
Transformar medidas. Permite transformar los valores generados por la medida de
distancia. Se aplican después de calcular la medida de distancia. Las opciones
disponibles son: Valores absolutos, Cambiar el signo y Cambiar la escala al rango0-1.
Análisis de conglomerados jerárquico: Estadísticos
Cuadro de diálogo Análisis de conglomerados jerárquico: Estadísticos
Historial de conglomeración. Muestra los casos o conglomerados combinados en
cada etapa, las distancias entre los casos o los conglomerados que se combinan, así
como el último nivel del proceso de aglomeración en el que cada caso (o variable) se
unió a su conglomerado correspondiente.
Matriz de distancias. Proporciona las distancias o similaridades entre los elementos.
Conglomerado de pertenencia. Muestra el conglomerado al cual se asigna cada caso
en una o varias etapas de la combinación de los conglomerados. Las opciones
disponibles son: Solución única y Rango de soluciones.
Análisis de conglomerados jerárquico: Gráficos
Cuadro de diálogo Análisis de conglomerados jerárquico: Gráficos
Dendrograma. Muestra un dendrograma. Los dendrogramas pueden emplearse para
evaluar la cohesión de los conglomerados que se han formado y proporcionar
información sobre el número adecuado de conglomerados que deben conservarse.
Témpanos. Muestra un diagrama de témpanos, que incluye todos los
conglomerados o un rango especificado de conglomerados. Los diagramas de
témpanos muestran información sobre cómo se combinan los casos en los
conglomerados, en cada iteración del análisis. La orientación permite seleccionar un
diagrama vertical u horizontal.
Análisis de conglomerados jerárquico: Guardar variables nuevas
Cuadro de diálogo Análisis de conglomerados jerárquico:
Guardar variables nuevas.
Conglomerado de pertenencia. Permite guardar los conglomerados de pertenencia
para una solución única o un rango de soluciones. Las variables guardadas pueden
emplearse en análisis posteriores para explorar otras diferencias entre los grupos.
ANÁLISIS DE RESPUESTAS MÚLTIPLES
Se ofrecen dos procedimientos para analizar los conjuntos de categorías múltiples y
de dicotomías múltiples. El procedimiento Frecuencias de respuestas múltiples
muestra tablas de frecuencias. El procedimiento Tablas de contingencia de respuestas
múltiples muestra tablas de contingencia de dos y tres dimensiones. Antes de utilizar
cualquiera de estos procedimientos, deberá definir conjuntos de respuestas múltiples.
Ejemplo. Este ejemplo ilustra el uso de elementos de respuestas múltiples en un
estudio de investigación de mercado. Los datos son ficticios y no deben interpretarse
como reales. Una línea aérea podría hacer una encuesta a los pasajeros que realicen
una determinada ruta para evaluar las líneas aéreas de la competencia. En este
ejemplo, American Airlines desea conocer el uso que hacen sus pasajeros de otras
líneas aéreas en la ruta Chicago-Nueva York y la importancia relativa del horario y el
servicio a la hora de seleccionar una línea aérea. El encargado del vuelo proporciona
a cada pasajero un breve cuestionario durante el embarque. La primera pregunta dice:
Rodee con un círculo todas las líneas aéreas con la que haya volado al menos una
vez en los últimos seis meses en este mismo trayecto: American, United, TWA,
USAir, Otras. Se trata de una pregunta de respuestas múltiples, ya que el pasajero
puede marcar más de una respuesta. Sin embargo, la pregunta no se puede codificar
directamente, ya que una variable sólo puede tener un valor para cada caso. Deberá
utilizar distintas variables para asignar respuestas a cada pregunta. Existen dos formas
de hacerlo. Una consiste en definir una variable para cada una de las opciones (por
ejemplo, American, United, TWA, USAir y Otras). Si el pasajero marca United, a la
variable united se le asignará el código 1; en caso contrario se le asignará 0. Éste es
un método de dicotomías múltiples de asignación de variables. La otra forma de
asignar respuestas es el método de categorías múltiples, en el que se estima el número
máximo de posibles respuestas a la pregunta y se configura el mismo número de
variables, con códigos para especificar la línea aérea utilizada. Examinando una
muestra de cuestionarios, podría observarse que ningún usuario ha volado en más de
tres líneas aéreas diferentes en esta ruta durante los últimos seis meses. Aún más,
se observará que debido a la liberalización de las líneas aéreas, aparecen otras 10 en
la categoría Otras. Con el método de respuestas múltiples, definiría tres variables,
cada una codificada como 1 = american, 2 = united, 3 = twa, 4 = usair, 5 = delta y así
sucesivamente. Si un pasajero determinado marca American y TWA, la primera
variable tendrá el código 1, la segunda el 3 y la tercera un código de valor perdido.
Otro pasajero podría haber marcado American e introducido Delta. Así, la primera
variable tendrá el código 1, la segunda el 5 y la tercera un código de valor perdido.
Por el contrario, si utiliza el método de dicotomías múltiples, terminará con 14
variables independientes. Aunque cualquiera de los métodos de asignación anteriores
es viable para este estudio, el método seleccionado dependerá de la distribución de
respuestas.
Para definir conjuntos de respuestas múltiples
Elija en los menús:
Analizar…
Respuesta múltiple…
Definir conjuntos...
Cuadro de diálogo Definir conjuntos de respuestas múltiples
Seleccione dos o más variables.
Si las variables están codificadas como dicotomías, indique qué valor desea contar.
Si las variables están codificadas como categorías, defina el rango de las categorías.
Introduzca un nombre distintivo para cada conjunto de respuestas múltiples.
Pulse Añadir para agregar el conjunto de respuestas múltiples a la lista de conjuntos
definidos.
Frecuencias de respuestas múltiples
El procedimiento Frecuencias de respuestas múltiples produce tablas de frecuencias
para conjuntos de respuestas múltiples. En primer lugar es necesario definir uno o
más conjuntos de respuestas múltiples.
Para los conjuntos de dicotomías múltiples, los nombres de categorías que se
muestran en los resultados proceden de etiquetas de variable definidas para variables
elementales del grupo. Si las etiquetas de variable no están definidas, los nombres de
las variables se utilizarán como etiquetas. Para los conjuntos de categorías múltiples,
las etiquetas de categoría proceden de las etiquetas de valor de la primera variable del
grupo. Si las categorías perdidas para la primera variable están presentes para otras
variables del grupo, defina una etiqueta de valor para las categorías perdidas.
Valores perdidos. Los casos con valores perdidos se excluyen en base a tabla por
tabla. Si lo desea, puede seleccionar una de las opciones siguientes o ambas:
Excluir los casos según lista dentro de las dicotomías. Excluye los casos con
valores perdidos en cualquier variable de la tabulación del conjunto de dicotomías
múltiples. Esto sólo se aplica a conjuntos de respuestas múltiples definidos como
conjuntos de dicotomías. Por defecto, un caso se considera perdido para un conjunto
de dicotomías múltiples si ninguna de sus variables que lo componen contiene el
valor contado. Los casos con valores perdidos en algunas variables, pero no en todas,
se incluyen en las tabulaciones del grupo si al menos una variable contiene el valor
contado.
Excluir los casos según lista dentro de las categorías. Excluye los casos con
valores perdidos en cualquier variable de la tabulación del conjunto de categorías
múltiples. Esto sólo se aplica a conjuntos de respuestas múltiples definidos como
conjuntos de categorías. Por defecto, un caso se considera perdido para un conjunto
de categorías múltiples sólo si ninguno de sus componentes tiene valores válidos
dentro del rango definido.
Ejemplo. Cada variable creada a partir de una pregunta de una encuesta es una
variable elemental. Para analizar un elemento de respuestas múltiples, deberá
combinar las variables en uno o dos tipos de conjuntos de respuestas múltiples: un
conjunto de dicotomías múltiples o un conjunto de categorías múltiples. Por ejemplo,
si una encuesta sobre líneas aéreas preguntara al encuestado cuál de las tres líneas
(American, United, TWA) ha utilizado durante los seis últimos meses y usted
utilizara variables dicotómicas y definiera un conjunto de dicotomías múltiples,
cada una de las tres variables del conjunto se convertiría en una categoría de la
variable de grupo. Las frecuencias y los porcentajes de las tres líneas aéreas se
muestran en una tabla de frecuencias. Si observa que ningún encuestado ha
mencionado más de dos líneas aéreas, podría crear dos variables, cada una con tres
códigos, uno para cada línea aérea. Si define un conjunto de categorías múltiples,
los valores se tabulan añadiendo los mismos códigos en las variables elementales
juntas. El conjunto de valores resultantes es igual a los de cada una de las variables
elementales. Por ejemplo, 30 respuestas para United son la suma de las cinco
respuestas de United para la línea aérea 1 y las 25 respuestas de United para la línea
aérea 2. Las frecuencias y los porcentajes de las tres líneas aéreas se muestran en una
tabla de frecuencias.
Estadísticos. Tablas de frecuencias que muestran recuentos, porcentajes de
respuestas, porcentajes de casos, número de casos válidos y número de casos
perdidos.
Datos. Utilice conjuntos de respuestas múltiples.
Supuestos. Las frecuencias y los porcentajes proporcionan una descripción útil de los
datos de cualquier distribución.
Procedimientos relacionados. El procedimiento Definir conjuntos de respuestas
múltiples permite definir este tipo de conjuntos. Resultados de las frecuencias de
respuestas múltiples.
Para obtener frecuencias de respuestas múltiples
Elija en los menús:
Analizar…
Respuesta múltiple…
Frecuencias...
Cuadro de diálogo Frecuencias de respuestas múltiples
Seleccione uno o más conjuntos de respuestas múltiples.
ANÁLISIS DE FIABILIDAD
El análisis de fiabilidad permite estudiar las propiedades de las escalas de medición
y de los elementos que las constituyen. El procedimiento Análisis de fiabilidad
calcula un número de medidas de fiabilidad de escala que se utilizan normalmente y
también proporciona información sobre las relaciones entre elementos individuales
de la escala. Se pueden utilizar los coeficientes de correlación intraclase para calcular
estimaciones de la fiabilidad inter-evaluadores.
Ejemplo. ¿El cuestionario mide la satisfacción del cliente de manera útil? El análisis
de fiabilidad le permitirá determinar el grado en que los elementos del cuestionario se
relacionan entre sí, obtener un índice global de la replicabilidad o de la consistencia
interna de la escala en su conjunto e identificar elementos problemáticos que deberían
ser excluidos de la escala.
Estadísticos. Descriptivos para cada variable y para la escala, estadísticos de resumen
comparando los elementos, correlaciones y covarianzas inter-elementos, estimaciones
de la fiabilidad, tabla de ANOVA, coeficientes de correlación intraclase, Tcuadrado
de Hotelling y prueba de aditividad de Tukey.
Modelos. Están disponibles los siguientes modelos de fiabilidad:
Alfa (Cronbach). Es un modelo de consistencia interna, que se basa en la correlación
inter-elementos promedio.
Dos mitades. Este modelo divide la escala en dos partes y examina la correlación
entre dichas partes.
Guttman. Este modelo calcula los límites inferiores de Guttman para la fiabilidad
verdadera.
Paralelo. Este modelo asume que todos los elementos tienen varianzas iguales y
varianzas error iguales a través de las réplicas.
Paralelo estricto. Este modelo asume los supuestos del modelo paralelo y también
asume que las medias son iguales a través de los elementos.
Datos. Los datos pueden ser dicotómicos, ordinales o de intervalo, pero deben estar
codificados numéricamente.
Supuestos. Las observaciones deben ser independientes y los errores no deben estar
correlacionados entre los elementos. Cada par de elementos debe tener una
distribución normal bivariada. Las escalas deben ser aditivas, de manera que cada
elemento esté linealmente relacionado con la puntuación total.
Procedimientos relacionados. Si desea explorar la dimensionalidad de los elementos
de la escala (para comprobar si es necesario más de un constructo para explicar el
patrón de puntuaciones en los elementos), utilice el Análisis factorial o el
Escalamiento multidimensional. Para identificar grupos homogéneos de variables,
puede utilizar Análisis de conglomerados jerárquico para agrupar las variables.
Para obtener un Análisis de Fiabilidad
Elija en los menús:
Analizar…
Escala…
Análisis de fiabilidad...
Cuadro de diálogo Análisis de fiabilidad
Seleccione dos o más variables como componentes potenciales de una escala
aditiva.
Elija un modelo de la lista desplegable Modelo.
Análisis de Fiabilidad: Estadísticos
Cuadro de diálogo Análisis de fiabilidad: Estadísticos
Puede seleccionar diversos estadísticos para describir la escala y sus elementos. Los
estadísticos de los que se informa por defecto incluyen el número de casos, el número
de elementos y las estimaciones de la fiabilidad, según se explica a continuación:
Modelos Alfa: coeficiente alfa. Para datos dicotómicos, éste es equivalente al
coeficiente 20 de Kuder-Richardson (KR20).
Modelos de Dos mitades: correlación entre formas, fiabilidad de dos mitades de
Guttman, fiabilidad de Spearman-Brown (longitud igual y desigual) y coeficiente alfa
para cada mitad.
Modelos de Guttman: coeficientes de fiabilidad lambda 1 a lambda 6.
Modelos de Paralelo y Paralelo estricto: prueba de bondad de ajuste del modelo,
estimaciones de la varianza error, varianza común y varianza verdadera, correlación
común inter-elementos estimada, fiabilidad estimada y estimación de la fiabilidad
insesgada.
Descriptivos para. Genera estadísticos descriptivos para las escalas o los elementos a
través de los casos. Las opciones disponibles son: Elemento, Escala y Escala si se
elimina el elemento.
Escala si se elimina el elemento. Muestra estadísticos de resumen para comparar
cada elemento con la escala compuesta por otros elementos. Los estadísticos
incluyen la media de escala y la varianza si el elemento se ha eliminado de la escala,
la correlación entre el elemento y la escala compuesta por otros elementos, y alfa de
Cronbach si el elemento se ha eliminado de la escala.
Resúmenes. Proporciona estadísticos descriptivos sobre las distribuciones de los
elementos a través de todos los elementos de la escala. Las opciones disponibles son:
Medias, Varianzas, Covarianzas y Correlaciones.
Medias (Fiabilidad). Estadísticos de resumen para las medias de los elementos. Se
muestran el máximo, el mínimo y el promedio de las medias de los elementos, el
rango y la varianza de las medias de los elementos, y la razón de la mayor media
sobre la menor media de los elementos.
Varianzas. Estadísticos de resumen de las varianzas de los elementos (ítems). Se
muestran: la menor, la mayor y el promedio de las varianzas de los ítems, el rango y
la varianza de las varianzas de los ítems, y la razón de la mayor varianza sobre la
menor varianza de los ítems.
Covarianzas. Estadísticos de resumen para las covarianzas entre los elementos. Se
muestran el máximo, el mínimo y el promedio de las covarianzas inter-elementos, el
rango y la varianza de las covarianzas inter-elementos, y la razón de la mayor
covarianza sobre la menor covarianza inter-elementos.
Correlaciones. Estadísticos de resumen para las correlaciones entre los elementos.
Se muestran el máximo, el mínimo y el promedio de las correlaciones inter-
elementos, el rango y la varianza de las correlaciones inter-elementos, y la razón de
la mayor correlación sobre la menor correlación inter-elementos.
Inter-elementos. Genera las matrices de correlaciones o covarianzas entre los
elementos.
Tabla de ANOVA. Produce pruebas de medias iguales. Las opciones disponibles
son:
Ninguno, Prueba F, Chi-cuadrado de Friedman y Chi-cuadrado de Cochran.
Prueba F (Fiabilidad). Muestra la tabla de un análisis de varianza de medidas
repetidas.
Chi-cuadrado de Friedman. Muestra el chi-cuadrado de Friedman y el coeficiente
de concordancia de Kendall. Esta opción es adecuada para datos que se encuentren
en el formato de rangos. La prueba de chi-cuadrado sustituye a la prueba F habitual
en la tabla de ANOVA.
Chi-cuadrado de Cochran. Muestra la Q de Cochran. Esta opción es adecuada para
datos que son dicotómicos. El estadístico Q sustituye a la F habitual en la tabla de
ANOVA.
T-cuadrado de Hotelling. Genera un contraste multivariado sobre la hipótesis nula
de que todos los elementos de la escala tienen la misma media.
Prueba de aditividad de Tukey. Genera un contraste sobre el supuesto de que no
existe una interacción multiplicativa entre los elementos.
Coeficiente de correlación intraclase. Genera medidas sobre la consistencia o sobre
el acuerdo de los valores entre los propios casos.
Modelo. Seleccione el modelo para calcular el coeficiente de correlación intraclase.
Los modelos disponibles son: Dos factores, efectos mixtos; Dos factores, efectos
aleatorios; y Un factor, efectos aleatorios. Seleccione Dos factores, efectos mixtos, si
los efectos de personas son aleatorios y los efectos de elementos son fijos, Dos
factores, efectos aleatorios, si los efectos de personas y los efectos de elementos son
aleatorios, y Un factor, efectos aleatorios, si los efectos de personas son aleatorios.
Tipo. Seleccione el tipo de índice. Los tipos disponibles son: Los tipos disponibles
son: Consistencia y Acuerdo absoluto.
Intervalo de confianza. Especifica el nivel para el intervalo de confianza. El valor
por defecto es 95%.
Valor de prueba. Especifica el valor hipotetizado para el coeficiente, para el
contraste de hipótesis. Este es el valor con el que se compara el valor observado.
El valor por defecto es 0.
APLICACIÓN DEL SPSS EN ESTADISTICA INFERENCIAL
Utilidad de procesamiento de Programa Estadístico Informático SPSS
La utilidad de procesamiento permite automatizar tareas, entre las que se incluyen:
Personalizar automáticamente los resultados del Visor.
Abrir y guardar archivos de datos.
Mostrar los cuadros de diálogo y trabajar con ellos.
Ejecutar transformaciones de datos y procedimientos estadísticos utilizando la
sintaxis de comandos.
Exportar gráficos como archivos de gráficos en diversos formatos.
Con el programa se incluyen varios procesos, entre ellos algunos auto-procesos que
se ejecutan automáticamente siempre que se produce un tipo concreto de resultado.
Puede utilizar estos procesos tal y como son o personalizarlos según sus necesidades.
Si desea crear sus propios procesos, puede empezar por elegir entre un número de
procesos de iniciación.
Para ejecutar un proceso
Elija en los menús: Utilidades… Ejecutar proceso…
Cuadro de diálogo Ejecutar proceso
Seleccione la carpeta de procesos Scripts.
Seleccione el proceso que desee.
PROCESOS INCLUIDOS EN SPSS
El programa incluye los siguientes procesos:
Ejecutar casos no seleccionados. Repite un análisis factorial o discriminante
utilizando los casos no seleccionados en un análisis anterior. Antes de ejecutar el
proceso se debe seleccionar una tabla Notas producida por una ejecución anterior de
Factor o de Discriminante. Cambiar sig a p. Cambia Sig. a p= en las etiquetas de
columna de cualquier tabla pivote. Se debe seleccionar la tabla antes de ejecutar el
proceso.
Limpiar navegador. Elimina todas las tablas Notas de un documento de resultados.
Antes de ejecutar el proceso el documento debe estar abierto en la ventana del Visor
designada.
Pie de página frec. Inserta los estadísticos mostrados en una tabla de estadísticos de
frecuencias como notas al pie en la tabla de frecuencias correspondiente para cada
variable. Antes de ejecutar el proceso se debe seleccionar la tabla de estadísticos de
frecuencia.
Totales en negrita. Aplica el formato negrita y el color azul a cualquier fila, columna
o capa de datos con la etiqueta Total en una tabla pivote. Se debe seleccionar la tabla
antes de ejecutar el proceso.
Informe de medias. Extrae información de una tabla Medias y escribe los resultados
en varios archivos de resultados ASCII. Antes de ejecutar el proceso se debe
seleccionar la tabla Medias.
Eliminar etiquetas. Elimina todas las etiquetas de fila y columna de la tabla pivote
seleccionada. Se debe seleccionar la tabla antes de ejecutar el proceso.
Volver a ejecutar sintaxis. Vuelva a enviar el comando encontrado en la tabla Notas
seleccionado utilizando el archivo de datos activo. Si no existe ningún archivo de
datos abierto, el proceso intentará leer el archivo de datos utilizado originalmente. Se
debe seleccionar la tabla Notas antes de ejecutar el proceso.
R cuadrado max. En una tabla de resumen del modelo de regresión, aplica el
formato de negrita y el color azul a la fila correspondiente al modelo que maximiza
la R cuadrado corregida.
Autoprocesos
Los autoprocesos se ejecutan automáticamente al ser activados cuando se crea una
pieza específica de resultados con un procedimiento dado. Por ejemplo, uno de los
autoprocesos elimina automáticamente la diagonal superior y resalta los coeficientes
de correlación inferiores a una significación determinada siempre que se genera una
tabla de correlaciones mediante el procedimiento Correlaciones bivariadas.
La pestaña Procesos del cuadro de diálogo Opciones (menú Edición) muestra los
autoprocesos que están disponibles en el sistema y permite activar o desactivar
procesos individuales.
Pestaña Procesos del cuadro de diálogo Opciones
CREACIÓN Y EDICIÓN DE PROCESOS
Puede personalizar muchos de los procesos incluidos con el software para sus
necesidades específicas. Por ejemplo, existe un proceso que elimina todas las tablas
notas del documento de resultados designado. Puede modificar fácilmente este
proceso para eliminar elementos de resultados de cualquier tipo y etiqueta que desee.
Modificación de un proceso en la ventana de proceso
Si prefiere crear sus propios procesos, puede comenzar eligiendo entre varios
procesos iniciales.
Para editar un proceso
Elija en los menús: Archivo… Abrir…Proceso...
Apertura de un archivo de autoproceso
Seleccione la carpeta de procesos Scripts.
En Tipo de archivos, seleccione Proceso de SPSS (*.sbs).
Seleccione el proceso que desee.
ENVÍO DE RESULTADOS A ARCHIVOS DE DATOS DE SPSS
Un archivo de datos de SPSS consta de variables en las columnas y de casos en las
filas, lo que representa básicamente el modo en que las tablas pivote se convierten en
archivos de datos:
Las columnas de la tabla son variables en el archivo de datos. Los nombres de
variable válidos se generan a partir de etiquetas de columna.
Las etiquetas de fila de la tabla se convierten en variables con nombres de variable
genérica (Var1, Var2, Var3, etc.) en el archivo de datos. Los valores de estas
variables son etiquetas de fila en la tabla.
En el archivo de datos se incluyen automáticamente tres variables de identificador
de tabla: Comando_, Subtipo_ y Etiqueta_. Las tres son variables de cadena. Las dos
primeras se corresponden con los identificadores de comandos y subtipos. Si desea
obtener más información, consulte “Identificadores de comandos y subtipos de tabla”
en p. 701. Etiqueta_ contiene el texto de título de tabla. Las filas de la tabla se
convierten en casos en el archivo de datos.
Ejemplo: Tabla sencilla de dos dimensiones
En el caso más simple (una tabla sencilla de dos dimensiones), las columnas de
tabla se convierten en variables y las filas se convierten en casos en el archivo de
datos.
Tabla sencilla de dos dimensiones
SOLUCIÓN DE PROBLEMAS
Una Aplicación Práctica en el Análisis Cuantitativo.
En investigaciones de Ortiz (2000, 2002), Ortiz y Rico (2001), Ortiz, Rico y Castro
(2001) y Ortiz, Rico y Castro (2003), para realizar el análisis de las actitudes de
profesores de matemática en formación se utilizó el paquete estadístico Statistical
Package for Social Sciences (SPSS) creado en 1968 y según Paniza (2005), uno de
los más utilizados en el ámbito de la investigación cuantitativa; este programa ofrece
un conjunto de herramientas de análisis estadístico univariado y multivariado (Futó,
2004), estructurado en partes independientes e integrables que reciben el nombre de
módulos.
Así, partiendo desde un módulo base, es posible añadir diferentes partes para
realizar una amplia gama de análisis, dando la posibilidad de trabajar utilizando la
interfaz gráfica (trabajar por ventanas) o mediante los comandos de sintaxis para
automatizar trabajos similares (trabajar por programación).
En particular, para conocer la actitud de los participantes en el desarrollo del
programa de formación propuesto por Ortiz (2002), tanto al inicio como al final de su
implementación (curso), se recurrió al diseño de un cuestionario de actitudes estilo
Likert, estructurado según las especificaciones descritas en Ortiz, Rico & Castro
(2001), cuyo propósito fue analizar los cambios actitudinales en los participantes.
Una de las técnicas adecuadas para estudiar la relación entre variables cualitativas
es la de los modelos logarítmicos lineales, conocida comúnmente como modelos log-
lineales. Esta técnica es usada para estudiar varias variables simultáneamente y
determinar las asociaciones e interacciones que existen entre ellas (Bisquerra, 1989;
Castro, 1995; Latiesa, 1991). En Ortiz (2002), el interés por conocer las interacciones
y asociaciones entre las variables del estudio, se consideró pertinente recurrir al
modelo log-lineal para analizar los valores de dichas variables. A efectos del análisis,
se aplicó la técnica de los modelos log-lineales a los datos colectados, utilizando el
programa SPSS. Se encontró que los resultados de la escala de actitudes sugieren
cambios favorables en los participantes, pero a la luz del análisis log-lineal éstos no
son estadísticamente significativos. Por otro lado, se identificaron actitudes que no
sufrieron cambio luego de la aplicación del programa, como el caso de la actitud
hacia la calculadora gráfica con respecto del alumno.
Del análisis estadístico de los sujetos, efectuado mediante las técnicas cluster y
escalamiento multidimensional, realizado con el paquete SPSS se concluyó que:
La complementariedad de las técnicas estadísticas utilizadas es útil para identificar
y validar los hallazgos en las tendencias actitudinales de los participantes. Tal es el
caso de la actitud hacia las componentes del programa (Modelización, Calculadora,
Algebra lineal y Unidades didácticas) referidas a la evaluación.
Con el análisis estadístico de los sujetos se complementan los niveles descriptivos.
Además se indaga en la estructura de cada grupo (inicial y final) hasta llegar a
identificar subgrupos y sus características.
En el momento inicial, los sujetos del grupo más numeroso coinciden en actitudes
favorables hacia componentes referidas a la dimensión curricular alumno. Por otro
lado, presentan disparidad en la actitud hacia las unidades didácticas en la enseñanza
del álgebra.
El análisis estadístico del momento final permite identificar un grupo de cinco
miembros. En él se destaca que todos sus miembros se manifiestan totalmente de
acuerdo en lo que respecta a las actitudes hacia la resolución de problemas
algebraicos en todas las dimensiones del currículo. Esto indica que en dicho grupo la
actitud de preferencia favorable es hacia el álgebra lineal. Tal hallazgo contribuye a
confirmar la pertinencia de la estructura conceptual del álgebra lineal escolar como
contexto matemático para desarrollar el curso implementado.
A partir de la comparación entre los resultados del análisis estadístico de los
sujetos, con los clusters seleccionados, se pudo confirmar que las actitudes más
favorables de manera significativa fueron hacia la resolución de problemas
algebraicos respecto del alumno y de la evaluación.
El análisis estadístico de los sujetos pone en evidencia la importancia de ser
cauteloso al momento de emitir juicios categóricos acerca de las tendencias
actitudinales y por lo tanto hacia el impacto del curso implementado. De allí la
importancia de la complementariedad de técnicas de análisis de los datos en el estudio
de las actitudes, para lograr un abordaje mucho más profundo para la obtención de
conclusiones con mayor sustentación.
Este ejemplo de utilización del paquete estadístico SPSS podría contribuir a
reflexionar acerca de la importancia de acudir a softwares para el análisis de datos
que coadyuven a obtener resultados de mayor profundidad en el análisis cuantitativo.
Asimismo, el manejo de datos con mayor precisión y rapidez de tal manera que el
investigador pueda concentrar su atención en el fenómeno en estudio y en
consecuencia valorar con más detalle las implicaciones de los resultados del análisis
estadístico realizado.
Aplicación del Programa SPSS para Resolver Ejercicios Estadísticos
Anova simple y factorial.
ETIQUETAS:
sexo: Género sexual > 1= "masculino", 0= "femenino".
ci: Nivel intelectual > 1= "120 o más", 2= "100-120”, 3= "80-100".
estrateg: Estrategia de enseñanza > 1= "cinta de video", 2= "conferencia", 3= "estudio de caso".
puntuaci: Puntuación obtenida en la evaluación (escala de 1 a 20 ptos.).
DATOS:
sujeto sexo ci estrateg puntuaci1 0 3 1 182 0 3 1 163 0 3 1 154 0 1 1 165 1 3 1 156 1 3 1 187 1 1 1 138 1 3 1 199 0 1 1 1710 0 3 1 1311 0 2 2 1412 0 1 2 1213 0 3 2 1114 1 2 2 1515 0 2 2 1316 0 3 2 1217 0 2 2 1018 0 3 2 1119 1 3 2 1020 1 1 2 1221 0 1 3 1422 0 3 3 1223 1 1 3 1524 1 2 3 925 1 2 3 1826 1 2 3 1827 0 2 3 1728 1 3 3 1829 1 2 3 1430 1 1 3 10
SOLUCIONES:
Nro. Variables usadas Coeficiente Valor Probabilidad H.
nula1.a estrateg, puntuaci F de Snedecor 6,448 0,005* rechazo
SheffeCinta de video y
conferencia0,2882 0,005* rechazo
1.b estrateg, ci, puntuaci F de Snedecor 0,355 0,786 acepto
estrateg, sexo, puntuaci F de Snedecor 0,022 0,978 acepto
*significativo al 0,05
Análisis Gráfico
ETIQUETAS:
edocivil: Estado civil 1= "casado", 0= "soltero".
antigued: Antiguedad en el puesto (en años).
antig2: Antiguedad en el puesto > 1= "5 años o menos", 2= "6-11 años”, 3= "11-15años", 4= "16-20 años" .
satlab1: Satisfacción laboral en el puesto 1 > 1= "nada satisfecho", 2= "algo satisfecho", 3= "bastante satisfecho", 4= "totalmente satisfecho".
satlab1b: Satisfacción laboral en el puesto 1 > 1= "alta", 0= "baja".
satlab2: Satisfacción laboral en el puesto 2 > 1= "nada satisfecho", 2= "algo satisfecho", 3= "bastante satisfecho", 4= "totalmente satisfecho".
DATOS:
sujeto edocivil antigued antig2 satlab1 satlab1b satlab21 1 10 2 4 1 32 1 7 2 3 1 23 1 15 3 4 1 34 0 2 1 1 0 25 1 5 1 3 1 46 1 10 2 2 0 37 0 1 1 1 0 18 0 2 1 2 0 39 0 5 1 1 0 210 1 6 2 3 1 111 0 2 1 2 1 312 1 20 4 4 1 313 0 3 1 2 0 414 0 2 1 2 1 415 0 3 1 1 0 216 0 4 1 2 0 317 1 8 2 3 1 418 1 15 3 3 0 219 0 1 1 1 0 220 0 9 2 3 0 121 1 4 1 1 1 222 0 20 4 4 1 323 0 3 1 1 0 224 1 8 2 3 1 325 1 5 1 4 1 426 0 2 1 1 0 127 0 2 1 2 1 328 0 6 2 4 0 229 1 6 2 3 1 330 1 4 1 2 0 1
CONCLUSIÓN
Usar el programa estadístico-informático SPSS 13.0 como herramienta, hoy en día
es un factor que sin duda alguna, influye de manera positiva en el desempeño de
nuestra labor en la vida.
Es una herramienta fundamental para comprender las causas y consecuencias del
comportamiento de nuestro entorno, brindándonos las bases para optimizar los
esfuerzos y recursos y así orientarlos a mejores resultados.
Podemos asegurar que usando esta herramienta de manera efectiva y eficiente, los
cálculos estadísticos dejaran de ser una complicada tarea convirtiéndose así en una
labor relativamente sencilla que cualquier persona puede realizar.
Por otra parte, el paquete estadístico SPSS beneficia de manera significativa a sus
usuarios por su gran capacidad, la facilidad de uso y su adaptabilidad a la mayoría de
las ramas de la ciencia y los negocios.
Por último, deseamos resaltar que este manual no tendrá ningún sentido, si al
finalizar, el usuario no está en la capacidad de realizar cualquier análisis descriptivo
de datos generando gráficos, estadísticos y diversos tipos de tablas y a su vez, ser
capaz de interpretar los resultados extrayendo las respectivas conclusiones de la
información utilizada.
BIBLIOGRAFÍAAFIFI, A.A. and CLARK, V. (1996) Computer-Aided Multivariate Analysis. Third Edition. Texts in Statistical Science. Chapman and Hall.
BOX,G. E. P., HUNTER, W. G., HUNTER, J.S. (1978). Statistics forExperimenters. John Wiley & Sons.
BOX, G., HUNTER, W. & HUNTER, J.S. "Estadística para Investigadores. Introducción al Diseño de Experimentos, Análisis de Datos y Construcción de Modelos". Ed. Revert‚ S.A.
Cao, R. y otros (2002) “Introducción a la Estadística y sus aplicaciones”. Ed. Pirámide.
Calderón C., Bernardo A. (2009) “Métodos de estimación (http://siona.udea.edu.co/~bcalderon/3_metodosestimacion.html)”.Estadística Matemática I. Universidad de Antioquia.
Camacho Rosales, J. (1998): Estadística con SPSS para Windows , Ra-Ma, Madrid.
Castañeda J., J.(1991): Métodos de Investigación 2. Editorial McGraw-Hill. México.
Carono, R., Minujin, A. y Vera, G.(1982): Manual de técnicas de evaluación yajuste de información Estadísticas. Fondo de cultura económica. México.
Chao, L.(1993): Estadística para la Ciencia Administrativa. Editorial McGraw –Hill. 4ta Edición. Colombia
CHOU, YA-LUN (1972): Análisis Estadístico. Editorial Interamericana. México.
COCHRAN, W.G. & COX, G.M. "Diseño Experimentales". Ed. Trillas.
COX, D.R. (1958). Planning of experiments. New York. John Wiley & Sons.
DANIEL, C. "Applications of Statistics to Industrial Experimentation." Willey
DAVIES, O.L. "The Design and Analysis of Industrial Experiments". Hafner (Mc.Millan)
DANIEL WAYNE, W. y Otros (1993): Estadística con Aplicación a las Ciencias Sociales y a la Educación Editorial McGraw-Hill Interamericana de México, S.A. de C.V. México.
De Oteyza de O., E; Emma Lam O., Carlos Hernández G. y Ángel M. CarrilloH. (1998). Temas Selectos de Matemáticas. Prentice Hall. México
Enciclopedia Microsoft Encarta 2003 (2003): Censo- Cuestionario- Encuesta. Estadística. Editorial Microsoft corporation. USA.
ERKIN KREYSZIA (1978): Introducción a la Estadística Matemática. Editorial Limusa, S.A. México.
EVERITT, B. And GRAHAM, D. (1991). Applied Multivariate Data Analysis. Arnold.
FEDERER, W. (1965). Experimental design. Oxford Publ. Co.
GARCÍA, J. & LARA, A. " Diseño Estadístico de Experimentos. Análisis de la Varianza." Grupo Editorial Universitario.
FERRAN, M. (1997). SPSS para Windows. Programación y Análisis Estadístico. Mc.Graw Hill.
FREUD J: E. y Otros (1990): Estadística para la Administración con Enfoque Moderno.Editorial, S.A. México.
George C. Canavos (1988) “Probabilidad y Estadística – Aplicaciones y Métodos”, Ed. McGraw-Hill
GILL, J.L. (1978). Design and Analysis of Experiments in the Animal and Medical Sciences. Iowa State University Press.
JOBSON, J. D. (1991). Applied Multivariate Data Analysis. Vol. I: Regression and Experimental Design. Springer-Verlag.
Gomes Rondón, Francisco (1985): Estadística Metodologica: Ediciones Fragor. Caracas.
GONDAR NORES, J.E. (2002). Tomo D: Estadística Multivariante. Data Mining Institute.
GONDAR NORES, J.E. (2001). Tomo M: Investigación de Mercados. Data Mining Institute.
González, Nijad H. (1986): Métodos estadísticos en Educación. Editorial Bourgeón, Caracas.Guilford, J. Y Fruchter, B. (1984): Estadística aplicada a la Psicología y la Educación.Editorial McGraw-Hill Latinoamericana, S. A., Bogotá.
Hamdan González, Nijad (1986): Métodos Estadísticos en Educación. Editorial BourgeónC.A. Caracas – Venezuela.
HAIR, J., ANDERSON, R., TATHAM, R. y BLACK, W. (1999). AnálisisMultivariante. 5ª Edición. Prentice Hall.
JOBSON, J.D. (1992) Applied Multivariate Data Analysis. Volume II: Categorical and Multivariate Methods. Springer-Verlag.
KEVIN, RICHARD I. (1988): Estadística para Administradores. Editorial Hispanoamericana. México.
KIRK, R.E. "Experimental Design: Procedures for the Behavioral Sciencies". Brooks/Cole Publishing Company.
LARSON HAROLD, J. (1985): Introducción a la Teoría de Probabilidades e inferencia Estadística. Editorial Limusa. México.
LEHMANN, CHARLES H. (1995): ÁLGEBRA. Editorial limusa, S.A. DE C.V.Grupo Noriega Editores. México.
LEITHOLD, LOUIS (1992): El Cálculo con Geometría Analítica. Editorial HARLA México.
LINCON L., CHAO (1996): Estadística para Ciencias Administrativas. Cuarta edición. Editorial McGaw-Hill. Usa.
Lenin, R.y Kubin, D.(1992): Estadística para Administradores. Editorial Hispanoamérica. VI edición. México.
LEBART, L; MORINEAU, A. and PIRON, M. (2000). Statistique Exploratoire Multidimensionnelle. 3ª Edition. DUNOD.
LOPEZ CASUSO, R. (1984): Introducción al Cálculo de Probabilidades e Inferencia Estadística. Editorial Instituto de Investigaciones Económicas, UCAB. Caracas- Venezuela.
LORENZEN, T. J., Anderson, V. L. (1993). Design of experiments: A No- Name Approach. Marcel Dekker Inc.
Manzano, V. y otros (1999): SPSS para Windows , Ra-Ma, Madrid. SPSS Inc. (1999): SPSS 9.0. Manual de Usuario, SPSS, Chicago.
MARDIA, K.V., KENT, J.T. y BIBBY, J.M. (1994). Multivariate Analysis. Academic Press.
Enfocados hacia SPSS:
Martínez E., Andrés G.: Introducción al SPSS. Curso de www.spssparatodos.com. 2005.
MARTINEZ ARIAS, R. (2000). El Análisis Multivariante en la Investigación Científica. Cuadernos de Estadística. Editorial La Muralla.
Mason, Robert (1.992): Estadística para la Administración y Economía. Ediciones Alfaomega S.A.N. México.
MASON, R.L. "Statistical Design and Analysis of Experiments with Applications to Engineering and Science" John Wiley & Sons. New York.
MENDENNAF, W. y OTROS (1981): Estadística para Administradores y Economía. Editorial Iberoamericana. México.
MEAD, R., CURNOW, R.N. y HASTED, A.M. (1993). Statistical Methods in agriculture and experimental biology. Second edition. Chapman & Hall.
MONTGOMERY, D.C. (1991). Diseño y Análisis de experimentos. Grupo Editorial Iberoamérica.
MONTGOMERY, D.C. (1994). Applied Statistics and Probability for Engineers. John Wiley & Sons.
Mode, Elmer B. (1988): Elementos de Probabilidades y Estadística Editorial Reverte Mejicana. México.
Murria, R.(1993): Estadística. Edición Interamericana.2da Edición. México.
Murray R. Spiegel (2002): Estadística. Segunda Edición. Serie Schaum. Mc Graw Hill.
PARZEN, E. (1986): Teoría Moderna de Probabilidades y sus AplicacionesEditorial Limusa: México
NETER, J. et al. "Applied Linear Statistical Models: Regression, Analysis of Variance and Experimental Designs". Library of Congress Cataloging Publication Data.
OLLERO, J.; García, J.; LARA, A.; MARTÍNEZ, A.; RODRÍGUEZ, C. &RAMOS, H. (1997). "Diseño y Análisis Estadístico de Experimentos". Grupo Editorial Universitario
PEÑA SANCHEZ DE RIVERA, D. "Estadística: Modelos y Métodos. Modelos Lineales y Series Temporales." Vol. 1 y 2. Alianza Editorial.
Pérez L., César: Métodos Estadísticos Avanzados SPSS. Thomson Editores Spain S.A. España, 2005.
PUGACHEV, V. S. (1973): Introducción a la Teoría de ProbabilidadesEditorial Mir. Moscú.
RAYBILL, F.A. "An introduction to Linear Statistical models." Vol. 1. Ed. McGraw-Hill.
Rivas González, Ernesto(1980): Estadística General. Ediciones de la Biblioteca UCV. Caracas – Venezuela.
RUIZ MAYA, L. "Métodos Estadísticos de Investigación" I.N.E.
Rodrigo, María F.; Molina, J. Gabriel (2010) “Tema 3. Estadística Inferencial en Psicología”, p. 1.
SHARMA, S. (1998). Applied Multivariate Techiques. John Wiley and Sons.
Soto Negrin, Armando (1982): Iniciación a la estadística. Editorial José Marti. Caracas – Venezuela.
Stephen P., Shao (1986): Estadística para Economistas y Administradores deEmpresa.Editorial Herreros Hermanos, Sucs., S.A., México.
Stevenson, William(1991): Estadística para la Administración y Económica. Editorial Harla. México.
STEEL, R.G.D y TORRIE, J.H.(1988). Bioestadística: Principios y procedimientos. Segunda edición. McGraw Hill.
SIEGEL. S.. "Estadística no paramétrica". Ed. Trillas
Universidad Nacional Experimental “Simón Rodríguez” (1983): Estadística 1. Ediciones UNESR, Caracas.
URIEL, E. (1995). Análisis de Datos: Series temporales y Análisis Multivariante. Coartículo Plan Nuevo. Editorial AC.
VISAUTA, B. (1998) Análisis Estadístico con SPSS para WINDOWS (Vol II. Análisis Multivariante). Mc-Graw Hill.
Visanta V., Bienvenido: Análisis Estadístico con SPSS para Windows. Volumen I Estadística Básica. Ediciones Mc Graw Hill, Segunda Edición. España, 2002.
WALPOLE, R. y Myers, R. (1987): Probabilidad y Estadística para Ingenieros. Editorial Interamericana. México.
Wackerly, Dennis D; Mendenhall, William; Scheaffer, Richard L. (2002). “8. Estimación”. Estadística matemática con aplicaciones (6ª edición)”. Cengage Learning Editores. p. 364. ISBN 9706861947.
Webster, Allen L. (1996): Estadística Aplicada a la Empresa y la Economía. Editorial Irwin. Segunda edición. Barcelona – España.
Weimer, Richard C. (1996) Estadística. Compañía Editorial Continental, SA de CV. México.
Wonnacott, T. H. y Wonnacott, R: J. (1989): Fundamentos de Estadística para Administración y Economía. Editorial LIMUSA. México.
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
http://www.spss.com
www.spssparatodos.com
http://asesorspss.blogspot.com/2006/04/una-de-las-ventajas-de-la-versin- 130.html
http://www.spssfree.com/capitulotres.html
http://www.uv.es/RELIEVEemail: [email protected] http://www.scribd.com/doc/…/spss-introducción
http://es.wikipedia.org/wiki/SPSS
http://www.superiordepsicologia.com/archivosesc/.../manual_spss_13_espan ol.pdf.
http://www.spss.com.ar/es/success/argentina.shtml
http://es.wikipedia.org/wiki/SPSS
http://www-01.ibm.com/software/es/analytics/spss/
http://psico.fcep.urv.es/spss/index0.htm
https://sites.google.com/site/estadisticaconelspss/
http://es.wikipedia.org/wiki/An%C3%A1lisis_de_la_varianza
http://e-stadistica.bio.ucm.es/web_spss/indice_spss.html
http://www.quimica.urv.es/quimio/general/anovacast.pdf
http://www.ucm.es/info/socivmyt/paginas/D_departamento/materiales/analisis_datosyMultivariable/14anova1_SPSS.pdf
http://www.pucpr.edu/facultad/ejaviles/ED%20800%20PDF%20Files/ED%208 00%20An%E1lisis%20de%20Varianzas.pdf
http://asesoriasspss.blogspot.com/2009/08/como-hacer-una-correlacion-de- pearson.
http://fcm.ens.uabc.mx/~chelo/estadistica/doc-pdf/lec-8-2-1.pdf
http://www.uoc.edu/in3/emath/docs/RegresionLineal.pdf
http://es.wikipedia.org/wiki/Regresi%C3%B3n_lineal
http://www.uclm.es/profesorado/raulmmartin/Estadistica/PracticasSPSS/REG RESION_LINEAL_CON_SPSS.pdf
http://www.cicma.una.ac.cr/CICMA2008/REPOSITORIO/REGRESION%20LI NEAL%20SIMPLE%20CON%20SPSS.pdf
https://www.uclm.es/profesorado/raulmmartin/Estadistica/PracticasSPSS/RE GRESION_LINEAL_CON_SPSS.pdf
http://www.sc.ehu.es/sbweb/fisica/cursoJava/numerico/regresion/regresion.ht m
http://es.wikipedia.org/wiki/Nivel_de_medida
http://html.rincondelvago.com/regresion-lineal-simple.html
http://www.dm.uba.ar/materias/estadistica_Q/2011/1/clase%20regresion%20 simple.pdf
http://www.vitutor.com/estadistica/bi/8.html
https://www.uam.es/personal_pdi/economicas/sgarcia/regresionlinealsimple.p df
http://www.rcumariacristina.com/wp-content/uploads/2010/12/11-Elena- Martinez_1.pdf
http://www.monografias.com/trabajos27/regresion-simple/regresion- simple.shtml
http://es.slideshare.net/patolink/ecuacin-de-regresin-lineal
http://es.wikipedia.org/wiki/M%C3%ADnimos_cuadrados
http://es.wikipedia.org/wiki/M%C3%ADnimos_cuadrados_ordinarios
http://www.wordreference.com/definicion/correlaci%C3%B3n
http://www.ditutor.com/estadistica_2/correlacion_estadistica.html
http://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Pearson
http://es.wikipedia.org/wiki/Coeficiente_de_determinaci%C3%B3n
http://es.wikipedia.org/wiki/Matriz_de_correlaci%C3%B3n
http://es.wikipedia.org/wiki/An%C3%A1lisis_de_la_varianza
http://www.infecepi.unizar.es
http://www.lt.bioestadistica.uma.es
http://www.uaq.mx/matematicas/estadisticas/xu3.html
http://www.members-americas.tripod.com
http://www.msip.lce.org
http://www.bnv.co.cr/sesion/nota.aspg
http://www.altavista.com.
http://www.auyantepuy.com
http://www.ine.es.
http://www.udec.cl.
http://www.rincondelvago.com
http://www.monografias.com
http://www.festadistica.fguam.es/indicadores/ipri.html
http://www.uaq.mx/matematicas/estadistica/xu3.html
http://www.ine.go.bo/iwd0801.html#E
http://www.itlp/pública.edu.mx/tutoriales/economia2/portada.htm
http://www.itlp.edu.mx
http://www.ecla.evespanovestadistica/sna93nn/snann7es.html
http://w3mor.itesm.mx/~cmendoza/maest/estoo.html
http://www.mty.itesm.mx/data/materiales/estadistica/ALFREDO.html
http://www.uaq.mx/matematicas/estadistica/xtra.html#funcion
http://www.unl.edu.ar/fave/sei/encuestas/index.html
http://www.monografias.com/trabajos11/opera/opera.shtml
http://www.monografias.com/trabajos6/hiso/hiso.shtml
http://es.wikipedia.org/wiki/Historia_de_los_sistemas_operativos
http://www.monografias.com/trabajos16/sistema-operativo/sistema- operativo.shtml#TIPPOS
http://www.taringa.net/posts/ciencia-educacion/10684779/Tipos-de-Sistemas- operativos.html
http://www.monografias.com/trabajos7/sisinf/sisinf.shtml#ei
http://www.monografias.com/trabajos/anaydisesis/anaydisesis.shtml
http://hamletyelaprendizajevirtual.jimdo.com/inform%C3%A1tica/sistema- operativo
http://www.sliderhare.net/isa06t/características–de-software
http://www.sscc.co.cl/informatica/conceptos.html
http://www.opinionynoticias.com/.../8565-software-libre-en-el-pais-se-nutr ...
http://www.cad.com.mx/historia_de_la_computacion.htm
http://www.es.wikipedia.org/wiki/Bus_(inform%C3%A1tica)
http://www.cavsi.com/preguntasrespuestas/que-es-un-monitor-o-pantalla/
http://www.cavsi.com/preguntasrespuestas/que-es-el-teclado/
http://www.info-ab.uclm.es/labelec/Solar/elementos_del_pc/.../tipos.htm