ibm spss categories

IBM SPSS Categories 23

NotaAntes de utilizar esta informacin y el producto al que da soporte, lea la informacin del apartado Avisos en la pgina57.

Informacin del producto

Esta edicin se aplica a la versin 23, release 0, modificacin 0 de IBM SPSS Statistics y a todos los releases ymodificaciones posteriores hasta que se indique lo contrario en ediciones nuevas.

ContenidoCaptulo 1. Introduccin a losprocedimientos de escalamiento ptimode datos categricos . . . . . . . . . 1Qu es el escalamiento ptimo?. . . . . . . . 1Por qu utilizar el escalamiento ptimo?. . . . . 1Nivel de escalamiento ptimo y nivel de medicin . 2

Seleccin del nivel de escalamiento ptimo . . . 2Grficos de transformacin . . . . . . . . 3Cdigos de la categora . . . . . . . . . . 3

Qu procedimiento es el mejor para la aplicacin? . 5Regresin categrica . . . . . . . . . . . 6Anlisis de componentes principales categrico. . 6Anlisis de correlacin cannica no lineal. . . . 7Anlisis de correspondencias . . . . . . . . 8Anlisis de correspondencias mltiple . . . . . 9Escalamiento multidimensional . . . . . . . 10Desplegamiento multidimensional . . . . . . 10

Relacin de aspecto en grficos de escalamientoptimo . . . . . . . . . . . . . . . . 11

Captulo 2. Regresin categrica(CATREG) . . . . . . . . . . . . . 13Para definir la escala en regresin categrica . . . 14Discretizacin de regresin categrica . . . . . 14Valores perdidos de regresin categrica. . . . . 15Opciones de regresin categrica . . . . . . . 15Regularizacin de regresin categrica . . . . . 16Resultados de la regresin categrica . . . . . . 16Regresin categrica: Guardar . . . . . . . . 17Grficos de transformacin en regresin categrica 18Caractersticas adicionales del comando CATREG . 18

Captulo 3. Anlisis de componentesprincipales categrico (CATPCA) . . . 19Definir escala y ponderacin en CATPCA . . . . 20Anlisis de componentes principales categrico:Discretizacin . . . . . . . . . . . . . 21Anlisis de componentes principales categrico:Valores perdidos. . . . . . . . . . . . . 21Anlisis de componentes principales categrico:Opciones . . . . . . . . . . . . . . . 22Anlisis de componentes principales categrico:Resultados. . . . . . . . . . . . . . . 23Anlisis de componentes principales categrico:Guardar . . . . . . . . . . . . . . . 24Anlisis de componentes principales categrico:Grficos de objetos . . . . . . . . . . . . 24Anlisis de componentes principales categrico:Grficos de categoras . . . . . . . . . . . 25Anlisis de componentes principales categrico:grfico de cargas . . . . . . . . . . . . 25Simulacin de muestreo del anlisis de componentesprincipales categrico . . . . . . . . . . . 25Caractersticas adicionales del comando CATPCA 26

Captulo 4. Anlisis de correlacincannica no lineal (OVERALS) . . . . 27Definir rango y escala . . . . . . . . . . . 28Definir rango . . . . . . . . . . . . . . 29Anlisis de correlacin cannica no lineal: Opciones 29Caractersticas adicionales del comando OVERALS 30

Captulo 5. Anlisis decorrespondencias . . . . . . . . . . 31Definir rango de filas en Anlisis decorrespondencias . . . . . . . . . . . . 32Definir rango de columnas en Anlisis decorrespondencias . . . . . . . . . . . . 32Anlisis de correspondencias: Modelo . . . . . 33Anlisis de correspondencias: Estadsticos . . . . 34Anlisis de correspondencias: Grficos . . . . . 34Caractersticas adicionales del comandoCORRESPONDENCE . . . . . . . . . . . 35

Captulo 6. Anlisis decorrespondencias mltiple . . . . . . 37Definir ponderacin de la variable en el anlisis decorrespondencias mltiple . . . . . . . . . 38Discretizacin en el anlisis de correspondenciasmltiple . . . . . . . . . . . . . . . 38Valores perdidos en el anlisis de correspondenciasmltiple . . . . . . . . . . . . . . . 38Opciones de anlisis de correspondencias mltiple 39Resultados del anlisis de correspondencias mltiple 40Anlisis de correspondencias mltiple: Guardar . . 40Anlisis de correspondencias mltiple: Grficos deobjetos . . . . . . . . . . . . . . . . 41Anlisis de correspondencias mltiple: Grficos devariables . . . . . . . . . . . . . . . 41Caractersticas adicionales del comando MULTIPLECORRESPONDENCE . . . . . . . . . . . 41

Captulo 7. Escalamientomultidimensional (PROXSCAL) . . . . 43Proximidades en matrices a travs de columnas . . 44Proximidades en columnas . . . . . . . . . 44Proximidades en una columna . . . . . . . . 45Crear proximidades de los datos . . . . . . . 45Crear la medida a partir de los datos . . . . . . 45Definir un modelo de escalamientomultidimensional . . . . . . . . . . . . 46Escalamiento multidimensional: Restricciones . . . 47Escalamiento multidimensional: Opciones . . . . 47Escalamiento multidimensional: Grficos, Versin 1 48Escalamiento multidimensional: Grficos, Versin 2 48Escalamiento multidimensional: Resultados. . . . 48Caractersticas adicionales del comando PROXSCAL 49

iii

Captulo 8. Desplegamientomultidimensional (PREFSCAL) . . . . 51Definir un modelo de desplegamientomultidimensional . . . . . . . . . . . . 52Restricciones del desplegamiento multidimensional 52Opciones de desplegamiento multidimensional . . 53Grficos de desplegamiento multidimensional . . . 54Resultados del desplegamiento multidimensional. . 55

Caractersticas adicionales del comando PREFSCAL 55

Avisos . . . . . . . . . . . . . . . 57Marcas comerciales . . . . . . . . . . . . 59

ndice . . . . . . . . . . . . . . . 61

iv IBM SPSS Categories 23

Captulo 1. Introduccin a los procedimientos deescalamiento ptimo de datos categricosLos procedimientos de categoras utilizan el escalamiento ptimo para analizar datos que son difciles oimposibles de analizar mediante los procedimientos estadsticos estndar. Este captulo describe lo quehace cada procedimiento, las situaciones en las que cada procedimiento es ms apropiado, las relacionesentre los procedimientos y las relaciones de estos procedimientos con sus procedimientos estadsticosanlogos estndar.

Nota: estos procedimientos y su implementacin en IBM SPSS Statistics han sido desarrollados por elgrupo Data Theory Scaling System Group (DTSS), formado por miembros de los departamentos deeducacin y psicologa de la facultad de ciencias sociales y del comportamiento de la Universidad deLeiden.

Qu es el escalamiento ptimo?La idea que subyace tras el escalamiento ptimo es asignar cuantificaciones numricas a las categoras decada variable, lo que permite utilizar los procedimientos estndar para obtener una solucin con lasvariables cuantificadas.

Los valores de escala ptimos se asignan a las categoras de cada variable de acuerdo con el criterio deoptimizacin del procedimiento que se est utilizando. A diferencia de las etiquetas originales de lasvariables nominales u ordinales del anlisis, estos valores de escala tienen propiedades mtricas.

En la mayora de los procedimientos de categoras, la cuantificacin ptima de cada variable escalada seobtiene mediante un mtodo iterativo denominado mnimos cuadrados alternantes en el que, despus deque se utilicen las cuantificaciones actuales para encontrar una solucin, las cuantificaciones se actualizanutilizando dicha solucin. A continuacin, se utilizan las cuantificaciones actualizadas para buscar unanueva solucin, que a su vez se utiliza para actualizar las cuantificaciones y as sucesivamente, hasta quese alcanza algn criterio que indica al proceso que finalice.

Por qu utilizar el escalamiento ptimo?Los datos categricos se utilizan con frecuencia en los estudios de mercado, los estudios de encuestas y lainvestigacin en las ciencias sociales y del comportamiento. De hecho, muchos investigadores trabajancasi exclusivamente con datos categricos.

Aunque existen adaptaciones de la mayora de los modelos estndar que permiten analizarespecficamente datos categricos, con frecuencia no funcionan bien con conjuntos de datos con lassiguientes caractersticas:v Observaciones insuficientesv Demasiadas variablesv Demasiados valores por cada variable

Mediante la cuantificacin de categoras, las tcnicas de escalamiento ptimo evitan los problemas deestas situaciones. Adems, son muy tiles incluso cuando es apropiado utilizar tcnicas especializadas.

En vez de interpretar las estimaciones de los parmetros, la interpretacin de los resultados delescalamiento ptimo muchas veces se basa en representaciones grficas. Las tcnicas de escalamientoptimo ofrecen excelentes anlisis exploratorios, que complementan tambin a otros modelos de IBM

Copyright IBM Corp. 1989, 2014 1

SPSS Statistics. Mediante el acotamiento del objetivo de la investigacin, la visualizacin de los datosmediante el escalamiento ptimo puede formar la base de un anlisis que se centre en la interpretacinde los parmetros del modelo.

Nivel de escalamiento ptimo y nivel de medicinEste concepto puede resultar muy confuso cuando se utilizan por primera vez los procedimientos decategoras. Al especificar el nivel, no se especifica el nivel al que se miden las variables, sino el nivel alque se escalan. La idea es que las variables que se van a cuantificar pueden tener relaciones no linealesindependientemente de cmo se midan.

En categoras, hay tres niveles bsicos de mediciones:v El nivel nominal implica que los valores de una variable representan categoras desordenadas. Algunos

ejemplos de variables que pueden ser nominales seran la regin, el rea del cdigo postal, la confesinreligiosa y las categoras con varias opciones.

v El nivel ordinal implica que los valores de una variable representan categoras ordenadas. Entre losejemplos se incluyen escalas de actitud que representan el grado de satisfaccin o confianza y laspuntuaciones de evaluacin de las preferencias.

v El nivel numrico implica que los valores de una variable representan categoras ordenadas con unamtrica significativa, de modo que las comparaciones de distancia entre categoras son adecuadas.Entre los ejemplos se incluyen la edad en aos y los ingresos en dlares.

Por ejemplo, suponga que las variables regin, trabajo y edad se codifican como se muestra en la siguientetabla.

Tabla 1. Esquema de codificacin para regin, trabajo y edad

Cdigo de regin Valor de reginCdigo detrabajo Valor de trabajo Edad

1 Norte 1 trabajador en prcticas 20

2 Sur 2 vendedor 22

3 Este 3 administrador 25

4 Oeste 27

Los valores mostrados representan las categoras de cada variable. Regin sera una variable nominal. Haycuatro categoras de regin, sin ningn orden intrnseco. Los valores del 1 al 4 sencillamente representanlas cuatro categoras; el esquema de codificacin es completamente arbitrario. Trabajo, por otra parte, sepodra considerar como variable ordinal. Las categoras originales forman una progresin desdetrabajador en prcticas hasta administrador. Los cdigos mayores representan un trabajo superior en laescala corporativa. Sin embargo, slo se conoce la informacin acerca del orden, no se puede decir nadaacerca de la distancia existente entre categoras adyacentes. Por el contrario, edad se podra considerarcomo una variable numrica. En el caso de edad, las distancias entre los valores son intrnsecamentesignificativas. La distancia entre 20 y 22 es la misma que la que hay entre 25 y 27, mientras que ladistancia entre 22 y 25 es superior a las dos anteriores.

Seleccin del nivel de escalamiento ptimoEs importante comprender que no hay propiedades intrnsecas de una variable que predefinanautomticamente el nivel de escalamiento ptimo que se debera definir para ella. Puede explorar losdatos de cualquier manera lgica que facilite la interpretacin. Mediante el anlisis de una variable denivel numrico a nivel ordinal, por ejemplo, el uso de una transformacin no lineal puede permitir unasolucin con menos dimensiones.

Los dos ejemplos siguientes ilustran cmo el nivel de medicin "obvio" no siempre es el mejor nivel deescalamiento ptimo. Supongamos que una variable ordena objetos en dos grupos de edad. Aunque la

2 IBM SPSS Categories 23

edad se puede escalar como una variable numrica, puede ocurrir que en las personas menores de 25aos, la seguridad tenga una relacin positiva con la edad, mientras que en las personas mayores de 60aos, la seguridad tenga una relacin negativa con la edad. En este caso, puede ser mejor tratar la edadcomo una variable nominal.

Tomemos otro ejemplo, una variable que ordena a las personas por preferencia poltica parece serbsicamente nominal. Sin embargo, si se ordenan los partidos desde la izquierda poltica hasta la derechapoltica, puede que le interese que la cuantificacin de los partidos respete este orden mediante un nivelordinal de anlisis.

Aunque no haya propiedades predefinidas de una variable que la coloquen exclusivamente en un nivel oen otro, existen algunas normas generales que pueden ayudar al usuario inexperto. Con la cuantificacinnominal simple, habitualmente no se conoce el orden de las categoras pero se desea que el anlisisimponga una. Si se conoce el orden de las categoras, debera intentarse la cuantificacin ordinal. Si lascategoras no se pueden ordenar, puede intentar la cuantificacin nominal mltiple.

Grficos de transformacinLos diferentes niveles en los que se puede escalar cada variable imponen diferentes restricciones sobre lascuantificaciones. Los grficos de transformacin ilustran la relacin entre las cuantificaciones y lascategoras originales que resultan del nivel de escalamiento ptimo seleccionado. Por ejemplo, se generaun grfico de transformacin lineal cuando una variable se trata como numrica. Las variables tratadascomo ordinales generan grficos de transformacin no decreciente. Los grficos de transformacin devariables tratadas nominalmente que tienen forma de U (o la inversa) muestran una relacin cuadrtica.Las variables nominales tambin pueden generar grficos de transformacin sin tendencias aparentesmediante el cambio completo del orden de las categoras. La siguiente figura muestra un grfico detransformacin de ejemplo.

Los grficos de transformacin son especialmente adecuados para determinar si funciona bien el nivel deescalamiento ptimo seleccionado. Si varias categoras reciben cuantificaciones similares, la agrupacin deestas categoras en una categora puede estar justificada. Otra posibilidad, si una variable tratada comonominal recibe cuantificaciones que muestran una tendencia creciente, una transformacin ordinal puedegenerar un ajuste similar. Si esta tendencia es lineal, el tratamiento numrico puede resultar adecuado.Sin embargo, si la agrupacin de categoras o el cambio de los niveles de escalamiento estn justificados,el anlisis no cambiar de manera significativa.

Cdigos de la categoraSe debe tener cierto cuidado al codificar las variables categricas ya que algunos esquemas decodificacin pueden generar resultados no deseados o anlisis incompletos. En la siguiente tabla semuestran algunos posibles esquemas de codificacin para el trabajo.

Tabla 2. Esquemas de codificacin alternativos para el trabajoCategora A B C D

trabajador en prcticas 1 1 5 1

vendedor 2 2 6 5

administrador 3 7 7 3

Algunos procedimientos de categoras requieren que se defina el rango de cada variable. Todo valor fuerade este rango se tratar como un valor perdido. El valor de categora mnima es siempre 1. El valor decategora mxima lo indica el usuario. Este valor no es el nmero de categoras de una variable, sino elvalor mayor de la categora. Por ejemplo, en la tabla, el esquema A tiene un valor de categora mxima de3 y el esquema B tiene un valor de categora mxima de 7, aunque ambos esquemas codifican las mismastres categoras.

Captulo 1. Introduccin a los procedimientos de escalamiento ptimo de datos categricos 3

El rango de la variable determina las categoras que se omitirn del anlisis. Todas las categoras concdigos fuera del rango definido se omitirn del anlisis. Se trata de un mtodo sencillo de omitircategoras, pero puede generar anlisis no deseados. Una categora mxima incorrectamente definidapuede omitir categoras vlidas del anlisis. Por ejemplo, para el esquema B, si se define que el valor decategora mxima sea 3 indica que trabajo tiene categoras codificadas de 1 a 3; la categora administradorse tratar como valor perdido. Como no hay ninguna categora que se haya codificado realmente como 3,la tercera categora del anlisis no contendr ningn caso. Si desea omitir todas las categoras deadministrador, este anlisis sera adecuado. Sin embargo, si desea incluir a los administradores, lacategora mxima deber definirse como 7 y los valores perdidos debern codificarse con valor porencima de 7 o por debajo de 1.

Para las variables tratadas como nominales u ordinales, el rango de las categoras no afecta a losresultados. Para las variables nominales, es importante slo la etiqueta y no el valor asociado con dichaetiqueta. Para las variables ordinales, se conserva el orden de las categoras en las cuantificaciones; lospropios valores de las categoras no son importantes. Todos los esquemas de codificacin que produzcanel mismo orden de categoras tendrn resultados idnticos. Por ejemplo, los tres primeros esquemas de latabla son funcionalmente equivalentes si trabajo se analiza a nivel ordinal. El orden de las categoras esidntico en estos esquemas. El esquema D, por otra parte, invierte las categoras segunda y tercera ygenerar resultados diferentes de los de los otros esquemas.

Aunque muchos esquemas de codificacin de una variable son funcionalmente equivalentes, se prefierenaquellos esquemas con pequeas diferencias entre los cdigos, ya que los cdigos afectan a la cantidad deresultados que genera un procedimiento. Todas las categoras codificadas con valores entre 1 y el mximodefinido por el usuario son vlidas. Si alguna de estas categoras est vaca, las cuantificacionescorrespondientes sern valores perdidos del sistema o 0, dependiendo del procedimiento. Aunqueninguna de estas asignaciones afecta a los anlisis, se generarn los resultados correspondientes a estascategoras. Por tanto, para el esquema B, trabajo tiene cuatro categoras que reciben valores perdidos delsistema. Para el esquema C, tambin hay cuatro categoras que reciben indicadores de valores perdidosdel sistema. Por el contrario, para el esquema A no hay ninguna cuantificacin de valores perdidos delsistema. El uso de nmeros enteros consecutivos como cdigos de las variables tratadas como nominalesu ordinales genera una cantidad mucho menor de resultados sin que stos se vean afectados.

Los esquemas de codificacin de las variables tratadas como numricas son mucho ms restringidos quecuando se trata de una variable ordinal. Para estas variables, las diferencias entre las categorasconsecutivas son importantes. La siguiente tabla muestra tres esquemas de codificacin para edad.

Tabla 3. Esquemas de codificacin alternativos para la edadCategora A B C

20 20 1 1

22 22 3 2

25 25 6 3

27 27 8 4

Toda recodificacin de las variables numricas debe conservar las diferencias entre las categoras. El usode los valores originales es un mtodo para asegurarse de la conservacin de las diferencias. Sinembargo, esto puede generar que muchas categoras tengan indicadores de valores perdidos del sistema.Por ejemplo, el esquema A utiliza los valores originales observados. Para todos los procedimientos decategoras salvo para el anlisis de correspondencias, el valor de categora mxima es 27 y el valor decategora mnimo se establece en 1. Las primeras 19 categoras estn vacas y reciben indicadores devalores perdidos del sistema. Los resultados pueden volverse rpidamente bastante engorrosos si lacategora mxima es mucho mayor que 1 y hay muchas categoras vacas entre 1 y el mximo.

Para reducir la cantidad de resultados, se puede aplicar una recodificacin. Sin embargo, en el casonumrico, la funcin Recodificacin automtica no se debe utilizar. La codificacin en enteros


consecutivos generar diferencias de 1 entre todas las categoras consecutivas y, por tanto, todas lascuantificaciones tendrn idntica separacin. Las caractersticas mtricas que se consideraban importantesal tratar una variable como numrica desaparecen al recodificarla mediante enteros consecutivos. Porejemplo, el esquema C de la tabla corresponde a la recodificacin automtica de edad. La diferencia entrelas categoras 22 y 25 ha cambiado de tres a uno y las cuantificaciones reflejarn esta ltima diferencia.

Un esquema de recodificacin alternativa que conserva las diferencias entre las categoras consiste enrestar el valor de la categora ms pequea a cada categora y sumar 1 a cada diferencia. El esquema Bsurge de esta transformacin. El valor de categora ms pequeo, 20, se ha restado a cada categora y sesumado 1 a cada resultado. Los cdigos transformados tienen un mnimo de 1 y todas las diferencias sonidnticas a los datos originales. El valor de categora mxima es ahora 8 y se eliminan todas lascuantificaciones de cero antes de la primera cuantificacin que no es cero. An as, las cuantificacionesque no son cero correspondientes a cada categora que resultan del esquema B son idnticas a lascuantificaciones del esquema A.

Qu procedimiento es el mejor para la aplicacin?Las tcnicas que se incluyen en cuatro de estos procedimientos (Anlisis de correspondencias, Anlisis decorrespondencias mltiple, Anlisis de componentes principales categrico y Anlisis de correlacincannica no lineal) corresponden al rea general del anlisis de datos multivariantes conocido comoreduccin de dimensiones. Es decir, las relaciones entre las variables se representan en un nmeropequeo de dimensiones (digamos, dos o tres) con tanta frecuencia como sea posible. Esto permitedescribir las estructuras o patrones de las relaciones que seran extremadamente difcil de descubrir consu riqueza y complejidad original. En las aplicaciones de investigacin de mercados, estas tcnicaspueden ser una forma de correlacin perceptual. Una importante ventaja de estos procedimientos es quese adaptan a los datos con diferentes niveles de escalamiento ptimo.

La regresin categrica describe la relacin entre una variable de respuesta categrica y una combinacinde predictores categricos. La influencia de cada predictor sobre la variable de respuesta la describe lacorrespondiente ponderacin de regresin. Como en los dems procedimientos, los datos se puedenanalizar con diferentes niveles de escalamiento ptimo.

El escalamiento multidimensional y el desplegamiento multidimensional describe las relaciones entreobjetos en un espacio conceptual de pocas dimensiones utilizando las proximidades entre los objetos.

A continuacin, se indican unas breves normas generales para cada uno de los procedimientos:v Utilice la regresin categrica para pronosticar los valores de una variable dependiente categrica a

partir de una combinacin de variables independientes categricas.v Utilice el anlisis de componentes principales categrico para tener en cuenta los patrones de variacin

de un nico conjunto de variables con varios tipos de niveles de escalamiento ptimos.v Utilice el anlisis de correlacin cannica no lineal para evaluar el grado de correlacin entre dos o

ms conjuntos de variables de varios tipos de niveles de escalamiento ptimo.v Utilice el anlisis de correspondencias para analizar tablas de contingencia bidimensionales o datos que

se puedan expresar como una tabla de doble clasificacin, como la preferencia por una u otra marca odatos de opcin sociomtricos.

v Utilice el anlisis de correspondencias mltiple para analizar una matriz de datos multivariantescategricos cuando no se est dispuesto a suponer que todas las variables se analizan a nivel nominal.

v Utilice el escalamiento multidimensional para analizar datos de proximidad para buscar unarepresentacin de un solo conjunto de los objetos en un espacio de pocas dimensiones.

v Utilice el desplegamiento multidimensional para analizar datos de proximidad para buscar unarepresentacin de dos conjuntos de los objetos en un espacio de pocas dimensiones.


Regresin categricaEl uso de la regresin categrica es especialmente adecuado cuando el objetivo del anlisis es pronosticaruna variable dependiente (de respuesta) a partir de un conjunto de variables (predictoras)independientes. Al igual que ocurre con todos los procedimientos de escalamiento ptimo, los valores deescala se asignan a cada categora de cada variable de manera que estos valores sean ptimos respecto ala regresin. La solucin de una regresin categrica maximiza la correlacin de los cuadrados entre larespuesta transformada y la combinacin ponderada de los predictores transformados.

Relacin con otros procedimientos de categoras. La regresin categrica con escalamiento ptimo sepuede comparar con el anlisis de correlacin cannica mediante escalamiento ptimo con dos conjuntos,uno de los cuales slo contiene la variable dependiente. En esta ltima tcnica, la similitud de losconjuntos se determina mediante la comparacin de cada conjunto con una variable desconocida que seencuentra en algn sitio entre todos los conjuntos. En la regresin categrica, la similitud de la respuestatransformada y la combinacin lineal de los predictores transformados se evala directamente.

Relacin con las tcnicas estndar. En la regresin lineal estndar, las variables categricas se puedenrecodificar como variables indicadoras o se pueden tratar de la misma manera que las variables de nivelde intervalo. En el primer mtodo, el modelo contiene una inclinacin y una interseccin diferentes paracada combinacin de los niveles de las variables categricas. Esto implica que es necesario interpretar ungran nmero de parmetros. En el segundo enfoque, slo se estima un parmetro para cada variable. Sinembargo, la naturaleza arbitraria de las codificaciones de categoras hace imposibles las generalizaciones.

Si algunas de las variables no son continuas, habr disponibles anlisis alternativos. Si la respuesta escontinua y los predictores son categricos, se suele utilizar el anlisis de la varianza. Si la respuesta escategrica y los predictores son continuos, puede que sean adecuados el anlisis discriminante o laregresin logstica. Si la respuesta y los predictores son ambos categricos, se suelen utilizar modelosloglineales.

La regresin con el escalamiento ptimo ofrece tres niveles de escalamiento para cada variable. Lascombinaciones de estos niveles pueden tener en cuenta una gran variedad de relaciones no lineales paralas que cualquier mtodo "estndar" no se adapte bien. Por tanto, el escalamiento ptimo ofrece unamayor flexibilidad que los enfoques estndar con una mnima complejidad adicional.

Adems, las transformaciones no lineales de los predictores suelen reducir las dependencias entre lospredictores. Si compara los autovalores de la matriz de correlaciones de los predictores con losautovalores de la matriz de correlaciones de los predictores escalados ptimamente, este ltimo conjuntonormalmente ser menos variable que el anterior. Dicho de otra manera, en la regresin categrica, elescalamiento ptimo hace que los autovalores mayores de la matriz de correlaciones de los predictoressean ms pequeos y que los autovalores ms pequeos sean ms grandes.

Anlisis de componentes principales categricoEl uso del anlisis de componentes principales categrico es especialmente adecuado cuando se deseatener en cuenta los patrones de variacin de un nico conjunto de variables con varios tipos de nivelesde escalamiento ptimos. Esta tcnica intenta reducir la dimensionalidad de un conjunto de variables almismo tiempo que tiene en cuenta toda la variacin que sea posible. Se asignan valores de escala a cadacategora de cada variable de manera que estos valores sean ptimos respecto a la solucin decomponentes principales. Los objetos del anlisis reciben puntuaciones de componentes en funcin de losdatos cuantificados. Los grficos de las puntuaciones de componentes revelan los patrones de los objetosdel anlisis y pueden revelar objetos poco habituales en los datos. La solucin de un anlisis decomponentes principales categrico maximiza las correlaciones de las puntuaciones de objetos con cadauna de las variables cuantificadas para el nmero de componentes (dimensiones) especificado.

Una aplicacin importante de los componentes principales categricos es el estudio de los datos depreferencias, en el que los encuestados clasifican o evalan un nmero de elementos de acuerdo con suspreferencias. En la configuracin de datos de IBM SPSS Statistics habitual, las filas son individuos, las


columnas son mediciones de los elementos y las puntuaciones a travs de las filas son puntuaciones depreferencias (en una escala de 0 a 10, por ejemplo), lo que hace que los datos sean condicionales respectoa las filas. Para los datos de preferencias, es posible que quiera tratar a los individuos como variables.Mediante el procedimiento Transponer, puede transponer los datos. Los evaluadores se convierten en lasvariables y todas las variables se declaran como ordinales. No hay ningn problema en utilizar msvariables que objetos en CATPCA.

Relacin con otros procedimientos de categoras. Si todas las variables se declaran como nominalesmltiples, el anlisis de componentes principales categrico produce un anlisis equivalente a un anlisisde correspondencias mltiple ejecutado sobre las mismas variables. Por tanto, el anlisis de componentesprincipales categrico se puede considerar como un tipo de anlisis de correspondencias mltiple en elque algunas de las variables se declaran como ordinales o numricas.

Relacin con las tcnicas estndar. Si todas las variables se escalan a nivel numrico, el anlisis decomponentes principales categrico es equivalente al anlisis de componentes principales estndar.

De manera ms general, el anlisis de componentes principales categricos es una alternativa al clculode las correlaciones entre las escalas no numricas y su anlisis mediante un enfoque de anlisis defactores o de componentes principales estndar. El uso simplista del coeficiente de correlacin de Pearsonhabitual como medida de la asociacin de los datos ordinales puede llevar a un sesgo de importancia a lahora de estimar las correlaciones.

Anlisis de correlacin cannica no linealEl anlisis de correlacin cannica no lineal es un procedimiento muy general con numerosas aplicacionesdiferentes. El objetivo del anlisis de correlacin cannica no lineal es analizar las relaciones existentesentre dos o ms conjuntos de variables en vez de entre las propias variables, como ocurre en el anlisisde componentes principales. Por ejemplo, imaginemos que tiene dos conjuntos de variables, donde unconjunto de variables pueden contener elementos de informacin demogrfica general en un conjunto deencuestados, mientras que un segundo puede contener las respuestas a un conjunto de elementos deactitud. Los niveles de escalamiento del anlisis pueden ser cualquier combinacin de nominal, ordinal ynumrico. El anlisis de correlacin cannica mediante escalamiento ptimo determina la similitudexistente entre los conjuntos mediante la comparacin de manera simultnea de las variables cannicasde cada conjunto con un conjunto de puntuaciones de compromiso asignadas a los objetos.

Relacin con otros procedimientos de categoras. Si hay dos o ms conjuntos de variables connicamente una variable por conjunto, el anlisis de correlacin cannica mediante escalamiento ptimoes equivalente al anlisis de componentes principales mediante escalamiento ptimo. Si todas lasvariables en un anlisis de una variable por conjunto son nominales mltiples, el anlisis de correlacincannica mediante escalamiento ptimo es equivalente al anlisis de correspondencias mltiple. Si haydos conjuntos de variables, uno de los cuales contiene nicamente una variable, el anlisis de correlacincannica categrica mediante escalamiento ptimo es equivalente a una regresin categrica medianteescalamiento ptimo.

Relacin con las tcnicas estndar. El anlisis de correlacin cannica estndar es una tcnica estadsticaque busca una combinacin lineal de un conjunto de variables y una combinacin lineal de un segundoconjunto de variables de correlacin mxima. Dado este conjunto de combinaciones lineales, el anlisis decorrelacin cannica puede buscar otros conjuntos independientes de combinaciones lineales, a los que sedenominan variables cannicas, hasta un nmero mximo que es igual que el nmero de variables delconjunto ms pequeo.

Si hay dos conjuntos de variables en el anlisis y todas las variables se definen como numricas, elanlisis de correlacin cannica mediante escalamiento ptimo es equivalente a un anlisis de correlacincannica estndar. Aunque IBM SPSS Statistics no tiene un procedimiento de anlisis de correlacincannica, muchos de los estadsticos pertinentes se pueden obtener mediante un anlisis multivariante dela varianza.


El anlisis de correlacin cannica mediante escalamiento ptimo tiene otras aplicaciones. Si tiene dosconjuntos de variables y uno de los conjuntos contiene una variable nominal declarada como nominalsimple, los resultados del anlisis de correlacin cannica mediante escalamiento ptimo se puedeninterpretar de manera similar al anlisis de regresin. Si considera que la variable es nominal mltiple, elanlisis mediante escalamiento ptimo es una alternativa al anlisis discriminante. La agrupacin de lasvariables en ms de dos conjuntos proporciona varias maneras de analizar los datos.

Anlisis de correspondenciasEl objetivo del anlisis de correspondencias es hacer grficos de dispersin biespacial para las tablas decorrespondencias. En una tabla de correspondencias, las variables de filas y de columnas se supone querepresentan categoras desordenadas; por tanto, se utiliza siempre el nivel de escalamiento ptimonominal. Slo se examina la informacin nominal de ambas variables. Es decir, la nica consideracin esel hecho de que algunos objetos se encuentran en la misma categora, mientras que otros no. No se haceninguna suposicin acerca de la distancia o el orden entre las categoras de la misma variable.

Un uso especfico del anlisis de correspondencias es el anlisis de las tablas de contingenciabidimensionales. Si una tabla tiene r filas activas y c columnas activas, el nmero de dimensiones de lasolucin de anlisis de correspondencias es el mnimo de r menos 1 o c menos 1, el que sea inferior.Dicho de otra manera, puede representar perfectamente las categoras de fila o las categoras de columnade una tabla de contingencia en un espacio de dimensiones. En lo que se refiere a la prctica, sinembargo, resulta preferible representar las categoras de fila y de columna de una tabla bidimensional enun espacio de pocas dimensiones, por ejemplo de dos dimensiones, ya que los grficos bidimensionalesson de ms fcil comprensin que las representaciones espaciales multidimensionales.

Cuando se utiliza un nmero menor que el nmero mximo de dimensiones posibles, los estadsticosgenerados por el anlisis describen la bondad con la que se representan las categoras de fila y decolumna en la representacin de pocas dimensiones. Siempre que la calidad de la representacin de lasolucin de dos dimensiones sea buena, puede examinar los grficos de los puntos de fila y de los puntosde columna para conocer las categoras de la variable de fila que son similares, las categoras de lavariable de columna que son similares y las categoras de fila y de columna que son similares entre s.

Relacin con otros procedimientos de categoras. El anlisis de correspondencias simple se limita a lastablas bidimensional. Si hay ms de dos variables de inters, puede combinar las variables para crearvariables de interaccin. Por ejemplo, para las variables regin, trabajo y edad, puede combinar regin ytrabajo para crear una nueva variable retrabajo con las 12 categoras que aparecen en la siguiente tabla.Esta nueva variable forma una tabla bidimensional con edad (12 filas, 4 columnas), que se pueden analizaren el anlisis de correspondencias.

Tabla 4. Combinaciones de regin y trabajoCdigo de categora Definicin de categora Cdigo de categora Definicin de categora

1 Norte, trabajador en prcticas 7 Este, trabajador en prcticas

2 Norte, vendedor 8 Este, vendedor

3 Norte, administrador 9 Este, administrador

4 Sur, trabajador en prcticas 10 Oeste, trabajador en prcticas

5 Sur, vendedor 11 Oeste, vendedor

6 Sur, administrador 12 Oeste, administrador

Un defecto de este enfoque es que se puede combinar cualquier par de variables. Podemos combinartrabajo y edad, lo que generara otra variable de 12 categoras. Tambin podemos combinar regin y edad, loque generara una nueva variable de 16 categoras. Cada una de estas variables de interaccin forma unatabla bidimensional con la variable restante. El anlisis de correspondencias de estas tres tablas nogenerar resultados idnticos, aunque cada uno de los enfoques es vlido. Adems, si hay cuatro o msvariables, se pueden generar las tablas bidimensionales que comparen una variable de interaccin con


otra variable de interaccin. El nmero de posibles tablas que se pueden analizar puede ser bastantegrande, incluso cuando hay pocas variables. Puede seleccionar una de estas tablas para analizarla opuede analizarlas todas. Otra posibilidad consiste en utilizar el procedimiento Anlisis decorrespondencias mltiple para examinar todas las variables simultneamente sin que sea necesario crearvariables de interaccin.

Relacin con las tcnicas estndar. El procedimiento Tablas cruzadas tambin se puede utilizar paraanalizar tablas de contingencia, con independencia como un enfoque comn en los anlisis. Sin embargo,incluso en las tablas pequeas, la deteccin de las desviaciones de la independencia puede ser difcil. Lautilidad del anlisis de correspondencias reside en la presentacin de tales patrones para tablasbidimensionales de cualquier tamao. Si hay una asociacin entre las variables de fila y de columna (esdecir, el valor de chi-cuadrado es significativo) el anlisis de correspondencias puede ayudar a revelar lanaturaleza de la relacin.

Anlisis de correspondencias mltipleEl anlisis de correspondencias mltiple intenta generar una solucin en la que los objetos de la mismacategora se representan cerca los unos de los otros y los objetos de categoras diferentes se representanalejados los unos de los otros. Cada objeto se encuentra lo ms cerca posible de los puntos de categorapara las categoras que se aplican a dicho objeto. De esta manera, las categoras dividen los objetos ensubgrupos homogneos. Las variables se consideran homogneas cuando clasifican objetos de las mismascategoras en los mismos subgrupos.

Para una solucin de una sola dimensin, el anlisis de correspondencias mltiple asigna valores deescala ptimos (cuantificaciones de las categoras) a cada categora de cada variable de forma que engeneral, como media, las categoras tengan una mxima dispersin. Para una solucin de dosdimensiones, el anlisis de correspondencias mltiple busca un segundo conjunto de cuantificaciones delas categoras de cada variable no relacionada con el primer conjunto, volviendo a intentar maximizar ladispersin y as sucesivamente. Como las categoras de una variable reciben tantas puntuaciones comodimensiones haya, se supone que las variables del anlisis son nominales mltiples en el nivel deescalamiento ptimo.

El anlisis de correspondencias mltiple tambin asigna puntuaciones a los objetos del anlisis de maneraque las cuantificaciones de las categoras son los promedios, o los centroides, de las puntuaciones de losobjetos de dicha categora.

Relacin con otros procedimientos de categoras. El anlisis de correspondencias mltiple tambin seconoce como anlisis de homogeneidad o escalamiento dual. Proporciona resultados comparables, perono idnticos, al anlisis de correspondencias cuando hay slo dos variables. El anlisis decorrespondencias genera resultados exclusivos que resumen el ajuste y la calidad de la representacin dela solucin, incluida la informacin sobre la estabilidad. Por tanto, el anlisis de correspondenciashabitualmente resulta preferible al anlisis de correspondencias mltiple en el caso de dos variables. Otradiferencia entre los dos procedimientos es que la entrada al anlisis de correspondencias mltiple es unamatriz de datos, donde las filas son objetos y las columnas son variables, mientras que la entrada alanlisis de correspondencias puede ser la misma matriz de datos, una matriz de proximidades general ouna tabla de contingencia conjunta, que es una matriz agregada en la que tanto las filas como lascolumnas representan categoras de variables. El anlisis de correspondencias mltiple tambin se puedeconsiderar como un anlisis de componentes principales de datos escalados al nivel nominal mltiple.

Relacin con las tcnicas estndar. El anlisis de correspondencias mltiple se puede considerar como elanlisis de una tabla de contingencia de varios factores. Las tablas de contingencia de varios factorestambin se pueden analizar con el procedimiento Tablas cruzadas, pero Tablas cruzadas proporcionaestadsticos de resumen independientes para cada categora de cada variable de control. Con el anlisisde correspondencias mltiple, con frecuencia es posible resumir la relacin entre todas las variables conun nico grfico bidimensional. Un uso avanzado del anlisis de correspondencias mltiple es sustituirlos valores originales de la categora por los valores de la escala ptimos de la primera dimensin y


realizar un anlisis multivariante secundario. Ya que el anlisis de correspondencias mltiple sustituye lasetiquetas de categora por valores de escala numricos, se pueden aplicar muchos procedimientosdiferentes que requieren datos numricos tras el anlisis de correspondencias mltiple. Por ejemplo, elprocedimiento Anlisis factorial produce un primer componente principal que es equivalente a la primeradimensin del anlisis de correspondencias mltiple. Las puntuaciones de los componentes de la primeradimensin son iguales que las puntuaciones de los objetos y las cargas en componentes al cuadrado soniguales que las medidas de discriminacin. La segunda dimensin del anlisis de correspondenciasmltiple, sin embargo, no es igual que la segunda dimensin del anlisis factorial.

Escalamiento multidimensionalEl uso del escalamiento multidimensional es especialmente apropiado cuando el objetivo del anlisis esbuscar la estructura de un conjunto de medidas de distancia entre un solo conjunto de objetos o casos.Esto se logra asignando las observaciones a posiciones especficas en un espacio conceptual de pocasdimensiones, de modo que las distancias entre los puntos en el espacio concuerden al mximo con lassimilaridades (o disimilaridades) dadas. El resultado es una representacin de mnimos cuadrados de losobjetos en dicho espacio de pocas dimensiones que, en muchos casos, le ayudar a entender mejor losdatos.

Relacin con otros procedimientos de categoras. Cuando tiene datos multivariantes a partir de los quese crean distancias y, a continuacin, los analiza con el escalamiento multidimensional, los resultados sonsimilares al anlisis de los datos mediante el anlisis de componentes principales categricos con lanormalizacin principal de objetos. Este tipo de PCA tambin se conoce como anlisis de coordenadasprincipales.

Relacin con las tcnicas estndar. El procedimiento Escalamiento multidimensional (PROXSCAL) decategoras ofrece varias mejoras sobre el procedimiento de escalamiento disponible en la opcinEstadsticas bsicas (ALSCAL). PROXSCAL ofrece un algoritmo acelerado para ciertos modelos y permitecolocar restricciones en el espacio comn. Adems, PROXSCAL intenta minimizar el estrs brutonormalizado, en vez del S-stress (tambin denominado tensin). El estrs bruto normalizado se prefiereen general ya que es una medida basada en las distancias, mientras que el S-stress se basa en loscuadrados de las distancias.

Desplegamiento multidimensionalEl uso del desplegamiento multidimensional es especialmente apropiado cuando el objetivo del anlisises buscar la estructura de un conjunto de medidas de distancia entre dos conjuntos de objetos(denominados objetos de fila y de columna). Esto se logra asignando las observaciones a posicionesespecficas en un espacio conceptual de pocas dimensiones, de modo que las distancias entre los puntosen el espacio concuerden al mximo con las similaridades (o disimilaridades) dadas. El resultado es unarepresentacin de mnimos cuadrados de los objetos de fila y de columna en dicho espacio de pocasdimensiones que, en muchos casos, le ayudar a entender mejor los datos.

Relacin con otros procedimientos de categoras. Si los datos constan de distancias entre un nicoconjunto de objetos (una matriz simtrica cuadrada), utilice Escalamiento multidimensional.

Relacin con las tcnicas estndar. El procedimiento Desplegamiento multidimensional (PREFSCAL) decategoras ofrece varias mejoras sobre la funcionalidad de desplegamiento disponible en la opcinEstadsticas bsicas (a travs de ALSCAL). PREFSCAL permite colocar restricciones en el espacio comn;es ms, PREFSCAL intenta minimizar una medida de estrs penalizado que le ayuda a evitar lassoluciones degeneradas (a las que los algoritmos antiguos son propensos).


Relacin de aspecto en grficos de escalamiento ptimoLa relacin de aspecto en los grficos de escalamiento ptimo es istropa. En un grfico bidimensional, ladistancia que representa una unidad en la dimensin 1 es igual que la distancia que representa unaunidad en la dimensin 2. Si cambia el rango de una dimensin en un diagrama bidimensional, elsistema cambiar el tamao de la otra dimensin para mantener iguales las distancias fsicas. La relacinde aspecto istropa no se puede omitir para los procedimientos de escalamiento ptimo.


Captulo 2. Regresin categrica (CATREG)La regresin categrica cuantifica los datos categricos mediante la asignacin de valores numricos a lascategoras, obtenindose una ecuacin de regresin lineal ptima para las variables transformadas. Laregresin categrica se conoce tambin por el acrnimo CATREG, del ingls categorical regression(regresin categrica).

El anlisis de regresin lineal ordinario implica minimizar las diferencias de la suma de los cuadradosentre una variable de respuesta (la dependiente) y una combinacin ponderada de las variablespredictoras (las independientes). Las variables son normalmente cuantitativas, con los datos categricos(nominales) recodificados como variables binarias o de contraste. Como resultado, las variablescategricas sirven para separar grupos de casos y la tcnica estima conjuntos separados de parmetrospara cada grupo. Los coeficientes estimados reflejan cmo los cambios en los predictores afectan a larespuesta. El prediccin de la respuesta es posible para cualquier combinacin de los valores predictores.

Un mtodo alternativo incluye la regresin de la respuesta respecto a los propios valores predictorescategricos. Como consecuencia, se estima un coeficiente para cada variable. Sin embargo, para lasvariables categricas, los valores categricos son arbitrarios. La codificacin de las categoras de diferentesmaneras proporciona diferentes coeficientes, dificultando las comparaciones entre los anlisis de lasmismas variables.

CATREG ampla el mtodo estndar mediante un escalamiento de las variables nominales, ordinales ynumricas simultneamente. El procedimiento cuantifica las variables categricas de manera que lascuantificaciones reflejen las caractersticas de las categoras originales. El procedimiento trata a lasvariables categricas cuantificadas como si fueran variables numricas. La utilizacin de transformacionesno lineales permite a las variables ser analizadas en varios niveles para encontrar el modelo que ms seajusta.

Ejemplo. La regresin categrica se puede utilizar para describir cmo la satisfaccin laboral depende dela categora laboral, de la regin geogrfica y del nmero de desplazamientos. Observar que los nivelesms altos de satisfaccin corresponden a ejecutivos y a un nmero bajo de desplazamientos. La ecuacinde regresin resultante se puede utilizar para pronosticar la satisfaccin laboral para cualquiercombinacin de las tres variables independientes.

Estadsticos y grficos. Frecuencias, coeficientes de regresin, tabla ANOVA, historial de iteraciones,cuantificaciones de categoras, correlaciones entre predictores no transformados, correlaciones entrepredictores transformados, grficos de residuos y grficos de transformacin.

Regresin categrica: Consideraciones sobre los datos

Datos. CATREG trabaja con variables indicadoras de categoras. Los indicadores de las categoras debenser enteros positivos. Puede utilizar el cuadro de dilogo Discretizacin para convertir variables convalores fraccionarios y variables de cadena en enteros positivos.

Supuestos. Slo se permite una variable de respuesta, pero el nmero mximo de predictores es 200. Losdatos deben contener al menos tres casos vlidos y el nmero de casos vlidos debe ser superior alnmero de variables predictoras ms uno.

Procedimientos relacionados. CATREG es equivalente al anlisis de correlacin cannica categricomediante escalamiento ptimo (OVERALS) con dos conjuntos, uno de los cuales contiene slo unavariable. Si se escalan todas las variables a nivel numrico, el anlisis se corresponder con el anlisis deregresin mltiple estndar.


Para obtener una regresin categrica1. Seleccione en los mens:

Analizar > Regresin > Escalamiento ptimo (CATREG)...2. Seleccione la variable dependiente y la variable o variables independientes.3. Pulse en Aceptar.

Si lo desea, cambie el nivel de escalamiento de cada variable.

Para definir la escala en regresin categricaSe puede definir el nivel de escalamiento ptimo de las variables dependientes e independientes. Deforma predeterminada, se escalan como lneasSp (ordinales) monotnicas de segundo orden con dosnudos interiores. Asimismo, se puede definir la ponderacin para las variables del anlisis.

Nivel de escalamiento ptimo. Tambin se puede seleccionar el nivel de escalamiento para cuantificarcada variable.v Spline ordinal. El orden de las categoras de la variable observada se conserva en la variable escalada

ptimamente. Los puntos de categora estarn sobre una recta (vector) que pasa por el origen. Latransformacin resultante es un polinomio monotnico por tramos suave del orden seleccionado. Laspartes se especifican por el nmero de nudos interiores definido por el usuario y su posicin esdeterminada por el procedimiento en funcin del nmero de nudos interiores.

v Spline nominal. La nica informacin de la variable observada que se conserva en la variableescalada ptimamente es la agrupacin de los objetos en categoras. No se conserva el orden de lascategoras de la variable observada. Los puntos de categora estarn sobre una recta (vector) que pasapor el origen. La transformacin resultante es un polinomio, posiblemente monotnico, por tramossuave del orden seleccionado. Las partes se especifican por el nmero de nudos interiores definido porel usuario y su posicin es determinada por el procedimiento en funcin del nmero de nudosinteriores.

v Ordinal. El orden de las categoras de la variable observada se conserva en la variable escaladaptimamente. Los puntos de categora estarn sobre una recta (vector) que pasa por el origen. Latransformacin resultante se ajusta mejor que la transformacin de spline ordinal pero la suavidad esmenor.

v Nominal. La nica informacin de la variable observada que se conserva en la variable escaladaptimamente es la agrupacin de los objetos en categoras. No se conserva el orden de las categoras dela variable observada. Los puntos de categora estarn sobre una recta (vector) que pasa por el origen.La transformacin resultante se ajusta mejor que la transformacin de spline nominal pero la suavidades menor.

v Numrico. Las categoras se tratan como que estn ordenadas y espaciadas uniformemente (a nivel deintervalo). El orden de las categoras y la equidistancia entre los nmeros de las categoras de lavariable observada se conservan en la variable escalada ptimamente. Los puntos de categora estarnsobre una recta (vector) que pasa por el origen. Cuando todas las variables estn a nivel numrico, elanlisis es anlogo al anlisis de componentes principales estndar.

Discretizacin de regresin categricaEl cuadro de dilogo Discretizacin permite seleccionar un mtodo para recodificar las variables. Lasvariables con valores fraccionarios se agrupan en siete categoras (o en el nmero de valores distintos dela variable si dicho nmero es inferior a siete) con una distribucin aproximadamente normal, si no seespecifica lo contrario. Las variables de cadena se convierten siempre en enteros positivos mediante laasignacin de indicadores de categora en funcin del orden alfanumrico ascendente. La discretizacinde las variables de cadena se aplica a estos enteros resultantes. De forma predeterminada, las variablesrestantes se dejan inalteradas. A partir de ese momento, se utilizan en el anlisis las variablesdiscretizadas.


Mtodo. Seleccione entre agrupacin, clasificacin y multiplicacin.v Agrupacin. Se recodifica en un nmero especificado de categoras o se recodifica por intervalos.v Clasificacin. La variable se discretiza mediante la clasificacin de los casos.v Multiplicacin. Los valores actuales de la variable se tipifican, multiplican por 10, redondean y se les

suma una constante de manera que el menor valor discretizado sea 1.

Agrupacin. Se encuentran disponibles las siguientes opciones al discretizar variables por agrupacin:v Nmero de categoras. Especifique un nmero de categoras y si los valores de la variable deben

seguir una distribucin aproximadamente normal o uniforme en dichas categoras.v Intervalos iguales. Las variables se recodifican en las categoras definidas por dichos intervalos de

igual tamao. Se debe especificar la longitud de los intervalos.

Valores perdidos de regresin categricaEl cuadro de dilogo Valores perdidos permite seleccionar la estrategia para el tratamiento de los valoresperdidos en las variables de anlisis y las suplementarias.

Estrategia. Seleccione excluir los objetos con valores perdidos (eliminacin por lista) o imputar los valoresperdidos (tratamiento activo).v Excluir objetos con valores perdidos en esta variable. Los objetos con valores perdidos en la variable

seleccionada se excluyen del anlisis. Esta estrategia no est disponible para las variablessuplementarias.

v Imputar valores perdidos. Los objetos con valores perdidos en la variable seleccionada tendrn dichosvalores imputados. Se puede seleccionar el mtodo de imputacin. Seleccione Moda para reemplazarlos valores perdidos por la categora ms frecuente. Cuando existen varias modas, se utiliza la quetiene el indicador de categora ms pequeo. Seleccione Categora adicional para reemplazar losvalores perdidos con la misma cuantificacin de una categora adicional. Esto implica que los objetoscon un valor perdido en esta variable se consideran que pertenecen a la misma categora (la adicional).

Opciones de regresin categricaEl cuadro de dilogo Opciones permite seleccionar el estilo para la configuracin inicial, especificar loscriterios de iteracin y convergencia, seleccionar los objetos suplementarios y definir el etiquetado de losgrficos.

Objetos suplementarios. Permite especificar los objetos que se tratarn como suplementarios. Slo hayque escribir el nmero de un objeto suplementario (o especificar un intervalo de casos) y pulsar enAadir. No es posible ponderar los objetos suplementarios (se ignoran las ponderaciones especificadas).

Configuracin inicial. Si no se trata ninguna variable como nominal, seleccione la configuracinNumrica. Si al menos una variable se trata como nominal, seleccione la configuracin Aleatoria.

Adems, si al menos una variable tiene un nivel de escalamiento ordinal o spline ordinal, el algoritmonormal de ajuste de modelo puede dar lugar a una solucin inferior a la ptima. Si selecciona Mltiplesinicios sistemticos con todos los patrones de signos de prueba posibles siempre encontrar la solucinptima, pero el tiempo de procesamiento necesario aumentar rpidamente, al aumentar el nmero devariables ordinales y de spline ordinal del conjunto de datos. Puede reducir el nmero de patrones deprueba especificando un porcentaje de prdida de umbral de varianza, donde mientras mayor sea elumbral, ms patrones de signos se excluirn. Con esta opcin, no se garantiza obtener la solucin ptima,pero se reduce la posibilidad de obtener una solucin que no sea ptima. Adems, si no se encuentra lasolucin ptima, disminuye la posibilidad de que la solucin encontrada sea muy diferente de la solucinptima. Cuando se solicitan mltiples inicios sistemticos, los signos de los coeficientes de regresin paracada inicio se escriben en un archivo de datos de IBM SPSS Statistics externo en la sesin actual. Consulteel tema Regresin categrica: Guardar en la pgina 17 para obtener ms informacin.

Captulo 2. Regresin categrica (CATREG) 15

Los resultados de una ejecucin anterior con mltiples inicios sistemticos le permiten Utilizar signosfijos para los coeficientes de regresin. Los signos (indicados por 1 y -1) deben estar en una fila delconjunto de datos o archivo especificado. El nmero de inicio de valor entero representa el nmero decaso de la fila de este archivo que contiene los signos que se utilizarn.

Criterios. Se puede especificar el nmero mximo de iteraciones que la regresin puede realizar durantelos clculos. Tambin puede seleccionar un valor para el criterio de convergencia. La regresin detiene laiteracin si la diferencia del ajuste total entre la dos ltimas iteraciones es menor que el valor deconvergencia o si se ha alcanzado el nmero mximo de iteraciones.

Etiquetar grficos con. Permite especificar si se utilizarn en los grficos las etiquetas de variable y lasetiquetas de valor o los nombres de variable y los valores. Tambin se puede especificar una longitudmxima para las etiquetas.

Regularizacin de regresin categricaMtodo. Los mtodos de regularizacin pueden mejorar el error predictivo del modelo reduciendo lavariabilidad de las estimaciones de coeficiente de regresin reduciendo las estimaciones hacia 0. Lazo yRed elstica reducen algunas estimaciones de coeficientes a exactamente 0, ofreciendo as una forma deseleccin de variables. Cuando se solicita un mtodo de regularizacin, el modelo y los coeficientesregularizados para cada valor de coeficiente de penalizacin se escriben en un archivo o conjunto dedatos de IBM SPSS Statistics externo en la sesin actual. Consulte el tema Regresin categrica:Guardar en la pgina 17 para obtener ms informacin.v Regresin Ridge. La regresin Ridge reduce los coeficientes introduciendo un trmino de penalizacin

igual a la suma de coeficientes cuadrados por un coeficiente de penalizacin. Este coeficiente puedevariar de 0 (sin penalizacin) a 1; el procedimiento buscar el "mejor" valor de penalizacin siespecifica un rango e incremento.

v Lazo. El trmino de penalizacin de Lazo se basa en la suma de coeficientes absolutos y laespecificacin de un coeficiente de penalizacin es similar al de la regresin Ridge; sin embargo, Lazosupone un procesamiento ms extenso.

v Red elstica. La Red elstica simplemente combina las penalizaciones de Lazo y regresin Ridge, ybuscar en la cuadrcula de valores especificada para encontrar los "mejores" coeficientes depenalizacin de Lazo y de regresin Ridge. En un par concreto de penalizaciones de Lazo y regresinRidge, la red elstica no requiere mucho ms procesamiento que Lazo.

Grficos de regularizacin de visualizacin. Son grficos de los coeficientes de regresin en comparacincon la penalizacin de regularizacin. Cuando busque un rango de valores para el "mejor" coeficiente depenalizacin, ofrecer una vista de la forma en que los coeficientes cambian en dicho rango.

Grficos de red elstica. En el mtodo de Red elstica se producen grficos de regularizacin distintosmediante los valores de la penalizacin de regresin Ridge. Todos los grficos posibles utiliza todos losvalores del rango determinados por los valores mnimo y mximo especificados de penalizacin deregresin Ridge. Para algunas penalizaciones de r. contrada le permite especificar un subconjunto devalores en el rango determinado por el mnimo y el mximo. Slo hay que escribir el nmero de un valorde penalizacin (o especificar un rango de valores) y pulsar en Aadir.

Resultados de la regresin categricaEl cuadro de dilogo Resultados permite seleccionar los estadsticos que aparecern en los resultados.

Tablas. Genera tablas correspondientes a:v R mltiple. Incluye R 2, R 2 corregida y R 2 corregida que tiene en cuenta el escalamiento ptimo.


v ANOVA. Esta opcin incluye las sumas de cuadrados de la regresin y de los residuos, las mediascuadrticas y F. Se muestran dos tablas de ANOVA: una con tantos grados de libertad para laregresin como predictores haya y otra con los grados de libertad de la regresin teniendo en cuenta elescalamiento ptimo.

v Coeficientes. Esta opcin produce tres tablas: una tabla de coeficientes que incluye betas, errorestndar de las betas, valores t y significacin; una tabla de escalamiento ptimo de coeficientes con elerror estndar de las betas que tiene en cuenta los grados de libertad del escalamiento ptimo; y unatabla con las correlaciones de orden cero, parciales y semiparciales, la medida de importancia relativade Pratt de los predictores transformados y la tolerancia antes y despus de la transformacin.

v Historial de iteraciones. Para cada iteracin, incluyendo los valores iniciales del algoritmo, aparecen laR mltiple y el error de la regresin. El incremento de la R mltiple aparece a partir de la primeraiteracin.

v Correlaciones de variables originales. Aparece una matriz que muestra las correlaciones entre lasvariables no transformadas.

v Correlaciones de variables transformadas. Aparece una matriz que muestra las correlaciones entre lasvariables transformadas.

v Coeficientes y modelos regularizados. Muestra valores de penalizacin, R cuadrado y los coeficientesde regresin de cada modelo regularizado. Si se especifica un mtodo de repeticin de muestreo o si seespecifican objetos suplementarios (casos de prueba), tambin mostrar el error de prediccin o MSEde prueba.

Repeticin de muestreo. Los mtodos de repeticin de muestreo le dan una estimacin del error deprediccin del modelo.v Validacin cruzada. La validacin cruzada divide la muestra en un nmero de submuestras o

pliegues. A continuacin, se generan los modelos de regresin categrica, que no incluyen los datos decada submuestra. El primer modelo se basa en todos los casos excepto los correspondientes al primerpliegue de la muestra; el segundo modelo se basa en todos los casos excepto los del segundo plieguede la muestra y as sucesivamente. Para cada modelo se calcula el error de prediccin aplicando elmodelo a la submuestra que se excluy al generarse este.

v Bootstrap .632. Con la simulacin de muestreo, las observaciones se trazan aleatoriamente a partir delos datos con reposicin, repitiendo este proceso una serie de veces para obtener muestras desimulacin de muestreo. Se ajusta un modelo para cada muestra de simulacin de muestreo. El errorde prediccin de cada modelo se estima al aplicar el modelo ajustado a los casos que no se encuentranen la muestra de simulacin de muestreo.

Cuantificaciones de categoras. Aparecen tablas que muestran los valores transformados de las variablesseleccionadas.

Estadsticos descriptivos. Aparecen tablas que muestran las frecuencias, los valores perdidos y los modosde las variables seleccionadas.

Regresin categrica: GuardarEl cuadro de dilogo Guardar permite guardar valores pronosticados, residuos y valores transformadosen un conjunto de datos activo y/o guardar datos discretizados, valores transformados, modelos ycoeficientes regularizados y signos de coeficientes de regresin en un archivo de datos o conjunto dedatos de IBM SPSS Statistics externo en la sesin actual.v Los conjuntos de datos estn disponibles durante la sesin actual, pero no as en las sesiones

posteriores, a menos que los haya guardado explcitamente como archivos de datos. El nombre de unconjunto de datos debe cumplir las normas de denominacin de variables.

v Los nombres de archivo o de conjunto de datos deben ser distintos para cada tipo de dato guardado.

Los coeficientes y modelos regularizados se guardan siempre que se selecciona un mtodo deregularizacin en el cuadro de dilogo Regularizacin. De forma predeterminada, el procedimiento crea

Captulo 2. Regresin categrica (CATREG) 17

un nuevo conjunto de datos con un nombre exclusivo, aunque por supuesto podr especificar el nombreque desee seleccionando o escribiendo en un archivo externo.

Los signos de coeficientes de regresin se guardan siempre que se utilizan mltiples inicios sistemticoscomo configuracin inicial en el cuadro de dilogo Opciones. De forma predeterminada, el procedimientocrea un nuevo conjunto de datos con un nombre exclusivo, aunque por supuesto podr especificar elnombre que desee seleccionando o escribiendo en un archivo externo.

Grficos de transformacin en regresin categricaEl cuadro de dilogo Grficos permite especificar las variables que generarn grficos de transformaciny de residuos.

Grficos de transformacin. Para cada una de estas variables, se representan las cuantificaciones de lascategoras respecto a los valores de categora originales. Las categoras vacas aparecen en el ejehorizontal pero no afectan a los clculos. Estas categoras se identifican por los saltos en la lnea queconecta las cuantificaciones.

Grficos de residuos. Para cada una de estas variables, se representan los residuos (calculados para lavariable dependiente pronosticada de todos los predictores salvo del predictor en cuestin) respecto a losindicadores de las categoras y las cuantificaciones de las categoras ptimas multiplicadas por betarespecto a los indicadores de las categoras.

Caractersticas adicionales del comando CATREGSe puede personalizar la regresin categrica si se pegan las selecciones en una ventana de sintaxis y seedita la sintaxis del comando CATREG resultante. La sintaxis de comandos tambin le permite:v Especificar nombres de raz para las variables transformadas al guardarlas en el conjunto de datos

activo (con el subcomando SAVE).

Consulte la Referencia de sintaxis de comandos para obtener informacin completa de la sintaxis.


Captulo 3. Anlisis de componentes principales categrico(CATPCA)Este procedimiento cuantifica simultneamente las variables categricas a la vez que reduce ladimensionalidad de los datos. El anlisis de componentes principales categrico se conoce tambin por elacrnimo CATPCA, del ingls CATegorical Principal Components Analysis.

El objetivo de los anlisis de componentes principales es la reduccin de un conjunto original devariables en un conjunto ms pequeo de componentes no correlacionados que representen la mayorparte de la informacin encontrada en las variables originales. La tcnica es ms til cuando un extensonmero de variables impide una interpretacin eficaz de las relaciones entre los objetos (sujetos yunidades). Al reducir la dimensionalidad, se interpreta un pequeo nmero de componentes en lugar deun extenso nmero de variables.

El anlisis estndar de componentes principales asume relaciones lineales entre las variables numricas.Por otra parte, el mtodo de escalamiento ptimo permite escalar las variables a diferentes niveles. Lasvariables categricas se cuantifican de forma ptima en la dimensionalidad especificada. Como resultado,se pueden modelar relaciones no lineales entre las variables.

Ejemplo. El anlisis de componentes principales categrico se puede utilizar para representargrficamente la relacin entre la categora laboral, la divisin laboral, la provincia, el nmero dedesplazamientos (alto, medio y bajo) y la satisfaccin laboral. Observar que con dos dimensiones sepuede explicar una gran cantidad de varianza. La primera dimensin podra separar la categora laboralde la provincia, mientras que la segunda dimensin podra separar la divisin laboral del nmero dedesplazamientos. Tambin podr observar que la alta satisfaccin laboral est relacionada con un nmeromedio de desplazamientos.

Estadsticos y grficos. Frecuencias, valores perdidos, nivel de escalamiento ptimo, moda, varianzaexplicada por: las coordenadas del centroide, las coordenadas de vector, total por variable y total pordimensin; cargas en componentes para las variables cuantificadas por los vectores, cuantificaciones ycoordenadas de categora, historial de iteraciones, correlaciones entre las variables transformadas y losautovalores de la matriz de correlaciones, correlaciones entre las variables originales y los autovalores dela matriz de correlaciones, puntuaciones de objetos, grficos de categoras, grficos de categorasconjuntas, grficos de transformacin, grficos de residuos, grficos de centroides proyectados, grficosde objetos, diagramas de dispersin biespaciales, diagramas de dispersin triespaciales y grficos de lascargas en componentes.

Consideraciones sobre los datos del Anlisis de componentes principales categrico

Datos. Los valores de las variables de cadena se convierten en enteros positivos por orden alfabticoascendente. Los valores perdidos del usuario, los valores perdidos del sistema y los valores menores que1 se consideran valores perdidos; se puede aadir una constante o recodificar las variables con valoresinferiores a 1 para evitar que se pierdan los mismos.

Supuestos. Los datos deben contener al menos tres casos vlidos. El anlisis se basa en datos enterospositivos. La opcin de discretizacin categorizar de forma automtica una variable con valoresfraccionarios, agrupando sus valores en categoras con una distribucin casi normal y convertir deforma automtica los valores de las variables de cadena en enteros positivos. Se pueden especificar otrosesquemas de discretizacin.

Procedimientos relacionados. Si se escalan todas las variables a nivel numrico, el anlisis secorresponder con el anlisis de componentes principales estndar. Hay caractersticas de representacin


alternativas que estn disponibles si se utilizan las variables transformadas en un anlisis decomponentes principales lineal estndar. Si todas las variables tienen un nivel de escalamiento nominalmltiple, el anlisis de componentes principales categrico es idntico al anlisis de correspondenciasmltiple (HOMALS). Si hay conjuntos de variables que son de inters, se debe utilizar el anlisis decorrelacin cannica categrico (no lineal).

Para obtener un Anlisis de componentes principales categrico1. Seleccione en los mens:

Analizar > Reduccin de dimensiones > Escalamiento ptimo...2. Seleccione Alguna variable no es nominal mltiple.3. Seleccione Un conjunto.4. Pulse en Definir.5. Seleccione al menos dos variables de anlisis y especifique el nmero de dimensiones en la solucin.6. Pulse en Aceptar.

Si lo desea, puede especificar variables suplementarias, que sern ajustadas sobre la solucin encontrada,o variables de etiqueta para los grficos.

Definir escala y ponderacin en CATPCASe puede definir el nivel de escalamiento ptimo de las variables del anlisis y de las suplementarias. Deforma predeterminada, se escalan como lneasSp (ordinales) monotnicas de segundo orden con dosnudos interiores. Asimismo, se puede definir la ponderacin para las variables del anlisis.

Ponderacin de la variable. Se puede definir una ponderacin para cada variable. El valor especificadodebe ser un entero positivo. El valor predeterminado es 1.

Nivel de escalamiento ptimo. Asimismo, se puede seleccionar el nivel de escalamiento que se utilizarpara cuantificar cada variable.v Spline ordinal. El orden de las categoras de la variable observada se conserva en la variable escalada

ptimamente. Los puntos de categora estarn sobre una recta (vector) que pasa por el origen. Latransformacin resultante es un polinomio monotnico por tramos suave del orden seleccionado. Laspartes se especifican por el nmero de nudos interiores definido por el usuario y su posicin esdeterminada por el procedimiento en funcin del nmero de nudos interiores.

v Spline nominal. La nica informacin de la variable observada que se conserva en la variable escaladaptimamente es la agrupacin de los objetos en categoras. No se conserva el orden de las categoras dela variable observada. Los puntos de categora estarn sobre una recta (vector) que pasa por el origen.La transformacin resultante es un polinomio, posiblemente monotnico, por tramos suave del ordenseleccionado. Las partes se especifican por el nmero de nudos interiores definido por el usuario y suposicin es determinada por el procedimiento en funcin del nmero de nudos interiores.

v Nominal mltiple. La nica informacin de la variable observada que se conserva en la variableescalada ptimamente es la agrupacin de los objetos en categoras. No se conserva el orden de lascategoras de la variable observada. Los puntos de categora estarn en el centroide de los objetos paralas categoras particulares. El trmino Mltiple indica que se obtienen diferentes conjuntos decuantificaciones para cada dimensin.

v Ordinal. El orden de las categoras de la variable observada se conserva en la variable escaladaptimamente. Los puntos de categora estarn sobre una recta (vector) que pasa por el origen. Latransformacin resultante se ajusta mejor que la transformacin de spline ordinal pero la suavidad esmenor.

v Nominal. La nica informacin de la variable observada que se conserva en la variable escaladaptimamente es la agrupacin de los objetos en categoras. No se conserva el orden de las categoras de


la variable observada. Los puntos de categora estarn sobre una recta (vector) que pasa por el origen.La transformacin resultante se ajusta mejor que la transformacin de spline nominal pero la suavidades menor.

v Numrico. Las categoras se tratan como que estn ordenadas y espaciadas uniformemente (a nivel deintervalo). El orden de las categoras y la equidistancia entre los nmeros de las categoras de lavariable observada se conservan en la variable escalada ptimamente. Los puntos de categora estarnsobre una recta (vector) que pasa por el origen. Cuando todas las variables estn a nivel numrico, elanlisis es anlogo al anlisis de componentes principales estndar.

Anlisis de componentes principales categrico: DiscretizacinEl cuadro de dilogo Discretizacin permite seleccionar un mtodo para recodificar las variables. Lasvariables con valores fraccionarios se agrupan en siete categoras (o en el nmero de valores distintos dela variable si dicho nmero es inferior a siete) con una distribucin aproximadamente normal, si no seespecifica lo contrario. Las variables de cadena se convierten siempre en enteros positivos mediante laasignacin de indicadores de categora en funcin del orden alfanumrico ascendente. La discretizacinde las variables de cadena se aplica a estos enteros resultantes. De forma predeterminada, las variablesrestantes se dejan inalteradas. A partir de ese momento, se utilizan en el anlisis las variablesdiscretizadas.

Mtodo. Seleccione entre agrupacin, clasificacin y multiplicacin.v Agrupacin. Se recodifica en un nmero especificado de categoras o se recodifica por intervalos.v Clasificacin. La variable se discretiza mediante la clasificacin de los casos.v Multiplicacin. Los valores actuales de la variable se tipifican, multiplican por 10, redondean y se les

suma una constante de manera que el menor valor discretizado sea 1.

Agrupacin. Se encuentran disponibles las siguientes opciones cuando se discretizan variables poragrupacin:v Nmero de categoras. Especifique un nmero de categoras y si los valores de la variable deben

seguir una distribucin aproximadamente normal o uniforme en dichas categoras.v Intervalos iguales. Las variables se recodifican en las categoras definidas por dichos intervalos de

igual tamao. Se debe especificar la longitud de los intervalos.

Anlisis de componentes principales categrico: Valores perdidosUtilice el cuadro de dilogo Valores perdidos para elegir la estrategia para manejar los valores que faltanen las variables de anlisis y las variables complementarias.

Estrategia. Seleccione excluir los valores perdidos (tratamiento pasivo), imputar los valores perdidos(tratamiento activo) o excluir objetos con valores perdidos (eliminacin por lista).v Excluir valores perdidos; para las correlaciones, imputar tras la cuantificacin. Los objetos con

valores perdidos en la variable seleccionada no contribuyen en el anlisis de esta variable. Si a todaslas variables se les aplica tratamiento pasivo, los objetos con valores perdidos en todas las variables setratarn como suplementarios. Si se especifican correlaciones en el cuadro de dilogo Resultados, trasel anlisis, los valores perdidos se imputarn con la categora ms frecuente, o moda, de la variablepara las correlaciones de las variables originales. Para las correlaciones de la variable escaladaptimamente, se puede seleccionar el mtodo de imputacin. Moda. Sustituya valores que faltan con el modo de la variable escalada de forma ptima. Categora adicional. Sustituya valores que faltan con la cuantificacin de una categora adicional.

Este valor implica que los objetos con un valor que falta en esta variable se considera quepertenecen a la misma categora (adicional).

Captulo 3. Anlisis de componentes principales categrico (CATPCA) 21

Categora aleatoria. Impute cada valor que falta en una variable con el valor cuantificado de unnmero de categora aleatoria diferente basndose en las frecuencias marginales de las categoras dela variable.

v Imputar valores perdidos. Los objetos con valores perdidos en la variable seleccionada tendrn dichosvalores imputados. Se puede seleccionar el mtodo de imputacin. Moda. Sustituya los valores que faltan con la categora ms frecuente. Cuando existen varias modas,

se utiliza la que tiene el indicador de categora ms pequeo. Categora adicional. Sustituya los valores que falta con la misma cuantificacin de una categora

adicional. Este valor implica que los objetos con un valor que falta en esta variable se considera quepertenecen a la misma categora (adicional).

Categora aleatoria. Sustituya cada valor que falta en una variable con un nmero de categoraaleatoria diferente basndose en las frecuencias marginales de las categoras.

v Excluir objetos con valores perdidos en esta variable. Los objetos con valores perdidos en la variableseleccionada se excluyen del anlisis. Esta estrategia no est disponible para las variablessuplementarias.

Anlisis de componentes principales categrico: OpcionesEl cuadro de dilogo Opciones proporciona controles para seleccionar la configuracin inicial, especificarcriterios de iteracin y de convergencia, seleccionar un mtodo de normalizacin, elegir el mtodo paraetiquetar grficos y especificar objetos complementarios.

Objetos suplementarios. Especifique el nmero de caso del objeto, o bien los nmeros de caso primero yltimo de un rango de objetos que desee convertir en suplementario y, a continuacin, pulse en Aadir.Si se especifica un objeto como suplementario, se ignorarn las ponderaciones de casos para dicho objeto.

Mtodo de normalizacin. Se puede especificar una de las cinco opciones para normalizar laspuntuaciones de objeto y las variables. Solo se puede utilizar un mtodo de normalizacin en cadaanlisis.v Principal por variable. Esta opcin optimiza la asociacin entre las variables. Las coordenadas de las

variables en el espacio de los objetos son las cargas en componentes (las correlaciones con componentesprincipales, como son las dimensiones y las puntuaciones de los objetos). Este mtodo es til si estinteresado bsicamente en la correlacin entre las variables.

v Principal por objeto. Esta opcin optimiza las distancias entre los objetos. Este mtodo es til si estinteresado bsicamente en las diferencias o similitudes entre los objetos.

v Simtrico. Se utiliza esta opcin de normalizacin si el inters principal est en la relacin entre objetosy variables.

v Independiente. Se utiliza esta opcin de normalizacin si se desea examinar por separado lasdistancias entre los objetos y las correlaciones entre las variables.

v Personalizado. Se puede especificar cualquier valor real en el intervalo cerrado [-1, 1]. Un valor de 1es igual al mtodo principal del objeto. Un valor de 0 es igual al mtodo simtrico. Un valor de 1 esigual al mtodo principal de variable. Si se especifica un valor mayor que -1 y menor que 1, se puededistribuir el autovalor entre los objetos y las variables. Este mtodo es til para generar diagramas dedispersin biespaciales y triespaciales a medida.

Criterios. Se puede especificar el nmero mximo de iteraciones que el procedimiento puede realizardurante los clculos. Tambin puede seleccionar un valor para el criterio de convergencia. El algoritmodetiene la iteracin si la diferencia del ajuste total entre la dos ltimas iteraciones es menor que el valorde convergencia o si se ha alcanzado el nmero mximo de iteraciones.

Etiquetar grficos con. Puede especificar si las variables y las etiquetas de valor o los nombres y valoresde variable se utilizan en los grficos. Tambin se puede especificar una longitud mxima para lasetiquetas.


Dimensiones del grfico. Puede controlar las dimensiones que se visualizan en el resultado.v Muestra todas las dimensiones de la solucin. Todas las dimensiones de la solucin se muestran en

un diagrama de dispersin matricial.v Restringe el nmero de dimensiones Las dimensiones mostradas se restringen a los pares

representados. Si restringe las dimensiones, deber seleccionar las dimensiones menor y mayor que sevan a representar. La dimensin menor puede variar desde 1 hasta el nmero de dimensiones de lasolucin menos 1 y se representa respecto a las dimensiones mayores. El valor de la dimensin mayorpuede oscilar variar desde 2 hasta el nmero de dimensiones de la solucin e indica la dimensinmayor que se utilizar al representar los pares de dimensiones. Esta especificacin se aplica a todos losgrficos multidimensionales solicitados.

Rotacin. Puede seleccionar un mtodo de rotacin para obtener resultados rotados.

Nota: Estos mtodos de rotacin no estn disponibles si selecciona Realizar simulacin de muestreo enel dilogo Simulacin de muestreo.v Varimax. Un mtodo de rotacin ortogonal que minimiza el nmero de variables que tienen

saturaciones altas en cada componente. Simplifica la interpretacin de los componentes.v Quartimax. Un mtodo de rotacin que minimiza el nmero de componentes que son necesarios para

explicar cada variable. Simplifica la interpretacin de las variables observadas.v Equamax. Un mtodo de rotacin que es una combinacin del mtodo Varimax, que simplifica los

componentes, y el mtodo Quartimax, que simplifica las variables. El nmero de variables queimponen una alta saturacin en un componente y el nmero de componentes que son necesarios paraexplicar una variable se minimizan.

v Oblimin. Un mtodo para la rotacin oblicua (no ortogonal). Cuando el delta es igual a 0, loscomponentes son los ms oblicuos. Cuando delta se vuelve negativo, los componentes pasan a sermenos oblicuos. Los valores positivos permiten una correlacin adicional de componentes. El valor deDelta debe ser menor o igual que 0,8.

v Promax. Una rotacin oblicua (no ortogonal), que permite correlacionar los componentes. Se puedecalcular ms rpidamente que una rotacin Oblimin directa, de forma que es til para conjuntos dedatos grandes. La cantidad de correlacin (oblicuidad) que est permitida se controla mediante elparmetro kappa. El valor de Kappa debe ser mayor o igual que 1 y menor que 10.000.

Configuracin. Puede leer datos en un archivo que contiene las coordenadas de una configuracin. Laprimera variable del archivo contiene las coordenadas para la primera dimensin. La segunda variablecontiene las coordenadas para la segunda dimensin y, as, sucesivamente.v Inicial. La configuracin en el archivo que se especifica se utiliza como el punto de partid del anlisis.v Fija. La configuracin en el archivo que se especifica se utiliza para ajustar las variables. Las variables

que se ajustan se deben seleccionar como variables de anlisis, pero al ser la configuracin fija, setratan como variables suplementarias (de manera que no es necesario seleccionarlas como variablessuplementarias).

Anlisis de componentes principales categrico: ResultadosEl cuadro de dilogo Resultados controla la visualizacin de resultados.

Puntuaciones de los objetos. Muestra las puntuaciones de los objetos y tiene las siguientes opciones:v Incluir categoras de. Muestra los indicadores de las categoras de las variables de anlisis

seleccionadas.v Etiquetar puntuaciones de los objetos por. En la lista de variables que se han especificado como

variables de etiquetado, puede seleccionar una para etiquetar los objetos.

Captulo 3. Anlisis de componentes principales categrico (CATPCA) 23

Saturaciones de componentes. Muestra las cargas en componentes para todas las variables que norecibieron niveles de escalamiento nominal mltiple. Puede ordenar las saturaciones de componentes portamao.

Historial de iteraciones. En cada iteracin, se muestra la varianza explicada, la prdida y el incrementoen la varianza explicada.

Correlaciones de variables originales. Muestra la matriz de correlaciones de las variables originales y losautovalores de dicha matriz.

Correlaciones de variables transformadas. Muestra la matriz de correlaciones de las variablestransformadas (mediante escalamiento ptimo) y los autovalores de dicha matriz.

varianza explicada por. Muestra la cantidad de varianza explicada por las coordenadas de los centroides,las coordenadas de vectores y total (coordenadas de centroides y de vectores combinadas) por variable ypor dimensin.

Cuantificaciones de categoras. Proporciona las cuantificaciones de categora y las coordenadas para cadadimensin de las variables que se han seleccionado.

Estadsticos descriptivos. Muestra frecuencias, el nmero de valores que faltan y el modo de las variablesque se han seleccionado.

Anlisis de componentes principales categrico: GuardarLos controles del recuadro de dilogo Guardar guardan datos discretizados, puntuaciones de objeto,valores transformados y otros resultados en el conjunto de datos activo, un nuevo conjunto de datos en lasesin actual, o un archivo externo.v Los conjuntos de datos estn disponibles durante la sesin actual, pero no as en las sesiones

posteriores, a menos que los haya guardado explcitamente como archivos de datos. El nombre de unconjunto de datos debe cumplir las normas de denominacin de variables.

v Los nombres de archivo o de conjunto de datos deben ser distintos para cada tipo de dato guardado.v Si guarda puntuaciones de objeto o valores transformados en el conjunto de datos activo, podr

especificar el nmero de dimensiones nominales mltiples.v Las opciones del grupo Elipses de confianza de simulacin de muestreo solo estn disponibles si

selecciona Realizar simulacin de muestreo en el dilogo Simulacin de muestreo.

Anlisis de componentes principales categrico: Grficos de objetosEl cuadro de dilogo Grficos de variables y objetos permite especificar los tipos de grficos que desee ylas variables para las que se generarn los grficos.

Puntos de objetos. Se muestra un grfico de los puntos de objetos.

Objetos y variables (grfico biespacial). Los puntos de objetos se representan con la seleccin realizadade las coordenadas de las variables (cargas en componentes o centroides de las variables).

Objetos, cargas y centroides (grfico triespacial). Los puntos de objetos se representan con los centroidesde las variables con un nivel de escalamiento nominal mltiple y las cargas en componentes de las otrasvariables.

Variables para grficos biespaciales y triespaciales. Puede utilizar todas las variables para los grficos dedispersin biespacial y triespacial o seleccionar un subconjunto.


ibm spss categories

Documents