examen unidad 3 analisis multidimensional 2014 ing. sistemas

EXAMEN UNIDAD 3EAP: Ing. Sistemas e Informtica Anlisis Multidimensional Ejercicio 1: Se elabor un test que tienen 04 escalas de tem. Se considera que las cuatro escalas sirven para diagnosticar, para discriminar entre paranoides, alcohlicos y personalidad lmite. Se eligieron 05 sujetos por grupo. Los datos son los siguientes:Paranoide E1 E2 E3 E4Alcohlicos E1 E2 E3 E4Personalidad Lmite E1 E2 E3 E4

5 8 7 2 4 9 6 5 6 7 6 3 8 8 9 2 7 8 7 3 7 4 6 8 5 4 7 9 8 2 6 6 6 3 5 9 4 2 6 8 4 4 1 6 8 2 3 5 7 3 2 5 5 2 1 4 6 4 3 5

Realice el Anlisis Discriminante e interpretar los resultados.

Mi variable de clasificacin fue ITEMSe definio el valomr minimo y mximo de sus categoras, que son 1 y 4Todas las variables sobrantes se colocaron dentro de la independientes del anlisis discriminante. Adems se selecciono el mtodo de paso a paso, ya que se realiza la introduccin de las variables explicativas en funcin de sus niveles de significancia.Dentro del anlisis discriminante, en el modo estadstico se evalu el lado descriptivo, dentro de esta la medias, y los ANOVAs univariados ya que muestran un anlisis de varianza para comprobar que las medidas de las variables explicativas son diferentes en los grupos.Mientras que en la zona de coeficientes de la funcin se uso la de Fisher y la de No tipificados para hacer predicciones sobre futuras observaciones. Ambos coeficientes producen las mismas predicciones.Siguiendo con mi desarrollo de analisis discriminantes en la zona de clasificacion seleccin dentro de vizualizacion que se muestre la tabla de resumen, ya que infroma el grado de predccion del modelo.

Estadsticos de grupo

ITEMMediaDesv. tp.N vlido (segn lista)

No ponderadosPonderados

E1Paranoide6,001,58155,000

Alcohlicos6,001,58155,000

Personalidad_Limite6,001,58155,000

E2Paranoide8,00,70755,000



E3Paranoide7,001,22555,000



E4Paranoide3,001,22555,000



TotalParanoide6,002,2242020,000

Alcohlicos5,752,1242020,000


Aqu se muestra la diferencia entre las variables explicativas, la visualizacion de las medias tiene utilidad limitada pero revela que el grupo que aceptaria la oferta del servicio es aproximadamente EN E2 PARANOIDE ES MAYOR A LAS DEMAS CON 8.00EN E4 ALCOHOLICOS ES MAYOR A LAS DEMAS CON 8.00EN E1 PERSONALIDAD_LIMITE ES MAYOR CON 6.00 QUE EN LAS DEMAS .E2e2

Pruebas de igualdad de las medias de los grupos

Lambda de WilksFgl1gl2Sig.

Paranoide,25515,556316,000

Alcohlicos,25715,455316,000

Personalidad_Limite,28613,333316,000

En la siguiente tabla, nos proporciona pistas acerca de cuales variables explicativas nos van hacer utiles en nuestra funcion discriminante.Como se conoce se debe buscar la variable mas significativa, en la columna de lambda tendra que ser la menor y en la columna de F tendra que ser el mayor, asi vemos que es la variable PARANOIDE la mas significativa ademas porque esta en la columna de Sig tiene un valor de .000. Y TIENE LA MENOR LAMBDA CON 0.255 Y MAYOR EN F CON 15,556

Esta tabla muestruna lista de las variables mas significativas , ignorando las dems.La variable PARANOIDE se introduce en primer lugar seguida de PERSONALIDAD_LIMITE y ALCOHOLICOS.Se aprecia que ningina de las demas variables creo una diferencia significativa despues de ajustarse a las primeras tres variables.

Variables en el anlisis

PasoToleranciaF para salirLambda de Wilks

1Paranoide1,00015,556

2Paranoide,86711,247,286


3Paranoide,8604,257,080


Alcohlicos,9845,184,088

En la siguiente tabla se muestra las variables incluidas en el analisis en cada paso.Tolerance: Mide el grado de independencia de las variables explicativas (que no se parezcan), una tolerancia entre 0,7 y 1 es lo ideal, pero una tolerancia entre 0 y 0,69 problemas.Asi que esas 3 variables son las mas importantes para la prediccion de la funcion discriminante.

Variables no incluidas en el anlisis

PasoToleranciaTolerancia mn.F para entrarLambda de Wilks

0Paranoide1,0001,00015,556,255

Alcohlicos1,0001,00015,455,257

Personalidad_Limite1,0001,00013,333,286

1Alcohlicos,998,9985,512,121

Personalidad_Limite,867,8679,518,088

2Alcohlicos,984,8545,184,042

En esta tabla , nos proporciona informacin sobre las variables que compiten por entrar en la ecuacin, En cada paso se introduce la variable con menor lambda o con mayor F.Podemos ver lo que ya afirmamos arriba que la variable PARANOIDE se introduce primero, luego PERSONALIDAD_LIMITE y ALCOHOLICOS , Las dems variables estn fuera del rango de introduccin y extraccin de la F (2,71 3,84)

Proporciona un test mutivariado de diferencias significativas entre los grupos. Si este test no fuera significativo mayor a 0,05(en este caso es altamente significativo), no tendramos base suficiente para proceder con el DA.

Autovalores

FuncinAutovalor% de varianza% acumuladoCorrelacin cannica

dimension015,587a72,572,5,921

21,838a23,896,3,805

3,284a3,7100,0,470

Esta tabla mide la fuerza de relacin entre la variable predictora y los grupos. Se han empleado las 3 primeras funciones discriminantes cannicas en el anlisis.

Coeficientes estandarizados de las funciones discriminantes cannicas

Funcin

123

Paranoide-,561,485,783

Alcohlicos,689-,170,716


En la siguiente tabla, se intenta cuantificar la importancia relativa de cada predictor en la funcin discriminante. De modo no sorprendente la variable PARANOIDE es otra vez el factor dominante, seguido por ALCOHOLICOS y PERSONALIDAD_LIMITE.Los signos debemos interpretarlos de la misma manera, Coeficientes elevados, tanto positivos como negativos, sern los que mas contribuirn a la discriminacin de las funciones.

Matriz de estructura

Funcin

123

Alcohlicos,684*-,289,669

Personalidad_Limite,444,869*-,220

Paranoide-,702,116,703*

Correlaciones intra-grupo combinadas entre las variables discriminantes y las funciones discriminantes cannicas tipificadas Variables ordenadas por el tamao de la correlacin con la funcin.

*. Mayor correlacin absoluta entre cada variable y cualquier funcin discriminante.

En la tabla muestra las correlaciones entre cada vairable y la funcin discriminante

Funciones en los centroides de los grupos

ITEMFuncin

123

E1,6921,805,392

E2-2,804,270-,521

E3-,856-1,482,552

E42,968-,593-,424

Funciones discriminantes cannicas no tipificadas evaluadas en las medias de los grupos

En esta tabla se determina las caracteristicas diferenciadoras de cada grupo, son el punto medio de cada grupo

Coeficientes de las funciones cannicas discriminantes

Funcin

123

Paranoide-,458,396,639

Alcohlicos,588-,145,611


(Constante)-1,722-5,224-7,826

Coeficientes no tipificados

Es esta tabla los coeficiente se pueden emplear para la prediccion de si aceptaran el servicio o si no lo aceptara

Coeficientes de la funcin de clasificacin

ITEM

E1E2E3E4

Paranoide6,9307,3396,4404,418

Alcohlicos5,4163,0285,0826,603

Personalidad_Limite8,1145,6384,6846,427

(Constante)-62,767-43,742-43,856-50,494

Funciones discriminantes lineales de Fisher

Esta tabla muestra los coeficientes de la funcion clasificacion(llamados coeficientes de clasificacion de fisher) utilizados para clasificar ITEM

Resultados de la clasificacina

ITEMGrupo de pertenencia pronosticadoTotal

E1E2E3E4

OriginalRecuentoE140015

E205005

E300505

E400055

%E180,0,0,020,0100,0

E2,0100,0,0,0100,0

E3,0,0100,0,0100,0

E4,0,0,0100,0100,0

a. Clasificados correctamente el 95,0% de los casos agrupados originales.b.

EL MODELO ES PRECISO EN UN 95% DE LOS CASOS, LO CUAL ES EXCELENTE

Ejercicio 2: En un estudio realizado por una compaa encuestadora a las regiones de: 1. Ancash2. La libertad3. Puno4. Cuzco5. Tumbes6. Tacna7. Cajamarca8. Piura9. Lima10. Arequipa11. Hunuco 12. Amazonas. Esta tiene las siguientes caractersticas medibles las cuales son ndice exportacin agrcola, ndice de produccin industrial, ndice de mortalidad, ndice de natalidad, poblacin alfabetizada, nmero de viviendas de material noble, numero de colegios e ndice de pobreza.

RegionesExportacProduccMortalidNatalidadPob_AlfabViviendasColegiosPobrez

127,8847,0762,2628,7620,51291571581,94

264,9245,8028,4974,8950,32267973855,82

375,2030,3221,9978,6333,41260863466,62

444,9541,6543,3560,0968,99112372381,55

537,4098,9781,3844,2149,44206575451,66

689,7276,1322,8249,3441,99231372753,60

733,9143,5694,6770,3142,70145367380,73

899,1221,9640,3563,4760,57219059723,04

953,3043,3593,1635,5175,31250269628,28

1051,5170,4065,3946,7339,20187177382,47

1162,7272,9083,6320,1159,63240051279,85

1253,3292,4294,6370,1874,07169766648,30

Realice el Anlisis de Cluster e interpretar los resultados.

Solucin 02:Anlisis Cluster de los Modelos Jerrquicos con SPSS Matriz de distancias: Esta matriz seala las distancias entre los individuos (ndice de exportacin agrcola, ndice de produccin industrial, ndice de mortalidad, ndice de natalidad, poblacin alfabetizada, nmero de viviendas de material noble, numero de colegios e ndice de pobreza..) segn la distancia eucldea al cuadrado. Esta matriz es simtrica y si la observamos veremos que el primer cluster observado estar formado por aquellos regiones ms cercamos (con menor distancia entre ellos) que son 1.1 y 5.5.

Matriz de distancias

Caso distancia eucldea al cuadrado

1:1 2:2 3:3 4:4 5:5 6:6 7:7 8:8 9:9 10:10 11:11 12:12

1:1 ,00015,06316,64123,36213,59217,22415,71833,36620,2628,66518,24829,032

2:2 15,063,0003,96413,01113,7395,41715,08311,17013,9739,77424,39215,756

3:3 16,6413,964,00017,78923,5118,83516,23610,04122,75015,08123,08923,730

4:4 23,36213,01117,789,00014,70116,3217,02221,64318,1388,09322,86112,249

5:5 13,59213,73923,51114,701,00011,43511,80827,80710,9274,79217,3016,715

6:6 17,2245,4178,83516,32111,435,00020,60912,44016,7608,31219,49416,395

7:7 15,71815,08316,2367,02211,80820,609,00024,94717,9546,92219,17010,788

8:8 33,36611,17010,04121,64327,80712,44024,947,00013,68625,69823,25120,210

9:9 20,26213,97322,75018,13810,92716,76017,95413,686,00016,10615,40510,686

10:10 8,6659,77415,0818,0934,7928,3126,92225,69816,106,00017,52012,426

11:11 18,24824,39223,08922,86117,30119,49419,17023,25115,40517,520,00016,892

12:12 29,03215,75623,73012,2496,71516,39510,78820,21010,68612,42616,892,000

Esta es una matriz de disimilaridades

2 Historial de conglomeracin: Nos va indicando el orden de las uniones y la distancia a la que lo hacen. Por ejemplo: Las dos columnas primeras columnas indican cuando se forman por primera vez un multicluster, es decir, un grupo de ms de dos individuos, que son el paso 2 con 2 y 5, con un valor de 3,964 y 4,792 respectivamente. Asi respectivamente.

Historial de conglomeracin

EtapaConglomerado que se combinaCoeficientesEtapa en la que el conglomerado aparece por primera vezPrxima etapa

Conglomerado 1Conglomerado 2Conglomerado 1Conglomerado 2

dimension01233,964004

25104,792005

3477,022006

4267,126107

55129,571206

64510,760358

72811,217409

84914,762609

92417,6777811

1011118,2480011

111219,6151090

3 Dendograma: En el Dendograma la distancia de agrupamiento aparece en el eje y los sujetos en el otro En nuestro ejemplo, en la primera etapa, se agrupan las regiones 2.2 y 3.3, despus las regiones 6.6:, 8.8; y 4.4.

Luego de haber visto el Dendograma repetimos el procedimiento y a travs de la opcin Guardar se le puede indicar que se guarde en forma de nuevas variables el grupo al que estara asociado cada pas. Por ejemplo podemos pedirle que se agrupe a los pases en tres grupos.

Cluster 1Cluster 2Cluster 3

LetoniaLituaniaEstoniaRepblica ChecaHungraPolonia Eslovaquia

Ejercicio 3: En la tabla siguiente se presentan las distancias, en kilmetros, entre las 8 ciudades europeas indicadas.MadridParisBruselasAmst.BerlnRomaLisboaLondres

Madrid0126015561735236020666441725

Paris12600296475110014371792465

Bruselas1556296019878915452088374

Amst.1735475198068517662267344

Berln23601100789685015292892996

Roma20661437154517661529027301902

Lisboa6441792208822672892273002257

Londres1725465374344996190222570

Realice el Anlisis Multidimensional e interpretar los resultados.

Escala inicial

Iteraciones para dos dimensiones

Coordenadas segn estmulos

Datos ptimamente escalados

Prueba de Bondad de Ajuste y StressMedidas de ajuste y stress

Stress bruto normalizado,00371

Stress-I,06088a

Stress-II,12992a

S-Stress,00683b

Dispersin explicada (D.A.F.),99629

Coeficiente de congruencia de Tucker,99815

PROXSCAL minimiza el stress bruto normalizado.

a. Factor para escalamiento ptimo = 1.004.

b. Factor para escalamiento ptimo = .990.

Como nuestro S-stress es bajo con un 0,006 podemos afirma que nuestros datos sirven para realizar un escalamiento multidimensional.6. Matriz de CoordenadasCoordenadas finales

Dimensin

12

Madrid,729,275

Paris-,195,322

Brucelas-,572,096

Berlin-,443-,343

Amsterdam-,427,137

Lisboa1,106-,001

Roma,151-,690

Londres-,350,203

En la tabla anterior se muestran las coordenadas de la ubicacin de cada ciudad de Europa.Grfica de las dimensiones encontradas

examen unidad 3 analisis multidimensional 2014 ing. sistemas

Documents