1
CÓDIGO DEL PROYECTO: 911 PALADRA CLAVE: ESCALA MULTIDIMENSIONAL
UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO
FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS
DEPARTAMENTO ACADÉMICO DE ESTADÍSTICA
Lambayeque, Noviembre del 2013
Aplicación de la Escala Multidimensional Métrica a
las Distancias de Las Principales ciudades del
Departamento del Norte de Perú (Lambayeque, La
Libertad, Tumbes y Piura)
MgSc. Est. MEJÍA PACHECO, Débora Esther.
MgSc. Est. ACOSTA PISCOYA, Jorge Antonio.
Dra. NOBLECILLA MONTEALEGRE, Emma
Autores:
2
I. DATOS PRELIMINARES
1.0. TITULO
Aplicación de la Escala Multidimensional Métrica a las
Distancias de Las Principales ciudades del Departamento
del Norte de Perú (Lambayeque, La Libertad , Tumbes y
Piura)
2.0. AUTORES :
MSc. Débora Mejía Pacheco
Docente Asociado a dedicación exclusiva
MSc. Jorge Acosta Piscoya
Docente Asociado a dedicación exclusiva
Dra. Emma Noblecilla Montealegre
Docente Principal a dedicación exclusiva
3.0. RESOLUCION DE APROBACIÓN: N°146-2013-D/FACFyM
4.0. TIPO DE INVESTIGACIÓN: Científica – Teórica Empírica.
5.0. AREA DE INVESTIGACIÓN: Estadística Aplicada.
6.0. LINEA DE INVESTIGACIÓN: Estadística Multivariada.
7.0. LOCALIDAD E INSTITUCIÓN DE EJECUCIÓN:
Facultad De Ciencias Físicas Y Matemáticas de la UNPRG –
Lambayeque.
8.0. DURACIÓN DEL PROYECTO : 12 meses
9.0. FECHA DE INICIO : 1° de Febrero del 2013
10.0. FECHA TÉRMINO : 30 de Diciembre del 2013
3
II. CUERPO DEL INFORME
1.0. RESUMEN
Estudio descriptivo cuyo objetivo es conocer aplicar las
técnicas multivariadas en la formación de grupos o clúster, la
cual nos pueden ayudar para afrontar los diversa problemática
de cada uno de los departamentos de la zona norte considerados
(Tumbes, Piura, Lambayeque y la Libertad)
En el Departamento de Lambayeque utilizando la técnica
nos permite formar cuatro grupos de desarrollo, un Primer
Grupo comformado por Salas y Motupes; el Segundo Grupo
formado por Jayanca, Pacora, Tucume, Illimo y Mochumi, Tercer
Grupo formado por Ferreñafe, Morrope, Lambayeque, Chiclayo,
Reque, Monsefú, San Jose, Pimentel y Puerto Eten, el Cuarto
Grupo formado por Oyotum, Nueva Arica, Nuevo Mocupe,
Mocupe, Zaña, y Chongoyape. Asi mismo el Indice de ajuste
Stress es de 0.17037 lo cual nos indica que el ajuste del modelo
es aceptable, el RSQ=0.88223 muy cercano a uno la bondad del
ajuste es bueno.
En el departamento de la Libertad, tambien se logran
formar cuatro clúster de desarrollo el Primer Grupo formado
por Contumaza y Cascas; el Segundo Grupo formado por
Ascope, Chicama, La Cumbre, Chocope, Huanchaco, Salaverry,
Laredo, Trujillo, Poroto, Paijan, Chuquizongo, Agallpampa,
Otuzco, JulcanSantiago de Chuco y Huamachuco Tercer Grupo
formado por Mollebamba y Bolivar; Cuarto Grupo formado por
Buldibuyo Tayabamba y Huacrachuco. Asi mismo el Indice de
ajuste Stress es de 0.11597 lo cual nos indica que el ajuste del
4
modelo es aceptable, el RSQ=0.9677 muy cercano a uno la
bondad del ajuste es bueno.
En el departamento de Piura, tambien se logran formar
cuatro clúster, el Primer Grupo formado por Ayabaca, Mancora,
El Alto; el Segundo Grupo formado por Sullana, Marcavelica,
Querecotillo, Lacones, Piura, castilla, La Arena, Bernal, Paita,
Tambogrande, Las Lomas, Sechura, Catacaos, Talara y negritos
Tercer Grupo formado por Chulucanas, Morropon, Chalaco y
Canchaque; Cuarto Grupo formado por Huarmaca y
Huancabamba. Asi mismo el Indice de ajuste Stress es de
0.18133 lo cual nos indica que el ajuste del modelo es aceptable,
el RSQ=0.89313 muy cercano a uno la bondad del ajuste es
bueno.
En el departamento de Tumbes, se logran formar tres
clúster, el Primer Grupo formado por Matapalo, Papayal,
Zarumilla y Aguas Verdes ; el Segundo Grupo formado por
Pampa de Hospital, S. J de la Virgen, Tumbes, San Jacinto, San
Pedro de los Incas, La Cruz y Zorritos; el Tercer Grupo
formado por Casitas. Asi mismo el Indice de ajuste Stress es de
0.14964 lo cual nos indica que el ajuste del modelo es aceptable,
el RSQ=0.92274 muy cercano a uno la bondad del ajuste es
bueno.
5
ABSTRACT
Descriptive study the objective was to apply multivariate
techniques in the formation of groups or cluster, which can help us to
meet the diverse problems of each of the departments of the
northern considered (Tumbes, Piura, Lambayeque and Freedom).
In the Department of Lambayeque using the technique allows
us to form four development groups, a Prime Group comformado by
Motupes and Chambers; the second group consists of Jayanca,
Resume, Túcume, Illimo and Mochumi; Third Group formed by
Ferreñafe Morrope, Lambayeque, Chiclayo, Reque, Monsefú, San
Jose, Puerto Eten and Pimentel; Fourth Oyotum Group formed by
New Arica, New Mocupe, Mocupe, Zana, and Chongoyape. Likewise
setting the Stress Index is 0.17037 which indicates that the model fit
is acceptable, the RSQ = 0.88223 very close to one of goodness of fit
is good.
In the department of Liberty, also be achieved form four cluster
development, Prime Group formed by Contumaza and Cascas; the
second group consists of Ascope, Chicama, La Cumbre, Chocope,
Huanchaco, Salaverry, Laredo, Trujillo, Bean, Paijan, Chuquizongo,
Agallpampa, Otuzco JulcanSantiago de Chuco and Huamachuco; Third
Group formed by Mollebamba and Bolivar; Fourth Group formed by
Buldibuyo Tayabamba and Huacrachuco. Likewise setting the Stress
Index is 0.11597 which indicates that the model fit is acceptable, the
RSQ = 0.9677 very close to one of goodness of fit is good.
In the department of Piura, also be achieved form four cluster
Prime Group formed by Ayabaca, Mancora, El Alto; the second group
consists of Sullana, Marcavelica, Querecotillo, lacones, Piura, Castilla,
La Arena, Bernal, Paita, Tambo Grande, Las Lomas, Sechura
6
Catacaos, Talara and Negritos; Third Group formed by CHulucanas,
Morropon, Chalaco and Canchaque; Fourth Group formed by
Huarmaca and Huancabamba. Likewise setting the Stress Index is
0.18133 which indicates that the model fit is acceptable, the RSQ =
0.89313 very close to one of goodness of fit is good.
In the department of Tumbes, are obtained form three cluster,
Prime Group formed by Matapalo, Papayal, Zarumilla and Aguas
Verdes; the second group consists of Pampa Hospital, S. J of the
Virgin, Tumbes, San Jacinto, San Pedro de los Incas, The Cross and
Zorritos; Third Group formed by Casitas. Likewise setting the Stress
Index is 0.14964 which indicates that the model fit is acceptable, the
RSQ = 0.92274 very close to one of goodness of fit is good.
7
CONTENIDO
Página
1.0. RESUMEN 03
ABSTRACT 05
2.0. INTRODUCCIÓN 08
3.0. MATERIALES Y MÉTODOS 12
4.0. RESULTADOS 13
4.1. Departamento de Lambayeque 13
4.2. Departamento de la Libertad 18
4.3. Departamento de Piura 23
4.4. Departamento de Tumbes 28
5.0. DISCUSIÓN 33
6.0. CONCLUSIONES 35
7.0. RECOMENDACIONES 37
8.0. REFERENCIA BIBLIOGRAFICA 38
9.0. ANEXOS 39
8
2.0. INTRODUCCIÓN
En los últimos años la proliferación de datos y el fácil
acceso a los mismos ha hecho que, en la mayoría de las
investigaciones, se analicen grandes conjuntos de datos,
utilizando para ello las técnicas Multivariante. En este sentido,
hay que indicar que las técnicas Multivariante cobran cada vez
mayor importancia en las investigaciones.
El Escalamiento Multidimensional es una técnica de análisis
Multivariante que, partiendo de una matriz de distancias (o bien
de similitudes) entre individuos, produce una representación de
los individuos en una escala Euclidea ordinaria de modo que las
distancias en dicha escala se aproximen lo mejor posible a las
distancias de partida.
Se trata, pues, de construir unas pocas variables (dos
dimensiones), y otorgar puntuaciones a los individuos de
manera que las distancias entre puntuaciones representen las
distancias dadas en el enunciado del problema. En la literatura
es frecuente denominar a estas puntuaciones, coordenadas
principales, y por este motivo, también se conoce al
escalamiento multidimensional como análisis de coordenadas
principales.
La historia de las técnicas de escalamiento
multidimensional comienza con un trabajo de Torgerson en
1952, quien introdujo el término y esbozó las primeras ideas.
En 1962, Shepard hizo una formulación bastante precisa del
escalamiento multidimensional cuando demostró,
empíricamente, que si se conocía una ordenación de las
distancias entre puntos, podría encontrarse una configuración
de puntos en un espacio euclidiano de baja dimensión cuyas
interdistancias euclidianas reproducían prácticamente la
ordenación original.
9
Esta técnica multivariada proporciona una forma de ubicar
la posición relativa entre los objetos con relación a un conjunto
de conceptos, factores o atributos, en un plano
multidimensional. A este resultado se lo llama Escalamiento
Multidimensional.
La materia prima de esta técnica son las proximidades
(similaridades o distancias) o los valores de los datos que
conectan el objeto I con el objeto J (i,j=1,…,I ) y se las puede
representar por el símbolo ij ji, . El arreglo de en una
matriz cuadrada I*I se llamará matriz de proximidades .
El objetivo de MDS, es representar esta matriz
mediante un conjunto de variables ortogonales y1, y2,...,yp
denominadas Coordenadas Principales, donde P < I , de manera
tal que las distancias euclídeas entre las coordenadas de los
elementos respecto a estas variables sean iguales (o lo más
próximas posibles) a las distancias de la matriz original. Es
decir, a partir de la matriz se pretende obtener una matriz
X, de dimensiones I *P, que pueda interpretarse como la matriz
de P variables en los I elementos, y donde la distancia euclídea
entre ellos reproduzca, aproximadamente, la matriz de
distancias inicial . Este problema no tiene una única solución
y se han presentado muchos procedimientos alternativos. El
método de cálculo es partir de una solución proporcionada por
iteraciones sucesivas de descomposición de la matriz de
distancias, a partir del álgebra lineal, encontrando sus valores y
10
vectores propios mejorando en cada paso la solución
precedente minimizando algún criterio de bondad de ajuste. La
descomposición se puede expresar matricialmente como
Donde U es de dimensión I *P y contiene como columnas a
los vectores propios correspondientes a los valores propios no
nulos de , B es diagonal P* P y contiene los valores propios y
U' es la matriz transpuesta de U. A partir de su producto se
genera la matriz D de distancias euclídeas entre los puntos de
la configuración resultante.
La configuración multidimensional lograda con la
descomposición de la matriz , no es única y siempre un paso
importante en las aplicaciones es evaluar la bondad de la
misma. Para ello se define una función objetivo que produzca
un único número que muestre cuán bien se ajustan los datos a
la configuración, es decir que indique cuán cerca se encuentra
la configuración resultante de los datos originales. La bondad de
ajuste es una consideración importante también en la decisión
de cuántas dimensiones son apropiadas para construir la nueva
configuración. Una medida del ajuste ampliamente usada en
MDS es el “stress”, definida como:
Mientras mayor sea la diferencia entre las disparidades y
las distancias, es decir, entre f(δij) y dij, mayor será el Stress y
por tanto peor será el modelo. Por tanto, el Stress no es
propiamente una medida de la bondad del ajuste, sino una
medida de la no bondad o “maldad” del ajuste. Su valor mínimo
es 0, mientras que su límite superior para n estímulos es
)/2(1 n .
11
Kruskal (1964) sugiere las siguientes interpretaciones del
Stress:
Tamaño del
Stress
Interpretación
0,2 Pobre
0,1 Aceptable
0,05 Bueno
0,025 Excelente
0,00 Perfecto
También se suele utilizar una variante del Stress que se
denomina S-Stress, definida como:
Otra medida que se suele utilizar es el coeficiente de
correlación al cuadrado (RSQ), que nos informa de la proporción
de variabilidad de los datos de partida que es explicada por el
modelo. Los valores que puede tomar oscilan entre 0 y 1, al ser
un coeficiente de correlación al cuadrado. Valores cercanos a 1
indican que el modelo es bueno y valores cercanos a 0 indican
que el modelo es malo. Su expresión es:
En este trabajo se pretende dar una visión general del
funcionamiento del MDS, de modo que pueda servir como
alternativa y como complemento a las mismas en cualquier
investigación que utilice dichas técnicas.
12
3.0. MATERIALES Y METODO
3.1. Materiales:
La recolección de los datos está a cargo de los
investigadores, tomando como fuente la información que
proporciona el Ministerio de Transporte y Comunicación al
INEI (Instituto Nacional de Estadística e Informática) La
distancia en Km. De las principales localidades del
departamento de Lambayeque, La Libertad, Piura y Tumbes.
3.2. Método:
La tabulación y el análisis de los datos se harán
utilizando el software estadístico SPSS versión 20. Se
construirán la matriz de datos triangular con las respectivas
distancias en Km. De las principales ciudades de cada
departamento, para luego realizar un análisis
Multidimensional. Finalmente se detallara los principales
grupos de desarrollo encontrado los cuales serán
corroborados al construir el dendograma (Análisis Cluster)
13
4.0 RESULTADOS:
4.1. DEPARTAMENTO DE LAMBAYEQUE:
Primeramente obtenemos el Historial de iteraciones para la
solución de 2 dimensiones (en distancias euclidianas al
cuadrado).
Al utilizar la fórmula S-stress de Young 1.
Iteration S-stress Improvement
1 0.30140
2 0 .23831 0.06308
3 0 .23669 0.00162
4 0 .23666 0.00004
Se detuvo en la cuarta iteración debido a que el valor que
mejora el valor del S-stress es menor que 0.001000.
El estrés y la correlación cuadrado (RSQ) en distancias
RSQ valores son la proporción de la varianza de los datos
escalados (disparidades) en la partición (fila, matriz, o de
datos enteros) que se explica por sus correspondientes
distancias.
Valores de tensión son el estrés de Kruskal fórmula 1.
Para la Matriz
Stress = 0.17037 RSQ = 0.88223
INTERPRETACION: Los resultados obtenidos de la Tabla
Nº01 (Anexo 01) nos permiten determinar que la bondad
de ajuste del modelo es aceptable dado el valor que se
obtiene del índice de esfuerzo (Stess=0.17037). Así
mismo podemos determinar que el Coeficiente de
correlación al cuadrado RSQ=0.88223, es muy cercano a
uno lo que nos indica que la bondad de ajuste del modelo
es bueno modelo es bueno (ver grafico Nº 01)
14
GRAFICO Nº 01
El Grafico N°01 nos muestra la bondad de ajuste del modelo la
cual nos muestra distancias y las disparidades siguen una
tendencia lineal.
15
TABLA Nº 02
COORDENADAS DE LAS PRINCIPALES LOCALIDADES DEL
DEPARTAMENTO DE LAMBAYEQUE EN DOS DIMENSIONES
Dimension
Stimulus Stimulus 1 2
Number Name
1 CHICLAYO -0.1491 0.1804
2 LAMBAYEQUE 0.1177 0.0312
3 MORROPE 0.3830 0.6318
4 MOCHUMI 0.6357 -0.0918
5 TUCUME 0.8224 -0.0395
6 ILLIMO 0.9609 -0.1029
7 PACORA 1.0540 -0.2009
8 JAYANCA 1.4522 0.3305
9 SALAS 2.0766 -0.2847
10 MOTUPE 2.3196 0.1326
11 OLMOS 1.6427 -2.2053
12 FERREÑAFE 0.1535 1.2255
13 CHONGOYA -1.8880 0.4351
14 REQUE -0.3577 0.0852
15 NUV.MOCU -0.9262 -0.8592
16 MOCUPE -1.1302 -0.0689
17 ZAÑA -1.3802 -0.3764
18 NUEV.ARI -1.5384 -1.4783
19 OYOTUM -1.6649 -1.6424
20 PIMENTEL -0.3644 0.8101
21 SAN JOSE -0.1244 0.4893
22 STA.ROSA -0.6312 0.6052
23 MONSEFU -0.4204 0.2173
24 PUER.ETE -0.4573 0.2743
25 BATANGRANDE -0.5862 1.9017
FUENTE: TABLA Nº 01
16
GRAFICO Nº 02
FUENTE: TABLA Nº 01
El Grafico Nº02 nos permite visualizar cuatro grupos de
desarrollo en el departamento de Lambayeque, un Primer
Grupo comformado por Salas y Motupes; el Segundo Grupo
formado por Jayanca, Pacora, Tucume, Illimo y Mochumi,
Tercer Grupo formado por Ferreñafe, Morrope,
Lambayeque, Chiclayo, Reque, Monsefú, San Jose, Pimentel y
Puerto Eten, el Cuarto Grupo formado por Oyotum, Nueva
Arica, Nuevo Mocupe, Mocupe, Zaña, y Chongoyape.
Podemos visualizar dos localidades aisladas Olmos y
Batangrande, considerados puntos atipicos (Oultier). Que no
se puede visualizar por lo que es necesario construiir un
dendograma
17
GRAFICO Nº 03
FUENTE: TABLA Nº 01
El Grafico N° 03 nos permite ubicar la ciudad de Olmos al
Primer Grupo, junto con Salas y Motupe, y la ciudad de
Batangrande al Cuarto Grupo junto con Oyotum, Nueva Arica,
Nuevo Mocupe, Mocupe, Zaña, y Chongoyape.
18
4.2. DEPARTAMENTO DE LA LIBERTAD:
Primeramente obtenemos el Historial de iteraciones para
la solución de 2 dimensiones (en distancias euclidianas al
cuadrado).
Al utilizar la fórmula S-stress de Young 1.
Iteration S-stress Improvement
1 0.11947
2 0.09578 0.02369
3 0.09548 0.00030
Se detuvo en la tercera iteración debido a que el valor
que mejora el valor del S-stress es menor que 0.001000.
El estrés y la correlación cuadrado (RSQ) en distancias
RSQ valores son la proporción de la varianza de los datos
escalados (disparidades) en la partición (fila, matriz, o de
datos enteros) que se explica por sus correspondientes
distancias.
Valores de tensión son el estrés de Kruskal fórmula 1.
Para la Matriz
Stress = 0.11597 RSQ = 0.96777
INTERPRETACION: Los resultados obtenidos de la tabla
Nº03 (Anexo 02) nos permiten determinar que la bondad
de ajuste del modelo es aceptable dado el valor que se
obtiene del índice de esfuerzo (Stess=0.11597). Así
mismo podemos determinar que el Coeficiente de
correlación al cuadrado RSQ=0.9677, es muy cercano a
uno lo que nos indica que la bondad de ajuste del modelo
es bueno (ver grafico Nº 04)
19
GRAFICO Nº 04
FUENTE: TABLA Nº 03
El Grafico N°04 nos muestra la bondad de ajuste del modelo la
cual nos muestra distancias y las disparidades siguen una
tendencia lineal.
20
TABLA Nº 04 COORDENADAS DE LAS PRINCIPALES LOCALIDADES DEL DEPARTAMENTO DE LA LIBERTAD EN DOS DIMENSIONES
Dimension Stimulus Stimulus 1 2
Number Name
1 Trujillo 0.3725 -0.0082
2 Huanchaco 0.6523 0.2299
3 Salaverry 0.6687 0.2330
4 La cumbre 0.7233 0.2892
5 Chicama 0.8448 0.3263
6 Chiclin 0.8519 0.3026
7 Chocope 0.9037 0.5335
8 Paijan 0.9801 0.4231
9 Ascope 1.0148 0.5498
10 Laredo 0.5029 -0.1066
11 Simbal 0.5014 0.1672
12 Poroto 0.3007 0.0815
13 Otuzco 0.1004 0.0045
14 Chuquizo 0.4931 0.9281
15 Agallpam -0.0137 -0.0085
16 Julcan 0.0261 -0.1270
17 Yamobamba -0.0539 -0.0588
18 Motil -0.0874 -0.0709
19 Shorey -0.2778 -0.1668
20 Quiruvila -0.3184 -0.1732
21 Stgo_chuco -0.3650 -0.5235
22 Mollebamba 0.0126 -1.4540
23 Huamachuco -0.7255 -0.2332
24 Bolivar -0.9782 -1.9219
25 Buldibuy -2.7664 0.0791
26 Tayabamba -3.0436 0.2540
27 Cascas 1.7669 -0.0101
28 Comtumaza 2.0090 -0.1311
29 Huacrachuco -4.0952 0.5921
FUENTE: TABLA Nº 03
21
GRAFICO Nº 05
FUENTE: TABLA Nº 03
El grafico Nº05 nos permite visualizar cuatro grupos de
desarrollo en el departamento de La Libertad, el Primer
Grupo formado por Contumaza y Cascas; el Segundo
Grupo formado por Ascope, Chicama, La Cumbre, Chocope,
Huanchaco, Salaverry, Laredo, Trujillo, Poroto, Paijan,
Chuquizongo, Agallpampa, Otuzco, JulcanSantiago de Chuco
y Huamachuco Tercer Grupo formado por Mollebamba y
Bolivar; Cuarto Grupo formado por Buldibuyo Tayabamba y
Huacrachuco.
22
GRAFICO Nº 06
FUENTE: TABLA Nº 03
El grafico N° 06 nos perfite comfirmar los grupos formados con
el mapa percepttual.
23
4.3. DEPARTAMENTO DE PIURA:
Primeramente obtenemos el Historial de iteraciones para
la solución de 2 dimensiones (en distancias euclidianas al
cuadrado).
Al utilizar la fórmula S-stress de Young 1.
Iteration S-stress Improvement
1 .21889
2 .18537 .03352
3 .18480 .00057
Se detuvo en la tercera iteración debido a que el valor
que mejora el valor del S-stress es menor que 0.001000.
El estrés y la correlación cuadrado (RSQ) en distancias
RSQ valores son la proporción de la varianza de los datos
escalados (disparidades) en la partición (fila, matriz, o de
datos enteros) que se explica por sus correspondientes
distancias.
Valores de tensión son el estrés de Kruskal fórmula 1.
Para la Matriz
Stress = .18133 RSQ = .89313
INTERPRETACION: Los resultados obtenidos de la Tabla
Nº 05 (Anexo 03) nos permiten determinar que la bondad
de ajuste del modelo es aceptable dado el valor que se
obtiene del índice de esfuerzo (Stess=0.18133). Así
mismo podemos determinar que el Coeficiente de
correlación al cuadrado RSQ=0.89313, es muy cercano a
uno que nos indica que La bondad de Ajuste del Modelo es
bueno (ver grafico Nº 07)
24
GRAFICO Nº 07
FUENTE: TABLA Nº 05
El Grafico N°07 nos muestra la bondad de ajuste del modelo la
cual nos muestra distancias y las disparidades siguen una
tendencia lineal.
25
TABLA Nº 06 COORDENADAS DE LAS PRINCIPALES LOCALIDADES DEL
DEPARTAMENTO DE PIURA EN DOS DIMENSIONES
Dimension
Stimulus Stimulus 1 2
Number Name
1 Piura -0.0260 -0.0932
2 Castilla -0.0702 -0.0831
3 Catacaos -0.3202 -0.2205
4 La_arena -0.0774 -0.1903
5 Bernal 0.0249 -0.0676
6 Sechura -0.0352 -0.6386
7 Tambogra 0.0308 -0.4657
8 Las_loma 0.1898 -0.9922
9 Sullana 0.3718 -0.0825
10 Ig_escud 0.6066 0.1084
11 Marcavel 0.3910 -0.0682
12 Querecot 0.4459 -0.0514
13 Lancones 0.7058 -0.2082
14 Talara 1.1555 0.5892
15 Negritos 0.9671 0.9403
16 El_alto 1.7437 1.1948
17 Mancora 2.1778 1.5449
18 Paita 0 .2995 -0.3321
19 Morropon -1.0618 0.4977
20 Chulucan -0.8626 0.3010
21 Chalaco -1.6692 -0.0446
22 Huancaba -2.4506 0.9734
23 Canchaque -1.8060 0.6352
24 Huarmaca -2.4450 -0.7268
25 Ayabaca 1.7135 -2.5198
FUENTE: TABLA Nº 05
26
GRAFICO Nº 08
FUENTE: TABLA Nº 05
El grafico Nº08 nos permite visualizar cuatro grupos de desarrollo
en el departamento de Piura, el Primer Grupo formado por Ayabaca,
Mancora, El Alto; el Segundo Grupo formado por Sullana,
Marcavelica, Querecotillo, Lacones, Piura, castilla, La Arena, Bernal,
Paita, Tambogrande, Las Lomas, Sechura, Catacaos, Talara y negritos
Tercer Grupo formado por Chulucanas, Morropon, Chalaco y
Canchaque; Cuarto Grupo formado por Huarmaca y Huancabamba.
27
GRAFICO Nº 09
FUENTE: TABLA Nº 05
El grafico N° 09 nos perfite comfirmar los grupos formados con
el mapa percepttual grafico Nº08.
28
4.4. DEPARTAMENTO DE TUMBES:
Primeramente obtenemos el Historial de iteraciones para
la solución de 2 dimensiones (en distancias euclidianas al
cuadrado).
Al utilizar la fórmula S-stress de Young 1.
Iteration S-stress Improvement
1 .12876
2 .12390 .00486
3 .12382 .00008
Se detuvo en la tercera iteración debido a que el valor
que mejora el valor del S-stress es menor que 0.001000.
El estrés y la correlación cuadrado (RSQ) en distancias
RSQ valores son la proporción de la varianza de los datos
escalados (disparidades) en la partición (fila, matriz, o de
datos enteros) que se explica por sus correspondientes
distancias.
Valores de tensión son el estrés de Kruskal fórmula 1.
Para la Matriz
Stress = 0.14964 RSQ = 0.92274
INTERPRETACION: Los resultados obtenidos de la tabla
Nº 06 (Anexo 03) nos permiten determinar que la bondad
de ajuste del modelo es aceptable dado el valor que se
obtiene del índice de esfuerzo (Stess=0.14964). Así
mismo podemos determinar que el Coeficiente de
correlación al cuadrado RSQ=0.92274, es muy cercano a
uno lo que nos indica que la bondad de ajuste del Modelo
es bueno (ver grafico Nº 10)
29
GRAFICO Nº 10
FUENTE: TABLA Nº 06
El Grafico N°10 nos muestra la bondad de ajuste del modelo
la cual nos muestra distancias y las disparidades siguen una
tendencia lineal
30
TABLA Nº 07 COORDENADAS DE LAS PRINCIPALES LOCALIDADES DEL
DEPARTAMENTO DE TUMBES EN DOS DIMENSIONES
Dimension
Stimulus Stimulus 1 2
Number Name
1 Tumbes -0.0379 -0.1794
2 San Pedro -0.2994 -0.1036
3 La Cruz -0.8450 -0.0261
4 S. J Virgen -0.0009 -0.6291
5 San Jacinto -0.0406 -0.5736
6 Pampa de hospital 0.0705 -1.2072
7 Zarumilla 1.0375 0.2745
8 Aguas Verdes 1.0911 0.5634
9 Papayal 1.3322 0.6121
10 Matapalo 1.9733 0.2056
11 Zorritos -1.0254 0.5767
12 Casitas -3.2552 0.4866
FUENTE: TABLA Nº 06
31
GRAFICO Nº 11
FUENTE: TABLA Nº 06
El grafico Nº11 nos permite visualizar tres grupos de desarrollo en
el departamento de tumbes, el Primer Grupo formado por Matapalo,
Papayal, Zarumilla y Aguas Verdes ; el Segundo Grupo formado por
Pampa de Hospital, S. J de la Virgen, Tumbes, San Jacinto, San Pedro
de los Incas, La Cruz y Zorritos; el Tercer Grupo formado por
Casitas.
32
GRAFICO Nº 12
FUENTE: TABLA Nº 06
El grafico N° 12 nos perfite comfirmar los grupos formados con
el mapa percepttual grafico Nº11.
33
5.0. DISCUSIÓN:
En el Departamento de Lambayeque se logran formar
cuatro grupos de desarrollo un Primer Grupo
comformado por Salas y Motupes; el Segundo Grupo
formado por Jayanca, Pacora, Tucume, Illimo y
Mochumi, Tercer Grupo formado por Ferreñafe,
Morrope, Lambayeque, Chiclayo, Reque, Monsefú, San
Jose, Pimentel y Puerto Eten, el Cuarto Grupo formado
por Oyotum, Nueva Arica, Nuevo Mocupe, Mocupe,
Zaña, y Chongoyape. Podemos visualizar dos
localidades aisladas Olmos y Batangrande, considerados
puntos atipicos (Oultier). Que no se puede visualizar por
lo que es necesario construiir un dendograma.
En el departamento de La Libertad se logran formar
tambien cuatro grupos de desarrollo, el Primer Grupo
formado por Contumaza y Cascas; el Segundo Grupo
formado por Ascope, Chicama, La Cumbre, Chocope,
Huanchaco, Salaverry, Laredo, Trujillo, Poroto, Paijan,
Chuquizongo, Agallpampa, Otuzco, JulcanSantiago de
Chuco y Huamachuco Tercer Grupo formado por
Mollebamba y Bolivar; Cuarto Grupo formado por
Buldibuyo Tayabamba y Huacrachuco.
En el departamento de Piura se logran formar cuatro
grupos de desarrollo, el Primer Grupo formado por
Ayabaca, Mancora, El Alto; el Segundo Grupo formado
por Sullana, Marcavelica, Querecotillo, Lacones, Piura,
castilla, La Arena, Bernal, Paita, Tambogrande, Las
Lomas, Sechura, Catacaos, Talara y negritos Tercer
Grupo formado por Chulucanas, Morropon, Chalaco y
34
Canchaque; Cuarto Grupo formado por Huarmaca y
Huancabamba.
En el departamento de Tumbes se logran formar tres
grupos de desarrollo, el Primer Grupo formado por
Matapalo, Papayal, Zarumilla y Aguas Verdes ; el
Segundo Grupo formado por Pampa de Hospital, S. J
de la Virgen, Tumbes, San Jacinto, San Pedro de los
Incas, La Cruz y Zorritos; el Tercer Grupo formado
por Casitas.
35
6.0. CONCLUSIONES:
En el departamento de Lambayeque se obtiene un valor
de Stess=0.17037, comparándolo con la tabla de
interpretación de Kruskal nos indica es aceptable el nivel
de ajuste. El Coeficiente de correlación al cuadrado
RSQ=0.88223, es muy cercano a uno lo que nos indica
que la bondad de ajuste entre las disparidades y las
distancias es bueno.
En el departamento de La Libertad se obtiene un valor
de Stress=0.11597, comparándolo con la tabla de
interpretación de Kruskal nos indica es aceptable el nivel
de ajuste. El Coeficiente de correlación al cuadrado
RSQ=0.9677, es muy cercano a uno lo que nos indica
que la bondad de ajuste entre las disparidades y las
distancias es bueno.
En el departamento de Piura se obtiene un valor de
Stress=0.18133, comparándolo con la tabla de
interpretación de Kruskal nos indica es aceptable el nivel
de ajuste. El Coeficiente de correlación al cuadrado
RSQ=0.89313, es muy cercano a uno que nos indica
que La bondad de Ajuste entre las disparidades y las
distancias es bueno.
En el departamento de Tumbes se obtiene un valor de
Stress=0.14964. comparándolo con la tabla de
interpretación de Kruskal nos indica es aceptable el nivel
de ajuste. El Coeficiente de correlación al cuadrado
RSQ=0.92274, es muy cercano a uno lo que nos indica
36
que la bondad de ajuste entre las disparidades y las
distancias es bueno.
De los cuatro departamentos el que tiene menor
Stress=0.11597 son las localidades que conforman el
departamento de La Libertad. Asi mismo este
departamento presenta una mejor bondad de ajuste
entre las distancias y las diparidades, RSQ=0.9677.
37
7.0. RECOMENDACIONES
Los Resultados del Presente trabajo de investigación
se espera sean tomados en cuenta por las
autoridades de los departamentos en estudio para
poder abordar mejor el desarrollo de sus respectivos
departamentos.
Así mismo se espera que los estudiantes de la
Escuela profesional de Estadística tomen en
consideración el presente trabajo para que difundan
la aplicación a otras aéreas del conocimiento.
38
8.0. REFERENCIAS BIBLIOGRAFICAS
[1] De la Garza, J., Morales, B., & González, B. (2013).
Análisis Estadístico Multivariante México: Ed.
McGraw-Hill.
[2] Hair, J., Anderson R., Tatham, R. & Black W.
(2010). Análisis Multivariante Aplicado (5ª. ed.).
España: Ed. Pearson
[3] Peña, D. (2002) Análisis de datos Multivariante.
España: Ed. McGraw-Hill.
[4] Pérez, C., (2012) Técnicas de Segmentación.
México: Ed: Alfaomega.
[5] Uriel E., & Aldás, J. (2005) Análisis Multivariante
Aplicado. España: Ed. Thomson.
[6] Coria, D (2012, Setiembre). Escalonamiento
Multidimensional y Análisis de Escalas con SPSS,
Ponencia presentado en el XIV CONEEST en la
Universidad Mayor de San Marcos, Lima-Perú.
39
41
ANEXO 01
Tabla Nº01: Departamento de Lambayeque: Distancia entre las principales Localidades (en Kilometro)
FUENTE: Ministerio de Ttransportes, comunicaciones, vivienda y construccion - Lambayeque
42
ANEXO 02
Tabla Nº03: Departamento de La Libertad: Distancia entre las principales Localidades (en Kilometro)
FUENTE: Ministerio de Ttransportes, comunicaciones, vivienda y construccion – La Libertad
43
ANEXO 03
Tabla Nº05: Departamento de Piura: Distancia entre las principales Localidades (en Kilometro)
FUENTE: Ministerio de Ttransportes, comunicaciones, vivienda y construccion – Piura
44
ANEXO 04
Tabla Nº06: Departamento de Tumbes: Distancia entre las principales Localidades (en Kilometro)
FUENTE: Ministerio de Ttransportes, comunicaciones, vivienda y construccion – Tumbes