pontificia universidad catÓlica de valparaÍso facultad de...

130
PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE INGENIERÍA ESCUELA DE INGENIERÍA INFORMÁTICA MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES DE ALOJAMIENTO DANIEL ESTEBAN GUZMÁN SUAZO INFORME FINAL DE PROYECTO PARA OPTAR AL TÍTULO PROFESIONAL DE INGENIERO CIVIL EN INFORMÁTICA VALPARAÍSO, JULIO DE 2016

Upload: others

Post on 24-Aug-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO

FACULTAD DE INGENIERÍA

ESCUELA DE INGENIERÍA INFORMÁTICA

MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES ENAGENCIAS VIRTUALES DE ALOJAMIENTO

DANIEL ESTEBAN GUZMÁN SUAZO

INFORME FINAL DE PROYECTO PARA

OPTAR AL TÍTULO PROFESIONAL DE

INGENIERO CIVIL EN INFORMÁTICA

VALPARAÍSO, JULIO DE 2016

Page 2: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO

FACULTAD DE INGENIERÍA

ESCUELA DE INGENIERÍA INFORMÁTICA

MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES ENAGENCIAS VIRTUALES DE ALOJAMIENTO

DANIEL ESTEBAN GUZMÁN SUAZO

PROFESOR GUÍA

ALEXANDRU CRISTIAN RUSU

PROFESOR CO-REFERENTE

SILVANA RONCAGLIOLO DE LA HORRA

VALPARAÍSO, JULIO DE 2016

Page 3: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Dedicatoria

A mi madre Jacqueline.Por haberme apoyado en todo momento durante mi vida,

por sus consejos, sus valores, por la motivaciónconstante que me ha permitido siempre ser una persona

mejor, y por su amor en los buenos y malos momentosque hemos y seguiremos viviendo juntos.

A mis familiares.Por creer siempre en mi, por entregarme su apoyo y amor

en todo momento, por sus consejos, por su motivación,por las enseñanzas, y por los buenos momentos juntos.

A mis amigos.Por alegrar los momentos de mi vida, por sus consejos,por su apoyo incondicional, y por el apoyo mutuo en la

etapa profesional, y estoy seguro que seguiremos compartiendomuy buenos y gratos momentos a lo largo de la vida.

A mis profesores.Por todo el conocimiento que me entregaron desde mis

primeros años de estudio, por sus consejos, por losvalores recibidos, por volver a explicar las cosas que

no me quedaron claras las veces que fueran necesarias.Agradecer también especialmente al profesor Cristian Rusu,

por guiarme en el desarrollo de esta Memoria de titulo.

A mis compañeros.Por esos momentos que me enseñaron cuando no sabia

algo, por esos largos momentos de estudio en labiblioteca o en sus propias casas, por apoyarme

en los momentos difíciles, y por que sin ellosme habría costado mucho más lograr esta meta.

I

Page 4: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

ResumenEn la presente investigación se identificaron técnicas y fundamentos de la Minería de Datos, Ciencia

de los Servicios, Usabilidad, Experiencia del Usuario, Experiencia del Consumidor, entre otras, con

el objetivo de tener conocimiento previo al tema fundamental de este estudio, el cual consiste en

identificar tendencias en opiniones vertidas por clientes de hoteles a través de agencias virtuales de

alojamiento. Para cumplir a cabalidad con este objetivo, en primer lugar se escogió un caso de estudio

(Hotelclub.com), en segundo lugar, se analizó la estructura de este sitio web elegido, específicamente su

código HTML, realizando Minería Web de Contenido, es decir, extrayendo la información almacenada

en el sitio. Para poder realizar la Minería Web de Contenido, fue necesario desarrollar una herramienta

que se conectara al sitio web y extrajera estos datos. El formato obtenido de los datos en esta herramienta

fue de dos formas, la primera fue mostrando los datos a través de ventanas de la aplicación y la segunda

a través de un archivo Excel generado. Con este archivo Excel obtenido, se realizaron análisis de

estadística descriptiva, análisis de correlación a través de las pruebas de Spearman ρ, para encontrar

relaciones entre los datos y por último la prueba no paramétrica de Kruskall Wallis H que permite

saber si existen diferencias significativas entre los distintos datos analizados.

Palabras Claves: Minería de Contenido Web, Experiencia del Consumidor, Ciencia de los Servicios.

AbstractThe study’s aim is to analyse customers’ opinions about hospitality services express through the

web. Thus, this research is based on the use of data mining service science as the main and fundamental

data collection in order to identify trends in opinions expressed by customers through virtual hotels

accommodation agencies. To faithfully fulfil this goal, first a case study was carried on Hotelclub.com.

Secondly, the structure of this web site was chosen and then the specifically HTML code was analysed.

Web Mining Content was chosen to extract the information stored on the site. To apply the Web Content

Mining was necessary to develop a tool that will connect to the website and to extract this data. The

format of the data obtained in this tool has two forms, the first was showing data through application

windows and the second via an Excel file generated. With this Excel file obtained, analysis of descriptive

statistics, correlation analysis through tests Spearman ρ were conducted to find the nonparametric

Kruskal Wallis H that lets you know if there are significant differences relationships between data

and finally between the various data analysed.

Key words: Web Content Mining, Consumer Experience, Service Science.

II

Page 5: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Índice

1. Introducción 1

2. Definición del Problema 22.1. Planteamiento del Problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

2.2. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2.2.1. Objetivo General . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2.2.2. Objetivos Específicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2.3. Metodología de la Investigación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2.4. Plan de Trabajo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

3. Conceptos Básicos 63.1. Sitios Web Transaccionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

3.2. Ciencia de los Servicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

3.3. Experiencia del Usuario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

3.4. Experiencia del Cliente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

3.5. Usabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

3.6. Arquitectura de la Información . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

3.7. Descubrimiento del Conocimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

3.8. Minería de Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

3.8.1. Definición de Minería de Datos . . . . . . . . . . . . . . . . . . . . . . . . . . 14

3.8.2. Técnicas de la Minería de Datos . . . . . . . . . . . . . . . . . . . . . . . . . . 15

3.8.3. Minería Web . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

3.8.4. Etapas de la Minería Web . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

3.8.5. Minería de Opinión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

4. Caso de Estudio 204.1. Sitio Web Hotelclub.com . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

4.2. Justificación del Caso de Estudio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

5. Trabajo Realizado 225.1. Extracción de los Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

5.2. Herramienta de Extracción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

5.3. Análisis de Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

5.3.1. Análisis de Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

5.3.2. Medidas de Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

5.3.3. Spearman ρ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

5.3.4. Kruskall Wallis H . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

5.3.5. Kruskall Wallis H por año de publicación . . . . . . . . . . . . . . . . . . . . . 43

6. Síntesis de Resultados 486.1. Comparación Santiago de Chile y localidades de Chile . . . . . . . . . . . . . . . . . . 48

6.2. Comparación Santiago de Chile y localidades de Latinoamérica . . . . . . . . . . . . . 48

6.3. HotelClub V/S TripAdvisor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

III

Page 6: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

6.3.1. Santiago y las ciudades de Chile analizadas . . . . . . . . . . . . . . . . . . . . 49

6.3.2. Santiago de Chile y las ciudades de Latinoamérica analizadas . . . . . . . . . . 50

7. Conclusiones y Trabajo Futuro 51

Anexos 56

A. Medidas de Resumen y Matrices de Correlación de Spearman 57A.1. Hoteles de Santiago de Chile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

A.2. Hoteles de Bogota Colombia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

A.3. Hoteles de Buenos Aires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

A.4. Hoteles de Lima Perú . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

A.5. Hoteles de Montevideo Uruguay . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

A.6. Hoteles de Quito Ecuador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

A.7. Hoteles de Río de Janeiro Brasil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

A.8. Hoteles de Ciudad de México . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

A.9. Hoteles de Panamá . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

B. Matrices de Correlación de Spearman - Hoteles de Chile 64B.1. Hoteles de Viña del Mar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

B.1.1. BEST WEST Hotel Marina del Rey . . . . . . . . . . . . . . . . . . . . . . . . 64

B.1.2. Hotel Ultramar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

B.1.3. Sheraton Miramar Hotel & Convention Center . . . . . . . . . . . . . . . . . . 65

B.2. Hoteles de Santiago de Chile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

B.2.1. Hotel Plaza el Bosque San Sebastián . . . . . . . . . . . . . . . . . . . . . . . . 66

B.2.2. Hotel Kennedy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

B.2.3. Hotel Plaza el Bosque Ebro . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

B.2.4. Hotel Park Plaza Santiago . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

B.2.5. Park Plaza Apart Hotel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

B.2.6. Hotel Plaza el Bosque Nueva Las Condes . . . . . . . . . . . . . . . . . . . . . 69

B.2.7. Hotel Ismael 312 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

B.2.8. Hotel Plaza San Francisco . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

B.2.9. Hotel Regal Pacific . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

B.2.10. Hotel Manquehue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

B.2.11. Hotel Galerías . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

B.2.12. NH Ciudad de Santiago . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

B.2.13. Holiday Inn Santiago - Airport Terminal . . . . . . . . . . . . . . . . . . . . . . 72

B.2.14. Santiago Marriott Hotel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

B.2.15. BEST WESTERN PREMIER Marina Las Condes . . . . . . . . . . . . . . . . 74

B.2.16. Hotel Presidente Edificio Santiago . . . . . . . . . . . . . . . . . . . . . . . . . 74

B.2.17. Soho Santiago Apartments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

B.2.18. Holiday Inn Express Santiago Las Condes . . . . . . . . . . . . . . . . . . . . . 75

B.3. Hoteles de Isla de Pascua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

B.3.1. Tupa Hotel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

IV

Page 7: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

B.4. Hoteles de Puerto Montt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

B.4.1. Manquehue Hotel Puerto Montt . . . . . . . . . . . . . . . . . . . . . . . . . . 76

B.4.2. Hotel Cabana del Lago . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

B.5. Hoteles de San Pedro de Atacama . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

B.5.1. Hotel Cumbres San Pedro de Atacama . . . . . . . . . . . . . . . . . . . . . . . 77

B.6. Hoteles de Punta Arenas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

B.6.1. BEST WESTERN Hotel Finis Terrae . . . . . . . . . . . . . . . . . . . . . . . 78

C. Capturas del Sitio Web Hotelclub.com 78

D. Capturas del Sitio Web Hoteles.com 79

E. Estructura HTML del Sitio Web Hotelclub.com 83

F. Código de la Aplicación en Lenguaje JAVA 85

V

Page 8: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Lista de Figuras

1. Etapas del Proceso KDD. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2. Tipos de Minería Web . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

3. Etapas de la Minería Web. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

4. Interfaz Gráfica Programa-Inicio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

5. Interfaz para agregar hoteles por locación . . . . . . . . . . . . . . . . . . . . . . . . . 24

6. Interfaz para Selección de Locación y Hotel . . . . . . . . . . . . . . . . . . . . . . . . 25

7. Menú de la Aplicación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

8. Árbol con los Datos Extraídos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

9. Tabla de los datos cuantitativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

10. Matriz de Correlación de Pearson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

11. Excel Generado con la Aplicación - parte 1 . . . . . . . . . . . . . . . . . . . . . . . . 27

12. Excel Generado con la Aplicación - parte 2 . . . . . . . . . . . . . . . . . . . . . . . . 28

13. Porcentaje de viajeros según tipo de viaje . . . . . . . . . . . . . . . . . . . . . . . . . 30

14. Porcentaje de viajeros según finalidad de viaje . . . . . . . . . . . . . . . . . . . . . . . 31

15. Relación entre recomendación y tipo de viaje . . . . . . . . . . . . . . . . . . . . . . . 32

16. Interfaz del sitio web . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

17. Comentario con la interfaz del sitio web. . . . . . . . . . . . . . . . . . . . . . . . . . . 79

18. Interfaz del Sitio Web Hoteles.com - Todas las categorías . . . . . . . . . . . . . . . . . 80

19. Interfaz del Sitio Web Hoteles.com - De Negocio . . . . . . . . . . . . . . . . . . . . . 80

20. Interfaz del Sitio Web Hoteles.com - En Pareja . . . . . . . . . . . . . . . . . . . . . . 81

21. Interfaz del Sitio Web Hoteles.com - En Familia . . . . . . . . . . . . . . . . . . . . . . 81

22. Interfaz del Sitio Web Hoteles.com - Entre Amigos . . . . . . . . . . . . . . . . . . . . 82

23. Interfaz del Sitio Web Hoteles.com - Otras categorías . . . . . . . . . . . . . . . . . . . 82

24. Interfaz del Sitio Web Hoteles.com - Comentarios . . . . . . . . . . . . . . . . . . . . . 83

VI

Page 9: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Lista de Tablas

1. Fases y Etapas de la Metodología . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2. Distribución de Trabajo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

3. Clasificación de Sitios Web . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

4. Tipos de Minería de Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

5. Técnicas de la Minería de Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

6. Datos Extraídos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

7. Cantidad de comentarios según tipo de viaje . . . . . . . . . . . . . . . . . . . . . . . . 30

8. Porcentaje de comentarios según tipo de viaje . . . . . . . . . . . . . . . . . . . . . . . 30

9. Cantidad de comentarios según finalidad de viaje . . . . . . . . . . . . . . . . . . . . . 31

10. Porcentaje de comentarios según finalidad de viaje . . . . . . . . . . . . . . . . . . . . 31

11. Cantidad de comentarios según recomendación del viaje . . . . . . . . . . . . . . . . . 32

12. Porcentaje de comentarios según recomendación del viaje . . . . . . . . . . . . . . . . . 32

13. Cantidad de comentarios según año de publicación . . . . . . . . . . . . . . . . . . . . 33

14. Resumen de los Promedios por Locación . . . . . . . . . . . . . . . . . . . . . . . . . . 33

15. Matriz de Correlación - Hoteles Santiago de Chile . . . . . . . . . . . . . . . . . . . . . 34

16. Coeficiente de Determinación - Hoteles Santiago de Chile . . . . . . . . . . . . . . . . . 35

17. Matriz de Correlación - Hoteles de Bogota Colombia . . . . . . . . . . . . . . . . . . . 35

18. Coeficiente de Determinación - Hoteles de Bogota Colombia . . . . . . . . . . . . . . . 36

19. Matriz de Correlación - Hoteles de Buenos Aires Argentina . . . . . . . . . . . . . . . . 36

20. Coeficiente de Determinación - Hoteles Buenos Aires Argentina . . . . . . . . . . . . . 36

21. Matriz de Correlación - Hoteles de Lima Perú . . . . . . . . . . . . . . . . . . . . . . . 37

22. Coeficiente de Determinación - Hoteles de Lima . . . . . . . . . . . . . . . . . . . . . . 37

23. Matriz de Correlación - Hoteles de Montevideo Uruguay . . . . . . . . . . . . . . . . . 37

24. Coeficiente de Determinación - Hoteles de Montevideo . . . . . . . . . . . . . . . . . . 38

25. Matriz de Correlación - Hoteles de Quito Ecuador . . . . . . . . . . . . . . . . . . . . . 38

26. Regresión Lineal - Hoteles de Quito . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

27. Matriz de Correlación - Hoteles de Río de Janeiro . . . . . . . . . . . . . . . . . . . . . 39

28. Coeficiente de Determinación - Hoteles de Quito . . . . . . . . . . . . . . . . . . . . . 39

29. Matriz de Correlación - Hoteles de Ciudad de México . . . . . . . . . . . . . . . . . . . 40

30. Coeficiente de Determinación - Hoteles de México . . . . . . . . . . . . . . . . . . . . 40

31. Matriz de Correlación - Hoteles de Ciudad de México . . . . . . . . . . . . . . . . . . . 40

32. Coeficiente de Determinación - Hoteles de Panamá . . . . . . . . . . . . . . . . . . . . 41

33. Prueba 1: Kruskal-Wallis H - Tipos de viajeros en Santiago, por dimensiones . . . . . . 41

34. Prueba 2: Kruskal-Wallis H - Tipos de viajeros en Bogota, por dimensiones . . . . . . . 42

35. Prueba 3: Kruskal-Wallis H - Tipos de viajeros en Buenos Aires, por dimensiones . . . . 42

36. Prueba 4: Kruskal-Wallis H - Tipos de viajeros en Lima, por dimensiones . . . . . . . . 42

37. Prueba 5: Kruskal-Wallis H - Tipos de viajeros en Quito, por dimensiones . . . . . . . . 42

38. Prueba 6: Kruskal-Wallis H - Tipos de viajeros en Río de Janeiro, por dimensiones . . . 43

39. Prueba 7: Kruskal-Wallis H - Tipos de viajeros de Montevideo, por dimensiones . . . . . 43

40. Prueba 8: Kruskal-Wallis H - Tipos de viajeros en Ciudad de México, por dimensiones . 43

41. Prueba 9: Kruskal-Wallis H - Tipos de viajeros en Panamá, por dimensiones . . . . . . . 43

42. Prueba 1: Kruskal-Wallis H - Tipos de viajeros en Santiago de Chile por año de publicación 44

VII

Page 10: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

43. Prueba 2: Kruskal-Wallis H - Tipos de viajeros en Bogotá por año de publicación . . . . 44

44. Prueba 3: Kruskal-Wallis H - Tipos de viajeros en Buenos Aires por año de publicación . 45

45. Prueba 4: Kruskal-Wallis H - Tipos de viajeros en Lima por año de publicación . . . . . 45

46. Prueba 5: Kruskal-Wallis H - Tipos de viajeros en Quito por año de publicación . . . . . 45

47. Prueba 6: Kruskal-Wallis H - Tipos de viajeros en Río de Janeiro por año de publicación 46

48. Prueba 7: Kruskal-Wallis H - Tipos de viajeros en Montevideo por año de publicación . . 46

49. Prueba 8: Kruskal-Wallis H - Tipos de viajeros en Ciudad de México por año de publicación 46

50. Prueba 9: Kruskal-Wallis H - Tipos de viajeros en Panamá por año de publicación . . . . 47

51. Medidas de Resumen - Hoteles Santiago de Chile . . . . . . . . . . . . . . . . . . . . . 57

52. Matriz de Correlación - Hoteles Santiago de Chile . . . . . . . . . . . . . . . . . . . . . 57

53. Medidas de Resumen - Hoteles de Bogota Colombia . . . . . . . . . . . . . . . . . . . 58

54. Matriz de Correlación - Hoteles de Bogota Colombia . . . . . . . . . . . . . . . . . . . 58

55. Medidas de Resumen - Hoteles de Buenos Aires Argentina . . . . . . . . . . . . . . . . 59

56. Matriz de Correlación - Hoteles de Buenos Aires Argentina . . . . . . . . . . . . . . . . 59

57. Medidas de Resumen - Hoteles de Lima Perú . . . . . . . . . . . . . . . . . . . . . . . 59

58. Matriz de Correlación - Hoteles de Lima Perú . . . . . . . . . . . . . . . . . . . . . . . 60

59. Medidas de Resumen - Hoteles de Montevideo Uruguay . . . . . . . . . . . . . . . . . 60

60. Matriz de Correlación - Hoteles de Montevideo Uruguay . . . . . . . . . . . . . . . . . 60

61. Medidas de Resumen - Hoteles de Quito Ecuador . . . . . . . . . . . . . . . . . . . . . 61

62. Matriz de Correlación - Hoteles de Quito Ecuador . . . . . . . . . . . . . . . . . . . . . 61

63. Medidas de Resumen - Hoteles de Quito Ecuador . . . . . . . . . . . . . . . . . . . . . 62

64. Matriz de Correlación - Hoteles de Río de Janeiro . . . . . . . . . . . . . . . . . . . . . 62

65. Medidas de Resumen - Hoteles de Quito Ecuador . . . . . . . . . . . . . . . . . . . . . 63

66. Matriz de Correlación - Hoteles de Ciudad de México . . . . . . . . . . . . . . . . . . . 63

67. Medidas de Resumen - Hoteles de Quito Ecuador . . . . . . . . . . . . . . . . . . . . . 63

68. Matriz de Correlación - Hoteles de Ciudad de México . . . . . . . . . . . . . . . . . . . 64

69. Medidas de Resumen - BEST WEST Hotel Marina del Rey . . . . . . . . . . . . . . . . 64

70. Matriz de Correlación - BEST WEST Hotel Marina del Rey . . . . . . . . . . . . . . . 65

71. Medidas de Resumen - Hotel Ultramar . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

72. Matriz de Correlación - Hotel Ultramar . . . . . . . . . . . . . . . . . . . . . . . . . . 65

73. Medidas de Resumen - Sheraton Miramar Hotel & Convention Center . . . . . . . . . . 65

74. Matriz de Correlación - Sheraton Miramar Hotel & Convention Center . . . . . . . . . . 66

75. Medidas de Resumen - Hotel Plaza el Bosque San Sebastián . . . . . . . . . . . . . . . 66

76. Matriz de Correlación - Hotel Plaza el Bosque San Sebastián . . . . . . . . . . . . . . . 66

77. Medidas de Resumen - Hotel Kennedy . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

78. Matriz de Correlación - Hotel Kennedy . . . . . . . . . . . . . . . . . . . . . . . . . . 67

79. Medidas de Resumen - Hotel Plaza el Bosque Ebro . . . . . . . . . . . . . . . . . . . . 67

80. Matriz de Correlación - Hotel Plaza el Bosque Ebro . . . . . . . . . . . . . . . . . . . . 67

81. Medidas de Resumen - Hotel Park Plaza Santiago . . . . . . . . . . . . . . . . . . . . . 68

82. Matriz de Correlación - Hotel Park Plaza Santiago . . . . . . . . . . . . . . . . . . . . . 68

83. Medidas de Resumen - Park Plaza Apart Hotel . . . . . . . . . . . . . . . . . . . . . . . 68

84. Matriz de Correlación - Park Plaza Apart Hotel . . . . . . . . . . . . . . . . . . . . . . 68

85. Medidas de Resumen - Hotel Plaza el Bosque Nueva Las Condes . . . . . . . . . . . . . 69

VIII

Page 11: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

86. Matriz de Correlación - Hotel Plaza el Bosque Nueva Las Condes . . . . . . . . . . . . 69

87. Medidas de Resumen - Hotel Ismael 312 . . . . . . . . . . . . . . . . . . . . . . . . . . 69

88. Matriz de Correlación - Hotel Ismael 312 . . . . . . . . . . . . . . . . . . . . . . . . . 70

89. Medidas de Resumen - Hotel Plaza San Francisco . . . . . . . . . . . . . . . . . . . . . 70

90. Matriz de Correlación - Hotel Plaza San Francisco . . . . . . . . . . . . . . . . . . . . . 70

91. Medidas de Resumen - Hotel Regal Pacific . . . . . . . . . . . . . . . . . . . . . . . . . 70

92. Matriz de Correlación - Hotel Regal Pacific . . . . . . . . . . . . . . . . . . . . . . . . 71

93. Medidas de Resumen - Hotel Manquehue . . . . . . . . . . . . . . . . . . . . . . . . . 71

94. Matriz de Correlación - Hotel Manquehue . . . . . . . . . . . . . . . . . . . . . . . . . 71

95. Medidas de Resumen - Hotel Galerías . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

96. Matriz de Correlación - Hotel Galerías . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

97. Medidas de Resumen - NH Ciudad de Santiago . . . . . . . . . . . . . . . . . . . . . . 72

98. Matriz de Correlación - NH Ciudad de Santiago . . . . . . . . . . . . . . . . . . . . . . 72

99. Medidas de Resumen - Holiday Inn Santiago - Airport Terminal . . . . . . . . . . . . . 73

100. Matriz de Correlación - Holiday Inn Santiago - Airport Terminal . . . . . . . . . . . . . 73

101. Medidas de Resumen - Santiago Marriott Hotel . . . . . . . . . . . . . . . . . . . . . . 73

102. Matriz de Correlación - Santiago Marriott Hotel . . . . . . . . . . . . . . . . . . . . . . 73

103. Medidas de Resumen - BEST WESTERN PREMIER Marina Las Condes . . . . . . . . 74

104. Matriz de Correlación - BEST WESTERN PREMIER Marina Las Condes . . . . . . . . 74

105. Medidas de Resumen - Hotel Presidente Edificio Santiago . . . . . . . . . . . . . . . . 74

106. Matriz de Correlación - Hotel Presidente Edificio Santiago . . . . . . . . . . . . . . . . 74

107. Medidas de Resumen - Soho Santiago Apartments . . . . . . . . . . . . . . . . . . . . . 75

108. Matriz de Correlación - Soho Santiago Apartments . . . . . . . . . . . . . . . . . . . . 75

109. Medidas de Resumen - Holiday Inn Express Santiago Las Condes . . . . . . . . . . . . 75

110. Matriz de Correlación - Holiday Inn Express Santiago Las Condes . . . . . . . . . . . . 75

111. Medidas de Resumen - Tupa Hotel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

112. Matriz de Correlación - Tupa Hotels . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

113. Medidas de Resumen - Manquehue Hotel Puerto Montt . . . . . . . . . . . . . . . . . . 76

114. Matriz de Correlación - Manquehue Hotel Puerto Montt . . . . . . . . . . . . . . . . . . 77

115. Medidas de Resumen - Hotel Cabana del Lago . . . . . . . . . . . . . . . . . . . . . . . 77

116. Matriz de Correlación - Hotel Cabana del Lagos . . . . . . . . . . . . . . . . . . . . . . 77

117. Medidas de Resumen - Hotel Cumbres San Pedro de Atacama . . . . . . . . . . . . . . 77

118. Matriz de Correlación - Hotel Cumbres San Pedro de Atacama . . . . . . . . . . . . . . 78

119. Medidas de Resumen - Holiday Inn Express Antofagasta . . . . . . . . . . . . . . . . . 78

120. Matriz de Correlación - BEST WESTERN Hotel Finis Terrae . . . . . . . . . . . . . . . 78

121. Extracción del dato Nombre Hotel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

122. Extracción del dato Recomendación . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

123. Extracción del dato Usuario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

124. Extracción de los datos Proposito, Ubicación y Fecha . . . . . . . . . . . . . . . . . . . 84

125. Titulo Comentario y Comentario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

126. Extracción del dato Características del hotel . . . . . . . . . . . . . . . . . . . . . . . . 85

IX

Page 12: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

1. Introducción

La gran cantidad de información disponible en la actualidad, provocada por el aumento en las

tecnologías de la información, constituye una enorme ventaja para las necesidades de búsqueda de

los usuarios que utilizan estas nuevas tecnologías. Sin embargo, al mismo tiempo, surge también

un nuevo problema, derivado de la dificultad existente para distinguir cuál es la información ne-

cesaria que nos permite tomar decisiones en una organización, a partir de la generación del conocimiento.

Mayoritariamente, la información que existe hoy en día en Internet es del tipo de opiniones de

usuario. Esta, como todos sabemos, es generada a cada minuto gracias a las redes sociales, pero también

existe una gran parte de ella en los sitios web de servicios; es aquí donde los usuarios publican sus

experiencias, ya sean positivas o negativas, de las prestaciones adquiridas. Por lo tanto, constituyen

una información fundamental para las organizaciones del rubro de los servicios, debido a que con

ella es posible realimentar futuras mejoras en la organización. Pero esta gran cantidad de información

existente, no tiene sentido sin un debido tratamiento de los datos, y por consiguiente, una generación de

conocimiento para la toma de decisiones. Es por ello, que ha tomado gran fuerza una nueva disciplina en

el área informática, conocida como "Minería de Datos".

La Minería de Datos, se refiere al proceso de extraer conocimiento útil y comprensible, previamente

desconocido, desde grandes cantidades de datos almacenados en distintos formatos. En términos

más simples, se trata de un método de explotación de datos y extracción de información, para luego

convertirlo en conocimiento útil y de esta forma, ayudar a tomar decisiones en una organización, a través

de la determinación de patrones y modelos. Este conocimiento entregado por la minería de datos, puede

ser interpretado desde distintos puntos de vista, dependiendo del área de interés de la organización que

lo utiliza.

En este proyecto, se utilizará el conocimiento extraído, como apoyo a la calidad de los servicios de

un sitio web transaccional, el cual ha sido elegido como caso estudio. Este conocimiento, será extraído

partir de comentarios vertidos por usuarios de sitio web Hotelclub.com, acerca de los servicios de hoteles

de la regián de Valparaíso.

En el siguiente informe, se presenta el marco teórico de esta investigación, lo cual permitirá

comprender los conceptos básicos involucrados en esta. En el primer capítulo, se da a conocer la

descripción del problema; la metodología de la investigación; los objetivos y el plan de trabajo a utilizar.

En el capítulo dos, se encuentran los conceptos básicos, de los cuales, los más importantes son: Sitios Web

Transaccionales, Ciencia de los Servicios y Minería de Datos. Por su parte, el tercer capítulo da a conocer

el caso de estudio y la justificación de esta elección. Mientras que en el cuarto capítulo, se presenta el

trabajo realizado, destacando las técnicas de minería de datos a utilizar, el análisis de la estructura del

sitio web, las herramientas de la minería de datos y la extracción de los datos que se utilizarán.

1

Page 13: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

2. Definición del Problema

A continuación se define el problema que aborda la investigación, los objetivos, metodología y el plan

de trabajo a utilizar.

2.1. Planteamiento del Problema

Desde su creación, la World Wide Web ha sido objeto de una transformación constante y apresurada;

lo que se refleja en el momento en que los usuarios comunes comenzaron a unirse a la red. Mientras

tanto, varias nuevas tecnologías aparecieron para mejorar los computadores y redes; de esta manera, los

costos operativos relacionados con los sitios web y el precio de los equipos informáticos disminuyeron

drásticamente; lo que en conjunto contribuyó a la popularización masiva de Internet.

De igual modo, se produjo el surgimiento de un número asombroso de herramientas y aplicaciones,

como el llamado CMS (Content Management System), el cual es un marco que permite el desarrollo

de sitios web ágiles. Estos son sistemas que se encuentran dispuestos para su uso y los cuales están

habilitados de las herramientas necesarias para una instalación fácil con publicación de contenidos y

edición; todo lo cual permite que un usuario común pueda publicar contenido en línea sin ser un experto.

Debido a ello, se han ido desarrollando más foros, blogs y sitios web especializados aumentando

enormemente el número de contenidos generados por los usuarios. Por tanto, con los nuevos conceptos

introducidos por la Web 2.0, comenzó a darse más valor a la participación activa de los usuarios y

las comunidades, especialmente a través de la contribución del conocimiento de cada miembro para

enriquecer la información global.

Como consecuencia de este nuevo orden, proporcionar un espacio público para el debate de la comu-

nidad se convirtió casi en un modelo para las nuevas aplicaciones web. Es así que para satisfacer la nueva

demanda, la mayoría de los sitios web existentes, como las redes sociales, revistas web, comercio elec-

trónico, periódicos tuvieron que cambiar sus sistemas para cumplir con las nuevas normas de diseño, las

cuales proporcionan un espacio común que permite la interacción de los usuarios a través del intercambio

de opiniones y experiencias. Desde entonces, una enorme cantidad de datos han sido producido por los

usuarios, lo que es considerado como contenido valioso que puede ser extremadamente útil, no solo co-

mo un complemento, sino también en muchos casos, como una fuente primaria y única de la información.

En el caso de los sitios web turísticos, el intercambio de opiniones y experiencias son fundamentales,

tanto para los usuarios o consumidores como para las empresas que prestan los servicios. Para los

usuarios, estas sirven para ayudar a la toma de decisiones en el caso de contratar o no algún servicio,

por ejemplo, el alojarse en algún lugar del mundo; en el caso de las empresas, estas les permiten

retroalimentarse, en lo que respecta a las mejoras de sus productos y/o servicios; todo lo que posibilita

hacer más efectiva la toma de decisiones, en lo referente a la calidad del servicio, y teniendo como base

información fidedigna que requiere de un procesamiento y extracción desde el sitio web. Por todo ello,

se hace necesario utilizar técnicas especializadas de minería de datos.

Existen muchos sitios web con contenido turístico, de hoteles en particular, pero no se sabe con

precisión cuales entregan información real y confiable, además de que forma evitar que las personas

2

Page 14: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

no sean estafadas por estos; así como también que no obtengan malos servicios. En este sentido se

evalúan distintos casos de estudio a considerar; de los cuales se escoge el sitio web hotelclub.com

para desarrollar esta investigación. Esto, debido a que se analizaron sus políticas privacidad,

logrando determinar que es una empresa seria y reconocida a nivel mundial. Además de ello, po-

see una interfaz gráfica intuitiva para el usuario, lo que permite extraer datos del sitio con mayor facilidad.

Por lo tanto, la idea principal sería utilizar técnicas de minería de datos para extraer estas opiniones y

experiencias; analizándolas y obteniendo información significativa con el fin de entregar, tanto a usuarios

como a los proveedores, información útil a través de una aplicación. Esta información relevante, sería

acerca de cuál es el hotel que posee mayores recomendaciones, dentro de una determinada zona de interés

que el mismo ingrese, para en definitiva, proceder a contratar un determinado servicio. Mientras que por

otro lado, a los proveedores se les daría a conocer, luego de análisis estadísticos de sus mismos datos

representados en comentarios, cuáles son sus falencias y sus ventajas según la opinión de sus clientes;

todo lo cual permitiría a estos generar, si es posible en una instancia posterior, las correcciones pertinentes

a las prestaciones que brindan a los consumidores.

2.2. Objetivos

A continuación se dan a conocer los objetivos de esta investigación

2.2.1. Objetivo General

Identificar tendencias en opiniones vertidas por clientes de hoteles a través de una agencia virtual de

alojamiento.

2.2.2. Objetivos Específicos

Identificar conceptos, técnicas y fundamentos de la Minería de Datos, Ciencia de los Servicios,

Usabilidad, Experiencia del Usuario y Experiencia del Consumidor.

Extraer opiniones vertidas por clientes en una agencia virtual de alojamiento.

Analizar los datos extraídos a través de métodos estadísticos, para la obtención de conocimiento.

Validar el conocimiento obtenido, identificando tendencias de evaluación.

2.3. Metodología de la Investigación

Para esta investigación se utilizará una metodología con un enfoque cuantitativo, en el cual se

llevan a cabo procesos sistemáticos y ordenados siguiendo una serie de pasos. La metodología de la

investigación cuantitativa se basa en el uso de técnicas estadísticas para conocer ciertos aspectos de

interés sobre la población que se está estudiando.

Planificar una investigación, consiste en proyectar un trabajo de acuerdo con una estructura lógica de

decisiones y con una estrategia que esté orientada a la obtención de respuestas adecuadas a los problemas

de indagación propuestos. Pese a tratarse de un proceso metódico y sistemático, no existe un esquema

completo de validez universal, aplicable mecánicamente a todo tipo de investigación. No obstante, es

3

Page 15: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

posible identificar una serie de elementos comunes, que se encuentran lógicamente estructurados, y que

a su vez, nos proporcionan la dirección y guía suficiente al momento de realizar una investigación; todo

lo cual admite la posibilidad de ser organizado en objetivos de aprendizaje, fases y etapas.

Para esta investigación se utilizará esta metodología, debido a que se requieren realizar análisis

estadístico de datos, para lograr descubrir conocimiento a partir de estos.

A continuación se presenta la forma en cómo se organizará esta metodología (tabla 1).

a. Objetivos de AprendizajeDefinir las fases y etapas de la investigación cuantitativa.

b. fases y etapasLa tabla 1 muestra las fases y etapas que se mencionaron anteriormente.

Fases Etapas

Fase Conceptual

Formulación y limitación del problema.

Revisión de la literatura.

Construcción del marco teórico.

Fase de Planificación y Diseño.

Selección de un diseño de investigación.

Identificación de la población que se va a estudiar.

Selección de métodos e instrumentos.

Diseño del plan de muestreo.

Término y revisión del plan de investigación.

Realización del estudio piloto y revisiones.

Fase Empírica.Recolección de datos.

Preparación de los datos para análisis.

Fase Analítica.Análisis de Datos.

Interpretación de resultados.

Fase de Difusión.Comunicación de las observaciones.

Aplicación de las observaciones.

Tabla 1: Fases y Etapas de la Metodología

2.4. Plan de Trabajo

A continuación se presenta en la tabla 2 el plan de trabajo para el desarrollo de este proyecto con sus

períodos de tiempo estimado.

4

Page 16: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Actividad / Mes (2015-2016) Sep Oct Nov Dic Mar Abr May Jun

Proyecto 1 O O O OFormulación y limitación del problema O

Revisión de la literatura O

Construcción del marco teórico O O

Selección de un diseño de investigación O O

Identificación de la población que se va a estudiar O O

Selección de métodos e instrumentos O O

Diseño del plan de muestreo O O

Término y revisión del plan de investigación O O

Realización del estudio piloto y revisiones O O

Proyecto 2 O O O ORecolección de datos O

Preparación de los datos para análisis O

Análisis de Datos O O

Interpretación de resultados O O O

Comunicación de las observaciones O

Aplicación de las observaciones O

Tabla 2: Distribución de Trabajo

5

Page 17: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

3. Conceptos Básicos

A modo de tener una visión general de los conceptos que se estudiarán más adelante en el desarrollo

principal del tema, se expone una definición de los conceptos más fundamentales de este proyecto, los

cuales son: Sitios Web Transaccionales, Ciencia de los Servicios, Usabilidad, Experiencia del Usuario,

Experiencia del Cliente, Arquitectura de la Información, Descubrimiento del Conocimiento, Minería de

Datos, Minería Web y Minería de Opinión.

3.1. Sitios Web Transaccionales

El uso de Internet permite a los usuarios de la red, hacer cada vez más gestiones que se relacionan con

su diario vivir: realizar trámites, pagar servicios, comprar, entre otros. El desarrollo de estas gestiones

virtuales, se ha logrado gracias a los llamados sistemas transaccionales; programas que garantizan la

seguridad y el éxito de la interacción que se genera entre un usuario con una determinada aplicación.

Ello permite a los ciudadanos comunicarse y operar con las instituciones públicas y privadas de manera

fiable a través de Internet; lo cual ayuda a solucionar problemas que van en aumento entre los usuarios,

permitiendo organizar su vida de mejor manera.

Bajo este modelo, las empresas exhiben sus productos y/o servicios en los sitios para que los clientes

los compren o contraten a través de Internet. El principal objetivo de estos sitios web, es el de realizar

ventas o transacciones online, pero un segundo objetivo muy común, es el de alojar información sobre

sus productos y/o servicios. Uno de los mejores ejemplos de este tipo de sitio es Amazon, siendo una de

las tiendas online más grandes y con mayor presencia a nivel mundial.

Además podemos entender lo que es un sitio web, según su definición, como un conjunto de páginas

html relacionadas entre sí por hiperenlaces, gestionadas por organización, accesibles desde Internet

a partir de una dirección URL de su página índice (index) y con una unidad de contenido y de estilo

gráfico. Incluye textos, imágenes, archivos de audio, vídeo y enlaces a otros sitios web. Normalmente no

suele diseñarse una página web de manera aislada, sino más bien, un sitio completo donde a partir de una

página principal o índice, se enlaza el resto de páginas. Este a su vez, puede ser considerado como un

sistema distribuido, es decir, que se basa en una arquitectura cliente-servidor o una arquitectura multicapa.

Existe una gran gama de sitios webs, los que han sido clasificados según su contenido o el uso para

el cual estos hayan sido creados. Dicha clasificación se puntualiza de la siguiente manera en la tabla 3,

en la cual se clasifican según su dinamismo, por su audiencia, por su apertura, por su profundidad, y por

sus objetivos. [AMCM14].

En el sentido de esta investigación, el sitio web elegido como caso de estudio Hotelclub.com, posee

una clasificación mixta entre sitio web transaccional y de servicio; debido a que presta servicios a los

usuarios de hoteles y además permite realizar reservas con pagos o transacciones dentro del mismo. Lo

cual, es considerado como una ventaja dentro del circulo de empresas de este rubro, ya que mejora la

experiencia del usuario y del cliente, utilizando la lógica de un sistema unificado.

La presente investigación por lo tanto, se enfoca netamente en los sitios web catalogados como

6

Page 18: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Clasificación de los Sitios Web

Por su DinamismoSitios Estáticos

Sitios Dinámicos

Por su Audiencia

Públicos

Extranet

Intranet

Por su Apertura

Estructuras Abiertas

Estructuras Cerradas

Estructuras Semicerradas

Por su Profundidad

Por sus Objetivos

E-commerce

Transaccionales

Servicio

Informativos

Ocio

Navegación

Artísticos

Personales

Tabla 3: Clasificación de Sitios Web

transaccionales y de servicio, los cuales proveen múltiples beneficios a la hora de utilizarlos, tales como:

Óptima explotación de la información ejerciendo un adecuado control sobre la misma.

Ágil atención a los requerimientos de las dependencias usuarias, con la consiguiente reducción de

los costos operativos, y obteniendo un incremento en el grado de satisfacción de las áreas.

Incremento del grado de calidad de automatización en los servicios administrativos; liberando a

los usuarios de labores manuales - mecánicas rutinarias, permitiendo que sus funciones y esfuerzos

estén inclinados a obtener mayores niveles de productividad.

Modularidad, tanto del hardware como del software, logrando satisfacer la necesidad de

crecimiento controlado de las oficinas, y en general de la organización; protegiendo la inversión

inicial y la subsiguiente.

Facilidad que brinda el sistema al permitir que su proceso sea distribuido.

Optimización, estandarización y simplificación de los procedimientos operativos; además de

organización en las oficinas y áreas centrales, para proporcionar un servicio más ágil y eficiente

a la clientela.

Contabilización automática e interactiva hasta el último nivel de cada operación, teniendo como

beneficio la optimización de las áreas contables, de presupuesto y de operación.

Control de la tesorería, el que permita conocer en cualquier momento, la posición financiera real

de la institución.

Reducción tanto de los gastos administrativos como operativos.

7

Page 19: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Sustancial incremento de las utilidades.

Incremento sustancial en el nivel de seguridad de manejo de la información.

3.2. Ciencia de los Servicios

El sector servicios es el motor de las economías desarrolladas; y por este motivo, ha dado lugar a

una nueva disciplina que se conoce como La Ciencia de los Servicios (en inglés Services Sciences,

Management and Engineering: SSME). La Ciencia de los Servicios es la aplicación de disciplinas

científicas, de gestión e ingeniería a los trabajos que una organización (la proveedora de los servicios)

realiza para y con otra organización (la receptora de los mismos) [Abe05].

En los términos en los que se emplea en esta definición, un servicio es aquello que tiene un valor

económico, pero que carece de una consistencia material. Se concreta en intenciones de coproducción de

materiales y/o realización de acciones conjuntamente entre los proveedores y los receptores mencionados

más arriba. Estas intenciones se reflejan en un hecho contractual, en donde se especifica la forma de

repartir riesgos, tareas, información y activos; así como el proceso de gestión de tal contrato (toma de

decisiones, formas de pago, penalizaciones, etc.) [Cen07].

A partir de una definición amplia, arriba mencionada, de la Ciencia de los Servicios (Ciencia,

Gestión e Ingeniería de los Servicios), nos da además las claves para entender cómo se desarrolla la

actividad dentro de esta área de conocimiento: Ciencia es la forma de crear conocimiento, el cual es

necesario; si es que realmente queremos afirmar la existencia de una nueva disciplina académica y de un

cuerpo razonablemente sólido de actividad profesional y empresarial.

Esta área de conocimiento, nueva disciplina académica, actividad profesional y empresarial, tiene un

triple enfoque:

Ciencia porque se crea conocimiento

Gestión porque se convierte en valor empresarial

Ingeniería por su contribución al desarrollo técnico y social.

En términos generales, el sector de servicios se basa en gran medida en la intuición y la experiencia

de los empleados. La Ciencia de los Servicios, busca tomar estos elementos y examinar científicamente,

investigando a través de la utilización de las disciplinas académicas existentes; con el fin de aumentar

la productividad y crear evaluaciones visibles de inversiones. Un ejemplo de tales esfuerzos, es el

mejoramiento futuro de predecir efectos y riesgos, en las inversiones de servicios a través de la

modelización matemática de procesos de negocios, que a su vez daría lugar a una mayor productividad.

3.3. Experiencia del Usuario

Se puede definir la Experiencia del Usuario (user experience: ux) sencillamente como aquella que

es obtenida por el usuario, cuando interactúa con un producto en condiciones determinadas. En contexto

de la web, lo que se persigue es generar sensaciones, para los usuarios del sitio web, lo más agradables,

positivas y placenteras posibles; lo que se concreta en las valoraciones que estos realizarán, y que

8

Page 20: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

plasman la garantía de obtener como satisfacción final; lo que se traduce en conservar la fidelidad del

usuario. Por tanto, la experiencia de usuario (UX), consiste en la vivencia real que tienen los usuarios

con determinado producto, al relacionarse o interactuar con él [AMCM14].

Peter Morville diseñó un diagrama para explicar la importancia de la experiencia de usuario, donde lo

primordial es asegurar que estos encuentren valor en lo que se les proporciona. Este diagrama se denomina

User Experience Honeycomb", y señala que una experiencia de usuario es significativa y valiosa cuando

el producto es [Jos]:

1. Útil: su contenido es original y satisface una necesidad.

2. Usable: el producto es fácil de usar.

3. Deseable: la imagen, identidad, marca y otros elementos de diseño evocan emociones hacia el

producto.

4. Localizable: su contenido es navegable y localizable dentro y fuera del producto.

5. Accesible: su contenido es accesible para personas con necesidades especiales.

6. Creíble: los usuarios confían y creen lo que el producto muestra.

7. Valioso: Este elemento deriva como resultado de cubrir correctamente todos los demás. De este modo,

es posible aportar más valor al producto.

Por otra parte, Dillon (2001) propone una sencilla definición como la suma de tres niveles, y estos

son: Acción, qué hace el usuario; Resultado, qué obtiene el usuario; y Emoción, qué siente el usuario.

La diferencia respecto a las anteriores definiciones, es que el autor descompone el fenómeno causante

(interacción) en dos niveles: Acción y Resultado; y enfatiza el aspecto emocional de la experiencia

resultante [AMCM14].

Finalmente, podemos definir la experiencia del usuario como la sensación, sentimiento, respuesta

emocional, valoración y satisfacción, que experimenta este respecto a los sitios web; siendo esta experien-

cia el resultado del fenómeno que se genera en la interacción que se produce entre el sitio web y el usuario.

Esta investigación se enfoca en extraer la experiencia del usuario, a través de opiniones compartidas

por clientes de un sitio web, en donde quedan registradas las experiencias vividas por las personas al utili-

zar los servicios brindados; todo ello, por la interacción que se reporta con el producto del caso de estudio.

Dentro de un proyecto web, podemos encontrar trabajando a diseñadores de interacción, arquitectos

de información, especialistas en accesibilidad, diseñadores gráficos y especialistas en usabilidad, entre

muchos otros perfiles; todos abocados a la búsqueda de visiones y soluciones globales para mejorar

considerablemente la experiencia del usuario en aplicaciones.

A consecuencia de todo ello, en los últimos años se ha popularizado el concepto de experiencia del

usuario, noción que integra en sí misma, diferentes disciplinas y roles profesionales.

9

Page 21: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

3.4. Experiencia del Cliente

La Experiencia del cliente (Customer Experience: CX) se puede definir como la percepción que

tienen los clientes de las interacciones que mantienen con una empresa u organización. La CX está en

gran medida fundamentada en la suma de las experiencias que tiene un cliente con un proveedor de

bienes y servicios, especialmente de aquellas con alto impacto emocional.

Las organizaciones que brindan una experiencia del cliente superior de manera constante obtiene

beneficios comerciales que van mucho mas allá de mejorar la lealtad del cliente y las ganancias. Las

empresas que gestionan el recorrido del cliente (para obtener su(s) producto(s) o servicio(s)) de principio

a fin y entre múltiples puntos de contacto y canales, poseen una gran ventaja competitiva, al reducir la

deserción de clientes, y a la vez al diferenciarse de sus competidores. De esta manera, al obtener una

experiencia más completa del cliente, se mejoran considerablemente las ventas, lo que contribuye a

reducción de costos.

Para mejorar la experiencia del cliente, es esencial tener la capacidad de satisfacer sus expectativas,

entender el contexto de cada interacción en cualquier canal, optimizar el enrutamiento y aprovechar los

comentarios que vierten los clientes en los sitios web de la empresa, a través de herramientas analíticas,

como las de minería de datos, que permiten obtener mejores resultados y mejor calidad en los servicios.

Esto permite ajustar el proceso y adoptar las medidas necesarias para que la CX sea inmejorable, lo cual,

brinda una experiencia superior, genera mayores ventas, disminuye costos, mejora deficiencias y los

empleados estarán más satisfechos.

La forma más sencilla y rentable de generar recorridos bien definidos es a través de una única

plataforma; en vez de malgastar recursos y esfuerzos en integrar soluciones de diversos proveedores.

Para esto, la clave es brindar una CX superior con una plataforma unificada lista para ser usada y que

dirija los puntos de contacto y optimice el compromiso entre todos los canales; logrando que el recorrido

del cliente no implique esfuerzo alguno, siendo proactivo y personalizado, y aumentando la productividad

de la empresa, ya que los clientes se contactan a través de múltiples canales que tenga a su disposición,

como lo son el web chat, correo electrónico, aplicación móvil, y redes sociales.

3.5. Usabilidad

Según el estándar ISO 9241-11, la usabilidad se puede definir como “el grado en la que un producto

se puede usar por determinados usuarios para conseguir objetivos específicos con efectividad, eficiencia

y satisfacción en un contexto de uso especificado” [Jos].

Este estándar explica cómo identificar la información que es necesaria considerar, cuando se

especifica o evalúa la usabilidad en términos de medidas del desempeño de los usuarios y su satisfacción.

Se incluye además una explicación de cómo la usabilidad de un producto puede ser especificada y

evaluada como parte de la calidad del sistema.

La usabilidad es un neologismo, proveniente de la palabra inglesa usability, que significa facilidad de

uso, y que según la ISO 9241 (1998), hace referencia a la eficacia, eficiencia y satisfacción con la que un

10

Page 22: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

producto permite alcanzar objetivos específicos a usuarios específicos en un contexto de uso específico.

Por lo tanto, la usabilidad es la disciplina que estudia la forma de diseñar sitios web para que los usuarios

puedan interactuar con ellos de forma más fácil, cómoda e intuitiva posible[AMCM14].

El psicólogo Donald Norman (2002), socio de la Nielsen y Bruce Tognazzini en la N/N Group,

una firma de consultoría en usabilidad, en el libro "The Design of everyday things", presenta algunos

principios de diseño para la orientación en la construcción de interfaces de sistemas interactivos. Los

principios son [Jos]:

1. Visibilidad: para que el usuario sepa cómo proceder, las funciones deben estar visibles.

2. Feedback: el debido retorno de las acciones ayuda al usuario a seguir la tarea. La respuesta puede ser

verbal y/o visual o de audio.

3. Restricciones: inhibir las opciones del menú, en algunos momentos, pueden evitar que el usuario siga

opciones incorrectas y reduce la posibilidad de errores.

4. Mapeamento: las convenciones de la interfaz deben mirar a los símbolos comunes presentes en la

vida natural del usuario.

5. consistencia: la interfaz debe tener una norma, donde las operaciones y elementos semejantes

correspondan a tareas similares, para que sea más fácil al usuario de aprender a usarla.

6. Affordance: cuando el objeto es auto explicativo, es decir, cuando la forma de interacción es evidente.

Al mismo tiempo, Jakob Nielsen (2000), otro socio de la Nielsen y Bruce Tognazzini en la N/N

Group, define la usabilidad en términos de cinco atributos [Jos]:

1. Facilidad de aprendizaje (learnability): como de fácil resulta para los usuarios llevar a cabo tareas

básicas la primera vez que se enfrentan al diseño.

2. Eficiencia: una vez que los usuarios han aprendido el funcionamiento básico del diseño, ¿cuánto

tardan en la realización de tareas?

3. Cualidad de ser recordado (memorability): cuando los usuarios vuelven a usar el diseño después

de un período sin hacerlo, ¿cuánto tardan en volver a adquirir el conocimiento necesario para usarlo

eficientemente?

4. Eficacia: durante la realización de una tarea, ¿cuántos errores comete el usuario?, ¿cómo de graves son

las consecuencias de esos errores?, ¿Qué tan de rápido puede el usuario deshacer las consecuencias de

sus propios errores?

5. Satisfacción: ¿Qué tan agradable y sencillo le ha parecido al usuario la realización de las tareas?

En el modelo de Nielsen, la usabilidad es: “Parte de la utilidad del sistema, la cual es parte de la

aceptabilidad práctica y, finalmente parte de la aceptabilidad del sistema”.

11

Page 23: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

3.6. Arquitectura de la Información

El término Arquitectura de la Información, fue utilizado por primera vez por Richard Saul Wurman

en 1975, quien la define como el estudio de la organización de la información con el objetivo de permitir

al usuario encontrar su vía de navegación hacia el conocimiento y la comprensión de la información. De

esta manera, podemos señalar que esta disciplina se encarga de diseñar sitios que sean útiles, para que el

usuario pueda encontrar lo que busca, si se halla lo que se busca en el sitio, existe una buena arquitectura

de la información (IA) [AMCM14].

En términos generales, podemos convenir que se trata de una disciplina encargada de estructurar,

organizar y etiquetar los elementos que conforman los entornos informacionales, para facilitar de esta

manera la localización y el acceso a la información contenida en los mismos, y mejorar así su utilidad y

aprovechamiento por parte de sus usuarios.

Por otra parte, Hassan y Ortega el 2009 [AMCM14], establecen que la arquitectura de la información

de un sitio web representa su esqueleto; esto es, aquel elemento del diseño que sostiene estructuralmente

el contenido. Por tanto, la arquitectura de la información, debe definirse en las primeras etapas del ciclo

de diseño, ya que de esta organización conceptual dependerán otros elementos de diseño; como lo son su

diseño de interacción o su diseño gráfico.

Muchos sitios web reciben millones de visitas, mientras que otras pasan desapercibidas, sin apenas

registrar usuarios que se interesen por ellas. Las causas que pueden explicar esa variación en el éxito

comunicativo pueden ser múltiples, tales como, el grado de interés de sus contenidos, el posicionamiento

en el que las sitúan los buscadores en los resultados de búsqueda, o su nivel de usabilidad y accesibilidad.

Todas estas causas, pueden explicar el éxito comunicativo de un sitio web.

Como afirma Nielsen [AMCM14], una mala arquitectura de la información es la piedra con la que

tropiezan los usuarios cuando buscan cualquier tipo de contenido en un sitio web, y por tanto lo que les

impide poder llegar a realizar otras tareas. Esto es clave en los sitios web transaccionales, especialmente

para el caso de estudio de esta investigación, ya que se requiere una captación amplia de clientes para

poder tener un éxito en el negocio, y para esto el sitio web debe cumplir todas las normas de la Usabilidad

y Arquitectura de la Información.

3.7. Descubrimiento del Conocimiento

El proceso completo de extraer conocimiento, a partir de bases de datos, se conoce como Knowledge

Discovery in Databases (KDD) o simplemente Descubrimiento del Conocimiento. Este proceso

comprende diversas etapas, que van desde la obtención de los datos hasta la aplicación del conocimiento

adquirido en la toma de decisiones. [Rod09]

El Descubrimiento de Conocimiento en Bases de Datos, se puede definir como el proceso no

trivial de identificación de patrones válidos, novedosos, potencialmente útiles y fundamentalmente

comprensibles en los datos.

12

Page 24: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Generalmente, se consideran las siguientes etapas del Proceso de Extracción del Conocimiento

[PMS12a]:

1. Selección de datos: Consiste en buscar el objetivo y las herramientas del proceso de minería;

identificando los datos que deben ser extraídos, buscando los atributos apropiados de entrada y la

información de salida para representar la tarea. Es decir, se debe saber lo que se quiere obtener y

cuáles son los datos que facilitarán esa información para lograr la meta.

2. Limpieza de datos: En este paso se limpian los datos sucios, incluyendo los datos incompletos (donde

hay atributos o valores de atributos perdidos), el ruido (valores incorrectos o inesperados) y datos

inconsistentes (conteniendo valores y atributos con nombres diferentes). Los datos sucios en algunos

casos deben ser eliminados, ya que pueden contribuir a un análisis inexacto y resultados incorrectos.

En síntesis, se definen y se determinan los tipos de errores, se busca e identifican las instancias que

contienen errores y se corrigen los errores descubiertos.

3. Integración de datos: Combina datos de diversas procedencias, incluyendo múltiples bases de datos,

que podrían tener diferentes contenidos y formatos. La inconsistencia en el formato, puede desembocar

en una redundancia e incongruencia en los atributos y valores de los datos. Normalmente, cuando se

trabaja en un problema de proceso de descubrimiento, es necesario primero formar un único conjunto

con todos los datos que provienen de distintas fuentes.

4. Transformación de datos:: Las transformaciones consisten principalmente en modificaciones

sintácticas llevadas a cabo sobre datos sin que supongan un cambio para la técnica de minería aplicada.

Las transformaciones discretas de los datos, tienen la ventaja de que mejoran la comprensión de las

reglas descubiertas, al transformar los datos de bajo nivel en datos de alto nivel; y también reduce

significativamente el tiempo de ejecución del algoritmo de búsqueda. Su principal desventaja, es que

se puede reducir la exactitud del conocimiento descubierto, debido a que puede causar la pérdida de

alguna información.

5. Reducción de datos: Reducir el tamaño de los datos, encontrando las características más significativas

para representar los datos, dependiendo del objetivo del proceso. Se pueden utilizar métodos de

transformación, para reducir el número efectivo de variables a ser consideradas, o para encontrar

otras representaciones de los datos. Las estrategias incluyen reducción de dimensiones (la extracción

irrelevante y débil de atributo), compresión de datos (reemplazando valores de datos con datos

alternativos codificados), reducción de tamaño (reemplazando valores de datos con representación

alternativa más pequeña), y una generalización de datos (reemplazando valores de datos de niveles

conceptuales bajos con niveles conceptuales más altos).

6. Minería de Datos: Consiste en la búsqueda de los patrones de interés, que pueden expresarse como un

modelo o simplemente que expresen dependencia de los datos. El modelo encontrado depende de su

función y de su forma de representarlo. Ahora bien, se tiene que especificar un criterio de preferencia

para seleccionar un modelo de un conjunto de posibles modelos; además de precisar la estrategia de

búsqueda a utilizar (normalmente está determinado en el algoritmo de minería).

7. Evaluación de los patrones: Se identifican verdaderamente patrones interesantes que representan

conocimiento, usando diferentes técnicas; además del uso de análisis estadísticos y lenguajes de

consultas.

13

Page 25: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

8. Interpretación de resultados: Consiste en entender los resultados del análisis y sus implicaciones, lo

que nos puede llevar a retroceder hacia alguno de los pasos anteriores. En este punto, hay técnicas de

visualización que pueden ser útiles para facilitar el entendimiento de los patrones descubiertos.

En la figura 1 se visualizan las etapas del proceso KDD, las cuales se describieron anteriormente.

Figura 1: Etapas del Proceso KDD.

3.8. Minería de Datos

3.8.1. Definición de Minería de Datos

En la sección anterior (Descubrimeinto del Conocimiento) se pudo apreciar que la Minería de Datos

es parte de una de las etapas del proceso KDD, por ende, es importante discutir sobre la diferencia

entre KDD y Minería de Datos (Data Mining: DM), ya que muchos estudios e investigaciones dan por

hecho que ambos son sinónimos. Existen muchos casos en los que no es posible identificar o distinguir

claramente la etapa de Minería de Datos dentro del Proceso de Descubrimiento, porque en ocasiones no

es necesario realizar todas y cada una de las etapas del mismo, como por ejemplo, preprocesamiento,

limpieza de datos, etc [PMS12a].

Entonces, la Minería de Datos la podemos definir como una etapa particular en el proceso KDD,

etapa en la que se aplican algoritmos específicos o técnicas determinadas para la extracción de patrones

de los datos, distinguiéndolo del proceso KDD, que ya antes ha sido definido.

La Minería de Datos es la etapa más importante del KDD; es la que integra los procesos de

aprendizaje y métodos estadísticos para la obtención de hipótesis de patrones y modelos. Se fundamenta

en varias disciplinas, como lo son la estadística, la visualización de datos, sistemas para tomas de

decisión, el aprendizaje automático o la computación paralela y distribuida; beneficiándose de los

avances en estas tecnologías, pero difiriendo de ellas en la finalidad que persigue: extraer patrones,

describir tendencias y predecir comportamientos [PMS12a].

Debemos tener claro, que el proceso de Minería de Datos genera muchos tipos de patrones,

pero lo más importante es determinar qué patrones son útiles e interesantes y cuáles no. Un patrón

es interesante si cumple con ciertas condiciones. Si un patrón es de fácil comprensión, será válido

con cierto grado de certeza, para otro conjunto de datos, ya sea nuevo o de prueba; teniendo así una

14

Page 26: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

utilidad potencial y siendo expresión además, de un conocimiento novedoso que escapa a lo trivial [IP07].

El Aprendizaje Automático, es el área de la Inteligencia Artificial que se ocupa de desarrollar

técnicas capaces de aprender, es decir, extraer de forma automática conocimiento subyacente en la

información; y constituye, junto con la estadística, el corazón del análisis inteligente de los datos.

Con todo ello, cabe señalar que existen dos tipos de minería de datos [Rod09], las cuales se muestran

en la tabla 4:

Tipos de Minería de Datos

Aprendizaje SupervisadoClasificación

Regresión o Estimación

Aprendizaje No SupervisadoClustering o agrupamiento

Reglas de Asociación

Tabla 4: Tipos de Minería de Datos

Además la Minería de Datos posee distintas técnicas, las cuales pueden ser descriptivas o predictivas.

Las descriptivas, caracterizan las propiedades generales de los datos en una DB (Base de Datos) y por el

contrario, la predictiva realiza inferencias en los datos para poder realizar predicciones, por lo mismo, es

importante tener claro lo que se desea obtener para ver cual de los dos enfoques se utiliza [PMS12a].

3.8.2. Técnicas de la Minería de Datos

En la tabla 5 se puede apreciar las técnicas más utilizadas en la Minería de Datos, las cuales pueden

ser descriptivas o predictivas [PMS12a]:

Para realizar estas técnicas, es necesario utilizar un software especializados en minería de datos. A

continuación se presentan cinco de las mejores herramientas de software de código abierto para minería

de datos: Orange, RapidMiner, WEKA, JHepWork y KNIME.

3.8.3. Minería Web

Minería Web (Web Mining: WM), es un área que se desprendió del proceso de Minería de Datos

y cuyo término fue acuñado por Oren Etzioni en 1996, y actualmente es un área de investigación

extensa. Algunos autores definen a la WM como el uso de técnicas para descubrir y extraer de forma

automática información de los documentos y servicios de la web. Según M. Scotto, la WM es el proceso

de descubrir y analizar información útil de los documentos de la Web. Sin embargo, la Minería Web se

puede definir como el descubrimiento y análisis de información relevante que involucra el uso de técnicas

y acercamientos basados en la minería de datos (Data Mining: DM), orientados al descubrimiento y

extracción automática de información de documentos y servicios de la Web, teniendo en consideración el

comportamiento y preferencias del usuario. Entre los objetivos principales del WM se tiene [JS03]:

Descubrir recursos, extraer información, analizar datos e inferir generalidades.

15

Page 27: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Técnicas DescripciónTécnicas Descriptivas

Descripción de Clases

Se puede dar de tres formas:

1. Caracterización de los Datos

2. Discriminación de los Datos

3. Combinación de ambas

Análisis de Asociación Es el procesos de búsqueda interesante de correlaciones entre un conjunto

grande de datos mostrando condiciones del tipo atributo-valor.

Análisis de Clusters El proceso trabaja agrupando objetos según el principio de maximizar la

similitud dentro de una clase y minimizar la similitud entre clases. Un clusters

es una colección de objetos de datos mutuamente similares.

Técnicas PredictivasClasificación y Predicción Son dos tipos de análisis de datos, aquellos que pueden ser usados para

clasificar datos y los que se usan para predecir tendencias. La clasificación

de datos predice clases de etiquetas mientras la predicción de datos predice

funciones de valores continuos.

Árboles de Decisión Definen un conjunto de clases, asignando a cada dato de entrada una clase y

determina la probabilidad de que ese registro pertenezca a la clase.

Redes Neuronales Son modelos predictivos no lineales que aprenden a través del entrenamiento.

Las tareas principales son: reconocer, clasificar, asociar, almacenar patrones,

aproximación de funciones, sistemas (predicción, control) y optimización.

Tabla 5: Técnicas de la Minería de Datos

Obtener nuevos conocimientos provenientes de la información disponible en la Web.

Encontrar información relevante.

Optimizar el diseño y estructura del sitio web.

La Web, es una enorme colección de datos con información muy heterogénea, que posee un

aumento en problemas de escalabilidad y dinamismo. Por consiguiente, la Web es un área fértil para

la investigación de Minería Web, con la existencia de una enorme cantidad de información en línea.

Este proceso de Minería Web, lo podemos definir formalmente como “el proceso global de descubrir

información o conocimiento potencialmente útil y previamente desconocido a partir de datos de la Web”

[PMS12b].

Se suele usar la denominación WM para catalogar tres tipos de actividades considerablemente

diferentes. Todas estas actividades se enmarcan dentro de la MD y además, están relacionadas con la

web; sin embargo, los datos que son objeto de la minería son diferentes.

Estas tres actividades son las siguientes [SG13]:

Minería de Contenido Web (WCM, Web Content Mining): WCM se trata del descubrimiento

de información útil de los contenidos, datos, documentos y servicios de la web. Sin embargo,

los contenidos web no se componen únicamente de texto, sino también de audio, vídeo, datos

simbólicos e hiperenlazados y metadatos [Rod09].

16

Page 28: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Minería de Estructura Web (WSM, Web Structure Mining): WSM extrae la estructura de los

hiperenlaces, es decir, cómo están los documentos estructurados respecto a los otros. La estructura

se representa como un grafo de los enlaces en un sitio web o entre sitios web. WSM revela

más información que la contenida en los documentos, por ejemplo, los enlaces que apuntan a un

documento pueden indicar la popularidad o importancia de este; mientras que los enlaces salientes

indican la riqueza o variedad de los temas que contiene. Esto nos lleva a una organización jerárquica

por temas, que puede ser inferida directamente de los patrones de enlazado. Es posible incluso

no especificar los documentos mediante palabras clave, sino mediante documentos ejemplares

[Rod09].

Minería de Uso Web (WUM, Web Usage Mining): Mientras que la minería de contenidos (WCM)

y la minería de estructura (WSM) usan los datos reales o primarios de la web; la minería de uso

(WUM), utiliza datos secundarios generados por la interacción de los usuarios con la web. WUM

incluye datos de las conexiones a los servidores web, servidores Proxy o buscadores, perfiles de

usuarios, archivos de registro, sesiones de usuario, búsquedas, clicks de ratón o scrolls, carpetas de

favoritos, etc [Rod09].

Por lo tanto, WCM clasifica los documentos automáticamente o construye una base de información

web multicapa; WSM extrae la estructura de una página web; mientras que, WUM descubre patrones de

acceso a las páginas en los usuarios.

A continuación, en la figura 2, se ilustran las categorías de la Minería Web

Figura 2: Tipos de Minería Web

3.8.4. Etapas de la Minería Web

Para poder procesar los datos y transformarlos en información útil, podemos distinguir una serie de

etapas dentro del proceso global de la Minería Web.

Selección y recopilación de datos: Lo primero es determinar qué es lo que se quiere obtener

y cuáles son los datos que nos facilitarán esa información para lograr la meta. Posteriormente,

se localizan los documentos o archivos a adquirir; capturándose y almacenándose los datos

17

Page 29: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

pertinentes. El objetivo de esta etapa es recuperar automáticamente los documentos más

importantes, indexándolos para optimizar la búsqueda. El proceso de indexación es complejo,

debido a la gran cantidad de páginas Web, además que estas cambian continuamente; por lo cual

existen cuatro enfoques de indexación, los cuales son: indexación manual, automática, inteligente

o basada en agentes y basada en Metadatos.

Extracción y preprocesamiento de información: Se trata principalmente de filtrar y limpiar los

datos recogidos. Una vez extraída la información determinada a partir de un documento (ya sea

HTML, XML, TEXTO, PS, PDF, LaTeX, FAQs), se eliminarán los datos erróneos o incompletos,

y se presentarán de manera ordenada, para luego realizar transformación de estos por medios

automáticos. El objetivo es identificar y etiquetar el contenido esencial del documento, para mapear

hacia algún modelo de datos. La extracción de la información entrega nueva información a partir

de la estructura del documento y su representación.

Minería: En esta etapa, se descubren automáticamente los modelos o patrones generales sobre un

sitio Web, así como por múltiples sitios, utilizando recursos estadísticos, técnicas de Minería de

Datos, etc.

Análisis: Una vez teniendo los patrones identificados, es necesario interpretarlos; para esto, existen

diversas herramientas que permiten entender, ya sea visualmente o por algún otro método que

facilita la interpretación de dichos patrones.

A continuación, en la figura 3, se pueden visualizar de forma gráfica las etapas de la minería web.

Figura 3: Etapas de la Minería Web.

3.8.5. Minería de Opinión

La Minería de Opinión (Opinion Mining: OM) o Análisis del Sentimiento (Sentiment Analysis), es

un campo de la Minería Web que utiliza una serie de aplicaciones de técnicas del procesamiento del

lenguaje natural, lingüística computacional y minería de textos, que tienen como objetivo encontrar

información subjetiva en opiniones vertidas por los usuarios. La Minería de Opinión, es un tema bastante

nuevo hoy en día, y su importancia ha crecido significativamente, debido principalmente al crecimiento

del comercio electrónico, blogs, foros y redes sociales; logrando extraer información valiosa que puede

ser catalogada como positiva o negativa [Mat10].

Con el alto crecimiento del comercio electrónico, muchas personas cambiaron sus hábitos de ir a una

tienda para comprar sus productos o contratar servicios; y en cambio, han preferido hacerlo de forma

cómoda desde un computador con conexión a Internet, y al mismo tiempo, compartir sus opiniones en

los sitios webs. De esta manera, la búsqueda de información útil sobre las opiniones de los usuarios

antes de comprar un producto o contratar un servicio, se convirtió en una práctica común para muchas

18

Page 30: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

personas. Encontrar sitios webs con miles de comentarios de un solo producto y/o servicio no es nada

complicado, lo difícil es encontrar una información que pueda servir de utilidad entre los usuarios

[AH08].

La Minería de Opiniones es un campo que cada vez se hace más extenso, el cual esta relacionado

con el análisis de las componentes subjetivas que están implícitas en los contenidos generados por

los usuarios. Dentro de este campo, existen aplicaciones que realizan un análisis profundo de los

contenidos textuales, en función de la tarea o problemática que se quiera resolver. En términos generales,

encontramos dos tipos de tareas relacionadas con la Minería de Opiniones [Shu08]:

Detección de la polaridad: Se refiere a la capacidad de determinar si una opinión es positiva o

negativa. Más allá de una polaridad básica, también se puede querer obtener un valor numérico

dentro de un rango determinado, en otras palabras, es la búsqueda de un “rating” asociado a una

determinada opinión.

Análisis del sentimiento basado en características: Se refiere a la capacidad de determinar

distintas características del producto tratadas en la opinión o review escrita por el usuario, y para

cada una de esas características mencionadas en la opinión, ser capaces de extraer una polaridad.

Este tipo de acercamientos son mucho más complejos y de un grado más específico que la detección

de la polaridad.

19

Page 31: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

4. Caso de Estudio

4.1. Sitio Web Hotelclub.com

El 15 Enero del año 2016 la empresa encargada de la agencia virtual que escogimos como caso de

estudio hace el siguiente comunicado: “Hotelclub.com se unirá Hoteles.com el 15 de febrero de 2016.

Puede continuar reservando a través de HotelClub.com como normal hasta esta fecha. A partir del 15 de

febrero de 2016 usted será capaz de hacer nuevas reservas en Hoteles.com”. Esto implicó, agilizar el

proceso de extracción de datos antes de la fecha de migración del sitio web y además, dejó obsoleta la

aplicación desarrollada, debido a que la estructura del sitio cambio completamente (ver Anexo secciónA: figuras 15 a 21).

La escala con la que se califica cada comentario se mantuvo en 5 puntos desde 1 (peor calificación)

a 5 (mejor calificación) tal como se hacía en HotelClub.com y para los viajeros con finalidad de viaje

de Negocio, Pareja, Familia, Amigos y Otras categorías, eliminando la finalidad LGBT. Además, las

dimensiones evaluadas en Hoteles.com son las siguientes:

Servicio

Desayuno

Ubicación

Limpieza

Internet

Áreas deportivas

Hotel Club era una comunidad online internacional de viajes para la reserva de alojamiento por

internet. Los socios de esta comunidad, recibían múltiples beneficios económicos a la hora de elegir un

hotel. Hotel Club poseía opciones de alojamiento en 7.400 ciudades de 141 países de todo el mundo, y

contaba con servicios disponibles en 16 idiomas y 35 tipos de moneda. Hotel Club pertenecía a Hotel

Club Pty Ltd., una empresa registrada en Australia y parte de Orbitz Worldwide Inc. Este último, es un

líder mundial en viajes por Internet y utiliza innovadoras tecnologías para permitir a los viajeros, ya

sea por negocios o placer, la posibilidad de poder investigar, planear y reservar una amplia gama de

productos de viaje.

En este sitio web, se encontraban múltiples comentarios realizados por los usuarios registrados en

el mismo sitio. En sus comentarios se daba a conocer las opiniones que lograban percibir respecto del

servicio entregado; además a estos se les permitía efectuar múltiples valoraciones, las cuales podían

ingresar de acuerdo a ciertas categorías como, por ejemplo, en relación a las instalaciones, el servicio

proporcionado, la limpieza, el personal del hotel, la comodidad, ubicación y calidad v/s precio, etcétera.

Todas estas categorías podían ser evaluadas por los clientes con calificaciones que van desde el 1 al 5,

entregando así una puntuación final o nota; y teniendo la posibilidad final de señalar si se recomendaría

o no el servicio contratado.

20

Page 32: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

4.2. Justificación del Caso de Estudio

Las personas a menudo realizan transacciones a través de sitios web de servicios, de hoteles en

particular, en donde realizan reservas de estos. A la hora de elegir uno, muchas de los usuarios revisa los

comentarios de estos sitios web, para poder obtener el mejor servicio posible. Es por esto, que hoy en

día los comentarios realizados en los sitios web de servicios son una fuente de información valiosa, tanto

para los usuarios como para las empresas. Por lo tanto, es de suma importancia que estos comentarios

sean confiables, ya que asegurará que lo que el usuario leyó acerca de un determinado comentario es

totalmente real.

El Sitio Web Hotelclub.com se aseguraba que solo los usuarios registrados en el sitio, y además

que hayan utilizado sus servicios hoteleros, podían comentar en él. Lo cual es fundamental para esta

investigación, ya que se trabaja con estos datos, lo que permite obtener un conocimiento de mayor calidad.

Hotelclub.com pertenecía a una empresa conocida en todo el mundo como se describió en la sección

anterior, pero aun no es muy utilizada en Chile, debido a que existen otras empresas del mismo rubro

que han tenido mayor auge en este país. Sin embargo, se eligió como caso de estudio, ya que forma parte

de una investigación mayor, en la cual existen otros investigadores de la misma Universidad, realizando

análisis de este tipo, pero de otras empresas del mismo rubro. Como lo son: Booking.com, Tripadvisor.cl,

Expedia.com, y Despegar.cl. Todo ello permite, comparar futuros resultados con estos investigadores, lo

cual posibilita generar otro tipo de conclusiones.

21

Page 33: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

5. Trabajo Realizado

Para dar solución a la problemática planteada, se realizó un proceso de extracción y procesamiento

de los datos del sitio web que existía como caso de estudio (Hotelclub.com), con el objetivo de identificar

la información relevante de estos. Para ello, se realizaron análisis estadísticos de los comentarios, lo cual

en primera instancia fue con hoteles de Chile. Luego, expandimos el horizonte de análisis a hoteles de

latinoamerica y finalmente realizamos una comparación de Santiago de Chile con el resto de ciudades de

Latinoamérica.

5.1. Extracción de los Datos

Para extraer los comentarios se desarrolló un programa en Eclipse apoyados de la librería

JSoup y JFrame en el lenguaje de programación JAVA (ver punto 5.2 con capturas del prototipo

y código de este). La herramienta desarrollada, en primer lugar, pide seleccionar ubicación del

hotel y nombre de este (según la ubicación antes seleccionada), en segundo lugar se ingresa a un

menú, en donde hay cinco funciones principales, estas son: Crear Excel con los datos extraídos,

Visualizar los datos extraídos, Visualizar una tabla de los datos cuantitativos y un análisis estadís-

tico de estos, Visualizar la matriz de correlación de Spearman, y por último el botón Salir de la aplicación.

En la primera fase de este análisis, se obtuvieron los comentarios de 27 servicios de alojamiento

pertenecientes a San Pedro de Atacama, Antofagasta, Valparaíso, Isla de Pascua, Santiago, Puerto Montt

y Punta Arenas. La cantidad de comentarios corresponde a 373, una cantidad muy inferior con respecto

a otros sitios web de este rubro en Chile, lo cual se debe principalmente a que Hotelclub no era muy

conocido a lo largo de este país.

En la segunda fase, se expandió el horizonte de análisis a ciudades turísticas de Latinoamérica,

con el fin de realizar comparaciones con Chile y lograr interpretar resultados. Estas ciudades son

las siguientes: Santiago de Chile, Buenos Aires, Montevideo, Lima, Bogota, Río de Janeiro, Quito,

Ciudad de México y Panamá con las cuales se llega a un total de 4687 comentarios. A pesar de

la baja cantidad de comentarios, cabe destacar que cada uno de ellos posee mucha información

relevante, la cual se puede visualizar en la tabla 6. En la misma tabla, se pueden apreciar los datos

cuantitativos, los que fueron analizados a través de medidas de resumen (Media y Desviación estándar)

y a además, pruebas no paramétricas como lo son: Prueba de Spearman ρ y Kruskall Wallis H , con

el objetivo de encontrar tendencias en los datos obtenidos por clientes esta agencia virtual de alojamiento.

La tabla 6 muestra el formato de los datos que fueron extraídos (en Anexo, Sección E, se puede

encontrar la estructura HTML de los datos extraídos), con Nombre del Dato, Tipo de Dato y Descripción

.

22

Page 34: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Dato Extraído Tipo de Dato DescripciónFecha Date Corresponde a la fecha del comentario

Nombre Hotel String Corresponde al nombre del hotel

Titulo Comentario String Corresponde al titulo de un comentario

Comentario String Corresponde al comentario

Nombre Usuario String Corresponde al nombre de usuario del comentario

Ubicación Usuario String Corresponde a la ubicación de donde proviene el usuario

Recomendación String Corresponde a una palabra reservada de recomendación (Lo

recomendaría/No lo recomendaría)

Finalidad del Viaje String Corresponde a una palabra reservada de la finalidad del viaje

(Negocio, Pareja, Familia, Amigos, Solo y LGBT)

Rating Numérico[1;5] Corresponde a una nota dada por el usuario

Instalaciones y Servicios Numérico[1;5] corresponde a una nota por los servicios e instalaciones

Limpieza Numérico[1;5] Corresponde a una nota por la limpieza del hotel

Personal del Hotel Numérico[1;5] Corresponde a una nota por el personal del hotel

Comodidad Numérico[1;5] Corresponde a una nota por comodidad del hotel

Ubicación Numérico[1;5] Corresponde a una nota por la ubicación del hotel

Calidad-Precio Numérico[1;5] Corresponde una nota por la relación precio-calidad

Tabla 6: Datos Extraídos

5.2. Herramienta de Extracción

Se programó una herramienta (en formato .JAR) que permite extraer los datos a partir de los

parámetros de locación y nombre de un hotel. Por lo tanto, este programa cuenta con una interfaz gráfica

en la cual se le solicita en primera instancia Agregar hoteles, Elegir hotel y/o Salir, como se puede apreciar

en la figura 4:

23

Page 35: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Figura 4: Interfaz Gráfica Programa-Inicio.

Al presionar Agregar Hoteles, se despliega una interfaz que solicita un link, el cual se puede obtener

del sitio web Hotelclub.com, al buscar una locación de interés, luego al poner aceptar, el programa

procederá a extraer todos los hoteles de la locación indicada, para almacenar cada hotel en un txt. Ver

figura 5:

Figura 5: Interfaz para agregar hoteles por locación

Al presionar Elegir Hotel se despliega una sección en dónde se solicita la locación de interés y el

hotel según la locación indicada, y los datos serán obtenidos el txt antes creado. Ver figura 6

24

Page 36: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Figura 6: Interfaz para Selección de Locación y Hotel

Luego, al presionar siguiente, se muestra otra pantalla con un menú de la aplicación como se ve en la

figura 7, en donde destacan 3 funciones principales, las cuales son: Visualizar los comentarios extraídos,

generar un excel con los comentarios extraídos para su posterior análisis estadístico y mayor manejo de

los datos, y por último la opción de visualizar estadísticas de los datos cuantitativos extraídos.

Figura 7: Menú de la Aplicación

En la figura 8 se muestra la función Visualizar Comentarios, en un formato de árbol, en este caso del

hotel Park Plaza Santiago.

25

Page 37: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Figura 8: Árbol con los Datos Extraídos

En la figura 9 se muestra una tabla con los datos cuantitativos, a los cuales se les aplicó estadística

básica.

26

Page 38: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Figura 9: Tabla de los datos cuantitativos

La figura 10 muestra la tabla de correlación de Spearman de los datos mostrados en la imagen

anterior:

Figura 10: Matriz de Correlación de Pearson

En la figura 11 se muestra el excel generado al seleccionar la opción de crear excel. Esta función es

realizada con el objetivo de hacer análisis manuales de los datos.

Figura 11: Excel Generado con la Aplicación - parte 1

27

Page 39: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Figura 12: Excel Generado con la Aplicación - parte 2

5.3. Análisis de Datos

En base a los datos que fueron extraídos se pueden hacer relaciones a través de gráficos, para que

las tendencias sean vistas con mayor claridad. Para esto, primero se debe realizar un procesamiento

previo de los datos en un archivo Excel (.xls) a partir de la información obtenida de cada hotel

por medio de la herramienta desarrollada. Luego de esto, se resumen los datos cuantitativos en

una tabla, y con ella se genera cada gráfico. Para este estudio, contamos con un universo de 4687comentarios, de los cuales 294 corresponden a Santiago de Chile, 202 a Bogota, 326 a Buenos

Aires, 393 a Lima, 137 a Quito, 722 a Río de Janeiro, 69 a Montevideo, 1428 a Ciudad de México

y 1116 a Panamá. En la siguiente cita se documenta parte del trabajo realizado en la primera fase de

esta investigación y además es publicado en “Proceedings HCI International 2016, Springer”: [RRG+16].

5.3.1. Análisis de Resultados

Hotel Club clasificaba a sus viajeros en 6 tipos, obteniéndose para este análisis 4687 comentarios de

los cuales 134 son sin especificar su finalidad, lo que daría un total de 4553 comentarios que si especifican

su finalidad, y estos son:

Negocios (1011 comentarios).

Parejas (1610 comentarios).

Familias (647 comentarios).

Amigos (489 comentarios).

Solos (760 comentarios).

LGBT (36 comentarios).

28

Page 40: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

No especificado (134 comentarios).

Hotel Club, además de clasificar los tipos de viajeros y sus finalidades de viaje, permite realizar

evaluaciones cuantitativas utilizando un rango para cada comentario con el objetivo de dar una calificación

por los servicios obtenidos en cada hotel. Esto, se realiza para las siguientes dimensiones cualitativas de

tipo ordinal:

D0: Rating

D1: Instalaciones y Servicios

D2: Limpieza

D3: Personal del Hotel

D4: Comodidad

D5: Ubicación

D6: Calidad/Precio

Esta calificación se realiza mediante una escala de 5 puntos desde 1 (peor calificación) a 5 (mejor

calificación), donde:

1: Pésimo

2: Malo

3: Regular

4: Muy Bueno

5: Excelente

5.3.2. Medidas de Resumen

A continuación se mostrará una serie de tablas y gráficos que resumen la estadística descriptiva

realizada a los datos extraídos para los hoteles de Latinoamérica. En las tablas podremos ver la cantidad

y porcentaje de comentarios según tipo de viaje, cantidad y porcentaje de comentarios según finalidad

de viaje, cantidad y porcentaje de comentarios según recomendación del viaje, cantidad de comentarios

según año de publicación, y resumen de promedios por locación. En cuanto a los gráficos, podremos ver

el porcentaje de viajeros según tipo de viaje, porcentaje de viajeros según finalidad de viaje, y por último

relación entre recomendación y tipo de viaje.

En la figura 13 se puede ver el gráfico con el porcentaje de viajeros según tipo de viaje, este puede

ser de ocio o negocios. Se puede apreciar que predominan los comentarios de ocio con un total de 3676

equivalentes al 78,4 % y por otro lado los de negocio con 1011 comentarios equivalentes al 21,6 % del

total de comentarios extraídos en Latinoamérica. En cuanto a la relación entre ciudades, se puede ver

que la mayoría de comentarios provienen de la ciudad de México con un total de 1428 comentarios de

los cuales 448 son de Negocio y 980 de Ocio. Además, la ciudad que posee menor cantidad de comen-

tarios es Montevideo, Uruguay, con tan solo 69 comentarios de los cuales 15 son de Negocio y 54 de Ocio.

29

Page 41: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Figura 13: Porcentaje de viajeros según tipo de viaje

Para ver con mayor exactitud los datos del gráfico presentado anteriormente (figura 13) se muestra la

tabla 7 y la tabla 8 con la cantidad de viajeros y porcentaje de estos según tipo de viaje respectivamente.

Propósito/Locación Santiago Bogotá Buenos Aires Lima Quito Río de Janeiro Montevideo Cd. de México Panamá

Negocios 77 57 33 78 18 97 15 448 188

Ocio 217 145 293 315 119 625 54 980 928

Total 294 202 326 393 137 722 69 1428 1116

Tabla 7: Cantidad de comentarios según tipo de viaje

Propósito/Locación Santiago Bogota Buenos Aires Lima Quito Río de Janeiro Montevideo Cd. de México Panamá

Negocios 26.2 28.2 10.1 19.8 13.1 13.4 21.7 31.4 16.8

Ocio 73.8 71.8 89.9 80.2 86.9 78.3 68.6 83.2 78.4

Tabla 8: Porcentaje de comentarios según tipo de viaje

En la figura 14 se puede ver el gráfico con la cantidad de viajeros según la finalidad de su viaje,

ya sea en grupo de amigos, familia, pareja, persona que viaja sola, LGBT y sin Especificar. Se puede

observar, que predominan los viajes en pareja en todas las ciudades analizadas con un total de 1610

comentarios, registrándose la mayoría de estos en la localidad de Panamá con 392 comentarios seguido

por Ciudad de México con 392 comentarios, Buenos Aires 145,Lima con 134, Santiago de Chile con

123, Bogota con 51, Quito con 50 y finalmente Montevideo con 29. Además, se puede ver que la menor

cantidad de comentarios es realizada por la finalidad de viaje LGBT con un total de 16 comentarios en

todas las ciudades y registrando cero en la ciudad de Bogota.

Para ver con mayor exactitud los datos de la figura 14 se muestra la tabla 9 y la tabla 10 con la

cantidad de viajeros y porcentaje de estos según finalidad de viaje respectivamente.

30

Page 42: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Figura 14: Porcentaje de viajeros según finalidad de viaje

Finalidad Santiago Bogotá Buenos Aires Lima Quito Río de Janeiro Montevideo Cd. de México Panamá Total

Negocios 77 57 33 78 18 97 15 448 188 1011

Parejas 123 51 145 134 50 304 29 382 392 1610

Amigos 27 21 58 38 10 92 5 117 121 489

Familias 21 25 44 67 18 76 5 199 192 647

Solo 35 42 27 63 36 109 14 224 210 760

No especificado 9 6 18 12 3 35 0 47 4 134

LGBT 2 0 1 1 2 9 1 11 9 36

Total 294 202 326 393 137 722 69 1428 1116 4687

Tabla 9: Cantidad de comentarios según finalidad de viaje

Propósito/Locación [ %] Santiago Bogotá Buenos Aires Lima Quito Río de Janeiro Montevideo Cd. de México Panamá

Negocios 26.2 28.2 10.1 19.8 13.1 13.4 21.7 31.4 16.8

Parejas 41.8 25.2 44.5 34.1 36.5 42.1 42.0 26.8 35.1

Amigos 9.2 10.4 17.8 9.7 7.3 12.7 7.2 8.2 10.8

Familias 7.1 12.4 13.5 17.0 13.1 10.5 7.2 13.9 17.2

Solo 11.9 20.8 8.3 16.0 26.3 15.1 20.3 15.7 18.8

No especificado 3.1 3.0 5.5 3.1 2.2 4.8 0 3.3 0.4

LGBT 0.7 0 0.3 0.3 1.5 1.2 1.4 0.8 0.8

Tabla 10: Porcentaje de comentarios según finalidad de viaje

En la figura 15 se puede ver el gráfico con la cantidad de viajeros que recomiendan o no hoteles

según su tipo de viaje, es decir, viajes de negocios o viajes de ocio. Se puede observar, en el universo de

comentarios analizados, que existe un porcentaje superior al 80 % que recomienda estos hoteles. En el

tipo de viajes de negocio, se llega a un total de 375 comentarios de los cuales 322 recomiendan y 53 no

recomiendan hoteles. En el tipo de viaje de Ocio, se registra un total de 1768 comentarios de los cuales

1574 recomiendan y 194 no recomiendan hoteles.

31

Page 43: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Figura 15: Relación entre recomendación y tipo de viaje

Para ver con mayor exactitud los datos de la figura 15 se muestra la tabla 11 y la tabla 12 con la

cantidad de viajeros y porcentaje de estos según recomendación del viaje respectivamente.

Finalidad/CiudadNegocio Ocio

Lo recomendaría No lo recomendaría Lo recomendaría No lo recomendaría

Santiago 70 7 198 19

Bogota 49 8 130 15

Buenos Aires 29 4 266 27

Lima 73 5 291 24

Quito 13 5 107 12

Río de Janeiro 75 22 538 87

Montevideo 13 2 44 10

Ciudad de México 361 87 839 141

Panamá 151 37 786 142

Total 834 177 3199 477

Tabla 11: Cantidad de comentarios según recomendación del viaje

Finalidad/Ciudad [ %]Negocio Ocio

Lo recomendaría No lo recomendaría Lo recomendaría No lo recomendaría

Santiago 23.8 2.4 67.3 6.5

Bogota 24.3 4.0 64.4 7.4

Buenos Aires 8.9 1.2 81.6 8.3

Lima 18.6 1.3 74.0 6.1

Quito 9.5 3.6 78.1 8.8

Río de Janeiro 10.4 3.0 74.5 12.0

Montevideo 18.8 2.9 63.8 14.5

Ciudad de México 25.3 6.1 58.8 9.9

Panamá 13.5 3.3 70.4 12.7

Tabla 12: Porcentaje de comentarios según recomendación del viaje

En la tabla 13, “cantidad de comentarios según año de publicación”, se puede apreciar que el año con

mayor cantidad de comentarios es el 2014 con 1010 comentarios. En este año se puede ver que la ciudad

32

Page 44: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

que tuvo la mayor cantidad de estos fue Ciudad de México con 294 comentarios.

Año/Locación Santiago Bogotá Buenos Aires Lima Quito Río de Janeiro Montevideo México Panamá Total

2007 1 1 5 1 0 3 0 21 13 45

2008 2 2 16 5 1 11 0 26 10 73

2009 5 8 23 21 2 50 2 130 53 294

2010 13 11 29 26 1 76 4 235 61 456

2011 16 24 25 40 27 62 2 179 85 460

2012 35 23 42 48 37 102 13 176 127 603

2013 62 38 56 69 24 126 12 175 148 710

2014 84 58 62 108 24 125 19 236 294 1010

2015 76 37 61 72 21 156 17 242 316 998

2016 0 0 7 3 0 11 0 8 9 38

Total 294 202 326 393 137 722 69 1428 1116 4687

Tabla 13: Cantidad de comentarios según año de publicación

A continuación se puede ver un cuadro resumen (tabla 14) con los promedios de cada dimensión por

locación y el total de comentarios por locación (N). En este resumen se puede observar lo siguiente:

La locación con mayor cantidad de comentarios es Ciudad de México.

La locación con menos cantidad de comentarios es Montevideo.

Bogota posee las mejores calificaciones en la dimensiones: Rating, Instalaciones y Servicios,

Limpieza y Comodidad.

Buenos Aires posee la mejor puntuación de Ubicación.

Montevideo posee la mejor puntuación de Calidad/Precio.

Las localidad con peores puntuaciones es Santiago de Chile.

Locación / Dimensión N D0 D1 D2 D3 D4 D5 D6

Santiago de Chile 294 3,7971 3,7101 4,0580 4,0725 4,0290 4,0000 3,9420

Buenos Aires 326 4,1963 3,9540 4,4540 4,4018 4,2669 4,4294 4,1810

Lima 393 4,1399 4,0153 4,4860 4,3893 4,3053 4,2850 4,1705

Montevideo 69 3,7971 3,7101 4,0580 4,0725 4,0290 4,0000 4,9420Bogota 202 4,2079 4,1485 4,5594 4,5050 4,3564 4,0396 4,2178

Río de Janeiro 722 3,9349 3,8490 4,1842 4,0859 4,0720 4,3310 3,8019

Quito 137 3,9051 3,7518 4,3504 4,3212 3,8686 4,0146 3,9635

Ciudad de México 1428 3,8564 3,7913 4,2563 4,1141 4,0399 4,4125 3,9181

Panamá 1116 3,9131 3,9292 4,1873 4,0358 4,1013 4,1792 3,9220

Tabla 14: Resumen de los Promedios por Locación

5.3.3. Spearman ρ

Luego de realizar el análisis de estadística descriptiva, procedemos a ver relaciones entre los datos

cuantitativos entregados por los usuarios de esta agencia virtual de alojamiento. Para esto, se extrajeron

datos de 9 ciudades de Latinoamérica, para luego hacer comparaciones con Chile, y específicamente de

Santiago, localidad que había sido utilizada para la primera fase de este estudio.

33

Page 45: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

En primer lugar, para realizar esta comparación, se utiliza el coeficiente de correlación de

Spearmanρ, el cual es una medida de la relación lineal entre dos variables aleatorias cuantitativas. En

palabras simples, es un índice que puede utilizarse para medir el grado de relación de dos variables

siempre y cuando estas sean cuantitativas.

La prueba de Spearman ρ se realizó para comprobar la siguiente hipótesis:

H0 : ρ = 0, las dimensiones Dm y Dn son independientes.

H1 : ρ �= 0, las dimensiones Dm y Dn son dependientes.

Esta hipótesis nos comprueba la dependencia o independencia de los datos (dimensiones). Para esto,

deben utilizarse las tablas de correlación de Spearmanρ las cuales fueron calculadas por locación.

Además, cabe destacar lo siguiente acerca del coeficiente de correlación de Spearmanρ: un ρ cercano

a 1 indica relación, un ρ cercano a 0 indica no hay relación, y un ρ cercano a -1 indica relación inversa.

Solo las correlaciones marcadas con negrita son significativas al nivel α = 0, 05, y será interpretado por

cada locación de la siguiente forma (tomando rho como valor absoluto):

ρ = 0 : la correlación es nula.

0 < ρ ≤ 0, 190 : la correlación es muy baja.

0, 200 ≤ ρ ≤ 0, 390 : la correlación es baja.

0, 400 ≤ ρ ≤ 0, 590 : la correlación es moderada.

0, 600 ≤ ρ ≤ 0, 790 : la correlación es alta.

0, 800 ≤ ρ < 1 : la correlación es muy alta.

ρ = 1 : la correlación es perfecta.

Para analizar de mejor manera el Coeficiente de correlación de Spearman ρ, interpretaremos la

relación de sus dimensiones con el Coeficiente de Determinación bajo cada una de las matrices. El

Coeficiente de Determinación se explicará en términos de proporción de variabilidad compartida, donde

se ofrece una idea mas cabal de la magnitud de la relación. Dicho coeficiente se define como el cuadrado

del coeficiente de correlación; esto es, dadas dos variables X e Y , hace referencia a r2xy (coeficiente de

correlación al cuadrado), y se entiende como una proporción de variabilidades.

1. Matriz de Correlación Hoteles de Santiago de Chile

D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

D0 1,000 0,688 0,621 0,593 0,593 0,387 0,625D1 – 1,000 0,566 0,480 0,567 0,299 0,507D2 – – 1,000 0,577 0,632 0,319 0,514D3 – – – 1,000 0,493 0,383 0,590D4 – – – – 1,000 0,295 0,534D5 – – – – – 1,000 0,363

D6 – – – – – – 1,000

Tabla 15: Matriz de Correlación - Hoteles Santiago de Chile

34

Page 46: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Como se muestra en la tabla 15, existen correlaciones positivas entre todas las dimensiones. En todos

los casos, las correlaciones son significativas, porque el valor ρ es menor que el nivel de significación

elegido (α = 0,05). Además, las correlaciones van de moderadas a medianamente fuerte.

Se puede observar que el mayor grado de correlación se da entre Instalaciones y Servicios y

Comodidad, lo cual podría indicarnos que los clientes mientras más cómodos se sientan con las

instalaciones y servicios del hotel, mejor va ser su percepción y calificación en cuanto a la calidad

y precio de este. Por otra parte, se puede ver otra correlación medianamente fuerte entre Rating e

Instalaciones y servicios, lo cual podría decirnos que los clientes entregarán un mayor Rating al recibir

mejores instalaciones y buenos servicios.

D [ %] Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

D0 100 47,3 38,5 35,1 35,1 22,9 39,0

D1 – 100 32,0 23,0 32,1 8,9 25,7

D2 – – 100 33,2 39,9 10,1 26,4

D3 – – – 100 24,3 14,6 34,8

D4 – – – – 100 8,7 28,5

D5 – – – – – 100 13,1

D6 – – – – – – 100

Tabla 16: Coeficiente de Determinación - Hoteles Santiago de Chile

Un 47,3 % del Rating es debido a las Instalaciones y Servicios

Un 39,9 % de la Comodidad es debido a la Limpieza

2. Matriz de Correlación Hoteles de Bogota

D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

D0 1,000 0,749 0,629 0,610 0,676 0,565 0,598D1 – 1,000 0,571 0,481 0,621 0,557 0,604D2 – – 1,000 0,559 0,690 0,409 0,463

D3 – – – 1,000 0,555 0,397 0,531D4 – – – – 1,000 0,460 0,577D5 – – – – – 1,000 0,425

D6 – – – – – – 1,000

Tabla 17: Matriz de Correlación - Hoteles de Bogota Colombia

Como se muestra en la tabla 17, existen correlaciones positivas entre todas las dimensiones. En todos

los casos, las correlaciones son significativas, porque el valor ρ es menor que el nivel de significación

elegido (α = 0,05). Además, las correlaciones van de moderadas a muy fuerte.

Se puede observar que el mayor grado de correlación se da entre Instalaciones y Servicios y Rating, lo

cual podría indicarnos que los clientes mientras más satisfechos estén con las instalaciones y servicios

de estos hoteles, mejor será la calificación al Rating. Además, se puede ver una segunda correlación

alta entre Limpieza y Comodidad, lo cual nos indicaría que mientras más limpio este el lugar de

hospedaje .mayor será la valoración de comodidad del cliente.

35

Page 47: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

D [ %] Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

D0 100 56.1 39,5 37,2 45,6 31,9 35,7

D1 – 100 32,6 23,1 38,5 31,0 36,4

D2 – – 100 31,2 47,6 16,7 21,4

D3 – – – 100 30,8 15,7 28,1

D4 – – – – 100 21,1 33,2

D5 – – – – – 100 18,0

D6 – – – – – – 100

Tabla 18: Coeficiente de Determinación - Hoteles de Bogota Colombia

Un 56,1 % del Rating es debido a las Instalaciones y Servicios

Un 47,6 % de la Comodidad es debido a la Limpieza

3. Matriz de Correlación Hoteles de Buenos Aires

D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

D0 1,000 0,662 0,564 0,597 0,638 0,416 0,567D2 – 1,000 0,437 0,389 0,514 0,369 0,416

D3 – – 1,000 0,524 0,605 0,406 0,483

D3 – – – 1,000 0,470 0,383 0,458

D4 – – – – 1,000 0,311 0,527D65 – – – – – 1,000 0,368

D6 – – – – – – 1,000

Tabla 19: Matriz de Correlación - Hoteles de Buenos Aires Argentina

Como se muestra en la tabla 19, existen correlaciones positivas entre todas las dimensiones. En todos

los casos, las correlaciones son significativas, porque el valor ρ es menor que el nivel de significación

elegido (α = 0,05). Además, las correlaciones van de moderadas a muy fuerte.

Se puede observar que el mayor grado de correlación se da entre Rating e Instalaciones y Servicios, lo

cual, tal como en el caso anterior, se puede interpretar como: mientras mejores servicios e instalaciones

tenga el hotel mejor será la calificación general del cliente. Además, entre Comodidad e Instalaciones

y servicios también se da una correlación alta, lo cual se puede interpretarse de la siguiente manera:

mientras mejores sean los servicios e instalaciones mejor será la valoración de la comodidad entregada

por el cliente.

D [ %] Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

D0 100 43,8 31,8 35,6 40,7 17,3 32,1

D1 – 100 19,0 15.1 26,4 15,1 17,3

D2 – – 100 27,4 36,6 16,4 23,3

D3 – – – 100 22,0 14,6 20,9

D4 – – – – 100 9,6 27,7

D5 – – – – – 100 13,5

D6 – – – – – – 100

Tabla 20: Coeficiente de Determinación - Hoteles Buenos Aires Argentina

Un 43,8 % del Rating es debido a las Instalaciones y Servicios

36

Page 48: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Un 40,7 % del Rating es debido a la Comodidad

4. Matriz de Correlación Hoteles de Lima

D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

D0 1,000 0,674 0,673 0,602 0,675 0,580 0,629D1 – 1,000 0,608 0,487 0,610 0,441 0,494

D2 – – 1,000 0,564 0,793 0,499 0,573D3 – – – 1,000 0,488 0,376 0,547D4 – – – – 1,000 0,457 0,528D5 – – – – – 1,000 0,471

D6 – – – – – – 1,000

Tabla 21: Matriz de Correlación - Hoteles de Lima Perú

Como se muestra en la tabla 21, existen correlaciones positivas entre todas las dimensiones. En todos

los casos, las correlaciones son significativas, porque el valor ρ es menor que el nivel de significación

elegido (α = 0,05). Además, las correlaciones van de moderadas a muy fuerte.

Se puede observar que las dimensiones con mayor grado de correlación son Limpieza con Comodidad,

lo cual se puede interpretar como: los clientes de la localidad de Lima se sienten con mayor comodidad

al tener un ambiente más limpio. Además, nuevamente existe una correlación medianamente fuerte

entre Rating y comodidad lo cual quiere decir que las personas de esta localidad al estar más cómodas

en un determinado hotel darán una mejor valoración general.

D [ %] Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

D0 100 45,4 45,2 36,2 45,5 33,6 39,5

D1 – 100 36,9 23,7 37,2 19,4 24,4

D2 – – 100 31,8 62,8 24,9 32,8

D3 – – – 100 23,8 14,1 29,9

D4 – – – – 100 20,8 27,8

D5 – – – – – 100 22,1

D6 – – – – – – 100

Tabla 22: Coeficiente de Determinación - Hoteles de Lima

Un 62,8 % de la Comodidad es debido a la Limpieza

Un 45,5 % del Rating es debido a la Comodidad

5. Matriz de Correlación Hoteles de Montevideo

D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

D0 1,000 0,714 0,569 0,645 0,666 0,405 0,696D1 – 1,000 0,547 0,569 0,681 0,321 0,689D2 – – 1,000 0,489 0,722 0,298 0,687D3 – – – 1,000 0,618 0,267 0,591D4 – – – – 1,000 0,340 0,788D5 – – – – – 1,000 0,444

D6 – – – – – – 1,000

Tabla 23: Matriz de Correlación - Hoteles de Montevideo Uruguay

37

Page 49: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Como se muestra en la tabla 23, existen correlaciones positivas entre todas las dimensiones. En todos

los casos, las correlaciones son significativas, porque el valor ρ es menor que el nivel de significación

elegido (α = 0,05). Además, las correlaciones van de moderadas a muy fuerte.

Se puede observar que existe nuevamente una mayor correlación alta entre las dimensiones Rating e

Instalaciones y Servicios, lo cual nos puede indicar que los usuarios de la localidad de Montevideo,

dan una mejor valoración del Rating dependiendo en mayor medida de los servicios obtenidos y de las

instalaciones del hotel. Además, también existe una correlación alta entre las dimensiones Limpieza y

Comodidad, lo cual indica que a mayor Limpieza mejor es la comodidad de los clientes.

D [ %] Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

D0 100 50,9 32,3 41,6 44,3 16,4 48,4

D1 – 100 29,9 32,3 46,3 10,3 47,4

D2 – – 100 23,9 52.1 8,8 47,1

D3 – – – 100 38,1 7,1 34,9

D4 – – – – 100 11,5 62,0

D5 – – – – – 100 19,7

D6 – – – – – – 100

Tabla 24: Coeficiente de Determinación - Hoteles de Montevideo

Un 62,0 % de la Comodidad es debido a la Calidad/Precio

Un 52,1 % de la Comodidad es debido a la Limpieza

6. Matriz de Correlación Hoteles de Quito

D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

D0 1,000 0,753 0,570 0,633 0,603 0,546 0,671D1 – 1,000 0,563 0,542 0,600 0,495 0,494

D2 – – 1,000 0,580 0,678 0,346 0,484

D3 – – – 1,000 0,523 0,397 0,584D4 – – – – 1,000 0,456 0,578D5 – – – – – 1,000 0,583D6 – – – – – – 1,000

Tabla 25: Matriz de Correlación - Hoteles de Quito Ecuador

Como se muestra en la tabla 25, existen correlaciones positivas entre todas las dimensiones. En todos

los casos, las correlaciones son significativas, porque el valor ρ es menor que el nivel de significación

elegido (α = 0,05). Además, las correlaciones van de moderadas a muy fuerte.

Se puede observar que existe una correlación fuerte entre las dimensiones Rating e Instalaciones y

Servicios, lo cual no indica que mientras mejor infraestructura y servicios del hotel, mejor será la

calificación general de este. La segunda correlación más fuerte, se da entre Rating y Calidad/Precio,

lo que nos podría indicar que los viajeros de esta localidad les interesa el precio de los hoteles versus

la calidad entregada para poder efectuar una mejor valoración del hotel.

38

Page 50: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

D [ %] Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

D0 100 56,7 32,4 40,0 36,3 29,8 45,0

D1 – 100 31,6 29,3 36,0 24,5 24,4

D2 – – 100 33,6 45,9 11,9 23,4

D3 – – – 100 27,3 15,7 34,1

D4 – – – – 100 20,7 33,4

D5 – – – – – 100 33,9

D6 – – – – – – 100

Tabla 26: Regresión Lineal - Hoteles de Quito

Un 56,7 % del Rating es debido a las Instalaciones y Servicios

Un 45,9 % de la Comodidad es debido a la Limpieza

7. Matriz de Correlación Hoteles de Río de Janeiro

D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

D0 1,000 0,720 0,720 0,665 0,647 0,653 0,642D1 – 1,000 0,636 0,567 0,610 0,378 0,537D2 – – 1,000 0,586 0,660 0,412 0,526D3 – – – 1,000 0,534 0,431 0,528D4 – – – – 1,000 0,322 0,552D5 – – – – – 1,000 0,427

D6 – – – – – – 1,000

Tabla 27: Matriz de Correlación - Hoteles de Río de Janeiro

Como se muestra en la tabla 27, existen correlaciones positivas entre todas las dimensiones. En todos

los casos, las correlaciones son significativas, porque el valor ρ es menor que el nivel de significación

elegido (α = 0,05). Además, las correlaciones van de moderadas a muy fuerte.

Se puede observar que las dimensiones con mayor grado de correlación son Rating con Instalaciones

y Servicios, lo cual no indica que mientras mejor infraestructura y servicios del hotel, mejor será la

calificación general de este. Además, existe una correlación igual a la anterior entre Rating y Limpieza,

lo cual nos podría indicar que los clientes de los hoteles de Río de Janeiro, se basan mayormente en la

limpieza del hotel para dar su valoración general.

D [ %] Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

D0 100 51,8 51,8 44,2 41,8 42,6 41,2

D1 – 100 40,0 32,1 37,2 14,2 28,8

D2 – – 100 34,3 43,5 16,9 23,4

D3 – – – 100 28,5 18,5 27,6

D4 – – – – 100 10,3 30,4

D5 – – – – – 100 18,2

D6 – – – – – – 100

Tabla 28: Coeficiente de Determinación - Hoteles de Quito

Un 51,8 % del Rating es debido a las Instalaciones y Servicios

Un 51,8 % del Rating es debido a la Limpieza

39

Page 51: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

8. Matriz de Correlación Hoteles de Ciudad de México

D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

D0 1,000 0,685 0,607 0,640 0,654 0,426 0,613D1 – 1,000 0,552 0,567 0,631 0,357 0,505D2 – – 1,000 0,554 0,656 0,475 0,521D3 – – – 1,000 0,545 0,450 0,575D4 – – – – 1,000 0,391 0,509D5 – – – – – 1,000 0,430

D6 – – – – – – 1,000

Tabla 29: Matriz de Correlación - Hoteles de Ciudad de México

Como se muestra en la tabla 29, existen correlaciones positivas entre todas las dimensiones. En todos

los casos, las correlaciones son significativas, porque el valor ρ es menor que el nivel de significación

elegido (α = 0,05). Además, las correlaciones van de moderadas a muy fuerte.

Se puede observar que las dimensiones con mayor grado de correlación son Rating con Instalaciones

y servicios, lo cual no indica que mientras mejor infraestructura y servicios del hotel, mejor será

la calificación general de este. Además, existe una correlación medianamente alta entre Limpieza y

Comodidad, lo cual nos podría indicar que los clientes de los hoteles de Ciudad de México realizan su

valoración de comodidad con respecto a la limpieza.

D [ %] Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

D0 100 46,9 36,8 40,9 42,7 18,1 37,5

D1 – 100 30,4 32,1 39,8 12,7 25,5

D2 – – 100 30,6 43,0 22.5 27,1

D3 – – – 100 29,7 20,2 33,0

D4 – – – – 100 15,2 25,9

D5 – – – – – 100 18,4

D6 – – – – – – 100

Tabla 30: Coeficiente de Determinación - Hoteles de México

Un 46,9 % del Rating es debido a las Instalaciones y Servicios

Un 42,7 % del Rating es debido a la Comodidad

9. Matriz de Correlación Hoteles de Panamá

D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

D0 1,000 0,764 0,704 0,712 0,775 0,516 0,745D1 – 1,000 0,671 0,626 0,717 0,511 0,654D2 – – 1,000 0,645 0,783 0,451 0,619D3 – – – 1,000 0,654 0,454 0,629D4 – – – – 1,000 0,462 0,673D5 – – – – – 1,000 0,453

D6 – – – – – – 1,000

Tabla 31: Matriz de Correlación - Hoteles de Ciudad de México

40

Page 52: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Como se muestra en la tabla 31, existen correlaciones positivas entre todas las dimensiones. En todos

los casos, las correlaciones son significativas, porque el valor ρ es menor que el nivel de significación

elegido (α = 0,05). Además, las correlaciones van de moderadas a muy fuerte.

Se puede observar que las dimensiones con mayor grado de correlación son Rating con Comodidad, lo

cual nos puede indicar que los usuarios de hoteles de esta localidad darán una mejor valoración general

al poseer mayor comodidad. Además, los clientes de Panamá dan un mayor Rating a los hoteles con

respecto a la calidad y precio obtenidos.

D [ %] Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

D0 100 58,3 45,5 50,6 60,0 26,6 55,5

D1 – 100 45,0 39,1 51,4 26,1 42,7

D2 – – 100 41,6 61,3 20,3 38,3

D3 – – – 100 42,7 20,6 39,5

D4 – – – – 100 21,3 45,2

D5 – – – – – 100 20,5

D6 – – – – – – 100

Tabla 32: Coeficiente de Determinación - Hoteles de Panamá

Un 61,3 % de la Comodidad es debido a la Limpieza

Un 58,3 % del Rating es debido a las Instalaciones y Servicios

Por lo tanto, las dimensiones que poseen mayor relación en los hoteles de Latinoamérica, y que

por lo tanto marcan una tendencia clara, son la relación entre las dimensiones Rating e Instalaciones y

Servicios, seguido de Comodidad y Limpieza.

5.3.4. Kruskall Wallis H

En segundo lugar, se realizó la prueba no paramétrica de Kruskal −Wallis H , la cual nos permite

decidir si puede aceptarse la hipótesis de que K muestras independientes proceden de la misma población

o de poblaciones idénticas con la misma mediana. El único supuesto necesario para realizar esta prueba

es que las distribuciones subyacentes de las variables sean continuas y que estas hayan sido medidas

por lo menos en una escala ordinal. Dado que las condiciones mencionadas anteriormente se cumplen,

procedemos a comprobará la siguiente hipótesis:

H0: No existen diferencias significativas entre las opiniones de los diferentes tipos de viajeros.

H1: Existen diferencias significativas entre las opiniones de los diferentes tipos de viajeros.

Como regla de decisión se utiliza ρ = 0, 05.

D0 D1 D2 D3 D3 D5 D6

ρ− valor 0,002 0,000 0,005 0,011 0,006 0,119 0,007

Tabla 33: Prueba 1: Kruskal-Wallis H - Tipos de viajeros en Santiago, por dimensiones

41

Page 53: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Los resultados de la Prueba 1: Kruskal-Wallis H (tabla 33) indican que existen diferencias

significativas entre las opiniones de los diferentes tipos de viajeros en las dimensiones de: D0

(Rating), D1 (Instalaciones y Servicios), D2 (Limpieza), D3 (Personal del Hotel), D4 (Comodidad),

D6 (Calidad/Precio); y por consiguiente, no existen diferencia significativas únicamente en la dimensión

D5 (Ubicación).

D0 D1 D2 D3 D3 D5 D6

ρ− valor 0,006 0,012 0,017 0,008 0,000 0,012 0,267

Tabla 34: Prueba 2: Kruskal-Wallis H - Tipos de viajeros en Bogota, por dimensiones

Los resultados de la Prueba 2: Kruskal-Wallis H (tabla 34) indican que existen diferencias

significativas entre las opiniones de los diferentes tipos de viajeros en las dimensiones de: D0 (Rating), D1

(Instalaciones y Servicios), D2 (Limpieza), D3 (Personal del Hotel), D4 (Comodidad), D5 (Ubicación);

y por consiguiente, no existen diferencia significativas únicamente en la dimensión D6 (Calidad/Precio).

D0 D1 D2 D3 D3 D5 D6

ρ− valor 0,001 0,069 0,000 0,003 0,000 0,091 0,195

Tabla 35: Prueba 3: Kruskal-Wallis H - Tipos de viajeros en Buenos Aires, por dimensiones

Los resultados de la Prueba 3: Kruskal-Wallis H (tabla 35) indican que existen diferencias

significativas entre las opiniones de los diferentes tipos de viajeros en relación a las dimensiones de:

D0 (Rating), D2 (Limpieza), D3 (Personal del Hotel), D4 (Comodidad); y por consiguiente, no existen

diferencia significativas únicamente en las dimensiones D1 (Instalaciones y Servicios), D5 (Ubicación)

y D6 (Calidad/Precio).

D0 D1 D2 D3 D3 D5 D6

ρ− valor 0,000 0,000 0,000 0,000 0,000 0,008 0,006

Tabla 36: Prueba 4: Kruskal-Wallis H - Tipos de viajeros en Lima, por dimensiones

Los resultados de la Prueba 4: Kruskal-Wallis H (tabla 36) indican que existen diferencias

significativas entre las opiniones de los diferentes tipos de viajeros (Negocio, Parejas, Familias, Amigos,

Solos y LGBT).

D0 D1 D2 D3 D3 D5 D6

ρ− valor 0,564 0,420 0,009 0,010 0,803 0,511 0,370

Tabla 37: Prueba 5: Kruskal-Wallis H - Tipos de viajeros en Quito, por dimensiones

Los resultados de la Prueba 5: Kruskal-Wallis H (tabla 37) indican que existen diferencias

significativas entre las opiniones de los diferentes tipos de viajeros únicamente en relación con las

dimensiones D2 (Limpieza) y D3 (Personal del Hotel).

42

Page 54: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

D0 D1 D2 D3 D3 D5 D6

ρ− valor 0,000 0,000 0,000 0,000 0,000 0,000 0,000

Tabla 38: Prueba 6: Kruskal-Wallis H - Tipos de viajeros en Río de Janeiro, por dimensiones

Los resultados de la Prueba 6: Kruskal-Wallis H (tabla 38) indican que existen diferencias

significativas entre las opiniones de los diferentes tipos de viajeros (Negocio, Parejas, Familias, Amigos,

Solos y LGBT).

D0 D1 D2 D3 D3 D5 D6

ρ− valor 0,190 0,868 0,986 0,063 0,894 0,044 0,804

Tabla 39: Prueba 7: Kruskal-Wallis H - Tipos de viajeros de Montevideo, por dimensiones

Los resultados de la Prueba 7: Kruskal-Wallis H (tabla 39) indican que existen diferencias

significativas entre las opiniones de los diferentes tipos de viajeros únicamente en relación con la

dimensión D5 (Ubicación).

D0 D1 D2 D3 D3 D5 D6

ρ− valor 0,000 0,000 0,000 0,000 0,000 0,000 0,000

Tabla 40: Prueba 8: Kruskal-Wallis H - Tipos de viajeros en Ciudad de México, por dimensiones

Los resultados de la Prueba 8: Kruskal-Wallis H (tabla 40) indican que existen diferencias

significativas entre las opiniones de los diferentes tipos de viajeros (Negocio, Parejas, Familias, Amigos,

Solos y LGBT).

D0 D1 D2 D3 D3 D5 D6

ρ− valor 0,000 0,000 0,000 0,000 0,000 0,000 0,000

Tabla 41: Prueba 9: Kruskal-Wallis H - Tipos de viajeros en Panamá, por dimensiones

Los resultados de la Prueba 9: Kruskal-Wallis H (tabla 41) indican que existen diferencias

significativas entre las opiniones de los diferentes tipos de viajeros (Negocio, Parejas, Familias, Amigos,

Solos y LGBT).

Como se puede observar las localidades que presentan mayor cantidad de diferencias significativas

en todas sus dimensiones son las que poseen mayor cantidad de comentarios como es el caso de Río

de Janeiro, Ciudad de México y Panamá. Por otro lados las que poseen menor cantidad de diferencias

significativas son las que posen menos comentarios, como es el caso de Santiago de Chile y Montevideo.

5.3.5. Kruskall Wallis H por año de publicación

En los siguientes análisis también se utilizó la prueba no paramétrica de Kruskal−Wallis H , pero

esta vez aplicada a cada locación según año de publicación de cada comentario, es decir, se ordenaron

43

Page 55: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

los datos de cada Excel según su fecha, las cuales están en un rango desde el año 2007 al año 2016, y

luego se realizó la prueba para el conjunto de dimensiones correspondientes a cada año, con el objetivo

de comprobar la siguiente hipótesis:

H0: No existen diferencias significativas entre las opiniones de los diferentes tipos de viajeros en

el año analizado.

H1: Existen diferencias significativas entre las opiniones de los diferentes tipos de viajeros en el

año analizado.

Como regla de decisión se utiliza ρ = 0, 05.

Como observación, se puede ver que no todas las tablas poseen la misma cantidad de años, esto

debido a que debe existir un mínimo de comentarios por locación para poder realizar la prueba no

paramétrica de Kruskal − Wallis H , el cual consideramos sobre 5 comentarios. Por ende, aquella

tabla que no posea un año del rango 2007-2016, es debido a que posee menos de 5 comentarios.

Dimensión / Año Año D0 D1 D2 D3 D4 D5 D6

ρ− valor

2009 0,506 0,506 0,261 0,261 0,261 0,375 0,261

2010 0,599 0,221 0,725 0,456 0,849 0,805 0,074

2011 0,162 0,165 0,184 0,189 0,180 0,234 0,160

2012 0,010 0,036 0,079 0,158 0,183 0,301 0,159

2013 0,185 0,080 0,049 0,122 0,048 0,232 0,240

2014 0,141 0,168 0,483 0,077 0,472 0,785 0,385

2015 0,311 0,298 0,465 0,587 0,063 0,064 0,758

Tabla 42: Prueba 1: Kruskal-Wallis H - Tipos de viajeros en Santiago de Chile por año de publicación

Los resultados de la Prueba 1: Kruskal-Wallis H tabla 42 indican que existen diferencias significa-

tivas solo en los años 2012 y 2013. Las dimensiones que presentan estas diferencias significativas son:

D0 (Rating), D1 (Instalaciones y Servicios), D2 (Limpieza) y D4 (Comodidad). Por consiguiente, no

existen diferencia significativas en el resto de los años (2009, 2010, 2011, 2014 y 2015).

Dimensión / Año Año D0 D1 D2 D3 D3 D5 D6

ρ− valor

2009 0,515 0,711 0,801 0,000 0,515 0,366 0,706

2010 0,364 0,388 0,257 0,186 0,021 0,438 0,096

2011 0,519 0,547 0,329 0,221 0,333 0,619 0,555

2012 0,288 0,183 0,109 0,122 0,305 0,209 0,171

2013 0,336 0,095 0,793 0,111 0,242 0,269 0,438

2014 0,019 0,014 0,004 0,054 0,006 0,156 0,174

2015 0,541 0,291 0,374 0,495 0,613 0,236 0,840

Tabla 43: Prueba 2: Kruskal-Wallis H - Tipos de viajeros en Bogotá por año de publicación

Los resultados de la Prueba 2: Kruskal-Wallis H tabla 43 indican que existen diferencias

significativas en los años 2009, 2010 y 2014. Las dimensiones que presentan estas diferencias

significativas son: D0 (Rating), D1 (Instalaciones y Servicios), D2 (Limpieza), D3 (Personal del Hotel),

y D4 (Comodidad). Por consiguiente, no existen diferencia significativas en el resto de los años (2011,

44

Page 56: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

2012, 2013 y 2015).

Dimensión / Año Año D0 D1 D2 D3 D3 D5 D6

ρ− valor

2007 0,596 0,277 0,490 0,487 0,679 0,490 0,490

2008 0,331 0,137 0,607 0,363 0,685 0,769 0,065

2009 0,671 0,669 0,224 0,551 0,659 0,328 0,905

2010 0,092 0,278 0,105 0,085 0,057 0,009 0,205

2011 0,711 0,547 0,609 0,045 0,589 0,692 0,377

2012 0,365 0,852 0,177 0,733 0,071 0,411 0,739

2013 0,139 0,162 0,282 0,247 0,023 0,776 0,746

2014 0,074 0,156 0,001 0,196 0,042 0,285 0,069

2015 0,108 0,033 0,077 0,456 0,559 0,879 0,450

Tabla 44: Prueba 3: Kruskal-Wallis H - Tipos de viajeros en Buenos Aires por año de publicación

Los resultados de la Prueba 3: Kruskal-Wallis H tabla 44 indican que existen diferencias

significativas en los años 2010m, 2011, 2013, 2014 y 2015. Las dimensiones que presentan estas

diferencias significativas son: D1 (Instalaciones y Servicios), D2 (Limpieza), D3 (Personal del Hotel),

D4 (Comodidad) y D5 (Ubicación). Por consiguiente, no existen diferencia significativas en el resto de

los años (2007, 2008, 2009 y 2012).

Dimensión / Año Año D0 D1 D2 D3 D3 D5 D6

ρ− valor

2007 0,596 0,277 0,490 0,487 0,679 0,490 0,490

2008 0,506 0,261 0,000 0,506 0,261 0,682 0,506

2009 0,843 0,653 0,718 0,330 0,870 0,873 0,149

2010 0,209 0,049 0,236 0,138 0,110 0,094 0,143

2011 0,096 0,076 0,175 0,427 0,165 0,582 0,396

2012 0,011 0,125 0,034 0,136 0,015 0,277 0,0042013 0,073 0,177 0,161 0,175 0,073 0,176 0,435

2014 0,243 0,228 0,328 0,584 0,023 0,027 0,189

2015 0,227 0,443 0,239 0,082 0,293 0,230 0,478

Tabla 45: Prueba 4: Kruskal-Wallis H - Tipos de viajeros en Lima por año de publicación

Los resultados de la Prueba 4: Kruskal-Wallis H tabla 45 indican que existen diferencias significati-

vas solo en los años 2008, 2012 y 2014. Las dimensiones que presentan estas diferencias significativas

son: D0 (Rating), D2 (Limpieza), D4 (Comodidad) y D5 (Ubicación) y D6 (Calidad/Precio). Por

consiguiente, no existen diferencia significativas en el resto de los años (2007, 2009, 2010 2011, 2013 y

2015).

Dimensión / Año Año D0 D1 D2 D3 D3 D5 D6

ρ− valor

2010 0,757 0,876 0,822 0,548 0,894 0,402 0,496

2011 0,357 0,110 0,248 0,162 0,291 0,665 0,148

2012 0,011 0,125 0,034 0,136 0,015 0,277 0,0042013 0,714 0,548 0,095 0,051 0,535 0,410 0,837

2014 0,040 0,023 0,154 0,066 0,147 0,122 0,0412015 0,057 0,306 0,229 0,146 0,456 0,112 0,058

Tabla 46: Prueba 5: Kruskal-Wallis H - Tipos de viajeros en Quito por año de publicación

45

Page 57: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Los resultados de la Prueba 5: Kruskal-Wallis H tabla 46 indican que existen diferencias significati-

vas solo en los años 2012 y 2014. Las dimensiones que presentan estas diferencias significativas son: D0

(Rating), D1 (Instalaciones y Servicios), D2 (Limpieza), D4 (Comodidad) y D6 (Calidad/Precio). Por

consiguiente, no existen diferencia significativas en el resto de los años (2010, 2011, 2013 y 2015).

Dimensión / Año Año D0 D1 D2 D3 D3 D5 D6

ρ− valor

2008 0,379 0,201 0,320 0,379 0,721 0,320 0,379

2009 0,038 0,092 0,423 0,203 0,079 0,245 0,333

2010 0,016 0,002 0,021 0,160 0,010 0,045 0,0122011 0,248 0,156 0,180 0,212 0,111 0,006 0,0372012 0,068 0,056 0,041 0,535 0,003 0,028 0,370

2013 0,004 0,006 0,000 0,034 0,001 0,000 0,213

2014 0,008 0,002 0,008 0,122 0,001 0,027 0,178

2015 0,000 0,001 0,000 0,004 0,000 0,002 0,051

2016 0,442 0,293 0,304 0,792 0,753 0,754 0,672

Tabla 47: Prueba 6: Kruskal-Wallis H - Tipos de viajeros en Río de Janeiro por año de publicación

Los resultados de la Prueba 6: Kruskal-Wallis H tabla 47 indican que existen diferencias

significativas en los años 2009, 2010, 2011, 2012, 2013, 2014 y 2015. Las dimensiones que presentan

estas diferencias significativas son: D0 (Rating), D1 (Instalaciones y Servicios), D2 (Limpieza), D3

(Personal del Hotel), D4 (Comodidad), D5 (Ubicación), y D6 (Calidad/Precio). Por consiguiente, no

existen diferencia significativas en el resto de los años (2008 y 2016).

Dimensión / Año Año D0 D1 D2 D3 D3 D5 D6

ρ− valor

2010 0,325 0,223 0,223 0,632 0,325 0,223 0,325

2012 0,508 0,304 0,478 0,536 0,451 0,339 0,220

2013 0,660 0,958 0,471 0,458 0,619 0,361 0,680

2014 0,585 0,811 0,559 0,371 0,731 0,328 0,437

2015 0,198 0,689 0,588 0,095 0,368 0,362 0,511

Tabla 48: Prueba 7: Kruskal-Wallis H - Tipos de viajeros en Montevideo por año de publicación

Los resultados de la Prueba 7: Kruskal-Wallis H tabla 48 indican que no existen diferencias

significativas solo en los años 2010, 2012, 2013, 2014 y 2015.

Dimensión / Año Año D0 D1 D2 D3 D3 D5 D6

ρ− valor

2007 0,442 0,136 0,088 0,168 0,476 0,777 0,373

2008 0,326 0,259 0,175 0,433 0,036 0,139 0,151

2009 0,157 0,098 0,074 0,070 0,043 0,003 0,0182010 0,140 0,007 0,118 0,470 0,194 0,238 0,105

2011 0,142 0,236 0,314 0,099 0,496 0,010 0,445

2012 0,003 0,122 0,288 0,118 0,034 0,051 0,127

2013 0,022 0,072 0,115 0,046 0,049 0,003 0,269

2014 0,003 0,000 0,001 0,000 0,001 0,117 0,002

2015 0,042 0,028 0,146 0,626 0,053 0,024 0,0462016 0,321 0,420 0,373 0,321 0,321 0,290 0,458

Tabla 49: Prueba 8: Kruskal-Wallis H - Tipos de viajeros en Ciudad de México por año de publicación

46

Page 58: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Los resultados de la Prueba 8: Kruskal-Wallis H tabla 49 indican que existen diferencias

significativas en los años 2008, 2009, 2010, 2011, 2012, 2013, 2014 y 2015. Las dimensiones que

presentan estas diferencias significativas son: D0 (Rating), D1 (Instalaciones y Servicios), D3 (Personal

del Hotel), D4 (Comodidad), D5 (Ubicación), y D6 (Calidad/Precio). Por consiguiente, no existen

diferencia significativas en el resto de los años (2007 y 2016).

Dimensión / Año Año D0 D1 D2 D3 D3 D5 D6

ρ− valor

2008 0,051 0,279 0,000 0,346 0,000 0,346 0,287

2009 0,325 0,008 0,114 0,116 0,274 0,002 0,048

2010 0,044 0,001 0,051 0,028 0,045 0,398 0,154

2011 0,000 0,000 0,000 0,024 0,000 0,000 0,0012012 0,000 0,000 0,000 0,004 0,000 0,000 0,0022013 0,000 0,000 0,000 0,018 0,000 0,002 0,0032014 0,000 0,000 0,000 0,001 0,000 0,000 0,0042015 0,000 0,000 0,000 0,033 0,000 0,033 0,0022016 0,456 0,423 0,401 0,334 0,336 0,321 0,380

Tabla 50: Prueba 9: Kruskal-Wallis H - Tipos de viajeros en Panamá por año de publicación

Los resultados de la Prueba 9: Kruskal-Wallis H tabla 50 indican que existen diferencias

significativas en los años 2008, 2009, 2010, 2011, 2012, 2013, 2014 y 2015. Las dimensiones que

presentan estas diferencias significativas son: D0 (Rating), D1 (Instalaciones y Servicios), D2 (Limpieza)

D3 (Personal del Hotel), D4 (Comodidad), D5 (Ubicación), y D6 (Calidad/Precio). Por consiguiente, no

existen diferencia significativas en año 2016.

47

Page 59: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

6. Síntesis de Resultados

Para poder cumplir con los objetivos establecidos en esta investigación, validaremos el conocimiento

obtenido e identificaremos las tendencias de evaluación en los datos analizados. Esto lo realizamos en

primer lugar, con una comparación entre la ciudad de Santiago y las ciudades de Chile; en segundo lugar,

una comparación entre Santiago de Chile y las ciudades de Latinoamérica.

6.1. Comparación Santiago de Chile y localidades de Chile

Según los análisis realizados en la primera fase de este estudio, el cual fue en hoteles de Chile,

podemos obtener los siguientes resultados:

A través del análisis de de Spearmanρ se observa una mayor cantidad de correlaciones positivas

que negativas en las ciudades de Chile, en cambio Santiago presenta una cantidad similar de

correlaciones positivas que negativas.

Al analizar que dimensión D0(Rating) se puede apreciar que la dimensión que posee menor

correlación es D5(Ubicacin) tanto en Santiago como el resto de las ciudades de Chile.

Al analizar que dimensión D0(Rating) se puede apreciar que las dimensiones que poseen mayor

correlación son D1(InstalacionesyServicios) y D6(Calidad/Precio) tanto en Santiago como

el resto de las ciudades de Chile.

La valoración general del Rating que los clientes realizan son bastante similares con un promedio

que varia entre 4,11 a 4,74 en todas las localidades (Santiago y Regiones), excepto en San Pedro

de Atacama que se presenta un promedio más bajo con un 3,86, además el más alto se presenta en

la localidad de Isla de Pascua.

La dimensión que presenta el promedio más alto es D6(Calidad/Precio) con un 4,94.

La dimensión que presenta el promedio más bajo es D1(InstalacionesyServicios) con 3,710.

6.2. Comparación Santiago de Chile y localidades de Latinoamérica

Según los análisis realizados en la segunda fase de este estudio, el cual fue en hoteles de

Latinoamérica, podemos obtener los siguientes resultados:

A través del análisis de de Spearmanρ se observa solo correlaciones positivas tanto en la localidad

de Santiago de Chile como en las de Latinoamérica. Estas, varían entre correlaciones bajas (ρ

entre : 0, 200− 0, 390) y correlaciones altas (ρ entre : 0, 600− 0, 790).

Al analizar que dimensión D0(Rating) se puede apreciar que la dimensión que posee menor

correlación es D5(Ubicacin) tanto en Santiago como el resto de las ciudades de Latinoamérica.

Al analizar que dimensión D0(Rating) se puede apreciar que las dimensiones que poseen mayor

correlación son D1(InstalacionesyServicios) tanto en Santiago como el resto de las ciudades de

Latinoamérica.

La valoración general del Rating que los clientes realizan varia entre 3,797 a 4,207. Encontrándose

este promedio del rating más bajo en la localidad de Santiago de Chile y el promedio más alto en

Bogota, Colombia.

48

Page 60: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

La prueba no paramétrica de Kruskall Wallis H indica que existen diferencias significativas en

todas las localidades analizadas.

La prueba de Kruskall Wallis H aplicada por año de publicación de los comentarios indica que

existen diferencias significativas entre los distintos años.

6.3. HotelClub V/S TripAdvisor

Terminando la fase analítica de nuestro estudio continua la fase de Difusión, según nuestra

metodología, y en esta nosotros debemos comunicar nuestras observaciones. Por lo tanto, realizaremos

una comparación de los resultados de nuestro caso de estudio Hotel Club (www.hotelclub.com), con el

de otros investigares, este es TripAdvisor (www.tripadvisor.cl).

6.3.1. Santiago y las ciudades de Chile analizadas

A continuación podemos ver los análisis de TripAdvisor en cuanto a la comparación de Santiago y

las ciudades de Chile analizadas, seguidos por la comparación realizada en HotelClub.

Con el análisis Spearman ρ se observa una correlación positiva en la mayor parte de la dimensiones

analizadas, tanto en Santiago como en las demás ciudades. En el caso de HotelClub, también se

observa una correlación positiva en la mayoría de las localidades, y estas tienden a fluctuar entre

un grado bajo a un grado alto de correlación.

Tras analizar la Valoración General (D0), la dimensión que influye en menor medida es

la Ubicación (D1). En HotelClub, se da la misma situación (correlación baja en dimensión

Ubicación), con cifras muy cercanas a cero. Además, la que posee mayor correlación en la mayoría

de las ciudades es Instalaciones y Servicios (D1).

Al momento de asignar la valoración general los viajeros lo hacen de manera similar tanto en

regiones como en Santiago. En HotelClub, también existe una valoración similar en el Rating o

valoración general con un promedio sobre 4, lo cual significa muy bueno.

El análisis Kruskal-Wallis H por el tipo de viajero indica que existen diferencias significativas al

momento en el que estos califican un hotel. En HotelClub, también existen diferencias significativas

entre los distintos tipos de viajeros, pero existen en las cuales no existen diferencias significativas,

como lo es el caso de Viña del Mar.

El mismo análisis pero sobre el año en el que fue realizada la valoración, también indica que

existen diferencias significativas. Esto se traduce a que los usuarios califican de forma distinta un

hotel según el año. En HotelClub en cambio, existen diferencias significativas, pero solo en algunos

años, ya que en la mayoría de los años no se registran evidencias significativas.

La dimensión con mejor promedio de evaluación tendió a ser predominantemente D1 (Ubicación).

En HotelClub, la dimensión que presenta el mayor promedio es Calidad/Precio en Montevideo con

un 4,942.

La dimensión con peor promedio de evaluación tendió a ser D5 (Mejor precio). En HotelClub, el

que presenta el peor promedio es Instalaciones y Servicios (D1) en Montevideo y Santiago de Chile

con un 3,701.

49

Page 61: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

6.3.2. Santiago de Chile y las ciudades de Latinoamérica analizadas

A continuación podemos ver los análisis de TripAdvisor en cuanto a la comparación de Chile y las

ciudades de Latinoamérica analizadas, seguidos por la comparación realizada en HotelClub.

Con el análisis Spearman ρ se observa una correlación positiva en la mayor parte de las dimensiones

analizadas, tanto en Santiago como en las demás ciudades de Latinoamérica. Estas siguen una

tendencia de fluctuar entre moderada a altamente correlacionadas. En el caso de HotelClub, también

se observa una correlación positiva en la mayoría de las localidades, y estas tienden a fluctuar entre

correlaciones bajas (ρ entre : 0, 200− 0, 390) y correlaciones altas (ρ entre : 0, 600− 0, 790).

La dimensión que influye en menor medida sobre la Valoración General (D0) tiende a ser D1

(Ubicación) en la mayoría de las ciudades. En HotelClub, se da la misma situación, con cifras

muy cercanas a cero. Además, la que posee mayor correlación en la mayoría de las ciudades es

Instalaciones y Servicios (D1).

La Valoración General de los viajeros tiene una tendencia similar en las distintas ciudades de

Latinoamérica con respecto a Santiago de Chile. En HotelClub, también existe una valoración

similar, esta varia entre 3,797 a 4,207. Encontrándose el promedio del rating más bajo en la

localidad de Santiago de Chile y el promedio más alto en Bogota, Colombia.

El análisis Kruskal-Wallis H indica que si existe una diferencia significativa entre las valoraciones

de los distintos tipos de viajeros en las diversas ciudades. En HotelClub, indica que existen

diferencias significativas en todas las localidades analizadas.

También, el mismo análisis pero sobre el año en el que fue realizada la valoración, indica que

también existen diferencias significativas entre un año y otro. En HotelClub, indica que existen

diferencias significativas entre los distintos años.

La dimensión con mejor promedio de evaluación tendió a ser predominantemente D1 (Ubicación).

En HotelClub, la dimensión que presenta el mayor promedio es Calidad/Precio.

La dimensión con peor promedio de evaluación tendió a ser D5 (Mejor precio). En HotelClub, el

que presenta el peor promedio es Instalaciones y Servicios (D1).

50

Page 62: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

7. Conclusiones y Trabajo Futuro

Es fundamental, para este estudio, conocer la diferencia entre experiencia del cliente (CX)

y experiencia del usuario (UX). CX extiende el concepto de UX, inclusive más allá del uso de

sistemas de software interactivo, servicios y productos. UX se ocupa de las personas que interactúan

con el producto y la experiencia que reciben de esa interacción. CX, por el contrario, abarca

todas las interacciones que una persona tiene con su marca, empresa u organización; centrándose

en la ciencia gestión e ingeniería de los servicios como área de estudio interdisciplinar. De esta

manera, se entiende como ciencia al crear al crear conocimiento; como gestión al convertirse en un

valor empresarial; y se manifiesta como ingeniería por el hecho de contribuir al desarrollo técnico y social.

En el presente estudio, se desarrolló una herramienta en el lenguaje de programación JAVA, la

cual permitió extraer los datos de opiniones de clientes de hotelclub.com en los principales hoteles y

localidades de latinoamérica. Las localidades utilizadas fueron: Santiago de Chile, Bogotá, Buenos

Aires, Lima, Quito, Río de Janeiro, Montevideo, Ciudad de México y Panamá. Estas localidades suman

170 hoteles con 4687 comentarios en total. La mayoría de las investigaciones de este rubro se centran en

análisis cualitativos, pero nosotros decidimos tomar un enfoque alternativo, poniendo especial atención

en lo que respecta los datos cuantitativos. De esta forma, buscamos tendencias en los datos para medir

la experiencia del cliente de dicha agencia virtual de alojamiento; interpretando la experiencia vivi-

da por los usuarios, la continuidad en el uso del servicio y las posibles recomendaciones a futuros clientes.

Para llevar a cabo ello, se procedió al análisis de los datos cuantitativos sobre los hoteles situados en

Latinoamérica, los cuales se caracterizan por contar con la mayor popularidad y concurrencia turística

de entre los usuarios. La agencia virtual de alojamiento elegida como caso de estudio es: Hotelclub.com,

como se mencionó anteriormente, la cual posee libre acceso a los datos en el sitio web; ya sean datos

cualitativos como cuantitativos. Los viajeros de esta agencia virtual de alojamiento, entregan una

calificación en una escala de 1 a 5, donde 1 representa la peor puntuación y 5 la mejor. Dividimos

los viajeros en dos grandes grupos según su tipo de viaje en Negocio y Ocio. Los viajeros de Ocio se

subdividen a su vez, según la finalidad del viaje, esto es en viajes de parejas, amigos, solos, familia y

LGBT.

Los resultados de las medias aritméticas indican que en promedio los usuarios de esta agencia virtual

de alojamiento valoran mejor la dimensión Comodidad (D4) en el caso de las ciudades de Chile y la

dimensión Calidad/Precio (D6) en el caso de las localidades de Latinoamérica. El peor promedio de las

ciudades de Chile se da en la dimensión Instalaciones y Servicios (D1) al igual que en las localidades

de Latinoamérica, en donde encontramos Montevideo y Santiago de Chile como las ciudades con el

promedio más bajo. Esto, nos puede indicar que los clientes que visitan estos hoteles (que en su mayoría

son extranjeros), encuentran más deficiente las Instalaciones y servicios de estos a diferencia del resto de

países de Latinoamérica.

La prueba de Spearman ρ nos indica la existencia de correlaciones positivas en la mayor parte

de Chile, por ende, solo algunas negativas en regiones, y solo correlaciones positivas en territorio

Latinoamericano. Las correlaciones se presentan desde un grado muy bajo (ρ entre : 0 − 0, 190,)

hasta un grado muy alto (ρ entre : 0, 800 − 1) para el caso de las ciudades de Chile; bajo (ρ

51

Page 63: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

entre : 0, 200 − 0, 390 hasta un grado alto (ρ entre : 0, 600 − 0, 790) para el caso de las localidades

de Latinoamérica. Al analizar la dimensión del Rating, se puede apreciar que la dimensión con la que

posee menor relación es la Ubicación (D5) y con la que posee mayor relación es con Instalaciones y

Servicios (D1). Por lo tanto, de estos análisis se puede deducir, que los clientes no valoran los recintos

hoteleros por la ubicación en los que estos se encuentren; y por ende, lo más importante para ellos son

las instalaciones y los servicios recibidos en estos.

La prueba de Kruskall-Wallis H, indica que existen diferencias significativas entre los diferentes

tipos de viajeros (negocio, parejas, amigos, solos, familia y LGBT) de las localidades de Chile y

Latinoamérica. Lo cual nos puede indicar, que los clientes de estas agencias virtuales de alojamiento

opinan de forma distinta dependiendo de su finalidad de viaje, ya sea de negocio u ocio. Las localidades

que no presentan diferencias significativas en alguna de sus dimensiones son: Santiago de Chile en

D5 (Ubicación), Bogota en D6 Calidad/Precio, Quito en D2 Limpieza y D3 Personal del Hotel; y

por último Montevideo en la dimensión D5 Ubicación. Además, se realizó esta prueba por año de

publicación de los comentarios, los cuales van entre el año 2007 y 2016. Estos análisis indican que

existen diferencias significativas entre los distintos años analizados, tanto en las localidades de Chile

como en Latinoamérica. Esto, nos da a entender que los recintos hoteleros van evolucionando en el

tiempo, y mejorando las falencias que tuvieron en años anteriores, por ende, los comentarios tienden a

ser distintos entre cada año.

Finalmente se realizó una síntesis de los resultados de este estudio y se compararon las localidades de

Chile con su capital (Santiago de Chile), y esta a su vez con las localidades de Latinoamérica. En general,

los análisis de correlación de Spearman ρ, señalan que que existe mayor cantidad de correlaciones

positivas, tanto en Chile como en localidades de Latinoamérica, en esta última no existen correlaciones

negativas; la dimensión con menor correlación con respecto a la valoración general del Rating (D0) es la

Ubicación (D5), esto tanto para Chile como para Latinoamérica. Kruskall Wallis H , indica que existen

diferencias significativas en todas las localidades analizadas. Además, se realizo esta prueba por año de

publicación de los comentarios, encontrándose diferencias entre estos, lo cual lo interpretamos como una

evolución en las características de los hoteles en cada año. El análisis de medias, para Chile y en cuanto

a el Rating de cada localidad indica que son bastante similares mostrando un promedio sobre 4 en la

mayoría de estas ciudades; para el caso de Latinoamérica existe una puntuación más baja, variado entre

3,797 a 4,207, siendo la más baja en Santiago de Chile y la más alta en Bogota.

Para poder cumplir con los objetivos establecidos en esta investigación, validaremos el conocimiento

obtenido e identificaremos las tendencias de evaluación en los datos analizados. Esto lo realizamos en

primer lugar, con una comparación entre la ciudad de Santiago y las ciudades de Chile; en segundo

lugar, una comparación entre Santiago de Chile y las ciudades de Latinoamérica. Las comparaciones

tendieron a ser bastante similares, con correlaciones positivas, menor correlación de la dimensión Rating

con la dimensión Ubicación, diferencias significativas en la mayoría de las localidades y con pequeñas

variaciones en los mejores y peores promedios de cada dimensión, lo cual es bastante valido debido

a que los servicios de la agencia son distintos y existe bastante diferencia en cantidad de comentarios.

Esto es, 9.163 comentarios de TripAdvisor v/s 375 comentarios de Hotelel Club en el caso de Chi-

le y 46.684 comentarios de TripAdvisor v/s 4.687 comentarios de Hotel Club en el caso de Latinoamérica.

52

Page 64: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Como trabajo futuro, queda abierta la investigación para poder ser analizada por otros colaboradores,

y de esta manera ampliar el caso de estudio ya sea analizándolo en otros casos de estudio similares o

para otras regiones del Mundo, aplicando nuevos métodos estadísticos o matemáticos. Además, se puede

realizar un herramienta con la que podamos obtener conocimiento de estos análisis la cual pueda ser

utilizada por trabajadores en el rubro turístico o bien clientes que quieran escoger el mejor hotel en sus

viajes.

53

Page 65: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Referencias

[Abe05] Tadahiko Abe. Research Report: What is the Service Science? - Tokyo, Japan. 2005.

[AH08] Gérard Dray Mathieu Roche Francois Trousset Pascal Poncelet Ali Harb, Michel Plantié.

Web Opinion Mining: How to extract opinions from blogs? - Francia. 2008.

[AMCM14] Natalia Stefany Perla Ribadeneira Adriana María Castellanos Méndez, Cristina Rami-

rez Calderón. Estudio Descriptivo de la Factibilidad del User Experience (UX) Para laWeb - UNIVERSIDAD DR. JOSÉ ÍAS DELGADO. 2014.

[Cen07] Paul P. Maglio IBM Almaden Research Center. Service Science, Management, andEngineering (SSME): An Interdisciplinary Approach to Service Innovation - IBM: AlmadenServices Research. 2007.

[IP07] Directores de Tesis: M. Ing. Enrique Fernández y Dr. Ramón García Martínez Ignacio Per-

versi. APLICACIÓN DE MINERÍA DE DATOS PARA LA EXPLORACIÓN Y DETECCIÓNDE PATRONES DELICTIVOS EN ARGENTINA. 2007.

[Jos] S Joshi. Customer experience management: An exploratory study on the parametersaffecting - customer experience for cellular mobile services of a telecom company. Procedia- Social and Behavioral Sciences, 133, pp. 392-399 - 2014.

[JS03] Vipin Kumar Jaideep Srivastava, Prasanna Desikan. Web Mining - Concepts, Applicationsy Research Directions - Department of Computer Science, University of Minnesota,Minneapolis, USA, volume 3. 2003.

[Mat10] Felipe Jordao Almeida Prado Mattosinho. MASTER THESIS, Mining Product Opinions andReviews on the Web - Cruzeiro Brazil. 2010.

[PMS12a] Kirit Modi Pooja Mehtaa, Brinda Parekh and Paresh Solanki. Web Personalization UsingWeb Mining: Concept and Research Issue, volume 2. 2012.

[PMS12b] Kirit Modi Pooja Mehtaa, Brinda Parekh and Paresh Solanki. Web Personalization UsingWeb Mining: Concept and Research Issue - International Journal of Information andEducation Technology, USA, volume 2. 2012.

[Rod09] Jorge Ropero Rodríguez. Método general de Extracción de Información basado en el usode Lógica Borrosa, Aplicación en portales web - Sevilla. 2009.

[RRG+16] Cristian Rusu, Virginica Rusu, Daniel Guzmán, Diego Espinoza, Daniel Rojas, Silvana

Roncagliolo, and Daniela Quiñones. Assessing the Customer eXperience Based onQuantitative Data: Virtual Travel Agencies, Springer International Publishing Switzerland2016 - A. Marcus (Ed.): DUXU 2016, Part I, LNCS 9746, pp. 499 - 508 - 2016 - DOI:10.1007/978-3 - 319 - 40409 -7 - 47. 2016.

[SG13] Darshak B. Mehta Shaily G.Langhnoja, Mehul P. Barot. Web Usage Mining UsingAssociation Rule Mining on Clustered Data for Pattern Discovery - Computer Department,M.E.(Pursing) Gujarat Technical University, Gujarat, India. 2013.

54

Page 66: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

[Shu08] Hanjie Shu. Master in information system: Opinion MIning for Song Lyrics - NTNU. 2008.

55

Page 67: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

ANEXOS

56

Page 68: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

A. Medidas de Resumen y Matrices de Correlación de Spearman

En esta sección del anexo se mostrarán las medidas de resumen de los datos extraídos por ciudades y

capitales de países, donde x representa la media y S la desviación estándar; cantidad de comentarios por

cada hotel; y por último el test ρ de Spearman, en donde cabe destacar lo siguiente acerca del coeficiente

de correlación de Spearman: un r cercano a 1 indica relación, un r cercano a 0 indica no hay relación, y

un r cercano a -1 indica relación inversa.

A.1. Hoteles de Santiago de Chile

En la tabla 51 se muestran las medidas de resumen Hoteles de Santiago de Chile, los cuales tienen

un total de 294 Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 4,2143 4,0374 4,4354 4,3095 4,3299 4,5034 4,2245

S 0,90411 0,87940 0,76679 0,95430 0,81997 0,70468 0,93689

Tabla 51: Medidas de Resumen - Hoteles Santiago de Chile

D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

D0 1,000 0,688 0,621 0,593 0,593 0,387 0,625D1 – 1,000 0,566 0,480 0,567 0,299 0,507D2 – – 1,000 0,577 0,632 0,319 0,514D3 – – – 1,000 0,493 0,383 0,590D4 – – – – 1,000 0,295 0,534D5 – – – – – 1,000 0,363

D6 – – – – – – 1,000

Tabla 52: Matriz de Correlación - Hoteles Santiago de Chile

La tabla 52 muestra las correlaciones entre todas las dimensiones. Solo correlaciones destacadas con

negrita son significativas al nivel de ρ = 0, 05, y será interpretado:

a. La valoración del rating (D0) está fuertemente correlacionada con las dimensiones D1 (Instalaciones

y Servicios), D2 (Limpieza), D3 (Personal del Hotel), y D6 (Calidad/Precio).

b. Instalaciones y Servicios (D1) está fuertemente correlacionada con la dimensión D4 (Comodidad).

c. Limpieza está fuertemente correlacionada con las dimensiones D3 (Personal del Hotel) y D4

(Comodidad).

d. Personal del Hotel (D3) esta moderadamente correlacionada con las dimensiones D4 (Comodidad) y

D6 (Calidad/Precio).

e. Comodidad (D4) está moderadamente correlacionada con la dimensión D6 (Calidad/Precio).

f. Ubicación (D5) está fuertemente relacionada con la dimensión D6 (Calidad/Precio).

57

Page 69: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

A.2. Hoteles de Bogota Colombia

En la tabla 53 se muestran las medidas de resumen Hoteles de Bogota Colombia, los cuales tienen

un total de 202 Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 4,2079 4,1485 4,5594 4,5050 4,3564 4,0396 4,2178

S 0,96007 0,95559 0,75240 0,94236 1,03264 0,94549 1,00352

Tabla 53: Medidas de Resumen - Hoteles de Bogota Colombia

D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

D0 1,000 0,749 0,629 0,610 0,676 0,565 0,598D1 – 1,000 0,571 0,481 0,621 0,557 0,604D2 – – 1,000 0,559 0,690 0,409 0,463

D3 – – – 1,000 0,555 0,397 0,531D4 – – – – 1,000 0,460 0,577D5 – – – – – 1,000 0,425

D6 – – – – – – 1,000

Tabla 54: Matriz de Correlación - Hoteles de Bogota Colombia

La tabla 54muestra las correlaciones entre todas las dimensiones. Solo correlaciones destacadas con

negrita son significativas al nivel de ρ = 0, 05, y será interpretado:

a. La valoración del rating (D0) está fuertemente correlacionada con las dimensiones D1 (Instalaciones

y Servicios), D4 (Comodidad), D6 (Calidad/Precio), D2 (Limpieza), D3 (Personal del Hotel) y D5

(Ubicación).

b. Instalaciones y Servicios (D1) está fuertemente correlacionada con la dimensión D6 (Calidad/Precio),

D3 (Personal del Hotel), D4 (Comodidad) y D5 (Ubicación).

c. Limpieza está fuertemente correlacionada con D4 (Comodidad), D3 (Personal del Hotel) y D6

(Calidad/Precio).

d. Personal del Hotel (D3) esta fuertemente correlacionada con la dimensión D4 (Comodidad), D6

(Calidad/Precio).

e. Comodidad (D4) está fuertemente correlacionada con la dimensión D5 (Ubicación) y D6 (Calidad/-

Precio).

f. Ubicación (D5) está moderadamente relacionada con la dimensión D6 (Calidad/Precio).

A.3. Hoteles de Buenos Aires

En la tabla 55 se muestran las medidas de resumen Hoteles de Buenos Aires Argentina, los cuales

tienen un total de 326 Comentarios.

58

Page 70: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 4,1963 3,9540 4,4540 4,4018 4,2669 4,4294 4,1810

S 0,88654 0, 0,98965 0,82052 0,92451 0,77634 0,95163

Tabla 55: Medidas de Resumen - Hoteles de Buenos Aires Argentina

D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

D0 1,000 0,662 0,564 0,597 0,638 0,416 0,567D2 – 1,000 0,437 0,389 0,514 0,369 0,416

D3 – – 1,000 0,524 0,605 0,406 0,483

D3 – – – 1,000 0,470 0,383 0,458

D4 – – – – 1,000 0,311 0,527D65 – – – – – 1,000 0,368

D6 – – – – – – 1,000

Tabla 56: Matriz de Correlación - Hoteles de Buenos Aires Argentina

La tabla 56 muestra las correlaciones entre todas las dimensiones. Solo correlaciones destacadas con

negrita son significativas al nivel de ρ = 0, 05, y será interpretado:

a. La valoración del rating (D0) está fuertemente correlacionada con las dimensiones D1 (Instalaciones

y Servicios), D2 (Limpieza), D3 (Personal del Hotel), D4 (Comodidad), D5 (Ubicación) y D6

(Calidad/Precio).

b. Instalaciones y Servicios (D1) está fuertemente correlacionada con las dimensiones D2 (Limpieza),

D3 (Personal del Hotel), D4 (Comodidad),D6 (Calidad/Precio), y moderadamente correlacionada con

D5 (Ubicación).

c. Limpieza esta fuertemente correlacionada con las dimensiones D3 (Personal del Hotel), D4

(Comodidad), D5 (Ubicación) y D6 (Calidad/Precio).

d. Personal del Hotel (D3) está fuertemente correlacionada con las dimensiones D4 (Comodidad) y D6

(Calidad/Precio), y moderadamente correlacionada con la dimensión D5 (Ubicación).

e. Comodidad (D4) está moderadamente correlacionada con la dimensión D5 (Ubicación) y fuertemente

correlacionada con la dimensión D6 (Calidad/Precio).

f. Ubicación (D5) está moderadamente correlacionada con la dimensión D6 (Calidad/Precio).

A.4. Hoteles de Lima Perú

En la tabla 57 se muestran las medidas de resumen Hoteles de Lima Perú, los cuales tienen un total

de 393 Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 4,1399 4,0153 4,4860 4,3893 4,3053 4,2850 4,1705

S 0,87672 0,89487 0,79246 0,91115 0,87970 0,87494 0,94704

Tabla 57: Medidas de Resumen - Hoteles de Lima Perú

59

Page 71: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

D0 1,000 0,674 0,673 0,602 0,675 0,580 0,629D1 – 1,000 0,608 0,487 0,610 0,441 0,494

D2 – – 1,000 0,564 0,793 0,499 0,573D3 – – – 1,000 0,488 0,376 0,547D4 – – – – 1,000 0,457 0,528D5 – – – – – 1,000 0,471

D6 – – – – – – 1,000

Tabla 58: Matriz de Correlación - Hoteles de Lima Perú

La tabla 58 muestra las correlaciones entre todas las dimensiones. Solo correlaciones destacadas con

negrita son significativas al nivel de ρ = 0, 05, y será interpretado:

a. La valoración del rating (D0) está fuertemente correlacionada con las dimensiones D1 (Instalaciones

y Servicios), D2 (Limpieza), D3 (Personal del Hotel), D4 (Comodidad), D5 (Ubicación) y D6

(Calidad/Precio).

b. Instalaciones y Servicios (D1) está fuertemente correlacionada con las dimensiones D2 (Limpieza) y

D4 (Comodidad).

c. Limpieza está fuertemente correlacionada con las dimensiones D3 (Personal del Hotel), D4

(Comodidad) y D6 (Calidad/Precio).

d. Personal del Hotel (D3) esta fuertemente correlacionada con la dimensión D6 (Calidad/Precio).

e. Comodidad (D4) está fuertemente correlacionada con la dimensión D6 (Calidad/Precio).

f. Ubicación (D5) está moderadamente correlacionada con la dimensión D6 (Calidad/Precio).

A.5. Hoteles de Montevideo Uruguay

En la tabla 59 se muestran las medidas de resumen Hoteles de Lima Perú, los cuales tienen un total

de 69 Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 3,7971 3,7101 4,0580 4,0725 4,0290 4,0000 4,9420

S 0,993802 1,07240 0,95308 0,94431 0,99957 0,95518 1,01292

Tabla 59: Medidas de Resumen - Hoteles de Montevideo Uruguay

D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

D0 1,000 0,714 0,569 0,645 0,666 0,405 0,696D1 – 1,000 0,547 0,569 0,681 0,321 0,689D2 – – 1,000 0,489 0,722 0,298 0,687D3 – – – 1,000 0,618 0,267 0,591D4 – – – – 1,000 0,340 0,788D5 – – – – – 1,000 0,444

D6 – – – – – – 1,000

Tabla 60: Matriz de Correlación - Hoteles de Montevideo Uruguay

60

Page 72: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

La tabla 60 muestra las correlaciones entre todas las dimensiones. Solo correlaciones destacadas con

negrita son significativas al nivel de ρ = 0, 05, y será interpretado:

a. La valoración del rating (D0) está fuertemente correlacionada con las dimensiones D1 (Instalaciones

y Servicios), D2 (Limpieza), D3 (Personal del Hotel), y D6 (Calidad/Precio).

b. Instalaciones y Servicios (D1) está fuertemente correlacionada con las dimensiones D2 (Limpieza),

D3 (Personal del Hotel), D4 (Comodidad), D6 (Calidad/Precio).

c. Limpieza está fuertemente relacionada con D4 (Comodidad) y D6 (Calidad/Precio).

d. Personal del Hotel (D3) esta fuertemente correlacionada con la dimensión D4 (Comodidad) y D6

(Calidad/Precio).

e. Comodidad (D4) está fuertemente correlacionada con la dimensión D6 (Calidad/Precio).

f. Ubicación (D5) está fuertemente relacionada con D6 (Calidad/Precio).

A.6. Hoteles de Quito Ecuador

En la tabla 61 se muestran las medidas de resumen Hoteles de Quito Ecuador, los cuales tienen un

total de 137 comentarios.

D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

x 3,9051 3,7518 4,3504 4,3212 4,8686 4,0146 4,9635

S 0,95396 1,92180 0,83658 1,07056 1,06286 0,99989 1,09416

Tabla 61: Medidas de Resumen - Hoteles de Quito Ecuador

D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

D0 1,000 0,753 0,570 0,633 0,603 0,546 0,671D1 – 1,000 0,563 0,542 0,600 0,495 0,494

D2 – – 1,000 0,580 0,678 0,346 0,484

D3 – – – 1,000 0,523 0,397 0,584D4 – – – – 1,000 0,456 0,578D5 – – – – – 1,000 0,583D6 – – – – – – 1,000

Tabla 62: Matriz de Correlación - Hoteles de Quito Ecuador

La tabla 62 muestra las correlaciones entre todas las dimensiones. Solo correlaciones destacadas con

negrita son significativas al nivel de ρ = 0, 05, y será interpretado:

a. La valoración del rating (D0) está fuertemente correlacionada con las dimensión D1 (Instalaciones

y Servicios), D2 (Limpieza), D3 (Personal del Hotel), D4 (Comodidad), D5 (Ubicación) y D6

(Calidad/Precio).

b. Instalaciones y Servicios (D1) está fuertemente correlacionada con las dimensiones D2 (Limpieza),

D3 (Personal del Hotel), D4 (Comodidad) y D6 (Personal del Hotel).

61

Page 73: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

c. Limpieza está fuertemente correlacionada con las dimensiones D2 (Limpieza), D3 (Personal del

Hotel), D4 (Comodidad) y D6 (Personal del Hotel).

d. Personal del Hotel (D3) está fuertemente correlacionada con las dimensiones D4 (Comodidad) y D6

(Calidad/Precio).

e. Comodidad (D4) está fuertemente correlacionada con la dimensión D6 (Calidad/Precio).

f. Ubicación (D5) está fuertemente relacionada con la dimensión D6 (Calidad/Precio).

A.7. Hoteles de Río de Janeiro Brasil

En la tabla 63 se muestran las medidas de resumen Hoteles de Río de Janeiro, los cuales tienen un

total de 722 Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 3,9349 3,8490 4,1842 4,0859 4,0720 4,3310 4,8019

S 1,05200 1,02300 1,04709 1,07852 1,04957 0,96821 1,14223

Tabla 63: Medidas de Resumen - Hoteles de Quito Ecuador

D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

D0 1,000 0,720 0,720 0,665 0,647 0,653 0,642D1 – 1,000 0,636 0,567 0,610 0,378 0,537D2 – – 1,000 0,586 0,660 0,412 0,526D3 – – – 1,000 0,534 0,431 0,528D4 – – – – 1,000 0,322 0,552D5 – – – – – 1,000 0,427

D6 – – – – – – 1,000

Tabla 64: Matriz de Correlación - Hoteles de Río de Janeiro

La tabla 64 muestra las correlaciones entre todas las dimensiones. Solo correlaciones destacadas con

negrita son significativas al nivel de ρ = 0, 05, y será interpretado:

a. La valoración del rating (D0) está fuertemente correlacionada con las dimensiones D1 (Instalaciones

y Servicios), D2 (Limpieza), D3 (Personal del Hotel), D5 (Ubicación) y D6 (Calidad/Precio).

b. Instalaciones y Servicios (D1) está fuertemente correlacionada con las dimensiones D1 (Instalaciones

y Servicios), D2 (Limpieza), D3 (Personal del Hotel) y D6 (Calidad/Precio).

c. Limpieza está fuertemente relacionada con las dimensiones D3 (Personal del Hotel), D4 (Comodidad)

y D6 (Calidad/Precio).

d. Personal del Hotel (D3) esta fuertemente correlacionada con las dimensiones D4 (Comodidad) y D6

(Calidad/Precio).

e. Comodidad (D4) está moderadamente correlacionada con la dimensión D6 (Calidad/Precio).

f. Ubicación (D5) está moderadamente relacionada con D6 (Calidad/Precio).

62

Page 74: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

A.8. Hoteles de Ciudad de México

En la tabla 65 se muestran las medidas de resumen Hoteles de Ciudad de México, los cuales tienen

un total de 1428 Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 3,8564 3,7913 4,2563 4,1141 4,0399 4,4125 3,9181

S 1,04206 1,08497 ,97487 1,13194 1,08785 ,84713 1,11667

Tabla 65: Medidas de Resumen - Hoteles de Quito Ecuador

D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

D0 1,000 0,685 0,607 0,640 0,654 0,426 0,613D1 – 1,000 0,552 0,567 0,631 0,357 0,505D2 – – 1,000 0,554 0,656 0,475 0,521D3 – – – 1,000 0,545 0,450 0,575D4 – – – – 1,000 0,391 0,509D5 – – – – – 1,000 0,430

D6 – – – – – – 1,000

Tabla 66: Matriz de Correlación - Hoteles de Ciudad de México

La tabla 64 muestra las correlaciones entre todas las dimensiones. Solo correlaciones destacadas con

negrita son significativas al nivel de ρ = 0, 05, y será interpretado:

a. La valoración del rating (D0) está fuertemente correlacionada con las dimensiones D1 (Instalaciones

y Servicios), D2 (Limpieza), D3 (Personal del Hotel), D5 (Ubicación) y D6 (Calidad/Precio).

b. Instalaciones y Servicios (D1) está fuertemente correlacionada con las dimensiones D1 (Instalaciones

y Servicios), D2 (Limpieza), D3 (Personal del Hotel) y D6 (Calidad/Precio).

c. Limpieza está fuertemente relacionada con las dimensiones D3 (Personal del Hotel), D4 (Comodidad)

y D6 (Calidad/Precio).

d. Personal del Hotel (D3) esta fuertemente correlacionada con las dimensiones D4 (Comodidad) y D6

(Calidad/Precio).

e. Comodidad (D4) está moderadamente correlacionada con la dimensión D6 (Calidad/Precio).

f. Ubicación (D5) está moderadamente relacionada con D6 (Calidad/Precio).

A.9. Hoteles de Panamá

En la tabla 67 se muestran las medidas de resumen Hoteles de Ciudad de México, los cuales tienen

un total de 1116 Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 3,9131 3,9292 4,1873 4,0358 4,1013 4,1792 3,9220

S 1,10383 1,10661 1,06970 1,13508 1,09690 1,01299 1,13415

Tabla 67: Medidas de Resumen - Hoteles de Quito Ecuador

63

Page 75: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

D0 1,000 0,764 0,704 0,712 0,775 0,516 0,745D1 – 1,000 0,671 0,626 0,717 0,511 0,654D2 – – 1,000 0,645 0,783 0,451 0,619D3 – – – 1,000 0,654 0,454 0,629D4 – – – – 1,000 0,462 0,673D5 – – – – – 1,000 0,453

D6 – – – – – – 1,000

Tabla 68: Matriz de Correlación - Hoteles de Ciudad de México

La tabla 64 muestra las correlaciones entre todas las dimensiones. Solo correlaciones destacadas con

negrita son significativas al nivel de ρ = 0, 05, y será interpretado:

a. La valoración del rating (D0) está fuertemente correlacionada con las dimensiones D1 (Instalaciones

y Servicios), D2 (Limpieza), D3 (Personal del Hotel), D5 (Ubicación) y D6 (Calidad/Precio).

b. Instalaciones y Servicios (D1) está fuertemente correlacionada con las dimensiones D1 (Instalaciones

y Servicios), D2 (Limpieza), D3 (Personal del Hotel) y D6 (Calidad/Precio).

c. Limpieza está fuertemente relacionada con las dimensiones D3 (Personal del Hotel), D4 (Comodidad)

y D6 (Calidad/Precio).

d. Personal del Hotel (D3) esta fuertemente correlacionada con las dimensiones D4 (Comodidad) y D6

(Calidad/Precio).

e. Comodidad (D4) está moderadamente correlacionada con la dimensión D6 (Calidad/Precio).

f. Ubicación (D5) está moderadamente relacionada con D6 (Calidad/Precio).

B. Matrices de Correlación de Spearman - Hoteles de Chile

B.1. Hoteles de Viña del Mar

B.1.1. BEST WEST Hotel Marina del Rey

En la tabla 69 se muestran las medidas de resumen del BEST WEST Hotel Marina del Rey, el cual

posee 11 Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 4,18 3,82 4,64 4,09 4,55 4,18 4,18

S 0,40 0,60 0,50 0,83 0,52 0,52 0,60

Tabla 69: Medidas de Resumen - BEST WEST Hotel Marina del Rey

A continuación se presenta la tabla 70, se puede apreciar que los datos mas relacionados son:

Instalaciones y Servicios con personal del Hotel (r=0,53), Rating con Instalaciones y Servicios (r=0,58),

y los datos con mayor relación fueron Limpieza con Comodidad (r=0,80).

64

Page 76: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

Rating 1,00 0,58 0,33 0,20 0,41 0,16 0,67

Inst. y Serv. – 1,00 0,15 0,53 0,07 0,16 0,11

Limpieza – – 1,00 0,47 0,80 0,31 0,22

Pers. del Hotel – – – 1,00 0,22 -0,33 -0,09

Comodidad – – – – 1,00 0,38 0,27

Ubicación – – – – – 1,00 0,36

Calidad/Precio – – – – – – 1,00

Tabla 70: Matriz de Correlación - BEST WEST Hotel Marina del Rey

B.1.2. Hotel Ultramar

En la tabla 71 se muestran las medidas de resumen del Hotel Ultramar, el cual posee 10 Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 3,9 3,5 3,5 3,4 3,4 3,1 3,0

S 1,2 1,08 1,51 1,43 1,43 1,43 1,33

Tabla 71: Medidas de Resumen - Hotel Ultramar

A continuación se presenta la tabla 72, se puede apreciar que los datos más relacionados

son: Rating con Instalaciones y Servicios (r=0,90), Instalaciones y Servicios con Calidad/Precio

(r=0,69), Limpieza con Personal del Hotel (r=0,88), Limpieza con Comodidad (r=0,82), Limpieza

con Calidad/Precio (r=0,77), Personal del Hotel con Comodidad (r=0,78), Personal del Hotel con

Calidad/Precio (r=0,64), Comodidad con Ubicación (r=0,83), Comodidad con Calidad/Precio (r=0,82), y

Ubicación con Calidad/Precio (r=0,67).

Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

Rating 1,00 0,90 0,28 0,16 0,35 0,14 0,42

Inst. y Serv. – 1,00 0,44 0,29 0,50 0,34 0,69Limpieza – – 1,00 0,88 0,82 0,73 0,77Pers. del Hotel – – – 1,00 0,78 0,88 0,64Comodidad – – – – 1,00 0,83 0,82Ubicación – – – – – 1,00 0,67Calidad/Precio – – – – – – 1,00

Tabla 72: Matriz de Correlación - Hotel Ultramar

B.1.3. Sheraton Miramar Hotel & Convention Center

En la tabla 73 se muestran las medidas de resumen del Sheraton Miramar Hotel & Convention Center,

el cual posee 6 Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 4,33 4,67 4,67 4,00 4,83 4,83 4,33

S 0,82 0,52 0,52 1,55 0,41 0,41 0,82

Tabla 73: Medidas de Resumen - Sheraton Miramar Hotel & Convention Center

65

Page 77: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

A continuación se presenta la tabla 73, se puede apreciar que todas las dimensiones se encuentran

muy relacionadas mostrando el valor r más bajo en Instalaciones y Servicios con Comodidad ( r=0,63) y

Limpieza con Comodidad (r=0,63), excepto en Ubicación con el resto de las dimensiones, en las cuales

se aprecian solo relaciones negativas o inversas.

Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

Rating 1,00 0,79 0,79 0,95 0,80 -0,40 0,70Inst. y Serv. – 1,00 1,00 0,75 0,63 -0,32 0,79Limpieza – – 1,00 0,75 0,63 -0,32 0,79Pers. del Hotel – – – 1,00 0,95 -0,32 0,79Comodidad – – – – 1,00 -0,20 0,80Ubicación – – – – – 1,00 -0,40

Calidad/Precio – – – – – – 1,00

Tabla 74: Matriz de Correlación - Sheraton Miramar Hotel & Convention Center

B.2. Hoteles de Santiago de Chile

B.2.1. Hotel Plaza el Bosque San Sebastián

En la tabla 75 se muestran las medidas de resumen del Hotel Plaza el Bosque San Sebastián, el cual

posee 17 Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 4,29 4,06 4,53 4,47 4,71 4,65 4,47

S 0,59 0,75 0,51 0,72 0,59 0,59 0,72

Tabla 75: Medidas de Resumen - Hotel Plaza el Bosque San Sebastián

A continuación se presenta la tabla 76, se puede apreciar que los datos más relacionados son: Rating

con Instalaciones y Servicios (r=0,67), Instalaciones y Servicios con Comodidad (r=0,75), Instalaciones

y Servicios con Calidad/Precio (r=0,64), Limpieza con Calidad/Precio (r=0,64), y Comodidad con

Calidad/Precio (r=0,65).

Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

Rating 1,00 0,67 0,49 0,54 0,45 0,48 0,54

Inst. y Serv. – 1,00 0,56 0,18 0,75 0,19 0,64Limpieza – – 1,00 0,47 0,34 0,44 0,64Pers. del Hotel – – – 1,00 0,05 0,55 0,51

Comodidad – – – – 1,00 0,22 0,65Ubicación – – – – – 1,00 0,41

Calidad/Precio – – – – – – 1,00

Tabla 76: Matriz de Correlación - Hotel Plaza el Bosque San Sebastián

B.2.2. Hotel Kennedy

En la tabla 77 se muestran las medidas de resumen del Hotel Kennedy, el cual posee 22 Comentarios.

66

Page 78: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 4,55 4,41 4,68 4,68 4,68 4,36 4,55

S 0,51 0,59 0,57 0,48 0,57 0,57 0,60

Tabla 77: Medidas de Resumen - Hotel Kennedy

A continuación se presenta la tabla 78, se puede apreciar que los datos más relacionados son: Personal

del Hotel con Ubicación (r=0,54) y Comodidad con Calidad /Precio (r=0,54). El resto de los datos muestra

relación baja o relación inversa.

Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

Rating 1,00 0,17 0,46 0,16 0,13 0,40 -0,09

Inst. y Serv. – 1,00 0,12 0,32 -0,16 0,35 -0,12

Limpieza – – 1,00 0,14 0,26 0,15 0,12

Pers. del Hotel – – – 1,00 0,14 0,54 0,30

Comodidad – – – – 1,00 0,35 0,54Ubicación – – – – – 1,00 0,44

Calidad/Precio – – – – – – 1,00

Tabla 78: Matriz de Correlación - Hotel Kennedy

B.2.3. Hotel Plaza el Bosque Ebro

En la tabla 79 se muestran las medidas de resumen del Hotel Plaza el Bosque Ebro, el cual posee 21Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 4,29 4,24 4,67 4,48 4,38 4,52 4,24

S 1,23 0,83 0,66 1,21 0,80 0,80 1,09

Tabla 79: Medidas de Resumen - Hotel Plaza el Bosque Ebro

A continuación se presenta la tabla 80, se puede apreciar que todos los datos se encuentran bastante

relacionados en los cuales el valor r más bajo es de 0,68.

Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

Rating 1,00 0,81 0,86 0,95 0,74 0,79 0,95Inst. y Serv. – 1,00 0,70 0,78 0,75 0,69 0,82Limpieza – – 1,00 0,90 0,72 0,81 0,81Pers. del Hotel – – – 1,00 0,68 0,80 0,90Comodidad – – – – 1,00 0,60 0,69

Ubicación – – – – – 1,00 0,81Calidad/Precio – – – – – – 1,00

Tabla 80: Matriz de Correlación - Hotel Plaza el Bosque Ebro

B.2.4. Hotel Park Plaza Santiago

En la tabla 81 se muestran las medidas de resumen del Hotel Park Plaza Santiago, el cual posee 24Comentarios.

67

Page 79: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 4,29 4,08 4,38 4,38 4,33 4,50 4,21

S 0,86 0,72 0,65 0,82 0,70 0,70 0,83

Tabla 81: Medidas de Resumen - Hotel Park Plaza Santiago

A continuación se presenta la tabla 82, se puede apreciar que los datos más relacionados son: Rating

con Instalaciones y Servicios (r=0,74), Rating con Limpieza (r=0,74), Rating con Comodidad (r=0,78),

Instalaciones y Servicios con Comodidad (r=0,73), y Comodidad con Calidad/Precio (r=0,71).

Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

Rating 1,00 0,74 0,74 0,55 0,78 0,27 0,77

Inst. y Serv. – 1,00 0,60 0,28 0,73 0,16 0,57

Limpieza – – 1,00 0,43 0,68 0,35 0,67

Pers. del Hotel – – – 1,00 0,42 0,44 0,67

Comodidad – – – – 1,00 0,15 0,71Ubicación – – – – – 1,00 0,38

Calidad/Precio – – – – – – 1,00

Tabla 82: Matriz de Correlación - Hotel Park Plaza Santiago

B.2.5. Park Plaza Apart Hotel

En la tabla 83 se muestran las medidas de resumen del Park Plaza Apart Hotel, el cual posee 26Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 4,12 3,96 4,62 4,27 4,38 4,50 4,27

S 0,71 0,87 0,50 0,67 0,64 0,64 0,87

Tabla 83: Medidas de Resumen - Park Plaza Apart Hotel

A continuación se presenta la tabla 84, se puede apreciar que los datos más relacionados son:

Rating con Instalaciones y Servicios (r=0,65), Rating con Comodidad (r=0,64), Rating con Calidad/Precio

(r=0,78), Limpieza con Personal del Hotel (r=0,60), Limpieza con Comodidad (r=0,74), y Personal del

Hotel con Calidad/Precio (r=0,61).

Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

Rating 1,00 0,65 0,46 0,58 0,52 0,64 0,78Inst. y Serv. – 1,00 0,50 0,34 0,38 0,53 0,38

Limpieza – – 1,00 0,60 0,74 0,56 0,43

Pers. del Hotel – – – 1,00 0,59 0,42 0,61Comodidad – – – – 1,00 0,55 0,46

Ubicación – – – – – 1,00 0,51

Calidad/Precio – – – – – – 1,00

Tabla 84: Matriz de Correlación - Park Plaza Apart Hotel

68

Page 80: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

B.2.6. Hotel Plaza el Bosque Nueva Las Condes

En la tabla 85 se muestran las medidas de resumen del Hotel Plaza el Bosque Nueva Las Condes, el

cual posee 22 Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 4,45 4,36 4,59 4,27 4,59 4,27 4,50

S 0,74 0,58 0,59 0,83 0,59 0,59 0,51

Tabla 85: Medidas de Resumen - Hotel Plaza el Bosque Nueva Las Condes

A continuación se presenta la tabla 86, se puede apreciar que los datos más relacionados son: Rating

con Calidad/Precio (r=0,52) Instalaciones y Servicios con Limpieza (r=0,60), y Limpieza con Personal

del Hotel (r=0,54). Además, todas las dimensiones con ubicación muestran relación inversa o muy baja

relación.

Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

Rating 1,00 0,29 0,25 0,43 0,46 0,31 0,52Inst. y Serv. – 1,00 0,60 0,31 0,34 -0,04 0,50Limpieza – – 1,00 0,54 0,47 -0,08 0,41

Pers. del Hotel – – – 1,00 0,45 0,19 0,25

Comodidad – – – – 1,00 -0,08 0,26

Ubicación – – – – – 1,00 0,41

Calidad/Precio – – – – – – 1,00

Tabla 86: Matriz de Correlación - Hotel Plaza el Bosque Nueva Las Condes

B.2.7. Hotel Ismael 312

En la tabla 87 se muestran las medidas de resumen del Hotel Ismael 312, el cual posee 11Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 4,55 4,09 4,73 4,73 4,09 4,82 4,36

S 0,69 0,83 0,65 0,65 0,70 0,70 0,81

Tabla 87: Medidas de Resumen - Hotel Ismael 312

A continuación se presenta la tabla 88, se puede apreciar que los datos más relacionados son: Rating

con Instalaciones y Servicios (r=0,78), Rating con Ubicación (r=0,75), Limpieza con Personal del Hotel

(r=0,76), Limpieza con Ubicación (r=0,89), Personal del Hotel con Ubicación (r=0,89), y Comodidad con

Calidad/Precio (r=0,64).

69

Page 81: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

Rating 1,00 0,78 0,59 0,59 0,51 0,75 0,51

Inst. y Serv. – 1,00 0,42 0,24 0,50 0,44 0,39

Limpieza – – 1,00 0,76 0,28 0,89 0,59

Pers. del Hotel – – – 1,00 0,50 0,89 0,59

Comodidad – – – – 1,00 0,52 0,64Ubicación – – – – – 1,00 0,56

Calidad/Precio – – – – – – 1,00

Tabla 88: Matriz de Correlación - Hotel Ismael 312

B.2.8. Hotel Plaza San Francisco

En la tabla 89 se muestran las medidas de resumen del Hotel Plaza San Francisco, el cual posee 28Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 4,36 4,25 4,43 4,50 4,54 4,61 4,43

S 0,78 0,70 0,92 1,04 0,79 0,79 0,79

Tabla 89: Medidas de Resumen - Hotel Plaza San Francisco

A continuación se presenta la tabla 90, se puede apreciar que los datos más relacionados son: Rating

con Instalaciones y Servicios (r=0,63), Rating con Personal del Hotel (r=0,76), Rating con Calidad/Precio

(r=0,75), y Limpieza con Comodidad (r=0,84).

Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

Rating 1,00 0,63 0,53 0,76 0,51 0,17 0,75Inst. y Serv. – 1,00 0,50 0,28 0,47 0,39 0,41

Limpieza – – 1,00 0,30 0,84 0,37 0,58

Pers. del Hotel – – – 1,00 0,34 -0,13 0,57

Comodidad – – – – 1,00 0,45 0,43

Ubicación – – – – – 1,00 0,26

Calidad/Precio – – – – – – 1,00

Tabla 90: Matriz de Correlación - Hotel Plaza San Francisco

B.2.9. Hotel Regal Pacific

En la tabla 91 se muestran las medidas de resumen del Hotel Regal Pacific, el cual posee 8Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 4,75 4,50 4,88 4,75 4,62 4,50 4,38

S 0,46 0,76 0,35 0,46 0,52 0,52 0,52

Tabla 91: Medidas de Resumen - Hotel Regal Pacific

A continuación se presenta la tabla 92, se puede apreciar que los datos más relacionados son: Rating

con Limpieza (r=0,65), Instalaciones y Servicios con Personal del Hotel (r=0,82). Además, se pueden ver

70

Page 82: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

dos valores negativos en: Instalaciones y Servicios con Comodidad (r=-0,18) y Comodidad con Ubicación

(r=-0,26).

Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

Rating 1,00 0,82 0,65 1,00 0,15 0,58 0,45

Inst. y Serv. – 1,00 0,27 0,82 -0,18 0,35 0,55

Limpieza – – 1,00 0,65 0,49 0,38 0,29

Pers. del Hotel – – – 1,00 0,15 0,58 0,45

Comodidad – – – – 1,00 -0,26 0,07

Ubicación – – – – – 1,00 0,26

Calidad/Precio – – – – – – 1,00

Tabla 92: Matriz de Correlación - Hotel Regal Pacific

B.2.10. Hotel Manquehue

En la tabla 93 se muestran las medidas de resumen del Hotel Manquehue, el cual posee 10Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 3,30 3,30 3,70 3,70 4,40 3,80 3,60

S 1,42 1,25 1,16 1,42 1,26 1,26 1,43

Tabla 93: Medidas de Resumen - Hotel Manquehue

A continuación se presenta la tabla 94, se puede apreciar que en su mayoría los datos se encuentran

muy relacionados, mostrando el valor más bajo de relación en Rating con Ubicación (r=0,57).

Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

Rating 1,00 0,95 0,80 0,93 0,85 0,57 0,78Inst. y Serv. – 1,00 0,83 0,93 0,83 0,65 0,88Limpieza – – 1,00 0,89 0,92 0,90 0,92Pers. del Hotel – – – 1,00 0,88 0,68 0,92Comodidad – – – – 1,00 0,72 0,84Ubicación – – – – – 1,00 0,84Calidad/Precio – – – – – – 1,00

Tabla 94: Matriz de Correlación - Hotel Manquehue

B.2.11. Hotel Galerías

En la tabla 95 se muestran las medidas de resumen del Hotel Galerías, el cual posee 12 Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 3,83 3,42 4,00 3,67 3,92 4,42 4,00

S 0,83 0,67 0,85 1,07 0,67 0,67 0,85

Tabla 95: Medidas de Resumen - Hotel Galerías

A continuación se presenta la tabla 96, se puede apreciar que los datos más relacionados son: Rating

con Instalaciones y Servicios (r=0,62), Rating con Calidad/Precio (r=0,77), Instalaciones y Servicios con

71

Page 83: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Comodidad (r=0,69), Instalaciones y Servicios con Calidad/Precio (r=0,64), Limpieza con Comodidad

(r=0,64), Limpieza con Calidad/Precio (r=0,62), Personal del Hotel con Ubicación (r=0,60), y Personal

del Hotel con Calidad/Precio (r=0,70).

Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

Rating 1,00 0,62 0,26 0,54 0,30 0,18 0,77Inst. y Serv. – 1,00 0,64 0,59 0,69 0,51 0,64Limpieza – – 1,00 0,50 0,64 0,21 0,62Pers. del Hotel – – – 1,00 0,59 0,60 0,70Comodidad – – – – 1,00 0,64 0,48

Ubicación – – – – – 1,00 0,41

Calidad/Precio – – – – – – 1,00

Tabla 96: Matriz de Correlación - Hotel Galerías

B.2.12. NH Ciudad de Santiago

En la tabla 97 se muestran las medidas de resumen del NH Ciudad de Santiago, el cual posee 12Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 4,17 3,17 4,00 3,83 3,92 4,08 3,17

S 1,19 1,47 1,13 0,94 1,31 1,31 1,27

Tabla 97: Medidas de Resumen - NH Ciudad de Santiago

A continuación se presenta la tabla 98, se puede apreciar que los datos más relacionados son: Rating

con Instalaciones y Servicios (r=0,87), Rating con Limpieza (r=0,74), Rting con Comodidad (r=0,88),

Rating con Calidad/Precio (r=0,88), Instalaciones y Servicios con Limpieza (r=0,71) Instalaciones y

Servicios con Comodidad (r=0,81), Instalaciones y Servicios con Calidad/Precio (r=0,67), Limpieza con

Comodidad (r=0,92), Limpieza con Calidad/Precio (r=0,70), y Comodidad con Calidad/Precio (r=0,83).

Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

Rating 1,00 0,87 0,74 0,60 0,88 0,24 0,88Inst. y Serv. – 1,00 0,71 0,62 0,81 0,13 0,67Limpieza – – 1,00 0,60 0,92 -0,09 0,70Pers. del Hotel – – – 1,00 0,58 -0,09 0,48

Comodidad – – – – 1,00 0,01 0,83Ubicación – – – – – 1,00 0,31

Calidad/Precio – – – – – – 1,00

Tabla 98: Matriz de Correlación - NH Ciudad de Santiago

B.2.13. Holiday Inn Santiago - Airport Terminal

En la tabla 99 se muestran las medidas de resumen del Holiday Inn Santiago - Airport Terminal, el

cual posee 23 Comentarios.

72

Page 84: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 4,17 3,78 4,26 4,13 4,13 4,61 4,61

S 0,89 0,85 1,01 1,10 1,01 1,01 1,12

Tabla 99: Medidas de Resumen - Holiday Inn Santiago - Airport Terminal

A continuación se presenta la tabla 100, se puede apreciar que los datos más relacionados son: Rating

con Personal del Hotel (r=0,71), Rating con Calidad/Precio (r=0,78), Limpieza con Personal del Hotel

(r=0,84), Limpieza con Comodidad (r=0,90), y Personal del Hotel con Calidad/Precio (r=0,73).

Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

Rating 1,00 0,51 0,55 0,71 0,63 0,36 0,78Inst. y Serv. – 1,00 0,49 0,51 0,44 0,33 0,42

Limpieza – – 1,00 0,84 0,90 0,48 0,60

Pers. del Hotel – – – 1,00 0,89 0,44 0,73Comodidad – – – – 1,00 0,48 0,67

Ubicación – – – – – 1,00 0,33

Calidad/Precio – – – – – – 1,00

Tabla 100: Matriz de Correlación - Holiday Inn Santiago - Airport Terminal

B.2.14. Santiago Marriott Hotel

En la tabla 101 se muestran las medidas de resumen del Santiago Marriott Hotel, el cual posee 8Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 4,50 4,25 4,75 4,25 4,62 4,62 4,00

S 1,07 1,04 0,71 1,16 0,74 0,74 1,07

Tabla 101: Medidas de Resumen - Santiago Marriott Hotel

A continuación se presenta la tabla 102, se puede apreciar que los datos más relacionados son: Rating

con Instalaciones y Servicios (r=0,90), Rating con Limpieza (r=0,94), Rating con Comodidad (r=0,99),

Rating con Calidad/Precio (r=0,75), Instalaciones y Servicios con Limpieza (r=0,88), Instalaciones y

Servicios con Comodidad (r=0,88), Instalaciones y Servicios con Calidad/Precio (r=0,90), Limpieza con

Personal del Hotel (r=0,78), Limpieza con Comodidad (r=0,88), Limpieza con Calidad/Precio (r=0,76),

y Comodidad con Calidad/Precio (r=0,72).

Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

Rating 1,00 0,90 0,94 0,69 0,99 0,27 0,75Inst. y Serv. – 1,00 0,88 0,65 0,88 0,14 0,90Limpieza – – 1,00 0,78 0,88 0,34 0,76Pers. del Hotel – – – 1,00 0,62 0,78 0,69

Comodidad – – – – 1,00 0,23 0,72Ubicación – – – – – 1,00 0,36

Calidad/Precio – – – – – – 1,00

Tabla 102: Matriz de Correlación - Santiago Marriott Hotel

73

Page 85: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

B.2.15. BEST WESTERN PREMIER Marina Las Condes

En la tabla 103 se muestran las medidas de resumen del BEST WESTERN PREMIER Marina Las

Condes, el cual posee 6 Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 4,33 4,33 4,67 4,67 4,33 4,67 4,50

S 0,82 0,82 0,52 0,52 0,82 0,82 0,84

Tabla 103: Medidas de Resumen - BEST WESTERN PREMIER Marina Las Condes

A continuación se presenta la tabla 104, se puede apreciar que todos los datos poseen alta relación

excepto las relaciones entre la ubicación y las demás dimensiones, las cuales tienen baja relación.

Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

Rating 1,00 1,00 0,81 0,81 1,00 0,37 0,88Inst. y Serv. – 1,00 0,81 0,81 1,00 0,37 0,88Limpieza – – 1,00 1,00 0,81 0,30 0,93Pers. del Hotel – – – 1,00 0,81 0,30 0,93Comodidad – – – – 1,00 0,37 0,88Ubicación – – – – – 1,00 0,06

Calidad/Precio – – – – – – 1,00

Tabla 104: Matriz de Correlación - BEST WESTERN PREMIER Marina Las Condes

B.2.16. Hotel Presidente Edificio Santiago

En la tabla 104 se muestran las medidas de resumen del Hotel Presidente Edificio Santiago, el cual

posee 7 Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 4,14 3,14 4,57 4,71 3,86 4,57 4,57

S 0,69 0,90 0,53 0,76 1,21 1,21 0,79

Tabla 105: Medidas de Resumen - Hotel Presidente Edificio Santiago

A continuación se presenta la tabla 106, se puede apreciar que los datos más relacionados son: Rating

con Comodidad (r=0,82), Rating con Calidad/Precio (r=0,75), Instalaciones y Servicios con Comodidad

(r=0,78), y Personal del Hotel con Calidad/Precio (r=0,88).

Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

Rating 1,00 0,50 0,65 0,73 0,82 0,19 0,75Inst. y Serv. – 1,00 0,15 0,56 0,78 0,15 0,34

Limpieza – – 1,00 0,47 0,40 -0,17 0,28

Pers. del Hotel – – – 1,00 0,67 -0,35 0,88Comodidad – – – – 1,00 0,40 0,62

Ubicación – – – – – 1,00 -0,11

Calidad/Precio – – – – – – 1,00

Tabla 106: Matriz de Correlación - Hotel Presidente Edificio Santiago

74

Page 86: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

B.2.17. Soho Santiago Apartments

En la tabla 106 se muestran las medidas de resumen del Soho Santiago Apartments, el cual posee 32Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 4,22 4,25 4,22 4,09 4,25 4,66 4,53

S 0,61 0,57 0,66 1,06 0,62 0,62 0,67

Tabla 107: Medidas de Resumen - Soho Santiago Apartments

A continuación se presenta la tabla 108, se puede apreciar que los datos más relacionados son: Rating

con Instalaciones y Servicios (r=0,77), Rating con Comodidad (r=0,70), Rating con Limpieza (r=0,60),

Instalaciones y Servicios con Comodidad (r=0,64), y Comodidad con Calidad/Precio (r=0,60).

Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

Rating 1,00 0,77 0,60 0,37 0,70 0,23 0,58

Inst. y Serv. – 1,00 0,45 0,28 0,64 0,29 0,49

Limpieza – – 1,00 0,25 0,57 -0,05 0,31

Pers. del Hotel – – – 1,00 0,31 0,34 0,47

Comodidad – – – – 1,00 0,07 0,60Ubicación – – – – – 1,00 0,25

Calidad/Precio – – – – – – 1,00

Tabla 108: Matriz de Correlación - Soho Santiago Apartments

B.2.18. Holiday Inn Express Santiago Las Condes

En la tabla 108 se muestran las medidas de resumen del Holiday Inn Express Santiago Las Condes,

el cual posee 6 Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 3,83 3,83 4,33 4,17 4,33 4,83 3,67

S 1,83 1,60 1,03 1,33 1,03 1,03 1,51

Tabla 109: Medidas de Resumen - Holiday Inn Express Santiago Las Condes

A continuación se presenta la tabla 110, se puede apreciar que todos los datos poseen alta relación

excepto las relaciones entre la ubicación y las demás dimensiones, las cuales tienen una relación inversa.

.

Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

Rating 1,00 0,94 0,99 1,00 0,99 -0,31 0,84Inst. y Serv. – 1,00 0,89 0,95 0,89 -0,36 0,72

Limpieza – – 1,00 0,97 1,00 -0,32 0,86Pers. del Hotel – – – 1,00 0,97 -0,31 0,83Comodidad – – – – 1,00 -0,32 0,86Ubicación – – – – – 1,00 -0,43

Calidad/Precio – – – – – – 1,00

Tabla 110: Matriz de Correlación - Holiday Inn Express Santiago Las Condes

75

Page 87: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

B.3. Hoteles de Isla de Pascua

B.3.1. Tupa Hotel

En la tabla 110 se muestran las medidas de resumen del Tupa Hotel, el cual posee 19 Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 4,74 3,05 4,21 4,42 3,475 4,42 3,89

S 1,05 1,27 0,98 1,21 0,96 0,96 1,15

Tabla 111: Medidas de Resumen - Tupa Hotel

A continuación se presenta la tabla 112, se puede apreciar que los datos más relacionados son:

Rating con Limpieza (r=0,76), Rating con Comodidad (r=0,79), Rating con Calidad/Precio (r=0,85),

Instalaciones y Servicio con Comodidad (r=0,71), Limpieza con Personal del Hotel (r=0,78), Personal

del Hotel con Calidad/Precio (r=0,77), y Comodidad con Calidad/Precio (r=0,75).

Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

Rating 1,00 0,77 0,76 0,67 0,79 0,33 0,85Inst. y Serv. – 1,00 0,53 0,61 0,71 0,31 0,69

Limpieza – – 1,00 0,78 0,48 0,37 0,66

Pers. del Hotel – – – 1,00 0,52 0,45 0,77Comodidad – – – – 1,00 0,14 0,75Ubicación – – – – – 1,00 0,27

Calidad/Precio – – – – – – 1,00

Tabla 112: Matriz de Correlación - Tupa Hotels

B.4. Hoteles de Puerto Montt

B.4.1. Manquehue Hotel Puerto Montt

En la tabla 113 se muestran las medidas de resumen del Manquehue Hotel Puerto Montt, el cual

posee 5 Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 4,60 4,00 4,20 4,40 4,40 4,00 4,20

S 0,55 0,71 0,84 0,55 0,89 0,89 0,84

Tabla 113: Medidas de Resumen - Manquehue Hotel Puerto Montt

A continuación se presenta la tabla 114, se puede apreciar que los datos más relacionados son: Rating

con Comodidad (r=0,92), Instalaciones y Servicios con Limpieza (r=0,85), Instalaciones y Servicios con

Calidad/Precio (r=0,85), Limpieza con Personal del Hotel (r=0,87), Limpieza con Comodidad (r=0,87),

y Comodidad con Calidad/ Precio.

76

Page 88: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

Rating 1,00 0,65 0,76 0,67 0,92 0,00 0,76

Inst. y Serv. – 1,00 0,85 0,65 0,79 0,50 0,85Limpieza – – 1,00 0,87 0,87 0,42 0,64

Pers. del Hotel – – – 1,00 0,61 0,65 0,33

Comodidad – – – – 1,00 0,00 0,87Ubicación – – – – – 1,00 0,00

Calidad/Precio – – – – – – 1,00

Tabla 114: Matriz de Correlación - Manquehue Hotel Puerto Montt

B.4.2. Hotel Cabana del Lago

En la tabla 115 se muestran las medidas de resumen del Hotel Cabana del Lago, el cual posee 6Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 4,83 4,67 4,83 4,50 4,83 4,83 4,83

S 0,41 0,52 0,41 0,84 0,41 0,41 0,41

Tabla 115: Medidas de Resumen - Hotel Cabana del Lago

A continuación se presenta la tabla 116, se puede apreciar que los datos más relacionados son: Rating

con Instalacione (r=0,63) e Instalaciones y servicios con Calidad/Precio (r=0,63).

Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

Rating 1,00 0,63 -0,20 -0,29 -0,20 -0,20 1,00

Inst. y Serv. – 1,00 -0,32 -0,46 -0,32 -0,32 0,63Limpieza – – 1,00 -0,29 -0,20 -0,20 -0,20

Pers. del Hotel – – – 1,00 0,29 0,29 -0,29

Comodidad – – – – 1,00 1,00 -0,20

Ubicación – – – – – 1,00 -0,20

Calidad/Precio – – – – – – 1,00

Tabla 116: Matriz de Correlación - Hotel Cabana del Lagos

B.5. Hoteles de San Pedro de Atacama

B.5.1. Hotel Cumbres San Pedro de Atacama

En la tabla 117 se muestran las medidas de resumen del Hotel Cumbres San Pedro de Atacama, el

cual posee 7 Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 3,86 4,29 4,43 4,29 4,43 3,86 3,86

S 1,46 0,95 0,98 1,50 0,79 0,79 0,69

Tabla 117: Medidas de Resumen - Hotel Cumbres San Pedro de Atacama

A continuación se presenta la tabla 118, se puede apreciar que la gran mayoría de los datos tienen

una relación bastante alta mostrando el mayor r en Instalaciones y Servicios con Limpieza (r=0,92)

77

Page 89: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

e Instalaciones y Servicios con Comodidad (r=0,92). Además no se ven valores negativos o inversos,

mostrando el valor más bajo de relación con un r=0,16 en Persona del Hotel con Comodidad.

Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

Rating 1,00 0,75 0,87 0,86 0,50 0,74 0,80Inst. y Serv. – 1,00 0,92 0,52 0,92 0,62 0,83Limpieza – – 1,00 0,59 0,81 0,76 0,85Pers. del Hotel – – – 1,00 0,16 0,58 0,53

Comodidad – – – – 1,00 0,42 0,75Ubicación – – – – – 1,00 0,37

Calidad/Precio – – – – – – 1,00

Tabla 118: Matriz de Correlación - Hotel Cumbres San Pedro de Atacama

B.6. Hoteles de Punta Arenas

B.6.1. BEST WESTERN Hotel Finis Terrae

En la tabla 119 se muestran las medidas de resumen del BEST WESTERN Hotel Finis Terrae, el cual

posee 6 Comentarios.

Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.

x 4,33 3,33 4,33 4,50 4,00 4,50 3,50

S 0,82 1,37 0,52 0,84 0,63 0,63 0,55

Tabla 119: Medidas de Resumen - Holiday Inn Express Antofagasta

A continuación se presenta la tabla 120, se puede apreciar que los datos más relacionados son: Rating

con Instalaciones y Servicios (r=0,78), Limpieza con Ubicación (r=0,71), Rating con Calidad/Precio

(r=0,89),y Limpieza con Calidad/Precio (r=0,71).

Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio

Rating 1,00 0,78 0,63 0,29 0,00 0,00 0,89Inst. y Serv. – 1,00 0,66 0,00 0,46 0,00 0,53

Limpieza – – 1,00 0,46 0,61 0,71 0,71Pers. del Hotel – – – 1,00 0,00 0,65 0,65

Comodidad – – – – 1,00 0,58 0,00

Ubicación – – – – – 1,00 0,33

Calidad/Precio – – – – – – 1,00

Tabla 120: Matriz de Correlación - BEST WESTERN Hotel Finis Terrae

C. Capturas del Sitio Web Hotelclub.com

En la figura 16 se muestra la interfaz del sitio web Hotelclub.com en la sección del hotel BEST

WESTERN Marina del Rey.

78

Page 90: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Figura 16: Interfaz del sitio web

En la figura 17 se muestra un comentario del hotel BEST WESTERN Marina del Rey en la interfaz

del sitio web Hotelclub.com

Figura 17: Comentario con la interfaz del sitio web.

D. Capturas del Sitio Web Hoteles.com

En la figura 18 se muestra la interfaz del sitio web Hoteles.com, sección: puntuaciones de todas las

categorías.

79

Page 91: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Figura 18: Interfaz del Sitio Web Hoteles.com - Todas las categorías

En la figura 19 se muestra la interfaz del sitio web Hoteles.com, sección: puntuaciones de negocio.

Figura 19: Interfaz del Sitio Web Hoteles.com - De Negocio

En la figura 20 se muestra la interfaz del sitio web Hoteles.com, sección: puntuaciones de parejas.

80

Page 92: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Figura 20: Interfaz del Sitio Web Hoteles.com - En Pareja

En la figura 21 se muestra la interfaz del sitio web Hoteles.com, sección: puntuaciones de familia.

Figura 21: Interfaz del Sitio Web Hoteles.com - En Familia

En la figura 22 se muestra la interfaz del sitio web Hoteles.com, sección: puntuaciones de amigos.

81

Page 93: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Figura 22: Interfaz del Sitio Web Hoteles.com - Entre Amigos

En la figura 23 se muestra la interfaz del sitio web Hoteles.com, sección: puntuaciones de otras

categorías.

Figura 23: Interfaz del Sitio Web Hoteles.com - Otras categorías

En la figura 24 se muestra la interfaz del sitio web Hoteles.com, sección: comentarios del hotel.

82

Page 94: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Figura 24: Interfaz del Sitio Web Hoteles.com - Comentarios

E. Estructura HTML del Sitio Web Hotelclub.com

1 < div c l a s s ="offscreen item">

2 Review of <span c l a s s ="fn">BEST WESTERN Marina Del Rey< / span>

3 < / div >

Tabla 121: Extracción del dato Nombre Hotel

1 < div c l a s s ="recommended">

2 <img s r c ="http://www.tnetnoc.com/static/28.222/image/global/reviews-positive

-lg.png" a l t ="" data−c o n t e x t ="reviews-positive-lg">

3 <p>Lo r e c o m e n d a r í a < / p>

4 < / div >

Tabla 122: Extracción del dato Recomendación

83

Page 95: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

1 < div c l a s s ="reviewerName">

2 <img s r c ="http://www.tnetnoc.com/static/28.222/image/global/reviews-verified

.png" a l t ="" t i t l e ="La etiqueta de Cliente Verificado sólo se asigna a

aquellos clientes que han reservado este hotel con nosotros" data−c o n t e x t

="reviews-verified">

3 < s t r o n g c l a s s ="reviewer" lang ="es-ES">Maryland Matt < / s t r o n g >

4 < / div >

Tabla 123: Extracción del dato Usuario

1 < div c l a s s ="purpose"> Couples < / div >

2 < div c l a s s ="location"> S a n t i a g o < / div >

3 <abbr c l a s s ="date dtreviewed" t i t l e ="2013-08-05">

4 0 5 / 0 8 / 2 0 1 3

5 < / abbr>

Tabla 124: Extracción de los datos Proposito, Ubicación y Fecha

1 <h3 lang ="es-ES"><q c l a s s ="summary">Bueno pe ro c a r o < / q>< / h3>

2 < div c l a s s ="review">

3 <p c l a s s ="reviewComment description" lang ="es-ES">

4 Todo b i e n y a c o r d e con un e s t á n d a r de un buen h o t e l de

negoc io s , pe r o con p r e c i o de h o t e l c i n c o e s t r e l l a s a

n i v e l i n t e r n a c i o n a l .

5 < / p>

Tabla 125: Titulo Comentario y Comentario

84

Page 96: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

1 < div c l a s s ="reviewScores userReviewGraph" data−a g e n t ="{&quot;type&quot;:&quot;

UserReviewGraph&quot;}">

2 < dl ><dt c l a s s ="noneBlock graphHeading">&nbsp ; < / dt ><dd c l a s s ="graphHeading">

3 <span>1< / span><span>2< / span><span>3< / span><span>4< / span><span>5< / span>< / dt >

4 <dt > I n s t a l a c i o n e s y s e r v i c i o s : < / dt >

5 <dd t i t l e ="4"><span c l a s s ="score" s t y l e ="width: 80%;">4< / span>< / dd>

6 <dt > Limpieza : < / dt >

7 <dd t i t l e ="5"><span c l a s s ="score" s t y l e ="width: 100%;">5< / span>< / dd>

8 <dt > P e r s o n a l d e l h o t e l : < / dt >

9 <dd t i t l e ="5"><span c l a s s ="score" s t y l e ="width: 100%;">5< / span>< / dd>

10 <dt >Comodidad : < / dt >

11 <dd t i t l e ="5"><span c l a s s ="score" s t y l e ="width: 100%;">5< / span>< / dd>

12 <dt > U b i c a c i ó n : < / dt >

13 <dd t i t l e ="4"><span c l a s s ="score" s t y l e ="width: 80%;">4< / span>< / dd>

14 <dt > Cal idad−P r e c i o : < / dt >

15 <dd t i t l e ="3"><span c l a s s ="score" s t y l e ="width: 60%;">3< / span>< / dd>

16 < / dl >

17 < / div >

Tabla 126: Extracción del dato Características del hotel

F. Código de la Aplicación en Lenguaje JAVA

1 public class ExtractDataWeb {

2

3 public Elements TitulosComentarios;

4 public Elements Comentarios;

5 public Elements Ratings;

6 public Elements Recomendaciones;

7 public Elements Ubicaciones;

8 public Elements Users;

9 public Elements CaracteristicasHotel;

10 public Elements HotelName;

11 public Elements Fechas;

12 public Elements Propositos;

13 public Elements currentPages;

14 public Elements countViajeros;

15 public Elements NoRatings;

16 public Elements streetAddress;

17 public Elements addressLocality;

18 public int size;

19 public Elements Linkes;

20 public int ContNoRating;

21 public ExtractDataWeb(){

22

23 }

24

85

Page 97: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

25 public ExtractDataWeb(Elements TitulosComentarios,Elements Comentarios,

Elements Ratings, Elements Recomendaciones,

26 Elements Ubicaciones, Elements Users, Elements CaracteristicasHotel,

Elements HotelName, Elements Fechas, Elements Propositos,

27 Elements currentPage, Elements countViajeros, Elements NoRatings, Elements

streetAddress, Elements addressLocality) {

28 this.TitulosComentarios=TitulosComentarios;29 this.Comentarios=Comentarios;30 this.Ratings=Ratings;31 this.Recomendaciones=Recomendaciones;32 this.Ubicaciones=Ubicaciones;33 this.Users=Users;34 this.CaracteristicasHotel=CaracteristicasHotel;35 this.HotelName=HotelName;36 this.Fechas=Fechas;37 this.Propositos=Propositos;38 this.currentPages=currentPages;39 this.countViajeros=countViajeros;40 this.NoRatings=NoRatings;41 this.addressLocality=addressLocality;42 this.streetAddress=streetAddress;43 }

44

45 public ListaObjetos ExtraerData(String link) throws IOException{

46 Document doc;

47 Document doc1;

48

49 ListaObjetos list=new ListaObjetos();

50 ArrayList<String> tc =new ArrayList();

51 ArrayList<String> co =new ArrayList();

52 ArrayList<String> ra =new ArrayList();

53 ArrayList<String> re =new ArrayList();

54 ArrayList<String> ub =new ArrayList();

55 ArrayList<String> us =new ArrayList();

56 ArrayList<String> iys =new ArrayList();

57 ArrayList<String> hn =new ArrayList();

58 ArrayList<String> f =new ArrayList();

59 ArrayList<String> p =new ArrayList();

60 ArrayList<String> cp =new ArrayList();

61 ArrayList<String> listLink =new ArrayList();

62 ArrayList<Integer> contr =new ArrayList();

63 int countV=0;

64 listLink.add(link);

65 doc1=Jsoup.connect(link).get();

66 Elements count=doc1.select(".count");

67

68 Linkes =doc1.select(".pages a[href]");

69 for(Element cantidad : count){

70 size=Integer.parseInt(cantidad.text());

86

Page 98: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

71 }

72 String Extractlink=Linkes.attr("abs:href");

73 String[] linkSplit=Extractlink.split("reviewPage=");

74 for(int i=2;i<=size;i++){

75 listLink.add(linkSplit[0]+"reviewPage="+i);

76 }

77 System.out.println("Linkesssss: "+listLink);

78 //for(Element Link : Linkes){

79 // listLink.add(Link.attr("abs:href"));

80 //}

81 int div=size/10;

82 int mod=size%10;

83 if(mod==0) size=div;

84 else size=div+1;

85 System.out.println("Largo del FOR: "+size);

86 try{87 for(int i=0;i<size;i++){

88 doc=Jsoup.connect(listLink.get(i)).get();

89

90 TitulosComentarios=doc.select(".summary");

91 Comentarios=doc.select(".review .reviewComment");

92 Ratings=doc.select(".reviewDetails .userReviewScore .score .rating");

93 Recomendaciones=doc.select(".recommended p");

94 Users=doc.select(".reviewerName strong");

95 Ubicaciones=doc.select(".location");

96 CaracteristicasHotel=doc.select(".review dd .score");

97 HotelName=doc.select(".headline h1");

98 Fechas=doc.select(".reviewDetails .date");

99 Propositos=doc.select(".purpose ");

100 currentPages=doc.select(".pages .link");

101 countViajeros=doc.select(".count");

102 NoRatings=doc.select(".noRating");

103 addressLocality=doc.select("title");

104 streetAddress=doc.select(".title .link");

105 for(Element countViajero : countViajeros){

106 //System.out.println(Proposito.text());

107 countV=Integer.parseInt(countViajero.text());

108 }

109 for(Element TituloComentario : TitulosComentarios){

110 //System.out.println(TituloComentario.text());

111 tc.add(TituloComentario.text());

112 }

113 for(Element Comentario : Comentarios){

114 //System.out.println(Comentario.text());

115 co.add(Comentario.text());

116 }

117 int cont=0;

118 for(Element Rating : Ratings){

119 //System.out.println(Rating.text());

87

Page 99: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

120 ra.add(Rating.text());

121 }

122 int contreco=0;

123 for(Element Recomendacion : Recomendaciones){

124 //System.out.println(Recomendacion.text());

125 re.add(Recomendacion.text());

126 if(Recomendacion.text().equals("Lo recomendaría")){

127 contr.add(contreco++);

128 }

129 }

130 System.out.println("conreco: "+contreco);

131 for(Element User : Users){

132 //System.out.println(User.text());

133 us.add(User.text());

134 }

135 for(Element Ubicacion : Ubicaciones){

136 //System.out.println(Ubicacion.text());

137 ub.add(Ubicacion.text());

138 }

139 for(Element CaracteristicaHotel: CaracteristicasHotel){

140 //System.out.println(Ubicacion.text());

141 iys.add(CaracteristicaHotel.text());

142 }

143 for(Element NombreHotel : HotelName){

144 //System.out.println(TituloComentario.text());

145 hn.add(NombreHotel.text());

146 }

147 for(Element Fecha : Fechas){

148 //System.out.println(Fecha.text());

149 f.add(Fecha.text());

150 }

151 for(Element Proposito : Propositos){

152 //System.out.println(Proposito.text());

153 p.add(Proposito.text());

154 }

155 for(Element currentPage : currentPages){

156 //System.out.println(Proposito.text());

157 cp.add(currentPage.text());

158 }

159 String calle=null;160 for(Element callehotel: streetAddress){

161 //System.out.println(Ubicacion.text());

162 calle=callehotel.text();

163 }

164 String ciudad=null;165 for(Element ciudadhotel: addressLocality){

166 //System.out.println(Ubicacion.text());

167 ciudad=ciudadhotel.text();

168 }

88

Page 100: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

169 for(Element NoRating : NoRatings){

170 System.out.println(NoRatings);

171 System.out.println(NoRating.text());

172 System.out.println("Página No Rating: "+i);

173 String noRating=NoRating.text();

174 if(noRating.equals("Sin puntuación")){

175 ContNoRating++;

176 System.out.println("ContNoRating: "+ContNoRating);

177 iys.add(ra.get(ra.size()-1));

178 }

179 }

180 list.setTitulosComentarios(tc);

181 list.setComentarios(co);

182 list.setRatings(ra);

183 list.setUbicaciones(ub);

184 list.setUsers(us);

185 list.setRecomendaciones(re);

186 list.setCaracteristicasHotel(iys);

187 list.setHotelName(hn);

188 list.setFechas(f);

189 list.setPropositos(p);

190 list.setCurrentPages(cp);

191 list.setCountViajeros(countV);

192 list.setCiudadHotel(ciudad);

193 int porcentaje=(100*contr.size())/(list.TitulosComentarios.size());

194 list.setTotalRecomendación(porcentaje);

195 String[] Calle=calle.split(" ");

196 String calle1=Calle[4];

197 String[] calle2=calle1.split(",");

198 list.setDireccionHotel(Calle[3]+" "+calle2[0]);

199 int aux=0;

200 int CantComenEndPage=countV/10;

201 list.setCantidadComentarioPage(CantComenEndPage);

202 }

203 }catch(Exception e){

204 e.printStackTrace();

205 JOptionPane.showInternalMessageDialog(null, "Error de Conexión");

206 }

207 System.out.println("currentPage :"+list.currentPages);

208 System.out.println("countViajeros :"+list.countViajeros);

209 System.out.println("size: "+size);

210 System.out.println("linkes: "+listLink);

211 System.out.println("list: "+list.TitulosComentarios);

212 System.out.println("list: "+list.Comentarios);

213 System.out.println("list: "+list.CaracteristicasHotel);

214 ArrayList<String> instalaciones =new ArrayList();

215 ArrayList<String> limpieza =new ArrayList();

216 ArrayList<String> comodidad =new ArrayList();

217 ArrayList<String> personal =new ArrayList();

89

Page 101: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

218 ArrayList<String> ubicacion =new ArrayList();

219 ArrayList<String> calidad =new ArrayList();

220 int k=0;

221 for(int j=0;j<list.TitulosComentarios.size();j++){

222 instalaciones.add(list.CaracteristicasHotel.get(k));

223 limpieza.add(list.CaracteristicasHotel.get(k+1));

224 personal.add(list.CaracteristicasHotel.get(k+2));

225 comodidad.add(list.CaracteristicasHotel.get(k+3));

226 ubicacion.add(list.CaracteristicasHotel.get(k+4));

227 calidad.add(list.CaracteristicasHotel.get(k+5));

228 System.out.print(list.CaracteristicasHotel.get(k)+" , ");

229 System.out.print(list.CaracteristicasHotel.get(k+1)+" , ");

230 System.out.print(list.CaracteristicasHotel.get(k+2)+" , ");

231 System.out.print(list.CaracteristicasHotel.get(k+3)+" , ");

232 System.out.print(list.CaracteristicasHotel.get(k+4)+" , ");

233 System.out.println(list.CaracteristicasHotel.get(k+5)+" , ");

234 k=k+6;

235 //System.out.println("j: "+j);

236 //System.out.println("k: "+k);

237 //System.out.println("largo: "+list.TitulosComentarios.size());

238 //if(k==60) break;

239 }

240 list.setIyS(instalaciones);

241 list.setLimpieza(limpieza);

242 list.setPersonal(personal);

243 list.setComodidad(comodidad);

244 list.setUbicacion(ubicacion);

245 list.setCalidad(calidad);

246 System.out.println("C.H.: "+list.CaracteristicasHotel);

247 System.out.println(list.IyS);

248 System.out.println(list.Limpieza);

249 System.out.println(list.Personal);

250 System.out.println(list.Comodidad);

251 System.out.println(list.Ubicacion);

252 System.out.println(list.Calidad);

253 return list;

254 }

255 }

1 public class Ventana1 extends JFrame{

2 public JFrame frmMineraWeb;

3 public Ventana1() {

4 //crea la ventana 1

5 setTitle("Miner\u00EDa Web");

6 setBounds(100, 100, 579, 487);

7 setDefaultCloseOperation(JFrame.EXIT_ON_CLOSE);

8 getContentPane().setLayout(null);9 JTextPane txtpn = new JTextPane();

90

Page 102: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

10 txtpn.setText("Aplicaci\u00F3n de Miner\u00EDa de Datos desarrollada para

Proyecto 1 con el objetivo de extraer datos del sitio web transaccional

Hotelclub.com, y as\u00ED mejorar la calidad de los servicios de este.\r

\nLos datos extra\u00EDdos son:\r\n\r\n-Nombre Hotel\r\n-Titutlos de

comentarios\r\n-Comentarios\r\n-Notas de Comentarios\r\n-Nobres de

Usuario\r\n-Ubicaci\u00F3n de Usuario\r\n-Recomendaci\u00F3n\r\n\r\nAdem

\u00E1s de algunas notas especificas de los servicios encontrados como

lo son:\r\n\r\n-Instalaciones y servicios\r\n-Limpieza\r\n-Personal del

Hotel\r\n-Comodidad\r\n-Ubicaci\u00F3n\r\n-Calidad-Precio");

11 txtpn.setBounds(20, 22, 523, 328);

12 getContentPane().add(txtpn);

13 Agregar_Hotel();

14 Elegir_Hotel(); //sección datos del usuario del sistema

15 Boton_Salir(); //boton salir de la ventana 1

16 }

17 public void Agregar_Hotel(){

18 final ObtenerHoteles OH = new ObtenerHoteles();

19 JButton btnAgregarHotel = new JButton("Agregar Hotel");

20 btnAgregarHotel.addActionListener(new ActionListener() {

21 public void actionPerformed(ActionEvent e) {

22 String link = null;23 do{24 link = (String)JOptionPane.showInputDialog(null,25 "Ingrese LINK de la locación buscada en Hotelclub.com");

26 if(link!=null){27 try {

28 OH.ExtraerHotel(link);

29 } catch (IOException e1) {

30 // TODO Auto-generated catch block

31 e1.printStackTrace();

32 System.out.println("Error en la función!");

33 System.exit(0);

34 }

35 }else{36 JOptionPane.showMessageDialog(null, "El LINK ingresado no es valido, por

favor ingrese otro");

37 System.exit(0);

38 }

39 }while(link==null);40 }

41 });

42 btnAgregarHotel.setBounds(20, 387, 150, 23);

43 getContentPane().add(btnAgregarHotel);

44 }

45 public void Boton_Salir(){

46 JButton btnSalir = new JButton("Salir");

47 btnSalir.addActionListener(new ActionListener() {

48 public void actionPerformed(ActionEvent arg0) {

49 System.exit(0);

91

Page 103: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

50 }

51 });

52 btnSalir.setBounds(393, 387, 150, 23);

53 getContentPane().add(btnSalir);

54 }

55 public void Elegir_Hotel(){

56 final Ventana2 ventana2 = new Ventana2();

57 JButton btnEntrar = new JButton("Elegir Hotel");

58 btnEntrar.addActionListener(new ActionListener() {

59 public void actionPerformed(ActionEvent arg0) {

60 ventana2.setVisible(true);61 dispose();

62 }

63 });

64 btnEntrar.setBounds(202, 387, 150, 23);

65 getContentPane().add(btnEntrar);

66 }

67 }

1 public class Ventana2 extends JFrame {

2 private JPanel contentPane;

3 public Ventana2() {

4 //crea la venatana 2

5 setTitle("Selecci\u00F3n de Locaci\u00F3n y Hotel");

6 setDefaultCloseOperation(JFrame.EXIT_ON_CLOSE);

7 setBounds(100, 100, 450, 368);

8 contentPane = new JPanel();

9 contentPane.setBorder(new EmptyBorder(5, 5, 5, 5));

10 setContentPane(contentPane);

11 contentPane.setLayout(null);12 Seleccione_Locacion();

13 Boton_Salir(); //boton para salir de la ventana 2

14 }

15 public void Boton_Siguiente(JComboBox cmb_hotel, JComboBox cmb_locacion){

16 Leer_y_Escribir_Ficheros write_read = new Leer_y_Escribir_Ficheros();

17 ArrayList lectura_archivo = write_read.Leer_Fichero(cmb_locacion);

18 JButton btn_ingresar = new JButton("Siguiente");

19 btn_ingresar.addActionListener(new ActionListener() {

20 public void actionPerformed(ActionEvent e) {

21 ExtractDataWeb edw = new ExtractDataWeb();

22 String link = null;23 int i=0;

24 while(i<lectura_archivo.size()){25 if(cmb_hotel.getSelectedItem().equals(lectura_archivo.get(i))){26 link=(String) lectura_archivo.get(i+1);

27 }

28 i=i+2;

29 }

92

Page 104: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

30 if(link==null){31 System.out.println("Error en el link");

32 }

33 System.out.println("El link elegido es: "+link);

34 System.out.println("El Hotel elegido es: "+cmb_hotel.getSelectedItem());

35 final Ventana5 ventana5 = new Ventana5(link);

36 ventana5.setVisible(true);37 dispose();

38 }

39 });

40 btn_ingresar.setFont(new Font("Times New Roman", Font.BOLD, 14));

41 btn_ingresar.setBounds(166, 288, 103, 31);

42 contentPane.add(btn_ingresar);

43 }

44 public void Boton_Salir(){

45 JButton btn_salir = new JButton("Salir");

46 btn_salir.setFont(new Font("Times New Roman", Font.BOLD, 14));

47 btn_salir.addActionListener(new ActionListener() {

48 public void actionPerformed(ActionEvent arg0) {

49 System.out.println("Salir");

50 System.exit(0);

51 }

52 });

53 btn_salir.setBounds(279, 288, 96, 31);

54 contentPane.add(btn_salir);

55 {

56 JButton btnAtras = new JButton("Atras");

57 btnAtras.addActionListener(new ActionListener() {

58 public void actionPerformed(ActionEvent e) {

59 final Ventana1 ventana1 = new Ventana1();

60 ventana1.setVisible(true);61 dispose();

62 }

63 });

64 btnAtras.setFont(new Font("Times New Roman", Font.BOLD, 14));

65 btnAtras.setBounds(53, 288, 103, 31);

66 contentPane.add(btnAtras);

67 }

68 }

69 public JComboBox Seleccione_Locacion(){

70 JLabel lblNewLabel = new JLabel("Seleccione Locaci\u00F3n");

71 lblNewLabel.setFont(new Font("Times New Roman", Font.BOLD, 14));

72 lblNewLabel.setBounds(88, 16, 151, 20);

73 contentPane.add(lblNewLabel);

74 final JComboBox cmb_locacion = new JComboBox();

75 cmb_locacion.setFont(new Font("Times New Roman", Font.PLAIN, 12));

76 cmb_locacion.setModel(new DefaultComboBoxModel(new String[] {"Santiago de

Chile",

77 "Viña del Mar","Nueva York", "Buenos Aires"}));

93

Page 105: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

78 cmb_locacion.setBounds(88, 47, 268, 25);

79 contentPane.add(cmb_locacion);

80 Seleccione_Hotel(cmb_locacion);

81 return cmb_locacion;

82 }

83 public void Seleccione_Hotel(JComboBox cmb_locacion){

84 cmb_locacion.addActionListener(new ActionListener(){

85 public void actionPerformed(ActionEvent e) {

86 Vector comboBoxItems=new Vector();

87 Leer_y_Escribir_Ficheros write_read = new Leer_y_Escribir_Ficheros();

88 ArrayList lectura_archivo = write_read.Leer_Fichero(cmb_locacion);

89 for(int i=0;i<lectura_archivo.size();i=i+2){

90 comboBoxItems.add(lectura_archivo.get(i));

91 }

92 JLabel lblSeleccineHotel = new JLabel("Selecci\u00F3ne Hotel");

93 lblSeleccineHotel.setFont(new Font("Times New Roman", Font.BOLD, 14));

94 lblSeleccineHotel.setBounds(88, 90, 151, 20);

95 contentPane.add(lblSeleccineHotel);

96 final DefaultComboBoxModel model = new DefaultComboBoxModel(comboBoxItems);

97 final JComboBox cmb_hotel = new JComboBox(model);

98 cmb_hotel.setMaximumRowCount(20);

99 cmb_hotel.setFont(new Font("Times New Roman", Font.PLAIN, 12));

100 cmb_hotel.setBounds(88, 121, 268, 25);

101 contentPane.add(cmb_hotel);

102 Boton_Siguiente(cmb_hotel,cmb_locacion);

103 }

104 });

105 }

106 }

1 public class Ventana3 extends JFrame{

2 public ListaObjetos list = new ListaObjetos();

3 public ListaEstadisticas list_est = new ListaEstadisticas();

4 public Estadisticas est = new Estadisticas();

5 public Ventana3(ListaObjetos list){

6 JFrame f = new JFrame("Datos Extraídos");

7 Container content = f.getContentPane();

8 Ventana3(list);

9 Boton_Salir(content);

10 Boton_Atras(content);

11 }

12 public void Boton_Salir(Container content){

13 JButton btnSalir = new JButton("Salir");

14 btnSalir.addActionListener(new ActionListener() {

15 public void actionPerformed(ActionEvent e) {

16 System.exit(0);

17 }

18 });

94

Page 106: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

19 btnSalir.setBounds(305, 456, 107, 29);

20 content.add(btnSalir);

21 }

22 public void Boton_Atras(Container content){

23 JButton btnAtras = new JButton("Atras");

24 final Ventana2 ventana2 = new Ventana2();

25 btnAtras.addActionListener(new ActionListener() {

26 public void actionPerformed(ActionEvent e) {

27 ventana2.setVisible(true);28 dispose();

29 }

30 });

31 btnAtras.setBounds(177, 456, 107, 29);

32 content.add(btnAtras);

33 }

34 public void Ventana3(ListaObjetos list){

35 JFrame f = new JFrame("Datos Extraídos");

36 Container content = f.getContentPane();

37 JTree tree = new JTree();

38 tree.setModel(new DefaultTreeModel(

39 new DefaultMutableTreeNode("Extracción de Datos"){

40 {

41 int j=1;

42 DefaultMutableTreeNode node_1;

43 for(int i=0;i<list.TitulosComentarios.size();i++){

44 node_1 = new DefaultMutableTreeNode("Comentario "+j);

45 node_1.add(new DefaultMutableTreeNode("Fecha: "+

46 list.getFechas().get(i)));

47 node_1.add(new DefaultMutableTreeNode("Proposito: "+

48 list.getPropositos().get(i)));

49 node_1.add(new DefaultMutableTreeNode("Titulo Comentario: "+

50 list.getTitulosComentarios().get(i)));

51 node_1.add(new DefaultMutableTreeNode("Comentario: "+

52 list.getComentarios().get(i)));

53 node_1.add(new DefaultMutableTreeNode("Rating: "+

54 list.getRatings().get(i)));

55 node_1.add(new DefaultMutableTreeNode("Recomendación: "+

56 list.getRecomendaciones().get(i)));

57 node_1.add(new DefaultMutableTreeNode("Usuario: "+

58 list.getUsers().get(i)));

59 node_1.add(new DefaultMutableTreeNode("Ubicación: "+

60 list.getUbicaciones().get(i)));

61 node_1.add(new DefaultMutableTreeNode("Instalaciones y Servicios: "+

62 list.IyS.get(i)));

63 node_1.add(new DefaultMutableTreeNode("Limpieza: "+

64 list.Limpieza.get(i)));

65 node_1.add(new DefaultMutableTreeNode("Personal del hotel: "+

66 list.Personal.get(i)));

67 node_1.add(new DefaultMutableTreeNode("Comodidad: "+

95

Page 107: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

68 list.Comodidad.get(i)));

69 node_1.add(new DefaultMutableTreeNode("Ubicación: "+

70 list.Ubicacion.get(i)));

71 node_1.add(new DefaultMutableTreeNode("Calidad-Precio: "+

72 list.Calidad.get(i)));

73 add(node_1);

74 j++;

75 }}}));

76 JScrollPane scrollPane = new JScrollPane(tree);

77 content.add(scrollPane, BorderLayout.CENTER);

78 f.setSize(550, 434);

79 f.setVisible(true);80 }}

1 public class Ventana5 extends JFrame {

2 private JPanel contentPane;

3 public ListaObjetos list = new ListaObjetos();

4 public ListaEstadisticas list_est = new ListaEstadisticas();

5 public Estadisticas est = new Estadisticas();

6 public String Link;

7 public Ventana5(String link) {

8 setTitle("Menu");

9 setDefaultCloseOperation(JFrame.EXIT_ON_CLOSE);

10 setBounds(100, 100, 760, 340);

11 contentPane = new JPanel();

12 contentPane.setBorder(new EmptyBorder(5, 5, 5, 5));

13 setContentPane(contentPane);

14 contentPane.setLayout(null);15 Link=link;

16 System.out.println(Link);

17 ExtractDataWeb edw = new ExtractDataWeb();

18 try {

19 list=edw.ExtraerData(Link);

20 } catch (IOException e) {

21 e.printStackTrace();

22 }

23 JLabel lblNewLabel1 = new JLabel("Nombre Hotel: "+list.HotelName.get(0));

24 lblNewLabel1.setFont(new Font("Times New Roman", Font.BOLD, 14));

25 lblNewLabel1.setBounds(390, 40, 600, 20);

26 contentPane.add(lblNewLabel1);

27 JLabel lblNewLabel2 = new JLabel("Cantidad de Comentarios: "+list.

countViajeros);

28 lblNewLabel2.setFont(new Font("Times New Roman", Font.BOLD, 14));

29 lblNewLabel2.setBounds(390, 70, 600, 20);

30 contentPane.add(lblNewLabel2);

31 JLabel lblNewLabel3 = new JLabel("Ciudad del Hotel: "+list.CiudadHotel);

32 lblNewLabel3.setFont(new Font("Times New Roman", Font.BOLD, 14));

33 lblNewLabel3.setBounds(390, 100, 600, 20);

96

Page 108: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

34 contentPane.add(lblNewLabel3);

35 JLabel lblNewLabel4 = new JLabel("Dirección del Hotels: "+list.

DireccionHotel);

36 lblNewLabel4.setFont(new Font("Times New Roman", Font.BOLD, 14));

37 lblNewLabel4.setBounds(390, 130, 600, 20);

38 contentPane.add(lblNewLabel4);

39 JLabel lblNewLabel5 = new JLabel("Recomendación: "+list.TotalRecomendación+"

%");

40 lblNewLabel5.setFont(new Font("Times New Roman", Font.BOLD, 14));

41 lblNewLabel5.setBounds(390, 160, 600, 20);

42 contentPane.add(lblNewLabel5);

43 VisualizarComentarios(list,Link);

44 CrearExcel(list);

45 VisualizarEstadisticas(list,Link);

46 VisualizarAnalisisDeCorrelación(list,Link);

47 Atras();

48 Salir();

49 }

50 public void VisualizarComentarios(ListaObjetos list, String Link){

51 JButton btnNewButton = new JButton("Visualizar Comentarios");

52 btnNewButton.addActionListener(new ActionListener() {

53 public void actionPerformed(ActionEvent e) {

54 final Ventana3 prueba=new Ventana3(list);

55 }

56 });

57 btnNewButton.setBounds(106, 30, 230, 30);

58 contentPane.add(btnNewButton);

59 }

60 public void CrearExcel(ListaObjetos list){

61 JButton btnCrearExcelCon = new JButton("Crear Excel con los Datos");

62 btnCrearExcelCon.addActionListener(new ActionListener() {

63 CreateExcel excel = new CreateExcel();

64 public void actionPerformed(ActionEvent e) {

65 excel.CrearExcel(list);

66 System.out.println("Crear Excel");

67 }

68 });

69 btnCrearExcelCon.setBounds(106, 70, 230, 30);

70 contentPane.add(btnCrearExcelCon);

71

72 }

73 public void VisualizarEstadisticas(ListaObjetos list, String Link){

74 JButton btnVisualizarEstadisticas = new JButton("Visualizar Estadísticas");

75 Estadisticas le = new Estadisticas();

76 list_est=le.Estadisticas(list);

77 btnVisualizarEstadisticas.addActionListener(new ActionListener() {

78 public void actionPerformed(ActionEvent e) {

79 System.out.println("Visualizar Estadísticas");

80 final Ventana6 ventana6 = new Ventana6(list,list_est);

97

Page 109: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

81 }

82 });

83 btnVisualizarEstadisticas.setBounds(106, 110, 230, 30);

84 contentPane.add(btnVisualizarEstadisticas);

85 }

86 public void VisualizarAnalisisDeCorrelación(ListaObjetos list, String Link){

87 JButton btnVisualizarADC = new JButton("Visualizar Análisis de Correlación")

;

88 btnVisualizarADC.addActionListener(new ActionListener() {

89 public void actionPerformed(ActionEvent e) {

90 Analisis_de_Correlacion ADC = new Analisis_de_Correlacion();

91 double[][] correlacion = ADC.EjecutarAnalisis(list);

92 final Ventana7 ventana7 = new Ventana7(correlacion);

93 System.out.println("Visualizar Análisis de Correlación");

94 }

95 });

96 btnVisualizarADC.setBounds(106, 150, 230, 30);

97 contentPane.add(btnVisualizarADC);

98 }

99 public void Atras(){

100 final Ventana2 ventana2 = new Ventana2();

101 JButton btnAtras = new JButton("Atras");

102 btnAtras.addActionListener(new ActionListener() {

103 public void actionPerformed(ActionEvent arg0) {

104 System.out.println("Atras");

105 ventana2.setVisible(true);106 dispose();

107 }

108 });

109 btnAtras.setBounds(106, 190, 230, 30);

110 contentPane.add(btnAtras);

111 }

112

113 public void Salir(){

114 JButton btnSalir = new JButton("Salir");

115 btnSalir.addActionListener(new ActionListener() {

116 public void actionPerformed(ActionEvent arg0) {

117 System.out.println("Salir");

118 System.exit(0);

119 }

120 });

121 btnSalir.setBounds(106, 230, 230, 30);

122 contentPane.add(btnSalir);

123 }

124 }

1 public class Ventana6 extends JFrame{

2 public ListaObjetos list = new ListaObjetos();

98

Page 110: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

3 public ListaEstadisticas list_est = new ListaEstadisticas();

4 public Estadisticas est = new Estadisticas();

5 public Ventana6(ListaObjetos list, ListaEstadisticas list_est){

6 JFrame f = new JFrame("Datos Extraídos");

7 Container content = f.getContentPane();

8 TableModel(list,list_est);

9 Boton_Salir(content);

10 Boton_Atras(content);

11 }

12 public void Boton_Salir(Container content){

13 JButton btnSalir = new JButton("Salir");

14 btnSalir.addActionListener(new ActionListener() {

15 public void actionPerformed(ActionEvent e) {

16 System.exit(0);

17 }

18 });

19 btnSalir.setBounds(305, 456, 107, 29);

20 content.add(btnSalir);

21 }

22 public void Boton_Atras(Container content){

23 JButton btnAtras = new JButton("Atras");

24 final Ventana2 ventana2 = new Ventana2();

25 btnAtras.addActionListener(new ActionListener() {

26 public void actionPerformed(ActionEvent e) {

27 ventana2.setVisible(true);28 dispose();

29 }

30 });

31 btnAtras.setBounds(177, 456, 107, 29);

32 content.add(btnAtras);

33 }

34 public void TableModel(ListaObjetos list, ListaEstadisticas list_est){

35 JFrame f = new JFrame("Datos Extraídos");

36 //f.setDefaultCloseOperation(JFrame.EXIT_ON_CLOSE);

37 Container content = f.getContentPane();

38 DecimalFormat decimales = new DecimalFormat("0.00");

39 JTable table_1 = new JTable();

40 table_1.setFont(new Font("Times New Roman", Font.PLAIN, 12));

41 DefaultTableModel dtm = new DefaultTableModel(0,0);

42 String header[] = new String[]{"N\u00B0 Comentario", "Ranting", "

Instalaciones y Servicios",

43 "Limpieza", "Personal del Hotel", "Comodidad", "Ubicaci\u00F3n", "Calidad-

Precio"};

44 dtm.setColumnIdentifiers(header);

45 table_1.setModel(dtm);

46 int j=1;

47 dtm.addRow(new String[]{"N\u00B0 Comentario", "Ranting", "Instalaciones y

Servicios",

48 "Limpieza", "Personal del Hotel", "Comodidad", "Ubicaci\u00F3n", "Calidad-

99

Page 111: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

Precio"});

49 for(int i=0;i<list.countViajeros;i++){

50 dtm.addRow(new Object[]{j,list.Ratings.get(i),list.IyS.get(i),list.Limpieza.

get(i),

51 list.Personal.get(i),list.Comodidad.get(i),list.Ubicacion.get(i),list.

Calidad.get(i)});

52 j++;

53 }

54 dtm.addRow(new String[]{"Media",

55 decimales.format(list_est.Media.get(0)).toString(),

56 decimales.format(list_est.Media.get(1)).toString(),

57 decimales.format(list_est.Media.get(2)).toString(),

58 decimales.format(list_est.Media.get(3)).toString(),

59 decimales.format(list_est.Media.get(4)).toString(),

60 decimales.format(list_est.Media.get(5)).toString(),

61 decimales.format(list_est.Media.get(6)).toString()});

62 dtm.addRow(new String[]{"Varianza",

63 decimales.format(list_est.Varianza.get(0)).toString(),

64 decimales.format(list_est.Varianza.get(1)).toString(),

65 decimales.format(list_est.Varianza.get(2)).toString(),

66 decimales.format(list_est.Varianza.get(3)).toString(),

67 decimales.format(list_est.Varianza.get(4)).toString(),

68 decimales.format(list_est.Varianza.get(5)).toString(),

69 decimales.format(list_est.Varianza.get(6)).toString()});

70 dtm.addRow(new String[]{"Desviación Estandar", decimales.format(list_est.

DesviacionEstandar.get(0)).toString(),

71 decimales.format(list_est.DesviacionEstandar.get(1)).toString(),

72 decimales.format(list_est.DesviacionEstandar.get(2)).toString(),

73 decimales.format(list_est.DesviacionEstandar.get(3)).toString(),

74 decimales.format(list_est.DesviacionEstandar.get(4)).toString(),

75 decimales.format( list_est.DesviacionEstandar.get(4)).toString(),

76 decimales.format( list_est.DesviacionEstandar.get(6)).toString()});

77 table_1.getColumnModel().getColumn(0).setPreferredWidth(106);

78 table_1.getColumnModel().getColumn(2).setResizable(false);79 table_1.getColumnModel().getColumn(2).setPreferredWidth(132);

80 table_1.getColumnModel().getColumn(3).setResizable(false);81 table_1.getColumnModel().getColumn(3).setPreferredWidth(67);

82 table_1.getColumnModel().getColumn(4).setResizable(false);83 table_1.getColumnModel().getColumn(4).setPreferredWidth(107);

84 table_1.getColumnModel().getColumn(5).setResizable(false);85 table_1.getColumnModel().getColumn(5).setPreferredWidth(69);

86 table_1.getColumnModel().getColumn(6).setResizable(false);87 table_1.getColumnModel().getColumn(6).setPreferredWidth(60);

88 table_1.getColumnModel().getColumn(7).setResizable(false);89 table_1.getColumnModel().getColumn(7).setPreferredWidth(90);

90 table_1.setSelectionMode(ListSelectionModel.MULTIPLE_INTERVAL_SELECTION);

91 table_1.setBorder(UIManager.getBorder("Table.focusCellHighlightBorder"));

92 table_1.setBounds(10, 11, 731, 346);

93 add(table_1);

100

Page 112: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

94 JScrollPane scrollPane = new JScrollPane(table_1);

95 content.add(scrollPane, BorderLayout.CENTER);

96 f.setSize(731, 346);

97 f.setVisible(true);98 }

99 }

1 public class Ventana7 extends JFrame {

2 private JTable table_1;

3 public Ventana7(double[][] correlacion) {

4 JFrame f = new JFrame("Análisis de Correlación");

5 Container content = f.getContentPane();

6 TableModel(correlacion);

7 Boton_Salir(content);

8 Boton_Atras(content);

9 }

10 public void Boton_Salir(Container content){

11 JButton btnSalir = new JButton("Salir");

12 btnSalir.addActionListener(new ActionListener() {

13 public void actionPerformed(ActionEvent e) {

14 System.exit(0);

15 }

16 });

17 btnSalir.setBounds(305, 456, 107, 29);

18 content.add(btnSalir);

19 }

20 public void Boton_Atras(Container content){

21 JButton btnAtras = new JButton("Atras");

22 final Ventana2 ventana2 = new Ventana2();

23 btnAtras.addActionListener(new ActionListener() {

24 public void actionPerformed(ActionEvent e) {

25 ventana2.setVisible(true);26 dispose();

27 }

28 });

29 btnAtras.setBounds(177, 456, 107, 29);

30 content.add(btnAtras);

31 }

32 public void TableModel(double[][] Correlacion){

33 JFrame f = new JFrame("Análisis de Correlación");

34 //f.setDefaultCloseOperation(JFrame.EXIT_ON_CLOSE);

35 Container content = f.getContentPane();

36 DecimalFormat decimales = new DecimalFormat("0.00");

37 JTable table_1 = new JTable();

38 table_1.setFont(new Font("Times New Roman", Font.PLAIN, 12));

39 DefaultTableModel dtm = new DefaultTableModel(0,0);

40 String header[] = new String[]{"Dimensiones", "Ranting", "Instalaciones y

Servicios",

101

Page 113: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

41 "Limpieza", "Personal del Hotel", "Comodidad", "Ubicaci\u00F3n", "Calidad-

Precio"};

42 dtm.setColumnIdentifiers(header);

43 table_1.setModel(dtm);

44 int j=1;

45 dtm.addRow(new Object[]{"Rating",

decimales.format(Correlacion[0][0]),decimales.format(Correlacion[0][1]),

46 decimales.format(Correlacion[0][2]),decimales.format(Correlacion[0][3]),

47 decimales.format(Correlacion[0][4]),decimales.format(Correlacion[0][5]),

48 decimales.format(Correlacion[0][6])});

49 dtm.addRow(new Object[]{"Instalaciones y Servicios",

50 decimales.format(Correlacion[1][0]),decimales.format(Correlacion[1][1]),

51 decimales.format(Correlacion[1][2]),decimales.format(Correlacion[1][3]),

52 decimales.format(Correlacion[1][4]),decimales.format(Correlacion[1][5]),

53 decimales.format(Correlacion[1][6])});

54 dtm.addRow(new Object[]{"Limpieza",

decimales.format(Correlacion[2][0]),decimales.format(Correlacion[2][1]),

55 decimales.format(Correlacion[2][2]),decimales.format(Correlacion[2][3]),

56 decimales.format(Correlacion[2][4]),decimales.format(Correlacion[2][5]),

57 decimales.format(Correlacion[2][6])});

58 dtm.addRow(new Object[]{"Personal del Hotel", decimales.format(

Correlacion[3][0]),decimales.format(Correlacion[3][1]),

59 decimales.format(Correlacion[3][2]),decimales.format(Correlacion[3][3]),

60 decimales.format(Correlacion[3][4]),decimales.format(Correlacion[3][5]),

61 decimales.format(Correlacion[3][6])});

62 dtm.addRow(new Object[]{"Comodidad", decimales.

format(Correlacion[4][0]),decimales.format(Correlacion[4][1]),

63 decimales.format(Correlacion[4][2]),decimales.format(Correlacion[4][3]),

64 decimales.format(Correlacion[4][4]),decimales.format(Correlacion[4][5]),

65 decimales.format(Correlacion[4][6])});

66 dtm.addRow(new Object[]{"Ubicaciones", decimales.

format(Correlacion[5][0]),decimales.format(Correlacion[5][1]),

67 decimales.format(Correlacion[5][2]),decimales.format(Correlacion[5][3]),

68 decimales.format(Correlacion[5][4]),decimales.format(Correlacion[5][5]),

69 decimales.format(Correlacion[5][6])});

70 dtm.addRow(new Object[]{"Calidad-Precio", decimales.

format(Correlacion[6][0]),decimales.format(Correlacion[6][1]),

71 decimales.format(Correlacion[6][2]),decimales.format(Correlacion[6][3]),

72 decimales.format(Correlacion[6][4]),decimales.format(Correlacion[6][5]),

73 decimales.format(Correlacion[6][6])});

74 table_1.getColumnModel().getColumn(0).setPreferredWidth(106);

75 table_1.getColumnModel().getColumn(2).setResizable(false);76 table_1.getColumnModel().getColumn(2).setPreferredWidth(132);

77 table_1.getColumnModel().getColumn(3).setResizable(false);78 table_1.getColumnModel().getColumn(3).setPreferredWidth(67);

79 table_1.getColumnModel().getColumn(4).setResizable(false);80 table_1.getColumnModel().getColumn(4).setPreferredWidth(107);

81 table_1.getColumnModel().getColumn(5).setResizable(false);82 table_1.getColumnModel().getColumn(5).setPreferredWidth(69);

102

Page 114: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

83 table_1.getColumnModel().getColumn(6).setResizable(false);84 table_1.getColumnModel().getColumn(6).setPreferredWidth(60);

85 table_1.getColumnModel().getColumn(7).setResizable(false);86 table_1.getColumnModel().getColumn(7).setPreferredWidth(90);

87 table_1.setSelectionMode(ListSelectionModel.MULTIPLE_INTERVAL_SELECTION);

88 table_1.setBorder(UIManager.getBorder("Table.focusCellHighlightBorder"));

89 table_1.setBounds(10, 11, 731, 346);

90 add(table_1);

91 JScrollPane scrollPane = new JScrollPane(table_1);

92 content.add(scrollPane, BorderLayout.CENTER);

93 f.setSize(731, 346);

94 f.setVisible(true);95 }

96 }

1 public class Estadisticas {

2 public ListaObjetos list = new ListaObjetos();

3 public ListaEstadisticas list_est=new ListaEstadisticas();

4 public Estadisticas(){

5 }

6 public ListaEstadisticas Estadisticas(ListaObjetos list) {

7 ArrayList<Float> media = new ArrayList();

8 ArrayList<Double> varianza = new ArrayList();

9 ArrayList<Double> desviacionestandar = new ArrayList();;

10 int num=list.Comentarios.size();

11 System.out.println("num: "+num);

12 int SumatoriaRating=0;

13 int SumatoriaIyS=0;

14 int SumatoriaLimpieza=0;

15 int SumatoriaPdelH=0;

16 int SumatoriaComodidad=0;

17 int SumatoriaUbucacion=0;

18 int SumatoriaCyP=0;

19 int flag=0;

20 for(int i=0;i<num;i++){

21 SumatoriaRating=SumatoriaRating+Integer.parseInt(list.Ratings.get(i));

22 }

23 float mediaR=Media(SumatoriaRating, num);

24 media.add(mediaR);

25 flag=1;

26 double varianzaR=Varianza(mediaR,num,list,flag);

27 varianza.add(varianzaR);

28 double desviacionR=DesviacionEstandar(varianzaR);

29 desviacionestandar.add(desviacionR);

30 for(int i=0;i<num;i++){

31 SumatoriaIyS=SumatoriaIyS+Integer.parseInt(list.IyS.get(i));

32 }

33 float mediaIyS=Media(SumatoriaIyS, num);

103

Page 115: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

34 media.add(mediaIyS);

35 flag=2;

36 double varianzaIyS=Varianza(mediaIyS,num,list,flag);

37 varianza.add(varianzaIyS);

38 double desviacionIyS=DesviacionEstandar(varianzaIyS);

39 desviacionestandar.add(desviacionIyS);

40 for(int i=0;i<num;i++){

41 SumatoriaLimpieza=SumatoriaLimpieza+Integer.parseInt(list.Limpieza.get(i));

42 }

43 float mediaLimpieza=Media(SumatoriaLimpieza,num);

44 media.add(mediaLimpieza);

45 flag=3;

46 double varianzaLimpieza=Varianza(mediaLimpieza,num,list,flag);

47 varianza.add(varianzaLimpieza);

48 double desviacionLimpieza=DesviacionEstandar(varianzaLimpieza);

49 desviacionestandar.add(desviacionLimpieza);

50 for(int i=0;i<num;i++){

51 SumatoriaPdelH=SumatoriaPdelH+Integer.parseInt(list.Personal.get(i));

52 }

53 float mediaPdelH=Media(SumatoriaPdelH,num);

54 media.add(mediaPdelH);

55 flag=4;

56 double varianzaPdelH=Varianza(mediaPdelH,num,list,flag);

57 varianza.add(varianzaPdelH);

58 double desviacionPdelH=DesviacionEstandar(varianzaPdelH);

59 desviacionestandar.add(desviacionPdelH);

60 for(int i=0;i<num;i++){

61 SumatoriaComodidad=SumatoriaComodidad+Integer.parseInt(list.Comodidad.get(i)

);

62 }

63 float mediaComodidad=Media(SumatoriaComodidad,num);

64 media.add(mediaComodidad);

65 flag=5;

66 double varianzaComodidad=Varianza(mediaComodidad,num,list,flag);

67 varianza.add(varianzaComodidad);

68 double desviacionComodidad=DesviacionEstandar(varianzaComodidad);

69 desviacionestandar.add(desviacionComodidad);

70 for(int i=0;i<num;i++){

71 SumatoriaUbucacion=SumatoriaUbucacion+Integer.parseInt(list.Ubicacion.get(i)

);

72 }

73 float mediaUbucacion=Media(SumatoriaUbucacion,num);

74 media.add(mediaUbucacion);

75 flag=6;

76 double varianzaUbicacion=Varianza(mediaUbucacion,num,list,flag);

77 varianza.add(varianzaUbicacion);

78 double desviacionUbicacion=DesviacionEstandar(varianzaUbicacion);

79 desviacionestandar.add(desviacionUbicacion);

80 for(int i=0;i<num;i++){

104

Page 116: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

81 SumatoriaCyP=SumatoriaCyP+Integer.parseInt(list.Calidad.get(i));

82 }

83 float mediaCyP=Media(SumatoriaCyP,num);

84 media.add(mediaCyP);

85 flag=7;

86 double varianzaCyP=Varianza(mediaCyP,num,list,flag);

87 varianza.add(varianzaCyP);

88 double desviacionCyP=DesviacionEstandar(varianzaCyP);

89 desviacionestandar.add(desviacionCyP);

90 list_est.setMedia(media);

91 list_est.setVarianza(varianza);

92 list_est.setDesviacionEstandar(desviacionestandar);

93 return list_est;

94 }

95 public float Media(int sumatoria, int num){

96 float media = 0;

97 media = sumatoria / (num*1.0f);

98 return media;

99 }

100 public double Varianza(float media, int num, ListaObjetos list, int flag){

101 DecimalFormat decimales = new DecimalFormat("0.00");

102 int valor[] = new int[num];103 int sumatoria = 0;

104 double varianza = 0.00;

105 double desviacion = 0.00;

106 for (int i = 0; i < num; i++) {

107 double rango = 0;

108 if(flag==1){109 rango = Math.pow(Integer.parseInt(list.Ratings.get(i)) - media, 2);

110 }

111 if(flag==2){112 rango = Math.pow(Integer.parseInt(list.IyS.get(i)) - media, 2);

113 }

114 if(flag==3){115 rango = Math.pow(Integer.parseInt(list.Limpieza.get(i)) - media, 2);

116 }

117 if(flag==4){118 rango = Math.pow(Integer.parseInt(list.Personal.get(i)) - media, 2);

119 }

120 if(flag==5){121 rango = Math.pow(Integer.parseInt(list.Comodidad.get(i)) - media, 2);

122 }

123 if(flag==6){124 rango = Math.pow(Integer.parseInt(list.Ubicacion.get(i)) - media, 2);

125 }

126 if(flag==7){127 rango = Math.pow(Integer.parseInt(list.Calidad.get(i)) - media, 2);

128 }

129 if(rango==0){

105

Page 117: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

130 System.out.println("Error de varianza");

131 }

132 varianza = varianza + rango;

133 }

134 varianza = varianza / (num-1);

135 return varianza;

136 }

137 public double DesviacionEstandar(double varianza){

138 DecimalFormat decimales = new DecimalFormat("0.00");

139 double desviacion = 0.00;

140 desviacion = Math.sqrt(varianza);

141 return desviacion;

142 }

143 }

1 public class ListaEstadisticas {

2 public ArrayList<Float> Media;

3 public ArrayList<Double> Varianza;

4 public ArrayList<Double> DesviacionEstandar;

5 public ListaEstadisticas() {

6 this.Media=Media;7 this.Varianza=Varianza;8 this.DesviacionEstandar=DesviacionEstandar;9 }

10 public ArrayList<Float> getMedia() {

11 return Media;

12 }

13 public void setMedia(ArrayList<Float> media) {

14 Media = media;

15 }

16 public ArrayList<Double> getVarianza() {

17 return Varianza;

18 }

19 public void setVarianza(ArrayList<Double> varianza) {

20 Varianza = varianza;

21 }

22 public ArrayList<Double> getDesviacionEstandar() {

23 return DesviacionEstandar;

24 }

25 public void setDesviacionEstandar(ArrayList<Double> desviacionEstandar) {

26 DesviacionEstandar = desviacionEstandar;

27 }

28 }

1 public class ListaObjetos{

2 public ArrayList<String> TitulosComentarios;

3 public ArrayList<String> Comentarios;

106

Page 118: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

4 public ArrayList<String> Ratings;

5 public ArrayList<String> Recomendaciones;

6 public ArrayList<String> Ubicaciones;

7 public ArrayList<String> Users;

8 public ArrayList<String> CaracteristicasHotel;

9 public ArrayList<String> HotelName;

10 public ArrayList<String> Fechas;

11 public ArrayList<String> Propositos;

12 public ArrayList<String> IyS;

13 public ArrayList<String> Limpieza;

14 public ArrayList<String> Personal;

15 public ArrayList<String> Comodidad;

16 public ArrayList<String> Ubicacion;

17 public ArrayList<String> Calidad;

18 public String DireccionHotel;

19 public String CiudadHotel;

20 public int TotalRecomendación;

21 public int getTotalRecomendación() {

22 return TotalRecomendación;

23 }

24 public void setTotalRecomendación(int totalRecomendación) {

25 TotalRecomendación = totalRecomendación;

26 }

27 public String getDireccionHotel() {

28 return DireccionHotel;

29 }

30 public void setDireccionHotel(String direccionHotel) {

31 DireccionHotel = direccionHotel;

32 }

33 public String getCiudadHotel() {

34 return CiudadHotel;

35 }

36 public void setCiudadHotel(String ciudadHotel) {

37 CiudadHotel = ciudadHotel;

38 }

39 public ArrayList<String> getIyS() {

40 return IyS;

41 }

42 public void setIyS(ArrayList<String> iyS) {

43 IyS = iyS;

44 }

45 public ArrayList<String> getLimpieza() {

46 return Limpieza;

47 }

48 public void setLimpieza(ArrayList<String> limpieza) {

49 Limpieza = limpieza;

50 }

51 public ArrayList<String> getPersonal() {

52 return Personal;

107

Page 119: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

53 }

54 public void setPersonal(ArrayList<String> personal) {

55 Personal = personal;

56 }

57 public ArrayList<String> getComodidad() {

58 return Comodidad;

59 }

60 public void setComodidad(ArrayList<String> comodidad) {

61 Comodidad = comodidad;

62 }

63 public ArrayList<String> getUbicacion() {

64 return Ubicacion;

65 }

66 public void setUbicacion(ArrayList<String> ubicacion) {

67 Ubicacion = ubicacion;

68 }

69 public ArrayList<String> getCalidad() {

70 return Calidad;

71 }

72 public void setCalidad(ArrayList<String> calidad) {

73 Calidad = calidad;

74 }

75 public ArrayList<String> currentPages;

76 public int countViajeros;

77 public int CantidadComentarioPage;

78 public ArrayList<String> getTitulosComentarios() {

79 return TitulosComentarios;

80 }

81 public void setTitulosComentarios(ArrayList<String> titulosComentarios) {

82 TitulosComentarios = titulosComentarios;

83 }

84 public ArrayList<String> getComentarios() {

85 return Comentarios;

86 }

87 public void setComentarios(ArrayList<String> comentarios) {

88 Comentarios = comentarios;

89 }

90 public ArrayList<String> getRatings() {

91 return Ratings;

92 }

93 public void setRatings(ArrayList<String> ratings) {

94 Ratings = ratings;

95 }

96 public ArrayList<String> getRecomendaciones() {

97 return Recomendaciones;

98 }

99 public void setRecomendaciones(ArrayList<String> recomendaciones) {

100 Recomendaciones = recomendaciones;

101 }

108

Page 120: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

102 public ArrayList<String> getUbicaciones() {

103 return Ubicaciones;

104 }

105 public void setUbicaciones(ArrayList<String> ubicaciones) {

106 Ubicaciones = ubicaciones;

107 }

108 public ArrayList<String> getUsers() {

109 return Users;

110 }

111 public void setUsers(ArrayList<String> users) {

112 Users = users;

113 }

114 public ArrayList<String> getCaracteristicasHotel() {

115 return CaracteristicasHotel;

116 }

117 public void setCaracteristicasHotel(ArrayList<String> caracteristicasHotel)

{

118 CaracteristicasHotel = caracteristicasHotel;

119 }

120 public ArrayList<String> getHotelName() {

121 return HotelName;

122 }

123 public void setHotelName(ArrayList<String> hotelName) {

124 HotelName = hotelName;

125 }

126 public ArrayList<String> getFechas() {

127 return Fechas;

128 }

129 public void setFechas(ArrayList<String> fechas) {

130 Fechas = fechas;

131 }

132 public ArrayList<String> getPropositos() {

133 return Propositos;

134 }

135 public void setPropositos(ArrayList<String> propositos) {

136 Propositos = propositos;

137 }

138 public ArrayList<String> getCurrentPages() {

139 return currentPages;

140 }

141 public void setCurrentPages(ArrayList<String> currentPages) {

142 this.currentPages = currentPages;

143 }

144 public int getCountViajeros() {

145 return countViajeros;

146 }

147 public void setCountViajeros(int countViajeros) {

148 this.countViajeros = countViajeros;

149 }

109

Page 121: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

150 public int getCantidadComentarioPage() {

151 return CantidadComentarioPage;

152 }

153 public void setCantidadComentarioPage(int cantidadComentarioPage) {

154 CantidadComentarioPage = cantidadComentarioPage;

155 }

156 }

1 public class CreateExcel {

2 public void CrearExcel(ListaObjetos list) {

3 HSSFWorkbook wb = new HSSFWorkbook();

4 HSSFSheet sheet = wb.createSheet("Estadísticas");

5 System.out.println("Crear Excel");

6 for(int i=0;i<list.countViajeros;i++){

7 System.out.println("Fechas: "+list.Fechas.get(i).toString());

8 System.out.println("Propositos: "+list.Propositos.get(i).toString());

9 System.out.println("Titulo Comentario: "+list.TitulosComentarios.get(i).

toString());

10 System.out.println("Comentarios: "+list.Comentarios.get(i).toString());

11 System.out.println("User :"+list.Users.get(i).toString());

12 System.out.println("Ubicaciones: "+list.Ubicaciones.get(i).toString());

13 System.out.println("Recomendaciones: "+list.Recomendaciones.get(i).toString

());

14 System.out.println("Rating: "+list.Ratings.get(i).toString());

15 System.out.println("Ins y Serv: "+list.IyS.get(i).toString());

16 System.out.println("Limpieza: "+list.Limpieza.get(i).toString());

17 System.out.println("Personal: "+list.Personal.get(i).toString());

18 System.out.println("Comodidad: "+list.Comodidad.get(i).toString());

19 System.out.println("Ubicacion: "+list.Ubicacion.get(i).toString());

20 System.out.println("Calidad-Precio: "+list.Calidad.get(i).toString());

21

22 }

23 Map<String, Object[]> data = new TreeMap<String, Object[]>();

24 data.put("0", new Object[] {"Número Comentario",

25 "Fecha","Proposito","Titulo Comentario",

26 "Comentario",

27 "Usuario", "Ubicacion",

28 "Recomendaciones",

29 "Rating",

30 "Instalaciones y Servicios",

31 "Limpieza",

32 "Personal del Hotel",

33 "Comodidad",

34 "Ubicación",

35 "Calidad-Precio"});

36 for(int i=0;i<list.countViajeros;i++){

37 System.out.println("i: "+i);;

38 String cont=Integer.toString(i+1);

110

Page 122: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

39 String num=Integer.toString(i+1);

40 int k=i;

41 data.put(cont, new Object[] {num, list.Fechas.get(i).toString(),

42 list.Propositos.get(i).toString(),

43 list.TitulosComentarios.get(i).toString(),

44 list.Comentarios.get(i).toString(),

45 list.Users.get(i).toString(),

46 list.Ubicaciones.get(i).toString(),

47 list.Recomendaciones.get(i).toString(),

48 list.Ratings.get(i).toString(),

49 list.IyS.get(i).toString(),

50 list.Limpieza.get(i).toString(),

51 list.Personal.get(i).toString(),

52 list.Comodidad.get(i).toString(),

53 list.Ubicacion.get(i).toString(),

54 list.Calidad.get(i).toString()});

55 }

56 Set<String> keyset = data.keySet();

57 int rownum = 0;

58 for (String key : keyset) {

59 Row row = sheet.createRow(rownum++);

60 System.out.println("rownumm:"+rownum);

61 Object [] objArr = data.get(key);

62 int cellnum = 0;

63 for (Object obj : objArr) {

64 Cell cell = row.createCell(cellnum++);

65 System.out.println("cellnumm:"+cellnum);

66 if(obj instanceof Date)

67 cell.setCellValue((Date)obj);

68 else if(obj instanceof Boolean)

69 cell.setCellValue((Boolean)obj);

70 else if(obj instanceof String)

71 cell.setCellValue((String)obj);

72 else if(obj instanceof Double)

73 cell.setCellValue((Double)obj);

74 }

75 }

76 try {

77 String NombreExcel=list.HotelName.get(0);

78 FileOutputStream fileOut = new FileOutputStream(NombreExcel+".xls");

79 wb.write(fileOut);

80 fileOut.close();

81 System.out.println("Excel Escrito Satisfactoriamente..");

82 JOptionPane.showMessageDialog(null, "Excel Creado Exitosamente!!");

83 } catch (FileNotFoundException e) {

84 e.printStackTrace();

85 } catch (IOException e) {

86 e.printStackTrace();

87 }

111

Page 123: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

88 }

89 }

1 public class ObtenerHoteles {

2 public Elements NombreHoteles;

3 public Elements CantidadHoteles;

4 public Elements LinkHoteles;

5 public Elements Locacion;

6 public int num;

7 public String Locaciones;

8 public String CantidadComentario;

9 public Elements CantidadComentarios;

10 public ObtenerHoteles() {

11 }

12 public ObtenerHoteles(Elements NombreHoteles, Elements CantidadHoteles,

Elements LinkHoteles,Elements Locacion, Elements CantidadComentarios){

13 this.NombreHoteles=NombreHoteles;14 this.CantidadHoteles=CantidadHoteles;15 this.LinkHoteles=LinkHoteles;16 this.Locacion=Locacion;17 this.CantidadComentarios=CantidadComentarios;18 }

19

20 public ListaHoteles ExtraerHotel(String link) throws IOException{

21 //String santiago = "http://www.hotelclub.com/shop/home?hotDA=true&hotel.

keyword.dl=26548&hotel.rooms%5B0%5D.chldAge%5B1%5D=&hotel.rooms%5B0%5D.

chldAge%5B2%5D=&hotel.rooms%5B0%5D.chldAge%5B0%5D=&hotel.couponCode=&

hotel.rooms%5B0%5D.adlts=2&hotel.keyword.key=santiago&type=hotel&hotel.

chkin=&hotel.rooms%5B0%5D.chlds=0&hotel.rooms%5B0%5D.chldAge%5B3%5D=&

hotel.rooms%5B0%5D.chldAge%5B4%5D=&hotel.chkout=&hotel.rating=&hotel.

coord=&hotel.type=keyword&hotel.hname=&search=Continuar&hsv.page=";

22 //String vina="http://www.hotelclub.com/shop/home?type=hotel&hotel.type=

keyword&hotel.fid=&hotel.coord=&hotel.keyword.key=Viña+del+Mar%2C+Chile&

hotel.locId=loc.id%3A26550&hotel.chkin=&hotel.chkout=&hotel.rooms%5B0%5D

.adlts=2&hotel.rooms%5B0%5D.chlds=0&hotel.rooms%5B0%5D.chldAge%5B0%5D=&

hotel.rooms%5B0%5D.chldAge%5B1%5D=&hotel.rooms%5B0%5D.chldAge%5B2%5D=&

hotel.rooms%5B0%5D.chldAge%5B3%5D=&hotel.rooms%5B0%5D.chldAge%5B4%5D=&

hotel.rating=&hotel.hname=&hotel.couponCode=&search=Buscar";

23 //String link=santiago;

24 Document doc;

25 Document doc1;

26 ListaHoteles ListHoteles=new ListaHoteles();

27 ArrayList<String> nh =new ArrayList();

28 ArrayList<String> lh =new ArrayList();

29 ArrayList<String> listLink =new ArrayList();

30 String LinkH=link;

31 listLink.add(LinkH);

32 try{

112

Page 124: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

33 doc1=Jsoup.connect(listLink.get(0)).get();

34 CantidadHoteles=doc1.select(".numberOfResults");

35 for(Element CantidadHotel : CantidadHoteles){

36 num=Integer.parseInt(CantidadHotel.text());

37 }

38 }catch(IOException e){

39 System.out.println("Problemas de conexión a internet!");

40 JOptionPane.showMessageDialog(null, "Problema con la conexión a internet!");

41 }

42 System.out.println("num1:"+num);

43 if(num>25){44 int mod=num%25;

45 int div=num/25;

46 if(mod==0){47 num=div;

48 ListHoteles.setCantidadHoteles(num);

49 }else{50 num=div+1;

51 ListHoteles.setCantidadHoteles(num);

52 }

53 String[] linkSplit=listLink.get(0).split("page=");

54 for(int i=2;i<=ListHoteles.CantidadHoteles;i++){

55 listLink.add(linkSplit[0]+"page="+i);

56 }

57 }else{58 num=1;

59 ListHoteles.setCantidadHoteles(num);

60 }

61 System.out.println("Link paginas hoteles:"+listLink);

62 try{63 for(int j=0;j<ListHoteles.CantidadHoteles;j++){

64 System.out.println("j:"+j);

65 doc=Jsoup.connect(listLink.get(j)).get();

66

67 NombreHoteles=doc.select(".hotelName a");

68 LinkHoteles=doc.select(".hotelName a[href]");

69 Locacion=doc.select("title");

70 CantidadComentarios=doc.select(".numReviews link");

71

72 for(Element NombreHotel : NombreHoteles){

73 nh.add(NombreHotel.text());

74 }

75 for(Element LinkHotel : LinkHoteles){

76 lh.add(LinkHotel.attr("abs:href"));

77 }

78 for(Element locacion : Locacion){

79 Locaciones=locacion.text();

80 }

81 for(Element cantidadComentario : CantidadComentarios){

113

Page 125: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

82 CantidadComentario=cantidadComentario.text();

83 }

84

85 ListHoteles.setNombreHoteles(nh);

86 ListHoteles.setLinkHoteles(lh);

87 ListHoteles.setLocacion(Locaciones);

88 ListHoteles.setCantidadComentario(CantidadComentario);

89 }

90 }catch(IOException e){

91 System.out.println("Problemas de conexión a internet!");

92 JOptionPane.showMessageDialog(null, "Problema con la conexión a internet!");

93 }

94 for(int i=0;i<ListHoteles.NombreHoteles.size();i++){

95 System.out.println(i+1+")"+"NombreHoteles :"+ListHoteles.NombreHoteles.get(i

)+"\n");

96 System.out.println(i+1+")"+"LinkHotel: "+ListHoteles.LinkHoteles.get(i)+"\n"

);

97 System.out.println("Locacion: "+ListHoteles.Locacion);

98 }

99 System.out.println("Cantidad de Hoteles :"+ListHoteles.NombreHoteles.size())

;

100 System.out.println("Cantidad Comentarios: "+ListHoteles.CantidadComentario);

101

102 Leer_y_Escribir_Ficheros read_write = new Leer_y_Escribir_Ficheros();

103 read_write.Escribir_Fichero(ListHoteles);

104 return ListHoteles;

105 }

106 }

1 public class Leer_y_Escribir_Ficheros {

2 public Leer_y_Escribir_Ficheros() {

3 }

4 public void Escribir_Fichero(ListaHoteles ListHoteles){

5 try{6 //Crear un objeto File se encarga de crear o abrir acceso a un archivo que

se especifica en su constructor

7 String[] nombreSplit=ListHoteles.Locacion.split("-");

8 File archivo=new File(nombreSplit[0]+".txt");

9

10 //Crear objeto FileWriter que sera el que nos ayude a escribir sobre archivo

11 FileWriter escribir=new FileWriter(archivo,true);12

13 //Escribimos en el archivo con el metodo write

14 for(int k=0;k<ListHoteles.NombreHoteles.size();k++){

15 escribir.write(ListHoteles.NombreHoteles.get(k)+"\r\n");

16 escribir.write(ListHoteles.LinkHoteles.get(k)+"\r\n");

17 //escribir.write(ListHoteles.CantidadComentario+"\r\n");

18 }

114

Page 126: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

19 //Cerramos la conexion

20 escribir.close();

21 JOptionPane.showMessageDialog(null, "Hoteles Guardados Correctamente!");

22 }catch(Exception e){

23 System.out.println("Error al escribir");

24 JOptionPane.showMessageDialog(null, "Error al guardar los hoteles!");

25 }

26 }

27 public ArrayList Leer_Fichero(JComboBox cmb_locacion){

28 System.out.println("Nombre Archivo:"+cmb_locacion.getSelectedItem());

29 File archivo = new File(cmb_locacion.getSelectedItem()+" "+".txt");

30 Scanner s = null;31 ArrayList<String> lectura_archivo =new ArrayList();

32 try {

33 // Leemos el contenido del fichero

34 //System.out.println("... Leemos el contenido del fichero ...");

35 s = new Scanner(archivo);

36

37 // Leemos linea a linea el fichero

38 while (s.hasNextLine()) {

39 String linea = s.nextLine(); // Guardamos la linea en un String

40 //System.out.println(linea); // Imprimimos la linea

41 lectura_archivo.add(linea);

42 }

43 } catch (Exception ex) {

44 System.out.println("Mensaje: " + ex.getMessage());

45 JOptionPane.showMessageDialog(null, "Mensaje: " + ex.getMessage());

46 } finally {

47 // Cerramos el fichero tanto si la lectura ha sido correcta o no

48 try {

49 if (s != null)50 s.close();

51 } catch (Exception ex2) {

52 System.out.println("Mensaje 2: " + ex2.getMessage());

53 JOptionPane.showMessageDialog(null, "Mensaje 2: " + ex2.getMessage());

54 }

55 }

56 return lectura_archivo;

57 }

58 }

1 public class Analisis_de_Correlacion {

2 public double COV1=0;

3 public double COV2=0;

4 public double Sx=0;

5 public double Sy=0;

6 public double r=0;

7 public double SxSy=0;

115

Page 127: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

8 public double[][] Correlacion= {{1,0,0,0,0,0,0},

9 {0,1,0,0,0,0,0},

10 {0,0,1,0,0,0,0},

11 {0,0,0,1,0,0,0},

12 {0,0,0,0,1,0,0},

13 {0,0,0,0,0,1,0},

14 {0,0,0,0,0,0,1}};

15 public double[][] EjecutarAnalisis(ListaObjetos list){

16 DecimalFormat decimales = new DecimalFormat("0.00");

17 double n=list.TitulosComentarios.size();

18 double SumR = 0;double SumIyS=0;double SumL=0;double SumP=0;double SumC=0;

double SumU=0;double SumCP=0;

19 double SumRIyS=0;double SumRL=0;double SumRP=0;double SumRC=0;double SumRU

=0;double SumRCP=0;

20 double SumIySL=0;double SumIySP=0;double SumIySC=0;double SumIySU=0;doubleSumIySCP=0

21 double SumLP=0;double SumLC=0;double SumLU=0;double SumLCP=0;

22 double SumPC=0;double SumPU=0;double SumPCP=0;

23 double SumCU=0;double SumCCP=0;double SumUCP=0;

24 double PromR=0;double PromIyS=0;double PromL=0;double PromP=0;double PromC

=0;double PromU=0;double PromCP=0;

25 double SumR2=0;double SumIyS2=0;double SumL2=0;double SumP2=0;double SumC2

=0;double SumU2=0;double SumCP2=0;

26 int tope=list.TitulosComentarios.size();

27 double largo=list.TitulosComentarios.size();

28 for(int i=0;i<largo;i++){

29 SumR=SumR+Integer.parseInt(list.Ratings.get(i));

30 SumIyS=SumIyS+Integer.parseInt(list.IyS.get(i));

31 SumL=SumL+Integer.parseInt(list.Limpieza.get(i));

32 SumP=SumP+Integer.parseInt(list.Personal.get(i));

33 SumC=SumC+Integer.parseInt(list.Comodidad.get(i));

34 SumU=SumU+Integer.parseInt(list.Ubicacion.get(i));

35 SumCP=SumCP+Integer.parseInt(list.Calidad.get(i));

36 SumRIyS=SumRIyS+(Integer.parseInt(list.Ratings.get(i))*Integer.parseInt(list

.IyS.get(i)));

37 SumRL=SumRL+(Integer.parseInt(list.Ratings.get(i))*Integer.parseInt(list.

Limpieza.get(i)));

38 SumRP=SumRP+(Integer.parseInt(list.Ratings.get(i))*Integer.parseInt(list.

Personal.get(i)));

39 SumRC=SumRC+(Integer.parseInt(list.Ratings.get(i))*Integer.parseInt(list.

Comodidad.get(i)));

40 SumRU=SumRU+(Integer.parseInt(list.Ratings.get(i))*Integer.parseInt(list.

Ubicacion.get(i)));

41 SumRCP=SumRCP+(Integer.parseInt(list.Ratings.get(i))*Integer.parseInt(list.

Calidad.get(i)));

42 SumIySL=SumIySL+(Integer.parseInt(list.IyS.get(i))*Integer.parseInt(list.

Limpieza.get(i)));

43 SumIySP=SumIySP+(Integer.parseInt(list.IyS.get(i))*Integer.parseInt(list.

Personal.get(i)));

116

Page 128: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

44 SumIySC=SumIySC+(Integer.parseInt(list.IyS.get(i))*Integer.parseInt(list.

Comodidad.get(i)));

45 SumIySU=SumIySU+(Integer.parseInt(list.IyS.get(i))*Integer.parseInt(list.

Ubicacion.get(i)));

46 SumIySCP=SumIySCP+(Integer.parseInt(list.IyS.get(i))*Integer.parseInt(list.

Calidad.get(i)));

47 SumLP=SumLP+(Integer.parseInt(list.Limpieza.get(i))*Integer.parseInt(list.

Personal.get(i)));

48 SumLC=SumLC+(Integer.parseInt(list.Limpieza.get(i))*Integer.parseInt(list.

Comodidad.get(i)));

49 SumLU=SumLU+(Integer.parseInt(list.Limpieza.get(i))*Integer.parseInt(list.

Ubicacion.get(i)));

50 SumLCP=SumLCP+(Integer.parseInt(list.Limpieza.get(i))*Integer.parseInt(list.

Calidad.get(i)));

51 SumPC=SumPC+(Integer.parseInt(list.Personal.get(i))*Integer.parseInt(list.

Comodidad.get(i)));

52 SumPU=SumPU+(Integer.parseInt(list.Personal.get(i))*Integer.parseInt(list.

Ubicacion.get(i)));

53 SumPCP=SumPCP+(Integer.parseInt(list.Personal.get(i))*Integer.parseInt(list.

Calidad.get(i)));

54 SumCU=SumCU+(Integer.parseInt(list.Comodidad.get(i))*Integer.parseInt(list.

Ubicacion.get(i)));

55 SumCCP=SumCCP+(Integer.parseInt(list.Comodidad.get(i))*Integer.parseInt(list

.Calidad.get(i)));

56 SumUCP=SumUCP+(Integer.parseInt(list.Ubicacion.get(i))*Integer.parseInt(list

.Calidad.get(i)));

57 SumR2=SumR2+(Integer.parseInt(list.Ratings.get(i)))*(Integer.parseInt(list.

Ratings.get(i)));

58 SumIyS2=SumIyS2+(Integer.parseInt(list.IyS.get(i)))*(Integer.parseInt(list.

IyS.get(i)));

59 SumL2=SumL2+(Integer.parseInt(list.Limpieza.get(i)))*(Integer.parseInt(list.

Limpieza.get(i)));

60 SumP2=SumP2+(Integer.parseInt(list.Personal.get(i)))*(Integer.parseInt(list.

Personal.get(i)));

61 SumC2=SumC2+(Integer.parseInt(list.Comodidad.get(i)))*(Integer.parseInt(list

.Comodidad.get(i)));

62 SumU2=SumU2+(Integer.parseInt(list.Ubicacion.get(i)))*(Integer.parseInt(list

.Ubicacion.get(i)));

63 SumCP2=SumCP2+(Integer.parseInt(list.Calidad.get(i)))*(Integer.parseInt(list

.Calidad.get(i)));

64 }

65 PromR=SumR/largo;

66 PromIyS=SumIyS/largo;

67 PromL=SumL/largo;

68 PromP=SumP/largo;

69 PromC=SumC/largo;

70 PromU=SumU/largo;

71 PromCP=SumCP/largo;

72 Correlacion[0][1]=r(n,SumR,SumIyS,SumRIyS,SumR2,SumIyS2,PromR,PromIyS);

117

Page 129: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

73 Correlacion[0][2]=r(n,SumR,SumL,SumRL,SumR2,SumL2,PromR,PromL);

74 Correlacion[0][3]=r(n,SumR,SumP,SumRP,SumR2,SumP2,PromR,PromP);

75 Correlacion[0][4]=r(n,SumR,SumC,SumRC,SumR2,SumC2,PromR,PromC);

76 Correlacion[0][5]=r(n,SumR,SumU,SumRU,SumR2,SumU2,PromR,PromU);

77 Correlacion[0][6]=r(n,SumR,SumCP,SumRCP,SumR2,SumCP2,PromR,PromCP);

78 Correlacion[1][2]=r(n,SumIyS,SumL,SumIySL,SumIyS2,SumL2,PromIyS,PromL);

79 Correlacion[1][3]=r(n,SumIyS,SumP,SumIySP,SumIyS2,SumP2,PromIyS,PromP);

80 Correlacion[1][4]=r(n,SumIyS,SumC,SumIySC,SumIyS2,SumC2,PromIyS,PromC);

81 Correlacion[1][5]=r(n,SumIyS,SumU,SumIySU,SumIyS2,SumU2,PromIyS,PromU);

82 Correlacion[1][6]=r(n,SumIyS,SumCP,SumIySCP,SumIyS2,SumCP2,PromIyS,PromCP);

83 Correlacion[2][3]=r(n,SumL,SumP,SumLP,SumL2,SumP2,PromL,PromP);

84 Correlacion[2][4]=r(n,SumL,SumC,SumLC,SumL2,SumC2,PromL,PromC);

85 Correlacion[2][5]=r(n,SumL,SumU,SumLU,SumL2,SumU2,PromL,PromU);

86 Correlacion[2][6]=r(n,SumL,SumCP,SumLCP,SumL2,SumCP2,PromL,PromCP);

87 Correlacion[3][4]=r(n,SumP,SumC,SumPC,SumP2,SumC2,PromP,PromC);

88 Correlacion[3][5]=r(n,SumP,SumU,SumPU,SumP2,SumU2,PromP,PromU);

89 Correlacion[3][6]=r(n,SumP,SumCP,SumPCP,SumP2,SumCP2,PromP,PromCP);

90 Correlacion[4][5]=r(n,SumC,SumU,SumCU,SumC2,SumU2,PromC,PromU);

91 Correlacion[4][6]=r(n,SumC,SumCP,SumCCP,SumC2,SumCP2,PromC,PromCP);

92 Correlacion[5][6]=r(n,SumU,SumCP,SumUCP,SumU2,SumCP2,PromU,PromCP);

93 SxSy=Math.sqrt(Sx*Sy);

94 r=(COV1-COV2)/SxSy;

95 System.out.println("Matriz de Correlación:");

96 for (int i = 0; i < Correlacion.length; i++) {

97 for (int j = 0; j < Correlacion[i].length; j++) {

98 System.out.print(decimales.format(Correlacion[i][j]) + " ");

99 }

100 System.out.println();

101 }

102 return Correlacion;

103 }

104 public double r(double n, double SumX, double SumY, double SumXY,doubleSumX2, double SumY2,double PromX, double PromY){

105 System.out.println("SumX :"+SumX);

106 System.out.println("SumY :"+SumY);

107 System.out.println("SumXY :"+SumXY);

108 System.out.println("SumX2 :"+SumX2);

109 System.out.println("SumY2 :"+SumY2);

110 System.out.println("PromoX :"+PromX);

111 System.out.println("PromY :"+PromY);

112 COV1=SumXY;

113 System.out.println("COV1: "+COV1);

114 COV2=(SumX*SumY)/n;

115 System.out.println("COV2: "+COV2);

116 Sx=SumX2-(n*(Math.pow(PromX, 2)));

117 System.out.println("Sx: "+Sx);

118 Sy=SumY2-(n*(Math.pow(PromY, 2)));

119 System.out.println("Sy: "+Sy);

120 SxSy=Math.sqrt(Sx*Sy);

118

Page 130: PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO FACULTAD DE …opac.pucv.cl/pucv_txt/Txt-6500/UCD6597_01.pdf · MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES EN AGENCIAS VIRTUALES

121 System.out.println("SxSy: "+SxSy);

122 r=(COV1-COV2)/SxSy;

123 System.out.println("r: "+r);

124 return r;

125 }

126 }

1 public class CaracteristicasHotel {

2

3 public String TipoCaracteristica;

4 public String Puntuacion;

5

6 public String getTipoCaracteristica() {

7 return TipoCaracteristica;

8 }

9 public void setTipoCaracteristica(String tipoCaracteristica) {

10 TipoCaracteristica = tipoCaracteristica;

11 }

12 public String getPuntuacion() {

13 return Puntuacion;

14 }

15 public void setPuntuacion(String puntuacion) {

16 Puntuacion = puntuacion;

17 }

18 }

119