análisis de los campeones del league of legendsvalentin/ad/2016/t_final/celia_santiago...posiciones...

21
Universidad de Valladolid Análisis de los campeones del League of Legends Análisis de Datos (3º Grado en Estadística) Celia Santiago González 11-1-2016

Upload: others

Post on 21-Jan-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Análisis de los campeones del League of Legendsvalentin/ad/2016/T_final/Celia_Santiago...posiciones del juego (jungla, top, medio, adc o soporte); sobre los cuales mediremos 9 variables

Universidad de Valladolid

Análisis de los campeones

del League of Legends

Análisis de Datos (3º Grado en Estadística)

Celia Santiago González 11-1-2016

Page 2: Análisis de los campeones del League of Legendsvalentin/ad/2016/T_final/Celia_Santiago...posiciones del juego (jungla, top, medio, adc o soporte); sobre los cuales mediremos 9 variables

Celia Santiago González Grado en Estadística Análisis de Datos

Página 1 de 20

Tabla de contenido Introducción .................................................................................................................................. 3

Objetivo ......................................................................................................................................... 3

Datos ............................................................................................................................................. 3

Análisis de componentes principales ............................................................................................ 5

Elección entre ACP Normado o ACP No Normado ........................................................................ 5

Valores propios ............................................................................................................................. 5

Correlación entre variables ........................................................................................................... 6

Correlación variables-ejes ........................................................................................................... 77

Interpretación de las Componentes Principales ........................................................................... 8

Coordenadas ................................................................................................................................. 8

Correlaciones variable-factor ........................................................................................................ 8

Antiguos ejes unitarios .................................................................................................................. 8

Primer eje .................................................................................................................................. 9

Segundo eje ............................................................................................................................... 9

Tercer eje................................................................................................................................... 9

Conclusiones del plano 1-2 ......................................................................................................... 10

Proyecciones ............................................................................................................................... 10

Plano 1-2 según Contribución Relativa ....................................................................................... 10

Plano 1-2 según Contribución Relativa por posición .................................................................. 11

Clasificación Automática ............................................................................................................. 12

Dendograma ................................................................................................................................ 12

Índices de nivel ............................................................................................................................ 13

Estabilización por centros móviles .............................................................................................. 13

Composición y caracterización de las clases ............................................................................... 14

Situación de los centros .......................................................................................................... 14

Coordenadas ........................................................................................................................... 15

Iden-libelle ............................................................................................................................... 15

EFF. .......................................................................................................................................... 15

Disto. ....................................................................................................................................... 15

Clase 1 ..................................................................................................................................... 15

Clase 2 ..................................................................................................................................... 15

Clase 3 ..................................................................................................................................... 15

Clase 4 ..................................................................................................................................... 15

Clase 5 ..................................................................................................................................... 15

ANOVA para las variables ........................................................................................................ 15

Page 3: Análisis de los campeones del League of Legendsvalentin/ad/2016/T_final/Celia_Santiago...posiciones del juego (jungla, top, medio, adc o soporte); sobre los cuales mediremos 9 variables

Celia Santiago González Grado en Estadística Análisis de Datos

Página 2 de 20

Conclusión ................................................................................................................................... 19

Page 4: Análisis de los campeones del League of Legendsvalentin/ad/2016/T_final/Celia_Santiago...posiciones del juego (jungla, top, medio, adc o soporte); sobre los cuales mediremos 9 variables

Celia Santiago González Grado en Estadística Análisis de Datos

Página 3 de 20

Introducción

League of Legends (también conocido por sus siglas LoL) es un videojuego de género multiplayer

online battle arena (MOBA) desarrollado por Riot Games para Microsoft Windows y OS X. En

octubre del 2012, contaba con 70 millones de jugadores registrados. Para marzo del 2013 se

registró un pico de 5 millones de jugadores conectados al mismo tiempo en todo el mundo. Es

un juego de alta competitividad siendo uno de los juegos más populares de los deportes

electrónicos (e-sports). Actualmente se realizan campeonatos mundiales del LoL donde

participan 14 equipos de todo el mundo de 5 personas cada uno y el premio para el equipo

ganador es de 1 millón de dólares.

Dos equipos de cinco integrantes con un campeón cada uno, donde cada campeón es diferente,

con diferentes habilidades y características, compiten con el objetivo de destruir el nexo del

equipo rival en un mapa de tres carriles, dando lugar a 5 posibles posiciones: jungla, top, medio,

adc y soporte. Cada equipo deberá matar a los súbditos del equipo contrario programado de

forma automática para que avancen a través de los 3 carriles, saliendo del nexo un numero

continuo de súbditos cada cierto tiempo, destruyendo torretas hasta llegar al nexo enemigo y

destruirlo. Los campeones irán recibiendo más daño o más resistencia gracias a matar el máximo

número de súbditos, asesinar a campeones enemigos (reviven trascurrido un cierto tiempo),

muriendo el menor número de veces posible (dado que esto favorece al campeón contrario) y

ayudando a asesinar a campeones. Realizar estas tareas te otorga oro gracias al cual te permite

comprar objetos para multiplicar el poder de un campeón según te interese.

Objetivo

Voy a realizar una clasificación de los campeones de League of Legends según las estadísticas

del último año que ofrece la página oficial. Con todos los datos he decidido realizar un Análisis

de Componentes Principales o ACP con ello trataré de reducir la dimensión de los datos (pese a

la perdida de información), para poder describir a los campeones o personajes en función de sus

características, agrupando aquellos que tengan un comportamiento parecido o similar, siendo

esta información útil para diversas cuestiones.

Datos

En el informe que presento a continuación tomo los datos de todos los campeones del League

of Legends, siendo un total de 128 personajes, cada uno asignado a una de las cinco posibles

posiciones del juego (jungla, top, medio, adc o soporte); sobre los cuales mediremos 9 variables

continuas y 1 variable nominal. Los valores recogidos en estas variables son una media hecha

por los creadores del LoL a través de cientos de datos obtenidos de jugadas realizadas en los

campeonatos mundiales por los profesionales.

A continuación adjunto una tabla explicando las variables de forma detallada:

Page 5: Análisis de los campeones del League of Legendsvalentin/ad/2016/T_final/Celia_Santiago...posiciones del juego (jungla, top, medio, adc o soporte); sobre los cuales mediremos 9 variables

Celia Santiago González Grado en Estadística Análisis de Datos

Página 4 de 20

Role será la variable categórica nominal, siendo la posición a la que pertenece cada campeón,

con 5 niveles:

Role

Top Medio ADC Soporte Jungla

A continuación un análisis descriptivo de sus variables:

Libellé de la variable Moyenne Ecart-type Minimum Maximum

Win Percent 50,337 2,569 43,450 54,980

Kills 6,127 1,974 0,720 9,770

Deaths 6,117 0,676 4,450 8,020

Assists 8,549 2,657 4,630 15,860

Damage Dealt 18735,400 4804,000 4840,000 29470,000

Damage Taken 24284,200 5771,840 14369,000 36607,000

Total Healing 5437,580 4714,160 1043,000 26500,000

Minions Killed 123,668 66,683 13,400 208,500

Gold Earned 11857,000 992,885 9017,000 14175,000

Variable Descripción

Role Posición en la que juega el campeón

Win Percent Porcentaje medio de partidas ganadas con ese campeón

Kills Número medio de asesinatos que realiza ese campeón en una partida

Deaths Número medio de veces que muere el campeón en una partida

Assists Número de asistencias (ayudar a otro campeón a asesinar al contrario) realizadas por ese campeón en una partida

Damage Dealt Media del daño total realizado por un campeón al equipo contrario en una partida

Damage Taken Media del daño total recibido por un campeón a manos del equipo contrario en una partida

Total Healing Media del total de la vida regenerada por un campeón en una partida

Minions Killed Media del total de súbditos matados por un campeón en una partida

Gold Earned Media de oro total ganado en una partida

Page 6: Análisis de los campeones del League of Legendsvalentin/ad/2016/T_final/Celia_Santiago...posiciones del juego (jungla, top, medio, adc o soporte); sobre los cuales mediremos 9 variables

Celia Santiago González Grado en Estadística Análisis de Datos

Página 5 de 20

Como se puede observar a simple vista al analizar las variables estas presentan gran

heterogeneidad entre ellas, tanto en las desviaciones como en sus medias siendo Damage Taken

la variable que posee valores más altos con una media de 24284,2 y una desviación 5771,840

que comparado frente a Deaths que posee el valor más bajo de las medias con 6,117 y una

desviación de 0,676.

Análisis de componentes principales

Aplicaré un Análisis de Componentes principales para realizar el estudio de los individuos y

variables, recordamos que las poseemos 9 variables cuantitativas continuas y 1 variable

categórica nominal denominada Role (la posición en la que suelen encontrarse cada campeón)

con una población de 128 personajes del League of Legends. La variable TEAM la emplearemos

como una variable ilustrativa, es decir realizaremos el estudio sin diferenciar la posición en la

que suelen jugarse cada campeón.

Elección entre ACP Normado o ACP No Normado

El objetivo del ACP es reducir la dimensión de los datos, a un número menor de nuevas variables

que recojan la mayor parte de la información y faciliten comprender los datos.

En el caso de elegir un ACP No Normado la variabilidad pequeña será absorbida por la grande,

siendo en este caso las variables Damage Taken y Total Healing las que tendrían una mayor

importancia, como no considero que estas variables tengan mayor importancia que otras

variables que consideramos importantes y poseen menores desviaciones decido realizar un ACP

Normado.

Valores propios

Numéro Valeur propre Pourcentage Pourcentage cumulé

1 48232600,0000 60,59 60,59

2 20171800,0000 25,34 85,93

3 10903600,0000 13,70 99,63

4 296389,0000 0,37 100,00

5 1717,4400 0,00 100,00

6 0,0000 0,00 100,00

7 0,0000 0,00 100,00

8 0,0000 0,00 100,00

9 0,0000 0,00 100,00

En un ACP Normado la suma de los valores propios es igual al número de variables, por lo tanto

el valor esperado de inercia de cada eje es 1.

Conociendo esta información y con los valores propios calculados con seleccionar los 2 primeros

ejes proporcionaría un 86% de la información (valores propios: 48232600, 20171800.

Page 7: Análisis de los campeones del League of Legendsvalentin/ad/2016/T_final/Celia_Santiago...posiciones del juego (jungla, top, medio, adc o soporte); sobre los cuales mediremos 9 variables

Celia Santiago González Grado en Estadística Análisis de Datos

Página 6 de 20

También es destacable que los últimos 6 ejes no aportan información y que con tan solo los 3

primeros ejes ya recojo casi el 100% de la información.

Correlación entre variables

Win

Percent Kills Deaths Assists

Damage

Dealt

Damage

Taken

Total

Healing

Minions

Killed

Gold

Earned

Win

Percent 1,00

Kills -0,09 1,00

Deaths -0,39 0,43 1,00

Assists 0,26 -0,80 -0,45 1,00

Damage

Dealt -0,07 0,71 0,45 -0,69 1,00

Damage

Taken 0,01 -0,02 -0,24 -0,15 -0,25 1,00

Total

Healing 0,06 -0,24 -0,31 0,18 -0,40 0,53 1,00

Minions

Killed -0,14 0,47 0,31 -0,68 0,77 -0,22 -0,41 1,00

Gold

Earned 0,02 0,85 0,32 -0,80 0,81 -0,04 -0,26 0,68 1,00

En la tabla obtenida podemos ver que existen casi los mismos casos de correlaciones positivas

que negativas, siendo un 56 % negativas frente a un 44% que son positivas.

Observo que tengo tanto altas correlaciones positivas como altas correlaciones negativas.

Destaco que la variable Win Percent es la que tiene más correlaciones casi nulas con alguna

correlación media pero no significativa. En cuanto a las correlaciones negativas destacan:

- Kills - Assists lo que tiene sentido, puesto que cuantas más asistencias te lleves (esto

significa que ayudas a alguien de tu equipo con tu campeón a matar a un oponente,

llevándose el otro los beneficios de la baja) menos muertes causaras porque no te

sumará el plus de haberte llevado la baja.

- Assists - Gold Earned, también tiene sentido: más asistencias, menos oro te llevas por lo

que no puedes comprarte más objetos para causar un mayor daño.

- Minions Killed - Assists: cuantos más súbditos mates es menos probabilidad hay de que

solo te lleves una asistencia.

- Damage Dealt - Assists, con estas dos variables pasa lo mismo que con las dos anteriores,

cuando más daño hagas menos probable es de que solo te lleves una asistencia.

En cuanto a las variables positivas destacan: Damage Dealt - Kills, Damage Dealt- Gold Earned,

Damage Dealt- Minions Killed, Gold Earned - Kills. Todas ellas tienen sentido y están relacionadas

entre sí: cuantos más súbditos mates más dinero obtienes con lo que puedes comprar objetos

Page 8: Análisis de los campeones del League of Legendsvalentin/ad/2016/T_final/Celia_Santiago...posiciones del juego (jungla, top, medio, adc o soporte); sobre los cuales mediremos 9 variables

Celia Santiago González Grado en Estadística Análisis de Datos

Página 7 de 20

para obtener más daño, cuanto más daño más muertes se consiguen, lo que da más dinero. Es

un bucle.

Correlación variables-ejes

Realizamos un gráfico de puntos-variable en el plano 1-2, el cual recoge una información total

del 86%, dado que es importante conocer la correlación existente entra las variables y los ejes

factoriales, con ello podemos apreciar la calidad de representación de las diferentes variables

en el plano.

Las variables mejor representadas son aquellas que más se aproximan a la esfera, por lo que

observo que todas se aproximan bastante, menos la variable Win Percent que tiene una calidad

peor de representación.

Observo que las variables Total Healing, Damage Taken y Win Percent tienen correlaciones

negativas tanto en el eje 1 como en el 2, mientras que las variables Deaths, Minions Killed y

Damage Dealt tiene correlaciones positivas en ambos ejes.

Page 9: Análisis de los campeones del League of Legendsvalentin/ad/2016/T_final/Celia_Santiago...posiciones del juego (jungla, top, medio, adc o soporte); sobre los cuales mediremos 9 variables

Celia Santiago González Grado en Estadística Análisis de Datos

Página 8 de 20

Interpretación de las Componentes

Principales

Coordenadas

Axe 1 Axe 2 Axe 3 Axe 4 Axe 5

Win Percent -0,12 -0,14 -0,06 0,35 0,40

Kills 0,61 1,30 -0,22 0,84 0,38

Deaths 0,26 0,18 -0,03 -0,04 0,05

Assists -0,48 -2,00 0,13 -0,81 0,50

Damage Dealt 2846,56 3683,58 -1182,15 -96,03 0,33

Damage Taken -5046,75 2428,42 1395,32 -17,50 0,00

Total Healing -3812,28 -395,22 -2744,74 1,25 -0,08

Minions Killed 34,09 38,68 -5,98 5,72 -41,43

Gold Earned 354,00 740,34 -159,93 535,56 0,50

Correlaciones variable-factor

Axe 1 Axe 2 Axe 3 Axe 4 Axe 5

Win Percent -0,21 -0,08 0,89 -0,30 0,02

Kills 0,84 -0,27 0,06 -0,30 -0,10

Deaths 0,59 0,24 -0,53 -0,44 0,09

Assists -0,87 0,37 0,13 -0,06 0,08

Damage Dealt 0,90 0,04 0,17 0,05 0,17

Damage Taken -0,22 -0,87 -0,14 0,08 -0,32

Total Healing -0,47 -0,69 -0,13 -0,06 0,53

Minions Killed 0,81 0,08 0,13 0,47 0,15

Gold Earned 0,89 -0,26 0,24 -0,04 0,02

Antiguos ejes unitarios

Axe 1 Axe 2 Axe 3 Axe 4 Axe 5

Win Percent -0,10 -0,06 0,80 -0,38 0,02

Kills 0,40 -0,21 0,05 -0,38 -0,15

Deaths 0,28 0,19 -0,47 -0,57 0,13

Assists -0,41 0,29 0,12 -0,08 0,12

Page 10: Análisis de los campeones del League of Legendsvalentin/ad/2016/T_final/Celia_Santiago...posiciones del juego (jungla, top, medio, adc o soporte); sobre los cuales mediremos 9 variables

Celia Santiago González Grado en Estadística Análisis de Datos

Página 9 de 20

Damage Dealt 0,43 0,03 0,15 0,06 0,25

Damage Taken -0,10 -0,69 -0,12 0,10 -0,47

Total Healing -0,22 -0,55 -0,12 -0,08 0,78

Minions Killed 0,39 0,07 0,12 0,60 0,22

Gold Earned 0,42 -0,20 0,22 -0,05 0,03

Primer eje

U1 = -0.1*WP + 0.4*Kills + 0.28*Deaths - ….. + 0.39*MK + 0.42*GE

Esta primera componente principal, recoge el 60% de la información y presenta correlaciones

tanto negativas como positivas con las variables originales.

Las correlaciones positivas más altas serían la de Damage Dealt (0.9), Gold Earned (0.89) y Kills

(0.84), por lo que obtener valores altos en este eje será indicio de valores altos en estas

variables.

La correlación negativa a destacar sería la de Assists (-0.87) lo que me indica que obtener valores

bajos en este eje será indicio de valores altos en esta variable y viceversa.

Ninguna de las variables tiene un coeficiente cercano al 0 por lo que todas tienen, en mayor y

menos medida, relevancia.

Segundo eje

U2 = -0.06*WP – 0.21*Kills + 0.19*Deaths + ….. + 0.07*MK – 0.2*GE

Esta segunda componente principal recoge el 25% de la información. Observo que no hay

ninguna correlación positiva demasiado alta a destacar, mientras que hay dos correlaciones

negativas significativas: Damage Taken (-0.87) y Total Healing (-0.69) lo que me indica que

obtener valores bajos en este segundo eje será indicio de valores altos en estas variables y

viceversa.

En este eje las variables Win Rates, Damage Dealt y Minions Killed no tendrán relevancia dado

que su correlación es prácticamente 0.

Tercer eje

U3= 0.8*WP + 0.05*Kills – 0.47*Deaths + ….. + 0.12*MK + 0.22 GE

Page 11: Análisis de los campeones del League of Legendsvalentin/ad/2016/T_final/Celia_Santiago...posiciones del juego (jungla, top, medio, adc o soporte); sobre los cuales mediremos 9 variables

Celia Santiago González Grado en Estadística Análisis de Datos

Página 10 de 20

En esta tercera componente principal recoge el 13.7% de la información. Observo que hay tanto

correlaciones positivas como negativas pero todas son muy bajas por lo que la mayoría de las

variables no serán muy influyentes a excepción de la variable Win Rate que tiene una correlación

de 0.89, lo que me indica que cuanto más altos sean los valores en este eje será indicio de valores

altos en esta variable.

Descritos los 3 primeros ejes recojo casi el 100% de la información.

Conclusiones del plano 1-2

- Los campeones situados a la izquierda del plano tendrán una valoración alta en

Damage Taken y Total Healing.

- Los campeones situados de la mitad hacia abajo del plano obtendrán una alta

valoración en Assists, mientras que los que estén en la parte superior obtendrás

valores muy positivos en Damage Dealt, Kills y Gold Earned.

Proyecciones

Plano 1-2 según Contribución Relativa

En este primer plano represento el plano factorial 1-2 con un 86% de la información, donde el

tamaño de cada campeón será en relación a su contribución relativa, a mayor tamaño del punto

mayor contribución relativa poseerá, ósea mayor calidad en la representación.

Page 12: Análisis de los campeones del League of Legendsvalentin/ad/2016/T_final/Celia_Santiago...posiciones del juego (jungla, top, medio, adc o soporte); sobre los cuales mediremos 9 variables

Celia Santiago González Grado en Estadística Análisis de Datos

Página 11 de 20

En general la mayoría de los puntos del plano 1-2 están bien representados, pero observo que

son los puntos situados en los extremos los que poseen mayor contribución relativa, siendo los

campeones cercanos al origen de coordenadas los que poseen una representación de peor

calidad.

Observo que existe cierto patrón en la representación, en la parte inferior del gráfico se

encuentran más dispersos que en la parte superior, a su vez observo que la parte izquierda están

más disperso que la derecha. También observo que los individuos se encuentran concentrados

cerca del eje de abscisas (Factor 1).

Plano 1-2 según Contribución Relativa por posición

Observo cierto patrón respecto a las diferentes posiciones donde se suele jugar cada campeón.

En el caso de los campeones que se les juega en la posición de suporte están en la parte inferior

del gráfico donde se recogen mayor número de asistencias. El campeón Soraka que aparece en

la parte inferior del plano tiene mucha contribución relativa por lo que está muy bien

representada y esto me indica que se lleva un gran número de asistencias.

En el caso de los campeones que normalmente se juegan en la posición de ADC están situados

en la parte derecha del plano, cerca del eje de abscisas, esto me indica que soportan poco daño.

Zac es el campeón representado más a la izquierda del plano sobre el eje de abscisas y tiene una

gran contribución relativa, esto me indica que este campeón en las variables Damage Taken y

Total Healing tendrá altas puntuaciones.

Page 13: Análisis de los campeones del League of Legendsvalentin/ad/2016/T_final/Celia_Santiago...posiciones del juego (jungla, top, medio, adc o soporte); sobre los cuales mediremos 9 variables

Celia Santiago González Grado en Estadística Análisis de Datos

Página 12 de 20

Clasificación Automática

Realizo una clasificación automática de los individuos, agrupándolos de manera que los

campeones de cada clase sean lo más homogéneos posibles, mientras que las clases entre sí

sean lo más heterogéneo posible.

Mediante un método jerárquico de inercia de Ward hago una clasificación automática puesto

que el número de individuos no es grande, con lo que obtengo el número de clases.

Dendograma

Realizo el corte en 6 clases, estando los vértices de altura a diferentes niveles, si el corte tuviese

demasiados niveles los índices de agregación distarían muy poco, obteniendo demasiadas clases

para un número de individuos no muy grande. Con este corte obtendré tamaños de clases

bastante homogéneos: todos están entre el 27% y el 12% de información.

También realizo otro corte en 5 clases que también parece que me proporciona unos buenos

porcentajes de información: entre el 27% y el 13%.

Para ayudarme a escoger cual sería el corte indicado utilizo los índices de nivel.

Page 14: Análisis de los campeones del League of Legendsvalentin/ad/2016/T_final/Celia_Santiago...posiciones del juego (jungla, top, medio, adc o soporte); sobre los cuales mediremos 9 variables

Celia Santiago González Grado en Estadística Análisis de Datos

Página 13 de 20

Índices de nivel

Observo en el gráfico con los índices de nivel que parece razonable hacer el corte en 5 ó 6 clases

puesto que la diferencia de alturas entre vértices consecutivos es considerable. Al ser 5 los

diferentes roles que puede tener cada campeón elijo mi corte en 5 clases.

Estabilización por centros móviles

Una vez decidido que el corte en el dendograma para obtener 5 clases realizo una estabilización

por centros móviles. Mediante el proceso de centros móviles (búsqueda del centro de gravedad

y asignación de individuos más cercanos….) se buscarán unas clases un poco más precisas. Tras

realizar el proceso se pasará a la caracterización de cada clase, individuos que las forman, etc.

Lo que se pretende con una estabilización por centro móviles es reducir la inercia intraclase

(aumentando la interclases) hasta que se estabilice, es decir que varié muy poco.

Interacción I.Total I. Interclase I.Intraclase

0 9,00 5.50621 0.61180 1 9,00 5.59509 0.62168 2 9,00 5.61693 0.62410 3 9,00 5.62230 0.62470 4 9,00 5.62230 0.62470

Se puede observar como la inercia interclases (entre las 5 clases) va aumentando con el paso de

las iteraciones y se estabiliza en la tercera interacción fijándose en 5,62, signo de que el método

funciona bien.

En la siguiente tabla se ve de manera pormenorizada, qué implica la estabilización por centros

móviles en las 5 clases de la partición

Descomposición de la inercia:

Clases Inercia Individuos

Antes Después Antes Después

Page 15: Análisis de los campeones del League of Legendsvalentin/ad/2016/T_final/Celia_Santiago...posiciones del juego (jungla, top, medio, adc o soporte); sobre los cuales mediremos 9 variables

Celia Santiago González Grado en Estadística Análisis de Datos

Página 14 de 20

Interclase 5.5062 5.6223

1 0.9884 0.8916 32 30

2 0.8225 0.6096 20 17

3 0.4311 0.5057 25 27

4 0.7073 0.8264 34 37

5 0.5445 0.5445 17 17

En conjunto, las clases 3 y 4 han aumentado sus inercias mientras que las clases 1 y 2 se han

visto reducidas. La clase 5 se han mantenido estática. Observo que estos aumentos y descensos

vienen provocados por el número de individuos que compone cada clase, es decir, que todas las

clases que han disminuido su inercia también ha disminuido su número de individuos y de forma

análoga ha sucedido lo mismo con las clases que han sufrido aumentos.

No puedo dictaminar a simple vista qué clase es mejor, pues aunque en un principio la que tenga

menor inercia será la que posea mayor calidad, ésta dependerá del número de individuos que

tenga. Por tanto, para medir la calidad de una clase tengo que observar la inercia dividida por el

número de individuos.

Clases Inercia/Individuos Antes Inercia/Individuos Después

1 0.03088 0.02972

2 0.04112 0.03585

3 0.01724 0.01872

4 0.02080 0.02233

5 0.03202 0.03202

Tras realizar el denograma se observaba que la mejor clase era la 4 con un 27% de información,

ahora tras el proceso de estabilización pasa al segundo puesto (se le han añadido 3 campeones),

también la primera clase, que en el denograma estaba en el segundo puesto, se va visto

desplazada al tercer puesto, habiendo disminuido en 2 campeones. La tercera clase que ocupaba

el tercer puesto en el denograma ahora ocupa el primer puesto tras el proceso de estabilización

habiendo ganado dos individuos.

Más importante que los cambios de posición entre el antes y el después es la calidad tras el

algoritmo, así que solo se debe tener en cuenta esta última para establecer qué clase es más

precisa. Por lo que ahora la clase más precisa es la 3, seguida de la 4, 1, 5 y por último la 2.

Composición y caracterización de las clases

Ahora estudiare por separado las clases, analizando los campeones que las componen y sus

características. Pero antes analizaré los aspectos generales para dar una primera visión de cómo

van a ser dichas clases: la ubicación de los centros de cada clase y la posible heterocedasticidad

que pueda tener una variable dentro de un conjunto de individuos.

Situación de los centros

Page 16: Análisis de los campeones del League of Legendsvalentin/ad/2016/T_final/Celia_Santiago...posiciones del juego (jungla, top, medio, adc o soporte); sobre los cuales mediremos 9 variables

Celia Santiago González Grado en Estadística Análisis de Datos

Página 15 de 20

Coordenadas

Iden-libelle EFF. 1 2 3 4 5 Disto.

Clase 1 32 0.21 -1.12 -0.49 -0.21 -0.11 1.62

Clase 2 20 -1.53 -1.41 0.80 0.27 -0.17 5.10

Clase 3 25 1.53 0.69 -1.10 0.37 -0.04 4.20

Clase 4 34 1.59 0.64 0.88 -0.20 0.20 3.81

Clase 5 17 -4.04 1.48 -0.16 -0.07 0.08 18.61

La clase 1 es la que tiene sus coordenadas más cerca del origen, lo que me indica que los

campeones que la formen tendrán una tendencia a tener unas características en torno a la

media. Con coordenadas también muy parecidas a las de la clase 1 están la clase 3 y 4, lo que

me indica lo mismo. La clase 2 estará formada por campeones con peores características. Esto

lo analizaré mejor clase por clase.

ANOVA para las variables

En la tabla que se muestra a continuación se puede ver, en orden descendente, las variables que

son más diferentes entre las cinco clases, es decir, la que esté situada más arriba, séase la que

tenga un valor de Fisher más alto, será aquella variable cuya media sea lo más divergente de una

clase a otra (En este caso la variable Assists). Por otro lado, la variable que esté situada más

abajo, por lo que tiene el valor de Fisher más bajo, será una variable que presente las cinco

medias muy parecidas (En este caso la variable Total Healing). Así se podrá observar qué

variables son aquellas que pueden diferenciar unas clases de otras, y en las que hay que fijarse

de un modo más detallado.

Libellé de la variable Fisher Nb. de degrés de liberté Valeur-Test Probabilité

Assists 98,31 123 12,72 0,000

Gold Earned 97,22 123 12,68 0,000

Damage Dealt 93,68 123 12,55 0,000

Damage Taken 70,05 123 11,48 0,000

Kills 66,84 123 11,31 0,000

Minions Killed 46,49 123 9,98 0,000

Win Percent 33,10 123 8,76 0,000

Deaths 25,09 123 7,80 0,000

Total Healing 20,37 123 7,09 0,000

Visto esto, paso a analizar clase por clase:

1. Clase 1

La clase 1 está formada por los siguientes 30 campeones:

Page 17: Análisis de los campeones del League of Legendsvalentin/ad/2016/T_final/Celia_Santiago...posiciones del juego (jungla, top, medio, adc o soporte); sobre los cuales mediremos 9 variables

Celia Santiago González Grado en Estadística Análisis de Datos

Página 16 de 20

CLASSE 1 / 5

Aat Cho Dar Eli Eve Fio Gar Hec Ire Jar Kha Kin Lee Mao Mas

Nas Nid Noc Ola Qui Ren Ren Sha Sin Swa Try Vi Vla Xin Yor

Para ver de forma más exhaustiva las características de estos campeones adjunto una tabla

donde se describen no sólo las características medias de una observación perteneciente a

dicha clase, sino que también se aprecia qué variables son las más constantes en la clase, o

cuáles tienen mayor dispersión.

Variables

caractéristiques

Moyenne

dans la

classe

Moyenne

générale

Ecart-

type

dans la

classe

Ecart-

type

général

Valeur-

Test Probabilité

Damage Taken 29296,400 24284,200 2841,030 5771,840 5,41 0,000

Total Healing 7840,870 5437,580 3913,350 4714,160 3,18 0,001

Assists 7,136 8,549 1,480 2,657 -3,32 0,000

Esta clase representa campeones que tienen valores positivos en Daño Recibido y en media total

de vida regenerada por lo que son campeones que podrán resistir mejor. Por otro lado son

campeones que tendrán Asistencias por debajo de la media. Son campeones usados

normalmente en posiciones de top o jungla.

2. Clase 2

La clase 2 está formada por los siguientes 17 campeones:

CLASSE 2 / 5

Amu Dr. Fid Gra Nun Ram Rek Sej She Shy Sio Ska Tru Udy Vol

War Zac

Variables

caractéristiques

Moyenne

dans la

classe

Moyenne

générale

Ecart-

type

dans la

classe

Ecart-

type

général

Valeur-

Test Probabilité

Damage Taken 32452,600 24284,200 2937,480 5771,840 6,24 0,000

Total Healing 10685,500 5437,580 5789,400 4714,160 4,91 0,000

Win Percent 51,772 50,337 2,563 2,569 2,46 0,007

Damage Dealt 15326,900 18735,400 2422,690 4804,000 -3,13 0,001

Minions Killed 63,982 123,668 48,665 66,683 -3,95 0,000

Page 18: Análisis de los campeones del League of Legendsvalentin/ad/2016/T_final/Celia_Santiago...posiciones del juego (jungla, top, medio, adc o soporte); sobre los cuales mediremos 9 variables

Celia Santiago González Grado en Estadística Análisis de Datos

Página 17 de 20

Deaths 5,220 6,117 0,374 0,676 -5,86 0,000

Observo que los campeones de este grupo suelen usarse en Top y Jungla pero tienen unas

diferentes características con respecto a la clase 1: tendrán valores muy positivos en Daño

recibido, media total de regeneración de vida y además se observa una relación con el

porcentaje de partidas que se ganan usando a estos campeones, lo que me indica que ahora

mismo están muy “rotos”.

Por otro lado, obtienen valores por debajo de la media en Daño realizado, minions matados y

número de veces que el campeón muere, lo que me indica que son buenos campeones

“tanques”, que sean los primeros en iniciar la batalla en primera línea para recibir todo el daño

del equipo contrario resistiendo.

3. Clase 3

La clase 3 está formada por los siguientes 27 campeones:

CLASSE 3 / 5

Aka Azi Cai Cas Ekk Gna Ill Jax Jay Kar Kas Kat Kog LeB Lis

Mor Ori Pop Riv Rum Ryz Syn Urg Vay Vei Vik Yas

Variables

caractéristiques

Moyenne

dans la

classe

Moyenne

générale

Ecart-

type

dans la

classe

Ecart-

type

général

Valeur-

Test Probabilité

Deaths 6,690 6,117 0,542 0,676 4,94 0,000

Minions Killed 169,719 123,668 14,378 66,683 4,02 0,000

Damage Dealt 21289,600 18735,400 2283,500 4804,000 3,10 0,001

Kills 6,920 6,127 1,167 1,974 2,34 0,010

Damage Taken 21617,400 24284,200 3523,730 5771,840 -2,69 0,004

Total Healing 2587,370 5437,580 1364,610 4714,160 -3,52 0,000

Assists 6,796 8,549 1,021 2,657 -3,84 0,000

Win Percent 47,093 50,337 1,510 2,569 -7,36 0,000

Esta tercera clase está compuesta por campeones que van tanto en Top, como en Medio, como

de ADC.

Observo que tendrán valores por encima de la media en número medio de veces que mueren

en una partida, en minions matados, en Daño realizado y en llevarse el máximo número de

asesinatos al equipo enemigo. Por otro lado tendrán valores por debajo de la media en las

variables: Daño recibido, media total de vida regenerada, asistencias y un porcentaje inferior a

la media de partidas ganadas cuando juegas con este campeón.

Todo esto me indica que son campeones que tienen mucho daño por lo que se usan para matar

a los enemigos de forma más rápida y eficaz pero a la vez son los campeones que más protección

necesitan puesto que son muy débiles y si reciben daño directo son fáciles de matar.

Page 19: Análisis de los campeones del League of Legendsvalentin/ad/2016/T_final/Celia_Santiago...posiciones del juego (jungla, top, medio, adc o soporte); sobre los cuales mediremos 9 variables

Celia Santiago González Grado en Estadística Análisis de Datos

Página 18 de 20

Pese a todo esto ahora mismo (debido a la información que me aporta el porcentaje de partidas

ganadas) no están especialmente “rotos” (que estén más fuertes que los demás debido a las

mejoras que hacen los creadores del juego cada cierto tiempo).

4. Clase 4

La clase 4 está formada por los siguientes 37 campeones, es la clase con mayor número de

individuos y son los siguientes:

CLASSE 4 / 5

Ahr Ani Ann Ash Bra Cor Dia Dra Ezr Fiz Gal Gan Gra Hei Jin

Kal Kay Ken Luc Lux Mal Mal Mis Pan Siv Tal Tee Tri Twi Twi

Var Vel Wuk Xer Zed Zig Zyr

Variables

caractéristiques

Moyenne

dans la

classe

Moyenne

générale

Ecart-

type

dans la

classe

Ecart-

type

général

Valeur-

Test Probabilité

Damage Dealt 22625,900 18735,400 2215,360 4804,000 5,82 0,000

Gold Earned 12544,600 11857,000 577,945 992,885 4,98 0,000

Minions Killed 169,397 123,668 33,834 66,683 4,93 0,000

Win Percent 52,005 50,337 1,421 2,569 4,67 0,000

Kills 7,130 6,127 1,206 1,974 3,65 0,000

Total Healing 2780,140 5437,580 1654,540 4714,160 -4,05 0,000

Damage Taken 19976,200 24284,200 2449,250 5771,840 -5,36 0,000

Esta cuarta clase recoge un poco de todas las posiciones, tanto de ADC, como Medio, Top y

Jungla, menos campeones usados en la posición de Soporte.

Esta clase es muy parecida a la clase 3: son campeones con mucho daño, minions matados y

número de muertes realizadas, además de tener una media por encima de las variables

porcentaje de partidas ganadas jugadas con estos campeones y el oro ganado por partida.

También como en la clase 3 obtendrán valores por debajo de la media en total de daño recibido

y media total de vida regenerada.

Todo esto me indica que la única diferencia con la clase 3 es que en este momento estos

campeones debido a las mejoras que incluyen los creadores del juego en los personajes cada

poco tiempo hacen que estén más “rotos” que los demás, ósea, hagan un poco más de daño o

por sus nuevas habilidades estén en una posición aventajada que los demás del mismo estilo.

5. Clase 5

La clase 5 está formada por los siguientes 17 campeones:

CLASSE 5 / 5

Page 20: Análisis de los campeones del League of Legendsvalentin/ad/2016/T_final/Celia_Santiago...posiciones del juego (jungla, top, medio, adc o soporte); sobre los cuales mediremos 9 variables

Celia Santiago González Grado en Estadística Análisis de Datos

Página 19 de 20

Ali Bar Bli Bra Jan Kar Leo Lul Mor Nam Nau Son Sor Tah Tar

Thr Zil

Variables

caractéristiques

Moyenne

dans la

classe

Moyenne

générale

Ecart-

type

dans la

classe

Ecart-

type

général

Valeur-

Test Probabilité

Assists 14,004 8,549 0,955 2,657 9,05 0,000

Damage Taken 20882,600 24284,200 4568,590 5771,840 -2,60 0,005

Deaths 5,704 6,117 0,465 0,676 -2,69 0,004

Minions Killed 31,941 123,668 12,014 66,683 -6,07 0,000

Damage Dealt 10028,800 18735,400 3099,790 4804,000 -7,99 0,000

Kills 2,186 6,127 0,683 1,974 -8,80 0,000

Gold Earned 9777,880 11857,000 444,594 992,885 -9,24 0,000

En esta última clase observo que todos los campeones pertenecen a la posición de Support.

Esta clase obtendrá en la variable Asistencias valores por encima de la media mientras que en

las variables: Daño recibido, número de veces que muere, número de veces que se lleva una

baja, número medio de minions matados por partida, Daño realizado y oro ganado por partida,

estos campeones tendrán valores por debajo de la media.

Esto me indica que, como nos indica el role al que pertenecen, estos campeones se encargan de

acompañar a otro que tenga mucho daño y sea muy débil, para ayudarle a matar y defenderle,

dependiendo de sus habilidades, por eso se lleva ese mayor número de asistencias.

Conclusión

Ya finalizado el análisis de componentes principales y la clasificación automática presentaremos

las conclusiones finales, para ello realizo la representación de los individuos separándolos por

clases en el plano 1-2.

Page 21: Análisis de los campeones del League of Legendsvalentin/ad/2016/T_final/Celia_Santiago...posiciones del juego (jungla, top, medio, adc o soporte); sobre los cuales mediremos 9 variables

Celia Santiago González Grado en Estadística Análisis de Datos

Página 20 de 20

Observo, después de hacer el análisis completo que a lo mejor una división en una clase menos,

séase, en 4 clases no habría sido una idea descabellada, puesto que observo que las clases 3 y 4

tienen características muy parecidas entre sí y casi la clase 3 está contenida en la clase 4.

Por otro lado, la clase 5 es la que más dista de todas las demás clases, que son los que tienen

características más dispares a las demás. Pese a parecer que son los campeones con peores

características, son necesarios a la hora de jugar porque, como he explicado con anterioridad,

sus habilidades son muy útiles a la hora de acompañar a otros campeones para protegerlos o

bien ayudarlos a matar a los campeones enemigos.

La clase 1 con la clase 2 también se entrelazan un poco los campeones dado que comparten

algunas características en común aunque los campeones de la clase 2 están diseñados más para

tener una mayor resistencia a la hora de la batalla y llevarse menos bajas por lo que tendrían

menos daños, mientras que la clase 1 también resistiría pero tendría a su vez bastante daño.

En conclusión considero que haberlo dividido en 5 clases ha sido correcto (aunque podría

haberlo hecho en 4). También observo que algunos campeones, gracias a esta división de clases,

según sus características podrían ser válidos para jugarlos en otras posiciones diferentes a las

comúnmente jugadas, aunque para determinarlo exactamente debería de estudiar las

habilidades diferentes de cada campeón, no solo sus características, cosa que sería muy difícil

dado que tienen todos habilidades muy diferentes.