representaciones gráficas análisis de datos i semestre otoño 2010

Post on 22-Jan-2016

221 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Representaciones Gráficas

Análisis de Datos I

Semestre Otoño 2010

Gráficos para variables cualitativas (categóricas)

1. Gráfico de Sectores o de Torta

Se divide un círculo en tantas porciones como clases tenga la variable

A cada clase le corresponde un arco de círculo proporcional a su frecuencia absoluta o relativa

La información que se debe mostrar en cada sector hace referencia al número de casos dentro de cada categoría y al porcentaje del total que estos representan

Si el número de categorías es excesivamente grande (ej. Más de 3) la imagen proporcionada por el gráfico de sectores se empieza a tornar confusa.

Ejemplo Nº 1: Gráfico de sectores variable “Tipo de Fumador”

¿Cómo interpretamos este

gráfico?

Ejemplo Nº 2: Gráfico de sectores variable “Género”

¿Cómo interpretamos este

gráfico?

91 / 71%

38 / 29%

Mujeres

Hombres

Ej. Nº 3: Hay veces en que el sector que nos interesa describir se desagrupa

7 / 5%

57 / 44%

54 / 42%

11 / 9%

divorciado separado

casado

soltero

Omitido

¿Cómo interpretamos este

gráfico?

2.1 Gráfico de Barras SimplesLos diagramas de barras son similares a los gráficos de sectores. Se representan tantas barras como categorías tiene la variable, de modo que la altura de cada una de ellas sea proporcional a la frecuencia o porcentaje de casos en cada clase Estos mismos gráficos pueden utilizarse también para describir variables numéricas discretas que toman pocos valores (número de hijos, número de evaluaciones, etc.)

2. Gráficos de Barras

ESTCIVIL

divorciado separadocasadosolteroOmitido

Fre

cuen

cia

60

50

40

30

20

10

0

7

5754

11 ¿Cómo interpretamos este

gráfico?

Ejemplo Nº 4: Gráfico de Barras variable “Estado Civil” (cualitativa)

Número de Hijos

4 Hijos3 Hijos2 Hijos1 HijoSin Hijos

Fre

cue

nci

a

60

50

40

30

20

10

0

11

23

31

57

7

¿Cómo interpretamos este

gráfico?

Ejemplo Nº 5: Gráfico de Barras variable “Número de Hijos” (cuantitativa discreta)

2.2 Gráfico de Barras Agrupadas

• En Ocasiones se requiere agrupar dos variables en un mismo gráfico

• Para lo cual se sugiere ocupar un Gráfico de Barras Agrupadas

• Ayuda a comparar categorías de una variable en función de las Categorías o Intervalos de la otra variable

ESTCIVIL

divorciado separadocasadosolteroOmitido

Fre

cue

nci

a

50

40

30

20

10

0

GENERO

hombre

mujer

Ej. 6 “Gráfico de Barras agrupadas para las variables Estado civil y Género

¿Cómo interpretamos este

gráfico?

2.3 Gráfico de Barras Apiladas

• Cumple con las mismas características que el gráfico de barras agrupadas

• Busca Comparar dos variables superponiendo sus categorías o Intervalos

Ej. 7 “Gráfico de Barras Apiladas para las variables Categoría edad y Género

categoria edad

54 y más44 a 5334 a 4324 a 33Omitido

Fre

cue

nci

a

60

50

40

30

20

10

0

GENERO

mujer

hombre

6

19

19

42

554

1215 ¿Cómo

interpretamos este gráfico?

• Se utiliza cuando una variable Cualitativa tiene muchas categorías

• Es útil para entregar un ordenamiento de las categorías para realizar comparaciones

• Se ordenan las categorías de mayor a menor cantidad de apariciones o frecuencia y se les asigna cada categoría una barra

• El gráfico se complementa con una línea que representa la acumulación porcentual de las categorías

2.4 Gráfico de Pareto

ORIENTAC

Fre

cue

nci

a

140

120

100

80

60

40

20

0

Po

rcen

taje

100

50

0911131317

2126

Ej. 8 “Gráfico de Pareto Orientación Psicoterapeutica”

¿Cómo interpretamos este

gráfico?

1. HistogramasPara variables numéricas continuas, tales como la edad, la tensión arterial o el índice de masa corporal, el tipo de gráfico más utilizado es el histograma.Para construir un gráfico de este tipo, se divide el rango de valores de la variable en intervalos de igual amplitud, representando sobre cada intervalo un rectángulo que tiene a este segmento como base. El criterio para calcular la altura de cada rectángulo es el de mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de los datos en cada intervalo y el área de los rectángulos.

Gráficos para variables Cuantitativas

Tabla I.  Distribución de frecuenciasde la edad en 100 pacientes.

Edad Nº de pacientes

18 1

19 3

20 4

21 7

22 5

23 8

24 10

25 8

26 9

27 6

28 6

29 4

30 3

31 4

32 5

33 3

34 2

35 3

36 1

37 2

38 3

39 1

41 1

42 1

• Como ejemplo, la anterior muestra la distribución de frecuencias de la edad de 100 pacientes, comprendida entre los 18 y 42 años.

• Como se vio en clases, se divide este rango en intervalos de dos años, el primer tramo está comprendido entre los 18 y 19 años, entre los que se encuentra el 4/100=4% del total.

• Por lo tanto, la primera barra tendrá altura proporcional a 4.

• Procediendo así sucesivamente, se construye el histograma que se muestra en la siguiente Diapositiva

Ej. 9 “Histograma Variable Edad

¿Cómo interpretamos este

gráfico?

2. Polígono de Frecuencias

• Uniendo los puntos medios del extremo superior de las barras del histograma, se obtiene una imagen que se llama polígono de frecuencias.

• Dicha figura pretende mostrar, de la forma más simple, en qué rangos se encuentra la mayor parte de los datos.

• Un ejemplo, utilizando los datos anteriores, se presenta en la siguiente Diapositiva

Ej. 10 “Polígono de Frecuencias Variable Edad

¿Cómo interpretamos este

gráfico?

3. Diagramas de Caja

• Otro modo habitual, y muy útil, de resumir una variable de tipo numérico es utilizando el concepto de percentiles, mediante diagramas de cajas

• Como se apreciará en el Ejemplo 11, la caja central indica el rango en el que se concentra el 50% central de los datos.

• Sus extremos son, por lo tanto, el 1er y 3er cuartil de la distribución.

• La línea central en la caja es la mediana.

• De este modo, si la variable es simétrica, dicha línea se encontrará en el centro de la caja.

• Los extremos de los "bigotes" que salen de la caja son los valores que delimitan el 95% central de los datos, aunque en ocasiones coinciden con los valores extremos de la distribución.

• Se suelen también representar aquellas observaciones que caen fuera de este rango (outliers o valores extremos).

• Esto resulta especialmente útil para comprobar, gráficamente, posibles errores en nuestros datos.

• En general, los diagramas de cajas resultan más apropiados para representar variables que presenten una gran desviación de la distribución normal.

8636N =

GENERO

mujerhombre

ED

AD

80

70

60

50

40

30

20

6366

Ej. 11 “Polígono de Frecuencias Variable Edad

¿Cómo interpretamos este

gráfico?

4. Gráficos de Líneas

• Los gráficos de líneas pueden resultar especialmente interesantes, sobre todo cuando interesa estudiar tendencias a lo largo del tiempo

• No son más que una serie de puntos conectados entre sí mediante rectas

• Cada punto puede representar distintas cosas según lo que nos interese en cada momento (el valor medio de una variable, porcentaje de casos en una categoría, el valor máximo en cada grupo, etc).

Ej. 12 “Gráfico de Líneas Variable Número de pacientes trasplantados renales en el Complejo Hospitalario “Félix Bulnes" durante el periodo 1981-1997”

¿Cómo interpretamos este

gráfico?

Ej. 13 Gráfico de Líneas Superpuestas Variable Variación en el peso medio de una muestra de recién nacidos según el control

ginecológico del embarazo y el hábito de fumar de la madre

¿Cómo interpretamos este

gráfico?

5. Gráfico de Dispersión

• Cuando lo que interesa es estudiar la relación entre dos variables continuas, el método de análisis adecuado es el estudio de la correlación.

• Los coeficientes de correlación (Pearson, Spearman, etc.) valoran hasta qué punto el valor de una de las variables aumenta o disminuye cuando crece el valor de la otra.

• Cuando se dispone de todos los datos, un modo sencillo de comprobar, gráficamente, si existe una correlación alta, es mediante diagramas de dispersión,

• Se confronta, en el eje horizontal, el valor de una variable y en el eje vertical el valor de la otra.

• Un ejemplo sencillo de variables altamente correlacionados es la relación entre el peso y la talla de un sujeto.

• Partiendo de una muestra arbitraria, podemos construir el diagrama de dispersión en el Ejemplo 14

• En él puede observarse claramente como existe una relación directa entre ambas variables

Ej. 14 Histograma de Variables Talla y Peso

¿Cómo interpretamos este gráfico?

Ejemplo Final: Relación entre Nivel de Estrés y Edad

EDAD

706050403020

Niv

el d

e E

str

és

5,0

4,5

4,0

3,5

3,0

2,5

2,0

¿Cómo interpretamos este gráfico?

top related