gráficos para datos...

27

Upload: others

Post on 19-Mar-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Grá�cos para datos cuantitativos

Michael Wiper

Departamento de Estadística

Universidad Carlos III de Madrid

M. Wiper Estadística 1 / 18

Objetivo

Resultados de la prueba deconocimientos para la incorporación a laEscala de Cabos y Guardias de 2015.

Ilustrar los métodos grá�cos más importantes para resumir una muestra de datoscuantitativos.

M. Wiper Estadística 2 / 18

El diagrama de barras para datos discretas

La tabla muestra la frecuencia de número de accidentes mortales por día en eneroa junio 2014.

Por ejemplo, había dos días en los que hubieron 9 accidentes mortales de trá�co.

DGT

M. Wiper Estadística 3 / 18

El diagrama de barras

Hay una moda de tres accidentes diarios.Los datos están concentrados mayoritamente entre 1 y 5 o 6 accidentes diarios.Hay una ligera asimetría a la derecha o asimetría positiva.

M. Wiper Estadística 4 / 18

El diagrama de barras

Hay una moda de tres accidentes diarios.Los datos están concentrados mayoritamente entre 1 y 5 o 6 accidentes diarios.Hay una ligera asimetría a la derecha o asimetría positiva.

M. Wiper Estadística 4 / 18

Frecuencias cumulativas

En casi un 75% de los días, hay 4 o menos accidentes mortales.

M. Wiper Estadística 5 / 18

El grá�co

M. Wiper Estadística 6 / 18

El histograma para datos continuos

Tenemos datos del número de hectareas quemadas en cada provincia de España(sin incluir Ceuta y Melilla) en el año 2012.

Los datos varian entre 29 Ha (Álava) y 2246 Ha (Asturias)

No tiene sentido usar un diagrama de barras para cada valor individual.

Tenemos que agrupar los datos.

M. Wiper Estadística 7 / 18

El histograma para datos continuos

Tenemos datos del número de hectareas quemadas en cada provincia de España(sin incluir Ceuta y Melilla) en el año 2012.

Los datos varian entre 29 Ha (Álava) y 2246 Ha (Asturias)

No tiene sentido usar un diagrama de barras para cada valor individual.

Tenemos que agrupar los datos.

M. Wiper Estadística 7 / 18

El histograma para datos continuos

La mayoría de programas estadísticas tienen algoritmos automáticos para agrupar.El siguiente grá�co fue generado en Excel.

Hay barras anchas para representar la continuidad.

La elección de barras automática parece poco adecuado.

M. Wiper Estadística 8 / 18

El histograma para datos continuos

La mayoría de programas estadísticas tienen algoritmos automáticos para agrupar.El siguiente grá�co fue generado en Excel.

Hay barras anchas para representar la continuidad.

La elección de barras automática parece poco adecuado.

M. Wiper Estadística 8 / 18

El histograma para datos continuos

La mayoría de programas estadísticas tienen algoritmos automáticos para agrupar.El siguiente grá�co fue generado en Excel.

Hay barras anchas para representar la continuidad.

La elección de barras automática parece poco adecuado.

M. Wiper Estadística 8 / 18

El histograma para datos continuos

Una regla empírica es seleccionar aproximadamente√n barras donde n es el

tamaño de la muestra.En nuestro caso, usamos con (0, 350], (350, 700], ...

M. Wiper Estadística 9 / 18

El histograma para datos continuos

En el histograma se observa la fuerte asimetría positiva de los datos.

Hay dos valores mucho más grandes que los demás (atípicos).

Podemos mejorar empleando barras de distintas anchuras.

M. Wiper Estadística 10 / 18

El histograma para datos continuos

En el histograma se observa la fuerte asimetría positiva de los datos.

Hay dos valores mucho más grandes que los demás (atípicos).

Podemos mejorar empleando barras de distintas anchuras.

M. Wiper Estadística 10 / 18

Tabla de frecuencias con barras de distintas

anchuras

Ponemos barras menos anchas en principio y más anchas después.

La anchura es proporcional a la frecuencia partido por la anchura. Así, el áreadebajo de cada barra es igual a la frecuencia y el área debajo el histograma esigual a 1.

M. Wiper Estadística 11 / 18

Tabla de frecuencias con barras de distintas

anchuras

Ponemos barras menos anchas en principio y más anchas después.

La anchura es proporcional a la frecuencia partido por la anchura. Así, el áreadebajo de cada barra es igual a la frecuencia y el área debajo el histograma esigual a 1.

M. Wiper Estadística 11 / 18

El histograma con barras de distintas anchuras

Ahora se ve la forma de los datos de manera mucho más clara.

½Es muy difícil hacer esto en Excel!

M. Wiper Estadística 12 / 18

El histograma con barras de distintas anchuras

Ahora se ve la forma de los datos de manera mucho más clara.

½Es muy difícil hacer esto en Excel!

M. Wiper Estadística 12 / 18

El poligono de frecuencias

Supongamos que tenemos la siguiente tabla de frecuencias para unos datoscontinuos.

M. Wiper Estadística 13 / 18

El poligono de frecuencias

Podemos construir un histograma.

M. Wiper Estadística 14 / 18

El poligono de frecuencias

Suavizando, tenemos un poligono de frecuencias.

Para una muestra muy grande, la forma del poligono se acerca a la forma de lafunción de densidad.

M. Wiper Estadística 15 / 18

El poligono de frecuencias cumulativas

Podemos construir un histograma de frecuencias cumulativas.

M. Wiper Estadística 16 / 18

El poligono de frecuencias cumulativas

Ahora, unimos las barras desde los extremos izquierdos de cada intervalo.

Para muestras muy grandes, el poligono se acerca a la función de distribucióncumulativa.

M. Wiper Estadística 17 / 18

Resumen y siguiente sesión

Hemos comentado los grá�cos más utilizados para representar una muestra dedatos cuantitativos.

Hemos observado algunas caracteristicas de la forma de una muestra de datoscomo localización, escala o asimetría.

En las siguientes dos clases, introducimos formalmente las medidas másimportantes de forma.

M. Wiper Estadística 18 / 18

Resumen y siguiente sesión

Hemos comentado los grá�cos más utilizados para representar una muestra dedatos cuantitativos.

Hemos observado algunas caracteristicas de la forma de una muestra de datoscomo localización, escala o asimetría.

En las siguientes dos clases, introducimos formalmente las medidas másimportantes de forma.

M. Wiper Estadística 18 / 18

Resumen y siguiente sesión

Hemos comentado los grá�cos más utilizados para representar una muestra dedatos cuantitativos.

Hemos observado algunas caracteristicas de la forma de una muestra de datoscomo localización, escala o asimetría.

En las siguientes dos clases, introducimos formalmente las medidas másimportantes de forma.

M. Wiper Estadística 18 / 18