descripción de muestras

38

Upload: edgar-madrid

Post on 15-Apr-2017

231 views

Category:

Education


0 download

TRANSCRIPT

Descripción de muestras y poblaciones

ParteI

MSc Edgar Madrid Cuello

Departamento de Matemática, UNISUCRE

Estadística I

2016

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 1 / 21

Distribución de frecuencias

De�nición

Una distribución de frecuencia es simplemente una presentación de lafrecuencia. Puede ser presentada en forma de tabla y/o mediante ungrá�co.

De�nición (Diagrama de Barras (barplot))

Este diagrama se emplea cuando la variable de estudio es categórica, estáconformado por barras rectangulares de longitudes proporcionales a losvalores representados. Los grá�cos de barras son usados para comparar doso más valores. Las barras pueden orientarse vertical u horizontalmente.

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 2 / 21

Distribución de frecuencias

De�nición

Una distribución de frecuencia es simplemente una presentación de lafrecuencia. Puede ser presentada en forma de tabla y/o mediante ungrá�co.

De�nición (Diagrama de Barras (barplot))

Este diagrama se emplea cuando la variable de estudio es categórica, estáconformado por barras rectangulares de longitudes proporcionales a losvalores representados. Los grá�cos de barras son usados para comparar doso más valores. Las barras pueden orientarse vertical u horizontalmente.

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 2 / 21

Distribución de frecuencias

De�nición

Una distribución de frecuencia es simplemente una presentación de lafrecuencia. Puede ser presentada en forma de tabla y/o mediante ungrá�co.

De�nición (Diagrama de Barras (barplot))

Este diagrama se emplea cuando la variable de estudio es categórica, estáconformado por barras rectangulares de longitudes proporcionales a losvalores representados. Los grá�cos de barras son usados para comparar doso más valores. Las barras pueden orientarse vertical u horizontalmente.

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 2 / 21

Ejemplo

Canis lupusEn la siguiente tabla se muestran las tres razas de perros más comunes ennuestro municipio:

Raza de perros

Raza Frecuencia

Labrador 40

Dóberman 25

Chaw Chaw 18

Total 83

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 3 / 21

Figure: Diagrama de Barras

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 4 / 21

Figure: Diagrama de Pastel

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 5 / 21

De�nición (Diagramas de puntos)

Es un grá�co sencillo que se puede utilizar para mostrar la distribución deuna variable numérica cuando el tamaño de la muestra es pequeño. Pararealizar un diagrama de puntos, se dibuja una recta numérica que abarqueel intervalo de los datos y después se pone un punto sobre la línea numéricaen el lugar correspondiente a cada observación.

Cuando dos o más observaciones tienen el mismo valor, se sitúan lospuntos del diagrama de barras uno encima de otro. Esto produce un efectosimilar al de las barras en un diagrama de barras.

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 5 / 21

De�nición (Diagramas de puntos)

Es un grá�co sencillo que se puede utilizar para mostrar la distribución deuna variable numérica cuando el tamaño de la muestra es pequeño. Pararealizar un diagrama de puntos, se dibuja una recta numérica que abarqueel intervalo de los datos y después se pone un punto sobre la línea numéricaen el lugar correspondiente a cada observación.

Cuando dos o más observaciones tienen el mismo valor, se sitúan lospuntos del diagrama de barras uno encima de otro. Esto produce un efectosimilar al de las barras en un diagrama de barras.

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 5 / 21

De�nición (Diagramas de puntos)

Es un grá�co sencillo que se puede utilizar para mostrar la distribución deuna variable numérica cuando el tamaño de la muestra es pequeño. Pararealizar un diagrama de puntos, se dibuja una recta numérica que abarqueel intervalo de los datos y después se pone un punto sobre la línea numéricaen el lugar correspondiente a cada observación.

Cuando dos o más observaciones tienen el mismo valor, se sitúan lospuntos del diagrama de barras uno encima de otro. Esto produce un efectosimilar al de las barras en un diagrama de barras.

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 5 / 21

Ejemplo

La Tabla 2.2.3 muestra la tasa de mortalidad infantil (muertes infantilespor cada 100 nacimientos vivos) en 12 países de Sudamérica en 2009. Ladistribución se muestra en la Figura

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 6 / 21

De�nición (Histograma)

Si creamos barras en vez de pilas de puntos, entonces tenemos unhistograma. Un histograma es como un diagrama de barras, exceptoporque un histograma muestra una variable numérica, lo que signi�ca quehay un orden natural y una escala para la variable.

En un diagrama de barras el espacio entre las barras (si existe) esarbitrario, ya que los datos que se muestran son categóricos. En unhistograma, la escala de la variable determina la situación de las barras.

El ejemplo que sigue muestra un diagrama de puntos y un histograma de

una distribución de frecuencias.

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 7 / 21

De�nición (Histograma)

Si creamos barras en vez de pilas de puntos, entonces tenemos unhistograma. Un histograma es como un diagrama de barras, exceptoporque un histograma muestra una variable numérica, lo que signi�ca quehay un orden natural y una escala para la variable.

En un diagrama de barras el espacio entre las barras (si existe) esarbitrario, ya que los datos que se muestran son categóricos. En unhistograma, la escala de la variable determina la situación de las barras.

El ejemplo que sigue muestra un diagrama de puntos y un histograma de

una distribución de frecuencias.

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 7 / 21

De�nición (Histograma)

Si creamos barras en vez de pilas de puntos, entonces tenemos unhistograma. Un histograma es como un diagrama de barras, exceptoporque un histograma muestra una variable numérica, lo que signi�ca quehay un orden natural y una escala para la variable.

En un diagrama de barras el espacio entre las barras (si existe) esarbitrario, ya que los datos que se muestran son categóricos. En unhistograma, la escala de la variable determina la situación de las barras.

El ejemplo que sigue muestra un diagrama de puntos y un histograma de

una distribución de frecuencias.

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 7 / 21

De�nición (Histograma)

Si creamos barras en vez de pilas de puntos, entonces tenemos unhistograma. Un histograma es como un diagrama de barras, exceptoporque un histograma muestra una variable numérica, lo que signi�ca quehay un orden natural y una escala para la variable.

En un diagrama de barras el espacio entre las barras (si existe) esarbitrario, ya que los datos que se muestran son categóricos. En unhistograma, la escala de la variable determina la situación de las barras.

El ejemplo que sigue muestra un diagrama de puntos y un histograma de

una distribución de frecuencias.

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 7 / 21

Ejemplo (Tamaño de camada de cerdas)

Un grupo de 32 cerdas de 2 años de edad de la misma raza (3/4 Duroc,1/4 Yorkshire) se aparearon con cerdos Yorkshire. Se apuntó el número decochinillos supervivientes de cada cerda tras 21 días. Los resultados semuestran en la Tabla 2.2.4 y en forma grá�ca

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 8 / 21

De�nición (Frecuencia relativa)

A veces es conveniente utilizar una escala de frecuencia relativa

frecuencia relativa =Frecuencia

n

Ejemplo (Color de �ores)

Color Frecuencia F relativa %

Rojo 108

Rosa 34

Blanco 40

Total

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 9 / 21

De�nición (Frecuencia relativa)

A veces es conveniente utilizar una escala de frecuencia relativa

frecuencia relativa =Frecuencia

n

Ejemplo (Color de �ores)

Color Frecuencia F relativa %

Rojo 108

Rosa 34

Blanco 40

Total

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 9 / 21

En los ejemplos anteriores, las distribuciones de frecuencia simples sin

agrupar han proporcionado resúmenes concisos de los datos. En muchos

conjuntos de datos, es necesario agrupar dichos datos para condensar la

información adecuadamente. (Generalmente, esto sucede en el caso de

variables continuas). El ejemplo que sigue muestra una distribución de

frecuencias agrupadas.

Ejemplo (CFK en el suero)

La creatina fosfoquinasa es una enzima relacionada con las funciones de losmúsculos y del cerebro. Como parte de un estudio para determinar lavariación natural de concentración de CFK, se extrajo sangre de 36voluntarios varones. La Tabla 2.2.6 muestra sus concentraciones en suerode CFK (medidas en U/l).

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 10 / 21

En los ejemplos anteriores, las distribuciones de frecuencia simples sin

agrupar han proporcionado resúmenes concisos de los datos. En muchos

conjuntos de datos, es necesario agrupar dichos datos para condensar la

información adecuadamente. (Generalmente, esto sucede en el caso de

variables continuas). El ejemplo que sigue muestra una distribución de

frecuencias agrupadas.

Ejemplo (CFK en el suero)

La creatina fosfoquinasa es una enzima relacionada con las funciones de losmúsculos y del cerebro. Como parte de un estudio para determinar lavariación natural de concentración de CFK, se extrajo sangre de 36voluntarios varones. La Tabla 2.2.6 muestra sus concentraciones en suerode CFK (medidas en U/l).

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 10 / 21

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 11 / 21

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 12 / 21

Interpretación de las áreas en un histograma

Un histograma se puede ver de dos formas. La parte superior de las barras

esboza la forma de la distribución. Pero las áreas dentro de las barras

tienen también un signi�cado. El área de cada barra es proporcional a la

correspondiente frecuencia. Por tanto, el área de una o varias barras se

puede interpretar que expresa el número de observaciones en las clases

representadas por las barras.

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 13 / 21

Interpretación de las áreas en un histograma

Un histograma se puede ver de dos formas. La parte superior de las barras

esboza la forma de la distribución. Pero las áreas dentro de las barras

tienen también un signi�cado. El área de cada barra es proporcional a la

correspondiente frecuencia. Por tanto, el área de una o varias barras se

puede interpretar que expresa el número de observaciones en las clases

representadas por las barras.

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 13 / 21

Interpretación de las áreas en un histograma

Un histograma se puede ver de dos formas. La parte superior de las barras

esboza la forma de la distribución. Pero las áreas dentro de las barras

tienen también un signi�cado. El área de cada barra es proporcional a la

correspondiente frecuencia. Por tanto, el área de una o varias barras se

puede interpretar que expresa el número de observaciones en las clases

representadas por las barras.

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 13 / 21

Interpretación de las áreas en un histograma

Un histograma se puede ver de dos formas. La parte superior de las barras

esboza la forma de la distribución. Pero las áreas dentro de las barras

tienen también un signi�cado. El área de cada barra es proporcional a la

correspondiente frecuencia. Por tanto, el área de una o varias barras se

puede interpretar que expresa el número de observaciones en las clases

representadas por las barras.

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 13 / 21

Interpretación de las áreas en un histograma

Un histograma se puede ver de dos formas. La parte superior de las barras

esboza la forma de la distribución. Pero las áreas dentro de las barras

tienen también un signi�cado. El área de cada barra es proporcional a la

correspondiente frecuencia. Por tanto, el área de una o varias barras se

puede interpretar que expresa el número de observaciones en las clases

representadas por las barras.

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 13 / 21

Ejemplo

Por ejemplo, la Figura 4 muestra un histograma de la distribución de CFK.El área sombreada es el 42% del área total de todas las barras. De acuerdocon esto, el 42% de los valores de CFK están en las clases correspondientes.Es decir, 15 de 36 o el 42% de los valores están entre 60 U/l y 100 U/l.

Figure: 4

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 14 / 21

Ejemplo

Por ejemplo, la Figura 4 muestra un histograma de la distribución de CFK.El área sombreada es el 42% del área total de todas las barras. De acuerdocon esto, el 42% de los valores de CFK están en las clases correspondientes.Es decir, 15 de 36 o el 42% de los valores están entre 60 U/l y 100 U/l.

Figure: 4

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 14 / 21

Formas de distribuciones La forma de una distribución se

puede indicar mediante una curva suave que se aproxime al histograma,

como se muestra en la Figura 5.

Figure: 5 Aproximación al histograma mediante una curva suave

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 15 / 21

Una forma común para datos biológicos es la unimodal, y está sesgada a

la derecha

Figure: 6 Unimodal sesgada a la derecha

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 16 / 21

Aparecen también distribuciones con forma aproximada de campana,

Figure: 7 Simétrica acampanada

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 17 / 21

Algunas veces una distribución es simétrica, pero se diferencia de una

campana porque tiene colas largas,

Figure: 8 Simétrica pero no acampanada

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 18 / 21

Las formas sesgadas hacia la izquierda (�g. 9) y exponencial (�g. 10) son

menos comunes.

Figure: 9. Sesgada a la izquierda

Figure: 10. Exponencial

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 19 / 21

La bimodalidad. como en (11), puede indicar la existencia de dos

subgrupos distintos de unidades observacionales.

Figure: 11. Bimodal

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 20 / 21

Ejemplo (Peso del cerebro)

En 1888, P. Topinard publicó datos sobre los pesos de los cerebros decientos de hombres y mujeres franceses.

Figure: 12

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 21 / 21

Figure: 13MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 22 / 21

Figure: 14

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 23 / 21