tema 2: distribuciones de frecuencia y gráficas para datos ... · 0 2 4 6 8 10 12 14 azul marron...

Post on 16-May-2018

234 Views

Category:

Documents

2 Downloads

Preview:

Click to see full reader

TRANSCRIPT

1.1 - 1

Tema 2: Distribuciones de frecuencia y gráficas para datos

categórico y discretos

1

1.1 - 2 Copyright © 2010, 2007, 2004 Pearson Education, Inc. All Rights Reserved.

1. Centro: Un valor representativo o promedio que

indica dónde se encuentra el centro del conjunto de

datos.

2. Variación: Una medida de cuánto varían la data.

3. Distribución: La forma de la dispersión de la data

sobre el rango de valores de la variable

(acampanada, sesgada o uniforme).

Características importantes de la data

4. Datos extremos:

Valores que son muy

distintos a los otros

valores de la variable.

5. Tiempo:

Características que

cambian sobre el

tiempo.

1.1 - 3

Cuando se obtiene data de una encuesta o de un experimento, ésta se debe organizar en una forma manejable.

Formas de Organizar Data

• Tablas

• Gráficas

• Construir un resumen numérico

Formas para organizar datos

1.1 - 4

Una tabla o distribución de frecuencias

• agrupa la data en categorías o clases (que no tienen nada en común)

• indica el número de observaciones en cada categoría.

Tablas

1.1 - 5 Copyright © 2010, 2007, 2004 Pearson Education, Inc. All Rights Reserved.

1. Resumir conjuntos de datos grandes.

2. Analizar la naturaleza de los datos

3. Tener una base para la construcción de gráficas importantes.

Razones para construir una

distribución de frecuencia

1.1 - 6

Ejemplo 1: Tabla de frecuencia para data cualitativa o categórica

• Problema: Un fisioterapeuta quiere determinar los tipos de rehabilitación requeridos por sus pacientes. Para ello, obtiene una muestra aleatoria simple de 36 de sus pacientes y registra la parte del cuerpo que requieren rehabilitación.

• Construya una distribución de frecuencias para la localización de la lesión.

1.1 - 7

EJEMPLO: cont Un fisioterapeuta quiere obtener una idea de los tipos de rehabilitación requeridos por sus pacientes usando una muestra aleatoria simple de 36 de sus pacientes.

Cadera

Espalda

Codo

Cuello

Espalda

Espalda

Rodilla

Mano

Espalda

Espalda

Cadera

Ingle

Hombro

Espalda

Espalda

Espalda

Espalda

Codo

Mano

Hombro

Espalda

Hombro

Ingle

Mano

Hombro

Muñeca

Rodilla

Muñeca

Rodilla

Rodilla

Muñeca

Rodilla

Hombro

Rodilla

Espalda

Rodilla

Región del cuerpo Conteo Frecuencia

Cadera

Codo

Cuello

Espalda

Hombro

Ingle

Mano

Muñeca

Rodilla

1.1 - 8

Frecuencia absoluta y frecuencia relativa

• La tabla anterior muestra frecuencias absolutas (número de observaciones incluidas en cada categoría o clase).

• La frecuencia relativa es la proporción (o porcentaje) de observaciones dentro de una categoría.

• Se encuentra usando la fórmula:

• Una distribución de frecuencias relativas muestra la frecuencia relativa de cada categoría

frecuencia relativa = frecuencia absoluta

total de observaciones

1.1 - 9

EJEMPLO: cont Un fisioterapeuta quiere obtener una idea de los tipos de rehabilitación requeridos por sus pacientes usando una muestra aleatoria simple de 36 de sus pacientes. Construya una distribución de frecuencia relativa de los datos.

Categoría Frecuencia

absoluta

Frecuencia

relativa

Cadera 2

Codo 2

Cuello 1

Espalda 11

Hombro 5

Ingle 2

Mano 3

Muñeca 3

Rodilla 7

1.1 - 10

Una distribución de frecuencias acumuladas

muestra la frecuencia acumulada de cada

categoría.

2-10

Distribución de frecuencias acumuladas

La frecuencia acumulada correspondiente a una

clase particular es la suma de todas las

frecuencias hasta e incluyendo esa clase.

Una distribución de frecuencias relativas

acumuladas muestra el porciento acumulado de

observaciones menores o iguales a la categoría.

1.1 - 11 2-11

Distribución de frecuencias acumuladas

Ejemplo: La siguiente tabla muestra la distribución de

frecuencia absoluta del número de autos vendidos en cierta

compañía de autos. Determine la distribución de frecuencias

acumuladas y la distribución de frecuencias relativas

acumuladas .

1.1 - 12

• Las gráficas nos permiten resumir la data y nos ayudan a entender lo que la data dice, en general, acerca de los individuos en el estudio.

• Las gráficas para data categórica o cuantitativa discreta se construyen colocando cada categoría de data en uno de los ejes (normalmente el eje horizontal) y la frecuencia absoluta o la frecuencia relativa de cada categoría en el otro eje.

Gráficas para data categórica o cuantitativa discreta

1.1 - 13

Construcción de una gráfica de barra de frecuencia

M&M Cantidad de

dulces

Azul 5

Marrón 12

Rojo 9

Anaranjado 6

Amarillo 10

Verde 3

Usaremos data sobre colores de los M&M para construir

una gráfica de barra de frecuencia absoluta y relativa

M&M Frecuencias

absolutas Frecuencias

relativas

Azul

Marrón

Rojo

Anaranjado

Amarillo

Verde Tabla 1: Distribución de colores en

una bolsa de M&M’s de 12 oz.

1.1 - 14

Gráfica de barra de frecuencia relativa (creada en Excel)

Color de M&M Frecuencia absoluta

Azul 5

Marron 12

Rojo 9

Anaranjado 6

Amarillo 10

Verde 3

0

2

4

6

8

10

12

14

Azul Marron Rojo Anaranjado Amarillo Verde

Fre

cu

en

cia

Ab

so

luta

Distribución de frecuencias para M&M's

Características: • Las barras, que son del mismo ancho, se dibujan por cada categoría.

• La altura de cada barra representa la frecuencia o frecuencia relativa

de la categoría.

1.1 - 15

Gráfica de barra de frecuencia relativa (creada en Excel)

Color de M&M Frecuencia absoluta

Azul 5

Marron 12

Rojo 9

Anaranjado 6

Amarillo 10

Verde 3

0

0.05

0.1

0.15

0.2

0.25

0.3

Azul Marron Rojo Anaranjado Amarillo Verde

Fre

cu

en

cia

rela

tiv

a

Distribución de frecuencias relativas para M&M's

1.1 - 16

• Una gráfica circular es un círculo dividido en sectores.

• Cada sector representa una categoría de datos.

• El área de cada sector es proporcional a la frecuencia de la categoría.

• Ejemplo: Los siguientes datos representan el diagnóstico de una muestra aleatoria de 20 pacientes ingresados en un hospital. Determine el % del círculo ocupado por cada categoría.

Gráfica circular

Número de sectores en la

gráfica circular:

% del círculo que ocupa cada

sector:

Asalto:

Caída:

Herida de

bala:

Accidente de

vehículo: TOTAL: 20

1.1 - 17

Gráfica circular (cont.)

Número de sectores en la

gráfica circular:

Grados del círculo que ocupa cada sector:

Asalto: 5% de 360 =

Caída: 10% de 360=

Herida de

bala: 40% de 360=

Accidente de

vehículo: 35% de 360=

A mano, utilizamos un transportador para medir cada

ángulo y dibujarlo dentro del círculo.

1.1 - 18

Gráfica circular

1.1 - 19

Gráfica circular vs Gráfica de barra

• Las gráficas circulares sólo pueden crearse si todas las categorías de la variable bajo estudio están representados.

• Las gráficas circulares son útiles para mostrar la división de todos los valores posibles de una variable cualitativa en sus partes.

• Las gráficas circulares no son tan útiles en la comparación de dos valores específicos de la variable cualitativa. El énfasis está en la comparación de las partes con el todo.

• Utilice una gráfica de barras cuando se quiere comparar los diferentes valores de la variable entre si y no las partes con el todo.

1.1 - 20

Distribución de frecuencia para data cuantitativa discreta (muchos valores

posibles)

Características de esta data:

• discreta con muchos valores

posibles

Método para crear distribución de

frecuencia:

• Agrupar por categorías o

clases

1.1 - 21 Copyright © 2010, 2007, 2004 Pearson Education, Inc. All Rights Reserved.

4. Elegir un punto de comienzo (el valor mínimo del conjunto de

datos o un valor conveniente)

Pasos para construir una

distribución de frecuencias

1. Determinar el número de clases que se va a usar (debe ser

entre 5 y 20).

2. Determinar el valor máximo y mínimo del conjunto.

3. Calcular el ancho de la clase (redondear hacia arriba).

ancho de clase

(valor máximo) – (valor mínimo)

número de clases

1.1 - 22

Ejemplo: Construir una distribución de frecuencia para el conjunto que contiene pulsos de 40 féminas

SOLUCION:

• Usaremos 7 clases.

• Identificar el valor mínimo y

máximo

• mínimo ___, máximo ____

• Determinar el ancho de las

clases:

• 𝑎𝑛𝑐ℎ𝑜 =𝑣𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 −𝑣𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜

𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠

𝑎𝑛𝑐ℎ𝑜 =

• Decidir punto de comienzo:

60 60 60 64

64 64 64 68

68 68 68 68

72 72 72 72

72 72 72 72

76 76 76 76

76 76 80 80

80 80 80 80

88 88 88 88

88 96 104 124

1.1 - 23

Ejemplo: (continuación)

SOLUCION (continuación):

60 60 60 64

64 64 64 68

68 68 68 68

72 72 72 72

72 72 72 72

76 76 76 76

76 76 80 80

80 80 80 80

88 88 88 88

88 96 104 124

5. Usando el límite inferior de la primera clase, le sumas el ancho de

clase para conseguir los límite inferiores de las demás clases.

1.1 - 24

Ejemplo: (continuación)

SOLUCION (continuación):

60 60 60 64

64 64 64 68

68 68 68 68

72 72 72 72

72 72 72 72

76 76 76 76

76 76 80 80

80 80 80 80

88 88 88 88

88 96 104 124

6. Determinar los límites superiores de las clases.

7. Determinar las frecuencias de cada clase

1.1 - 25

• ¿valor mínimo y valor máximo?

672 y 738

• Usemos como límite inferior de la primera clase 670

• Usemos como ancho de la clase: 10

• Las clases y frecuencias:

Ejemplo 2 : Construir una distribución de frecuencia absoluta de datos discretos (muchos valores posibles)

Clases Frecuencia

Los datos dados representan el tiempo entre

erupciones (en segundos) de una muestra

aleatoria de 45 erupciones del géiser “Old

Faithful”

1.1 - 26

Ejemplo: Construir una tabla de frecuencias relativas para los datos del géiser “Old Faithful”

Tiempo entre Frecuencia Frecuencia

erupciones absoluta relativa

670 – 679

680 – 689

690 – 699

700 – 709

710 – 719

720 – 729

730 – 739

top related