2do material u2

100
ESTADISTICA UNAM SUA Material de apoyo didáctico. Aura Mélida De la Selva Menéndez

Upload: emmanuel-grooviedelik

Post on 29-Jun-2015

3.801 views

Category:

Education


3 download

TRANSCRIPT

Page 1: 2do material u2

ESTADISTICA UNAM SUA

Material de apoyo didáctico.

Aura Mélida De la Selva Menéndez

Page 2: 2do material u2

Recomendaciones

• El presente material ha sido preparado como apoyo para las clases de las materias de Estadística Descriptiva e Inferencial y en ningún momento sustituye la lectura y consulta detallada de la bibliografía recomendada así como la elaboración de los ejercicios de práctica a cada una de las técnicas.

Page 3: 2do material u2

¿Qué significa estadística?

• Estadística es la ciencia de recolectar, organizar, presentar, analizar e interpretar datos con el propósito de ayudar a una toma de decisiones más efectiva.

1-2

Page 4: 2do material u2

¿Quién usa estadística?

• Las técnicas estadísticas se usan ampliamente por personas en áreas de ciencias sociales, economía, demografía, sociología, comercialización, contabilidad, control de calidad, consumidores, deportes, administración de hospitales, educación, política, medicina, etcétera...

1-3

Page 5: 2do material u2

Tipos de estadísticas• Estadística descriptiva: métodos para

organizar, resumir y presentar datos de manera informativa.

• EJEMPLO 1: un sondeo de opinión encontró que 49% de las personas en una encuesta sabían el nombre del primr libro en la Biblia. La estadística “49” describe el número de cada 100 personas que saben la respuesta.

• EJEMPLO 2: según el Consumer Reports, los dueños de lavadoras de ropa Whirlpool reportaron 9 problemas por cada 100 máquinas durante 1995. La estadística “9” describe el número de problemas por cada 100 máquinas.

1-4

Page 6: 2do material u2

Tipos de estadísticas

• Estadística inferencial: una decisión, estimación, predicción o generalización sobre una población, con base en una muestra.

• Una población es un conjunto de todos los posibles individuos, objetos o medidas de interés.

• Una muestra es una porción, o parte, de la población de interés.

1-5

Page 7: 2do material u2

Tipos de estadísticas(ejemplos de inferencia estadística)

• EJEMPLO 3: el departmento de contabilidad de una empresa elegirá una muestra de facturas para verificar la exactitud de todas las facturas de la compañía.

• EJEMPLO 4: los catadores de vino prueban unas cuantas gotas para tomar la decisión de liberar todo el vino para la venta.

• EJEMPLO 5: las cadenas de TV monitorean la popularidad de sus programas contratando a Nielsen y otras organizaciones para muestrear las preferencias de televidentes.

1-6

Page 8: 2do material u2

Tipos de variables

• Variable cualitativa o de atributos: la característica o variable que se estudia no es numérica.

• EJEMPLOS: sexo, afiliación religiosa, tipo de automóvil que se posee, lugar de nacimiento, color de los ojos.

1-7

Page 9: 2do material u2

Tipos de variables

• Variable cuantitativa: la variable se puede registrar numéricamente.

• EJEMPLO: saldo en una cuenta de cheques, minutos que faltan para que termine la clase, número de niños en una familia.

1-8

Page 10: 2do material u2

Tipos de variables

• Las variables cuantitativas se pueden clasificar como discretas o continuas.

• Variables discretas: sólo pueden adquirir ciertos valores y casi siempre hay “brechas” entre esos valores.

• EJEMPLO: el número de habitaciones en una casa (1,2,3,..., etc.).

1-9

Page 11: 2do material u2

Tipos de variables

• Las variables cuantitativas se pueden clasificar como discretas o continuas.

• Variables continuas: pueden tomar cualquier valor dentro de un intervalo específico.

• EJEMPLO: el tiempo que toma volar de la Ciudad de México a Nueva York.

1-10

Page 12: 2do material u2

Resumen de tipos de variables

C u a lita tivo s o d e a tribu tos(t ipo de au to q ue po se e)

d isc re tos(n ú m ero d e h ijo s)

co n tin u os(tie m p o pa ra re so lve r e l e xam e n)

C u a ntita t ivo s o n u m é ricos

D A T O S

1-11

Page 13: 2do material u2

Fuentes de datos estadísticos

• Los problemas de investigación suelen requerir datos publicados. Se pueden encontrar estadísticas relacionadas en artículos publicados, revistas y periódicos.

• No todos los temas disponen de datos publicados. En esos casos, la información deberá recolectarse y analizarse.

• Una manera de recolectar datos es mediante encuestas.

1-12

Page 14: 2do material u2

Niveles de medición

• Nivel nominal: los datos sólo se puede clasificar en categorías, no se pueden ordenar.

• EJEMPLOS: color de los ojos, sexo, afiliación religiosa.

1-13

Page 15: 2do material u2

Niveles de medición

• Mutuamente excluyente: un indivduo, objeto o artículo, al ser incluido en una categoría, debe excluirse de las demás.

• EJEMPLO: color de los ojos.

• Exhaustivo: cada persona, objecto o artículo debe clasificarse en al menos una categoría.

• EJEMPLO: afiliación religiosa.

1-14

Page 16: 2do material u2

Niveles de medición

• Nivel ordinal: involucra datos que se pueden ordenar, pero no es posible determinar las diferencias entre los valores de los datos o no tienen significado.

• EJEMPLO: en una prueba de sabor de 4 refrescos de cola, el C se clasificó como número 1, el B como número 2, el A como 3 y el D como número 4.

1-15

Page 17: 2do material u2

Niveles de medición

• Nivel de intervalo: similar al nivel ordinal, con la propiedad adicional de que se pueden determinar cantidades significativas de las diferencias entre los valores. No existe un punto cero natural.

• EJEMPLO: temperatura en la escala de grados Fahrenheit.

1-16

Page 18: 2do material u2

Niveles de medición

• Nivel de razón: el nivel de intervalo con un punto cero inicial inherente. Las diferencias y razones son significativas para este nivel de medición.

• EJEMPLOS: dinero, altura de los jugadores de basquetbol de la NBA.

1-17

Page 19: 2do material u2

Bibliografía 1. FERRIS J. RITCHEY, Estadística para las

Ciencias Sociales. 2da. Edición, McGraw Hill Editores, ISBN 10-970-10-6699-5, Impreso en México, 2008.

2. Murray R. Spiegel y Larry J. Stephens. ESTADISTICA. 3a. Edición, McGraw-Hill, México 2002.Capítulos 6 al 12, Págs. 127 a 283.

3. Aprenda Fácil ESTADÍSTICA. Grupo Patria Cultural. Sexta reimpresión 2005.

Page 20: 2do material u2

Bibliografía ......

1. John Freund y Simon Gary. Estadística Elemental. México, Prentice Hall-Hispanoamerica, 1994, Pág. 89-383.B.

2. Jorge Padua. Técnicas de investigación aplicadas a las ciencias sociales. Colegio de México, FCE, México, 1992.

3. Hubert Blalock, Estadística Social. México, FCE, 1978.Guillermo Briones. Métodos y técnicas de investigación para las Ciencias Sociales, México, Ed. Trillas, 1990.

Page 21: 2do material u2

Estadística Descriptiva

Material de Apoyo didáctico

UNAM FCPyS SUA Educación a Distancia.

Profesora Aura Mélida De la Selva Menéndez Vol.2

Page 22: 2do material u2

Primera sesión

UNOOrganizar los datos en una distribución de frecuencias.

DOS Prresentar una distribución de frecuencias en un histograma, un polígono de freucencias y un polígono de frecuencias acumuladas.

TRESDesarrollar una representación de tallo y hoja.

CUATROPresentar datos mediante técnicas de graficación como gráficas de líneas, de barras y circulares.

Page 23: 2do material u2

Distribución de frecuencias

• Distribución de frecuencias: agrupamiento de datos en categorías que muestran el número de observacines en cada categoría mutumente excluyente.

2-2

Page 24: 2do material u2

Elaboración de una distribución de frecuencias

p reg un ta quese d eseare sp on d er

re co lecc iónd e d a tos

(d a to s o rig in a le s)

d is tribu c iónd e fre cu en c ias

o rg an izac iónd e d a tos

p re se n tac iónd e d a tos(g rá fica )

o b te nc iónde

co n c lus io n es

2-3

Page 25: 2do material u2

Distribución de frecuencias

• Marca de clase (punto medio): punto que divide a la clase en dos partes iguales. Es el promedio entre los límites superior e inferior de la clase.

• Intervalo de clase: para una distribución de frecuencias que tiene clases del mismo tamaño, el intervalo de clase se obtiene restando el límite inferior de una clase del límite inferior de la siguiente.

2-4

Page 26: 2do material u2

EJEMPLO 1• Dr. “X”es el director de la escuela de

ciencias sociales y desea determinar cuánto estudian los alumnos en ella. Selecciona una muestra aleatoria de 30 estudiantes y determina el número de horas por semana que estudia cada uno: 15.0, 23.7, 19.7, 15.4, 18.3, 23.0, 14.2, 20.8, 13.5, 20.7, 17.4, 18.6, 12.9, 20.3, 13.7, 21.4, 18.3, 29.8, 17.1, 18.9, 10.3, 26.1, 15.7, 14.0, 17.8, 33.8, 23.2, 12.9, 27.1, 16.6.

• Organice los datos en una distribución de frecuencias.

2-5

Page 27: 2do material u2

EJEMPLO 1 continuación

Horas de estudio Frecuencia, f 8-12 1 13-17 12 18-22 10 23-27 5 28-32 1 33-37 1

2-6

Considere las clases 8-12 y 13-17. Las marcas de clase son 10 y 15. El intervalo de clase es 5 (13 - 8).

Page 28: 2do material u2

Sugerencias para elaborar una distribución de frecuencias

• Los intervalos de clase usados en la distribución de frecuencias deben ser iguales.

• Determine un intervalo de clase sugerido con la fórmula: i = (valor más alto - valor más bajo)/número de clases.

2-7

Page 29: 2do material u2

Sugerencias para elaboraruna distribución de frecuencias

• Use el intervalo de clase calculado sugerido para construir la distribución de frecuencias.

Nota: este es un intervalo de clase sugerido; si el intervalo de clase calculado es 97, puede ser mejor usar 100.

• Cuente el número de valores en cada clase.

2-8

Page 30: 2do material u2

Distribución de frecuencia relativa• La frecuencia relativa de una clase se obtiene dividiendo la

frecuencia de clase entre la frecuencia total.

2-9

Frecuencia, f

Frecuencia relativa

8-12 1 1/30=.0333

13-17 12 12/30=.400

18-22 10 10/30=.333

23-27 5 5/30=.1667

28-32 1 1/30=.0333

33-37 1 1/30=.0333

TOTAL 30 30/30=1

T

Horas

Page 31: 2do material u2

Representaciones de tallo y hoja

• Representaciones de tallo y hoja: técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes: los dígitos principales son el tallo y el dígito siguiente es la hoja.

• Nota: una ventaja de la representación de tallo y hoja comparado con la distribución de frecuencias es que no se pierde la identidad de cada observación.

2-10

Page 32: 2do material u2

EJEMPLO 2

• Colin logró las siguientes calificaciones en el doceavo examen de contabilidad del semestre: 86, 79, 92, 84, 69, 88, 91, 83, 96, 78, 82, 85. Construya una representación de tallo y hoja para los datos.

tallo hoja

6 9

7 8 9

8 2 3 4 5 6 8

9 1 2 6

2-11

Page 33: 2do material u2

Presentación gráfica de una distribución de frecuencias

• Las tres formas de gráficas más usadas son histogramas, polígonos de frecuencia y distribuciones de frecuencias acumuladas (ojiva).

• Histograma: gráfica donde las clases se marcan en el eje horizontal y las frecuencias de clase en el eje vertical. Las frecuencias de clase se representan por las alturas de las barras y éstas se trazan adyacentes entre sí.

2-12

Page 34: 2do material u2

Presentación gráfica de una distribución de frecuencias

• Un polígono de frecuencias consiste en segmentos de línea que conectan los puntos formados por el punto medio de la clase y la frecuencia de clase.

• Una distribución de frecuencias acunulada (ojiva) se usa para determinar cuántos o qué proporción de los valores de los datos es menor o mayor que cierto valor.

2-13

Page 35: 2do material u2

Histograma para el ejemplo de horas de estudio

0

2

4

6

8

10

12

14

10 15 20 25 30 35

Horas de estudio

Fre

cuen

cia

2-14

Page 36: 2do material u2

Polígono de frecuencias para las horas de estudio

2-15

0

2

4

6

8

10

12

14

10 15 20 25 30 35

Horas de estudio

Frec

uenc

ia

Page 37: 2do material u2

Distribución de frecuencias acumuladas menor que para las horas de estudio

0

5

10

15

20

25

30

35

10 15 20 25 30 35

Horas de estudio

Frec

uenc

ia

2-16

Page 38: 2do material u2

Gráfica de barras

• Una gráfica de barras se puede usar para describir cualquier nivel de medición (nominal, ordinal, de intervalo o de razón).

• EJEMPLO 3: construya una gráfica de barras para el número de personas desempleadas por cada 100 000 habitantes de ciertas ciudades en 1995.

2-17

Page 39: 2do material u2

EJEMPLO 3 continuación

Ciudad Número de desempleadospor 100 000 habitantes

Atlanta, GA 7300Boston, MA 5400Chicago, IL 6700

Los Angeles, CA 8900New York, NY 8200

Washington, D.C. 8900

2-18

Page 40: 2do material u2

Gráfica de barras para los datos de desempleados

7300

5400

6700

89008200

8900

0

2000

4000

6000

8000

10000

1 2 3 4 5 6

Ciudades

# d

esem

ple

ad

os/1

00 0

00

Atlanta

Boston

Chicago

Los Angeles

New York

Washington

2-19

Page 41: 2do material u2

Gráfica circular

• Una gráfica circular es en especial útil para desplegar una distribución de frecuencias relativas. Se divide un círculo de manera proporcional a la frecuencia relativa y las rebanadas representan los diferentes grupos.

• EJEMPLO 4: se pidió a una muestra de 200 corredores que indicaran su tipo favorito de zapatos para correr.

2-20

Page 42: 2do material u2

EJEMPLO 4 continuación

• Dibuje una gráfica circular basada en la siguiente información.

Tipo de zapato # de corredores

Nike 92

Adidas 49

Reebok 37

Asics 13

Otros 9

2-21

Page 43: 2do material u2

Gráfica circular para tipos de zapatos

Nike

Adidas

ReebokAsics

Otros

Nike

Adidas

Reebok

Asics

Otros

2-22

Page 44: 2do material u2

Descripción de los datos: medidas de ubicación

UNOCalcular la media aritmética, mediana, moda, media ponderada y media geométrica.

DOS Explicar las características, utilización, ventajas y desventajas de cada medida de ubicación.

TRESIdentificar la posición de la media aritmética, la mediana, y la moda, tanto para distribuciones simétricas como asimétricas o sesgadas.

Page 45: 2do material u2

Media de la población• Para datos no agrupados, la media de la

población es la suma de todos los valores en ella dividida entre el total de valores en la población:

donde µ representa la media de la población.

• N es el número total de elementos en la población.

• X representa cualquier valor en particular.

indica la operación de sumar.

NX /

3-2

Page 46: 2do material u2

EJEMPLO 1

• Parámetro: una característica de una población.

• La familia Kiers posee cuatro carros. Los datos son las millas recorridas por cada uno:56 000, 23 000, 42 000 y 73 000. Encuentre el promedio de millas de los cuatro carros.

• Esto es (56 000 + 23 000 + 42 000 + 73 000)/4 = 48 500

3-3

Page 47: 2do material u2

Media de una muestra• Para datos no agrupados, la media de una

muestra es la suma de todos los valores divididos entre el número total de los mismos:

• donde X denota la media muestral

• n es el número total de valores en la muestra.

X X n /

3-4

Page 48: 2do material u2

EJEMPLO 2• Dato estadístico: una característica de una

muestra.

• Una muestra de cinco ejecutivos recibió la siguiente cantidad en bonos el año pasado: $14 000, $15 000, $17 000, $16 000 y

$15 000. Encuentre el promedio en bonos para los cinco ejecutivos.

• Como estos valores representan la muestra de 5 ejecutivos, la media de la muestra es

(14 000 + 15 000 + 17 000 + 16 000 +

15 000) / 5 = $15 400.

3-5

Page 49: 2do material u2

Propiedades de la media aritmética

• Todo conjunto de datos de nivel de intervalo y de nivel de razón tiene un valor medio.

• Al evaluar la media se incluyen todos los valores.

• Un conjunto de valores sólo tiene una media.

• La cantidad de datos a evaluar rara vez afecta la media.

• La media es la única medida de ubicación donde la suma de las desviaciones de cada valor con respecto a la media, siempre es cero.

3-6

Page 50: 2do material u2

EJEMPLO 3

• Considere el conjunto de valores: 3, 8 y 4. La media es 5. Para ilustrar la quinta propiedad, (3 - 5) + (8 - 5) + (4 - 5) = - 2 + 3 - 1 = 0. En otras palabras,

( )X X 0

3-7

Page 51: 2do material u2

Media ponderada

• La media ponderada de un conjunto de números X1, X2, ..., Xn, con las ponderaciones correspondientes w1, w2, ...,wn, se calcula con la fórmula:

wXwXw

wwwXwXwXwXw nnn

/)*(

).../()...( 212211

3-8

Page 52: 2do material u2

EJEMPLO 6• Durante un periodo de una hora en una

tarde calurosa de un sábado, el cantinero Chris sirvió cincuenta bebidas. Calcule la media ponderada de los precios de las bebidas. (Precio ($), cantidad vendida): (.50,5), (.75,15), (.90,15), (1.10,15).

• La media ponderada es: $(.50 x 5 + .75 x 15 + .90 x 15 + 1.10 x 15) / (5 + 15 + 15 + 15) = $43.75/50 = $0.875

3-9

Page 53: 2do material u2

Mediana• Mediana: es el punto medio de los valores

después de ordenarlos de menor a mayor, o de mayor a menor. La misma cantidad de valores se encuentra por arriba de la mediana que por debajo de ella.

• Nota: para un conjunto con un número par de números, la mediana será el promedio aritmético de los dos números medios.

3-10

Page 54: 2do material u2

EJEMPLO 4• Calcule la mediana para los siguientes datos.

• La edad de una muestra de cinco estudiantes es: 21, 25, 19, 20 y 22.

• Al ordenar los datos de manera ascendente quedan: 19, 20, 21, 22, 25. La mediana es 21.

• La altura, en pulgadas, de cuatro jugadores de basquetbol es 76, 73, 80 y 75.

• Al ordenar los datos de manera ascendente quedan: 73, 75, 76, 80. La mediana es 75.5.

3-11

Page 55: 2do material u2

Propiedades de la mediana• La mediana es única para cada conjunto de datos.

• No se ve afectada por valores muy grandes o muy pequeños, y por lo tanto es una medida valiosa de tendencia central cuando ocurren.

• Puede obtenerse para datos de nivel de razón, de intervalo y ordinal.

• Puede calcularse para una distribución de frecuencias con una clase de extremo abierto, si la mediana no se encuentra en una de estas clases.

3-12

Page 56: 2do material u2

Moda

• La moda es el valor de la observación que aparece con más frecuencia.

• EJEMPLO 5: las calificaciones de un examen de diez estudantes son: 81, 93, 84, 75, 68, 87, 81, 75, 81, 87. Como la calificación 81 es la que más ocurre, la calificación modal es 81.

3-13

Page 57: 2do material u2

Media geométrica• La media geométrica (MG) de un conjunto de n

números positivos se define como la raíz n-ésima del producto de los n valores. Su fórmula es:

– La media geométrica se usa para encontrar el promedio de porcentajes, razones, índices o tasas de crecimiento.

n nXXXXMG ))...()()(( 321

3-14

Page 58: 2do material u2

EJEMPLO 6• Las tasas de interés de tres bonos son 5%, 7% y

4%.

• La media geométrica es

= 5.192.

• La media aritmética es (6 + 3 + 2)/3 = 5.333.

• La MG da una cifra de ganancia más conservadora porque no tiene una ponderación alta para la tasa de 7%.

3 )4)(5)(7(MG

3-15

Page 59: 2do material u2

Media geométrica continuación

3-16

• Otra aplicación de la media geométrica es determinar el porcentaje promedio del incremento en ventas, producción u otros negocios o series económicas de un periodo a otro. La fórmula para este tipo de problema es:

1periodo) del inicio alvalor periodo)/( del final alvalor ( nMG

Page 60: 2do material u2

EJEMPLO 7

• El número total de mujeres inscritas en colegios americanos aumentó de 755 000 en 1986 a 835 000 en 1995.

• Aquí n = 10, así (n - 1) = 9.

• Es decir, la media geométrica de la tasa de crecimiento es 1.27%.

.0127.1000755/0008358 MG

3-17

Page 61: 2do material u2

Media de datos agrupados• La media de una muestra de datos

organizados en una distribución de frecuencias se calcula mediante la siguiente fórmula:

XXf

f

Xf

n

3-18

Page 62: 2do material u2

EJEMPLO 9

• Una muestra de diez cines en una gran área metropolitana dio el número total de películas exhibidas la semana anterior. Calcule la media de las películas proyectadas.

XXf

f

Xf

n

3-19

Page 63: 2do material u2

EJEMPLO 9 continuación

Películas exhibidas

frecuencia f

punto medio de clase X

(f)(X)

1-2 1 1.5 1.5

3-4 2 3.5 7.0

5-6 3 5.5 16.5

7-8 1 7.5 7.5

9-10 3 9.5 28.5

Total 10 61

61/10 = 6.1 películas

3-20

Page 64: 2do material u2

Mediana de datos agrupados

• La mediana de una muestra de datos organizados en una distribución de frecuencias se calcula mediante la siguiente fórmula:

• Mediana = L + [(n/2 - FA)/f] (i)

• donde L es el límite inferior de la clase que contiene a la mediana, FA es la frecuencia acumulada que precede a la clase de la mediana, f es la frecuencia de clase de la mediana e i es el intervalo de clase de la mediana.

3-21

Page 65: 2do material u2

Cálculo de la clase de la mediana

Para determinar la clase de la mediana de datos agrupados:

• Elabore una distribución de frecuencias acumulada.

• Divida el número total de datos entre 2.

• Determine qué clase contiene este valor. Por ejemplo, si n=50, 50/2 = 25, después determine qué clase contiene el 25° valor (la clase de la mediana).

3-22

Page 66: 2do material u2

EJEMPLO 10

• La clase de la mediana es 5 - 6, ya que contiene el 5° valor (n/2 = 5)

Películas exhibidas

Frecuencia Frecuencia acumulada

1-2 1 1

3-4 2 3

5-6 3 6

7-8 1 7

9-10 3 10

3-23

Page 67: 2do material u2

EJEMPLO 10 continuación

• De la tabla, L = 5, n = 10, f = 3, i = 2, FA = 3.

• Así, mediana = 5 + [((10/2) - 4)/3](2) = 6.33

3-24

Page 68: 2do material u2

Moda de datos agrupados

• La moda de los datos agrupados se aproxima por el punto medio de la clase que contiene la frecuencia de clase mayor.

• Las modas en el EJEMPLO 10 son 5.5 y 9.5. Cuando dos valores ocurren una gran cantidad de veces, la distribución se llama bimodal, como en el ejemplo 10.

3-25

Page 69: 2do material u2

Distribución simétrica

• sesgo cero moda = mediana = media

3-26

Page 70: 2do material u2

Distribución con asimetría positiva• sesgo a la derecha: media y mediana se

encuentran a la

derecha de la moda.

• moda < mediana < media

3-27

Page 71: 2do material u2

Distribución con asimetría negativa• sesgo a la izquierda: media y mediana

están a la izquierda de la moda.

• media < mediana < moda

3-28

Page 72: 2do material u2

NOTA

• Si se conocen dos promedios de una distribución de frecuencias con sesgo moderado, el tercero se puede aproximar.

• moda = media - 3(media - mediana)

• media = [3(mediana) - moda]/2

• mediana = [2(media) + moda]/3

3-29

Page 73: 2do material u2

Descripción de los datos: medidas de dispersión

OBJETIVOSAl terminar este capítulo podrá:UNO

Calcular e interpretar la amplitud de variación, la desviación media, la variancia, y la desviación estándar de los datos originales.

DOS Calcular e interpretar la amplitud de variación, la variancia y la desviación estándar de datos agrupados.

TRESExplicar las características, usos, ventajas y desventajas de cada medida de dispersión.

Page 74: 2do material u2

Descripción de datos: medidas de dispersión Continuación

CUATROEntender el problema de Chebyshev y la regla normal o empírica, y su relación con un conjuto de observaciones.

CINCO Calcular y explicar los cuartiles y la amplitud de variación intercuartílica.

SEISElaborar e interpretar los diagramas de caja.

SIETE Calcular y entender el coeficiente de variación y el coeficiente de asimetría.

Page 75: 2do material u2

Desviación media

• Desviación media: media aritmética de los valores absolutos de las desviaciones respecto a la media aritmética.

nXX

MD

4-3

Page 76: 2do material u2

EJEMPLO 1

• Los pesos de una muestra de cajas con libros en una librería son (en lb) 103, 97, 101, 106 y 103.

• X = 510/5 = 102 lb

• = 1 + 5 + 1 + 4 + 1 = 12

• MD = 12/5 = 2.4

• Por lo común los pesos de las cajas están a 2.4 lb del peso medio de 102 lb.

4-4

Page 77: 2do material u2

Variancia de la población

• La varianza de la población para datos no agrupados es la media aritmética de las desviaciones cuadráticas respecto a la media de la población.

2

2

( )X

N

4-5

Page 78: 2do material u2

EJEMPLO 2

• Las edades de la familia Dunn son 2, 18, 34, y 42 años. ¿Cuál es la variancia de la población?

X N/ /96 4 24

2 2 944 4 236 ( ) / /X N

4-6

Page 79: 2do material u2

Variancia poblacional continuación

• Una fórmula alternativa para la variancia poblacional es:

22

2 X

N

X

N( )

4-7

Page 80: 2do material u2

Desviación estándar poblacional

• La desviación estándar poblacional () es la raíz cuadrada de la variancia de la población.

• Para el EJEMPLO 2, la desviación estándar poblacional es 15.19 (raíz cuadrada de 230.81).

4-8

Page 81: 2do material u2

Varianza muestra

4-9

• La varianza muestra estima la variancia de la población.

1

)Σ(Σ

= =operativa Fórmula

1)(Σ

== conceptualFórmula

22

2

22

nnX

XS

nXX

S

Page 82: 2do material u2

EJEMPLO 3

• Una muestra de cinco salarios por hora para varios trabajos en el área es: $7, $5, $11, $8, $6. Encuentre la variancia.

X = 37/5 = 7.40 = 21.2/(5-1) = 5.3s2

4-10

Page 83: 2do material u2

Desviación estándar muestral

• La desviación estándar muestral es la raíz cuadrada de la variancia muestral.

• En el EJEMPLO 3, la desviación estándar de la muestra es = 2.30

4-11

Page 84: 2do material u2

Medidas de dispersión:datos no agrupados

• Para datos no agrupados, la amplitud es la diferencia entre los valores mayor y menor en un conjunto de datos.

• AMPLITUD = valor mayor - valor menor

• EJEMPLO 4: una muestra de cinco graduados de contaduría indicó los siguientes salarios iniciales: $22 000, $28 000, $31 000, $23 000, $24 000. La amplitud es $31 000 - $22 000 = $9 000.

4-12

Page 85: 2do material u2

Varianza muestral para datos agrupados

• La fórmula de la varianza para datos agrupados usada como estimador de la variancia poblacional es:

• donde f es la frecuencia de clase y X es el punto medio de la clase.

SfX

fX

nn

2

22

1

( )

4-13

Page 86: 2do material u2

Interpretación y usos de la desviación estándar

• Teorema de Chebyshev: para cualquier conjunto de observaciones, la proporción mínima de valores que está dentro de k desviaciones estándar desde la media es al menos 1 - 1/k , donde k2 es una constante mayor que 1 (uno).

4-14

Page 87: 2do material u2

Interpretación y usos de la deviación estándar

• Regla empírica: para una distribución de frecuencias simétrica de campana, cerca de 68% de las observaciones estará dentro de ±1 de la media (); cerca de 95% de las observaciones estará dentro de ±2 de la media (); alrededor de 99.7% estará dentro de ±3 de la media ().

4-15

Page 88: 2do material u2

© 2001 Alfaomega Grupo Editor

Curva en forma de campana que muestra la relación entre y

Page 89: 2do material u2

Dispersión relativa

• El coeficiente de variación es la razón de la desviación estándar a la media aritmética, expresada como porcentaje:

CVs

X (100%)

4-17

Page 90: 2do material u2

Asimetría

• Asimetría (sesgo) es la medida de la falta de simetría en una distribución.

• El coeficiente de asimetría se calcula mediante la siguiente fórmula:

3(media - mediana) desviación estándar

4-18

Sk =

Page 91: 2do material u2

Amplitud intercuartílica

• La amplitud intercuartílica es la distancia entre el tercer cuartil Q3 y el primer cuartil Q1.

• Amplitud intercuartílica = tercer cuartil - primer cuartil= Q3 - Q1

4-19

Page 92: 2do material u2

Primer cuartil• El primer cuartil es el valor correspondiente

al punto debajo del cual se encuentra el 25% de las observaciones en un conjunto ordenado de datos.

• donde L = límite de las clasese que contienen Q1, CF = frecuencia acumulda que precede a la clase que contiene a Q1, f = frecuencia de la clase que contiene Q1, i= tamaño de la clase que contiene Q1.

Q L

nCF

fi1

4

( )

4-20

Page 93: 2do material u2

Tercer cuartil

• El tercer cuartil es el valor correspondiente al punto debajo del cual se encuentra 75% de las observaciones en un conjunto ordenado de datos:

donde L = límite inferior de la clase que contiene a Q3, CF = frecuencia acumulada precedente a la clase que contiene a Q3, f = frequencia de la clase que contiene a Q3, i = tamaño de la clase que contiene a Q3.

)(43

+=3 if

CFn

LQ

4-21

Page 94: 2do material u2

Desviación cuartílica

• La desviación cuartílica es la mitad de la distancia entre el tercer cuartil, Q3, y el primero, Q1.

• QD = [Q3 - Q1]/2

4-22

Page 95: 2do material u2

EJEMPLO 5

• Si el tercer cuartil = 24 y el primer cuartil = 10, ¿cuál es la desviación cuartílica? La amplitud intercuartílica es 24 - 10 = 14; por lo tanto, la desviación cuartílica es 14/2 = 7.

4-23

Page 96: 2do material u2

Amplitud cuartílica

• Cada conjunto de datos tiene 99 porcentiles, que dividen el conjunto en 100 partes iguales.

• La amplitud cuartílica es la distancia entre dos porcentiles establecidos. La amplitud cuartílica 10 a 90 es la distancia entre el 10º y 90º porcentiles.

4-24

Page 97: 2do material u2

Fórmula para porcentiles

4-25

100)1+(=

PnLp

Page 98: 2do material u2

Diagramas de caja

• Un diagrama de caja es una ilustración gráfica, basada en cuartiles, que ayuda a visualizar un conjunto de datos.

• Se requieren cinco tipos de datos para construir un diagrama de caja: el valor mínimo, el primer cuartil, la mediana, el tercer cuartil, y el valor máximo.

4-26

Page 99: 2do material u2

EJEMPLO 6

• Con base en una muestra de 20 entregas, Marco’s Pizza determinó la siguiente información: valor mínimo = 13 minutos, Q1 = 15 minutos, mediana = 18 minutos, Q3 = 22 minutos, valor máximo = 30 minutos. Desarrolle un diagrama de caja para los tiempos de entrega.

4-27

Page 100: 2do material u2

EJEMPLO 6 continuación

mediana

mín Q1 Q3 máx

• 12 14 16 18 20 22 24 26 28 30 32

4-28