medidas de dispersion y ejercicios

13
MEDIAS DE DISPERSION VARIANZA La varianza es una medida de variabilidad que utiliza todos los datos. Esta basada en la diferencia entre los valores de cada observación ( xi) y la media. (x para una muestra, m para una población). La varianza es el promedio de las diferencias al cuadrado entre cada valor de dato y la media. Si el conjunto de DATOS ES UNA MUESTRA, la varianza se denota por s2. CUANDO LOS DATOS SON AGRUPADOS Si el conjunto de DATOS ES UNA MUESTRA, la varianza es: Si el conjunto de DATOS ES UNA POBLACIÓN, la varianza se denota por 2. CUANDO LOS DATOS SON AGRUPADOS Si el conjunto de DATOS ES UNA POBLACIÓN, la varianza es: DESVIACION ESTANDAR La desviación estándar de un conjunto de datos es la raíz cuadrada positiva de la varianza. Se mide en las mismas unidades que los datos, haciéndola mas comparable, que la variancia, a la media. Si el conjunto de DATOS ES UNA MUESTRA, la desviación estándar se denota por s. Prof. Gabriel Matos Estadística Aplicada. 2 2 ( ) x N i s x i x n 2 2 1 ( ) s 2 = f i ( X i −¯ x ) 2 n1 σ 2 = f i ( X i μ ) 2 N

Upload: gabriel-matos

Post on 18-Jun-2015

50.684 views

Category:

Documents


4 download

DESCRIPTION

Guia didactica para la resolucion de ejercicios de medidas de dispersion con la inclusion de ejercicios propuestos.

TRANSCRIPT

Page 1: Medidas de dispersion y ejercicios

MEDIAS DE DISPERSION

VARIANZA La varianza es una medida de variabilidad que utiliza todos los datos. Esta basada en la diferencia entre los valores de cada observación (xi) y la media. (x para una

muestra, m para una población). La varianza es el promedio de las diferencias al cuadrado entre cada valor de dato y la media. Si el conjunto de DATOS ES UNA MUESTRA, la varianza se denota por s2.

CUANDO LOS DATOS SON AGRUPADOS Si el conjunto de DATOS ES UNA MUESTRA, la varianza es:

Si el conjunto de DATOS ES UNA POBLACIÓN, la varianza se denota por 2.

CUANDO LOS DATOS SON AGRUPADOS Si el conjunto de DATOS ES UNA POBLACIÓN, la varianza es:

DESVIACION ESTANDAR

La desviación estándar de un conjunto de datos es la raíz cuadrada positiva de la varianza. Se mide en las mismas unidades que los datos, haciéndola mas comparable, que la variancia, a

la media. Si el conjunto de DATOS ES UNA MUESTRA, la desviación estándar se denota por s.

Si el conjunto de DATOS ES UNA POBLACIÓN, la desviación estándar se denota por (sigma).

COEFICIENTE DE VARIACION

Prof. Gabriel MatosEstadística Aplicada.

22

( )x

Ni

sxi x

n2

2

1

( )

s2=∑ f i(X i− x̄ )2

n−1

σ2=∑ f i (X i−μ )2

N

s=√s2

σ=√σ2

Page 2: Medidas de dispersion y ejercicios

El coeficiente de variación indica que tan grande es la desviación estándar rn relación al promedio.

Si un conjunto de datos es una muestra, el coeficiente de variación se calcula como sigue:

Si un conjunto de datos es una población, el coeficiente de variación se calcula como sigue:

Mide la variación relativa de la variable con respecto a su promedio. Cuando deseamos comparar la dispersión de dos distribuciones, necesitamos medir la magnitud

de la desviación estándar en relación con la magnitud de la media Expresa a la variación de los datos como porcentaje de su promedio.

Las medidas de forma son: Sesgo

Es el grado de asimetría que tiene la distribución Una curva insesgada tiene sesgo cero Medimos en cuánto se aleja la distribución de una insesgada: Si el polígono de frecuencias tiene la mayor acumulación a la izquierda, tiene sesgo

positivo o a la derecha. Si el polígono de frecuencias tiene la mayor acumulación a la derecha, tiene sesgo

negativo o a la izquierda

Coeficiente de Asimetría

Sesgo

= 0No hay sesgo. La distribución es insesgada

> 0La distribución tiene sesgo positivo o a la derecha.

< 0La distribución tiene sesgo negativo o a la izquierda.

Curtosis Mide qué tan “puntiaguda” es una distribución, con respecto a la Normal. La distribución Normal se considera mesocúrtica, es el término medio. Las distribuciones mas puntiagudas que la Normal se llaman leptocúrticas Las distribuciones menos puntiagudas que la Normal se conocen como

platocúrticas

Prof. Gabriel MatosEstadística Aplicada.

sx̄(100 )

σμ(100)

Page 3: Medidas de dispersion y ejercicios

Leptocúrtica

Mesocúrtica

Platocúrtica

Función Curtosis Curtosis

= 3 Mesocúrtica

> 3 Leptocúrtica

< 3 Platocúrtica

TEOREMA DE CHEBYSHEV

Al menos (1 - 1/k2) de los elementos en un conjunto de datos estará dentro de las k desviaciones estándar del promedio donde k es cualquier valor mayor que 1.

• Al menos 75% de los elementos deben estar entre k = 2 desviaciones estándar de la media.

• Al menos 89% de los elementos deben estar entre k = 3 desviaciones estándar de la media.

Al menos 94% de los elementos deben estar entre k = 4 desviaciones estándar de la media.

Cualquiera que sea la forma de la distribución de los datos: al menos el 75% de los valores (población) caerán dentro de 2 desviaciones estándar respecto

de la media de la distribución:

al menos el 89% de los valores (población) caerán dentro de 3 desviaciones estándar respecto de la media de la distribución:

1) EJEMPLO   RESUELTO

Prof. Gabriel MatosEstadística Aplicada.

( X̄±2S )

( X̄±3S )

Page 4: Medidas de dispersion y ejercicios

El número de diás necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de iguales características han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 días. Calcular la media, mediana, moda, varianza y desviación típica.

SOLUCIÓN:

  La media: suma de todos los valores de una variable dividida entre el número total de datos de los que se dispone:

 La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia:

15, 21, 32, 59, 60, 60,61, 64, 71, 80.

Como quiera que en este ejemplo el número de observaciones es par (10 individuos), los dos valores que se encuentran en el medio son 60 y 60. Si realizamos el cálculo de la media de estos dos valores nos dará a su vez 60, que es el valor de la mediana.

La moda: el valor de la variable que presenta una mayor frecuencia es 60

La varianza S2: Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución.

Sx2=

 La desviación típica S: es la raíz cuadrada de la varianza.

S = √ 427,61 = 20.67

 El rango: diferencia entre el valor de las observaciones mayor y el menor

80 - 15 = 65 días

 El coeficiente de variación: cociente entre la desviación típica y el valor absoluto de la media aritmética

Prof. Gabriel MatosEstadística Aplicada.

Page 5: Medidas de dispersion y ejercicios

CV = 20,67/52,3 = 0,39

2)   EJEMPLO

   El precio de un interruptor magentotérmico en 10 comercios de electricidad de una ciudad son : 25, 25, 26, 24, 30, 25, 29, 28, 26, y 27 Euros. Hallar la media, moda, mediana, (abrir la calculadora estadística, más abajo) diagrama de barras y el diagrama de caja.

SOLUCIÓN:

(Utilizar la calculadora de debajo)

3) EJERCICIO RESUELTO

Prof. Gabriel MatosEstadística Aplicada.

Page 6: Medidas de dispersion y ejercicios

Obtener la varianza y desviación estándar de la siguiente muestra, que nos indica el número de cigarros que

son consumidos en promedio al día por un conjunto de 20 encuestados. 

2 4 10 6 0 4 1 0 3 6

10 2 4 2 3 2 5 5 8 0

La media es igual a 85.3

20

77

n

xx i

a continuación reportamos la tabla de la diferencia de cuadrados 2xxi  :

3.4225 0.0225 37.8225 4.6225 14.8225 0.0225 8.1225 14.8225 0.7225 4.6225

37.8225 3.4225 0.0225 3.4225 0.7225 3.4225 1.3225 1.3225 17.2225 14.8225

 Por lo que

5915.8

20

83.1712

2

n

xxS i

por lo para determinar la desviación estándar basta con obtener la raíz cuadrada, con lo que finalmente la

desviación estándar es igual a: 

6554.0S cigarros.

4) EJERCICIO RESUELTO

A continuación se le dan los resultados de una evaluación de Química aplicada a un grupo de alumnos de 9no grado. Encuentre: a) la Media Aritmética (Promedio) b)la Varianza c) la Desviación Típica

9 14 18 20 13 1411 10 10 15 9 1512 11 10 19 12 1215 16 12 7 13 1317 16 14 15 17 11

PASO 1: Sume todos los valores y divida entre el número de sumandos: X = 400 / 30= 13,333...

PASO A REALIZARINTERVALO DE

CLASE

Prof. Gabriel MatosEstadística Aplicada.

Page 7: Medidas de dispersion y ejercicios

2) Elabore unaDistribución Agrupada

de frecuencias conuna amplitud de 3(por ejemplo) para

cada intervalo.

18 - 2015 – 1712 - 149 - 116 - 8

PASO A REALIZARINTERVALO DE CLASE

Xi

3) Agregue lacolumna de lamarca de clase

18 - 2015 – 1712 – 149 - 116 - 8

191613107

PASO A REALIZARINTERVALO DE CLASE

Xi fi

4) Agregue lacolumna de las

frecuencias y efectúela sumatoria

18 - 20 19 315 – 17 16 812 – 14 13 109 - 11 10 76 - 8 7 2

∑ = 30

PASO A REALIZARINTERVALO DE CLASE

Xi fi Xi*fi

5) Calculemos la MediaAritmética. Revisa la

lección correspondiente aMedia aritmética de datos

agrupados

18 - 20 19 3 57

15 – 17 16 8 128

12 – 14 13 10 130

9 - 11 10 7 70

6 - 8 7 2 14

∑ = 30 399

X = 399 / 30= 13,3. Observa que el Resultado obtenido difiere del resultado exacto (13.3333...)Recuerda: Al menos que sea necesario, nunca agrupes para calcular la media aritmética:

PASO A REALIZARINTERVALO DE CLASE

Xi fi Xi*fi fi*(x – xi)2

6) Construyamosla columna fi*(x – xi)2

18 - 20 19 3 57 97,4715 – 17 16 8 128 58,3212 – 14 13 10 130 0,99 - 11 10 7 70 76,236 - 8 7 2 14 79,38

∑ = 30 399 312,3

Prof. Gabriel MatosEstadística Aplicada.

Page 8: Medidas de dispersion y ejercicios

Dividamos la sumatoria de esta última columna entre la sumatoria de fi: s2 = 312,3/30La Varianza vale s2 = 10,41; Para la Desviación Típica (s), sacamos la raíz cuadrada de la varianza: La Desviación Típica vale s = 3,2265

EJERCICIOS MEDIDAS DE DISPERSIÓN PARA RESOLVER

1) La siguiente tabla presenta el tiempo (en minutos) que se demora un fiscalizador del S.I.I en resolver inconsistencias en los formularios de la declaración de la Renta.

Intervalo Fi40 - 4545 – 5050 - 5555 - 6060 - 6565 - 7070 - 7575 - 80

710151318211610

a) Calcule el tiempo medio que se demoran los fiscalizadores.b) Calcule la varianza de los tiempos y su desviación típica.c) Se implementa un software que promete reducir en un 25% los tiempos de las declaraciones.

¿Cuál es el nuevo promedio y la nueva varianza de los tiempos?

2) La varianza de dos números es 1 y su media aritmética es 8. Calcule los números.

3) En una empresa donde los salarios por hora tienen una media de $70 y una desviación estándar de $15, el sindicato solicita que cada salario xi se transforme en yi mediante la siguiente relación.

yi = 1,3xi + 10

El directorio acoge parcialmente la petición, rebajando los salarios resultantes yi en un 10%, lo que es aceptado por el sindicato. Se pide calcular la media aritmética y la varianza de la distribución final de los salarios.

6) La siguiente distribución, corresponde a las notas finales obtenidas por un curso de 30 personas en un curso de estadística:

Xi Fi

1 32 63 74 75 36 07 4

Calcule:Prof. Gabriel MatosEstadística Aplicada.

Page 9: Medidas de dispersion y ejercicios

a) Varianza, desviación estándar y coeficiente de dispersión de las notasb) Cuantifique la simetría en la distribución de las notas

8) Los ingresos mensuales en miles de pesos de un grupo de personas son los siguientes:

Ingresos Fi Fabac200-250 2250-300300-350 12 22350-400 29400-450 34450-500 4500-550

a) Coloque las cifras que faltanb) Calcule la media aritmética de los ingresos.

12) La siguiente tabla presenta las notas obtenidas en una prueba por un curso de 20 personas

4,0 3 4,3 3,1 3,9 4,5 4,8 3,6 2,1 4,53,0 2,7 4,5 3,4 4,2 2,5 1,9 4,3 3,6 1,1

a) Determine la media y la mediana de las notas del curso (3,45 pts.; 3,6pts)b) El profesor considera que las notas son demasiado bajas y por ello propone elevarlas mediante

la siguiente función:y i=1,2 x i+0,5

Determine el nuevo promedio de notas: (4,64 pts.)

13) La siguiente tabla muestra el salario de 100 trabajadores en miles de pesos

SALARIO Fi

100 – 110110 – 120120 – 130130 – 140140 - 150

822401812

a) Calcule el salario promedio de los trabajadores.b) Calcule la varianza de los salariosc) Si la empresa donde trabaja, les ofrece un aumento de remuneraciones que permitirán a ellos

$10.000 más o un aumento del 10%d) Recalcule la varianza en razón a los aumentos expuestos

Prof. Gabriel MatosEstadística Aplicada.

Page 10: Medidas de dispersion y ejercicios

14) La siguiente tabla muestra la distribución de las edades según el sexo de los trabajadores de una empresa

EDADHOMBRE MUJER

21 – 2525 – 3535 – 4545 - 60

2536025

3603718

a) Calcule el promedio ponderado del hombre y la mujerb) Calcule la varianza y desviación estándar de ambos

15) En una clase hay 35 estudiantes varones con una edad media de 17. 5 años y 15 estudiantes mujeres las que en promedio son 12% más Jóvenes. ¿Cuál es la edad media de la clase?

16) Sumando 5 a cada número del conjunto 3, 6, 2, 1, 7, 5, obtenemos 8, 11, 7, 6, 12, 10. Probar que ambos conjuntos de números tienen la misma desviación típica pero diferentes medias ¿Cómo están relacionadas las medias?

17) El retraso en la entrega de los últimos 100 pedidos de material informático en una empresa se ha agrupado en 4 intervalos, recordándose solo los siguientes datos de la distribución:

El primer intervalo tiene 6 días como extremo superior, una frecuencia relativa de 0,2 y una amplitud de 4 días.

En el segundo intervalo se acumulan 60 entregas retrasadas. Las marcas de clases del segundo y cuarto intervalo son 8 y 50 días, respectivamente. El tercer intervalo presenta una frecuencia de 30 entregas retrasadas y una amplitud de 30 días.

a) Construya la tabla de distribución de frecuencia del tiempo de retraso en las entregas. b) ¿Cuál es el tiempo medio de demora en las entregas? c) Calcular la mediana, moda, varianza, desviación estándar, el coeficiente de variación d) ¿Entre qué valores se encuentra el 50% central del tiempo de retraso en las entregas? e) Si descontamos el 15% del tiempo de retraso menos en las entregas y el 15% del tiempo de

retraso máximo en las entregas. ¿ En qué intervalo de puntuaciones se encuentran los restantes?

Prof. Gabriel MatosEstadística Aplicada.