quinta sesion de aprendizaje -...

28
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICA FACULTAD DE INGENIERÍA ______________________________________________________________________________________________________ LECTURA 05 : MEDIDAS DE DISPERSIÓN Y DE FORMA TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de dispersión son aquellas que cuantifican el grado de concentración o de dispersión de los valores de la variable en torno de un valor central, generalmente la media aritmética. Las medidas de dispersión se utilizan para dos propósitos básicos: a) Para verificar la confiabilidad de los promedios y b) Para que sirva como base para el control de la variación misma. Las medidas de dispersión que se utilizan con mayor frecuencia son: Varianza. Desviación estándar. Coeficiente de variación. 1.1. Varianza Es una medida que cuantifica el grado de dispersión o de variación de los valores de una variable cuantitativa con respecto a su media aritmética. Si los valores tienden a concentrarse alrededor de su media, la varianza será pequeña. Si los valores tienen a distribuirse lejos de la media, la varianza será grande. La varianza calculada a partir de una muestra se denota por s 2 y referida a la población se denota por 2 σ o V [x]. La varianza se define como la media aritmética de los cuadrados de las desviaciones de los datos respecto a su media aritmética. La varianza es una medida de dispersión con unidades de medición al cuadrado: S/. 2 , $ 2 , km 2 , etc. La varianza siempre es positiva. 1.1.1. La varianza para datos agrupados: Se utiliza la siguiente fórmula: Para n 30 n ) x x ( s n 1 i 2 i 2 = - = _________________________________________ 1 Elaborado por : Mg. Carmen Barreto R. Fecha : Febrero 2010 Versión : 2

Upload: others

Post on 08-Sep-2019

7 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

LECTURA 05 : MEDIDAS DE DISPERSIÓN Y DE FORMA

TEMA 18: MEDIDAS DE DISPERSION

1. DEFINICIONLas medidas de dispersión son aquellas que cuantifican el grado de concentración o de dispersión de los valores de la variable en torno de un valor central, generalmente la media aritmética. Las medidas de dispersión se utilizan para dos propósitos básicos:a) Para verificar la confiabilidad de los promedios y b) Para que sirva como base para el control de la variación misma.Las medidas de dispersión que se utilizan con mayor frecuencia son:• Varianza.• Desviación estándar.• Coeficiente de variación.

1.1. VarianzaEs una medida que cuantifica el grado de dispersión o de variación de los valores de una variable cuantitativa con respecto a su media aritmética. Si los valores tienden a concentrarse alrededor de su media, la varianza será pequeña. Si los valores tienen a distribuirse lejos de la media, la varianza será grande.La varianza calculada a partir de una muestra se denota por s2 y referida a la población se denota por 2σ o V [x].La varianza se define como la media aritmética de los cuadrados de las desviaciones de los datos respecto a su media aritmética. La varianza es una medida de dispersión con unidades de medición al cuadrado: S/.2, $2, km2, etc. La varianza siempre es positiva.

1.1.1. La varianza para datos agrupados:Se utiliza la siguiente fórmula:

• Para n ≥ 30

n

)xx(s

n

1i

2i

2∑

=−

=

_________________________________________ 1Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

Page 2: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

• Para n < 30 [varianza de Cochran]

1n

)xx(s

n

1i

2i

2

−=

∑=

Ejemplo 1:Los siguientes datos corresponden a una muestra al azar de 8 clientes según su tiempo en minutos que han visitado la página de Internet Google:

Xi : 2.3, 4.5, 4.2, 3.2, 4.4, 2.1, 1.6, 4.3

Calcular e interpretar la varianza:

Solución:a) Para hallar la varianza primero debemos hallar el tiempo promedio de visia de los clientes:

utosmin3.38

6.268

xx

8

1ii

===∑

=

A continuación construiremos una tabla de trabajo para calcular la varianza:

i ix )xx( i − 2i )xx( −

1 2.3 -1.0 1.002 4.5 1.2 1.443 4.2 0.9 0.814 3.2 -0.1 0.015 4.4 1.1 1.216 2.1 -1.2 1.447 1.6 -1.7 2.898 4.3 1.0 1.00

Total 26.6 - 9.80

Donde:

80.9)xx(8

1i

2i =−∑

=

_________________________________________ 2Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

Page 3: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

Reemplazando dicho valor en la formula de la varianza de Cochran ya que n=8 < 30.

82

i2 2i 1

(x x)9.80s 1.4min utos

8 1 7=

−= = =

Interpretación: La variabilidad de los tiempos de visita de los clientes a la pagina Web Google respecto de su valor central es de 1.4 minutos2 .

1.1.2. La varianza para datos agrupados:Se utiliza la siguiente formula:

Ejemplo 2 :Los siguientes datos corresponden a 240 trabajadores de una Empresa “X” según su número de inasistencias:

N° de inasistencias

yi

N° de trabajadores

fi

3 105 307 1009 80

11 20 Total 240

Calcular e interpretar la varianza.

Solución: a) Hallando en primer lugar el número promedio de inasistencias:

_________________________________________ 3Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

m2

i i2 i 1

m2

i i2 i 1

(y y) fs ; para n 30

n

(y y) fs ; para n 30 (Varianza de Cochran)

n 1

=

=

− ×= ≥

− ×= <

Page 4: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

b) A continuación construiremos una tabla de trabajo para calcular la varianza:

yi fi

3 10 -4.58 20.98 209.85 30 - 2.58 6.66 199.87 100 - 0.58 0.34 34.09 80 1.42 2.02 161.611 20 3.42 11.70 234.0

Total 240 - - 0Donde:

Reemplazando dicho valor en la formula de la varianza para n=240 > 30.

Interpetración: La variabilidad de las inasistenicas es de 4 inasistencias2 respecto de su valor central.

_________________________________________ 4Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

5

i ii 1

y f1820y 7.58 inasistencias

240 240=

×= = =

i(y y)− 2i(y y)− 2

i i(y y) f− ×

25

i ii 1

(y y) f 839.2=

− × =∑

52

2 2 3 4 5i i2 1 1 2 2 3 3 4 4 5 5i 1

52

i i2 i 1

52

i i2 i 1

2

(y y) f(y y) f (y y) f (y y) f (y y) f (y y) fs

240 240

(y y) f20.98 10 6.66 30 0.34 100 2.02 80 11.70 20s

240 240

(y y) f209.8 199.8 34 161.6 234s

240 240

(ys

=

=

=

− ×− × + − × + − × + − × + − ×= =

− ×× + × + × + × + ×= =

− ×+ + + += =

=

52

i ii 1

52

i i2 2i 1

y) f839.2

240 240

(y y) fs 3.5 4 inasistencias .

240

=

=

− ×=

− ×= = ≅

Page 5: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

Ejemplo 3: La siguiente tabla corresponde a 280 trabajadores de una Empresa “X” según su edad en años:

Edad en en años

LI - LS

N° de trabajadoresfi

[25 - 30) 40 [30 - 35) 50 [35 - 40) 100 [40 - 45) 50 [45 - 50) 40 TOTAL 280

Calcular e interpretar la varianza.

Solución: Hallando en primer lugar el promedio:

A continuación construiremos una tabla de trabajo para calcular la varianza:

Li - Ls y fi

[25 - 30) 27.5 40 -10 100 4000 [30 - 35) 32.5 50 -5 25 1250 [35 - 40) 37.5 100 0 0 0 [40 - 45) 42.5 50 5 25 1250 [45 - 50) 47.5 40 10 100 4000

Total - 280 - - 10500

Donde:

Reemplazando dicho valor en la formula de la varianza para n=240 > 30.

_________________________________________ 5Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

5

i ii 1

y f10500y 37.5 años

280 280=

×= = =

25

i ii 1

(y y) f 10500=

− × =∑

i(y y)− 2i(y y)− 2

i i(y y) f− ×

Page 6: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

Interpetración: La variabilidad de las edades de los trabajadores es de 37.5 años 2

respecto de su valor central.

1.2. La desviación estándar o típicaSe define como la raíz cuadrada positiva de la varianza:

Es uno de los estadígrafos de dispersión de mayor uso, la cual se expresa en unidades reales de la variable, es decir ya no están elevadas al cuadrado. La desviación estándar, al igual que la varianza, es no negativa (s ≥ 0), puesto que es la raíz positiva de la varianza. A mayor dispersión le corresponderá una mayor desviación estándar.

_________________________________________ 6Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

52

2 2 3 4 5i i2 1 1 2 2 3 3 4 4 5 5i 1

52

i i2 i 1

52

i i2 i 1

52

i i2 i 1

(y y) f(y y) f (y y) f (y y) f (y y) f (y y) fs

280 280

(y y) f100 40 25 50 0 100 25 50 100 40s

280 280

(y y) f4000 1250 0 1250 4000s

280 280

(y y) fs

2

=

=

=

=

− ×− × + − × + − × + − × + − ×= =

− ×× + × + × + × + ×= =

− ×+ + + += =

− ×=

52

i i2 2i 1

1050080 280

(y y) fs 37.5 años

280=

=

− ×= =

ianzas var=

Page 7: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

Ejemplo 4:Calcular e interpretar la desviación estándar de los datos del Ejemplo 1.

Solución:

Interpretación: Los tiempos de visita de los clientes se alejan en promedio de su valor central en 1.95 puntos.

Ejemplo 5 :Calcular e interpretar la desviación del Ejemplo 2:

Solución:3.5 1.87 2 .= = ≅s inasistencias

Interpretación: Las asistencias de los trabajadores se dispersan o se alejan en promedio de su valor central en 2 inasistencias.

Ejemplo 6 :Calcular e interpretar la desviación del Ejemplo 3:

Solución:

Interpretación: Las edades de los trabajadores se dispersan o se alejan en promedio de su valor central en 6.12 años.

1.3. El coeficiente de variaciónEs una medida de dispersión relativa exenta de unidades y expresada en porcentaje, se utilizan para comparar la variación de dos distribuciones siempre que las variables se expresen en las mismas unidades de medida y sean aproximadamente del mismo tamaño promedio. Sin embargo, a veces es necesario comparar dos conjuntos de datos expresados en unidades diferentes (tales como soles y

_________________________________________ 7Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

s 1.4 1.2min utos= =

37.5 6.12 .= =s años

Page 8: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

kilogramos). En estos casos las medidas de dispersión absoluta no son comparables y deben utilizarse medidas de dispersión relativa.

El coeficiente de variación de un conjunto de datos se denota por c.v. y se expresa como:

Donde:

estándar Desviación s =

aritmética Mediay =

• Si c.v. ≤ 15%, los datos son homogéneos, es decir tienen una baja variabilidad.• Si c.v. > 15%, los datos son heterogéneos, es decir tienen una alta variabilidad.

Ejemplo 7:Calcular e interpretar el coeficiente de variación de los datos del Ejemplo 1:

Solución:

Interpretación: Las dispersiónes de los tiempos utilizados por los clientes en visitar la página Google respecto de su valor central son heterogéneos.

Ejemplo 8:Calcular e interpretar el coeficiente de variación de los datos del Ejemplo 2:

Solución:

_________________________________________ 8Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

100ys.v.c ×=

%15%4.361003.32.1.v.c >=×=

1.87. . 100 24.67% 15%7.58

c v = × = >

Page 9: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

Interpretación: Las dispersiones de las inasistencias de los trabajadores respecto de su valor central son heterogéneos.

Ejemplo 9:Calcular e interpretar el coeficiente de variación de los datos del Ejemplo 3:Solución:

Interpretación: Las dispersiones de las edades de los trabajadores respecto de su valor central son heterogéneos.

Ejemplo 10: Los siguientes datos corresponden a una muestra aleatoria de los gastos mensuales en soles de 7 estudiantes de administración:

Xi : 200, 250, 250, 400, 270, 300, 420

a) ¿Cuánto es la dispersión de los gastos mensuales respecto de su valor central?

b) ¿Son los gastos mensuales homogéneos?

Solución:a) Hallando en primer lugar el promedio:

7

ii 1

x2090x 298.57soles.

7 7== = =

b) A continuación construiremos una tabla de trabajo para calcular la varianza:

i ix )xx( i − 2i )xx( −

1 200 -98.57 9716.042 250 -48.57 2359.043 250 -48.57 2359.044 400 101.43 10288.045 270 -28.57 816.246 300 1.43 2.047 420 121.43 14745.24

Total 2090 - 40270

_________________________________________ 9Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

6.12. . 100 16.32% 15%37.5

= × = >c v

Page 10: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

Donde:7

2i

i 1

(x x) 40285.68=

− =∑Reemplazando dicho valor en la formula de la varianza de Cochran ya que n=7 < 30.

c) Hallando la desviación estándar :

s 6714.28 81.94 soles.= =

d) Hallando el coeficiente de variación:De acuerdo a las operaciones realizadas tenemos:

entonces:

Los gastos mensuales de los estudiantes no son homogéneos.

Ejemplo 11:Los siguientes datos corresponden a una muestra aleatoria de los ahorros mensuales en dólares de 5 clientes del Banco de Crédito del Perú:

Xi: 500, 550, 220, 340, 180

El gerente del Banco piensa hacer un aumento en la tasa de interés solo si los ahorros mensuales son regulares. ¿Qué decisión tomará el gerente del Banco.(Hallar coeficiente de variación).

_________________________________________ 10Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

72

i2 2i 1

(x x)40285.68s 6714.28 soles .

7 1 6=

−= = =

x 298.57 soles.

s 81.94 soles.

=

=

6.12. . 100 100 16.32% 15%37.5

= × = × = >sc vx

Page 11: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

Solución:a) Hallando en primer lugar el ahorro mensual promedio:

5

ii 1

x1790x 358dólares.

5 5== = =

b) A continuación construiremos una tabla de trabajo para calcular la varianza:

i ix )xx( i − 2i )xx( −

1 500 142 201642 550 192 368643 220 -138 190444 340 - 18 3245 180 -178 31684

Total 1790 - 108080

Donde:5

2i

i 1

(x x) 108080=

− =∑Reemplazando dicho valor en la formula de la varianza de Cochran ya que n=5 < 30.

c) Hallando la desviación estándar :

s 27020 164.38 dólares.= =

d) Hallando el coeficiente de variación:De acuerdo a las operaciones realizadas tenemos:

x 358 dólares.

s 164.38 dólares.

=

=

_________________________________________ 11Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

52

i2 2i 1

(x x)108080s 27020 dólares .

5 1 4=

−= = =

Page 12: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

entonces:

Los ahorros mensuales de los clientes son heterogéneos; es decir no son regulares. Por lo tanto el gerente del banco no subirá la tasa de interés. El gerente no subirá la tasa de interés ya que los ahorros mensuales no son regulares.

Ejemplo 12:Los siguientes datos corresponden a una muestra aleatoria de los ahorros mensuales en dólares de dos grupos de clientes del Banco Continental :

GRUPO 1 2 3 4 5 6 1 500 550 540 530 520 5502 400 450 500 460 450 470

¿En que grupo los ahorros son más estables? (Hallar coeficiente de variación)

Solución: Llevando acabo todo el proceso de cálculo del coeficiente de variación para cada uno de los grupos se obtiene los siguientes resultados:

● Para el Grupo 1 a) Hallando el ahorro mensual promedio para el Grupo 1:

6

ii 1

1

x3190x 531.67soles.

6 6== = =

b) Hallando la varianza:i ix

i(x x )− 2i(x x )−

1 500 -31.67 1002.992 550 18.33 335.993 540 8.33 69.394 530 -1.67 2.795 520 -11.67 136.196 550 18.33 335.99

Total 3190 - 28887

_________________________________________ 12Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

164.38. . 100 45.92% 15%358

= = × = >sc vx

Page 13: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

Donde:6

2i

i 1

(x x) 1883.34=

− =∑Reemplazando dicho valor en la formula de la varianza de Cochran ya que n=6 < 30.

c) Luego hallamos la desviación estándar :

1s 376.67 19.41 soles.= =

d) Finalmente hallamos el coeficiente de variación:

● Para el Grupo 2 a) Hallando el ahorro mensual promedio para el Grupo 2:

6

ii 1

2

x2730x 455soles

6 6== = =

b) Hallando la varianza:i ix

i(x x )− 2i(x x )−

1 400 -55 30252 450 -5 253 500 45 20254 450 -5 255 460 5 256 470 15 225

Total 2730 - 5350Donde:

62

ii 1

(x x) 5350=

− =∑Reemplazando dicho valor en la formula de la varianza de Cochran ya que

_________________________________________ 13Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

11

1

19.41. 100 3.65% 15%531.67

= = × = <sc vx

62

i2 2i 11

(x x)1883.34s 376.67 soles .

6 1 5=

−= = =

Page 14: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

n=6 < 30.

c) Luego hallamos la desviación estándar :

2s 1070 32.71 soles.= =

d) Finalmente hallamos el coeficiente de variación:

La siguiente tabla muestra los resultados obtenidos en forma resumida:

GRUPO x s .v.c1 531.67 19.41 3.65% < 15%2 455 32.71 7.19% <15%

Haciendo las comparaciones respectivas de los coeficientes de variación obtenidos, se observa que en el Grupo 1 los ahorros son más estables. Ejemplo 13:Los siguientes datos corresponden a dos muestras aleatorias de dos grupos de trabajdores según su sueldo mensual en soles:

GRUPO 1Sueldo mensual en soles

LI - LSN° de trabajadores

fi

[550 - 650) 40[650 - 750) 60[750 - 850) 100[850 - 950) 40 [950 - 1050) 20

Total 260

_________________________________________ 14Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

62

i2 2i 12

(x x)5350s 1070 soles .

6 1 5=

−= = =

21

2

32.71. 100 7.19% 15%455

= = × = <sc vx

Page 15: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

GRUPO 2Sueldo mensual en soles

LI - LSN° de trabajadores

fi

[750 - 850) 30[850 - 950) 50[950 - 1050) 80[1050 - 1150) 40[1150 - 1250) 10

TOTAL 210

¿Qué grupo tiene sueldos mensuales más homogéneos?Solución:Llevando acabo todo el proceso de cálculo del coeficiente de variación para cada uno de los grupos se obtiene los siguientes resultados:

● Para el Grupo 1 a) Hallando en primer lugar el promedio:

b) A continuación construiremos una tabla de trabajo para calcular la varianza:

Li - Ls yi fi

[550 - 650) 600 40 -176.92 31300.69 1252027.6[650 - 750) 700 60 -76.92 5916.69 355001.4[750 - 850) 800 100 23.08 532.69 53269.0[850 - 950) 900 40 123.08 15148.69 605947.6

[950 - 1050) 1000 20 223.08 49764.69 995293.8 Total 260 - - 0

Donde:

Reemplazando dicho valor en la formula de la varianza para n=260 > 30.

_________________________________________ 15Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

5

i ii 1

1

y f202000y 776.92 soles

260 260=

×= = =

25

i ii 1

(y y) f 3261539.4=

− × =∑

i(y y)− 2i(y y)− 2

i i(y y) f− ×

Page 16: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

c) Hallando la desviación estándar:

1s 12544.48 112.00 soles.= =

d) Hallando el coeficiente de variación:

● Para el Grupo 2a) Hallando en primer lugar el promedio:

b) A continuación construiremos una tabla de trabajo para calcular la varianza:

_________________________________________ 16Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

52

2 2 3 4 5i i2 1 1 2 2 3 3 4 4 5 5i 11

52

i i2 i 11

52

i i2 i 11

(y y) f(y y) f (y y) f (y y) f (y y) f (y y) fs

260 260

(y y) f31300.69 40 5916.69 60 53269.0 100 15148.69 40 49764.69 20s

260 260

(y y) f1252027.6 355s

260

=

=

=

− ×− × + − × + − × + − × + − ×= =

− ×× + × + × + × + ×= =

− ×+= =

52

i i2 i 11

52

i i2 2i 11

001.4 53269.0 605947.6 995293.8280

(y y) f3261539.4s

260 260

(y y) fs 12544.38soles

260

=

=

+ + +

− ×= =

− ×= =

11

1

s 112.00c.v 100 14.42% 15%776.92y

= = × = <

5

i ii 1

2

y f205000y 976.19 soles

210 210=

×= = =

Page 17: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

Li - Ls yi fi

[ 750 - 850) 800 30 -176.19 31042.92 931287.60 [ 850 - 950) 900 50 - 76.19 5804.92 290246.00 [ 950 - 1050) 1000 80 23.81 566.92 45353.60[1050 - 1150) 1100 40 123.81 15328.92 613156.80 [1150 - 1250) 1200 10 223.81 50090.92 500909.16

Total - 210 - - 2380953.16

Donde:

Reemplazando dicho valor en la formula de la varianza para n=210 > 30.

c) Hallando la desviación estándar:

1s 11337.87 106.48 soles.= =

_________________________________________ 17Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

25

i ii 1

(y y) f 2380953.16=

− × =∑

52

2 2 3 4 5i i2 1 1 2 2 3 3 4 4 5 5i 12

52

i i2 i 11

52

i i2 i 11

(y y) f(y y) f (y y) f (y y) f (y y) f (y y) fs

210 210

(y y) f31042.92 30 5916.69 60 566.92 80 15328.92 40 50090.92 10s

210 210

(y y) f931287.60 29024s

210

=

=

=

− ×− × + − × + − × + − × + − ×= =

− ×× + × + × + × + ×= =

− ×+= =

52

i i2 i 11

52

i i2 2i 11

6.00 45353.60 613156.80 500909.16210

(y y) f2380953.16s

210 210

(y y) fs 11337.87soles

210

=

=

+ + +

− ×= =

− ×= =

i(y y)− 2i(y y)− 2

i i(y y) f− ×

Page 18: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

d) Hallando el coeficiente de variación:

Llevando acabo todo el proceso de cálculo del coeficiente de variación para cada uno de los grupos se obtiene los siguientes resultados:

GRUPO x s .v.c1 776.92 112 14.42% < 15%2 976.19 106.47 10.91% <15%

Haciendo las comparaciones respectivas de los coeficientes de variación obtenidos, se observa que en el Grupo 2 los sueldos mensuales son más homogéneos.

TEMA 19: MEDIDAS DE FORMA

1. DEFINICIÓN:

Las medidas de forma son aquellas que permiten comprobar si una distribución de frecuencia tiene características especiales como simetría, asimetría, nivel de concentración de datos y nivel de apuntamiento que la clasifiquen en un tipo particular de distribución.

2. MEDIDAS DE ASIMETRIA:Son medidas que miden el grado de deformación horizontal de una serie de datos o de distribución de frecuencias.

Se dice que una distribución de frecuencias es simétrica, si los intervalos equidistantes del intervalo central tienen iguales frecuencias. También se dice que una distribución es simétrica si su curva de frecuencias es simétrica con respecto al centro de los datos.

Dos distribuciones pueden tener la misma media y la misma desviación estándar, pero pueden diferir en el grado de asimetría.

_________________________________________ 18Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

11

1

s 106.48c.v 100 10.91% 15%976.19y

= = × = <

Page 19: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

Si la distribución es simétrica, entonces la media, la mediana y la moda coinciden. En contraposición, si estos 3 promedios no coinciden la distribución es asimétrica.Entre las medidas de asimetría más usuales tenemos:

2.1. El Coeficiente de asimetría de Pearson:Se expresa como:

Si:AS = 0 La serie de datos o la distribución es simétrica. Ver fig. 1.AS > 0 La serie de datos o la distribución es asimétrica positiva

(sesgada a la derecha). Ver fig. 2.AS < 0 La serie de datos o la distribución es asimétrica negativa

(sesgada a la izquierda). Ver fig. 3.

_________________________________________ 19Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

3(x Me)Ass

−=

x Me Mdfig.2

= =

Distribución Asimétrica Positiva

Distribución Simétrica

Distribución Asimétrica Negativa

x Me Mdfig.3

< <Md Me x

fig. 1< <

Page 20: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

NOTA: Si As 0, entonces se dice que la distribución es aproximadamente simétrica o ligeramente sesgada. Será tanto más sesgada cuanto más As se aleje de cero.

Ejemplo 1:Calcular e interpretar el coeficiente de asimetría de los datos del Ejemplo 1 de la lectura anterior:

Solución:Utilizando el coeficiente de asimetría de Pearson :

s)Mex(3As −=

De los datos dados se ha obtenido:

Reemplazando en la fórmula obtenemos:

Interpretación: Este valor indica que la serie de tiempos de los clientes que visitan la página Google es asimétrica negativa.

Ejemplo 2:Hallar el coeficiente de asimetría de Pearson del Ejemplo 2 de la lectura de la sesión anterior:

Solución:

_________________________________________ 20Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

12.1

)7.33.3(3As −=−=

x 3.3min utos Me 3.7 min utos s 1.2 min utos

===

Page 21: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

Utilizando el coeficiente de asimetría de Pearson :

De los datos dados se ha obtenido:

Reemplazando en la fórmula obtenemos:

Interpretación: La distribución de trabajadores según su número de inasistencias es asimétrica positiva.

En el siguiente gráfico podemos observar que que hay mayor concentración de datos a la derecha:

_________________________________________ 21Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

3(7.58 7)As 0.931.87

−= =

y 7.58inasistenciasMe 7inasistenciass 1.87 inasistencias

==

=

0 3 5 7 9 11

100

80

60

40

20

Nº d

e tra

baja

dore

s

N° de inasistencias

3(y Me)Ass

−=

Page 22: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

Ejemplo 3:Hallar el coeficiente de asimetría de Pearson del Ejemplo 3 de la lectura:

Solución:Utilizando el coeficiente de asimetría de Pearson :

De los datos dados se ha obtenido:

Reemplazando en la fórmula obtenemos:

Interpretación: La distribución de trabajadores según su edad en años es simétrica.

En el gráfico se observa que en hay igual concentración de datos a la izquierda y derecha.

_________________________________________ 22Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

3(37.5 37.5)As 06.12

−= =

y 37.5 años.Me 37.5 años.s 6.12 años.

===

Page 23: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

2.1. MEDIDAS DE CÚRTOSIS:La cúrtosis es el grado de apuntamiento de una distribución. La cúrtosis se analiza amparando la distribución con la forma de una curva normal o simétrica, con igual media aritmética y desviación estándar de la distribución que se estudia.

Si una distribución tiene relativamente un elevado pico o apuntamiento, se llama leptocúrtica, mientras si es achatada se denomina platicúrtica. La distribución normal constituye una distribución mesocúrtica, tal como se puede ver en las siguientes figuras:

_________________________________________ 23Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

100

8 0

60

40

20

0

y Me Md= =

Nº d

e tr

abaj

ador

es

0 25 30 35 40 45 50 37.5

Edad en años

Page 24: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

Leptocúrtica Mesocúrtica Platicúrtica

El estadígrafo para analizar el apuntamiento es el coeficiente de cúrtosis y se expresa como:

4

4

Mks

=

Donde:4 2 2

2

m4

i i4 i 1

s (s )

s Varianza

(y y) fM

n=

=

=

− ×=

4M se llama: “cuarto momento respecto a la media”Si:

3=K , la distribución es normal o mesocúrtica.3<K , la distribución es platicúrtica.3>K , la distribución es leptocúrtica.

_________________________________________ 24Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

fig. 4 fig. 5 fig. 6

Page 25: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

Ejemplo 4:Calcular e interpretar el coeficiente de cúrtosis del Ejemplo 4 de la sesión anterior:

Solución: a) Hallando en primer lugar el promedio de los datos dados:

b) Luego se deben hallar las marcas de clases de cada intervalo, luego elevar a la cuarta, seguidamente multiplicar por su respectiva frecuencia y finalmente sumar los valores hallados en la última columna, tal como se muestra en la siguiente tabla:

yi fi

3 10 -4.58 440.01 4400.015 30 - 2.58 44.31 1329.307 100 - 0.58 0.11 11.009 80 1.42 4.07 325.6011 20 3.42 136.81 2736.20

Total 240 - - 36831Donde:

c) Luego hallamos los momentos de orden 4 (M4 ) :

_________________________________________ 25Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

5

i ii 1

y f1820y 7.58 inasistencias

240 240=

×= = =

i(y y)− 4i(y y)− 4

i i(y y) f− ×

45

i ii 1

(y y) f 8802.11=

− × =∑

54

i i4 i 1

54

i i4 i 1

54

i i4 i 1

54

i i4 4i 1

(y y) f440.01 10 44.31 30 0.11 100 4.07 80 136.81 20M

240 240

(y y) f4400.1 1329.30 11 325.60 2736.20M

240 240

(y y) f8802.11M

240 240

(y y) fM 36.68 inasistencias

240

=

=

=

=

− ×× + × + × + × + ×= =

− ×+ + + += =

− ×= =

− ×= =

Page 26: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

Además:

Por lo tanto el coeficiente de cúrtosis está dado por:4

4

Mks

36.68k12.25

k 2.99 3

=

=

= <

Interpretación: La distribución de trabajadores según su número de inasistencias es

platicúrtica.

Ejemplo 5:Calcular e interpretar el coeficiente de cúrtosis del Ejemplo 5 de la sesión anterior:

a) Hallando en primer lugar el promedio de los datos dados:

b) Luego se deben hallar las marcas de clases de cada intervalo, luego elevar a la cuarta, seguidamente multiplicar por su respectiva frecuencia y finalmente sumar los valores hallados en la última columna, tal como se muestra en la siguiente tabla:

_________________________________________ 26Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

5

i ii 1

y f10500y 37.5 años

280 280=

×= = =

2 2

4 4

s 3.5 inasistencias

Entonces :

s 12.25 inasistencias

=

=

Page 27: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

Li - Ls y fi

[25 - 30) 27.5 40 -10 10000 40000 [30 - 35) 32.5 50 -5 625 1250 [35 - 40) 37.5 100 0 0 0 [40 - 45) 42.5 50 5 625 1250 [45 - 50) 47.5 40 10 10000 40000

Total - 280 - - 82500Donde:

c) Luego hallamos los momentos de orden 4 (M4 ) :

Además:

Por lo tanto el coeficiente de cúrtosis está dao por::

_________________________________________ 27Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

i(y y)− 4i(y y)− 4

i i(y y) f− ×

45

i ii 1

(y y) f 82500=

− × =∑

54

i i4 i 1

54

i i4 i 1

54

i i4 i 1

54

i i4 4i 1

(y y) f10000 40 625 50 0 100 625 50 10000 40M

280 280

(y y) f40000 1250 0 1250 40000M

280 280

(y y) f82500M

280 280

(y y) fM 294.64años

280

=

=

=

=

− ×× + × + × + × + ×= =

− ×+ + + += =

− ×= =

− ×= =

2 2

4 4

s 37.5 años

Entonces :

s 1406.25 años

=

=

Page 28: QUINTA SESION DE APRENDIZAJE - files.uladech.edu.pefiles.uladech.edu.pe/docente/32765808/ESTADVI/SESION 05/LEC05.pdf · TEMA 18: MEDIDAS DE DISPERSION 1. DEFINICION Las medidas de

Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________

La distribución de trabajadores según su edad de años es platicúrtica.

_________________________________________ 28Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2

4

4

Mks

294.64k1406.25

k 0.21 3

=

=

= <