clase 2 4 medidas estadísticas - dispersión

Post on 21-Jul-2015

266 Views

Category:

Education

4 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Estadística y probabilidad

Santiago de Chile 2013

Profesor Rubén Rodríguez A. Física y Matemáticas

Repaso:

Tendencia central: punto medio de una distribución.

Dispersión: separación de los datos en una distribución.

Sesgo: Las curvas representan los datos puntuales de un conjunto de datos que pueden ser simétricas o sesgadas.

Curtosis: Cuando se mide la curtosis de una distribución, se mide qué tan puntiaguda es.

Sueldos mensuales iniciales en una muestra de 12 recién egresados de la carrera de administración

Egresado Sueldo mensual inicial

Egresado Sueldo mensual inicial ($)

1 1690500 7 1710100

2 1739500 8 1827700

3 1788500 9 1734600

4 1705200 10 1923250

5 1643950 11 1724800

6 1621900 12 1705200

𝑥 = 𝑥𝑖

𝑘𝑖=1

𝑛=𝑥1+𝑥2+⋯𝑥12

12=

1690500 +1739500 +⋯+1705200 12

=

1734600

Para la media poblacional es lo mismo excepto la notación:

𝜇 = 𝑥𝑖

𝑁

En una empresa en la que hay 80 empleados, 60 ganan 4900 pesos chilenos por hora y 20 ganan 6370 por hora.

a) Determinar el sueldo medio por hora

𝑋 = 𝑓𝑋

𝑛=

60 4900 +(20)(6370)

60+20=

Las desviaciones de los números dados respecto al 9 son -4, -1, 2, 0, 3, -3, 5 y 1. Calcule la media aritmética para datos agrupados.

𝑋 = 𝐴 + 𝑑

𝑁=9 +

3

8=

Mediana para los sueldos… 1621900 1643950 1690500 1705200 1705200 1710100 1724800 1734600 1739500 1827700 1788500 1923250

Los valores de en medio

La mediana es el promedio de estos dos valores

𝑀𝑒𝑑𝑖𝑎𝑛𝑎 =1710100 + 1724800

2= 1717450

A partir de los datos de la siguiente la mediana es un peso tal que la mitad del total de las frecuencias (40/2=20) quede por encima de él y la mitad del total de las frecuencias quede por debajo de él.

Peso (lb) Frecuencias

118-126 3

127-135 5

136-144 9

145-153 12

154-162 5

163-171 4

172-180 2

Total 40

-- la suma de las tres primeras frecuencias de clases es 3+5+9=17. Por tanto, para dar la frecuencia 20, que es la buscada, se necesitan tres más de los 12 casos que pertenecen a la cuarta clase.

-- como el cuarto intervalo de clase, 145-153, en realidad corresponde a los pesos desde 144.5 hasta 153.5, la mediana debe encontrase a 3/12 entre 144.5 y 153.5.

L1=frontera inferior de clase de la clase mediana =144.5

N=número de datos=40

𝑓1 = 3 + 5 + 9 suma de todas las frecuencias de todas las clases anteriores a la clase mediana.

𝑓𝑚𝑒𝑑𝑖𝑎𝑛𝑎 =frecuencia de la clase mediana=12

C=amplitud del intervalo de la clase mediana=9

Mediana=𝐿1 + (𝑁

2 − 𝑓 1

𝑓𝑚𝑒𝑑𝑖𝑎𝑛𝑎)𝑐

La moda en los sueldos es lámina 6 es:

El valor que se presenta con mayor frecuencia: 1705200

Emplear la fórmula empírica media-moda=3(media-mediana) para hallar el salario modal de los 65 empleados de la empresa P&R sabiendo que la media es =131130.70 pesos chilenos y mediana =136710.66.

Encontrar: a) la media geométrica y b) la media aritmética de los números 3,5,6,6,7,10 y 12. Se supone que los números son exactos.

Cuartiles, deciles y percentiles

Aporta información acerca de la dispersión de los datos en el intervalo que va del menor al mayor valor de los datos.

Por ejemplo la mediana divide en dos partes iguales a los datos.

-- Sean 𝑄1, 𝑄2 𝑦 𝑄3 el primer, segundo y tercer cuartil (dividen los datos en cuatro partes iguales); 𝑄2 coincide con la mediana.

-- Los deciles dividen al conjunto de datos en diez partes iguales 𝐷1,𝐷2, … , 𝐷𝑔.

-- Los valores que dividen al conjunto en 100 partes iguales son los percentiles 𝑃1, 𝑃2 , …, 𝑃𝑔𝑔

Calculo de los cuartiles para datos no agrupados:

𝑘 𝑛 + 1

4, 𝑘 = 1,2,3 𝑦 4

Donde:

n= número de observaciones

K=cuartil

Cálculo de cuartiles para datos agrupados

𝑄𝑘 = 𝐿𝑖 +𝐿𝑓 − 𝐿𝑖

4, 𝑐𝑜𝑛 𝐾 = 1,2,3 𝑦 4

Donde:

𝑄𝑘=cuartil k,

𝐿𝑖=límite inferior,

𝐿𝑓=límite superior.

Ejercicio:

Considere las siguientes temperaturas (en grados Celcius) reportadas en un experimento:

25 28 25 26 28 28

35 32 31 31 32 27

25 29 26 28 27 28

30 30 31 31 30 31

Calcular :

a) La posición del primer cuartil,

b) La posición del segundo cuartil,

c) La posición del tercer cuartil.

Nota: Puedes interpolar para encontrar el valor correcto a la posición de los cuartiles.

Cálculo de Deciles

En primer lugar se busca donde se encuentra 𝑘𝑁

10, 𝑝𝑎𝑟𝑎 𝑘 = 1,2,3,4, … 9, en la tabla de

frecuencias acumuladas.

𝐷𝑘 = 𝐿𝑘 +

𝑘𝑁10

− 𝐹𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎(𝑘−1)

𝑓𝑖𝑐

Para datos no agrupados

Donde:

𝐿𝑘=límite inferior de la clase del decil k

N= número de datos

𝐹𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎(𝑘−1)=Frecuencia acumulada de la

clase que antecede a la clase del decil k.

𝑓𝑘=frecuencia de la clase del decil k

c=longitud del intervalo de la clase del decil k.

Ejercicio: Calcular los deciles de la distribución siguiente:

f

[50,60) 8

[60,70) 10

[70,80) 16

[80,90) 14

[90,100) 10

[100,110) 5

[110,120) 2

Cálculo de percentiles

Para datos agrupados:

𝑃𝑘 = 𝐿𝑘 +𝑘

𝑛100

− 𝐹𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎(𝑘−1)

𝑓𝑘𝑐

Para datos no agrupados:

𝑘𝑛

100

Ejercicio:

Determinar el primer cuartil, el séptimo decil y el 30 percentil, de la siguiente tabla de salarios:

Salarios Número de empleados

200000-299000 85

300000-299000 90

400000-499000 120

500000-599000 70

600000-699000 62

700000-800000 36

Desviación media 𝐷𝑚

Es la división de la sumatoria del valor absoluto de las distancias existentes entre cada dato y su media aritmética y el número de total de datos:

𝐷𝑚 = 𝑋𝑖 − 𝑋 𝑛

𝑖=1

𝑛

**Este indicador muestra que tan disperso se encuentran un

conjunto de datos a un punto de concentración.

Ejercicio:

Halar la desviación media en la siguiente distribución de frecuencias:

Clases f

8-10 3

11-13 6

14-16 9

17-19 11

20-22 5

Desviación Estándar 𝜎

La desviación estándar es la raíz cuadrada de los cuadrados de las desviaciones de los valores de la variable respecto a su media:

𝜎 = 𝑋𝑖−𝑋 2𝑛

𝑖=1

𝑛

**Mide la dispersión de un grupo o población (indica si la población esta muy dispersa respecto de la media) una desviación estándar pequeña indica que la población está muy compacta alrededor de la media.

Varianza 𝜎2

Mide la mayor o menor dispersión de los valores de la variable respecto a la media aritmética.

Se define como el cuadrado de la desviación estándar: v=𝜎2

Ejercicio:

Hallar la desviación estándar y la varianza de la siguiente serie de datos: 10, 18, 15, 12, 3, 6, 5, 7.

Ejercicio:

Hallar la desviación estándar y la varianza para la siguiente distribución de frecuencias.

clases f

10-15 2

16-21 8

22-27 13

28-33 10

34-39 6

Próxima clase:

Contenidos:

-- Coeficiente de variación

-- Diagramas de dispersión

-- Covarianza

-- Correlación

-- Regresión lineal por covarianza

-- Regresión lineal por mínimos cuadrados

-- Sesgos, momentos y curtosis

top related