4 medidas de posición

41
Estadísticos Definición: Valores que resumen el comportamiento (distribución) de una variable, o la relación (asociación) entre dos o mas variables. Estadísticos que resumen el comportamiento de una variable: Medidas de Posición (Media, Mediana, Moda), Medidas de dispersión (Desvío Estandar, Varianza, Coef. de Variación, Rango intercoartilico).

Upload: cardozoan

Post on 12-Jun-2015

3.041 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 4 medidas de posición

EstadísticosDefinición: Valores que resumen el

comportamiento (distribución) de una variable, o la relación (asociación) entre dos o mas variables.

Estadísticos que resumen el comportamiento de una variable: Medidas de Posición (Media, Mediana, Moda), Medidas de dispersión (Desvío Estandar, Varianza, Coef. de Variación, Rango intercoartilico).

Page 2: 4 medidas de posición

Medidas de Posición – LA MODA

La moda, es aquel valor de la variable que más se repite.

Page 3: 4 medidas de posición

Medidas de Posición – LA MODA

• La moda puede ser única, si la frecuencia mayor es única.

• Puede haber mas de una, en caso de que la frecuencia mayor se repita.

• Puede no existir, en caso de que no halla valores repetidos (esto último en datos acumulados no es verificable).

Page 4: 4 medidas de posición

Medidas de Posición – LA MODA

Miremos los siguientes conjuntos a)2 5 7 9 9 9 11 11 Tiene moda 9b)3 8 10 12 15 16 19 No tiene modac) 2 4 4 4 4 5 5 7 7 7 7 9 Tiene 2 modas

Los conjuntos que tienen una moda se llaman unimodales y los conjuntos que tienen 2 modas se llaman bimodales.

Page 5: 4 medidas de posición

LA MODA en datos acumulados

Distribución de Frecuencias

Categorías (en años) FA

1 18

2 32

3 12

4 10

5 9

81

POLIGONO DE FRECUENCIAS

•La Categoría que presenta la moda se llama Categoría Modal.

En un polígono de frecuencia la moda corresponde al punto más alto.

Page 6: 4 medidas de posición

Variables Continuas – LA MODA

En variables continuas habitualmente hablamos de Intervalo Modal.

Intervalos Marcas de clase

Frecuencias Absolutas

(58-62] 60 5

(62-66] 64 18

(66-70] 68 42

(70-74] 72 27

(74-78] 76 8

100

iiiii

iii a

nnnn

nnlModa

11

11 46,684

27421842

184266

Moda

Page 7: 4 medidas de posición

Medidas de Posición – LA MEDIA

La Media X� (promedio): El valor que hubiera tomado cada individuos si el total de los puntajes se hubiera distribuido equitativamente entre todos los individuos.

Consiste en sumar los valores de los individuos y dividirlos entre la cantidad de individuos.

x = x₁ + x₂+…………xn → DATOS SIN AGRUPAR N

Los valores observados en cada individuo son los valores que toman los individuos en la variable x₁ + x₂+…………+xn y el número de observaciones, ó número de individuos es N.

Page 8: 4 medidas de posición

Propiedades de la Media (1)• La suma de las distancias a la media = 0

x de 5; 10, 15 = 5+10+15 = 10 3

5-10 = -510-10 = 015-10 = 5 -5 + 0 + 5 = 0

01

N

i

xxi

Page 9: 4 medidas de posición

Propiedades de la Media (2)• La media de una suma de variables = la suma de las medias

de cada variable.

+ y + = 10+16+25=51x� z�x (5,10,15) / = 5; 10; 15 = 10xy (8,16,24)/ y = 8; 16; 24 = 16z (14,28,33)/ = 14; 28; 33 = 25z Media de (x+y+z) = (5+8+14)+(10+16+28)+(15+24+33) 3

Media de x+y+z = 27+54+72 = 153 = 51 3 3

Page 10: 4 medidas de posición

Propiedades de la Media (3)

Si un conjunto de observaciones x₁, x₂………xn tienen desviaciones respecto de un número A dadas por:

Entonces tenemos que: la media del conjunto es igual a A + el promedio de la sumatoria de las distancias al punto.

AxdAxdAxd NN ,..., , 2211

N

dAx

N

ii

1

Page 11: 4 medidas de posición

Propiedad 3

2 4 7 A= 9 11 Suma de distancias -32-9= -74-9=-5 -7-5-2+2 = -127-9=-2 -12/4=-311-9=2 = 9-3 = 6 x

2 4 =6 7 A=9 11x� Promedios 0 -3

Siendo:A = 9Promedio distancias a 9 = -3La media desconocida

= 9 – 3= 6x�

N

dAx

N

ii

1

Page 12: 4 medidas de posición

Propiedad 3

• A cualquier punto de la variable, se le suma el promedio de las distancias a ese punto y nos da la Media de la variable.

N

dAx

N

ii

1

Page 13: 4 medidas de posición

Demostración práctica (propiedad 3)•En valores absolutos, la distancia entre dos puntos de una variable = La distancia entre el promedio de las distancias a cada uno de los 2 puntos.

Page 14: 4 medidas de posición

Propiedades de la Media (4)• Dado un conjunto de observaciones con media , si a cada uno

de esos valores se le realiza la misma operación matemática por el mismo valor constante:

(x₁◊k), (x₂◊k),…………………….(xn◊k) siendo ◊ una operación matemática básica (suma, resta,

multiplicación o división) la media del nuevo conjunto de valores es igual a: ◊kx

x de 5; 10, 15 = 10 / operación básica suma y k=7x de 12; 17, 22 = 17 ₁

= 10 + x k = 10 +7

Page 15: 4 medidas de posición

Media para Datos Acumulados

Para el cálculo de la Media ( ) utilizamos en variables xcontinuas, la marca de clase y en las variables discretas, tomamos el valor de la variable por la marca de clase (MC). Con esta indicación, usamos la misma formula tanto para variables discretas como para variables continuas.

= x� (c1*n1)+(c2 * n2)+(c3 * n3)+ .....+(cn-1 * nn-1)+(cn *nn)N

Siendo c las Marca de Clase y n las Frecuencias Absolutas

Page 16: 4 medidas de posición

Media para Datos Acumulados

En variables continuas asumimos que los individuos se distribuyen equitativamente al interior de cada intervalo, en torno a la marca de clase. Asumimos que es un buen promedio al interior del intervalo, lo que es probable estadísticamente.

= x� (c1*n1)+(c2 * n2)+(c3 * n3)+ .....+(cn-1 * nn-1)+(cn *nn)N

Siendo c las Marca de Clase y n las Frecuencias Absolutas

Page 17: 4 medidas de posición

Media para Frecuencia Absoluta

Media para Frecuencia Absoluta: = x (1500*8)+(4500*11)+(7500*11)+………(25500*1)=hacer en clase

75

Sueldos MC FA FR FAA FRA(0 a 3000] 1500 8 0,11 8 0,11

(3000 a 6000] 4500 11 0,15 19 0,26(6000 a 9000] 7500 11 0,15 30 0,41

(9000 a 12000] 10500 20 0,27 50 0,68(12000 a 15000] 13500 15 0,20 65 0,88(15000 a 18000] 16500 6 0,08 71 0,96(18000 a 21000] 19500 3 0,04 74 0,10(21000 a 24000] 22500 0 0,00 74 0,10(24000 a 27000] 25500 1 0,01 75 1

75 1,00

Page 18: 4 medidas de posición

Media para Frecuencia Relativa

Media para Frecuencia Relativa:

= (0,11*1500)+(0,15*4500)+(0,15*7500)+………(0,01+25500)= Hacer en clasex

Las FR ya están divididas por el N, por lo tanto es sumatoria de la MC*FR en cada intervalo.

Sueldos MC FA FR FAA FRA(0 a 3000] 1500 8 0,11 8 0,11

(3000 a 6000] 4500 11 0,15 19 0,26

(6000 a 9000] 7500 11 0,15 30 0,41

(9000 a 12000] 10500 20 0,27 50 0,68

(12000 a 15000] 13500 15 0,20 65 0,88

(15000 a 18000] 16500 6 0,08 71 0,96

(18000 a 21000] 19500 3 0,04 74 0,10

(21000 a 24000] 22500 0 0,00 74 0,10

(24000 a 27000] 25500 1 0,01 75 1

75 1,00

Page 19: 4 medidas de posición

ResoluciónMedia para Frecuencia

Absoluta

Sueldos MC FA =∑(MC*FA)/Nx

(0 a 3000] 1500 8

(3000 a 6000] 4500 11

(6000 a 9000] 7500 11

(9000 a 12000] 10500 20

(12000 a 15000] 13500 15

(15000 a 18000] 16500 6

(18000 a 21000] 19500 3

(21000 a 24000] 22500 0

(24000 a 27000] 25500 175 9860

Media para Frecuencia Relativa

MC FR MC*FR =∑(MC*FA)x

1500 0,11 165

4500 0,15 675

5500 0,15 825

8500 0,27 2295

11500 0,2 2300

14500 0,08 1160

17500 0,04 700

20500 0 0

22500 0,01 225

1 8345 9860

Page 20: 4 medidas de posición

Medidas de Posición – LA MEDIANAValor que toma la variable para aquel individuo que

ocupa el centro de la distribución, una vez que los datos están ordenados de menor a mayor. Valor del individuo que se encuentra en el centro de la distribución.

IMPORTANTE: encontrar la mediana implica primero encontrar la posición del individuo en el centro de la distribución y luego el valor que toma ese individuo en la variable.

Page 21: 4 medidas de posición

Medidas de Posición – LA MEDIANA1 2 2 3 3 4 5 5 5 6 7 7 8 9 10 11 12 13

Mediana = 5,5

Formula para Impar: Par:

Recordemos que la cifra entre paréntesis es la posición del individuo.X por su parte es el valor que toma la variable para el individuo que esta en esa posición.

2

122

NN

x

xx

med

2

1N x xmed

Page 22: 4 medidas de posición

Medidas de Posición – LA MEDIANA

Datos sin agrupar impar

3 4 5 6 7Med = X₃ = 5

Datos sin agrupar par

34 5 6 7 8Med = X₃+X₄ = 5,5

2IMPORTANTE: encontrar la mediana implica primero encontrar la posición del individuo en el centro de la distribución y luego el valor que toma ese individuo en la variable.

Page 23: 4 medidas de posición

Mediana para Datos AcumuladosFrecuencia Absoluta

Med = N/2 – Ni-1 ai +li-1 ni

Limite inferior del Intervalo donde esta

la mediana

Amplitud del intervalo

FAA intervalo anterior a la mediana

FA Intervalo donde esta la

Mediana

Page 24: 4 medidas de posición

Calculo de la Mediana (FA)Sueldos MC FA FR FAA FRA

(0 a 3000] 1500 8 0,11 8 0,11(3000 a 6000] 4500 11 0,15 19 0,25(6000 a 9000] 7500 11 0,15 30 0,40

(9000 a 12000] 10500 20 0,27 50 0,67(12000 a 15000] 13500 15 0,20 65 0,87(15000 a 18000] 16500 6 0,08 71 0,95(18000 a 21000] 19500 3 0,04 74 0,99(21000 a 24000] 22500 0 0,00 74 0,99(24000 a 27000] 25500 1 0,01 75 1

75 1,00

Med = N/2 – Ni-1 ai +li-1 ni

Med = 37,5 – 30 3000+9000= 10125 20

Page 25: 4 medidas de posición

Calculo de la Mediana (FA)

Med = N/2 – Ni-1 ai +li-1 ni

Med = 37,5 – 30 3000+9000= 10125 20

Page 26: 4 medidas de posición

Mediana para Datos AcumuladosFrecuencia Relativa: donde dice N (FA) pongo F (FR)

Med = 1/2-Fi-1 ai +li-1 fi

Limite inferior del Intervalo donde esta la mediana

Amplitud del intervalo

FAA intervalo anterior a la mediana

FA Intervalo donde esta la

Mediana

Page 27: 4 medidas de posición

Calculo de la Mediana (FR)

Sueldos MC FA FR FAA FRA(0 a 3000] 1500 8 0,11 8 0,11

(3000 a 6000] 4500 11 0,15 19 0,25(6000 a 9000] 7500 11 0,15 30 0,40

(9000 a 12000] 10500 20 0,27 50 0,67(12000 a 15000] 13500 15 0,20 65 0,87(15000 a 18000] 16500 6 0,08 71 0,95(18000 a 21000] 19500 3 0,04 74 0,99(21000 a 24000] 22500 0 0,00 74 0,99(24000 a 27000] 25500 1 0,01 75 1

75 1,00

Med = 0,50 – Fi-1 ai +li-1 fi

Med = 0,50 – 0,40 3000+9000= 10111 0,27

Page 28: 4 medidas de posición

Robustez; Media, Mediana• Si tomamos un conjunto de datos cualquiera a los

cuales calculamos media, mediana y moda y agregamos un dato extremo. Al volver a calcular la media, la mediana y la moda, veremos que la media puede variar notablemente, mientras que la mediana y la moda permanecen similares. Esta no variación de la mediana y la moda reciben el nombre de robustez. Las medidas basadas en el orden –como la mediana- gozan de ésta, en tanto que las medidas basadas en la suma –como la media- se ven más afectadas por las observaciones extremas y son, por lo tanto, poco robustas.

Page 29: 4 medidas de posición

Media, Mediana y Moda• Si todas las observaciones estuvieran concentradas en un solo valor de la

variable, media, mediana coincidirían en el mismo. Si las observaciones se fueran distribuyendo en forma simétrica, a la izquierda y a la derecha de ese valor central, media, mediana y modo seguirían coincidiendo. Supongamos ahora que las observaciones de la parte izquierda se alejan del valor central más que las observaciones de la parte derecha, generando una distribución asimétrica hacia la izquierda; en este caso como la media es la suma de los valores de las observaciones dividido por la cantidad total de observaciones, su valor se correrá a la izquierda también y por el mismo motivo, la media será menor que la mediana. En una distribución asimétrica a la derecha, la media, es mayor que la mediana.

Page 30: 4 medidas de posición

Concentración de los individuos• Según el tipo de Asimetría que tenga la

variable sabemos en donde se concentran los individuos que estamos investigando.

• Si la gráfica es simétrica los individuos se concentran en el centro de la variable.

• Si tiene asimetría negativa, los valores concentran a la izquierda de la gráfica.

• Si la asimetría es positiva, los valores concentraran a la derecha de la gráfica.

Page 31: 4 medidas de posición

Gráficos para cuantitativas continuasAsimetría positiva a la derecha Asimetría negativa a la izquierda

Page 32: 4 medidas de posición

Medidas de Posición – Cuartiles

De la misma forma que la Mediana divide la distribución en 2 partes al ubicar al individuo central. Los Cuartiles dividen la distribución en 4 partes.

Page 33: 4 medidas de posición

Medidas de Posición – Cuartiles

• 1er cuartil: Valor del individuo que esta sobre el 25% de la distribución.

• 2º cuartil: coincide con la mediana.• 3er cuartil: Valor del individuo que esta sobre

el 75% de la distribución.• 4º Cuartil: Ultimo individuo de la distribución.

Page 34: 4 medidas de posición

Medidas de Posición – Cuartiles1 2 2 3 3 4 5 5 5 7 6 7 8 9 10 11 12 13

Mediana = 6

Formula para 1er. Cuartil sin agruparImpar: Par: 2

144

1

NN xx

Q

4

11 NxQ

Recordemos que Q1 es la posición del individuo que ocupa el 25% de la variable. (ubicar primer cuartil en el ejemplo)

Page 35: 4 medidas de posición

Medidas de Posición – CuartilesFormula para 3er. Cuartil sin agrupar

• Impar • Par

34

13 NxQ2

13

43

43

NN xx

Q

Si el número da con coma se ajusta hacia arriba. Ya que es el individuo sobre el cual quedan el 75% de las observaciones. Recordemos que con la formula (N….) ubicamos la posición del individuo en la distribución.

Page 36: 4 medidas de posición

Cuartiles – Datos AgrupadosFrecuencia Absoluta

Primer Cuartil

Frecuencia Relativa

Tercer Cuartil

1

1

14

ii

i

i

lan

NN

Q

1

1

3

34

ii

i

i

lan

NN

Q

111

25,0

iii

laf

FQ i

131

75,0

iii

laf

FQ i

Page 37: 4 medidas de posición

Medidas de Posición – Quintiles, Déciles, Percentiles.

• Quintiles: Divide la frecuencia en 5 partes iguales.

• Déciles: Divide la frecuencia en 10 partes.

• Percentiles: Divide la frecuencia en 100 partes iguales.

Page 38: 4 medidas de posición

Formula GeneralFrecuencia Absoluta

I = p(N) – Ni-1 ai +li-1

ni

Frecuencia Relativa:

I = p(1)-Fi-1 ai +li-1 fi

Limite inferior del Intervalo donde esta

el individuo

Amplitud del intervalo

FAA intervalo anterior al individuo

FA Intervalo donde esta el

individuo

Proporción del Individuo buscado

Page 39: 4 medidas de posición

En un N de 1240 buscar la ubicación de los siguientes individuos.

• Decil₃

• Cuartil₁

• Quintil₄

• Percentil34

Page 40: 4 medidas de posición

En un N de 1240 Buscar

• Decil₃ …………………. 3/10(1240)=

• Cuartil₁…………………1/4(1240)=

• Quintil₄…………………4/5(1240)=

• Percentil34……………………...35/100 (1240)=

Page 41: 4 medidas de posición

Estadísticos: Medidas de Posición

Estadístico Variable según su nivel de mediciónProporción nominales ordinales RazónPorcentaje nominales ordinales RazónRatio nominales ordinales RazónModa nominales ordinales Intervales RazónMediana nominales₁ ordinales Intervales RazónMedia₂ Intervales Razón

₁Mediana:-En las variables nominales suele ser poco útil ya que su valor cambia con el orden que se le de a las categorías.