clase 4 medidas de tendencia no central

27
MEDIDAS DE POSICION NO CENTRAL

Upload: luz-elena-garcia

Post on 24-Jun-2015

20.413 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Clase 4 medidas de tendencia no central

MEDIDAS DE POSICION NO CENTRAL

Page 2: Clase 4 medidas de tendencia no central

Medidas de dispersión Caracterizar una distribución solamente a través de

una medida central no es apropiado.

Las distribuciones del ingreso de dos provincias con el mismo ingreso medio por hogar son muy distintas si una de ellas tiene extremos de pobreza y de riqueza, mientras que la otra tiene poca variación de ingresos entre familias.

Estamos interesados en la dispersión o variabilidad de los ingresos, además de estarlo en sus centros.

Page 3: Clase 4 medidas de tendencia no central

Medidas de dispersión El rango depende sólo de las

observaciones máxima y mínima, que podrían ser observaciones atípicas.

Podríamos mejorar nuestra descripción de la dispersión fijándonos, por ejemplo, también en la dispersión del 50% de los valores centrales de nuestros datos.

Un conjunto de estadísticos de utilidad son los cuartiles de una distribución.

Page 4: Clase 4 medidas de tendencia no central

Las medidas de posición no centrales permiten conocer otros puntos característicos de la distribución que no son los valores centrales. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la muestra en tramos iguales:Cuartiles: son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados.Deciles: son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados.Percentiles: son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados

Page 5: Clase 4 medidas de tendencia no central

Se puede definir otros índices para precisar la Se puede definir otros índices para precisar la posición de los valores:posición de los valores:

Los CuartilesLos Cuartiles

Dividen los valores ordenados en cuatro Dividen los valores ordenados en cuatro partes iguales:partes iguales:

el 1er cuartilel 1er cuartil que deja un cuarto de los que deja un cuarto de los valores por debajo.valores por debajo.

la 2do cuartilla 2do cuartil, que es la mediana. , que es la mediana.

el 3er cuartilel 3er cuartil que deja un cuarto de los que deja un cuarto de los

valores por arriba.valores por arriba.

Page 6: Clase 4 medidas de tendencia no central

CuartilesPara calcular los cuartiles de una

distribución debemos:

1.1. Ordenar las observaciones en orden creciente y localizar la mediana.

22. . El primer cuartil Q1 es la mediana de las observaciones situadas a la izquierda de la mediana de la distribución.

3.3. El tercer cuartil Q3 es la mediana de las observaciones situadas a la derecha de la mediana de la distribución.

Page 7: Clase 4 medidas de tendencia no central

Cuartiles Los cuartiles son medidas de tendencia no

central de una distribución.

Dividen los datos ordenados en 4 cuartos iguales:

El segundo cuartil de una distribución es su mediana.

25% 25% 25% 25%

Q1 Q2 Q3

Page 8: Clase 4 medidas de tendencia no central

1er cuartil1er cuartil

3er cuartil3er cuartil

MedianaMediana

Page 9: Clase 4 medidas de tendencia no central

Percentiles Los percentiles son otro conjunto de medidas de

tendencia no central de una distribución.

Dividen los datos ordenados en 100 partes iguales.

El percentil 25 es el primer cuartil ...

Ejemplo Supongamos que el 78% de los resultados de la nota del

parcial es menor o igual a 4 puntos. Entonces, 4 es el percentil 78 de la distribución.

78% de todos los resultados 22%

Page 10: Clase 4 medidas de tendencia no central

Percentiles frecuentemente utilizados Primer decil = percentil 10 Primer cuartil, Q1, = percentil 25 Segundo cuartil,Q2, = percentil 50 Tercer cuartil, Q3, = percentil 75 Noveno decil = percentil 90

EjemploEncontrar los cuartiles del siguiente conjunto de

datos:

7, 8, 12, 17, 29, 18, 4, 27, 30, 2, 4, 10, 21, 5, 8

Percentiles

Page 11: Clase 4 medidas de tendencia no central

Solución Primero, ordenar las observaciones

2, 4, 4, 5 7, 8, 10, 12 17, 18, 18 21 27, 29,30

Como máximo, (.25)(15) = 3.75 observaciones deberían aparecer pordebajo del primer cuartil.

Como máximo, (.75)(15)=11.25 observaciones deberían aparecer por encima del primer cuartil.

Primer cuartil

Si el numero de observaciones es par, los resultados se encuentran entre dos observaciones.En ese caso, hay que elegir el punto medio entre ambas observaciones.

Segundo cuartil Tercer cuartil

Page 12: Clase 4 medidas de tendencia no central

Medidas de dispersión 

Estudia la distribución de los valores de la serie, analizando si estos se encuentran más o menos concentrados, o más o menos dispersos.Existen diversas medidas de dispersión, entre las más utilizadas podemos destacar las siguientes:

1. Rango2. Varianza3. Desviación tipica4. Coeficiente de variación5. Coeficiente de asimetria

Page 13: Clase 4 medidas de tendencia no central

MEDIDAS DE DISPERSIÓN

Se tiene dos grupos de datos, el grupo A: 2, 98, 3, 97,

y el grupo B: 49, 51, 48, 52; obsérvese que aunque en

ambos grupos el promedio es 50, da la impresión de

que este promedio representa mejor los datos del

grupo B que los del grupo A, puesto que los datos del

grupo B están menos dispersos.

Page 14: Clase 4 medidas de tendencia no central

Ejemplo de dos conjuntos de datos con igual media

Datos con alta dispersiónDatos con baja dispersión

Medidas de dispersión

Page 15: Clase 4 medidas de tendencia no central

Medidas de dispersión Rango

Una manera de medir la dispersión es calcular el recorrido de la distribución empírica, es decir, la diferencia entre las observaciones máxima y mínima.

Su mayor ventaja es que se puede calcular facilmente, sin embargo, no brinda información sobre la dispersión existente entre ambos valores extremos.

Page 16: Clase 4 medidas de tendencia no central

La Varianza: Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de las difrencias al cuadrado entre cada valor y la media, multiplicadas por el número de veces que se ha repetido cada valor. La sumatoria obtenido se divide por el tamaño de la muestra.

La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.

Page 17: Clase 4 medidas de tendencia no central

MEDIDAS DE DISPERSION

1. Rango mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor más elevado y el valor más bajo.

R = Valor máximo – Valor mínimo

2. Varianza: Medidas de dispersión de los valores alrededor del promedio

S2= ∑(Xi –X)2 para muestras

n-1

δ 2= ∑(Xi –)2 para población

n

Calcule la varianza y la desviación estándar

Serie

7

14

14

14

21

Page 18: Clase 4 medidas de tendencia no central

Una medida de dispersión: La varianza

La varianza s2 de un conjunto de observaciones es el promedio de los cuadrados de la desviaciones de las observaciones respecto a su media. Formalmente:

De forma compacta:

1n

)xx(...)xx()xx(s

2n

22

212

2i

2 )xx(1n

1s

Page 19: Clase 4 medidas de tendencia no central

VARIANZA: VARIANZA: comparación de cada comparación de cada uno con el promedio uno con el promedio elevar cada diferencia elevar cada diferencia al cuadrado y sumaral cuadrado y sumar: :

VARIANZA: VARIANZA: comparación de cada comparación de cada uno con el promedio uno con el promedio elevar cada diferencia elevar cada diferencia al cuadrado y sumaral cuadrado y sumar: :

X=166cm

181 180 176 175 170 168 168 162 160 158 155 154,150181 180 176 175 170 168 168 162 160 158 155 154,150

VarianzaVarianza: : 1262.91262.9 cm cm22=97=97

1313

Desviación estándarDesviación estándar==

RAIZ(97) = 9.9 cmRAIZ(97) = 9.9 cm

Page 20: Clase 4 medidas de tendencia no central

Considere dos poblaciones:Población A: 8, 9, 10, 11, 12Población B: 4, 7, 10, 13, 16

1098

74 10

11 12

13 16

8 –10 = -2

9 –10 = -111 –10 = +1

12 – 10 = +2 Suma = 0

4 -10 = - 6

7- 10 = -313 -10 = +3 Suma = 0

16 -10 = +6

La media de ambas poblaciones es 10...

…pero en B los datos están mucho mas dispersos que en A

Comencemos calculando la suma de las desviaciones

A

B

En ambos casos, la suma de las desviaciones esCero (lo cual es siempre Cierto). Por lo tanto, usamosla suma de los cuadrados.

La varianza

Page 21: Clase 4 medidas de tendencia no central

Calculemos la suma de las desviaciones al cuadrado para ambas poblaciones:

185

)1016()1013()1010()107()104( 222222B

25

)1012()1011()1010()109()108( 222222A

La varianza

Page 22: Clase 4 medidas de tendencia no central

Una medida de dispersión: El desvío standard La desviación típica es la raíz cuadrada positiva

de la varianza s2:

Ejemplo:Tasas de retorno de dos fondos de inversiones durante 10 años ¿Cual de los dos es más riesgoso?

Fondo A: 8.3, -6.2, 20.9, -2.7, 33.6, 42.9, 24.4, 5.2, 3.1, 30.05 Media: 14.6 Desvío standard: 16.74

Fondo B: 12.1, -2.8, 6.4, 12.2, 27.8, 25.3, 18.2, 10.7, -1.3, 11.4

Media: 11.75 Desvío standard: 9.97El fondo A es mas riesgoso dado que su desvío standard es mayor.

2i )xx(

1n

1s

Page 23: Clase 4 medidas de tendencia no central

Propiedades de la desviación standard

s mide la dispersión respecto a la media. Debe emplearse solo cuando se escoge la media como medida central de la distribución.

s = 0 solo ocurre cuando no hay dispersión: todas las observaciones toman el mismo valor. De lo contrario s > 0.

Cuanto más dispersión hay entre las observaciones, mayor es s.

s, al igual que la media, se encuentra fuertemente influenciado por las observaciones extremas.

Page 24: Clase 4 medidas de tendencia no central

EJEMPLO

Se toma la información sobre el número de pacientes que llegan a un

hospital el fin de semana durante las 2 y las 6 AM, observando una

muestra de 25 fines de semana, se obtuvieron los siguientes resultados: 8,

6, 7, 9, 8, 7, 8, 10, 4, 10, 8, 7, 9, 8, 7, 6, 5, 10, 7, 8, 5, 6, 8, 10, 11.

Construir la tabla de frecuencias, además de su distribución. Representar

gráficamente la información. Calcular medidas de tendencia central y

medidas de dispersión.

Page 25: Clase 4 medidas de tendencia no central

δ 2= ∑fX 2 – 2 para población

n

La varianza en datos agrupados se calcula:a. Se halla el punto medio de cada

intervalob. La media clase obtenida se eleva al

cuadradoc. Se multiplica esta media clase elevada

al cuadrado por la frecuenciad. Se aplica la formula

Page 26: Clase 4 medidas de tendencia no central

3. Desviación típica: Se calcula como raíz cuadrada de la varianza.

4. Coeficiente de variación : Permite determinar el grado de variabilidad. Es un estadístico de dispersión que tiene la ventaja de que no lleva asociada ninguna unidad, por lo que nos permitirá decir entre dos muestras, cual es la que presenta mayor dispersión. La denotaremos por C.V

Page 27: Clase 4 medidas de tendencia no central

Coeficiente de variación

El coeficiente de variación es una medida de dispersión relativa.

Muestra la dispersión de una distribución en relación a su media.

Se utiliza para comparar distintas distribuciones.

Su fórmula es: Por ejemplo, un desvio standard de 10,

puede ser grande si la media es 100, pero no lo es si la media es 500.

CV