medidas de variabilidad

8
FUNDACIÓN UNIVERSITARIA AUTÓNOMA DE LAS AMÉRICAS Departamento de Educación a Distancia Claudia Victoria Quintero García Página 1 MEDIDAS DE DISPESIÓN O VARIABILIDAD Además de las medidas de tendencia central, en un conjunto de datos se deben calcular las medidas de variabilidad o dispersión, dado que dos conjuntos de datos pueden tener promedios similares, pero diferir en la dispersión de estos. Las medidas de dispersión miden hasta qué punto las medidas de tendencia central son representativas como síntesis de la información. Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central. Las medidas de variabilidad de mayor uso en estadística son rango, varianza, desviación estándar y coeficiente de variación. RANGO Se define como la diferencia existente entre el valor mayor y el menor de la distribución. Lo notaremos como R. Realmente no es una medida muy significativa en la mayoría de los casos, pero indudablemente es muy fácil de calcular. R = Valor máximo Valor mínimo Casi nunca se usa como la única medida de dispersión, debido a que se basa solo en los valores extremos del conjunto de datos. No es aconsejable usarlo para muestras grandes, puede conducirnos a errores, se utiliza en muestras pequeñas de 4 a 5 observaciones, sobre todo en el control estadístico de la calidad. Para cualquier caso en que se presenten los dotos: datos de las observaciones, tabla de frecuencias sin agrupar y tabla de frecuencias agrupadas, se utiliza la misma fórmula. Ejemplo: se tiene la renta anual en millones de 56 familias, a continuación se tiene la tabla de distribución de frecuencias

Upload: claudia-quintero

Post on 13-Jun-2015

482 views

Category:

Education


5 download

DESCRIPTION

Medidas de variabilidad

TRANSCRIPT

Page 1: Medidas de variabilidad

F U N D A C I Ó N U N I V E R S I T A R I A A U T Ó N O M A D E L A S

A M É R I C A S

Departamento de Educación a Distancia

Claudia Victoria Quintero García Página 1

MEDIDAS DE DISPESIÓN O VARIABILIDAD

Además de las medidas de tendencia central, en un conjunto de datos se deben calcular las medidas de variabilidad o dispersión, dado que dos conjuntos de datos pueden tener promedios similares, pero diferir en la dispersión de estos. Las medidas de dispersión miden hasta qué punto las medidas de tendencia central son representativas como síntesis de la información. Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central.

Las medidas de variabilidad de mayor uso en estadística son rango, varianza,

desviación estándar y coeficiente de variación.

RANGO

Se define como la diferencia existente entre el valor mayor y el menor de la distribución. Lo notaremos como R. Realmente no es una medida muy significativa en la mayoría de los casos, pero indudablemente es muy fácil de calcular.

R = Valor máximo – Valor mínimo

Casi nunca se usa como la única medida de dispersión, debido a que se basa solo en los valores extremos del conjunto de datos. No es aconsejable usarlo para muestras grandes, puede conducirnos a errores, se utiliza en muestras pequeñas de 4 a 5 observaciones, sobre todo en el control estadístico de la calidad. Para cualquier caso en que se presenten los dotos: datos de las observaciones, tabla de frecuencias sin agrupar y tabla de frecuencias agrupadas, se utiliza la misma fórmula. Ejemplo: se tiene la renta anual en millones de 56 familias, a continuación se tiene

la tabla de distribución de frecuencias

Page 2: Medidas de variabilidad

F U N D A C I Ó N U N I V E R S I T A R I A A U T Ó N O M A D E L A S

A M É R I C A S

Departamento de Educación a Distancia

Claudia Victoria Quintero García Página 2

Renta anual (xi)

N° de Viviendas (ni)

18,85 3

21,55 2

24,25 7

26,95 14

29,65 11

32,35 10

35,05 9

R = 35,05 – 18,85 = 16,2 millones de pesos

El rango se interpreta a partir de los valores extremos; es decir, entre que valores está el rango. Para el ejemplo, la variación de la renta anual de las viviendas es de $16.200.000, ósea que la renta oscila entre $35.005.000 y $18.850.000.

VARIANZA

La varianza (S2x) de los datos es la más utilizada. Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución.

La varianza es una medida de dispersión que emplea todos los datos. Se basa en la diferencia de cada observación (xi) y la media aritmética, que se llama desviación respecto al promedio. Para una muestra, la desviación respecto a la media se expresa como (xi – X); para una población (xi – µ). Para calcular la varianza, las desviaciones respecto al promedio se elevan al cuadrado. La varianza de la muestra (s2x) es la suma de los cuadrados de las desviaciones con relación a la media aritmética, dividida entre el tamaño de la muestra menos 1.

Dónde:

: Es la varianza

X: media aritmética de la muestra ( ) n: tamaño de la muestra xi: cada observación de los datos a analizar

Page 3: Medidas de variabilidad

F U N D A C I Ó N U N I V E R S I T A R I A A U T Ó N O M A D E L A S

A M É R I C A S

Departamento de Educación a Distancia

Claudia Victoria Quintero García Página 3

Las unidades al cuadrado asociadas con la varianza hacen difícil la interpretación. Por tanto, se recomienda que se tome la varianza como una medida útil para comparar el grado de dispersión de dos o más variables y, al compararlas, la que tienen mayor varianza tiene mayor dispersión o variabilidad.

Cuando se tiene todas las observaciones

El cálculo de la varianza se puede hacer con la fórmula, pero es más práctico tabular los datos en Excel y aplicarle a todas las observaciones la función VAR, solo si se tiene los datos de todas las observaciones Cuando se tiene la tabla de frecuencias sin agrupar Se aplica la fórmula y Xi son las modalidades o categorías de la variable

Ejemplo: se tiene la renta anual en millones de 56 familias, a continuación se tiene la tabla de distribución de frecuencias

i Renta anual

(xi)

N° de Viviendas

(ni)

xi*ni

1 18,85 3 56,55

2 21,55 2 43,1

3 24,25 7 169,75

4 26,95 14 377,3

5 29,65 11 326,15

6 32,35 10 323,5

7 35,05 9 315,45

Procedimiento

1. Se debe calcular primero la Media aritmética, como se explicó en la guía

anterior, para el ejemplo la Xmedia = 28,78

2. Se adiciona una columna donde se calcula , en excel para elevar

a una potencia, en este caso elevar apara cuadrado, presiona las teclas Alt gr +

^ (se encuentra a la derecha de la tecla ñ) y después el 2.

3. Se calcula la sumatoria de las restas anteriores

4. La suma anterior se divide por la muestra menos 1

Page 4: Medidas de variabilidad

F U N D A C I Ó N U N I V E R S I T A R I A A U T Ó N O M A D E L A S

A M É R I C A S

Departamento de Educación a Distancia

Claudia Victoria Quintero García Página 4

Renta anual (xi)

N° de Viviendas

(ni)

xi*ni (Xi - Xmedia)^2

18,85 3 56,55 98,64746173

21,55 2 43,1 52,30389031

24,25 7 169,75 20,54031888

26,95 14 377,3 3,356747449

29,65 11 326,15 0,75317602

32,35 10 323,5 12,72960459

35,05 9 315,45 39,28603316

56 1611,8 227,6172321

Cuando se tiene la tabla de frecuencias agrupada en intervalos: Se debe

primera calcular el valor medio de cada intervalo (marca de clase), que es la suma

de ambos dividida por 2 y ese valor representa el Xi y se continúa con el mismo

procedimiento anterior

Ejemplo: Se tiene la siguiente tabla de frecuencias agrupada, donde la variable es

ingresos anuales en millones de pesos

i Li Ls ni

1 100-120 8

2 120-140 15

3 140-160 8

4 160-180 17

5 180 - 200 18

6 200-220 4

70

Procedimiento:

1. Se calcula el valor medio de cada intervalo

Page 5: Medidas de variabilidad

F U N D A C I Ó N U N I V E R S I T A R I A A U T Ó N O M A D E L A S

A M É R I C A S

Departamento de Educación a Distancia

Claudia Victoria Quintero García Página 5

2. Se calcula la Media aritmética, como se explicó en la guía anterior, para el

ejemplo la Xmedia = 158,571

3. Se adiciona una columna donde se calcula

4. Se calcula la sumatoria de las restas anteriores

5. La suma anterior se divide por la muestra menos 1

Li Ls Xi (valor

medio) ni Xi*ni (Xi - Xmedia)^2

100-120 110 8 880 2471,510204

120-140 130 15 1950 882,9387755

140-160 150 8 1200 94,36734694

160-180 170 17 2890 105,7959184

180 - 200 190 18 3420 917,2244898

200-220 210 4 840 2528,653061

70 11180 7000,489796

DESVIACIÓN ESTANDAR

Es la diferencia que se observa entre el valor de la variable y la media aritmética.

La desviación estándar (Sx) es la raíz cuadrada de la varianza. Significa la

dispersión de la distribución y se expresa en las mismas unidades de medida de la

variable. La desviación típica o estándar es la medida de dispersión más utilizada en

estadística.

La desviación estándar indica cómo se agrupa o distribuye un conjunto de datos alrededor de la media. Esto implica que el intervalo comprendido entre X - Sx y X + Sx, por lo general, incluye la mayoría de los valores de los datos. Conocidas la media aritmética y la desviación estándar se puede definir en donde se

agrupa la mayor parte de los datos.

Page 6: Medidas de variabilidad

F U N D A C I Ó N U N I V E R S I T A R I A A U T Ó N O M A D E L A S

A M É R I C A S

Departamento de Educación a Distancia

Claudia Victoria Quintero García Página 6

Cuando se tiene todas las observaciones

El cálculo de la Desviación estándar se puede hacer aplicándole la raíz a la varianza, o aplicarle a todas las observaciones la función DESVEST, solo si se tiene los datos de todas las observaciones

Como se dijo anteriormente, la desviación estándar es la raíz cuadrada de la

varianza, entonces se tenga tabla de frecuencia sin agrupar o agrupada, después

de calculada la varianza se le aplica la raíz cuadrada.

Para el ejemplo de la renta anual en millones de 56 familias, la desviación

estándar sería:

Millones

La desviación estándar del valor de la renta es de $2.034.000. Esto indica que las rentas anuales para la mayoría de las familias se agrupan entre $26.750.000 (X-Sx) y $30.820.000(X+Sx) o la renta anual se dispersan en promedio en $2.034.000 con respecto a la media aritmética. Es importante destacar algunas características de la varianza y el desvío estándar:

Son índices que describen la variabilidad o dispersión y por tanto cuando los datos están muy alejados de la media, la varianza y la desviación estándar serán grandes.

Al aumentar el tamaño de la muestra, disminuye la varianza y la desviación estándar.

Cuanto más concentrados u homogéneos sean los datos, menores serán el rango, la varianza y la desviación estándar.

Cuando todos los datos de la distribución son iguales, la varianza y el desvío estándar son iguales a 0.

Page 7: Medidas de variabilidad

F U N D A C I Ó N U N I V E R S I T A R I A A U T Ó N O M A D E L A S

A M É R I C A S

Departamento de Educación a Distancia

Claudia Victoria Quintero García Página 7

COEFICIENTE DE VARIACIÓN Se denota con CV, es una medida de dispersión relativa de los datos y se calcula dividiendo la desviación estándar por la media y se interpreta como un porcentaje. Nos permite comparar la dispersión o variabilidad de dos o más grupos. El coeficiente de variación (CV) se utiliza para comparar la homogeneidad de dos series de datos. Se debe destacar que a medida que el coeficiente de variación (CV) disminuye, se observa una mayor homogeneidad en los datos o lo que es lo mismo, los datos están más concentrados alrededor de la media aritmética. Además si el CV<30%, la muestra es muy homogénea y la medida estadística que mejor representa los datos es la media aritmética; si 30%<CV<80% es aceptablemente homogénea sigue siendo la media aritmética que mejor representa los datos, en cambio sí CV>80%, la muestra es heterogénea y la medida que mejor representa los datos es la mediana.

Para el ejemplo de la renta anual de 56 familias el coeficiente de variación es:

Correspondiente al 7% Lo que indica que la desviación estándar de la muestra es el 7% del valor de la media de la muestra. Además, como el CV>30%, se puede afirmar que los datos son muy homogéneos, entonces la medida que representa correctamente los datos a la media aritmética Por ser una medida de dispersión relativa, resulta útil cuando se compara la variabilidad de dos o más conjuntos de datos, que se expresan en diferentes unidades de medida.

Page 8: Medidas de variabilidad

F U N D A C I Ó N U N I V E R S I T A R I A A U T Ó N O M A D E L A S

A M É R I C A S

Departamento de Educación a Distancia

Claudia Victoria Quintero García Página 8

Ejemplo:

Un inversionista desea adquirir acciones en una de dos compañías A o B, listadas en la Bolsa de Valores. Si ninguna de las compañías ofrece dividendos a sus clientes y ambas tienen igual clasificación (según los servicios de inversión) en términos del crecimiento potencial, el inversionista quizá considere la variabilidad de ambas

acciones para ayudar en la decisión de inversión.

Cada acción de la compañía A ha promediado $150.000 en los últimos meses, con desviación estándar de $30.000. Además, durante el mismo periodo el precio promedio de las acciones en la compañía B fue de $36.000 con una desviación estándar de $12.000. .Como puede determinar el inversionista cuales acciones son más variables? Con el fin de analizar la estabilidad de ambas acciones, es necesario calcular el CV de los dos tipos de acciones:

CV de las acciones A =

= 20 %

CV de las acciones B =

= 33,3 %

Se concluye que el precio de las acciones B es más variables que el precio de las acciones A.