medidas de variación - edug531 | just another wordpress ... · son medidas que indican cuánto...

42
Medidas de Variación o Dispersión Dra. Noemí L. Ruiz © 2007 Derechos de Autor Reservados Revisada 2010

Upload: doankhuong

Post on 27-Jul-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Medidas de

Variación o

DispersiónDra. Noemí L. Ruiz

© 2007

Derechos de Autor Reservados

Revisada 2010

Page 2: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Objetivos de la lección

Conocer cuáles son las medidas de

variación y cómo se calculan o se

determinan

Conocer el significado o interpretación

de cada una de las medidas

Aplicar las medidas de variación en un

conjunto de datos

Conocer los diagramas de caja y bigotes

y su aplicación

Page 3: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Medidas de Variación o

Dispersión

Page 4: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Son medidas que indican cuánto varía o

cuánto se dispersa un grupo de datos.

Algunas de estas medidas son: rango, rango

intercuartil, desviación intercuartil,

desviación promedio, varianza, desviación

estándar y coeficiente de variación.

Estas medidas miden el grado de dispersión,

desviación, o variación, que tienen las

puntuaciones, entre sí , o en relación al

centro de una distribución.

Medidas de Variación

Page 5: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Ayudan a determinar cuán homogéneo es

un grupo de datos.

Las puntuaciones que están relativamente

juntas tienen una medida de variación más

pequeña.

Las puntuaciones que están más dispersas

tienen una medida de variación más grande.

Menos dispersión significa que el grupo de

datos es más homogéneo.

Más dispersión implica mayor

heterogeneidad.

Medidas de Variación

Page 6: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Los valores en la muestra C son iguales, por

lo tanto, no existe variabilidad entre ellos.

Al calcular cualquier medida que

cuantifique la variabilidad de esta muestra,

el resultado sería igual a cero.

Medidas de VariaciónMuestras Valor 1 Valor 2 Valor 3 Valor 4 Valor 5

Muestra A 5 15 25 25 58

Muestra B 15 16 16 17 19

Muestra C 5 5 5 5 5

Page 7: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Si se comparan los valores de la muestra A

con los de la muestra B se puede observar

que en la Muestra A los valores están más

lejanos unos de otros.

Medidas de VariaciónMuestras Valor 1 Valor 2 Valor 3 Valor 4 Valor 5

Muestra A 5 15 25 25 58

Muestra B 15 16 16 17 19

Muestra C 5 5 5 5 5

Page 8: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Si se fuese a calcular cualquier medida que

cuantifique la variabilidad en cada una de

estas muestras, el resultado sería mayor

para la muestra A que para la muestra B.

En general, mientras mayor es la

variabilidad entre los datos, mayor será la

medida de dispersión

Medidas de VariaciónMuestras Valor 1 Valor 2 Valor 3 Valor 4 Valor 5

Muestra A 5 15 25 25 58

Muestra B 15 16 16 17 19

Muestra C 5 5 5 5 5

Page 9: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Medidas de Variación o

Dispersión

Page 10: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

El rango es la medida que indica

cuánto se dispersa un grupo de datos.

Se le conoce también, como: alcance,

amplitud, recorrido, o campo de valores

Es la medida más sencilla pero menos

confiable.

Se determina restando el valor mayor

menos el valor menor.

Rango = (Valor mayor) – (Valor menor)

Rango

Dice cuál

es la

dispersión

total del

grupo de

datos

Page 11: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Aunque la mayoría de las veces se

determina con la fórmula:

Rango = (Valor mayor) – (Valor menor)

Para propósitos del libro de Hinkle se

utilizará la siguiente fórmula que

ajusta la inclusión de ambos

extremos:Rango =[ (Valor mayor) – (Valor menor) ] + 1

Rango

Page 12: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Si el valor mayor es 5 y el menor es 3,

al restar 5 – 3 se obtiene 2.

5 – 3 = 2 indica que hay dos

unidades de diferencia entre estos

valores.

Si se suma 1, (5-3) + 1, tenemos el total

de valores que hay en ese intervalo de

5 a 3.

(5-3) + 1 = 2 + 1 = 3

Hay 3 valores: 5, 4, 3

Rango

Page 13: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Las medianas de ambos grupos es 23,

pero los rangos varían.

El rango del grupo 1 es 27 (37 – 11 +1 = 27)

El rango del grupo 2 es 12 (29 – 18 + 1 = 12)

El grupo 1 es más variado que el grupo 2.

RangoGrupo Valor

1

Valor

2

Valor

3

Valor

4

Valor

5

Valor

6

Valor

7

Grupo 1 11 16 18 23 29 31 37

Grupo 2 18 19 21 23 24 26 29

Page 14: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Se afecta por valores extremos.

Si el último valor del grupo 1

hubiera sido 64 en vez de 37, el

rango se duplacaría.

Se afecta por el tamaño de n, o sea, la

cantidad de sujetos en la muestra.

Los rangos de dos grupos que tienen

diferente número de sujetos (n) no se

pueden comparar.

Limitaciones del Rango

Page 15: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Indica cuánto se dispersan los valores que

están en el centro de un grupo de datos.

Se considera el centro como los valores que

se concentran entre el primer y tercer

cuartil.

El rango intercuartil no es afectado por

valores extremos.

Se determina usando la siguiente fórmula:

Rango Intercuartil= Q3 – Q1

Rango Intercuartil

Dice cuál

es la

dispersión

de los

valores que

están en el

centro

Page 16: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Es la distancia promedio que existe entre

el primer y tercer cuartil.

Esta medida nos dice, en promedio, cuán

amplio o dispersos están los datos que se

concentran en el centro (de Q3 a Q1).

El centro se concentra entre el primer y

tercer cuartil.

La fórmula para hallarlo es: Q3 - Q1

2

Desviación Intercuartil

Representa

el punto

medio del

rango

intercuartil

Page 17: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Es una representación visual simple pero

que brinda gran información sobre la

dispersión de un grupo de datos.

Utiliza la mediana y el rango intercuartil

(Q3 – Q1) para el análisis.

Lo desarrolló el prominente estadístico

llamado Tuckey.

Se puede usar para determinar valores que

representan valores inusuales llamados

“outliers” que requieren consideración

especial.

Diagramas de Caja y Bigotes

Page 18: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Para trazar el diagrama se necesitan 5

números o valores.

Por eso a veces se le conoce como el

análisis de los 5 números.

Estos 5 valores son:

Valor mayor (puntuación máxima)

Q3

Mediana

Q1

Valor menor (puntuación mínima)

Diagramas de Caja y Bigotes

Page 19: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Ejemplo:

Traza el diagrama de caja y bigotes usando los

siguientes valores:

Valor mayor = 69

Q3 = 56.26

Mediana = 49.26

Q1 = 43.36

Valor menor = 24

Diagramas de Caja y Bigotes

20 30 40 50 60 70 80

Page 20: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Son valores inusuales que podrían considerarse

extremos y que requieren consideración especial.

Para determinar estos valores se utiliza el rango

intercuartil: (Q3 – Q1) .

El límite superior razonable de una distribución

está dado por la fórmula:

Límite Superior Razonable (LSR) = Q3 + 1.5 (Q3 – Q1)

El límite inferior razonable de una distribución está

dado por la fórmula:

Límite Inferior Razonable (LIR) = Q1 - 1.5 (Q3 – Q1)

“Outliers”

Page 21: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Si un valor dado cae fuera de estos límites

razonables , el valor se considera un extremo y

habría que considerarlo cuando se tomen

decisiones sobre el grupo.

Determine si los valores a continuación son

razonables:

68 , 75 , 32, 21

“Outliers”

20 30 40 50 60 70 80

LSR LIR

Page 22: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Es la suma de los valores absolutos de las

desviaciones de los valores respecto a la

media aritmética de la muestra.

La fórmula para hallarlo es:

Desviación Media

Representa

el

promedio

de las

desviacio-

nes de

todos los

valores

respecto a

la media

n

xxn

i

i

1Desviación media

Page 23: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Desviación Media

n

xxn

i

i

1

86.2

7

2341163

7

2341163

9 3 3

12 6 6

7 1 1

5 -1 1

2 -4 4

3 -3 3

4 -2 2

Totales = 42 = 0 = 20

ix xxixxi

n

xxn

i

i

1

Page 24: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Se puede usar la desviación media para

comparar la variación de distintas

distribuciones.

Las distribuciones con mayor desviación

media serán las que tengan la variación

mayor.

Sin embargo, la utilidad de esta medida es

limitada debido a que se usa el valor absoluto

como medio para hallarla.

Los análisis estadísticos más avanzados

requieren manejo algebraico más complejo,

como la varianza.

Desviación Media

Page 25: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Es una medida que representa una unidad

cuadrada.

Esta medida promedia los cuadrados de las

desviaciones de los valores respecto a la media

aritmética.

La varianza toma en consideración cada valor de la

muestra.

La fórmula para hallar la varianza de una población

es:

Varianza

2

2 ix

n

La varianza

no se

interpreta

por ser una

unidad

cuadrada

Fórmula 1

es desviación estándar de la población

es media aritmética de la población

Page 26: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

La fórmula para hallar la varianza de

una muestra es:

La fórmula anterior es equivalente

también a la siguiente fórmula:

Varianza

2

2

1

ix xs

n

2

2

2

1

i

i

xx

n

sn

Fórmula 2

Fórmula 3

Ver cuando

se usa cada

fórmula

Page 27: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Se usa la fórmula 1 cuando se va a

determinar la varianza de una población.

Se usa la fórmula 2 y fórmula 3 cuando se va

a determinar la varianza de una muestra.

Se usa la fórmula 2 cuando se tiene una

muestra pequeña y la media aritmética es

un número entero, ya que se torna más

compleja y difícil de utilizar cuando hay

muchos valores o cuando la media

representa un valor decimal.

En este caso, se usa mejor la fórmula 3.

Varianza

Page 28: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Más adelante se presentarán ejemplos de

cómo se utilizan estas fórmulas.

El elevar al cuadrado las desviaciones de

las puntuaciones respecto a la media

aritmética, es un método alterno al uso del

valor absoluto para eliminar los signos

negativos antes de sumar las desviaciones.

Cuando se utilizan los cuadrados en vez de

los valores absolutos de las desviaciones

se facilita el manejo algebraico y se elimina

la restricción que tiene la desviación media.

Varianza

Page 29: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Desviación Media

9 3 9 1

12 6 36 16

7 1 1 1

5 -1 1 9

2 -4 16 36

3 -3 9 25

4 -2 4 16

Totales = 42 = 0 = 76 = 104

ix xxi

2

xxi

2

8ix

6x Ejemplo

Page 30: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Es una medida que representa una

unidad lineal.

Se halla extrayendo la raíz cuadrada

de la varianza.

La fórmula para hallar la desviación

estándar es:

Para hallar la desviación estándar de

una población se usa la última fórmula.

Desviación Estándar

2 2 ó s s

Es un

promedio

que mide

cuánto se

desvían

todos los

datos en

relación a

la media

aritmética

Page 31: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Cuando los datos están agrupados se

utiliza la siguiente fórmula:

Varianza y Desviación Estándar

para datos agrupados

Fórmula 4

2

2

1

1

2

2

1

ss

n

n

fx

fx

s

n

i

iin

i

ii

Page 32: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Ver las columnas que se necesitarían

añadir en una tabla de distribución de

frecuencias para poder aplicar la fórmula 4.

Varianza y Desviación Estándar

para datos agrupados

2

2

1

1

2

2

1

ss

n

n

fx

fx

s

n

i

iin

i

ii

Page 33: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Representa una medida relativa (por ciento)

que permite comparar grupos distintos.

Relaciona la desviación estándar con la

media aritmética.

Nos dice cuál es el por ciento de variación de

un grupo respecto a la media aritmética.

La fórmula es:

desviación estándar

media aritmética

Coeficiente de Variación

x

s

Page 34: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Ejemplos para aplicar

las fórmulas

Page 35: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Halla el rango, varianza y desviación

estándar usando fórmula 2.

Rango = 10-6 = 4

Ejemplo 1: Datos Crudos

Segundos de reacción antes de consumir un

gramo de droga THC

X (segundos) (x – ) (x - )2

10 10-8= 2 4

10 10-8 = 2 4

10 10-8 = 2 4

9 9-8 = 1 1

9 9-8 = 1 1

8 8- 8 = 0 0

7 7 – 8 = -1 1

7 7 – 8 = -1 1

6 6 - 8 = -2 4

6 6 – 8 = -2 4

6 6 – 8 = -2 4

88 28

x x

888

11x

2

2

2

2

1

28

11 1

282.8

10

2.8 1.67

ix xs

n

s

s

s x

Page 36: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

El mismo ejercicio anterior pero

usando la fórmula 3 para calcular s.

Ejemplo 2: Datos Crudos

Segundos de reacción antes de

consumir un gramo de droa THC

X (segundos) x2

10 100

10 100

10 100

9 81

9 81

8 64

7 49

7 49

6 36

6 36

6 36

88 732

2

2

2

2

2

2

1

88 7744732 732

11 11

10 10

732 704 282.8

10 10

2.8 1.67

i

i

xx

n

sn

s

s

s x

Page 37: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Halla la desviación intercuartil

Q3 = 3(n+1) = 36 = 9 ó 9na posición

4 4

Q3 = 10

Q1 = n+1 = 12 = 3 ó 3era pos.

4 4

Q1 = 6

= = 2

Interpreta este resultado

Ejemplo 3

Segundos de reacción antes de

consumir un gramo de droa THC

X (segundos) x2

10 100

10 100

10 100

9 81

9 81

8 64

7 49

7 49

6 36

6 36

6 36

Q3 - Q1

2

Q3 - Q1

2

10 - 6

2

DI =

Page 38: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Halla el coeficiente de variación

Coeficiente de Variación =

Desviación estándar =

Media aritmética

Interpreta este

resultado

Ejemplo 4

Segundos de reacción antes de

consumir un gramo de droa THC

X (segundos) x2

10 100

10 100

10 100

9 81

9 81

8 64

7 49

7 49

6 36

6 36

6 36

1.67 = 0.20875 = 0.21=21%

8

x

s

Page 39: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Halla la varianza y desviación estándar del grupo de

datos a continuación (Completar Tabla)

Ejemplo 5: Datos en Clases

Resultados de examen de estadística

Clases f x x . f x2 . f

35-41 1 38 38 1444

42-48 2 45 90 4050

49-55 2 52 104 5408

56-62 3 59 177 10443

63-69 7 66 462 30492

70-76 11 73 803 58619

77-83 9 80 720 57600

84-90 8 87 696 60552

91-97 6 94 564 53016

98-104 1 101 101 10201

50 3755 291825

Ver qué

columnas

se

necesitan

x, xf, x2f

Page 40: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Halla la varianza y desviación estándar del grupo de

datos a continuación (Clic para ver proceso)

Ejemplo 5: Datos en Clases

Resultados de examen de estadística

Clases f x x . f x2 . f

35-41 1 38 38 1444

42-48 2 45 90 4050

49-55 2 52 104 5408

56-62 3 59 177 10443

63-69 7 66 462 30492

70-76 11 73 803 58619

77-83 9 80 720 57600

84-90 8 87 696 60552

91-97 6 94 564 53016

98-104 1 101 101 10201

50 3755 291825

Page 41: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Continuación Ejemplo 52

2

2

2

2

2

( )

( 1)

(3755) 14,100,025291,825 291,825

50 50

49 49

291,825 282,000.5 9824.5200.5

49 49

200.5 14.16

x fx f

nsn

s

s

s

Page 42: Medidas de Variación - EDUG531 | Just another WordPress ... · Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos. Algunas de estas medidas son: rango,

Fin de la Lección