clase 9: medidas de centralización para datos agrupados

41
Clase 9: Medidas de Centralización para datos agrupados Dr. Félix Enrique Ayala Lic. Mariela Raiz Mayo, 2014 Universidad Nacional de Itapúa Facultad de Humanidades, Ciencias Sociales y Cultura Guaraní 1 CARRERA: Lic. En Psicología CURSO: 2do ASIGNATURA: Estadística Aplicada a la Psicología

Upload: sileas

Post on 19-Jan-2016

115 views

Category:

Documents


1 download

DESCRIPTION

Universidad Nacional de Itapúa. Facultad de Humanidades, Ciencias Sociales y Cultura Guaraní. Clase 9: Medidas de Centralización para datos agrupados. CARRERA: Lic. En Psicología CURSO: 2do ASIGNATURA: Estadística Aplicada a la Psicología. Dr. Félix Enrique Ayala Lic. Mariela Raiz. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Clase 9: Medidas de Centralización para datos agrupados

Clase 9: Medidas de Centralización para datos agrupados

Dr. Félix Enrique Ayala

Lic. Mariela Raiz Mayo, 2014

Universidad Nacional de Itapúa

Facultad de Humanidades, Ciencias Sociales y Cultura Guaraní

1

CARRERA: Lic. En PsicologíaCURSO: 2do

ASIGNATURA: Estadística Aplicada a la Psicología

Page 2: Clase 9: Medidas de Centralización para datos agrupados

2

Hasta la clase pasada se ha estudiado las medidas de centralización para datos no agrupados, es decir para los que no están organizados en tablas de frecuencias.

Recordar:

Page 3: Clase 9: Medidas de Centralización para datos agrupados

3

Los datos no agrupados son por ejemplo, los puntajes de 15 estudiantes en una prueba de actitudes hacia un reactivo determinados, que podría calificarse en valores que van del 1 al 7. Al ser aplicado dicho reactivo o escala de actitud a los 15 estudiantes se podría obtener los siguientes valores:

2 3 1 7 1 1 2 2 5 4 1 5 6 6 2

Para los valores anteriores se podría calcular las medidas de centralización como:La Media Aritmética, la Mediana y la Moda.

Page 4: Clase 9: Medidas de Centralización para datos agrupados

4

En el caso de la media aritmética solo se deben sumar todos los valores y luego dividir la suma por el total, es decir se debe aplicar la siguiente formula:

𝑥=∑ 𝑥𝑁

= 4815

=3,2

Page 5: Clase 9: Medidas de Centralización para datos agrupados

5

En el caso de la mediana, se debe buscar el valor central, como la cantidad de datos es 15, (un número impar) entonces se tendrá un solo valor central que se buscará una vez ordenado los datos de menor a mayor. Dichos datos ordenados se presenta de la siguiente manera:

1 1 1 1 2 2 2 2 3 4 5 5 6 6 7

Valor que se encuentra en el centro de los

datos agrupados, que es la MEDIANA

Page 6: Clase 9: Medidas de Centralización para datos agrupados

6

Para calcular la moda en de un conjunto de datos no agrupados se debe buscar el valor que más veces se repite en el conjunto de datos. En el caso del ejemplo encontramos que hay dos valores que se repita con mayor frecuencia que son el 1 y el 2; por lo tanto la moda del conjunto de dato son el 1 y el 2, y se dice en este caso que el conjunto de bimodal.

1 1 1 1 2 2 2 2 3 4 5 5 6 6 7

Los valor que más se repiten son el 1 y el 2,

por lo tanto la moda del conjunto son esto dos

valores.

Page 7: Clase 9: Medidas de Centralización para datos agrupados

7

Tal como se explicó hasta aquí, es la forma como se calculan la Media Aritmética, la Mediana y la Moda de un conjunto de datos no agrupados.

Seguidamente se mostraremos como se calculan las mismas tres medidas de centralización, pero para datos agrupados.

Page 8: Clase 9: Medidas de Centralización para datos agrupados

8

En el caso de datos agrupados se presenta dos situaciones:

i. Que el conjunto de datos esté agrupados pero no contengan intervalos, como podría ser el caso de la distribución de frecuencia de las calificaciones de un grupo de 40 alumnos en una asignatura determinada, los resultados se podría expresar de la siguiente manera:

Calificaciones F1 62 83 124 65 8

Total 40

La tabla es un ejemplo de datos agrupados pero sin intervalos

Page 9: Clase 9: Medidas de Centralización para datos agrupados

9

ii. Otra situación de datos agrupados se podría presentar en los casos de variables continuas o cuando el rango de variación es muy grande y se tiene una gran cantidad de datos. Como ejemplo se podría mencionar las puntuaciones de 200 estudiantes en un test motivacional, los resultados se podría expresar de la siguiente manera:

Puntajes F135 – 138 3131 – 134 5127 – 130 16123 – 126 23119 – 122 52115 – 118 49111 – 114 27107 – 110 18103 – 106 7

N 200

Page 10: Clase 9: Medidas de Centralización para datos agrupados

10

En este caso se tiene un rango de variación de los puntajes que va desde el valor menor: 106 hasta el valor mayor: 138 y un total de 200 observaciones distribuidas tal como se muestra en las frecuencias absolutas de la segunda columna.

Puntajes F135 – 138 3131 – 134 5127 – 130 16123 – 126 23119 – 122 52115 – 118 49111 – 114 27107 – 110 18103 – 106 7

N 200

Frecuencia absoluta correspondiente a cada uno de los intervalos de

clase

Page 11: Clase 9: Medidas de Centralización para datos agrupados

11

Los puntajes se representan en intervalos de ancho de clase c = 4; esto significa que en cada intervalo se cuentan o consideran 4 valores.

Por ejemplo en el primer intervalos que se representa por:

135 – 138, se consideran los siguientes valores: 135, 136, 137 y 138.

De la misma manera los demás intervalos que están por debajo del primero, tienen un ancho c = 4.

Page 12: Clase 9: Medidas de Centralización para datos agrupados

12

En el caso del cálculo de la Media Aritmética para datos agrupados, será necesario realizar las siguientes tareas:

Calculo de la Media Aritmética para datos agrupados en intervalos.

a) En primer lugar se debe calcular la Marca de Clase de los datos. La Marca de Clase es el valor central de cada uno de los intervalos de clase y se calcula sumando los límites inferior y superior de cada intervalo y luego se divide la suma por 2.

Este cálculo se realiza para todos los intervalos, puede que salga un valor decimal en ese caso se escribe con un decimal el valor obtenido.

Page 13: Clase 9: Medidas de Centralización para datos agrupados

13

Como ejemplo utilizaremos los siguientes datos:

Puntajes f X135 – 138 3 136,5131 – 134 5  127 – 130 16  123 – 126 23  119 – 122 52  115 – 118 49  111 – 114 27  107 – 110 18  103 – 106 7  

N 200  

La marca de clase del primer intervalo se calcula sumando los límites: inferior y superior: 135 + 138, que da la suma 273; esta suma se divide por 2; lo cual arroja como cociente: 136,5 que es la marca de clase del primer intervalo.

Page 14: Clase 9: Medidas de Centralización para datos agrupados

14

Se completa las marcas de clase para los demás intervalos:

Puntajes f X135 – 138 3 136,5131 – 134 5127 – 130 16123 – 126 23119 – 122 52115 – 118 49111 – 114 27107 – 110 18103 – 106 7

N 200  

Page 15: Clase 9: Medidas de Centralización para datos agrupados

15

Se completa las marcas de clase para los demás intervalos:

Puntajes f X135 – 138 3 136,5131 – 134 5 132,5127 – 130 16123 – 126 23119 – 122 52115 – 118 49111 – 114 27107 – 110 18103 – 106 7

N 200  

Page 16: Clase 9: Medidas de Centralización para datos agrupados

16

Se completa las marcas de clase para los demás intervalos:

Puntajes f X135 – 138 3 136,5131 – 134 5 132,5127 – 130 16 128,5123 – 126 23119 – 122 52115 – 118 49111 – 114 27107 – 110 18103 – 106 7

N 200  

Page 17: Clase 9: Medidas de Centralización para datos agrupados

17

Se completa las marcas de clase para los demás intervalos:

Puntajes f X135 – 138 3 136,5131 – 134 5 132,5127 – 130 16 128,5123 – 126 23 124,5119 – 122 52115 – 118 49111 – 114 27107 – 110 18103 – 106 7

N 200  

Page 18: Clase 9: Medidas de Centralización para datos agrupados

18

Se completa las marcas de clase para los demás intervalos:

Puntajes f X135 – 138 3 136,5131 – 134 5 132,5127 – 130 16 128,5123 – 126 23 124,5119 – 122 52 120,5115 – 118 49111 – 114 27107 – 110 18103 – 106 7

N 200  

Page 19: Clase 9: Medidas de Centralización para datos agrupados

19

Se completa las marcas de clase para los demás intervalos:

Puntajes f X135 – 138 3 136,5131 – 134 5 132,5127 – 130 16 128,5123 – 126 23 124,5119 – 122 52 120,5115 – 118 49 116,5111 – 114 27107 – 110 18103 – 106 7

N 200  

Page 20: Clase 9: Medidas de Centralización para datos agrupados

20

Se completa las marcas de clase para los demás intervalos:

Puntajes f X135 – 138 3 136,5131 – 134 5 132,5127 – 130 16 128,5123 – 126 23 124,5119 – 122 52 120,5115 – 118 49 116,5111 – 114 27 112,5107 – 110 18103 – 106 7

N 200  

Page 21: Clase 9: Medidas de Centralización para datos agrupados

21

Se completa las marcas de clase para los demás intervalos:

Puntajes f X135 – 138 3 136,5131 – 134 5 132,5127 – 130 16 128,5123 – 126 23 124,5119 – 122 52 120,5115 – 118 49 116,5111 – 114 27 112,5107 – 110 18 108,5103 – 106 7

N 200  

Page 22: Clase 9: Medidas de Centralización para datos agrupados

22

Se completa las marcas de clase para los demás intervalos:

Puntajes f X135 – 138 3 136,5131 – 134 5 132,5127 – 130 16 128,5123 – 126 23 124,5119 – 122 52 120,5115 – 118 49 116,5111 – 114 27 112,5107 – 110 18 108,5103 – 106 7 104,5

N 200  

Page 23: Clase 9: Medidas de Centralización para datos agrupados

23

Calculo de la Media Aritmética para datos agrupados en intervalos.

b) Luego de calcular la marca de clase para cada uno de los intervalos se procede a multiplicar la frecuencia absoluta (f) por la marca de clase de cada intervalo, este producto parcial se ubica en una columna siguiente, tal como se ilustra en la tabla siguiente:

Puntajes f X f*X

135 – 138 3 136,5 409,5131 – 134 5 132,5 662,5127 – 130 16 128,5 2.056,0123 – 126 23 124,5 2.863,5119 – 122 52 120,5 6.266,0115 – 118 49 116,5 5.708,5111 – 114 27 112,5 3.037,5107 – 110 18 108,5 1.953,0103 – 106 7 104,5 731,5

N 200   23.688

409,5 = 3 * 136,5

Page 24: Clase 9: Medidas de Centralización para datos agrupados

24

Calculo de la Media Aritmética para datos agrupados en intervalos.

c) Luego de calcular los productos parciales de cada frecuencia absoluta (f) por la marca de clase (X) de cada intervalo, se debe hallar la suma de todos estos productos: en el caso del ejemplo la suma se representa por:

∑ 𝑓 ×𝑋=23.688

Page 25: Clase 9: Medidas de Centralización para datos agrupados

25

Calculo de la Media Aritmética para datos agrupados en intervalos.

d) Luego de hallar la suma de los productos parciales: se divide esta suma por N, para obtener la media aritmética, cuya fórmula para datos agrupados está dada por:

𝑥=∑ 𝑓 ×𝑋

𝑁=23.688

200=118 ,4

Page 26: Clase 9: Medidas de Centralización para datos agrupados

26

En el caso del cálculo de la Mediana para datos agrupados, será necesario realizar la siguiente fórmula:

Calculo de la Mediana para datos agrupados en intervalos.

cf

fiNLiMd

med

2

Dónde:

Li = Limite real inferior del intervalo donde se encuentra la mediana

fmed = Frecuencia absoluta del intervalo donde se encuentra la mediana

= Suma de todas las frecuencias absolutas de los intervalos inferiores al intervalo donde

se encuentra la mediana

c = Ancho del intervalo donde se encuentra la mediana

fi

Como ejemplo de aplicación calcularemos la mediana para el siguiente conjunto de datos agrupados en intervalos

Page 27: Clase 9: Medidas de Centralización para datos agrupados

27

Calculo de la Mediana para datos agrupados en intervalos.

Puntajes f Fa<135 – 138 3131 – 134 5127 – 130 16  123 – 126 23  119 – 122 52  115 – 118 49  111 – 114 27107 – 110 18  103 – 106 7  

N 200  

Intervalos mayores están arriba de la tabla

Intervalos menores están abajo de la tabla

Como se podrá observar en la tabla de frecuencia los intervalos menores están en la parte inferior de la

distribución.

Page 28: Clase 9: Medidas de Centralización para datos agrupados

28

Como en el caso del cálculo de la media aritmética indicaremos las tareas que se deben realizar para calcular la mediana.

Calculo de la Mediana para datos agrupados en intervalos.

a) En primer lugar es necesario calcular la frecuencia acumulada menor de la distribución. Para ello es necesario identificar la ubicación de los intervalos de clases menores donde están, como en este caso los valores menores de los intervalos están debajo de la tabla, se inicia desde abajo hacia arriba el cálculo de la frecuencia acumulada menor.

Puntajes f Fa<

135 – 138 3 200131 – 134 5 197

127 – 130 16 192123 – 126 23 176119 – 122 52 153115 – 118 49 101111 – 114 27 52107 – 110 18 25103 – 106 7 7

N 200  

Valores de la frecuencia acumulada menor.

Page 29: Clase 9: Medidas de Centralización para datos agrupados

29

Calculo de la Mediana para datos agrupados en intervalos.

b) Luego de calcular la frecuencia acumulada menor, se determina cual es el valor de , que en el caso del ejemplo es:

c) Posteriormente se busca en la columna correspondiente a la frecuencia acumulada menor un valor igual a , en caso de que no se encuentra un valor idéntico, se busca un valor mayor a pero el más próximo a dicho valor. Como en el caso del ejemplo no existe un valor igual a , entonces identificamos uno que sea mayor pero más próximo, que en el caso del ejemplo es 101. Este valor encontrado nos indica el intervalo en la que se encuentra la mediana.

Page 30: Clase 9: Medidas de Centralización para datos agrupados

30

Calculo de la Mediana para datos agrupados en intervalos.

Puntajes f Fa<135 – 138 3 200131 – 134 5 197127 – 130 16 192123 – 126 23 176119 – 122 52 153115 – 118 49 101111 – 114 27 52107 – 110 18 25103 – 106 7 7

N 200  

Intervalo donde está la MEDIANA

Page 31: Clase 9: Medidas de Centralización para datos agrupados

31

d. Una vez identificado el intervalo donde se encuentra la mediana se podrá obtener los datos necesarios para la fórmula que se mencionó anteriormente y que nos permitirá calcular la mediana. Dichos datos son los siguientes:

Calculo de la Mediana para datos agrupados en intervalos.

Li = Limite inferior del intervalo donde se encuentra la mediana, en este caso el valor de Li =

115

fmed = Frecuencia absoluta del intervalo donde se encuentra la mediana, en este caso el valor

de fmed = 49

= Suma de todas las frecuencias absolutas de los intervalos inferiores al intervalo donde

se encuentra la mediana, En este caso = 52

c = Ancho del intervalo donde se encuentra la mediana, en este caso c = 4

fi

fi

Page 32: Clase 9: Medidas de Centralización para datos agrupados

32

Con estos datos se puede aplicar la formula mencionada:

Calculo de la Mediana para datos agrupados en intervalos.

918,118918,3115449

481154

49

521001152

c

f

fiNLiMd

med

e. Este resultado final es el valor de la Mediana para el conjunto de

datos agrupados en intervalos. Recordemos que la mediana es el

valor central del conjunto de datos ordenados, lo cual se podrá

interpretar que el 50% de todos los valores del conjunto son menores

a 118,918 y el otro 50% son mayores a este valor.

Page 33: Clase 9: Medidas de Centralización para datos agrupados

33

En el caso del cálculo de la Moda para datos agrupados, será necesario realizar la siguiente fórmula:

Calculo de la Moda para datos agrupados en intervalos.

Dónde:

Li = Limite real inferior del intervalo donde se encuentra la moda

D1 = Es la diferencia entre la frecuencias más alta y la frecuencia del intervalo inferior al

intervalo donde está la moda.

D2 = Es la diferencia entre la frecuencias más alta y la frecuencia del intervalo siguiente o

mayor al intervalo donde está la moda.

c = Ancho del intervalo donde se encuentra la moda

cDD

DLiMo

21

1

Page 34: Clase 9: Medidas de Centralización para datos agrupados

34

Como ejemplo de aplicación utilizaremos los datos correspondientes a los puntajes de 200 estudiantes para aplicar al cálculo de la moda de datos agrupados en intervalos

Calculo de la Moda para datos agrupados en intervalos.

Puntajes f135 – 138 3131 – 134 5127 – 130 16123 – 126 23 119 – 122 52115 – 118 49111 – 114 27107 – 110 18103 – 106 7

N 200

La frecuencia mas alta, en este caso corresponde al intervalo de

la Moda

Page 35: Clase 9: Medidas de Centralización para datos agrupados

35

Para proceder al cálculo de la moda se debe seguir los siguientes pasos:

Calculo de la Moda para datos agrupados en intervalos.

Puntajes f135 – 138 3131 – 134 5127 – 130 16123 – 126 23 119 – 122 52115 – 118 49111 – 114 27107 – 110 18103 – 106 7

N 200

Intervalo con la frecuencia mas alta, en este caso corresponde al

intervalo de la Moda

a) En primer lugar es necesario identificar cual es el intervalo que tiene la frecuencia más alta, en este caso corresponde al intervalo 119 – 122, cuya frecuencia es 52.

Page 36: Clase 9: Medidas de Centralización para datos agrupados

36

Calculo de la Moda para datos agrupados en intervalos.

Puntajes f135 – 138 3131 – 134 5127 – 130 16123 – 126 23 119 – 122 52115 – 118 49111 – 114 27107 – 110 18103 – 106 7

N 200

Límite inferior del intervalo donde está la moda Li = 119

b) Una vez ubicado en la tabla de frecuencia cual es el intervalo con mayor frecuencia se debe calcular los siguientes datos:

Page 37: Clase 9: Medidas de Centralización para datos agrupados

37

Calculo de la Moda para datos agrupados en intervalos.

Puntajes f135 – 138 3131 – 134 5127 – 130 16123 – 126 23 119 – 122 52115 – 118 49111 – 114 27107 – 110 18103 – 106 7

N 200

D1 = 52 – 49 = 3

c) D1: Que es la diferencia entre la frecuencia más alta y la frecuencia absoluta del intervalo menor o anterior, en este caso es: D1 = 52 – 49 = 3

Page 38: Clase 9: Medidas de Centralización para datos agrupados

38

Calculo de la Moda para datos agrupados en intervalos.

Puntajes f135 – 138 3131 – 134 5127 – 130 16123 – 126 23 119 – 122 52115 – 118 49111 – 114 27107 – 110 18103 – 106 7

N 200

D2 = 52 – 23 = 29

d) D2: Que es la diferencia entre la frecuencia más alta y la frecuencia absoluta del intervalo mayor o siguiente, en este caso es: D2 = 52 – 23 = 29

Page 39: Clase 9: Medidas de Centralización para datos agrupados

39

Calculo de la Moda para datos agrupados en intervalos.

Puntajes f135 – 138 3131 – 134 5127 – 130 16123 – 126 23 119 – 122 52115 – 118 49111 – 114 27107 – 110 18103 – 106 7

N 200

c = 4

e) El ancho del intervalo donde está la moda, en este caso es: c = 4

Page 40: Clase 9: Medidas de Centralización para datos agrupados

40

Una vez que se cuenta con todos los datos necesarios para la fórmula se los reemplaza en de la siguiente manera:

Calculo de la Moda para datos agrupados en intervalos.

375,119375,0119432

31194

293

3119

21

1

cDD

DLiMo

Este resultado final es el valor de la Moda para el conjunto de datos agrupados en intervalos. Recordemos que la Moda es el valor con mayor frecuencia del conjunto de datos, lo cual se podrá interpretar que el 119,375 es el que más veces se repite en la distribución.

Page 41: Clase 9: Medidas de Centralización para datos agrupados

Dr. Félix Enrique Ayala

Lic. Mariela Raiz Mayo, 2014

41

MUCHAS GRACIAS POR SU ATENCIÓN Y A PRACTICAR