2 distribución frecuencias
DESCRIPTION
ESTADÍSTICA DESCRIPTIVATRANSCRIPT
ESTADÍSTICA ESTADÍSTICA DESCRIPTIVADESCRIPTIVA
Lic. Tatiana Rettis SalazarLic. Tatiana Rettis Salazar
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA
►RECOPILACIÓN RECOPILACIÓN ►CLASIFICACIÓN CLASIFICACIÓN ►PRESENTACIÓNPRESENTACIÓN►DESCRIPCIÓNDESCRIPCIÓN
CLASIFICACIÓNCLASIFICACIÓN
Los datos recolectados suelen ser Los datos recolectados suelen ser registrados en el orden que se registrados en el orden que se presentan, para facilitar su presentan, para facilitar su interpretación y análisis, es necesario se interpretación y análisis, es necesario se ordenen o clasifiquen de forma ordenen o clasifiquen de forma sistemática de acuerdo a su magnitud, y sistemática de acuerdo a su magnitud, y a sus características en grupos o sub a sus características en grupos o sub grupos llamadas Distribución de grupos llamadas Distribución de Frecuencias.Frecuencias.
CLASIFICACIÓNCLASIFICACIÓN
Distribución de Frecuencias, es un Distribución de Frecuencias, es un agrupamiento de datos en categorías agrupamiento de datos en categorías mutuamente excluyentes obteniendo el mutuamente excluyentes obteniendo el número de observaciones de cada número de observaciones de cada categoría.categoría.
CLASIFICACIÓNCLASIFICACIÓN
Distribución de Frecuencias para Distribución de Frecuencias para Variables CategóricasVariables Categóricas
Ejemplo: Un asistente social de una comunidad esta Ejemplo: Un asistente social de una comunidad esta interesado en conocer la calidad alimenticia de los interesado en conocer la calidad alimenticia de los niños, para ello interrogo a 50 de ellos obteniendo las niños, para ello interrogo a 50 de ellos obteniendo las siguientes respuestas.siguientes respuestas.Variable: Calidad Alimenticia:Variable: Calidad Alimenticia:
►Muy DeficienteMuy Deficiente MDMD►DeficienteDeficiente DD►RegularRegular RR►BuenaBuena BB►Muy Buena Muy Buena MBMB
Distribución de Distribución de Frecuencias para Variables Frecuencias para Variables
CategóricasCategóricasBB RR RR DD MDMD
RR BB DD BB BB
RR DD MDMD DD DD
DD RR RR RR RR
MDMD RR DD MDMD DD
RR DD BB DD MDMD
DD MBMB DD RR RR
BB DD RR MBMB DD
MDMD DD MDMD DD MDMD
RR BB DD RR BB
Distribución de Frecuencias para Distribución de Frecuencias para Variables CategóricasVariables Categóricas
Variable: Calidad Variable: Calidad Alimenticia:Alimenticia: ConteoConteo
FrecuenciFrecuenciaa
Frecuencia Frecuencia RelativaRelativa
Frecuencia Frecuencia PorcentualPorcentual
Muy DeficienteMuy Deficiente MDMD IIII IIIIIII III 88 0.160.16 16.00%16.00%
DeficienteDeficiente D D 1717 0.340.34 34.00%34.00%
RegularRegular R R IIII IIII IIII IIII IIII IIII 1515 0.30.3 30.00%30.00%
BuenaBuena BB IIII IIIIIII III 88 0.160.16 16.00%16.00%
Muy BuenaMuy Buena MB MB I I I I 22 0.040.04 4.00%4.00%
5050 11 100.00%100.00%
MÉTODOS GRÁFICOSMÉTODOS GRÁFICOS
►VARIABLES CUALITATIVAS:VARIABLES CUALITATIVAS: Diagrama de barrasDiagrama de barras Diagrama de sectores angularesDiagrama de sectores angulares
Métodos Gráficos para variables Métodos Gráficos para variables CategóricasCategóricas
0
5
10
15
20
Nº de Casos
MD D R B MB
Variable Calidad Alimenticia
Calidad Alimenticia en la Comunidad Rural Calidad Alimenticia
MD16%
D34%
R30%
B16%
MB4%
MD D R B MB
Diagrama de barras: Diagrama de barras: Se utilizan rectángulos Se utilizan rectángulos separados, que tienen como base a cada uno de las separados, que tienen como base a cada uno de las categorías y como altura la frecuencia de ese dato.categorías y como altura la frecuencia de ese dato.
Gráfica de Torta: Gráfica de Torta: Se forma al dividir un círculo en Se forma al dividir un círculo en sectores circulares de manera que: a) cada sector sectores circulares de manera que: a) cada sector circular equivale al porcentaje correspondiente a la circular equivale al porcentaje correspondiente a la categoría o grupo que representa; y b) la unión de los categoría o grupo que representa; y b) la unión de los sectores circulares forma el círculo y la suma de sus sectores circulares forma el círculo y la suma de sus porcentajes es 100%.porcentajes es 100%.
TEMPORARY .SELECT IF (h12>25 AND h12<45) .FREQUENCIES VARIABLES=cdea /STATISTICS=MODE /BARCHART FREQ /ORDER ANALYSIS .
Métodos Gráficos para Métodos Gráficos para variables Categóricasvariables Categóricas
►Variable nominalVariable nominal
Statistics
PEA5907235
0
1,00
Valid
Missing
N
Mode
PEA
4699861 79,6 79,6 79,6
1207374 20,4 20,4 100,0
5907235 100,0 100,0
Activo
Inactivo
Total
ValidFrequency Percent
ValidPercent
Cumulative Percent
PEA
Cases weighted by PONDERA
PEA
InactivoActivo
Fre
quen
cy
5000000
4000000
3000000
2000000
1000000
0
CLASIFICACIÓNCLASIFICACIÓN
Distribución de Frecuencias para Distribución de Frecuencias para Variables NuméricasVariables Numéricas
Ejemplo:Ejemplo:Los datos obtenidos por una trabajadora Los datos obtenidos por una trabajadora Social a quien le interesa conocer el Social a quien le interesa conocer el número de hijos por familias de una número de hijos por familias de una comunidad para llevar a cabo un estudio comunidad para llevar a cabo un estudio socio económico de estos datos.socio económico de estos datos.
Distribución de Distribución de Frecuencias para Variables Frecuencias para Variables
NuméricasNuméricas88 44 77 44 55
1010 33 55 22 44
22 99 44 66 22
55 66 88 33 66
00 1111 66 77 44
66 44 44 55 00
33 22 33 44 88
88 55 99 77 55
44 33 55 1010 33
77 99 88 66 99
Distribución de Distribución de Frecuencias para Variables Frecuencias para Variables
NuméricasNuméricasVariable: Variable:
Numero de Numero de Hijos: Hijos:
FrecuenciFrecuenciaa Frecuencia RelativaFrecuencia Relativa
Frecuencia Frecuencia PorcentualPorcentual
00 22 0.040.04 4.00%4.00%
11 00 0.000.00 0.00%0.00%
22 44 0.080.08 8.00%8.00%
33 66 0.120.12 12.00%12.00%
44 99 0.180.18 18.00%18.00%
55 77 0.140.14 14.00%14.00%
66 66 0.120.12 12.00%12.00%
77 44 0.080.08 8.00%8.00%
88 55 0.100.10 10.00%10.00%
99 44 0.080.08 8.00%8.00%
1010 22 0.040.04 4.00%4.00%
1111 11 0.020.02 2.00%2.00%
5050 100.00%100.00% 100.00%100.00%
Consideraciones que se deben tomar en Consideraciones que se deben tomar en cuenta en la construcción de cuadros de cuenta en la construcción de cuadros de frecuencias para datos cuantitativosfrecuencias para datos cuantitativos
► Los intervalos deben ser mutuamente excluyentes Los intervalos deben ser mutuamente excluyentes o no traslapados.o no traslapados.
► Se recomienda tener entre 5 y 15 intervalos.Se recomienda tener entre 5 y 15 intervalos.► Se debe tener en cuenta la naturaleza de la Se debe tener en cuenta la naturaleza de la
variable de interés, el número de datos y la variable de interés, el número de datos y la amplitud del conjunto de datos.amplitud del conjunto de datos.
► Es recomendable que los intervalos tengan igual Es recomendable que los intervalos tengan igual tamaño cuando se desea hacer comparaciones tamaño cuando se desea hacer comparaciones entre ellos. Además, usualmente, los intervalos son entre ellos. Además, usualmente, los intervalos son cerrados a la izquierda y abiertos a la derecha; cerrados a la izquierda y abiertos a la derecha; excepto el último intervalo que es cerrado en excepto el último intervalo que es cerrado en ambos lados.ambos lados.
► Cuando se desea comparar el cuadro a construir Cuando se desea comparar el cuadro a construir con un cuadro ya construido, los intervalos del con un cuadro ya construido, los intervalos del cuadro ya construido deben servir de base para la cuadro ya construido deben servir de base para la construcción de los intervalos del cuadro a construcción de los intervalos del cuadro a construir.construir.
Distribución de Distribución de Frecuencias para Variables Frecuencias para Variables
NuméricasNuméricasElementos que se debe tener en cuenta Elementos que se debe tener en cuenta para construir una tabla de distribución para construir una tabla de distribución de frecuencias por intervalos.de frecuencias por intervalos.►Alcance (A)Alcance (A)►Rango (R)Rango (R)►Intervalo de clase (Ii)Intervalo de clase (Ii)►Limite clase (Li)Limite clase (Li)►Ancho de clase (Ci)Ancho de clase (Ci)
Procedimiento de construcción de un cuadro de Procedimiento de construcción de un cuadro de frecuencias para datos continuos, con intervalos de frecuencias para datos continuos, con intervalos de igual tamaño, y aplicando la regla de Sturgesigual tamaño, y aplicando la regla de Sturges
Determinar el rango o amplitud de los datos. Rango = (Obsv. mayor valor) - (Obsv. Menor valor).
Establecer el número de intervalos mediante la regla de Sturges.
K 1 + 3.3 Log n Determinar el tamaño de intervalo de clase
común.Ci Rango / K
Establecer los límites de cada uno de los intervalos. LI1=Xmin LS1=LI1+ Ci
LIj=LSj-1 LSj=LIj + Ci
Verificar si el intervalo K contiene a la Obsv. Mayor valor.
Determinar las marcas de clase, las frecuencias absolutas, frecuencias relativas y porcentajes.
Distribución de Distribución de Frecuencias para Variables Frecuencias para Variables
NuméricasNuméricas► Definiremos como Definiremos como frecuenciafrecuencia de un dato el número de veces que este de un dato el número de veces que este aparece en el colectivoaparece en el colectivo. Siendo . Siendo nn la suma de las respectivas frecuencias de la suma de las respectivas frecuencias de cada dato cada dato ((n=ΣXin=ΣXi)). Este . Este nn será denominado como será denominado como frecuencia total. frecuencia total. A A efectos prácticos, asumiremos las siguientes definiciones de frecuencias: efectos prácticos, asumiremos las siguientes definiciones de frecuencias:
► a) frecuencias absolutas : a) frecuencias absolutas : es el número de datos contenidos en cada clase y es el número de datos contenidos en cada clase y se representa por nse representa por nii..
► b) frecuencias relativas: b) frecuencias relativas: es el cociente entre la frecuencia absoluta y el es el cociente entre la frecuencia absoluta y el tamaño de la muestra. La denotaremos por htamaño de la muestra. La denotaremos por hii
► c) frecuencias absoluta acumulada: c) frecuencias absoluta acumulada: es el número de veces que ha es el número de veces que ha aparecido en la muestra un valor menor o igual que el de la variableaparecido en la muestra un valor menor o igual que el de la variable, , se puede se puede acumular, en la tabla estadística en orden ascendente (Ni↑) o descendente acumular, en la tabla estadística en orden ascendente (Ni↑) o descendente (Ni↓)(Ni↓)
► d) frecuencia relativa acumulada: d) frecuencia relativa acumulada: al igual que en el caso anterior se calcula al igual que en el caso anterior se calcula como el cociente entre la frecuencia absoluta acumulada dividido por el tamaño como el cociente entre la frecuencia absoluta acumulada dividido por el tamaño de la muestra (Hi)de la muestra (Hi)..
► e) e) Marca de ClaseMarca de Clase, son los puntos medios de los intervalos de clase. (Xi)., son los puntos medios de los intervalos de clase. (Xi).
Distribución de Distribución de Frecuencias para Variables Frecuencias para Variables
NuméricasNuméricas
Variable: Variable: Numero de Numero de
Hijos: Hijos:
FrecueFrecuenciancia
MarcMarca de a de ClasClas
ee
FrecuenFrecuencia cia
RelativaRelativa
FrecuenFrecuencia cia PorcentPorcentualual
Frecuencia Frecuencia Absoluta Absoluta AcumuladaAcumulada
Frecuencia Frecuencia Relativa Relativa AcumuladaAcumulada
Frecuencia Frecuencia Porcentula Porcentula AcumuladaAcumulada
LiLi LsLs nini XiXi hihi hi %hi % NiNi Hi Hi Hi %Hi %
00 22 22 0.040.04 4.00%4.00%
22 44 1010 0.20.2 20.00%20.00%
44 66 1616 0.320.32 32.00%32.00%
66 88 1010 0.20.2 20.00%20.00%
88 1010 99 0.180.18 18.00%18.00%
1010 1212 33 0.060.06 6.00%6.00%
5050 11100.00100.00
%%
MÉTODOS GRÁFICOSMÉTODOS GRÁFICOS
►VARIABLES CUANTITATIVASVARIABLES CUANTITATIVAS:: Diagrama de bastones Diagrama de bastones HistogramaHistograma Polígono de frecuenciasPolígono de frecuencias Diagrama de sectoresDiagrama de sectores
Diagrama de bastonesDiagrama de bastones
Numero de Familias según el numero de Hijos
0
2
4
6
8
10
1 2 3 4 5 6 7 8 9 10 11 12
Numero de Hijos
Fre
cuen
cia
HistogramaHistograma
0
5
10
15
20
Fre
cuen
cia
Numero de Familias según el numero de Hijos
[0 - 2>
[2 - 4>
[4 - 6>
[6 - 8>
[8 - 10>
[10 - 12>
Polígono de frecuenciasPolígono de frecuencias
POLIGONO DE FRECUENCIAS
1, 2
2, 10
3, 16
4, 105, 9
6, 3
0
2
4
6
8
10
12
14
16
18
1 2 3 4 5 6
Marcas de Clase
Fre
cuen
cia
OJIVA
0
10
20
30
40
50
60
Numero de Hijos
Fre
cuen
cia
[0 - 2>
[2 - 4>
[4 - 6>
[6 - 8>
[8 - 10>
[10 - 12>
Diagrama de sectores Diagrama de sectores AngularesAngulares
Familias por Numero de Hijos
4%20%
32%20%
18%6% [0 - 2>
[2 - 4>
[4 - 6>
[6 - 8>
[8 - 10>
[10 -12>
La técnica tallo-hojaLa técnica tallo-hoja1. Ordenación de los datos, en forma ascendente.
Datos InicialesX1, X2, X3, ..., Xn
Datos Ordenados en forma ascendenteY1, Y2, Y3, ..., Yn
La técnica tallo-hojaLa técnica tallo-hoja
Observación
Parte 1
Parte 2
Conformado por cifras más notables(usualmente es la primera cifra)
Conformado por cifras menos notables
2. Formación del tallo. Para formarlo se debe considerar que en cada observación se puede considerar dos partes: una parte más notable (que usualmente es la primera cifra) y la otra parte menos notable constituida por las otras cifras.
La técnica tallo-hojaLa técnica tallo-hoja
En una columna se colocan, en forma ordenada y ascendente y a distancias iguales, desde el valor más bajo hasta el valor más alto correspondiente a la parte 1 o troncal, se hallen presentes o no dentro del conjunto de datos.
3. Formación de las hojas. Una hoja es el conjunto de dígitos que se encuentran a la derecha de un valor troncal. Cada uno de los valores troncales tiene cero, una o más hojas . Estas hojas se colocan, en forma ordenada y ascendente, con espaciamientos iguales, a la derecha del valor troncal correspondiente.
La técnica tallo-hojaLa técnica tallo-hoja
96 93 88 117 127 95 113 96 108
139 142 94 107 125 155 155 103 112
112 135 132 111 125 104 106 139 134
118 136 125 143 120 103 113 124 138
94 127 119 148 117 97 156 120 89
La técnica tallo-hojaLa técnica tallo-hojaTallo Hojas
8 8 9
9 6 3 5 6 4 4 7
10 8 7 3 4 6 3
11 7 3 2 7 2 1 9 8 3
12 7 5 7 0 5 5 0 4
13 9 5 2 9 4 6 8
14 8 2 3
15 6 5 5
Tallo Hojas
8 8 9
9 3 4 4 5 6 6 7
10 3 3 4 6 7 8
11 1 2 2 3 3 7 7 8 9
12 0 0 4 5 5 5 7 7
13 2 4 5 6 8 9 9
14 2 3 8
15 5 5 6
MÉTODOS ANALÍTICOSMÉTODOS ANALÍTICOSMEDIDAS DE TENDENCIA CENTRAL• Moda• Media• Mediana • Cuantiles: cuartiles, deciles y percentiles
MEDIDAS DE DISPERSIÓN
• Rango o recorrido• Recorrido intercuartílico• Varianza y desviación típica• Desviación media• Coeficientes de variación
MEDIDAS DE FORMA
• Coeficientes de asimetría