distribucion de frecuecia
DESCRIPTION
Distribucion de FrecuenciaTRANSCRIPT
23/01/2011
DISTRIBUCIÓN DE FRECUENCIA PARA DATOS NO AGRUPADOS
ESTADÍSTICA DESCRIPTIVA
Una de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación de resultados, es decir, recoger la información de la muestra resumida en una tabla, que denominaremos DISTRIBUCIÓN DE FRECUENCIAS, en la que cada valor de la variable o clase se le asocian el número de veces que ha aparecido, su proporción con respecto a otros valores de la variable, etc. En caso de que las variables estén al menos en escala ordinal aparecen opcionalmente las frecuencias acumuladas absolutas y acumuladas porcentuales.
Variables o clases
Frecuencia(F)
Frecuencia Relativa
(Fr%)
Frecuencia Acumulada
(Fa )
Frecuencia Relativa
Acumulada(Fra%)
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS,
23/01/2011
Definiremos como frecuencia de un dato el número de veces que este aparece en el colectivo. Siendo N la suma de las respectivas frecuencias de cada dato (N=ΣXi). Este N será denominado como frecuencia total. A efectos prácticos, asumiremos las siguientes definiciones de frecuencias: a)frecuencias Absolutas : es el número de veces que aparece dicho valor de la variable y se representa por F. b)frecuencias Relativas: es el cociente entre la frecuencia absoluta y el tamaño de la muestra. La denotaremos por Fr% c)frecuencias Absoluta Acumulada: es el número de veces que ha aparecido en la muestra un valor menor o igual que el de la variable, se puede acumular, en la tabla estadística en orden ascendente (Fa↑) o descendente (Fa↓) d) frecuencia Relativa Acumulada: al igual que en el caso anterior se calcula como el cociente entre la frecuencia absoluta acumulada dividido por el tamaño de la muestra (N).(Far%)
DISTRIBUCIÓN DE FRECUENCIA PARA DATOS NO AGRUPADOS
ESTADÍSTICA DESCRIPTIVA
23/01/2011
REPRESENTACIÓN GRAFICAS DE VARIABLES CUALITATIVAS
El Gráfico es la representación en el plano, de la información estadística, con el fin de obtener una impresión visual global del material presentado, que facilite su rápida comprensión. Los gráficos son una alternativa a las tablas. Se emplean símbolos, barras, polígonos y sectores, de los datos contenidos en tablas de frecuencias.
Algunos requisitos recomendables al construir un gráfico son:
Evitar distorsiones por escalas exageradas.Elección adecuada del tipo de gráfico, según los objetivos y
tamaño de recorrido de las variables.Sencillez y autoexplicación.
Al igual que las tablas estadísticas, los gráficos estadísticos deben tener un título y una explicación de QUE, DONDE y CUANDO se obtuvo la información.
ESTADÍSTICA DESCRIPTIVA
23/01/2011
REPRESENTACIÓN GRAFICAS DE VARIABLES CUALITATIVAS
ESTADÍSTICA DESCRIPTIVA
Trataremos Cuatro tipos de gráficos estadísticos:Gráfico de sectores o tortasGráficos de Barras
Gráfico de sectores o tortasEste tipo de diagramas consideran una figura geométrica en que la distribución de frecuencias se reparte dentro de la figura como puede ser una dona, pastel, círculo o anillo, en el que cada porción dentro de la figura representa la información porcentual del total de datos.
Características de los gráficos de sectoresNo muestran frecuencias acumuladas.Se prefiere para el tratamiento de datos cualitativos La mayor área (o porción de la figura) representa la mayor
frecuencia.Son muy fáciles de elaborar.La figura completa equivale al 100% de los datos (360º).
18%
21%
32%
14%
14%
Grafico de Torta
Candidato 1Candidato 2Candidato 3Candidato 4Candidato 5
23/01/2011
REPRESENTACIÓN GRAFICAS DE VARIABLES CUALITATIVAS
Ejemplo de Gráfico de sectores o tortasRealizar un diagrama de sectores a partir de la siguiente tabla de frecuencia que resume las preferencias de un grupo de encuestados hacia cinco candidatos a elecciones locales:
Clase Frecuencia
Candidato 1 25
Candidato 2 30
Candidato 3 45
Candidato 4 20
Candidato 5 20
Total 140
Pasos para su construcción1.-Determinar las frecuencias relativas para cada clase.2.- Determinar los ángulos que representan las porciones dentro de la figura para cada clase.
ESTADÍSTICA DESCRIPTIVA
23/01/2011
REPRESENTACIÓN GRAFICAS DE VARIABLES CUALITATIVAS
Un círculo está formado por un ángulo de 360º. La porción correspondiente al Candidato 1 equivale a un 17.85% de esos 360º, es decir, 64,296º (0.1785*360 = 64,296º.) Gráficamente tendríamos (se parte desde el eje vertical superior, y se comienza a graficar cada clase en sentido de las manecillas del reloj):
La tabla final con los ángulos repartidos para cada clase quedaría:
Clase (F) Fr% AnguloCandidato 1 25 0,17857 64,2857Candidato 2 30 0,21428 77,1428Candidato 3 45 0,32142 115,7142Candidato 4 20 0,14285 51,4285Candidato 5 20 0,14285 51,4285
Total 140 1 360
18%
21%
32%
14%
14%
Grafico de Torta
Candidato 1
Candidato 2
Candidato 3
Candidato 4
Candidato 5
ESTADÍSTICA DESCRIPTIVA
23/01/2011
REPRESENTACIÓN GRAFICAS DE VARIABLES CUALITATIVAS
Diagramas de Barras. Se utiliza para representar datos cualitativos y cuantitativos, con datos de tipo discreto. En el eje x se representan los datos ordenados en clases mientras que en el eje y se pueden representar frecuencias absolutas o relativas. Todas las barras deben ser de igual ancho y estar igualmente espaciadas . El ejemplo para este tipo de representación se realizara con los datos del ejemplo anterior
Clase (F) Fr% Fa Fra%Candidato 1 25 0,17857 25 0.17857Candidato 2 30 0,21428 55 0.39285Candidato 3 45 0,32142 100 0.71472Candidato 4 20 0,14285 120 0.855712Candidato 5 20 0,14285 140 1
Total 140 1
Candidato 1 Candidato 2 Candidato 3 Candidato 4 Candidato 50
5
10
15
20
25
30
35
40
45
Grafica de Barras
Frec
uenc
ia
ESTADÍSTICA DESCRIPTIVA
23/01/2011
ESTADÍSTICA DESCRIPTIVA
DISTRIBUCIÓN DE FRECUENCIA PARA DATOS AGRUPADOS
Es aquella distribución en la que la disposición tabular de los datos estadísticos se encuentran ordenados en clases y con la frecuencia de cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase. No existen normas establecidas para determinar cuándo es apropiado utilizar datos agrupados o datos no agrupados; sin embargo, se sugiere que cuando el número total de datos (N) es igual o superior 50 se utilizará la distribución de frecuencia para datos agrupados, también se utilizará este tipo de distribución cuando se requiera elaborar gráficos lineales como el histograma, el polígono de frecuencia
La razón fundamental para utilizar la distribución de frecuencia de clases es proporcionar mejor comunicación acerca del patrón establecido en los datos y facilitar la manipulación de los mismos. Los datos se agrupan en clases con el fin de sintetizar, resumir, condensar o hacer que la información obtenida de una investigación sea manejable con mayor facilidad.
23/01/2011
DISTRIBUCIÓN DE FRECUENCIA PARA DATOS AGRUPADOS
COMPONENTES DE UNA DISTRIBUCIÓN DE FRECUENCIA DE CLASE
1.- Rango o Amplitud total (recorrido).- Es el límite dentro del cual están comprendidos todos los valores de la serie de datos, en otras palabras, es el número de diferentes valores que toma la variable en un estudio o investigación dada. Es la diferencia entre el valor máximo de una variable y el valor mínimo que ésta toma en una investigación cualquiera. El rango es el tamaño del intervalo en el cual se ubican todos los valores que pueden tomar los diferentes datos de la serie de valores, desde el menor de ellos hasta el valor mayor estando incluidos ambos extremos. El rango de una distribución de frecuencia se designa con la letra R.
R= Valor Mayor – Valor Menor
ESTADÍSTICA DESCRIPTIVA
23/01/2011
DISTRIBUCIÓN DE FRECUENCIA PARA DATOS AGRUPADOS
COMPONENTES DE UNA DISTRIBUCIÓN DE FRECUENCIA DE CLASE
2.-Clase o Intervalo de clase.- Son divisiones o categorías en las cuales se agrupan un conjunto de datos ordenados con características comunes. En otras palabras, son fraccionamientos del rango o recorrido de la serie de valores para reunir los datos que presentan valores comprendidos entre dos limites. Una regla práctica para determinar cuántos intervalos van a incluirse es el uso de una fórmula dada por Sturges. Esta fórmula es
donde:k: número de intervalos de clase,n: número de valores en el conjunto de datos bajo consideración
La respuesta obtenida bajo la fórmula de Sturges no debe considerarse como definitiva, sino solo como una guía.( este valor tiene que ser un numero entero)
k = 1 + 3,322 (log n)
ESTADÍSTICA DESCRIPTIVA
23/01/2011
DISTRIBUCIÓN DE FRECUENCIA PARA DATOS AGRUPADOS
COMPONENTES DE UNA DISTRIBUCIÓN DE FRECUENCIA DE CLASE
3.-Amplitud de Clase, Longitud o Ancho de una Clase : La amplitud o longitud de una clase es el número de valores o variables que concurren a una clase determinada. La amplitud de clase se designa con las letras c. Esta amplitud puede determinarse dividiendo el recorrido entre el valor de k, el numero de intervalos de clase. Simbólicamente, la amplitud del intervalo de clase está dada por
ESTADÍSTICA DESCRIPTIVA
23/01/2011
DISTRIBUCIÓN DE FRECUENCIA PARA DATOS AGRUPADOS
COMPONENTES DE UNA DISTRIBUCIÓN DE FRECUENCIA DE CLASE
4.-Punto medio o Marca de Clase: El centro de la clase, es el volar de los datos que se ubica en la posición central de la clase y representa todos los demás valores de esa clase. Este valor se utiliza para el calculo de la media aritmética.
Intervalo de clase
Ancho de clase= Ic
Limite superior (Ls)Limite Inferior (Li)
Marca de Clase
ESTADÍSTICA DESCRIPTIVA
23/01/2011
DISTRIBUCIÓN DE FRECUENCIA PARA DATOS AGRUPADOS
Es dentro de las técnicas de análisis exploratorio de datos una de más usadas ya que permite mostrar el orden de rangos así como la forma de un conjunto de datos en forma simultanea Se caracteriza por ser fácil de construir y dar más información que un histograma, debido a que muestra los valores realesNo hay cantidad única de tallos ni hojas aún cuando se recomienda seleccionar entre 5 a 20 tallos
METODOD PARA DETERMINAR LA FRECUENCIA DE CADA CLASE Diagrama de tallo y hoja (Stem-and-Leaf)
ESTADÍSTICA DESCRIPTIVA
23/01/2011
DISTRIBUCIÓN DE FRECUENCIA PARA DATOS AGRUPADOS
METODOD PARA DETERMINAR LA FRECUENCIA DE CADA CLASE Diagrama de tallo y hoja (Stem-and-Leaf)
Ejemplo:Trace un diagrama de tallo y hoja para los siguientes datos.70, 72, 75, 64, 58, 83, 80, 82, 76, 75, 68, 65, 57, 78, 85, 721.Ordenar en forma ascendente2.Seleccionar rangos (ancho de clases) define tallos3.Incorporar hojas
5 7 86 4 5 87 0 2 2 5 5 6 88 0 2 3 5
HojaTallo
ESTADÍSTICA DESCRIPTIVA
23/01/2011
REPRESENTACIÓN GRAFICAS DE VARIABLES CUALITATIVAS
Histogramas y Polígonos de Frecuencia
Histograma de FrecuenciaEste gráfico se puede preparar con datos que han sido resumido en una distribución de frecuenciaSe coloca la variable de interés en el eje horizontal y la distribución de frecuencia el verticalA diferencia del gráfico de barras no hay separación entre los rectángulos formados por las clases adyacentes, se completa con la línea vertical que separa a cada uno de ellosCuando se traza un línea recta entre cada punto medio de clase se construye un polígono de frecuencia
ESTADÍSTICA DESCRIPTIVA
23/01/2011
REPRESENTACIÓN GRAFICAS DE VARIABLES CUALITATIVAS
ESTADÍSTICA DESCRIPTIVA
Polígono de Frecuencias Alternativo al histograma de frecuencias podemos representar la información a través de los llamados polígonos de frecuencias. Estos se construyen a partir de los puntos medios de cada clase. La utilización de los puntos medios o marcas de clase son llevados al escenario gráfico mediante la utilización de los polígonos de frecuencias. Se construye uniendo los puntos medios de cada clase localizados en las tapas superiores de los rectángulos utilizados en los histogramas de las gráficas. Su utilidad se hace necesaria cuando desean destacarse las variables de tendencia central, como son media, modas y medianas
23/01/2011
ESTADÍSTICA DESCRIPTIVA
EJEMPLOUna tienda realizo un trabajo para determinar el precio de determinado articulo en las tiendas de la competencia La siguiente tabla muestra los precios en Bsf de este artículo. Realizar la distribución de frecuencia
DISTRIBUCIÓN DE FRECUENCIA PARA DATOS AGRUPADOS
0.738 0.729 0.743 0.740 0.736 0.741 0.735 0.731 0.736
0.728 0.737 0.736 0.735 0.724 0.733 0.742 0.736 0.739
0.745 0.736 0.742 0.740 0.728 0.738 0.725 0.733 0.734
0.733 0.730 0.732 0.730 0.739 0.734 0.738 0.739 0.727
0.735 0.732 0.735 0.727 0.734 0.732 0.736 0.741 0.736
0.732 0.737 0.731 0.746 0.735 0.735 0.729 0.734 0.730
0.730 0.735 0.732 0.700 0.750 0.722 0.729 0.733 0.750
0.732 0.736 0.742 0.727 0.750 0.738 0.725 0.741 0.728
0.735 0.736 0.732 0.731 0.759 0.741 0.751 0.755 0.740
0.754 0.756 0.758 0.729 0.755 0.789 0.800 0.810 0.810
23/01/2011
ESTADÍSTICA DESCRIPTIVA
COMPONENTES DE UNA DISTRIBUCIÓN DE FRECUENCIA DE CLASE1.- Rango o Amplitud total (recorrido)
R= Valor Mayor – Valor Menor = 0.81- 0.7 = 0.11
DISTRIBUCIÓN DE FRECUENCIA PARA DATOS AGRUPADOS
2.-Clase o Intervalo de clase.-
k = 1 + 3,322 (log n) ; K = 1+3.322 ( Log 90) = 7.5 = 8
3.-Amplitud de Clase, Longitud o Ancho de una Clase
23/01/2011
70 072 2455777888999973 00001112222222333344445555555566666666677888899974 000111122235675 000145568978 980 081 00
ESTADÍSTICA DESCRIPTIVA
COMPONENTES DE UNA DISTRIBUCIÓN DE FRECUENCIA DE CLASE
DISTRIBUCIÓN DE FRECUENCIA PARA DATOS AGRUPADOS
Stem-and-Leaf unit = 0,001 1|2 Representa 0,012
HojaTallo
23/01/2011
ESTADÍSTICA DESCRIPTIVA
DISTRIBUCIÓN DE FRECUENCIA PARA DATOS AGRUPADOS
Distribución de frecuencia
Intervalos F Fr% Fa Fra% CC
0.7 0.713 1 1.111 1 1.111 0.7068
0.713 0.727 7 7.778 8 8.889 0.720
0.727 0.741 62 38.889 70 77.778 0.734
0.741 0.755 13 14.444 83 92.222 0.748
0.755 0.768 3 3.333 86 95.556 0.761
0.768 0.782 0 0 86 95.556 0.775
0.782 0.796 1 1.111 87 96.667 0.789
0.796 0.81 3 3.333 90 100 0.803
80 100
23/01/2011
REPRESENTACIÓN GRAFICAS DE VARIABLES CUALITATIVAS
ESTADÍSTICA DESCRIPTIVA