unidad 3 estadistica descriptiva

Upload: ivanett-cruz-sarabia

Post on 11-Oct-2015

24 views

Category:

Documents


0 download

TRANSCRIPT

  • UNIDAD 3 ESTADISTICA DESCRIPTIVA

    Una de las ramas de la Estadstica ms accesible a la mayora de la poblacin es la Descriptiva. Esta parte se dedica nica y exclusivamente al ordenamiento y tratamiento mecnico de la informacin para su presentacin por medio de tablas y de representaciones grficas, as como de la obtencin de algunos parmetros tiles para la explicacin de la informacin.

    La Estadstica Descriptiva es la parte que conocemos desde los cursos de educacin primaria, que se ensea en los siguientes niveles y que, por lo general, no pasa a ser un anlisis ms profundo de la informacin. Es un primer acercamiento a la informacin y, por esa misma razn, es la manera de presentar la informacin ante cualquier lector, ya sea especialista o no. Sin embargo, lo anterior no quiere decir que carezca de metodologa o algo similar, sino que, al contrario, por ser un medio accesible a la mayora de la poblacin humana, resulta de suma importancia considerar para as evitar malentendidos, tergiversaciones o errores.

    3.1 Conceptos bsicos de estadstica: Definicin, Teora de decisin, Poblacin, Muestra aleatoria, Parmetros aleatorios.

    POBLACION es el conjunto de todos los sucesos susceptibles de aparecer en un problema y que interesan a la persona que hace el estudio; y sealamos que una MUESTRA en un subconjunto de mediciones seleccionadas de la poblacin. La poblacin segn su tamao puede ser: finita o infinita; y si nos referimos a su nmero se toma como el tamao de la poblacin.

    El concepto de infinita slo existe en teora pues en la prctica nos encontraremos aplicacin a poblaciones de elementos infinitos: Estrellas del universo (tiempo y costo). Se elige una MUESTRA lo suficientemente representativa de la poblacin.

    Muestreo Aleatorio

    Una muestra se dice que es extrada al azar cuando la manera de seleccin es tal, que cada elemento de la poblacin tiene igual oportunidad de ser seleccionado.

    Una muestra aleatoria es tambin llamada una muestra probabilstica son generalmente preferidas por los estadsticos porque la seleccin de las muestras es objetiva y el error muestral puede ser medido en trminos de probabilidad bajo la curva normal.

    Los tipos comunes de muestreo aleatorio son el muestreo aleatorio simple, muestreo sistemtico, muestreo estratificado y muestreo de conglomerados.

    Parmetros aleatorios

    Existen medidas para realizar descripciones cuantitativas de los conjuntos de datos, o poblaciones, y de sus muestras, diferencindose entre ellas las que se refieren a las mismas poblaciones y a las muestras.

    Para el caso de las POBLACIONES, las medidas que las describen se denominan PARMETROS, y suelen estar representadas con letras griegas (por ejemplo u y O).

    Por otro lado, para el caso de aquellas medidas que describen a una MUESTRA se les llama estadsticos o estimadores, y son representados por letras de nuestro alfabeto (por ejemplo, x o s).

  • 3.2 Descripcin de datos: Datos agrupados y datos no agrupados, Frecuencia de clase, Frecuencia relativa, Punto medio, Lmites de clases.

    DATOS AGRUPADOS Y NO AGRUPADOS.

    TRATAMIENTO PARA DATOS NO AGRUPADOS.

    A qu se refiere esto? Cuando la muestra que se ha tomado de la poblacin o proceso que se desea analizar, es decir, tenemos menos de 20 elementos en la muestra, entonces estos datos son analizados sin necesidad de formar clases con ellos y a esto es a lo que se le llama tratamiento de datos no agrupados.TRATAMIENTO PARA DATOS AGRUPADOS. Cuando la muestra consta de 30 o ms datos, lo aconsejable es agrupar los datos en clases y a partir de estas determinar las caractersticas de la muestra y por consiguiente las de la poblacin de donde fue tomada.Antes de pasar a definir cul es la manera de determinar las caractersticas de inters (media, mediana, moda, etc.) cuando se han agrupado en clases los datos de la muestra, es necesario que sepamos como se agrupan los datos. Pasos para agrupar datos.a. Determinar el rango o recorrido de los datos. Rango = Valor mayor Valor menor b. Establecer el nmero de clases (k) en que se van a agrupar los datos tomando como base para esto la

    siguiente tabla.

    Tamao de muestra o No. De datos Nmero de clasesMenos de 50 5 a 750 a 99 6 a 10100 a 250 7 a 12250 en adelante 10 a 20 El uso de esta tabla es uno de los criterios que se puede tomar en cuenta para establecer el nmero de clases en las que se van a agrupar los datos, existen otros para hacerlo. c. Determinar la amplitud de clase para agrupar (C).

    kRangoC =

    d. Formar clases y agrupar datos.Para formar la primera clase, se pone como lmite inferior de la primera clase un valor un poco menor que el dato menor encontrado en la muestra y posteriormente se suma a este valor C, obteniendo de esta manera el lmite superior de la primera clase, luego se procede a obtener los lmites de la clase siguiente y as sucesivamente.

  • OTROS TEMAS PARA ENTENDER LO UTIL DE TENER DATOS AGRUPADOS Y NO AGRUPADOS,AS COMO TAMBIN LOS DIFERENTES TIPOS DE FRECUENCIAS.

    Distribucin de frecuencia para datos no Agrupados:

    Es aquella distribucin que indica las frecuencias con que aparecen los datos estadsticos, desde el menor de ellos hasta el mayor de ese conjunto sin que se haya hecho ninguna modificacin al tamao de las unidades originales. En estas distribuciones cada dato mantiene su propia identidad despus que la distribucin de frecuencia se ha elaborado. En estas distribuciones los valores de cada variable han sido solamente reagrupados, siguiendo un orden lgico con sus respectivas frecuencias.

    Distribucin de frecuencia de clase o de datos Agrupados:

    Es aquella distribucin en la que la disposicin tabular de los datos estadsticos se encuentran ordenados en clases y con la frecuencia de cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase. No existen normas establecidas para determinar cundo es apropiado utilizar datos agrupados o datos no agrupados; sin embargo, se sugiere que cuando el nmero total de datos (N) es igual o superior 50 y adems el rango o recorrido de la serie de datos es mayor de 20, entonces, se utilizar la distribucin de frecuencia para datos agrupados, tambin se utilizar este tipo de distribucin cuando se requiera elaborar grficos lineales como el histograma, el polgono de frecuencia o la ojiva.

    La razn fundamental para utilizar la distribucin de frecuencia de clases es proporcionar mejor comunicacin acerca del patrn establecido en los datos y facilitar la manipulacin de los mismos. Los datos se agrupan en clases con el fin de sintetizar, resumir, condensar o hacer que la informacin obtenida de una investigacin sea manejable con mayor facilidad.

    Punto medio o Marca de clase

    El centro de la clase, es el volar de los datos que se ubica en la posicin central de la clase y representa todos los dems valores de esa clase. Este valor se utiliza para el calculo de la media aritmtica.

    Frecuencia de clase

    La frecuencia de clase se le denomina frecuencia absoluta y se le designa con las letras fi. Es el nmero total de valores de las variables que se encuentran presente en una clase determinada, de una distribucin de frecuencia de clase.

    Frecuencia Relativa

    La frecuencia relativa es aquella que resulta de dividir cada uno de los fi de las clases de una distribucin de frecuencia de clase entre el nmero total de datos(N) de la serie de valores. Estas frecuencias se designan con las letras fr; si cada fr se multiplica por 100 se obtiene la frecuencia relativa porcentual (fr %).

    Frecuencias acumuladas

    Las frecuencias acumuladas de una distribucin de frecuencias son aquellas que se obtienen de las sumas sucesivas de las fi que integran cada una de las clases de una distribucin de frecuencia de clase, esto se logra cuando la acumulacin de las frecuencias se realiza tomando en cuenta la primera clase hasta alcanzar la ultima. Las frecuencias acumuladas se designan con las letras fa. Las frecuencias acumuladas pueden ser menor que (fa que) y frecuencias acumuladas mayor que ( fa que).

  • Frecuencia acumulada relativa

    La frecuencia acumulada relativa es aquella que resulta de dividir cada una de las fa de las diferentes clases que integran una distribucin de frecuencia de clase entre el nmero total de datos (N) de la serie de valores, estas frecuencias se designan con las letras far. Si las far se multiplican por 100 se obtienen las frecuencias acumuladas relativas porcentuales y las mismas se designan as: far %

    3.3 Medidas de tendencia central: Media aritmtica, media geomtrica y media ponderada, Mediana, Moda, Medidas de dispersin, Varianza, Desviacin estndar, Desviacin media, Desviacin mediana, Rango.

    Medidas de tendencia central.

    Se les llama medidas de tendencia central a la media aritmtica, la mediana, la media geomtrica, la moda, etc. debido a que al observar la distribucin de los datos, estas tienden a estar localizadas generalmente en su parte central. A continuacin definiremos algunas medidas de tendencia central y la forma de calcular su valor.

    Media aritmtica (x ). Tambin se le conoce como promedio ya que es el promedio de las lecturas o mediciones individuales que se tienen en la muestra, se determina con la frmula siguiente:

    n

    xx

    n

    ii

    =

    =1

    donde:

    x = media aritmtica

    xi = dato i

    n = nmero de datos en la muestra

    Ejemplos:

    1. Se han tomado como muestra las medidas de seis cables usados en un arns para lavadora, las cuales son; 15.2 cm, 15.0, 15.1, 15.2, 15.1 y 15.0, determine su media aritmtica.

    Solucin:

    cm.......x 1156

    015115215115015215=

    +++++=

  • Media geomtrica (G). Es la raz en ensima del producto de los valores de los elementos de la muestra, es usada cuando los valores de los datos de la muestra no son lineales, es decir que su valor depende de varios factores a la vez, se determina de la siguiente forma:

    nn x*...*x*xG 21= Donde:

    G = media geomtrica

    xi = dato i

    n = nmero de datos en la muestra

    Ejemplo:

    1. Las siguientes temperaturas han sido tomadas de un proceso qumico, 13.4oC, 12.8, 11.9, 13.6, determine la temperatura promedio de este proceso.

    Solucin: G = 44 796827758613911812413 ..x.x.x. = = 12.9077 oC

    Media aritmtica ponderada ( xw ). Esta media se usa cuando el peso que tiene cada uno de los datos de la muestra es diferente, se calcula de la siguiente manera:

    =

    =

    =

    k

    ii

    k

    iii

    w

    xwwx

    1

    1

    donde:

    xw = media aritmtica ponderada

    xi = dato i

    wi = peso del dato i

    Media armnica (H). La media armnica se define como el recproco del promedio de los recprocos de cada uno de los datos que se tienen en la muestra, y

    se determina de la siguiente manera:

    ==

    == n

    i

    n

    ixi/

    n

    xi/n/H

    11

    111

    1

    Ejemplo: Determine la media armnica de los siguientes datos, 3.1, 2.8, 2.84, 3.05, 3.09

    Solucin: =

    ++++=

    0931053184218211315

    ./././././H

  • 97032

    683315

    32360327903521035710322605 .

    ......==

    ++++=

    Mediana (xmed). La mediana es aquel valor que se encuentra en la parte central de los datos que se tienen en la muestra una vez que estos han sido ordenados segn su valor o magnitud. Para calcular la mediana se presentan dos casos:

    Ejemplo:

    Los siguientes datos son las mediciones obtenidas de un circuito utilizado en un arns de lavadora; se toman como muestra siete circuitos y sus mediciones son: 11.3, 11.2, 11.5, 11.2, 11.2, 11.4, 11.5 cm.

    Solucin:Ordenando los datos de menor a mayor valor;

    11.2, 11.2, 11.2, 11.3, 11.4, 11.5, 11.5

    Moda (xmod). La moda se define como aquel valor o valores que ms se repiten o que tienen mayor frecuencia entre los datos que se han obtenido en una muestra, la muestra de una poblacin nos genera la distribucin de los datos una vez que estos se han graficado y en esta grfica es posible observar la moda o modas de la misma, es por esto que una distribucin de datos puede ser amodal (carece de moda), unimodal (tiene una sola moda), bimodal (tiene dos modas) o polimodal (tiene ms de dos modas).

    Medidas de Dispersin.

    Cuando se tiene una muestra de datos obtenida de una poblacin cualquiera, es importante determinar sus medidas de tendencia central as como tambin es bsico el determinar que tan dispersos estn los datos en la muestra, por lo que se hace necesario determinar su rango, la varianza, la desviacin estndar, etc., ya que una excesiva variabilidad o dispersin en los datos indica la inestabilidad del proceso en anlisis en la mayora de los casos.

    3.5 Parmetros para datos agrupados.

    TRATAMIENTO PARA DATOS AGRUPADOS.

    Cuando la muestra consta de 30 o ms datos, lo aconsejable es agrupar los datos en clases y a partir de estas determinar las caractersticas de la muestra y por consiguiente las de la poblacin de donde fue tomada.

    Antes de pasar a definir cul es la manera de determinar las caractersticas de inters (media, mediana, moda, etc.) cuando se han agrupado en clases los datos de la muestra, es necesario que sepamos como se agrupan los datos.

    Pasos para agrupar datos.

    *Determinar el rango o recorrido de los datos. Rango = Valor mayor Valor menor

    * Establecer el nmero de clases (k)en que se van a agrupar los datos

  • 3.6 Distribucin de frecuencias.

    Una distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente.

    Tipos de frecuencia

    Frecuencia absoluta.-La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio estadstico. Se representa por fi. La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N.

    Frecuencia relativa

    La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento y se representa por ni.

    Frecuencia acumulada

    La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.

    Se representa por Fi.

    Frecuencia relativa acumulada

    La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento.

    3.7 Tcnicas de agrupacin de datos

  • 3.8 Tcnicas de muestreo.

    Muestreo

    Es el procedimiento mediante el cul seleccionamos una muestra representativa de la poblacin objeto de estudio.

    El diseo y la eleccin de la muestra de estudio

    El paso siguiente que debe resolver el investigador es el del diseo y la eleccin de la muestra. Ambas acciones est ntimamente unidas puesto que dependiendo del diseo que utilice el investigador as ser la eleccin de los sujetos de estudio. Los elementos, personas, fenmenos, constituyen la muestra de la investigacin. Estos elementos forman parte de un grupo de conceptos bsicos que conviene clarificar y que deben ser definidos en cada investigacin.

    Conceptos Bsicos

    Universo

    Es la serie real o hipottica de elementos que comparten unas caractersticas definidas relacionadas con el problema de investigacin.

    Poblacin

    Es un conjunto definido, limitado y accesible del universo que forma el referente para la eleccin de la muestra. Es el grupo al que se intenta generalizar los resultados.

    Muestra

    Conjunto de individuos extrado de la poblacin a partir de algn procedimiento especfico. Los valores que obtenemos del anlisis estadstico de la muestra se denominan estadgrafos o estadsticos.

    Elemento o individuo (muestral)

    Es la unidad ms pequea en la que podemos descomponer la muestra, la poblacin o el universo. Esta unidad puede ser una persona, un grupo, un centro, etc. La identificacin de este elemento est en funcin del problema de investigacin.

    3.9 HISTOGRAMA

    El histograma es una grfica de barras que permite describir el comportamiento de un conjunto de datos en cuanto a su tendencia central, forma y dispersin. El histograma permite que de un vistazo se pueda tener una idea objetiva sobre la calidad de un producto, el desempeo de un proceso o el impacto de una accin

  • de mejora. La correcta utilizacin del histograma permite tomar decisiones no solo con base en la media, sino tambin con base en la dispersin y formas especiales de comportamiento de los datos. Su uso cotidiano facilita el entendimiento de la variabilidad y favorece la cultura de los datos y los hechos objetivos

    CONSTRUCCION DE UN HISTOGRAMA.

    Para decidir correctamente y detectar posibles anormalidades en los datos se procede a lo siguiente para construir un histograma:

    Paso 1. Determinar el rango de datos.La diferencia entre el dato mximo y el dato mnimo.

    Paso 2. Obtener el numero de clases (NC) o barras.Ninguno de ellos es exacto, esto depende de cmo sean los datos y cuantos sean . Un criterio usado es del numero de clases, debe ser aprox. Igual a la raz cuadrada del numero de datos.

    Paso3. Establecer la longitud de clase (LC).Se establece de tal manera que el rango pueda ser cubierto en su totalidad por NC. Una forma directa de obtener la LC es dividiendo el rango entre el numero de clases, LC= R/NC.

    Paso 4. Construir los intervalos de clase. Resultan de dividir el rango (original o ampliado) en NC e intervalos de longitud LC.

    Paso 5. Obtener la frecuencia de cada clase. Se cuentan los datos que caen en cada intervalo de clase.

    Paso 6.Graficar el histograma.

    Se grafican en barras, en las que su base es el intervalo de clase y la altura sean las frecuencias de las clases

    EJEMPLO :

    A una fabrica de envases de vidrio, un cliente le est exigiendo que la capacidad de cierto tipo de botella sea de13 ml., con una tolerancia de ms menos 1 ml.. La fbrica establece un programa de mejora de calidad para que las botellas que se fabriquen cumplan con los requisitos del cliente.

    Muestreo = 11,12,13,12,13,14,14,15,11,12,13,12,14,15,11,12,16,16,14,13,14,14,13,15,15

    1. Rango : 16 11 = 5 25 = 5 3. 5/5 = 1

    Clase Intervalo Frecuencia Frec. Relativa1 11,12 3 0,122 12,13 5 0,253 13,14 5 0,254 14,15 6 0,245 15,16 6 0,24

    20 1,00