unidad 3 estadistica descriptiva

12
UNIDAD 3 ESTADISTICA DESCRIPTIVA Una de las ramas de la Estadística más accesible a la mayoría de la población es la Descriptiva. Esta parte se dedica única y exclusivamente al ordenamiento y tratamiento mecánico de la información para su presentación por medio de tablas y de representaciones gráficas, así como de la obtención de algunos parámetros útiles para la explicación de la información. La Estadística Descriptiva es la parte que conocemos desde los cursos de educación primaria, que se enseña en los siguientes niveles y que, por lo general, no pasa a ser un análisis más profundo de la información. Es un primer acercamiento a la información y, por esa misma razón, es la manera de presentar la información ante cualquier lector, ya sea especialista o no. Sin embargo, lo anterior no quiere decir que carezca de metodología o algo similar, sino que, al contrario, por ser un medio accesible a la mayoría de la población humana, resulta de suma importancia considerar para así evitar malentendidos, tergiversaciones o errores. 3.1 Conceptos básicos de estadística: Definición, Teoría de decisión, Población, Muestra aleatoria, Parámetros aleatorios. POBLACION es el conjunto de todos los sucesos susceptibles de aparecer en un problema y que interesan a la persona que hace el estudio; y señalamos que una MUESTRA en un subconjunto de mediciones seleccionadas de la población. La población según su tamaño puede ser: finita o infinita; y si nos referimos a su número se toma como el tamaño de la población. El concepto de infinita sólo existe en teoría pues en la práctica nos encontraremos aplicación a poblaciones de elementos infinitos: Estrellas del universo (tiempo y costo). Se elige una MUESTRA lo suficientemente representativa de la población. Muestreo Aleatorio Una muestra se dice que es extraída al azar cuando la manera de selección es tal, que cada elemento de la población tiene igual oportunidad de ser seleccionado. Una muestra aleatoria es también llamada una muestra probabilística son generalmente preferidas por los estadísticos porque la selección de las muestras es objetiva y el error muestral puede ser medido en términos de probabilidad bajo la curva normal. Los tipos comunes de muestreo aleatorio son el muestreo aleatorio simple, muestreo sistemático, muestreo estratificado y muestreo de conglomerados. Parámetros aleatorios

Upload: carloss-ruiz-r

Post on 02-Jul-2015

3.576 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: UNIDAD 3 ESTADISTICA DESCRIPTIVA

UNIDAD 3 ESTADISTICA DESCRIPTIVA

Una de las ramas de la Estadística más accesible a la mayoría de la población es la Descriptiva. Esta parte se dedica única y exclusivamente al ordenamiento y tratamiento mecánico de la información para su presentación por medio de tablas y de representaciones gráficas, así como de la obtención de algunos parámetros útiles para la explicación de la información.

La Estadística Descriptiva es la parte que conocemos desde los cursos de educación primaria, que se enseña en los siguientes niveles y que, por lo general, no pasa a ser un análisis más profundo de la información. Es un primer acercamiento a la información y, por esa misma razón, es la manera de presentar la información ante cualquier lector, ya sea especialista o no. Sin embargo, lo anterior no quiere decir que carezca de metodología o algo similar, sino que, al contrario, por ser un medio accesible a la mayoría de la población humana, resulta de suma importancia considerar para así evitar malentendidos, tergiversaciones o errores.

3.1 Conceptos básicos de estadística: Definición, Teoría de decisión, Población, Muestra aleatoria, Parámetros aleatorios.

POBLACION es el conjunto de todos los sucesos susceptibles de aparecer en un problema y que interesan a la persona que hace el estudio; y señalamos que una MUESTRA en un subconjunto de mediciones seleccionadas de la población. La población según su tamaño puede ser: finita o infinita; y si nos referimos a su número se toma como el tamaño de la población.

El concepto de infinita sólo existe en teoría pues en la práctica nos encontraremos aplicación a poblaciones de elementos infinitos: Estrellas del universo (tiempo y costo). Se elige una MUESTRA lo suficientemente representativa de la población.

Muestreo Aleatorio

Una muestra se dice que es extraída al azar cuando la manera de selección es tal, que cada elemento de la población tiene igual oportunidad de ser seleccionado.

Una muestra aleatoria es también llamada una muestra probabilística son generalmente preferidas por los estadísticos porque la selección de las muestras es objetiva y el error muestral puede ser medido en términos de probabilidad bajo la curva normal.

Los tipos comunes de muestreo aleatorio son el muestreo aleatorio simple, muestreo sistemático, muestreo estratificado y muestreo de conglomerados.

Parámetros aleatorios

Existen medidas para realizar descripciones cuantitativas de los conjuntos de datos, o poblaciones, y de sus muestras, diferenciándose entre ellas las que se refieren a las mismas poblaciones y a las muestras.

Para el caso de las POBLACIONES, las medidas que las describen se denominan PARÁMETROS, y suelen estar representadas con letras griegas (por ejemplo u y O).

Por otro lado, para el caso de aquellas medidas que describen a una MUESTRA se les llama estadísticos o estimadores, y son representados por letras de nuestro alfabeto (por ejemplo, x o s).

Page 2: UNIDAD 3 ESTADISTICA DESCRIPTIVA

3.2 Descripción de datos: Datos agrupados y datos no agrupados, Frecuencia de clase, Frecuencia relativa, Punto medio, Límites de clases.

DATOS AGRUPADOS Y NO AGRUPADOS.

TRATAMIENTO PARA DATOS NO AGRUPADOS. 

¿A qué se refiere esto? Cuando la muestra que se ha tomado de la población o proceso que se desea analizar, es decir, tenemos menos de 20 elementos en la muestra, entonces estos datos son analizados sin necesidad de formar clases con ellos y a esto es a lo que se le llama tratamiento de datos no agrupados.TRATAMIENTO PARA DATOS AGRUPADOS. Cuando la muestra consta de 30 o más datos, lo aconsejable es agrupar los datos en clases y a partir de estas determinar las características de la muestra y por consiguiente las de la población de donde fue tomada.Antes de pasar a definir cuál es la manera de determinar las características de interés (media, mediana, moda, etc.) cuando se han agrupado en clases los datos de la muestra, es necesario que sepamos como se agrupan los datos. Pasos para agrupar datos.a. Determinar el rango o recorrido de los datos. Rango = Valor mayor – Valor menor b. Establecer el número de clases (k) en que se van a agrupar los datos tomando como base para esto la

siguiente tabla.   

 Tamaño de muestra o No. De datos Número de clasesMenos de 50 5 a 750 a 99 6 a 10100 a 250 7 a 12250 en adelante 10 a 20 El uso de esta tabla es uno de los criterios que se puede tomar en cuenta para establecer el número de clases en las que se van a agrupar los datos, existen otros para hacerlo. c. Determinar la amplitud de clase para agrupar (C).  

 

k

RangoC

 d.      Formar clases y agrupar datos.Para formar la primera clase, se pone como límite inferior de la primera clase un valor un poco menor que el dato menor encontrado en la muestra y posteriormente se suma a este valor C, obteniendo de esta manera el límite superior de la primera clase, luego se procede a obtener los límites de la clase siguiente y así sucesivamente. 

Page 3: UNIDAD 3 ESTADISTICA DESCRIPTIVA

OTROS TEMAS PARA ENTENDER LO UTIL DE TENER DATOS AGRUPADOS Y NO AGRUPADOS,ASÍ COMO TAMBIÉN LOS DIFERENTES TIPOS DE FRECUENCIAS.

Distribución de frecuencia para datos no Agrupados:

Es aquella distribución que indica las frecuencias con que aparecen los datos estadísticos, desde el menor de ellos hasta el mayor de ese conjunto sin que se haya hecho ninguna modificación al tamaño de las unidades originales. En estas distribuciones cada dato mantiene su propia identidad después que la distribución de frecuencia se ha elaborado. En estas distribuciones los valores de cada variable han sido solamente reagrupados, siguiendo un orden lógico con sus respectivas frecuencias.

Distribución de frecuencia de clase o de datos Agrupados:

Es aquella distribución en la que la disposición tabular de los datos estadísticos se encuentran ordenados en clases y con la frecuencia de cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase. No existen normas establecidas para determinar cuándo es apropiado utilizar datos agrupados o datos no agrupados; sin embargo, se sugiere que cuando el número total de datos (N) es igual o superior 50 y además el rango o recorrido de la serie de datos es mayor de 20, entonces, se utilizará la distribución de frecuencia para datos agrupados, también se utilizará este tipo de distribución cuando se requiera elaborar gráficos lineales como el histograma, el polígono de frecuencia o la ojiva.

La razón fundamental para utilizar la distribución de frecuencia de clases es proporcionar mejor comunicación acerca del patrón establecido en los datos y facilitar la manipulación de los mismos. Los datos se agrupan en clases con el fin de sintetizar, resumir, condensar o hacer que la información obtenida de una investigación sea manejable con mayor facilidad.

Punto medio o Marca de clase

El centro de la clase, es el volar de los datos que se ubica en la posición central de la clase y representa todos los demás valores de esa clase. Este valor se utiliza para el calculo de la media aritmética.

Frecuencia de clase

La frecuencia de clase se le denomina frecuencia absoluta y se le designa con las letras fi. Es el número total de valores de las variables que se encuentran presente en una clase determinada, de una distribución de frecuencia de clase.

Frecuencia Relativa

La frecuencia relativa es aquella que resulta de dividir cada uno de los fi de las clases de una distribución de frecuencia de clase entre el número total de datos(N) de la serie de valores. Estas frecuencias se designan con las letras fr; si cada fr se multiplica por 100 se obtiene la frecuencia relativa porcentual (fr %).

Frecuencias acumuladas

Las frecuencias acumuladas de una distribución de frecuencias son aquellas que se obtienen de las sumas sucesivas de las fi que integran cada una de las clases de una distribución de frecuencia de clase, esto se logra cuando la acumulación de las frecuencias se realiza tomando en cuenta la primera clase hasta alcanzar la ultima. Las frecuencias acumuladas se designan con las letras fa. Las frecuencias acumuladas pueden ser menor que (fa que) y frecuencias acumuladas mayor que (faque).

Frecuencia acumulada relativa

Page 4: UNIDAD 3 ESTADISTICA DESCRIPTIVA

La frecuencia acumulada relativa es aquella que resulta de dividir cada una de las fa de las diferentes clases que integran una distribución de frecuencia de clase entre el número total de datos (N) de la serie de valores, estas frecuencias se designan con las letras far. Si las far se multiplican por 100 se obtienen las frecuencias acumuladas relativas porcentuales y las mismas se designan así: far %

3.3 Medidas de tendencia central: Media aritmética, media geométrica y media ponderada, Mediana, Moda, Medidas de dispersión, Varianza, Desviación estándar, Desviación media, Desviación mediana, Rango.

Medidas de tendencia central.

Se les llama medidas de tendencia central a la media aritmética, la mediana, la media geométrica, la moda, etc. debido a que al observar la distribución de los datos, estas tienden a estar localizadas generalmente en su parte central. A continuación definiremos algunas medidas de tendencia central y la forma de calcular su valor.

Media aritmética (`x ). También se le conoce como promedio ya que es el promedio de las lecturas o mediciones individuales que se tienen en la muestra, se determina con la fórmula siguiente:

  n

xx

n

ii

1

donde:

`x = media aritmética

xi = dato i

n = número de datos en la muestra

 

Ejemplos:

1. Se han tomado como muestra las medidas de seis cables usados en un arnés para lavadora, las cuales son; 15.2 cm, 15.0, 15.1, 15.2, 15.1 y 15.0, determine su media aritmética.

Solución:

 

cm.......

x 1156

015115215115015215

 

 

Page 5: UNIDAD 3 ESTADISTICA DESCRIPTIVA

Media geométrica (G). Es la raíz en enésima del producto de los valores de los elementos de la muestra, es usada cuando los valores de los datos de la muestra no son lineales, es decir que su valor depende de varios factores a la vez, se determina de la siguiente forma:

  nn x*...*x*xG 21 Donde:

G = media geométrica

xi = dato i

n = número de datos en la muestra

Ejemplo:

1.      Las siguientes temperaturas han sido tomadas de un proceso químico, 13.4oC, 12.8, 11.9, 13.6, determine la temperatura promedio de este proceso.

 Solución: G = 44 796827758613911812413 ..x.x.x. = 12.9077 oC

Media aritmética ponderada ( xw ). Esta media se usa cuando el peso que tiene cada uno de los datos de la muestra es diferente, se calcula de la siguiente manera:

 

k

ii

k

iii

w

xwwx

1

1

donde:

xw = media aritmética ponderada

xi = dato i

wi = peso del dato i

Media armónica (H). La media armónica se define como el recíproco del promedio de los recíprocos de cada uno de los datos que se tienen en la muestra, y

se determina de la siguiente manera:

 

n

i

n

i

xi/

n

xi/n/H

11

111

1

Ejemplo: Determine la media armónica de los siguientes datos, 3.1, 2.8, 2.84, 3.05, 3.09

 Solución:

093105318421821131

5

./././././H

 97032

68331

5

3236032790352103571032260

5.

......

Page 6: UNIDAD 3 ESTADISTICA DESCRIPTIVA

Mediana (xmed). La mediana es aquel valor que se encuentra en la parte central de los datos que se tienen en la muestra una vez que estos han sido ordenados según su valor o magnitud. Para calcular la mediana se presentan dos casos:

Ejemplo:

Los siguientes datos son las mediciones obtenidas de un circuito utilizado en un arnés de lavadora; se toman como muestra siete circuitos y sus mediciones son: 11.3, 11.2, 11.5, 11.2, 11.2, 11.4, 11.5 cm.

 Solución:Ordenando los datos de menor a mayor valor;

11.2, 11.2, 11.2, 11.3, 11.4, 11.5, 11.5

Moda (xmod). La moda se define como aquel valor o valores que más se repiten o que tienen mayor frecuencia entre los datos que se han obtenido en una muestra, la muestra de una población nos genera la distribución de los datos una vez que estos se han graficado y en esta gráfica es posible observar la moda o modas de la misma, es por esto que una distribución de datos puede ser amodal (carece de moda), unimodal (tiene una sola moda), bimodal (tiene dos modas) o polimodal (tiene más de dos modas).

 

Medidas de Dispersión.

Cuando se tiene una muestra de datos obtenida de una población cualquiera, es importante determinar sus medidas de tendencia central así como también es básico el determinar que tan dispersos están los datos en la muestra, por lo que se hace necesario determinar su rango, la varianza, la desviación estándar, etc., ya que una excesiva variabilidad o dispersión en los datos indica la inestabilidad del proceso en análisis en la mayoría de los casos.

3.5 Parámetros para datos agrupados.

TRATAMIENTO PARA DATOS AGRUPADOS.

Cuando la muestra consta de 30 o más datos, lo aconsejable es agrupar los datos en clases y a partir de estas determinar las características de la muestra y por consiguiente las de la población de donde fue tomada.

Antes de pasar a definir cuál es la manera de determinar las características de interés (media, mediana, moda, etc.) cuando se han agrupado en clases los datos de la muestra, es necesario que sepamos como se agrupan los datos.

  Pasos para agrupar datos.

*Determinar el rango o recorrido de los datos. Rango = Valor mayor – Valor menor

* Establecer el número de clases (k)en que se van a agrupar los datos

3.6 Distribución de frecuencias.

Page 7: UNIDAD 3 ESTADISTICA DESCRIPTIVA

Una distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.

Tipos de frecuencia

Frecuencia absoluta.-La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico. Se representa por fi. La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N.

Frecuencia relativa

La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento y se representa por ni.

Frecuencia acumulada

La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.

Se representa por Fi.

Frecuencia relativa acumulada

La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento.

3.7 Técnicas de agrupación de datos

Page 8: UNIDAD 3 ESTADISTICA DESCRIPTIVA

3.8 Técnicas de muestreo.

Muestreo

Es el procedimiento mediante el cuál seleccionamos una muestra representativa de la población objeto de estudio.

El diseño y la elección de la muestra de estudio

El paso siguiente que debe resolver el investigador es el del diseño y la elección de la muestra. Ambas acciones está íntimamente unidas puesto que dependiendo del diseño que utilice el investigador así será la elección de los sujetos de estudio. Los elementos, personas, fenómenos, constituyen la muestra de la investigación. Estos elementos forman parte de un grupo de conceptos básicos que conviene clarificar y que deben ser definidos en cada investigación.

Conceptos Básicos

Universo

Es la serie real o hipotética de elementos que comparten unas características definidas relacionadas con el problema de investigación.

Población

Es un conjunto definido, limitado y accesible del universo que forma el referente para la elección de la muestra. Es el grupo al que se intenta generalizar los resultados.

Muestra

Conjunto de individuos extraído de la población a partir de algún procedimiento específico. Los valores que obtenemos del análisis estadístico de la muestra se denominan estadígrafos o estadísticos.

Elemento o individuo (muestral)

Es la unidad más pequeña en la que podemos descomponer la muestra, la población o el universo. Esta unidad puede ser una persona, un grupo, un centro, etc. La identificación de este elemento está en función del problema de investigación.

Page 9: UNIDAD 3 ESTADISTICA DESCRIPTIVA

3.9 HISTOGRAMA

El histograma es una gráfica  de barras que permite describir el comportamiento de un conjunto de datos en cuanto a su tendencia central, forma y dispersión. El histograma  permite que de un vistazo  se pueda tener una idea objetiva  sobre la calidad de un producto, el desempeño de un proceso  o el impacto de una acción de mejora. La correcta utilización del histograma permite tomar decisiones no solo con base  en la media, sino también con base en la dispersión  y formas especiales de comportamiento  de los datos. Su uso cotidiano facilita  el entendimiento de la variabilidad y favorece la cultura de los datos  y los hechos objetivos

CONSTRUCCION DE UN HISTOGRAMA.

Para decidir correctamente y detectar posibles anormalidades  en los datos se procede a lo siguiente para construir un histograma:

Paso 1. Determinar el rango de datos.La diferencia entre el dato máximo y el dato mínimo.

Paso 2. Obtener el numero de clases (NC) o barras.Ninguno de ellos es exacto, esto depende de cómo sean los datos y cuantos sean . Un criterio usado es del numero de clases, debe ser aprox. Igual a la raíz cuadrada del numero de datos.

Paso3. Establecer la longitud de clase  (LC).Se establece de tal manera que el rango pueda ser cubierto  en su totalidad por NC. Una forma directa de obtener  la LC es dividiendo el rango entre el numero de clases, LC= R/NC.

Paso 4. Construir los intervalos de clase. Resultan de dividir el rango (original o ampliado) en NC e intervalos de longitud  LC.

Paso 5. Obtener la frecuencia de cada clase. Se cuentan los datos que caen en cada intervalo de clase.

Paso 6.Graficar el histograma.

Se grafican en barras, en las que su base es el intervalo de clase  y la altura  sean las frecuencias de las clases

EJEMPLO :

A una fabrica de envases de vidrio, un cliente le está exigiendo que la capacidad de cierto tipo de botella sea de13 ml., con una tolerancia de más menos 1 ml.. La fábrica establece un programa de mejora de calidad para que las botellas que se fabriquen cumplan con los requisitos del cliente.

Muestreo = 11,12,13,12,13,14,14,15,11,12,13,12,14,15,11,12,16,16,14,13,14,14,13,15,15

Page 10: UNIDAD 3 ESTADISTICA DESCRIPTIVA

1. Rango : 16 –11 = 5 25 = 5

3. 5/5 = 1 Clase Intervalo Frecuencia Frec. Relativa

1 11,12 3 0,12

2 12,13 5 0,25

3 13,14 5 0,25

4 14,15 6 0,24

5 15,16 6 0,24

   20 1,00