estadistica descriptiva

18
Universidad Veracruzana Maestría en Vías Terrestres “Control de calidad” Catedrático: Mtra. Genoveva Lorenzo Landa Presenta: López González Pablo Julián Ramírez Rendón Beder Noé Rodríguez Mendo Gabriel Quiroa Reyes Aarón

Upload: aaron-quiroa-reyes

Post on 13-Dec-2015

219 views

Category:

Documents


0 download

DESCRIPTION

Incluye herramientas de estadistica descriptiva como es el histograma, diagrama de dispersion y el diagrama de cajas, viene una explicacion breve con los tipos de datos de entrada, su utilizacion y su rotulacion.

TRANSCRIPT

Universidad Veracruzana

Maestría en Vías Terrestres

“Control de calidad”

Catedrático:

Mtra. Genoveva Lorenzo Landa

Presenta:

López González Pablo JuliánRamírez Rendón Beder NoéRodríguez Mendo Gabriel

Quiroa Reyes Aarón

Xalapa, Veracruz a 1° de septiembre de 2015

El Histograma

Definición

El Histograma es un resumen gráfico de los valores producidos por las variaciones de un determinado estudio o conjunto de datos, representando la frecuencia con que se presentan distintas categorías dentro de dicho conjunto. La utilidad del histograma tiene que ver con la posibilidad de establecer de manera visual, ordenada y fácilmente comprensible todos los datos numéricos estadísticos que pueden tornarse difíciles de entender.

Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que en ciencias naturales y exactas. Y permite la comparación de los resultados de un proceso.

Uso

Exponer gráficamente números, variables y cifras de modo que los resultados se visualicen más clara y ordenadamente.

Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos.

Por el tipo de información brindada y por la manera en que ésta es dispuesta, los histogramas son de especial utilidad y eficacia para las ciencias sociales ya que permiten comparar datos sociales como los resultados de un censo, la cantidad de mujeres y/o hombres en una comunidad, el nivel de analfabetismo o mortandad infantil, etc.

Trabajar con histogramas es muy simple y seguramente proveerá con una mejor comprensión de diferente tipo de datos e información.

Características Generales

Información

Para un histograma existen dos tipos de informaciones básicas: la frecuencia de los valores y los valores en sí.

Las frecuencias son representadas en el eje vertical mientras que en el horizontal se representan los valores de cada una de las variables.

• Síntesis  Permite resumir grandes cantidades de datos.

• Análisis

Permite el análisis de los datos evidenciando esquemas de comportamiento y pautas de variación que son difíciles de captar en una tabla numérica.

• Capacidad de comunicación

Permite comunicar información de forma clara y sencilla sobre situaciones complejas.

Tipos de Histogramas

Los histogramas de barras simples son los más comunes y utilizados. También están los histogramas de barras compuestas que permiten introducir información sobre dos variables. Luego están los histogramas de barras agrupadas según información y por último el polígono de frecuencias y la ojiva porcentual, ambos sistemas utilizados normalmente por expertos.

Ejemplos

Histograma Simple

En este ejemplo se puede apreciar las notas obtenidas por un grupo de alumnos en el primer parcial.

Histograma de Barras Compuestas

En este ejemplo se puede apreciar dos variables aplicadas al estudio de una población, uno es la clase social y el otro su estado civil.

Se puede apreciar un sesgo en este análisis debido a la cantidades de personas de las cuales se obtuvo información que corresponden a la clase Alta y Baja.Sesgo:En el campo de la estadística, el sesgo estadístico es un error que se detecta en los resultados de un estudio y que se debe a factores en la recolección, análisis, interpretación o revisión de los datos, por lo que hace que los resultados no sean representativos de toda la población. Este puede ser positivo o negativo.

Histograma de Barras Agrupadas

En este ejemplo se puede apreciar de igual manera el análisis de dos variables a una misma población, como la clase social y la condición de salud, representadas de manera agrupada.

Polígono de Frecuencias

Se conoce como polígonos de frecuencia para datos agrupados a aquellos que se desarrollan mediante la marca de clase que tiene coincidencia con el punto medio de las distintas columnas del histograma. En el momento de la representación de todas las frecuencias que forman parte de una tabla de datos agrupados, se genera el histograma de frecuencias acumuladas que posibilita la diagramación del polígono correspondiente.

Cabe recordar que la frecuencia es la repetición mayor o menor de un evento, o el número de veces que un acontecimiento periódico se reitera en una unidad temporal.

DIAGRAMA DE DISPERSIÓN

Definición

Representación gráfica del grado de relación entre dos variables cuantitativas.

Características principales

A continuación se comentan una serie de características que ayudan a comprender la naturaleza de la herramienta.

Impacto visual

Un Diagrama de Dispersión muestra la posibilidad de la existencia de correlación entre dos variables de un vistazo.

Comunicación

Simplifica el análisis de situaciones numéricas complejas.

Guía en la investigación

El análisis de datos mediante esta herramienta proporciona mayor información que el simple análisis matemático de correlación, sugiriendo posibilidades y alternativas de estudio, basadas en la necesidad de conjugar datos y procesos en su utilización.

PROCESO (Diagrama de flujo)

CONSTRUCCIÓN

Pasos previos a la construcción de un Diagrama de Dispersión

Paso 1: Elaborar una teoría admisible y relevante sobre la supuesta relación entre dos variables

Este paso previo es de gran importancia, puesto que el análisis de un Diagrama de Dispersión permite obtener conclusiones sobre la existencia de una relación entre dos variables, no sobre la naturaleza de dicha relación.

Paso 2: Obtener los pares de datos correspondientes a las dos variables

Al igual que en cualquier otra herramienta de análisis de datos, éstos son la base de las conclusiones obtenidas, por tanto cumplirán las siguientes condiciones:

- En cantidad suficiente: Se consideran necesarios al menos 40 pares de datos para construir un Diagrama de Dispersión.

- Datos correctamente emparejados: Se estudiará la relación entre ambos.- Datos exactos: Las inexactitudes afectan a su situación en el diagrama

desvirtuando su apariencia visual.- Datos representativos: Asegúrese de que cubren todas las condiciones operativas

del proceso.- Información completa: Anotar las condiciones en que han sido obtenidos los

datos.

Paso 3: Determinar los valores máximo y mínimo para cada una de las variables

Paso 4: Decidir sobre qué eje representará a cada una de las variables

Si se está estudiando una posible relación causa-efecto, el eje horizontal representará la supuesta causa.

Paso 5: Trazar y rotular los ejes horizontal y vertical

La construcción de los ejes afecta al aspecto y a la consiguiente interpretación del diagrama.

a) Los ejes han de ser aproximadamente de la misma longitud, determinando un área cuadrada.

b) La numeración de los ejes ha de ir desde un valor ligeramente menor que el valor mínimo de cada variable hasta un valor ligeramente superior al valor máximo de las mismas. Esto permite que los puntos abarquen toda el área de registro de los datos.

c) Numerar los ejes a intervalos iguales y con incrementos de la variable constantes.d) Los valores crecientes han de ir de abajo a arriba y de izquierda a derecha en los

ejes vertical y horizontal respectivamente.e) Rotular cada eje con la descripción de la variable correspondiente y con su unidad

de medida.

Paso 6: Marcar sobre el diagrama los pares de datos

a) Para cada par de datos localizar la intersección de las lecturas de los ejes correspondientes y señalarlo con un punto o símbolo.

Si algún punto coincide con otro ya existente, se traza un círculo concéntrico a este último.

b) Cuando coinciden muchos pares de puntos, el Diagrama de Dispersión puede hacerse confuso. En este caso es recomendable utilizar una "Tabla de Correlación" para representar la correlación.c) En el caso en que se construye un Diagrama de Dispersión estratificado separando los pares de datos, por ejemplo, según el turno de trabajo, lote de materia prima, etc.), deben escogerse símbolos que pongan de manifiesto los diferentes grupos de puntos de forma clara.

Paso 7: Rotular el gráfico

Se rotula el título del gráfico y toda aquella información necesaria para su correcta comprensión.

En general, es conveniente incluir una descripción adicional del objeto de las medidas y de las condiciones en que se han realizado, ya que esta información puede ayudar en la interpretación del diagrama.

INTERPRETACIÓN

Posibles tipos de relaciones entre variables

El Diagrama de Dispersión se puede utilizar para estudiar:

- Relaciones causa-efecto.

Este es el caso más común en su utilización para la mejora de la calidad. Se utiliza el diagrama a partir de la medición del efecto observado y de su posible causa.

Ejemplo: Comprobar la relación entre el número de errores y la hora en que se cometen.

- Relaciones entre dos efectos.

Sirve para contrastar la teoría de que ambos provienen de una causa común desconocida o difícil de medir.

Ejemplo: Analizar la relación entre el número de quejas que llegan y el aumento/disminución de las ventas, suponiendo que los dos dependen del nivel de satisfacción del cliente.

- Posibilidad de utilizar un efecto como sustituto de otro.

Se puede utilizar para controlar efectos difíciles o costosos de medir, a través de otros con medición más simple.

Ejemplo: Estudiar la relación existente entre reducción de costos y satisfacción del cliente para utilizar el parámetro de más fácil medición en la evaluación de las actividades de planificación.

- Relaciones entre dos posibles causas.

Sirve para actuar sobre efectos de forma más simple o adecuada y para analizar procesos complejos.

Ejemplo: Analizar la relación entre el porcentaje idóneo de contenido en potasio de un fertilizante y la cantidad media de lluvia recogida en la zona de cultivo, puesto que ambos elementos influyen en la calidad del vino y el régimen de lluvias no puede ser modificado.

Proceso de interpretación

El Diagrama de Dispersión expresa el grado de relación entre dos variables, y dicha relación no necesariamente significa que una de ellas es la causa de la otra.El análisis de un Diagrama de Dispersión es un proceso de cuatro pasos:

Primero: Elaborar una teoría admisible y relevante sobre la supuesta relación entre dos variables.

Segundo: Recoger datos y construir el Diagrama.

Tercero: Identificar y clasificar la pauta de correlación.

Cuarto: Discutir la teoría original y considerar otras explicaciones.

La construcción y clasificación del Diagrama de Dispersión es la parte central del proceso. No es ni el principio ni el final.

PAUTAS TÍPICAS DE CORRELACIÓN

Correlación

Se entiende por correlación el grado de relación existente entre dos variables.

Concepto

Cuando entre dos variables existe una correlación total, se cumple que a cada valor de una, le corresponde un único valor de la otra (función matemática). Es frecuente que dos variables estén relacionadas de forma que a cada valor de una de ellas le correspondan varios valores de la otra.

Correlación Fuerte

Los puntos se agrupan claramente alrededor de una línea imaginaria que pasa por el centro de la masa de los mismos. Estos casos sugieren que el control de una de las variables lleva al control de la otra.

Los datos parecen confirmar la teoría estudiada, pero hay que analizar la existencia de otras posibles explicaciones admisibles y relevantes para dicha relación.

Correlación Fuerte, Positiva: El valor de la variable "Y" (eje vertical) aumenta claramente con el valor de la variable "X" (eje horizontal).

Correlación Fuerte, Negativa: El valor de "Y" disminuye claramente cuando "X" aumenta.

Correlación Débil

Los puntos no están suficientemente agrupados, como para asegurar que existe la relación. El control de una de las variables no necesariamente nos llevará al control de la otra.

Si lo que se busca es determinar las causas de un problema, se deben buscar otras variables con una relación mayor o más relevante sobre el efecto.

Correlación Débil, Positiva: El valor de la variable "Y" (eje vertical) tiende a aumentar cuando aumenta el valor de la variable "X" (eje horizontal)

Correlación Débil, Negativa: El valor de "Y" tiende a disminuir cuando aumenta el valor de "X".

Correlación compleja

El valor de la variable "Y" parece estar relacionado con el de la variable "X", pero esta relación no es simple o lineal.

Sin correlación

Para cualquier valor de la variable "X", "Y" puede tener cualquier valor. No aparece ninguna relación especial entre ambas variables. En este caso, nuestra teoría no es correcta y se deben buscar otros tipos de relaciones.

UTILIZACIÓN

El Diagrama de Dispersión es una herramienta útil para comprobar (aceptar o rechazar) teorías respecto a la supuesta existencia de una relación entre dos variables.

Utilización en las fases de un proceso de solución de problemas

Hay tres puntos de dicho proceso en los que el Diagrama de Dispersión puede ser una herramienta útil:

- Durante la fase de diagnóstico, para ensayar teorías sobre las causas e identificar las causas raíz.

- Durante la fase de corrección, en el diseño de soluciones.

- Para el diseño de un sistema de control que mantenga los resultados de una acción de mejora de la calidad.

UTILIZACIÓN DE LA HERRAMIENTA

La herramienta es muy útil para: La herramienta es útil para:- Determinación de causas.- Diseño de soluciones y controles.

- Priorización de Causas.

RELACIÓN CON OTRAS HERRAMIENTAS

La herramienta está fuertemente relacionada con:

La herramienta está débilmente relacionada con:

- Diagrama Matricial. - Hojas de Comprobación y Recogida de Datos.- Diseño de Experimentos.

Un Diagrama o grafico de caja es un gráfico, basado en cuartiles, mediante el cual se visualiza un conjunto de datos señalando donde caen la mayoría de los valores y los valores que difieren considerablemente de la norma y al mismo tiempo describe varias características importantes, tales como la dispersión y simetría. Para su realización se representan los tres cuartiles (Q1, Q2 o mediana y Q3) y los valores mínimo y máximo de los datos, sobre un rectángulo, alineado horizontal o verticalmente.

Construcción:

Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos muestran el recorrido intercuartílico. Este rectángulo está dividido por un segmento vertical que indica donde se posiciona la mediana y por lo tanto su relación con los cuartiles primero y tercero (recordemos que el segundo cuartil coincide con la mediana y que primero es necesario encontrar la mediana para luego encontrar los 2 cuartiles restantes).Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo de la variable. Las líneas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre dentro de este rango es marcado e identificado individualmente.

Elementos de los diagramas de caja

El lado inferior del rectángulo representa el primer cuartil, y el lado superior, el tercer cuartil. En consecuencia, la altura de la caja representa el rango intercuartilico. La línea horizontal a través de la caja es la mediana. Los valores, indicados por puntos, respectivamente, por debajo y por encima de los bigotes inferior y superior se consideran valores atípicos.

Utilidad

Proporcionan una visión general de la simetría de la distribución de los datos; si la mediana no está en el centro del rectángulo, la distribución no es simétrica.

Son útiles para ver la presencia de valores atípicos.

Pertenece a las herramientas de la estadística descriptiva. Permite ver como es la dispersión de los puntos con la mediana, los percentiles 25 y 75 y los valores máximos y mínimos.

Representar la distribución de una variable continua

o Medianao Percentileso Valores extremoso Dispersión

Comparar gráficamente el comportamiento de una variable en distintos grupos.