tabulación y representación gráfica de datos ... tabulacion y analisis... · gráfica de puntos...

Post on 20-Sep-2018

273 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Tabulación y representación gráfica de datos

cualitativos y cuantitativos

Contenido

Reglas para tabular y graficar

Resúmenes de datos: – Cualitativos

Distribución de frecuencias

Gráficas de barra y pastel

– Cuantitativos Distribución de frecuencias

Gráfica de puntos

Histogramas, Diagrama acumulativo

Diagrama de tallo y hojas

– Dos variables Tabulaciones cruzadas

Gráficos de dispersión

Conceptos importantes

Población: es la totalidad de elementos del

universo.

Población

Infinita

Finita

Conceptos importantes

Característica de estudio: es la variable que

se va a estudiar, ejemplos: edad, sexo, peso,

altura, concentración, ph, rendimiento, etc…….

Conceptos importantes

Muestreo: es una parte de la población para

inferir en su característica de estudio.

Conceptos importantes

Cuándo usar muestras?

La población es infinita o muy grande.

La población es finita pero lo suficientemente

grande, entonces es difícil hacer todo el

estudio.

La unidad de estudio se transforma o se

destruye al ser examinado, ejemplo es

ensayos destructivos.

Conceptos importantes

Variable es la característica de interés a estudiar

Cuantitativa

Cualitativa

Variable

Continua

Discreta

Atributo

Color

Sabor

Aroma

Suavidad

Impacto

Cantidad

personas

Cantidad

de autos

Cantidad

de bolsas

Peso

Altura

Frecuencia

Estatura

Edad

Las variables cuantitativas requieren de un instrumento o medio

de medición.

Conceptos importantes

Experimento: Es cualquier

proceso que genera un

conjunto de datos.

Elemento: es el resultado

del espacio muestral.

Observación es cualquier

registro de información

numérico o categórico.

Conceptos importantes

Estadístico: Es la medida

de una característica de la

población que se calcula a

partir de los datos de una

muestra.

Tabulación

Es un ordenamiento de la información en filas y columnas

Una buena tabla debe tener: – Títulos y encabezamientos claros y completamente

definidos

– Incluir las unidades en que se expresa la medición

– Incluir la suficiente información que permita chequear la validez de los cálculos o argumentos

– Incluir fuente de datos cuando corresponda

Ejemplo de tabulación

Representaciones gráficas

Alternativa para mostrar la información obtenida o

generada

Los principios básicos son:

– Simplicidad

– Fidelidad (incremento de escalas)

– Representar una ayuda ( no son concluyentes)

– Deben responder al objetivo deseado

Regla

Partición de la Población. Cada observación

debe pertenecer a una, y sólo una clase o

categoría.

Para estudiar las características de una

variable se ordenan los valores observados

de la muestra en k clases denominadas c1,

c2, .. ck.

14

ANALISIS DE DATOS

Diseño de procedimientos eficientes que suministren datos confiables para su posterior análisis.

Planear la recolección de datos indicando entre otros aspectos tiempo (¿cuándo?, lugar (¿dónde?), responsabilidades (¿quién?), formatos y procedimientos (¿cómo?).

El registro y análisis de la información proveniente de muestras representativas tomadas de pruebas físicas y químicas se hacen a los productos con el fin de verificar su estado.

15

ANALISIS DE DATOS Datos deben ser veraces y reflejar las

condiciones del proceso, datos erróneos generan conclusiones erróneas.

El analista debe tener plena confianza en los datos para que el estudio sea válido.

Mínima desconfianza en los datos o en su procedencia obligan al analista a descartarlos.

Recolección de datos debe ser cuidadosamente planeada y programada asignado los recursos que sean necesarios para garantizar excelente calidad de datos.

16

ANALISIS DE DATOS

Acciones correctivas y preventivas, con las que se procurará reducir y si es posible eliminar los problemas.

Análisis y aproximaciones de los datos a distribuciones de probabilidad es necesario agruparlos de tal manera que se puedan visualizar comportamientos y tendencias históricas de los procesos que ayuden a interpretar los aspectos que pueden estar causando descontrol y por ende bajos niveles de calidad.

Distribución de Frecuencias

Datos No

Agrupados

n < 30

Datos

Agrupados

n ≥30

Tratamiento de datos, para conocer su comportamiento

Gráfico de barras:

– Representación gráfica de datos cualitativos que se han

resumido en una distribución de frecuencia.

– En el eje horizontal se especifican los indicadores o

nombres de cada clase y en el eje vertical una escala de

frecuencia

– Un caso particular lo constituye el gráfico de Pareto

desarrollado como una forma de incrementar la calidad.

Aquí las clases van ordenadas de izquierda a derecha de

mayor a menor frecuencia

Gráfico de pastel:

– Representación gráfica de frecuencias relativas o

porcentuales

– Para dibujarlo se traza un círculo y se divide según las

frecuencias.

Datos cualitativos

Ejemplo

Los empleados de una empresa electrónica moderna

tienen un sistema de horario flexible. Pueden comenzar

su jornada de trabajo a las 7:00, 7:30, 8:00, 8:30 o 9:00.

Los datos siguientes representan una muestra de las

horas de entrada que seleccionaron.

1.Resumir los datos formando una distribución de

frecuencias y graficarlos en barras y pastel

2.¿Que le dicen los resúmenes respecto a las

preferencias horarias?

Datos cualitativos

Horas de entrada

7:00 8:30 9:00 8:00 7:30

7:30 8:30 8:30 7:30 7:00

8:30 8:30 8:00 8:00 7:30

8:30 7:00 9:00 8:30 8:00

Datos cualitativos

Tabla de Frecuencia

Datos cualitativos

Clase F.Absoluta F.Relativa F.porcentual

7:00 3 0.15 15 %

7:30 4 0.2 2 %

8:00 4 0.2 2 %

8:30 7 0.35 35 %

9:00 2 0.1 10 %

Total 20 1 100 %

Gráfica de barras

Datos cualitativos

0

1

2

3

4

5

6

7

8

07:00 07:30 08:00 08:30 09:00

Horas

Fre

cu

en

cia

ab

so

luta

Entrada

Gráfico de pastel

Datos cualitativos

15%

20%

20%

35%

10%

07:00 07:30 08:00 08:30 09:00

Ejercicio La Organización Internacional de Normas, en Ginebra ha

desarrollado un conjunto de normas de calidad, las ISO. En todo el

mundo las empresas tratan de obtener la certificación. Una

encuesta solicito a un grupo de fabricantes sus planes para

obtener este nivel. Las respuestas se codificaron de acuerdo a

C= ya certificado

P= en vías de certificarse

W= le interesa el tema

N= no quiere certificarse

U = indeciso

Las repuestas fueron las siguientes:

Datos cualitativos

W P N N W P C W W N

N W U W P W P C N P

P N W W N W N W W N

C W P W N N C W P N

W W N W N U N W N W

Datos cualitativos

Forme una distribución de frecuencia absoluta y

porcentual para cada conjunto de datos

Una Consultora informó que menos del 1% de las

empresas estaban certificadas un año antes de la

encuesta. Comente la tendencia hacia la

certificación ISO

Datos cualitativos

Es un método o técnica de análisis de datos.

Consiste en el agrupamiento de un conjunto de

datos en intervalos, de tal manera que genera

una distribución o arreglo de datos.

El objetivo es proporcionar una perspectiva de

los datos

Esta distribución se puede comparar con las

distribuciones estadísticas teóricas y así inferir

soluciones al problema planteado.

DISTRIBUCIONES DE FRECUENCIAS

28

DISTRIBUCIONES DE FRECUENCIAS

Visualizar la posible distribución de datos

Cada dato pierde su identidad.

Distribuciones estadísticas teóricas o empíricas

para inferir hacia el problema.

Distribuciones de frecuencia de datos no

agrupados presentan una distribución que es muy

difícil de aproximar.

Cifras significativas de los datos

Selección de un número de clases que refleje una

adecuada distribución.

29

DISTRIBUCIONES DE FRECUENCIAS

Es conveniente que los datos se agrupen en un número de intervalos de clase que están entre 10 y 20. Queda a criterio del analista escoger este número, aunque existen reglas que podrían usarse como punto de partida.

Moya Marcos, Robles Natalia, 2010

Datos Agrupados

n ≥ 30

30

DISTRIBUCIONES DE FRECUENCIAS Datos agrupados

Criterio del Libro Estadístico un enfoque teórico y práctico, página 34 a la 38.

PREAMBULO

Muestreo: Recolectar los datos (xi) de acuerdo con el tamaño de muestra previamente calculado.

Ordenar los datos de menor a mayor.

31

DISTRIBUCIONES DE FRECUENCIAS Datos agrupados

Paso 1. Calcular el número apropiado de intervalos K.

Regla de Sturges: k = 1 + 3,3 log n, donde n es el tamaño de la muestra.

Otra opción es K = raíz(n)

Paso 2.

Calcular el rango:

R = ximáx - ximín

Paso 3. Calcular el intervalo de clase (C), así:

C = R/k

El valor de i debe ser redondeado siempre hacia arriba y a la misma cantidad de decimales que tienen los datos.

32

Paso 4. Calcular el nuevo rango (NR)

NR = C * k

Paso 5. Calcular los límites inferior y superior de la primera y última clase de la distribución, de la siguiente forma:

Observ menor = Xmin – (NR – R)/2

Observ mayor = Xmáx + (NR – R)/2

Paso 6. Construir la distribución de frecuencias

DISTRIBUCIONES DE FRECUENCIAS Datos agrupados

33

DISTRIBUCIONES DE FRECUENCIAS

Completar el cuadro de frecuencias de

datos agrupados.

Construir el histograma para observar

la distribución del conjunto de datos.

Frecuencia absoluta: Se llama frecuencia

absoluta de la clase ci al número total de individuos u

observaciones que pertenece a dicha clase y se

denota por ni. Como las clases c1, c2, ..... ck

Frecuencia relativa: Se llama frecuencia relativa

de la clase ci a la proporción de individuos que

pertenecen a la clase sobre el total de individuos o

tamaño de la muestra.

Frecuencia porcentual: Caso particular de

frecuencia relativa multiplicada por 100

Frecuencia absolutaFrecuencia relativa =

n

Frecuencia porcentual = Frecuencia relativa 100

Datos cualitativos

Distribución de frecuencia

Para los datos cuantitativos se deben :

– Determinar la cantidad de clases

– Determinar el ancho de cada clase

– Determinar los límites de clase

Datos cuantitativos

Cantidad de clases:

– Se forman al especificar intervalos de valores de datos que

se usan para agrupar los elementos de un conjunto

– Se recomienda usar entre 10 y 20 clases

– El objetivo final es mostrar la variación de los datos

Ancho de las clases:

– La regla es elegir igual ancho para todas las reglas

– Una mayor cantidad de clases se traduce en un menor

ancho

– Cálculo aproximado:

Valor maximo en los datos- Valor minimo en los datosAncho de clase =

Cantidad de clases

Datos cuantitativos

Límite de clases:

– Los límites se escogen para que cada valor de

dato sólo pertenezca a una clase

– Se asigna un valor mínimo y máximo para cada

clase

Punto medio de clase: corresponde al valor

promedio entre los límites inferior y superior

de clase

Datos cuantitativos

38

DISTRIBUCIONES DE FRECUENCIAS (EJEMPLO)

Se toman doce grupos de cinco

unidades de una máquina llenadora de

latas de pasta de tomate y se pesan,

originando los siguientes datos:

Construir una distribución de frecuencias

de datos agrupados.

A continuacion se presenta el

procedimiento para construir una

distribucion de frecuencias de datos

agrupados

40

Paso 1 Recolectar datos TABULAR DATOS

HOJA DE DATOS - DISTRIBUCION DE FRECUENCIAS

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

Artículo: Pasta de tomate Código: XY-987

Característica: Peso Especificación: 20,0 ± 2,5 decigramos

Operación: Llenado Máquina: Llenadora n=60

Operario: M. Matamoros Inspector: M. Coto Turno: 1

Fecha:02-12-84 Hora de inicio: 8 am Hoja: 1de 1

–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

# 1 2 3 4 5 6 7 8 9 10 11 12

–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

1 22,0 23,0 20,0 21,5 19,0 21,5 22,5 25,0 21,5 24,5 22,5 23,5

2 20,5 19,0 19,0 19,0 21,5 24,0 20,0 20,5 23,0 24,0 22,5 20,0

3 20,0 21,5 19,5 21,0 22,5 19,5 21,0 21,5 22,5 23,5 20,5 20,5

4 21,0 21,0 20,0 20,0 22,5 22,0 22,5 21,5 23,5 22,0 22,0 22,5

5 22,5 21,5 22,5 22,0 18,5 22,0 22,0 22,5 21,0 22,0 19,5 23,0

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––-

41

SOLUCION

Paso 2: Ordenar datos de menor a mayor (es

opcional)

Paso 3: Fijar el número de clases (k)

Regla de Sturges: k = 1 + 3,3 log n, donde n es el tamano de la muestra.

k = 1 + 3,3 log 60 = 6,867, redondear a la próxima unidad

k =7

Paso 4: Determinar el Rango (R)

R = ximáx - ximín

R = 25,0 – 18,5 = 6,5

SOLUCION

Paso 5: Calcular el intervalo de clase (C) R 6,5 C = —— = ——— = 0,923 = 1,0 k 7 C = 1,0 El valor de C debe ser redondeado siempre hacia arriba y a la misma cantidad de decimales que tienen los datos. Paso 6: Calcular el Nuevo Rango (NR) NC = C * k = 1, 0 * 7 = 7,0

SOLUCION

Paso 5: Fijar los limites reales de clase (Li , Ls). Se les

reconoce por ser limites abiertos.

Li1 = ximín – (NR-R)/2 =

Li2 = Ls1 = XXXX

Ls2 = Li2 + C = y así sucesivamente hasta completar las k

clases

SOLUCION Paso 7: Completar el cuadro de frecuencias de datos

agrupados de la siguiente manera

a. Punto medio de clase o Marca de Clase (Xk)

Xk = Li + Ls o li + ls

2 2

b. Obtener la frecuencia absoluta de cada clase nk (conteo)

c. Obtener la frecuencoa absoluta acumulada (Nk)

d. Calcular la frecuencia relativa (fk)

fk = nk

n

e. Obtener la frecuencia relativa acumulada (Fk)

Fk = Nk

n

SOLUCION

Paso 8: Construir el histograma para observar la

distribucion del conjunto de datos

46

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

HOJA DE DATOS - DISTRIBUCION DE FRECUENCIAS

–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

Artículo: Pasta de tomate Código: XY-987

Característica: Peso Especificación: 20,0 ± 2,5 decigramos

Operación: Llenado Máquina: Llenadora n=60

Operario: M. Matamoros Inspector: M. Coto Turno: 1

Fecha:02-12-84 Hora de inicio: 8 am Hoja: 1 de 1

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

Li Ls CONTEO nk xk Nk fk Fk

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

18,25 19,25 ||||| 5 18,75 5 8,33 8,33

19,25 20,25 ||||||||| 9 19,75 14 15,00 23,33

20,25 21,25 |||||||| | 9 20,75 23 15,00 38,33

21,25 22,25 |||||||||||||||| 16 21,75 39 26,67 65,00

22,25 23,25 |||||||||||||| 14 22,75 53 23,33 88,33

23,25 24,25 ||||| 5 23,75 58 8,33 96,67

24,25 25,25 || 2 24,75 60 3,33 100

SOLUCION

Utilizando Minitab 16

2524232221201918

19

17

15

13

11

9

7

5

3

1

Peso

Fre

cu

en

cia

Media 21,54

Desv.Est. 1,485

N 60

Histograma de PesoNormal

Histogramas

Este gráfico se puede preparar con datos que han

sido resumido en una distribución de frecuencia

Se coloca la variable de interés en el eje horizontal y

la distribución de frecuencia el vertical

A diferencia del gráfico de barras no hay separación

entre los rectángulos formados por las clases

adyacentes, se completa con la línea vertical que

separa a cada uno de ellos

Cuando se traza un línea recta entre cada punto

medio de clase se construye un polígono de

frecuencia

Datos cuantitativos

10 15 20 25

Unidad de medición

Datos cuantitativos

Histograma y poligono de frecuencias

Diagrama acumulativo

Este tipo de resumen corresponde a la distribución de frecuencias acumuladas, en donde se emplean la cantidad de clases, anchos y límites definidos anteriormente

Esta distribución muestra la cantidad de elementos menores que, o iguales al límite superior de clase para cada clase

El último elemento de una frecuencia acumulada es siempre la cantidad de elementos

Una gráfica de una distribución acumulada se llama OJIVA. Los valores de los datos están en el eje horizontal y las frecuencias acumuladas en el eje vertical

Datos cuantitativos

Ejemplo

Considere la siguiente distribución de frecuencias:

Forme una distribución acumulada absoluta y relativa

Clase Frecuencia

10-19 10

20-29 14

30-39 17

40-49 7

50-59 2

Datos cuantitativos

Clase Frecuencia F.acumulada

absoluta

F.acumulada

porcentual

10-19 10 10 2%

20-29 14 24 48%

30-39 17 41 82%

40-49 7 48 96%

50-59 2 50 100%

Total 50 50 100%

Datos cuantitativos

Diagrama de tallo y hoja (Stem-and-Leaf)

Es dentro de las técnicas de análisis exploratorio de

datos una de más usadas ya que permite mostrar el

orden de rangos así como la forma de un conjunto de

datos en forma simultanea

Se caracteriza por ser fácil de construir y dar más

información que un histograma, debido a que

muestra los valores reales

No hay cantidad única de tallos ni hojas aún cuando

se recomienda seleccionar entre 5 a 20 tallos

Datos cuantitativos

Ejemplo Trace un diagrama de tallo y hoja para los siguientes datos.

70, 72, 75, 64, 58, 83, 80, 82, 76, 75, 68, 65, 57, 78, 85, 72

1.Ordenar en forma ascendente

2.Seleccionar rangos (ancho de clases) define tallos

3.Incorporar hojas

5 7 8

6 4 5 8

7 0 2 2 5 5 6 8

8 0 2 3 5

Hoja Tallo

Datos cuantitativos

Tabulaciones cruzadas

Es formato de tabulación se emplea para

examinar la relación entre dos variables

Se pueden considerar comparaciones entre

variables cuali o cuantitativa

Datos cuantitativos

n= 196 Precio por cubierto

Calificación de calidad $10-19 $20-29

Buena 42 40

Muy Buena 34 64

Excelente 2 14

Total 78 118

Gráficos de dispersión

Son una representación de la relación entre

dos variables cuantitativas

En este diagrama se grafican los puntos con

esas coordenadas

Pueden indicar relación positiva, negativa y

sin relación aparente

Datos cuantitativos

Resumen Objetivo Naturaleza Tipo de diagrama

Distribución de

frecuencia de una

variable

Cualitativa Circular, Barras Simples

Continua Histogramas, Polígonos de frecuencia

Distribución de

frecuencia de dos

variables

Cualitativa

Barras agrupadas

Continua Histogramas, Polígonos de frecuencia

Relación entre

dos variables

Cualitativa

Barras agrupadas y Barras

proporcionales

Continua Gráficos lineales y diagramas de

dispersión

top related