unidad_2_bases_estadisticas_para_el_control_-a

87
Ing. Mario Enrique Elías Ayala e-mail: [email protected] UNIDAD II BASES ESTADISTICAS PARA EL CONTROL

Upload: roberto-gil

Post on 01-Jul-2015

938 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Unidad_2_Bases_estadisticas_para_el_control_-a

Ing. Mario Enrique Elías Ayalae-mail: [email protected]

UNIDAD IIBASES ESTADISTICAS

PARA EL CONTROL

Page 2: Unidad_2_Bases_estadisticas_para_el_control_-a

CONTENIDO

2.1 Estadística descriptiva

2.2 Técnicas de conteo

2.3 Introducción a la probabilidad

2.4 Distribuciones de probabilidad

Page 3: Unidad_2_Bases_estadisticas_para_el_control_-a

OBJETIVOS

Reconstruir sus conocimientos estadísticos. Aplicar las medidas de tendencia central así

como las medidas de dispersión. Aplicar los conceptos de probabilidad. Identificar y aplicar las diferentes

distribuciones de probabilidad.

Page 4: Unidad_2_Bases_estadisticas_para_el_control_-a

La estadística tiene que ver con la recopilación, presentación, análisis y uso de datos para tomar decisiones y resolver problemas.

Cualquier persona recibe información en forma de datos a través de los periódicos, la televisión u otros medios; y a menudo es necesario obtener alguna conclusión a partir de la información contenida en los datos.

Page 5: Unidad_2_Bases_estadisticas_para_el_control_-a

Ing. Melba de Mirandae-mail: [email protected]

2.1 Estadística Descriptiva

OBJETIVO: Conocer y calcular las medidas de tendencia central

Page 6: Unidad_2_Bases_estadisticas_para_el_control_-a

CONTENIDO

• Conceptos básicos.• Tipos de datos.• Aleatorización y otras estrategias de muestreo.• Organización de datos.• Representación de datos.• Medidas de tendencia central.

Datos no agrupados Datos agrupados

• Visualización de datos.• Medidas de dispersión

Page 7: Unidad_2_Bases_estadisticas_para_el_control_-a

Los métodos empleados para resumir y organizar datos se denominan estadística descriptiva; mientras que los métodos para tomar decisiones se denominan inferencia estadística.

GENERALIDADES

Page 8: Unidad_2_Bases_estadisticas_para_el_control_-a

ESTADÍSTICA DESCRIPTIVA

Estadística Descriptiva (Deductiva): Es la encargada de la organización, condensación, presentación de los datos en tablas y gráficos y del cálculo de medidas numéricas que permitan estudiar los aspectos más importantes de los datos.

DESCRIBIR

Page 9: Unidad_2_Bases_estadisticas_para_el_control_-a

Esto se debe a la creciente facilidad con la cual se pueden manejar grandes cantidades de datos numéricos, debido al uso de …

Page 10: Unidad_2_Bases_estadisticas_para_el_control_-a

CONCEPTOS BÁSICOS

ESTADISTICA: Es una colección de métodos para planear experimentos, obtener datos, y después organizar, resumir, presentar, analizar, interpretar y llegar a conclusiones basadas en los datos.

Page 11: Unidad_2_Bases_estadisticas_para_el_control_-a

Población: es la colección de todas las posibles mediciones u observaciones a estudiar. Se dice que la colección es completa, pues incluye a todos los sujetos que se estudian o que pueden hacerse de una variable bajo estudio.

Page 12: Unidad_2_Bases_estadisticas_para_el_control_-a

Se clasifica en dos categorías:

POBLACIÓN FINITA: Es aquella que incluye una cantidad limitada contable de observaciones, individuos o medidas. Siempre que sea posible alcanzar (contar) el número total de todas las posibles mediciones, se considera como finita la población.

POBLACIÓN INFINITA: Es aquella que incluye un gran conjunto de observaciones o mediciones que no pueden alcanzarse por conteo. Al menos, hipotéticamente, no existe límite en cuanto al número de observaciones que el experimento puede generar.

Page 13: Unidad_2_Bases_estadisticas_para_el_control_-a

Muestra: Es un conjunto de mediciones u observaciones

tomadas o seleccionados a partir de una población.

Es un subconjunto de la población.

CENSO: Es la colección de datos de cada uno de los miembros de la población.

Page 14: Unidad_2_Bases_estadisticas_para_el_control_-a

TIPOS DE DATOS

Variables: Son las características o lo que se estudia de

cada individuo de la muestra. Ej: sexo, edad, peso, estatura, color de ojos, estado civil, temperatura, cantidad de nacimientos, presión, grosor, diámetro, ...

Datos: Son los valores que toma la variable en cada

caso. Son las observaciones recolectadas (como

mediciones, géneros, respuestas de encuestas).

Page 15: Unidad_2_Bases_estadisticas_para_el_control_-a

PARAMETRO: Es una medición numérica que describe algunas características de una población.

EJEMPLO: Cuando Lincoln fue elegido presidente por primera vez,

recibió el 39.82% de 1, 865,908 votos. Si suponemos que el conjunto de todos esos votos es la población a considerar, entonces el 39.82% es un parámetro, no un estadístico.

ESTADISTICO: Es una medición numérica que describe algunas características de una muestra.

EJEMPLO: Con base en una muestra de 877 ejecutivos encuestados,

se encontró que el 45% de ellos no contaría a alguien con un error ortográfico en su solicitud de empleo. Esta cifra de 45% es un estadístico, ya que está basado en una muestra, no en la población completa de todos los ejecutivos.

Page 16: Unidad_2_Bases_estadisticas_para_el_control_-a

DATOS CUALITATIVOS (categóricos o de atributos): Son datos que solo toman valores asociados a las cualidades o atributos, clasificándolos en una de varias categorías, es decir, no son valores numéricos.

Ejemplo: Sexo: f/m. Hábito de fumar: Fumador/No fumador Color de ojos: negro, azul, marrón, … Religión: católica, evangélica, … Estado civil: soltero, casado, divorciado,…

Page 17: Unidad_2_Bases_estadisticas_para_el_control_-a

DATOS CUANTITATIVOS: provienen de variables que pueden medirse, cuantificarse o expresarse numéricamente.

Ejemplos: Peso Edad Estatura Presión Humedad Intensidad de un sismo Cantidad de hermanos

Page 18: Unidad_2_Bases_estadisticas_para_el_control_-a

DATOS DISCRETOS: Resultan cuando el número de posibles valores es un número finito, o bien, un número que puede contarse. (Es decir, el número de posibles valores es 0, 1, 2, etc.).

DATOS CONTINUOS (NUMERICOS): Resultan de un infinito de posibles valores que pueden asociarse a puntos de alguna escala continua, cubriendo un rango de valores sin huecos ni interrupciones.

Page 19: Unidad_2_Bases_estadisticas_para_el_control_-a

Abusos que se pueden cometer con la Estadística

Conclusiones erróneas debido a que los datos son numéricamente insuficientes.

Representaciones gráficas engañosas (escalas).

Datos muéstrales no representativos: Muestra que no incluye a elementos de toda la

población. Ciertas categorías de personas no responden

correctamente. Respuestas voluntarias (sesgadas).

Page 20: Unidad_2_Bases_estadisticas_para_el_control_-a

CLASIFICACION DEL TIPO DE MUESTREO

PROBALISTICO O ALEATORIOS

NO PROBALISTICOS(Determinístico)

Casual o accidentalIntencional Por cuotas

Azar simpleAzar sistemáticoEstratificadoConglomerados

ALEATORIZACIÓN Y OTRAS ESTRATEGIAS DE MUESTREO

Page 21: Unidad_2_Bases_estadisticas_para_el_control_-a

TIPOS DE MUESTREO

Los métodos de muestreo más comunes son: a) Aleatorio, b) Aleatorio simple, c) Sistemático, d) Por conveniencia, e) Estratificado, f) Por conglomerados o racimos.

Page 22: Unidad_2_Bases_estadisticas_para_el_control_-a

Muestra aleatoria: se considera aleatoria siempre y cuando cada observación, medición o miembro de la población tenga la misma probabilidad de ser seleccionado.

A menudo se usan computadoras para generar números telefónicos aleatorios.

Page 23: Unidad_2_Bases_estadisticas_para_el_control_-a

MUESTREO ALEATORIO SIMPLE

Se selecciona una muestra de tamaño de n sujetos de manera que cada posible muestra del mismo tamaño n tenga la misma posibilidad de ser elegida.

Todos los elementos de la población tienen la misma probabilidad de ser elegidos para formar parte de la muestra.

Page 24: Unidad_2_Bases_estadisticas_para_el_control_-a

Ejemplo: Imagine un salón de clase con 60 estudiantes acomodados en seis filas de 10 estudiantes cada una. Suponga que el profesor selecciona una muestra de 10 estudiantes tirando un dado y seleccionando la fila correspondiente al resultado. ¿El resultado es una muestra aleatoria? o ¿Es una muestra aleatoria simple?

Page 25: Unidad_2_Bases_estadisticas_para_el_control_-a

Se selecciona al azar un elemento de la población y a partir de él se seleccionan cada k-esimo los elementos siguientes (por ejemplo, cada n elemento en la población). Ejemplo: sea n=3

MUESTREO ALEATORIO SISTEMATICO

Page 26: Unidad_2_Bases_estadisticas_para_el_control_-a

MUESTREO DE CONVENIENCIA

Se utiliza n resultados fáciles de obtener.

Page 27: Unidad_2_Bases_estadisticas_para_el_control_-a

La población se divide en grupos homogéneos, llamamos estratos. La proporción de cada estrato en la población se mantiene en la muestra. Cada uno de los estrato de la muestra se obtiene por muestreo aleatorio simple sobre el estrato correspondiente de la población.

Población

Estrato 1 Estrato 2

Muestra

MUESTREO ESTRATIFICADO

Page 28: Unidad_2_Bases_estadisticas_para_el_control_-a

Se subdivide a la población en al menos dos diferentes subgrupos (o estratos) que comparten las mismas características (por ejemplo, el genero o categoría de edad) y después se extrae una muestra de cada subgrupo.

Homogéneos en su interior; diferentes entre sí en propiedades y tamaño.

• Los estratos más grandes tienen mayor probabilidad de ser representados.

Page 29: Unidad_2_Bases_estadisticas_para_el_control_-a

MUESTREO POR CONGLOMERADOS O RACIMOS

Se divide el área de la población en secciones (conglomerados o racimos ). Se eligen al azar unas pocas de estas secciones y luego se toman todos los elementos o miembros de las secciones elegidas para formar la muestra. Para dividir la población en

secciones podemos usar las provincias.

Page 30: Unidad_2_Bases_estadisticas_para_el_control_-a

Grupo 5CGrupo 5C

Grupo 1AGrupo 1A

Grupo 2AGrupo 2A

Grupo 3BGrupo 3B

Grupo 5CGrupo 5C

Grupo 1AGrupo 1A

Grupo 2AGrupo 2A

Grupo 3BGrupo 3B

Heterogéneos en su interior; diferentes entre sí en propiedades y tamaño.

Page 31: Unidad_2_Bases_estadisticas_para_el_control_-a

ORGANIZACIÓN DE DATOS NO AGRUPADOS

Una vez que se ha realizado la recolección de los datos, se obtienen datos en bruto, los cuales rara vez son significativos sin una organización y tabulación.

Page 32: Unidad_2_Bases_estadisticas_para_el_control_-a

Formas de organizar los datos: Un arreglo: es la forma más sencilla de

organizar los datos en bruto, consiste en colocar las observaciones en orden según su magnitud: ascendente o descendente.

Poco práctica cuando se tiene una gran cantidad de datos.

Si los datos muéstrales no se reúnen de forma adecuada, resultarían tan inútiles que ninguna cantidad estadística podrá salvarlos.

Page 33: Unidad_2_Bases_estadisticas_para_el_control_-a

Ejemplo:

En un área de servicios dentro de una empresa de manufactura se hace una encuesta para evaluar la calidad del servicio proporcionada y el nivel de satisfacción de los clientes internos. La encuesta consiste de 10 preguntas, donde cada una de ellas evalúa diferentes aspectos del servicio proporcionado. Las respuestas para cada pregunta es un número entre 0 y 10. Para hacer un primer análisis de los resultados obtenidos, se suman los puntos obtenidos de las 10 preguntas para cada cuestionario. A continuación se muestran los puntos obtenidos en 50 cuestionarios.

78 78 82 85 81 86 80 73 84 78

68 84 75 78 76 76 82 85 91 80

70 87 77 82 84 48 49 39 39 43

35 42 34 44 49 34 30 43 31 34

41 42 45 42 35 38 39 42 43 29

Page 34: Unidad_2_Bases_estadisticas_para_el_control_-a

Solución:1. Ordenar datos de menor a mayor:

29 30 31 34 34 34 35 35 38 3939 39 41 42 42 42 42 43 43 4344 45 48 49 49 68 70 73 75 7676 77 78 78 78 78 80 80 81 8282 82 84 84 84 85 85 86 87 91

2. Determinar el : Valor mínimo (Vmin) = 29 Valor máximo (Vmax) = 91

3. Calcular el Rango (R) = Vmax – VminRango (R) = 91 - 29= 62

Rango (R) = 62

Page 35: Unidad_2_Bases_estadisticas_para_el_control_-a

Las medidas de localización dividen la distribución en partes iguales, sirven para clasificar a un individuo o elemento dentro de una determinada población o muestra.

Clasificación de las medidas de localización:

MEDIDAS DE LOCALIZACIÓN

Centralización o de tendencia central• Indican valores con respecto a los que los

datos parecen agruparse.• Media, • Mediana y • Moda

Page 36: Unidad_2_Bases_estadisticas_para_el_control_-a

36

Dispersión Indican la mayor o menor concentración de

los datos con respecto a las medidas de centralización.• Desviación típica, coeficiente de variación,

Rango, Varianza Posición

Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos.

• Percentiles, Cuartiles, Deciles y mediana. Forma

Asimetría Apuntamiento o curtosis

Page 37: Unidad_2_Bases_estadisticas_para_el_control_-a

MEDIDAS DE TENDENCIA CENTRAL

Corresponden a valores que generalmente se ubican en la parte central de un conjunto de datos.

Forma como los datos pueden condensarse en un solo valor central alrededor del cual todos los datos muéstrales se distribuyen.

Page 38: Unidad_2_Bases_estadisticas_para_el_control_-a

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS

Las medidas de tendencia central más importantes son: Media. Mediana. Moda.

Son valores que se encuentran en el centro o a la mitad de los datos, o representa el valor al que tienden a concentrarse los datos de una muestra o de un proceso.

Page 39: Unidad_2_Bases_estadisticas_para_el_control_-a

MEDIA ARITMÉTICA

La media aritmética o simplemente promedio (también llamada media muestral).

Es la suma de todas las observaciones dividida entre

el número total de observaciones.

Se calcula de la siguiente forma: si las observaciones de una muestra de tamaño n son x1, x2,…,xn entonces:

11 2 ...

n

iin

xx x x

Xn n

Page 40: Unidad_2_Bases_estadisticas_para_el_control_-a

Ejemplo: datos no agrupadosEn un área de servicios dentro de una empresa de manufactura se hace una encuesta para evaluar la calidad del servicio proporcionada y el nivel de satisfacción de los clientes internos. La encuesta consiste de 10 preguntas, donde cada una de ellas evalúa diferentes aspectos del servicio proporcionado. Las respuestas para cada pregunta es un número entre 0 y 10. Para hacer un primer análisis de los resultados obtenidos, se suman los puntos obtenidos de las 10 preguntas para cada cuestionario. A continuación se muestran los puntos obtenidos en 50 cuestionarios.

Encontrar la media en la distribución

78 78 82 85 81 86 80 73 84 78

68 84 75 78 76 76 82 85 91 80

70 87 77 82 84 48 49 39 39 43

35 42 34 44 49 34 30 43 31 34

41 42 45 42 35 38 39 42 43 29

Page 41: Unidad_2_Bases_estadisticas_para_el_control_-a

Solución..

Encontrar la media en la distribución:

n

xX

n

ii

1

= 2990 =59.80 50

29 30 31 34 34 34 35 35 38 3939 39 41 42 42 42 42 43 43 4344 45 48 49 49 68 70 73 75 7676 77 78 78 78 78 80 80 81 8282 82 84 84 84 85 85 86 87 91

Page 42: Unidad_2_Bases_estadisticas_para_el_control_-a

Es el valor que ocupa la posición central de un conjunto de observaciones o datos, una vez que han sido ordenados en forma ascendente o descendente.

La mediana se suele definir como el valor “más intermedio” una vez que los datos han sido ordenados en forma creciente. Se suele denotar por Me.

Divide al conjunto de datos en dos partes iguales. Si el número de valores es impar, la mediana es el

número que se localiza exactamente a la mitad de los datos.

Si el número de valores es par, la mediana es el número que se obtiene calculando la media entre los dos valores centrales.

MEDIANA –PERCENTIL 50

Page 43: Unidad_2_Bases_estadisticas_para_el_control_-a

1 2

2 ( 2) 1

2

n

n n

x si n es impar

Md x xsi n es par

Cálculo de la mediana

Para datos no agrupados:Si n es impar: posición donde se ubica la mediana es igual a (n+1)/2.Si n es par: (n+1)/2 no es entero, por lo tanto la mediana será igual al promedio de las dos posiciones centrales.

La forma más general de calcular la mediana es la siguiente:

Page 44: Unidad_2_Bases_estadisticas_para_el_control_-a

Ejemplo: datos no agrupadosEn un área de servicios dentro de una empresa de manufactura se hace una encuesta para evaluar la calidad del servicio proporcionada y el nivel de satisfacción de los clientes internos. La encuesta consiste de 10 preguntas, donde cada una de ellas evalúa diferentes aspectos del servicio proporcionado. Las respuestas para cada pregunta es un número entre 0 y 10. Para hacer un primer análisis de los resultados obtenidos, se suman los puntos obtenidos de las 10 preguntas para cada cuestionario. A continuación se muestran los puntos obtenidos en 50 cuestionarios.

a) Ordenar los datos de menor a mayor.

b) Calcular mediana de los datos.

78 78 82 85 81 86 80 73 84 78

68 84 75 78 76 76 82 85 91 80

70 87 77 82 84 48 49 39 39 43

35 42 34 44 49 34 30 43 31 34

41 42 45 42 35 38 39 42 43 29

Page 45: Unidad_2_Bases_estadisticas_para_el_control_-a

Solución: Ordenar datos de menor a mayor:

Calcular mediana de los datosn es par utilizamos la formula:

29 30 31 34 34 34 35 35 38 3939 39 41 42 42 42 42 43 43 4344 45 48 49 49 68 70 73 75 7676 77 78 78 78 78 80 80 81 8282 82 84 84 84 85 85 86 87 91

Md = (X(n/2) + X((n/2) +1) )/2

Md = (49 + 68)/2 = 58.5

Page 46: Unidad_2_Bases_estadisticas_para_el_control_-a

Es una medida de tendencia central que se puede utilizar sea cual sea el tipo de variable a estudiar.

La moda de un conjunto de observaciones es el valor que más se repite, aquel cuya frecuencia absoluta es máxima.

Puede ser única (unimodal), que haya más de una (bimodal o multimodal), o que no exista.

Es la única medida de tendencia central que se puede determinar para datos de tipo cualitativo.

Para datos no agrupados: es simplemente la observación que más se repite.

MODA

Page 47: Unidad_2_Bases_estadisticas_para_el_control_-a

Ejemplo: datos no agrupadosEn un área de servicios dentro de una empresa de manufactura se hace una encuesta para evaluar la calidad del servicio proporcionada y el nivel de satisfacción de los clientes internos. La encuesta consiste de 10 preguntas, donde cada una de ellas evalúa diferentes aspectos del servicio proporcionado. Las respuestas para cada pregunta es un número entre 0 y 10. Para hacer un primer análisis de los resultados obtenidos, se suman los puntos obtenidos de las 10 preguntas para cada cuestionario. A continuación se muestran los puntos obtenidos en 50 cuestionarios. Clasificar el tipo de moda que presentan los datos e

identificar el valor de ella.

78 78 82 85 81 86 80 73 84 78

68 84 75 78 76 76 82 85 91 80

70 87 77 82 84 48 49 39 39 43

35 42 34 44 49 34 30 43 31 34

41 42 45 42 35 38 39 42 43 29

Page 48: Unidad_2_Bases_estadisticas_para_el_control_-a

Solución: Ordenar datos de menor a mayor:

El valor que mas se repite es Mo = 42 y 78 por lo tanto es BIMODAL

29 30 31 34 34 34 35 35 38 3939 39 41 42 42 42 42 43 43 4344 45 48 49 49 68 70 73 75 7676 77 78 78 78 78 80 80 81 8282 82 84 84 84 85 85 86 87 91

Page 49: Unidad_2_Bases_estadisticas_para_el_control_-a

Ejemplo:Construir para el ejemplo anterior el grafico que corresponda, considerando el tipo de datos.

78 78 82 85 81 86 80 73 84 78

68 84 75 78 76 76 82 85 91 80

70 87 77 82 84 48 49 39 39 43

35 42 34 44 49 34 30 43 31 34

41 42 45 42 35 38 39 42 43 29

Page 50: Unidad_2_Bases_estadisticas_para_el_control_-a

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 490

10

20

30

40

50

60

70

80

90

100

ENCUESTA

NO

TA

S

Datos no estan ordenados

Page 51: Unidad_2_Bases_estadisticas_para_el_control_-a

REPRESENTACIÓN DE DATOS

CURVAS

Page 52: Unidad_2_Bases_estadisticas_para_el_control_-a

EJERCICIO:

A continuación se presentan las calificaciones de 60 estudiantes en el año 2009:

23 60 79 32 57 74 52 70 82 3680 77 81 95 41 65 92 85 55 7652 10 64 75 78 25 80 98 81 6741 71 83 54 64 72 88 62 74 4360 78 89 76 84 48 84 90 15 7934 67 17 82 69 74 63 80 85 61

a) Ordenar los datos.b) Determine el valor mínimo y máximo de los datos.c) Encuentre el rango de los datos.d) Calcule la media, mediana y moda de la distribución.e) Construir el grafico que corresponda para la serie de

datos.

Page 53: Unidad_2_Bases_estadisticas_para_el_control_-a

Una distribución de frecuencias: es un arreglo de los datos que permite expresar la frecuencia de ocurrencias de las observaciones en cada una de las clases, mostrando el patrón de la distribución de manera más significativa.

Clase Pto.Medio

fi Fi fri FRi

ORGANIZACIÓN DE DATOS AGRUPADOS

Page 54: Unidad_2_Bases_estadisticas_para_el_control_-a

La Distribución de Frecuencias:Se recomienda su uso cuando se tienen

grandes cantidades de datos (n).

Su construcción requiere, en primer lugar, la selección de los límites de los intervalos de clase.

Para definir la cantidad de intervalos de clase (k), se puede usar:

La regla de Sturges: k = 1 + 3.3log(n) k = n

Page 55: Unidad_2_Bases_estadisticas_para_el_control_-a

La cantidad de clases no puede ser tan pequeño (menos de 5) o tan grande (más de 20), que la verdadera naturaleza de la distribución sea imposible de visualizar.

La amplitud de todas las clases deberá ser la misma. Se recomienda que los puntos medios tengan la misma cantidad de cifras significativas que los datos en bruto.

Los límites de las clases deben tener una cifras significativas más que los datos en bruto cuando sean reales.

Page 56: Unidad_2_Bases_estadisticas_para_el_control_-a

Determinar:Punto medio = (Li+Ls)/2.

Li: limite inferiorLs: limite superior

Frecuencia absoluta de la clase (fi).Frecuencia acumulada de la clase

(Fi).Frecuencia relativa de la clase

(fri)= fi/nFrecuencia relativa acumulada de la

clase (FRi).

Page 57: Unidad_2_Bases_estadisticas_para_el_control_-a

Ejemplo:

En un área de servicios dentro de una empresa de manufactura se hace una encuesta para evaluar la calidad del servicio proporcionada y el nivel de satisfacción de los clientes internos. La encuesta consiste de 10 preguntas, donde cada una de ellas evalúa diferentes aspectos del servicio proporcionado. Las respuestas para cada pregunta es un número entre 0 y 10. Para hacer un primer análisis de los resultados obtenidos, se suman los puntos obtenidos de las 10 preguntas para cada cuestionario. A continuación se muestran los puntos obtenidos en 50 cuestionarios.

78 78 82 85 81 86 80 73 84 78

68 84 75 78 76 76 82 85 91 80

70 87 77 82 84 48 49 39 39 43

35 42 34 44 49 34 30 43 31 34

41 42 45 42 35 38 39 42 43 29

Page 58: Unidad_2_Bases_estadisticas_para_el_control_-a

Solución:1. Ordenar datos de menor a mayor:

29 30 31 34 34 34 35 35 38 3939 39 41 42 42 42 42 43 43 4344 45 48 49 49 68 70 73 75 7676 77 78 78 78 78 80 80 81 8282 82 84 84 84 85 85 86 87 91

2. Determinar el : Valor mínimo (Vmin) = 29 Valor máximo (Vmax) = 91

3. Calcular el Rango (R) = Vmax – VminRango (R) = 91 - 29= 62

Rango (R) = 62

Page 59: Unidad_2_Bases_estadisticas_para_el_control_-a

59

4. Determinar el Número de clase (K) en las que se van a agrupar los datos. Clase: subgrupo en los que se agrupan los datos. Como se determina:

5.Determinar la Amplitud (A) de las clases.A= Rango/Clase = R/K

Amplitud ( A) = 62/7 = 8.857Amplitud ( A) ≈ 8.86 ≈ 9

La regla de Sturges: k = 1 + 3.3log(n)k = 1 + 3.3log(50) = 6.607 ≈ 7Número de clase (K) = 7

Si utilizamos la formula es:K= √nK=√50 = 7.07≈7

Page 60: Unidad_2_Bases_estadisticas_para_el_control_-a

6. Determinar las fronteras o límites naturales de cada clase.Li: Limite inferior --- Li = Vm = 29Ls: Limite superior – Ls = Li + (A-1)

Ls =29+ (9-1) =37

INTERVALOS DE CLASE

(I)

FRONTERAS

LIMITE INFERIOR

(Li)

LIMITE SUPERIOR (Ls)

1 X X+(A-1)

2 X+(A-1) X+2(A-1)

3 X+2(A-1) X+3(A-1)

IFRONTERAS

Li Ls

1 29 37

2 38 46

3 47 55

4 56 64

5 65 73

6 74 82

7 83 91

Page 61: Unidad_2_Bases_estadisticas_para_el_control_-a

6. Determinar las fronteras o límites reales de cada clase.Li: Limite inferior --- Li = Vm – ½ uLs: Limite superior – Ls = Li + Au: unidad, si es entero es 1, decimal es 0.1, centesimal 0.01, ect. Limite inferior --- Li = Vmin – ½ u

Li = 29 – (1/2) (1) = 28.5 Limite superior --- Ls = Li + A

Ls = 28.5 + 9 = 37.5

INTERVALOS DE CLASE

(I)

FRONTERAS

LIMITE INFERIOR

(Li)

LIMITE SUPERIO

R (Ls)

1 X X+A

2 X+A X+2A

3 X+2A X+3A

IFRONTERAS

Li Ls

1 28.5 <37.5

2 37.5 <46.5

3 46.5 <55.5

4 55.5 <64.5

5 64.5 <73.5

6 73.5 <82.5

7 82.5 <91.5

Page 62: Unidad_2_Bases_estadisticas_para_el_control_-a

7. Contar los datos que pertenecen a cada clase.8. Elaborar la tabla de frecuencias absolutas (fi).

IFRONTERAS

fiLi Ls

1 29 37 8

2 38 46 14

3 47 55 3

4 56 64 0

5 65 73 3

6 74 82 14

7 83 91 8

29 30 31 34 34 34 35 35 38 3939 39 41 42 42 42 42 43 43 4344 45 48 49 49 68 70 73 75 7676 77 78 78 78 78 80 80 81 8282 82 84 84 84 85 85 86 87 91

IFRONTERAS

fiLi Ls

1 28.5 <37.5 8

2 37.5 <46.5 14

3 46.5 <55.5 3

4 55.5 <64.5 0

5 64.5 <73.5 3

6 73.5 <82.5 14

7 82.5 <91.5 8

LIMITES NATURALES LIMITES REALES

Page 63: Unidad_2_Bases_estadisticas_para_el_control_-a

Para datos agrupados:

Donde: xi : punto medio de la clase i (marca de clase) = (Li + Ls)/2 fi : frecuencia absoluta de la clase i n : número de datos

Cálculo de la media

1

1

k

i iik

i

x fX

fi

Page 64: Unidad_2_Bases_estadisticas_para_el_control_-a

Ejercicio: datos agrupados

Calcule la media de la distribución:

I

FRONTERASFRECUENCIA

fi

MARCA CLASE

Xi Xi*fiLi Ls

1 29 37 8 33 264

2 38 46 14 42 588

3 47 55 3 51 153

4 56 64 0 60 0

5 65 73 3 69 207

6 74 82 14 78 1092

7 83 91 8 87 696TOTAL 50 3,000

= 3000/50= 60

1

1

k

i iik

i

x fX

fi

Xi= (Li+Ls)/2

Page 65: Unidad_2_Bases_estadisticas_para_el_control_-a

Donde: Li: límite inferior de la clase mediana.Faa: frecuencia acumulada de la clase anterior a la clase mediana.fm: frecuencia absoluta de la clase mediana.Ic :amplitud de la clase mediana

Datos agrupados: La clase mediana es la que contiene a la observación

que ocupa la posición N/2.

2( )*

NFaa

Md Li Icfm

Cabe destacar que es preferible el uso de la mediana como medida descriptiva del centro cuando se quiere reducir o eliminar el efecto de

valores extremos en un conjunto de datos (muy grandes o muy pequeños).

Cálculo de la mediana

Page 66: Unidad_2_Bases_estadisticas_para_el_control_-a

Ejercicio: datos agrupados

Calcule la mediana de la distribución:

I

FRONTERASFRECUENCIA

ABSOLUTA fi

FRECUENCIA ABSOLUTA

ACUMULADA

Faa Li Ls

1 28.5 <37.5 8 8

2 37.5 <46.5 14 22

3 46.5 <55.5 3 25

4 55.5 <64.5 0 25

5 64.5 <73.5 3 28

6 73.5 <82.5 14 42

7 82.5 <91.5 8 50

TOTAL 50

= 55.5

2( )*

NFaa

Md Li Icfm

Page 67: Unidad_2_Bases_estadisticas_para_el_control_-a

Solución:

1. Calcular el factor N/2 = 50/2 = 25 datos.

2. Observar en la tabla la columna de Frecuencia absoluta acumulada e identificar la clase en que se encuentran 25.

Faa3 = Faa4 = 25 datos

Fi3= 3 y Fi4 = 0

Por lo tanto esta en el intervalo de clase I3, con Fi3=3.

I

FRONTERASFRECUENCIA

ABSOLUTA fi

FRECUENCIA ABSOLUTA

ACUMULADA

Faa Li Ls

2 37.5 <46.5 14 22

3 46.5 <55.5 3 25

4 55.5 <64.5 0 25

Page 68: Unidad_2_Bases_estadisticas_para_el_control_-a

Limite real inferior de la clase mediana o frontera de clase es: Li = 47 - 0.5 = 46.5

Factor es: N/2 = número de datos/2 = N/2 = 50/2 = 25 Frecuencia acumulada de la clase anterior es: Faa = 22 Frecuencia de la clase de la mediana o frecuencia

absoluta es: fm = fi = 3 Ancho o amplitud de clase es: Ic = 9 Sustituyendo valores en la ecuacion se tiene que la

mediana es:

Md = 46.5 + ( 50/2 – 22 ) * 9 = 55.5

3

2( )*

NFaa

Md Li Icfm

Page 69: Unidad_2_Bases_estadisticas_para_el_control_-a

Cálculo de la moda

Para datos agrupados:

1

1 2

Mo Li Ic

Donde: Li: límite inferior de la clase modal. 1: diferencia entre fi de la clase modal y la anterior. 2: diferencia entre fi de la clase modal y la posterior. Ic: amplitud de la clase modal (clase de mayor frecuencia).

Page 70: Unidad_2_Bases_estadisticas_para_el_control_-a

Ejemplo: datos agrupados Calcular la moda de las distribuciones

anteriores.

I

FRONTERASFRECUENCIA

ABSOLUTA Fi

Li Ls

1 28.5 <37.5 8

2 37.5 <46.5 14

3 46.5 <55.5 3

4 55.5 <64.5 0

5 64.5 <73.5 3

6 73.5 <82.5 14

7 82.5 <91.5 8

TOTAL 50

1

1 2

Mo Li Ic

Mo2 = 40.7≈41

Mo6 = 79.3 ≈79

Page 71: Unidad_2_Bases_estadisticas_para_el_control_-a

El intervalo de clase donde mas se repiten los datos es en: Fi2 = Fi6=14

Limite real inferior de la clase modal es: Li2 = 38 - 0.5=37.5 Li6 = 74 – 0.5 =73.5

Diferencia entre la frecuencia de la clase modal y la clase pre modal es:

Δ21 =14 - 8 = 6 Δ61 =14 - 3 = 11 Diferencia entre la frecuencia de la clase modal y la clase

post modal es: Δ22 =14 - 3 = 11 Δ62 =14 - 8 = 6

Ancho o amplitud de clase es: Ic = 9 Mo2= 37.5 + ( 6 ) * 9 Mo6= 73.5 + ( 11 ) * 9

6 + 11 11 + 6 Mo2= 40.7≈41 Mo6= 79.3≈79

1

1 2

Mo Li Ic

Page 72: Unidad_2_Bases_estadisticas_para_el_control_-a

REPRESENTACIÓN GRÁFICA DE LOS DATOS

Los gráficos permiten visualizar en forma global y rápida el comportamiento de los datos.

Para datos cuantitativos agrupados en clases, comúnmente se utilizan tres gráficos: Histogramas. Polígono de frecuencias. Ojiva o Polígono de frecuencias acumuladas.

Page 73: Unidad_2_Bases_estadisticas_para_el_control_-a

Histograma OJIVA

REPRESENTACIÓN DE DATOS CUANTITATIVOS

Page 74: Unidad_2_Bases_estadisticas_para_el_control_-a

POLIGONO DE FRECUENCIAS

Histograma y Polígono de Frecuencias

Page 75: Unidad_2_Bases_estadisticas_para_el_control_-a

Para datos cualitativos se usan: Curvas Barras Sectores

REPRESENTACIÓN DE DATOS CUALITATIVOS

BARRAS

CURVAS

PASTEL O CIRCULAR

Page 76: Unidad_2_Bases_estadisticas_para_el_control_-a

Continuación….Construir para el ejercicio anterior, el grafico que corresponda, considerando el tipo de datos.

IFRONTERAS

fiLi Ls

1 29 37 8

2 38 46 14

3 47 55 3

4 56 64 0

5 65 73 3

6 74 82 14

7 83 91 8

0

2

4

6

8

10

12

14

8

14

3

0

3

14

8

INTERVALOS DE CLASE

FR

EC

UEN

CIA

Solución:El grafico que representa esos datos es el HISTOGRAMA

29 38 47 56 65 74 83 92

Page 77: Unidad_2_Bases_estadisticas_para_el_control_-a

RELACIÓN ENTRE LA MEDIA, LA MEDIANA Y LA MODA

Cuando los datos son sesgados es mejor emplear la Md

Permiten estudiar la forma de la curva, dependiendo de cómo se agrupan los datos.

Page 78: Unidad_2_Bases_estadisticas_para_el_control_-a

78

ASIMETRÍA O SESGO Una distribución es simétrica si

la mitad izquierda de su distribución es la imagen especular de su mitad derecha.

oEn las distribuciones simétricas media y mediana coinciden. Si sólo hay una moda también coincide.

oLa asimetría es positiva o negativa en función de a qué lado se encuentra la cola de la distribución.

Page 79: Unidad_2_Bases_estadisticas_para_el_control_-a

79

La media tiende a desplazarse hacia las valores extremos (colas).

Las discrepancias entre las medidas de centralización son indicación de asimetría.

Page 80: Unidad_2_Bases_estadisticas_para_el_control_-a

Relación entre Tendencia Central y la Simetría de la distribución

Simetría Relación

Simétrica o insesgada Moda = Mediana = Media

sesgo positivo o a la derecha

Moda < Mediana < Media

sesgo negativo o a la izquierda

Moda > Mediana > Media

Page 81: Unidad_2_Bases_estadisticas_para_el_control_-a

SIMETRICA ó Campana de Gauss-Normal

Forma bimodal

La forma depende de la distribución de las frecuencias absolutas de los datos. Algunas de las formas más comunes que puede adoptar son las siguientes:

Asimétrica

Page 82: Unidad_2_Bases_estadisticas_para_el_control_-a

Sesgada a la derecha Sesgada a la izquierda

Forma en UCon anomalías

Page 83: Unidad_2_Bases_estadisticas_para_el_control_-a

La localización o tendencia central de un conjunto de datos no necesariamente proporciona información suficiente para describirlos adecuadamente. Debido a que no todos los valores son semejantes, la variación entre ellos se considera importante.

Se puede decir que un conjunto de datos tiene

una dispersión reducida si los mismos se aglomeran estrechamente en torno a alguna medida de localización de interés y se dice que tiene una dispersión grande si se esparcen ampliamente alrededor de alguna medida de localización de interés.

Page 84: Unidad_2_Bases_estadisticas_para_el_control_-a

0

2

4

6

8

10

12

14

8

14

3

0

3

14

8

INTERVALOS DE CLASE

FR

EC

UEN

CIA

29 38 47 56 65 74 83 92

Mo = 41 Mo = 79

Md = 55.5

60X

CONCLUSIÓN:

Page 85: Unidad_2_Bases_estadisticas_para_el_control_-a

Comparación de los resultados obtenidos en las medidas de tendencia central

MEDIDAS DE TENDENCIA CENTRAL

DATOS NO AGRUPADOS

DATOS AGRUPADOS

Media Aritmética(¯) 59.8 60.0

Mediana (Md) 58.5 55.5

Moda (Mo) 42 y 78 41 y 79

X

Conclusión:

Page 86: Unidad_2_Bases_estadisticas_para_el_control_-a

EJERCICIO:

A continuación se presentan las calificaciones de 60 estudiantes en el año 2009:

23 60 79 32 57 74 52 70 82 3680 77 81 95 41 65 92 85 55 7652 10 64 75 78 25 80 98 81 6741 71 83 54 64 72 88 62 74 4360 78 89 76 84 48 84 90 15 7934 67 17 82 69 74 63 80 85 61

a) Determine el valor mínimo y máximo de los datos.b) Encuentre el rango de los datos.c) Construir el grafico que corresponda para la serie de datos.d) Calcule la media, mediana y moda de la distribución.e) Compare los resultados obtenidos. ¿Qué puede concluir de estos

datos?

Page 87: Unidad_2_Bases_estadisticas_para_el_control_-a

Comparación de los resultados obtenidos en las medidas de tendencia central

MEDIDAS DE TENDENCIA CENTRAL

DATOS NO AGRUPADOS

DATOS AGRUPADOS

Media Aritmética(¯)

Mediana (Md)

Moda (Mo)

X

Conclusión: