Download - Clase de introducción a la estadística
1 de 44
Fundamentos de Teoría Estadística
2 de 44
Temas a tratar
Indicadores.
Datos.
Variación y tipo de causas.
Distribuciones, y cálculo de parámetros y estadísticos.
Caracterización de los datos.
Sumando o restando distribuciones.
Relación entre estadísticos y parámetros.
Intervalos de Confianza.
Ejercicios.
Indicadores
4 de 44
Características de un indicador
Todo indicador, no importa de qué tipo sea, debe cumplir con las siguientes características:
Mesurable
Existe una manera de cuantificar el cumplimiento de la especificación.
Verificable
Múltiples observadores deberían coincidir cuando evalúan el resultado del indicador.
Eficiente
Deben ser elegidos considerando el costo.
DMAIC - Fase 1 Medir
Datos
6 de 44
Para qué recolectamos datos
Para separar lo que “pensamos que pasa” de lo que “realmente pasa”.
Confirmar o descartar ideas y preconceptos.
Establecer una línea de base para el desempeño.
Ver el desempeño del proceso o la historia de un problema a lo largo del tiempo.
Medir el impacto de los cambios introducidos.
Identificar y entender las relaciones que explican la variación.
Controlar un proceso.
Evitar soluciones que no corrigen realmente el problema.
7 de 44
Variables para las cuales recolectar datos
Los datos pueden pertenecer a:
Y: Resultado del proceso medido en el producto o servicio, que se entrega al cliente externo del proceso.
y: Resultado intermedio del proceso medido en el producto o servicio que un cliente interno recibe de un proveedor interno.
x: Variable de proceso que afecta al y o al Y.
X: Variable medida en el producto o servicio que es input del proceso.
11 de 44
Definiciones operacionales 1
Para que un dato pueda ser confiable debe, entre otros factores, tener una definición operacional.
Una Definición Operacional se refiere a: Una clara, compresible y no ambigua descripción de qué
debe ser medido u observado... De manera tal que todos puedan operar o medir
consistentemente en base a la definición.
¿Cómo describir mejor el factor / cosa que queremos observar y medir?
12 de 44
Definiciones operacionales 2
No hay una regla ni respuesta única para lograr una definición operacional de una medición.
Lo más específico posible, es mejor.
La mejor manera de mejorar una definición operacional es poniéndola a prueba con quienes la usarán en la práctica. El entrenamiento y uso monitoreado es indispensable.
DMAIC - Fase 1 Medir
Variación y tipo de causas
14 de 44
Variación 1
Los resultados y variables de un proceso están afectados por variación.
Medio ambiente
Personas
Máquinas
MaterialesMétodosMediciones
Los resultados del proceso tienen variación, lo que
afecta al cliente
Los resultados del proceso tienen variación, lo que
afecta al cliente
La variación está originada en la variación de las
variables
La variación está originada en la variación de las
variables
Una importante fuente de variación está en la omisión
de métodos estudiados y comunes a todos los
operadores.
Una importante fuente de variación está en la omisión
de métodos estudiados y comunes a todos los
operadores.
A mayor uniformidad de las variables, mayor
uniformidad del resultado
A mayor uniformidad de las variables, mayor
uniformidad del resultado
15 de 44
Variación 2
Máquinas
MaterialesMétodosMediciones
Medio ambiente
Personas
Tiempo
Med
ició
n
16 de 44
Variación 3
Verifiquemos la existencia y tipos de variación.
Si tiramos dos dados, y sumamos los resultados de ambos:
¿Cuáles serán los posibles resultados de nuestra suma?
¿Cuál es la probabilidad de cada valor?
6-66-56-46-36-26-1
5-65-55-45-35-25-1
4-64-54-44-34-24-1
3-63-53-43-33-23-1
2-62-52-42-32-22-1
1-61-51-41-31-21-1
6-66-56-46-36-26-1
5-65-55-45-35-25-1
4-64-54-44-34-24-1
3-63-53-43-33-23-1
2-62-52-42-32-22-1
1-61-51-41-31-21-1
17 de 44
Variación 4
2 3 4 5 6 7 8 9 10 11 12
Esta es la distribución teórica, -ver
tabla anterior-
Esta es la distribución teórica, -ver
tabla anterior-
18 de 44
Variación 5
2 3 4 5 6 7 8 9 10 11 12 151413
Esta es una distribución real.
Esta es una distribución real.
• Cualquier número dicho entre 2 y 12 no causará sorpresas. Son cosas “normales”.• Cualquier número dicho entre 2 y 12 no causará sorpresas. Son cosas “normales”.
19 de 44
Variación 6
2 3 4 5 6 7 8 9 10 11 12 151413
Esta es una distribución real.
Esta es una distribución real.
• Cualquier número fuera de ese rango, sí.Son cosas “especiales”. Algo diferente tiene que haber ocurrido.
• Cualquier número fuera de ese rango, sí.Son cosas “especiales”. Algo diferente tiene que haber ocurrido.
20 de 44
Variación 7
2 3 4 5 6 7 8 9 10 11 12
Esta es una distribución real.
Esta es una distribución real.
• Cualquier secuencia que no respete el patrón, por ejemplo un número repetido excesivamente sí. Son cosas “especiales”. Algo diferente tiene que haber ocurrido.
• Cualquier secuencia que no respete el patrón, por ejemplo un número repetido excesivamente sí. Son cosas “especiales”. Algo diferente tiene que haber ocurrido.
22 de 44
Causas Comunes de variación 1
1. Causas Comunes
Atribuibles al proceso.
Normales en condiciones operativas especificadas.
Función sólo del azar.
Muchas. Cada una genera pequeña variación.
Se eliminan o disminuyen con el rediseño del proceso, cambiando las condiciones operativas especificadas.
Es un 6 o un 8 en el juego de los dados.
23 de 44
Causas Comunes de variación 2
Por ejemplo, para ir de nuestra casa al trabajo durante todos los días en auto, podríamos encontrar las siguientes causas Comunes:
Los semáforos. Mayor o menor cantidad de autos en la calle.
24 de 44
Causas Especiales de variación 1
2. Causas Especiales
No atribuibles al proceso.
Situación que no responde al diseño o funcionamiento original del proceso.
Deben eliminarse identificando y destruyendo las causas que la generan.
Es un 14 en el juego de los dados.
Las causas Especiales no son solamente aquellas que “empeoran” el resultado. Una serie de valores con los dados de 3, 5, 4, 5, 3, 4, 5, 5, 4, 5, 3, 4... aunque ha bajado la variabilidad del resultado también es especial: no responde al Patrón.
25 de 44
Causas Especiales de variación 2
Por ejemplo, para ir de nuestra casa al trabajo durante todos los días en auto, podríamos encontrar las siguientes causas Especiales:
La pinchadura de una cubierta. Quedarnos sin combustible.
27 de 44
Causas Comunes y Especiales 2
Qué acciones tomar frente a las diferentes causas, Comunes o Especiales:
Causa Situación Acción a tomar
Comunes
El proceso está entregando lo mejor según su diseño.
Si el resultado del proceso no es el necesario, rediseñar el proceso.
Especiales
El proceso está entregando una variación diferente al diseño dadas las causas especiales.
Eliminar las causas especiales u homologarlas en el caso que disminuyan la variabilidad.
DMAIC - Fase 1 Medir
Distribuciones, y cálculo de parámetros y estadísticos
30 de 44
Técnicas Estadísticas
Estadística Descriptiva Permite describir la información de la cual disponemos,
para entender los datos.
Estadística Inferencial Usa un conjunto de datos más pequeño, una muestra,
para sacar conclusiones o hacer inferencias de un grupo más grande, la Población.
31 de 44
Población
Es el grupo completo de objetos en el cual estamos interesados, al cual queremos describir o del cual queremos sacar conclusiones.
A los valores reales que representan los resultados de un proceso los llamamos Parámetros.
32 de 44
Muestra
Es un grupo de unidades seleccionadas de la población. Al estudiar la muestra, esperamos sacar conclusiones de la población.
Por eso, debe ser representativa de toda la población, y generalmente esto es logrado a partir de la selección aleatoria de la muestra.
A los valores reales que representan los resultados de una muestra los llamamos “Estadísticos”.
Las técnicas estadísticas nos son útiles para tomar decisiones sobre un proceso o población basado en un análisis de información contenida en una muestra de esa población.
33 de 44
Parámetros y Estadísticos 1
Tanto de una muestra como de la Población nos interesa:
Posición Dispersión FormaPosiciónPosición DispersiónDispersión FormaForma
34 de 44
Parámetros y Estadísticos 2
Nomenclatura
σ = desvío estándar de la población.
µ = media de la población
N = población total.
x = estimación de la media (muestra).
s = estimación del desvío estándar (muestra).
n = tamaño de la muestra.
35 de 44
Promedio = Mediana = Moda Moda Promedio
Mediana
Posición (localización) 1
Estadísticos de Posición
Promedio Promedio matemático.
Mediana Valor que deja el mismo 50 % de los datos por derecha
que por izquierda.
Moda Valor más repetido.
36 de 44
Posición (localización) 2
Cálculo del promedio
Población Muestra
Cálculo de la Mediana
Es el valor del dato central, cuando estamos hablando de cantidad de datos impares.
Toma el valor del promedio de los dos datos centrales, cuando la cantidad de datos es par.
n
n1 X
X∑
=N
XN1μ
∑=
37 de 44
Variación 1
Estadísticos de Dispersión
Rango Es un estadístico que muestra la máxima variabilidad de
un conjunto de observaciones. Rango = Mayor valor – Menor valor
Desvío estándar (σ o s) Es un estadístico que señala la dispersión de los valores
respecto al valor central (de posición).
Varianza (σ2 o s2) Es el cuadrado del desvío estándar (en realidad el desvío
estándar es la raíz cuadrada de la Varianza).
38 de 44
Variación 2
Cálculo del desvío estándar
Población
Muestra
N
2μ)N
(X...2μ)2
(X2μ)1
(Xσ
−−+−=
1-n
2)Xn
(X...2)X2
(X2)X1
(Xs
−−+−=
39 de 44
Cálculo de promedio y desvío estándar 1
1°1°
2°2°
3°3°
Ejercicios Medir.Columna 7Ejercicios Medir.Columna 7Cálculos de
estadísticos y graficación
Cálculos de estadísticos y graficación
Nivel de Confianza defaultNivel de Confianza default
40 de 44
Cálculo de promedio y desvío estándar 2
103,5102,0100,599,097,596,0
Median
Mean
100,3100,2100,1100,099,999,899,7
1st Quartile 98,759Median 99,9623rd Quartile 101,080Maximum 103,856
99,774 100,121
99,736 100,275
1,415 1,662
A-Squared 0,76P-Value 0,048
Mean 99,948StDev 1,528Variance 2,336Skewness 0,083005Kurtosis -0,598483N 300
Minimum 96,044
Anderson-Darling Normality Test
95% Confidence Interval for Mean
95% Confidence Interval for Median
95% Confidence Interval for StDev95% Confidence I nt erv als
Summary for Tiempos de reparación4°4°
5°5°
Histograma de los datosHistograma de los datos
Muestra los Intervalos de Confianza para Mediana y MediaMuestra los Intervalos de Confianza para Mediana y Media
Valores de promedio y desvío estándar para la serie de datos
Valores de promedio y desvío estándar para la serie de datos
Resultado en un Gráfico
Resultado en un Gráfico
41 de 44
Cálculo de promedio y desvío estándar 3
1°1°
2°2°
4°4°
5°5°3°3°
7°7°
6°6°
Permite calcular estadísticos.Permite calcular estadísticos.
Columna con los datosColumna con los datos
Permite elegir los estadísticos a calcularPermite elegir los estadísticos a calcular
Permite elegir los gráficos a hacer
Permite elegir los gráficos a hacer
42 de 44
Cálculo de promedio y desvío estándar 4
Results for: EJERCICIOS MEDIR.MTW
Summary for Tiempos de reparación
Descriptive Statistics: Tiempos de reparación
Total
Variable Count N N* Mean SE Mean StDev Sum Minimum
Tiempos de repar 300 300 0 99,948 0,0882 1,528 29984,343 96,044
Variable Q1 Median Q3 Maximum Range Skewness
Tiempos de repar 98,759 99,962 101,080 103,856 7,812 0,08
Resultado en la Hoja de Sesión
Resultado en la Hoja de Sesión
8°8°
43 de 44
Distribución 1
Para comprender mejor a la variación del indicador, usamos una serie de distribuciones para caracterizarla.
La más conocida es la Distribución Normal (Gauss). Pero, se necesita ubicar aquella que mejor represente a los datos que se tienen.
3σ3σ
99,73%
2σ2σ
95,44%
99,999997%
6σ6σ
σ
Tiempo de viaje
Can
tidad
ed
días
3σ3σ
99,73%
2σ2σ
95,44%
99,999997%
6σ6σ
σ
Tiempo de viaje
Can
tidad
ed
días
f z ez
( ) =−1
2
2
2
π
44 de 44
Distribución Normal 1
Es la distribución de probabilidad que más frecuentemente se encuentra en la naturaleza.
La media, mediana y modo, todos ocurren en el centro de la distribución con ambas mitades simétricas alrededor del centro.
El área bajo la curva es igual a 1 y una vez que la media y el desvío estándar son conocidos, la curva queda definida.