clase 1-2
DESCRIPTION
ESTADISTICA APLICADATRANSCRIPT
-
Curso: Estadstica
Tema 01: Conceptos Bsicos Estadstica
-
CONTENIDO
1. Introduccin 2. Procesamiento de muestras 2.1 Aleatoriedad 2.2 Poblacin y muestra 2.3 Representacin grfica de las muestras 3. Parmetros estadsticos 3.1 Media de la muestra 3.2 Mediana de la muestra 3.3 Moda 3.4 Varianza 3.5 Desviacin estndar 3.6 Percentil 3.7 Estadsticos de Asimetra 4. Muestreo Aleatorio
-
1. Introduccin
La estadstica es la disciplina interesada en la organizacin de datos obtenidos de
mediciones u observaciones hechas en campo, los que son procesados con el fin de determinar las propiedades que caracterizan a una muestra o poblacin, para luego poder realizar pronsticos, tomar decisiones y llevar a cabo acciones; as se puede tener como ejemplo: planificar el transito vehicular, ejecucin de acciones contra enfermedades peligrosas, etc.
2. Procesamiento de muestras
Con esto se busca determinar los parmetros que caracterizan los datos de una poblacin.
-
2.1 Aleatoriedad
2.2 Poblacin y muestra
Una expresin aleatoria es aquella en la que cada miembro de la poblacin tiene igual probabilidad de ser escogido.
En la tabla N01, se presenta un ejemplo de cmo se anotan los registros muestrales, donde se puede identificar que el tamao de la muestra es n=14; en este caso n es igual al tamao de la poblacin (N).
-
Tabla N 01 Eventos ocurridos en el ao 2002
N Tipo de eventos Frecuencia 1 Aluvin 1 2 Derrumbe 21 3 Deslizamiento 68 4 Granizada 6 5 Huayco 55 6 Incendio Urbano 125 7 Incendio forestal 16 8 Inundaciones 169 9 Lluvias intensas 135
10 Maretazo 3 11 Sismo 1 12 Vientos fuertes 37 13 Tormentas elctricas 3 14 Otros 39
Total 679
-
En la tabla anterior la columna que lleva de titulo frecuencia, hace referencia a la frecuencia absoluta, es decir el nmero de veces que ocurre un valor en una muestra o poblacin.
2.3 Representacin grfica de las muestras
Las posibilidades de representar grficamente a una muestra son muchas, pero solo unas pocas tendrn un significado entendible y legible con solo ver la grafica.
-
EVENTOS OCURRIDOS EN EL AO 2002
0
20
40
60
80
100
120
140
160
180
Alu
vi
n
De
rru
mb
e
De
sliz
amie
nto
Gra
niz
ada
Hu
ayco
Ince
nd
io
Urb
ano
Ince
nd
io
fore
stal
Inu
nd
acio
nes
Llu
vias
in
ten
sas
Mar
etaz
o
Sism
o
Vie
nto
s fu
erte
s
Torm
en
tas
elc
tric
as
Otr
os
TIPO DE EVENTO
FREC
UEN
CIA
AB
SOLU
TA
-
EVENTOS OCURRIDOS EL AO 2002
0
20
40
60
80
100
120
140
160
180
Alu
vi
n
Sism
o
Mar
etaz
o
Torm
en
tas
elc
tric
as
Gra
niz
ada
Ince
nd
io
fore
stal
De
rru
mb
e
Vie
nto
s fu
erte
s
Otr
os
Hu
ayco
De
sliz
amie
nto
Ince
nd
io
Urb
ano
Llu
vias
in
ten
sas
Inu
nd
acio
nes
TIPO DE EVENTO
FREC
UEN
CIA
AB
SOLU
TA
-
EVENTOS OCURRIDOS EL AO 2002
0% 0% 0% 0% 1% 2% 3% 5% 6% 8%
10%
18%
21%
26%
Aluvin
Sismo
Maretazo
Tormentas elctricas
Granizada
Incendio forestal
Derrumbe
Vientos fuertes
Otros
Huayco
Deslizamiento
Incendio Urbano
Lluvias intensas
Inundaciones
-
3.0 Parmetros estadsticos
Son aquellos que caracterizan las propiedades mas importantes de una muestra.
3.1 Media de la muestra
La media de una muestra, x1, x2,...,xn; se define como:
nn
j
j x...xxn
xn
x
21
1
11
Es decir la suma de todos los valores muestrales, divididos entre el tamao n de la muestra. Este valor indica el tamao promedio de los valores muestrales. Como ejemplo de aplicacin, podemos tomar los datos de la tabla N01 y hallar la media de los eventos ocurridos en el ao 2002
-
N Tipo de eventos Frecuencia 1 Aluvin 1 2 Derrumbe 21 3 Deslizamiento 68 4 Granizada 6 5 Huayco 55 6 Incendio Urbano 125 7 Incendio forestal 16 8 Inundaciones 169 9 Lluvias intensas 135
10 Maretazo 3 11 Sismo 1 12 Vientos fuertes 37 13 Tormentas elctricas 3 14 Otros 39
Total 679
Tabla N 01 Eventos ocurridos en el ao 2002
Valores muestrales: 14 (1, 21, 68, ..., 39) (mediciones u observaciones)
Tamao de la muestra: 14 (nmero de valores muestrales).
3921114
1 ...x
5.4814
679x
-
3.2 Mediana de la muestra
Cuando la muestra es demasiado grande, se hace difcil ubicar la mediana, es por eso que es necesario establecer una formula para facilitar la bsqueda de la mediana, as como de las observaciones centrales de la muestra.
Sea x1, x2,...,xn; una muestra de observaciones dispuestas en orden creciente. La mediana muestral es la observacin central si n es impar; caso contrario la mediana es el promedio de dos observaciones centrales.
La mediana muestral se denota como: x~
2
1mediana la den Localizaci
n
-
N Tipo de eventos Frecuencia
1 Aluvin 1
2 Sismo 1
3 Maretazo 3
4 Tormentas elctricas 3
5 Granizada 6
6 Incendio forestal 16
7 Derrumbe 21
8 Vientos fuertes 37
9 Otros 39
10 Huayco 55
11 Deslizamiento 68
12 Incendio Urbano 125
13 Lluvias intensas 135
14 Inundaciones 169
Tabla N02
Eventos ocurridos el ao 2002 (ordenados
crecientemente segn su frecuencia)
Como el nmero de valores muestrales es par, para determinar la mediana tenemos que encontrar la localizacin de la mediana.
5.72
114
2
1med L.
n
Entonces la mediana se obtiene de promediar los valores de la posicin 7 y 8 de los datos registrados
292
3721x~
-
3.3 Moda de la muestra Es el valor de los datos con mayor frecuencia. En la tabla 2 se observa que el valor de la moda es 169.
-
3.4 Varianza de la muestra
La varianza S2 de una muestra x1, x2,...,xn; se define como:
2212
1
2 ...1
1
1
1xxxx
nxx
nS n
n
j
j
Es la suma de los cuadrados de las desviaciones de los valores muestrales con respecto a su media, dividida entre n-1. Mide la dispersin de los valores muestrales.
As por ejemplo al procesar los datos presentados en la tabla N01, se obtiene que la varianza es:
S2 = 3,136.27
-
3.5 Desviacin estndar
Esta dada por la raz cuadrada positiva de la varianza de la muestra, y se denota por la letra S.
2SS
3.6 Percentil
Los percentiles son 99 valores que dividen a la distribucin en 100 partes iguales, conteniendo cada parte el 1% de los datos. Pk es el valor que deja el k% de los datos no superior a l.
-
Cuartiles Son un caso particular de los percentiles, hay 3: Q1 = P25 Q2 = P50 = mediana Q3 = P75
Ejemplo: Dada la siguiente distribucin en el nmero de hijos de 100 familias, calcular sus cuartiles.
xi ni Ni
0 14 14
1 10 24
2 15 39
3 26 65
4 20 85
5 15 100
-
Primer cuartil: n/4 = 25; primera Ni > 25 es Ni = 39 Q1 = 2
Segundo cuartil: n/2 = 50; primera Ni > 50 es Ni = 65 Q2 = 3
tercer cuartil: 3n/4 = 75; primera Ni > 75 es Ni = 85 Q3 = 4
-
4. Muestreo aleatorio
Es fundamental que la muestra seleccionada de una poblacin dada, represente adecuadamente a su poblacin, es decir que sus propiedades permitan obtener conclusiones acerca de la poblacin. Para lograr lo anterior se requiere que la muestra seleccionada sea aleatoria, es decir que cada elemento de la poblacin debe poseer una probabilidad conocida de ser considerada en la muestra.
-
Ejemplo
Se desea extraer e inspeccionar una muestra de 10 tornillos, de un lote de 80, cmo seleccionar fsicamente 10 tornillos de manera que todas las muestras de tamao 10 sean equiprobables?
Sol
Para solucionar este caso se procede de la siguiente manera:
1.- Los artculos del lote se enumeran del 1 al 80.
2.- Se elige aleatoriamente los 10 artculos usando una tabla de nmeros aleatorios.
Esto se logra eligiendo al azar una fila del 0 al 99 de la tabla de nmeros aleatorios, y una columna del 0 al 9 de la misma tabla. Para hacer esta seleccin se puede efectuar un experimento que consiste en lanzar una moneda, para el cual se procede de la siguiente manera:
-
Lanzar 7 veces una moneda y asignar el valor de 1 a las caras y 0 a los sellos, de esa forma se obtiene un nmero binario de siete dgitos, este nmero se usa si su valor es mayor de 0 y menor a 99. Al realizar un experimento se obtuvo el nmero binario 0011010 (=26).
Se repite el experimento anterior, pero esta vez para encontrar un nmero binario de cuatro dgitos; asimismo este nmero se acepta si esta entre 0 y 9. Al realizar este experimento se obtuvo el nmero binario 0111 (=7).
Habiendo encontrado los nmeros 26 y 7, se recurre a la tabla de nmeros aleatorios y dirigindonos a la fila 26 y columna 7 se obtiene el primer nmero aleatorio (1942), del cual solo se toman los dos primeros dgitos, en este caso 19; luego desplazndose hacia abajo en la misma columna se determinan los otros nmeros aleatorios, hasta completar los 10 nmeros que van a representar a la muestra pedida.
-
Tabla de nmeros aleatorios
3690 2492 7171 7720 6509 7549 2330 5733 4730
0813 6790 6858 1489 2669 3743 1901 4971 8280
6477 5289 4092 4223 6454 7632 7577 2816 9002
0772 2160 7236 0812 4195 5589 0830 8261 9232
5692 9870 3583 8997 1533 6466 8830 7271 3809
2080 3828 7880 0586 8482 7811 6807 3309 2729
1039 3382 7600 1077 4455 8806 1822 1669 7501
7227 0104 4141 1521 9104 5563 1392 8238 4882
8506 6348 4612 8252 1062 1757 0964 2983 2244
5086 0303 7423 3298 3979 2831 2257 1508 7642
0092 1629 0377 3590 2209 4839 6332 1490 3092
0935 5565 2315 8030 7651 5189 0075 9353 1921
2605 3973 8204 4143 2677 0034 8601 3340 8383
7277 9889 0390 5579 4620 5650 0210 2082 4664
5484 3900 3485 0741 9069 5920 4326 7704 6525
6905 7127 5933 1137 7583 6450 5658 7678 3444
8387 5323 3753 1859 6043 0294 5110 6340 9137
4094 4957 0163 9717 4118 4276 9465 8820 4127
4951 3781 5101 1815 7068 6379 7252 1086 8919
9047 0199 5068 7447 1664 9278 1708 3625 2864
7274 9512 0074 6677 8676 0222 3335 1976 1645
9192 4011 0255 5458 6942 8043 6201 1587 0972
0554 1690 6333 1931 9433 2661 8690 2313 6999
9231 5627 1815 7171 8036 1832 2031 6298 6073
3995 9677 7765 3194 3222 4191 2734 4469 8617
2402 6250 9362 7373 4757 1716 1942 0417 5921
5295 7385 5474 2123 7035 9983 5192 1840 6176
5177 1191 2106 3351 5057 0967 4538 1246 3374
7315 3365 7203 1231 0546 6612 1038 1425 2709
5775 7517 8974 3961 2183 5295 3096 8536 9442
5500 2276 6307 2346 1285 7000 5306 0414 3383
Tabla de nmeros aleatorios
3690 2492 7171 7720 6509 7549 2330 5733 4730
0813 6790 6858 1489 2669 3743 1901 4971 8280
6477 5289 4092 4223 6454 7632 7577 2816 9002
0772 2160 7236 0812 4195 5589 0830 8261 9232
5692 9870 3583 8997 1533 6466 8830 7271 3809
2080 3828 7880 0586 8482 7811 6807 3309 2729
1039 3382 7600 1077 4455 8806 1822 1669 7501
7227 0104 4141 1521 9104 5563 1392 8238 4882
8506 6348 4612 8252 1062 1757 0964 2983 2244
5086 0303 7423 3298 3979 2831 2257 1508 7642
0092 1629 0377 3590 2209 4839 6332 1490 3092
0935 5565 2315 8030 7651 5189 0075 9353 1921
2605 3973 8204 4143 2677 0034 8601 3340 8383
7277 9889 0390 5579 4620 5650 0210 2082 4664
5484 3900 3485 0741 9069 5920 4326 7704 6525
6905 7127 5933 1137 7583 6450 5658 7678 3444
8387 5323 3753 1859 6043 0294 5110 6340 9137
4094 4957 0163 9717 4118 4276 9465 8820 4127
4951 3781 5101 1815 7068 6379 7252 1086 8919
9047 0199 5068 7447 1664 9278 1708 3625 2864
7274 9512 0074 6677 8676 0222 3335 1976 1645
9192 4011 0255 5458 6942 8043 6201 1587 0972
0554 1690 6333 1931 9433 2661 8690 2313 6999
9231 5627 1815 7171 8036 1832 2031 6298 6073
3995 9677 7765 3194 3222 4191 2734 4469 8617
2402 6250 9362 7373 4757 1716 1942 0417 5921
5295 7385 5474 2123 7035 9983 5192 1840 6176
5177 1191 2106 3351 5057 0967 4538 1246 3374
7315 3365 7203 1231 0546 6612 1038 1425 2709
5775 7517 8974 3961 2183 5295 3096 8536 9442
5500 2276 6307 2346 1285 7000 5306 0414 3383
-
En la tabla de nmeros aleatorios los resultados pueden ser los siguientes :
19 44 83 91 55 55 53 03
De los cuales se omiten los nmeros mayores a 80 y tambin los nmeros que se repiten, finalmente los nmeros seleccionados fueron:
19 44 55 53 03 52 61 67 78 39
-
Generacin de nmeros aleatorios con mathematica:
Do[Print[RandomInteger[{1,100}]],{n,10}] 51 86 49 39 98 55 5 68 89 7
-
MINITAB 16
-
Planilla de Datos (Worksheet)
Los datos se pueden digitar directamente en Minitab o se pueden copiar desde otras aplicaciones y pegar en una worksheet o abrir archivos de diferentes aplicaciones tales como excel, dbase, origin, o archivos de texto .txt o .dat Abrir un archivo .MTW Pregunta2.MTW File > Open Worksheet > (buscar archivo Pregunta2.MTW en su carpeta de destino)
-
Manipulacin de Worksheets
Con comandos en el men Data se pueden obtener subplanillas, dividir planillas, unir planillas, copiar planillas Abrir el archivo Fsico Qumico.MTW
-
Subplanillas Las subplanillas se pueden obtener de acuerdo a un o algunos criterios establecidos por el usuario: Un primer ejemplo; obtener una planilla solamente con datos relacionados con la estacin B de la 1 columna Data > Subset Worksheet
-
Un segundo ejemplo; obtener una planilla con datos solamente de Estacin A y Temperatura >= 10 C Data > Subset Worksheet >
-
Se pueden obtener subplanillas basadas en: Expresiones matemticas Nmeros de fila Un rango de datos Puntos Marcados
-
Dividir una Planilla
Para dividir una planilla se recomienda que los criterios estn basados en datos cualitativos o codificados, puesto que se obtendrn tantas planillas como criterios tenga(n) la(s) columna(s) Ejemplo: Dividir la planilla Fsico Qumico segn la columna Estacin Data > Split Worksheet
-
Desapilar columnas
Algunos de los comandos de Minitab permiten que datos de grupos estn desapilados en columnas diferentes. Mientras comandos de Minitab necesitan que los datos estn apilados. Fsico Qumico.MTW Los datos estn apilados segn Estacin
-
Desapilar pH y Temperatura segn Estacin Data > Unstack Columns
Variables a Desapilar
Criterio(s) o variable(s) de apilacin
Desapila en la misma planilla
-
pH desapilado segn estacin
Temperatura desapilada segn estacin
-
ANALISIS EXPLORATORIO DE DATOS
-
El anlisis exploratorio de datos permite la bsqueda de patrones en los datos, es una herramienta de utilidad en la generacin de hiptesis, conjeturas y preguntas de investigacin acerca de los fenmenos de donde los datos fueron obtenidos. Anlisis Clsico Problema Datos Modelo Anlisis Conclusiones
-
Distribucin de una variable
En un conjunto de datos la frecuencia absoluta de un valor (o de un intervalo), es el nmero de veces en que la variable toma ese valor (o pertenece a ese intervalo). La frecuencia relativa es igual a la frecuencia absoluta dividida por el nmero de datos.
-
Medidas de Frecuencia
Una forma de resumir datos es a travs de la Distribucin de Frecuencias. Esta Distribucin puede ser vista mediante Tablas y/o Grficos. En una Tabla se muestran los valores tabulados (o frecuencias) segn sus categoras. En herramientas grficas se suelen presentar estas categoras mediante segmentos de reas en diferentes formas.
Tabla
Grfico
Eritrocitosis.MTW
-
Medidas de Frecuencia
Los datos pueden ser recopilados de muchas formas y tamaos. Una de las formas ms comunes es una base de datos rectangular hechas de filas y columnas. Cada fila contiene informacin de un ente o individuo y comnmente es denominado de registro u observacin. Cada columna contiene informacin acerca de una caracterstica tal como sexo, fecha de nacimiento, etc. y es comnmente denominado de variables.
Registros
Variables
Eritrocitosis.MTW
-
Ratios, Proporciones y Tasas
Muchas de las variables que se trabajan son del tipo Nominal binarias. Por ejemplo, Vivo Muerto, Expuesto No Expuesto, etc. Debido a esto, es conveniente trabajar con Mtricas adecuadas para realizar comparaciones entre diferentes grupos de individuos diferentes individuos en un mismo grupo. Algunas de estas mtricas son los Ratios, Proporciones y Tasas.
x e y son las cantidades que sern comparadas
La constante 10n se utilizar para transformar el resultado de la divisin en una cantidad uniforme. 10n puede ser 1, 10, 100, 1000, etc. dependiendo del valor entero positivo n
, , =
10
-
Propiedades de una distribucin
Posicin: En torno a qu valor central toma valores la variable Dispersin: el grado de concentracin de los valores que toma la
variable alrededor de su posicin central Forma: distribucin simtrica o asimtrica, es decir si los valores
se reparten del mismo modo a uno y otro lado del centro
-
Medidas de Frecuencia
Es posible construir tablas sencillas para presentar la frecuencia de los valores de una variable especfica. Sin embargo, si estos valores de la variable especfica se incrementan en nmero de posibilidades, lo mejor es generar intervalos de clase para agrupar estos valores.
Variable
-
Valores de Variable Cuantitativa X
-
Intervalo de Clase que contiene a los Valores de Variable X
-
Tabulacin de Datos Cualitativos o Categorizados Stat>Tables
Tabulacin Unidimensional
Trab_Altura.MTW
Medidas de Frecuencia (Datos Cualitativos)
-
Estado Nutricional ndice de Masa Corporal categorizado
Medidas de Frecuencia (Datos Cualitativos)
-
Tabulacin de Datos Cualitativos o Categorizados Stat>Tables
Tabulacin Bidimensional (Tabulacin Cruzada)
Trab_Altura.MTW
Medidas de Frecuencia (Datos Cualitativos)
-
Estado Nutricional vs. Tabaquismo
Medidas de Frecuencia (Datos Cualitativos)
-
Diagrama de Barras Se utilizan cuando en los datos se tienen varias categoras o clases de datos nominales u ordinales Graph>Bar Chart
Trab_Altura.MTW
Medidas de Frecuencia (Datos Cualitativos)
-
Diagrama de Barras
Medidas de Frecuencia (Datos Cualitativos)
-
Diagrama de Barras
Si se mantiene activa la ventana del grfico, al teclear el botn derecho del mouse se puede tener acceso a modificaciones al grfico
Medidas de Frecuencia (Datos Cualitativos)
-
Grfico Circular Graph>Pie Chart
Trab_Altura.MTW
Medidas de Frecuencia (Datos Cualitativos)
-
Grfico Circular Graph>Pie Chart
Trab_Altura.MTW
Medidas de Frecuencia (Datos Cualitativos)
-
Diagrama de Barras Agrupadas Graph>Bar Chart
Trab_Altura.MTW
Medidas de Frecuencia (Datos Cualitativos)
-
Diagrama de Barras Agrupadas
Medidas de Frecuencia (Datos Cualitativos)
-
DIAGRAMA DE PARETO
Diagrama de barras simple, ordenada segn frecuencias descendentes. Basado en el principio de Pareto:
20% de las fuentes causan el 80% de cualquier problema
Indica la importancia relativa de los problemas en un formato rpido y fcil de interpretar.
til para concentrarse en los problemas que ofrecen mayor impacto si se solucionan
-
Stat>Quality Tools>Pareto Charts
Accidentes.MTW
-
Medidas de Frecuencia (Datos Cuantitativos)
Histograma Se utiliza para obtener una estimacin rpida de la forma y de la variacin de los datos.
Se divide el rango de variacin de los datos en un nmero adecuado de intervalos
Sobre cada intervalo se dibuja un rectngulo con rea proporcional a la frecuencia de datos en el intervalo
-
Elementos para interpretar un Histograma:
Identificar si se han utilizado frecuencias absolutas o relativas Cuntas modas hay? Existe algn dato atpico? En caso de asimetra simetra positiva o negativa? En torno a qu valor aproximado estn centrados los datos?
-
Medidas de Frecuencia (Datos Cuantitativos)
Histograma Graph>Histogram
Accidentes.MTW
-
Graph>Histogram
Accidentes.MTW
-
Medidas de Frecuencia (Datos Cuantitativos)
Diagrama de Puntos Si el conjunto de datos es pequeo, el Histograma podra no entregar una buena idea de la forma de la Distribucin
Conjunto de datos pequeo o moderado Se divide el rango de variacin de los datos en un nmero adecuado
de intervalos Cada dato se representa con un punto sobre la correspondiente
marca de clase o localizacin del intervalo
-
Trab_Altura.MTW
Ejemplo: Se desea averiguar la distribucin de colesterol total segn el hbito de fumar de los trabajadores. Graph>Dotplot
-
Diagrama de Puntos
Trab_Altura.MTW
-
Diagrama de Puntos
Trab_Altura.MTW
Diagrama de puntos de colesterol total segn tabaquismo
-
3.7 Estadsticos de asimetra Se define el momento central de orden p como:
=1
1
Se define el coeficiente de curtosis como:
2 =44 3
-
Y el Coeficiente de Asimetra de Fischer como:
1 =33
-
Diagrama de Cajas (Box Plot)
Los Boxplot permiten compara grficamente conjunto de datos o particionar una poblacin de datos en sub poblaciones Graph>Boxplot
-
Velocidad.MTW
-
Velocidad.MTW
-
Velocidad.MTW
-
Velocidad.MTW
-
Tema 02: Distribucin y Probabilidades
1 Probabilidad El clculo de probabilidades constituye la base de la estadstica inferencial.
1.1 Experimento
Proceso por medio del cual se obtiene una medicin o una observacin, por ejemplo:
(1)Lanzar un dado y observar el resultado.
(2)Efectuar una medicin de la cantidad de vehculos que pasan por una avenida en un lapso de tiempo.
(3)Elegir aleatoriamente a una persona y preguntarle su gasto diario en movilidad
-
1.2 Ensayo
Es la ejecucin de un experimento.
1.3 Resultado o punto muestral
Es el valor que arroja el experimento.
1.4 Espacio muestral S
Es el conjunto de todos los resultados posibles obtenidos al realizar un experimento.
1) S = {1,2,3,4,5,6}.
2) S : Son los #s no negativos en algn intervalo 0 x K.
3) S = {G, N, I}; G: le gusta, N: no le gusta y I: Est indeciso.
-
1.5 Eventos Se les llama as a los subconjuntos de S. Por ejemplo en (1) los eventos son:
A = {1, 3, 5}, Nmeros impares
B = {2, 4, 6}, Nmeros pares
1.6 Probabilidad
Si el espacio muestral S de un experimento consta de un nmero finito de resultados equiprobables, entonces la probabilidad P(A) de un evento es:
Sen puntos de #
Aen puntos de #AP
-
Ejemplo de Probabilidad
Al lanzar un dado, Cual es la probabilidad P(A) de:
a) Obtener por lo menos un cinco, y.
b) De obtener un nmero par.
En el lanzamiento de un dado, las probabilidades de sus resultados son todas iguales a 1/6, es por eso que se les llama equiprobables. Entonces las probabilidades solicitadas se pueden expresar como:
puntos tres tiene;6 4 ,2B porque ,6
3yBP
-
1.7 Variable aleatoria
Es aquella que asociada a un experimento cuyo valor es un nmero real depende del azar. Cuando un evento A que se desprende de un espacio muestral S, puede o no ocurrir.
Por ejemplo, al aforar en una seccin determinada del ro, se encuentra que el volumen mensual de escurrimiento es a veces mayor de 300,000 m3, pero a veces es menor.
-
2.0 Funciones de Probabilidad
2.1 Funciones discretas de probabilidad
Cuando el nmero de valores x que puede tomar una variable aleatoria X es finito, X se llama variable aleatoria discreta.
Por ejemplo, al lanzar dos dados, la variable aleatoria X (experimento de lanzar los dados) puede generar valores finitos.
X = D1+D2
D1 y D2, son los puntos obtenidos por los dados; (ver en la tabla siguiente)
-
Tabla N 01
1+1=2 2+1=3 3+1=4 4+1=5 5+1=6 6+1=7
1+2=3 2+2=4 3+2=5 4+2=6 5+2=7 6+2=8
1+3=4 2+3=5 3+3=6 4+3=7 5+3=8 6+3=9
1+4=5 2+4=6 3+4=7 4+4=8 5+4=9 6+4=10
1+5=6 2+5=7 3+5=8 4+5=9 5+5=10 6+5=11
1+6=7 2+6=8 3+6=9 4+6=10 5+6=11 6+6=12
En este caso el nmero total de resultados posibles del experimento es 36 y el nmero n de valores que puede tomar la variable aleatoria X es 11 (x = 2, 3, 4,..., 12).
As mismo la probabilidad asociada a cada uno de estos n posibles valores de X se puede ver en la tabla N02 y en forma grfica en la figura N01.
-
Tabla N 02
2 1 1/36
3 2 2/36
4 3 3/36
5 4 4/36
6 5 5/36
7 6 6/36
8 5 5/36
9 4 4/36
10 3 3/36
11 2 2/36
12 1 1/36
x = valor de XNmero de resultados
favorablesProbabilidad
-
FUNCIN MASA DE PROBABILIDAD DISCRETA
1/36
2/36
3/36
4/36
5/36
6/36
5/36
4/36
3/36
2/36
1/36
0
3/36
6/36
2 3 4 5 6 7 8 9 10 11 12
VALORES DE X
PR
OB
AB
ILID
AD
-
FUNCIN DE DISTRIBUCIN DE PROBABILIDAD ACUMULADA
(Se suma el valor anterior)
0 /36
6 /36
12 /36
18 /36
24 /36
30 /36
36 /36
2 3 4 5 6 7 8 9 10 11 12
VALORES DE X
PR
OB
AB
ILID
AD
AC
UM
ULA
DA
-
2.2 Funciones continuas de probabilidad
Cuando el nmero n de valores que puede tomar una variable aleatoria X es infinito, se le llama variable aleatoria continua; por ejemplo: el volumen de escurrimiento de un ro.
Del ejemplo, de lanzar dos dados, imaginando que estos tienen infinitas caras, la funcin de probabilidad discreta del caso anterior se convierte ahora en una funcin de densidad de probabilidad.
-
FUNCIN DE DENSIDAD DE PROBABILIDAD (Ahora es variable continua)
0
6/36
2 3 4 5 6 7 8 9 10 11 12
VALORES DE X
PR
OB
AB
ILID
AD
-
FUNCIN DE DISTRIBUCIN DE PROBABILIDAD CONTINUA
(Sumndose los valores anteriores)
0 /36
6 /36
12 /36
18 /36
24 /36
30 /36
36 /36
2 3 4 5 6 7 8 9 10 11 12
VALORES DE X
PR
OB
AB
ILID
AD
AC
UM
ULA
DA
-
Cuando una variable aleatoria es continua, la probabilidad de que esta tome un valor exacto es siempre nula.
0 xXP
Y solo es posible hablar de probabilidades diferentes de cero para intervalos finitos.
0 bXaP
Entonces la funcin de distribucin continua de probabilidad se escribe:
dxx
xfxF
-
Ejemplo:
Determinar el valor de la constante a de la funcin de densidad de probabilidad:
parte otracualquier en 0
50 2 xaxxf
cul es la probabilidad de que un valor X seleccionado aleatoriamente de esta funcin: a) sea menor que 2? b) est entre 1 y 3? c) sea mayor que 4? d) sea mayor que 6? e) sea igual a 2.5?
Solucin
Segn los axiomas de probabilidad se sabe:
15
5
0
0
dxxfdxxfdxxfdxxfxF
-
Sustituyendo los valores de f(x) en la funcin anterior, se tiene:
13
125
300
5
0
3
5
5
0
20
aaxdxdxaxdx
De donde se obtiene:
125
3a
La funcin de densidad de probabilidad se escribe:
125
3 2xxf
Y la funcin de distribucin de probabilidad resulta:
125
3xxF
-
Funcin de distribucin de probabilidad 125
3xxF
Entonces:
a) sea menor que 2? 125
822 XPF
b) est entre 1 y 3? 125
26
125
1
125
271331 FFXP
c) sea mayor que 4? 125
61
125
64141414 FXPXP
-
Experimento aleatorio: es aquel que bajo el mismo conjunto aparente de condiciones iniciales, puede presentar resultados diferentes, es decir, no se puede predecir el resultado exacto de cada experiencia particular. Evento simple E: es un resultado bsico de un experimento aleatorio que no puede descomponerse en resultados ms simples. Espacio muestral : Coleccin de todos los eventos simples de un experimento aleatorio. La probabilidad de un evento simple E, P(E), es un nmero que mide la verosimilitud de que el evento ocurra cuando se realice el experimento.
-
PROBABILIDAD Cuando un experimento es ejecutado, se obtiene una de las varias posibilidades de resultados. Debido al azar posiblemente no seamos capaces de predecir de antemano un resultado particular, sin embargo, emitimos una opinin de las chances de ocurrencias de dichos resultados. Se han propuesto algunas formas de calcular probabilidades 1.- Mtodo clsico 2.- Mtodo estadstico
-
1. Mtodo Clsico Este mtodo es aplicable nicamente para el caso en que el experimento contenga un nmero finito de resultados: W1, , WN. Se asume que todos los resultados son equiprobables.
Ejemplo: Suponga que un dado es lanzado al aire, dado que existen 6 posibilidades igualmente probables, se tiene que: = {w1, w2, , w6} P(wi) = 1/6 Si A es un evento tal que un nmero par ocurra, entonces P(A) = P(w2, w4, w6) = 3/6
-
2. Mtodo Estadstico Suponga que A es un conjunto de resultados de un experimento. Suponga tambin que es posible repetir el experimento un nmero grande de veces. Si se denota por nA el nmero de ocurrencias de A en n repeticiones, entonces nA es llamada la frecuencia de A y fA = nA/n la frecuencia relativa de A.
Se define =
Ejemplo: Suponga que C denota la ocurrencia de una cara en un nico lanzamiento de una moneda; si en un nmero grande de lanzamientos el 50% ocurrieron caras, entonces P(cara) = ; si el 40% result en caras entonces P(cara) = 2/5 y as sucesivamente.
-
Mtodo Estadstico Calc>Random Data>Uniform
-
Mtodo Estadstico
Calc>Random Data>Uniform
-
Mtodo Estadstico
Calc>Calculator
-
Mtodo Estadstico
Calc>Calculator
-
Mtodo Estadstico
Graph>Scatterplot
-
Mtodo Estadstico
-
AC : suceso contrario a A : Suceso imposible : Suceso seguro A y B sucesos incompatibles si A B =
-
Definicin de Probabilidad
Propiedades de probabilidades
-
Ejemplo:
-
Probabilidad Condicional
-
Ejemplo En un lote de estacionamiento hay 10 automviles estacionados, 3 rojos 4 verdes y 3 azules. Dos de Ellos salen del estacionamiento. Cul es la probabilidad de que: a) Exactamente uno de ellos sea rojo? b) Dos de ellos sean rojos? c) Por lo menos uno de ellos sea rojo? d) El segundo sea rojo?
-
Ejemplo En un lote de estacionamiento hay 10 automviles estacionados, 3 rojos 4 verdes y 3 azules. Dos de Ellos salen del estacionamiento. Cul es la probabilidad de que: a. Exactamente uno de ellos sea rojo?
-
b. Dos de ellos sean rojos? c.- Por lo menos uno de ellos sea rojo? d.-El segundo sea rojo?
-
DISTRIBUCIONES PROBABILSTICAS
-
Una variable aleatoria (v.a.) es una funcin definida sobre el espacio muestral con valores numricos. Una distribucin de probabilidad es un modelo matemtico que relaciona el valor de la v. a. con la probabilidad de ocurrencia de este valor en la poblacin. Si la v.a. solamente puede tomar ciertos valores, como los nmeros enteros 0,1,2,3,, la distribucin de probabilidad es una distribucin discreta. Cuando la v. a. que se mide se expresa en una escala continua, su distribucin de probabilidad es una distribucin continua.
-
Si se tiene una muestra aleatoria simple, es posible encontrar una distribucin a partir de la muestra que proporcionar un cierto parecido a la distribucin verdadera de la variable asociada con la poblacin. Es lo que se denomina funcin de distribucin emprica de la muestra. Cmo se define? Pues como una funcin real de variable real donde, a cada valor, se le asigna la frecuencia relativa acumulada muestral.
Funcin de Distribucin Emprica
-
Funcin de Distribucin Emprica
-
Funcin de Distribucin Emprica Graph>Empirical CDF
Velocidad.MTW
-
Funcin de Distribucin Emprica
Velocidad.MTW
-
Ejercicio : Se pide calcular los valores de los percentiles 20 y 40 mediante la funcin de distribucin emprica, de la siguiente serie de valores: 102.2 96.3 377.7 119.9 221.1 32 153.8 199 261.9 58.7 160 209.8 270 60.4 171.9 142 138.3 83.5 172.1 148.5 13.5 289.4 183.6 269.4 18.1 299.9 197.9 118 110.5 300.7
-
El percentil 20 se obtiene por interpolacin sabiendo que ser un volumen de precipitacin entre el valor que est en la posicin sexta (19,35 %) y el valor que est en la posicin sptima (22,58 %) P19.35 83.5 P20 86.07 P22,58 96.3 El percentil 40 se obtiene por interpolacin sabiendo que ser un volumen de precipitacin entre el valor que est en la posicin duodcima (38,71 %) y el valor que est en la posicin dcimotercera (41,94 %) P38.71 138.3 P40 139.78 P41.94 142
Solucin. Se deben ordenar los datos en orden creciente, y asignar a cada valor su probabilidad emprica en funcin del orden de situacin del valor y del nmero de datos. As para los dos primeros valores tendremos: 1 (primero) 13.5 Prob (X 13.5) = i/(N +1) = 1/(30+1) = 0.03226 (3.226 %) 2 (segundo) 18.1 Prob (X 18.1) = i/(N +1) = 2/(30+1) = 0.06452 (6.452 %)
-
Distribuciones de Probabilidad
Discretas
Continuas
Uniforme discreta Binomial Poisson
Normal Lognormal Exponencial Chi-cuadrado, etc
-
Distribuciones muestrales Consideremos todas las posibles muestras de tamao n en una poblacin dada (con o sin reposicin). Para cada muestra, podemos calcular un estadstico (tal como la media o la desviacin estndar o tpica), dicho estadstico vara de una muestra a otra. De esta manera obtenemos una distribucin de la estadstica que se llama distribucin de muestreo. Si denotamos la media y la desviacin tpica de la distribucin de muestreo de medias por y las de la poblacin por y , respectivamente, entonces:
=
=
1
-
Donde: = la media de la distribucin de muestreo de las medias. = la media de la poblacin. = error estndar de la media de muestreo. = desviacin tpica de la poblacin. N = tamao de la poblacin. n = tamao de la muestra.
Ejemplo: Supongamos que estamos interesados en una poblacin de 20 compaas del mismo tamao, todas estas compaas experimentan una produccin excesiva de trabajo. Nuestro estudio indica que la desviacin estndar de la distribucin de la produccin anual es igual a 75. Si muestreamos 5 de estas compaas (sin reemplazo), y calculamos el error estndar de la media para la poblacin finita:
=75
5 20 5
20 1= 29.8
-
la fraccin n/N se define como la fraccin de muestreo. Cuando la fraccin de muestreo es pequea, el error estndar de la media para poblaciones finitas es cercano a la media para poblaciones infinitas
Para valores grandes de n (n30), la distribucin de muestreo de medias es aproximadamente normal con media y desviacin tpica independientemente de la poblacin. Este resultado para una poblacin infinita es un caso especial del teorema del lmite central , en estas ocasiones se dice que la distribucin de muestreo es asintticamente normal.
-
El teorema central del lmite es uno de los resultados fundamentales de la estadstica. Este teorema nos dice que si una muestra es lo bastante grande (generalmente cuando el tamao muestral (n) supera los 30), sea cual sea la distribucin de la media muestral, seguir aproximadamente una distribucin normal. Es decir, dada cualquier variable aleatoria, si extraemos muestras de tamao n (n>30) y calculamos los promedios muestrales, dichos promedios seguirn una distribucin normal. Adems, la media ser la misma que la de la variable de inters, y la desviacin estndar de la media muestral ser aproximadamente el error estndar.
Teorema de Limite Central
-
Distribucin de muestreo de proporciones Supongamos que una poblacin es infinita y que la probabilidad de ocurrencia de un suceso (su xito) es p, mientras la probabilidad de que no ocurra es q = 1 - p. Consideremos todas las posibles muestras de tamao n de tal poblacin, y para cada una de ellas determinemos la proporcin de xitos (P). Obtenemos as una distribucin de muestreo de proporciones cuya media p y su desviacin tpica p vienen dadas por:
=
=
-
donde: = media de muestreo de proporciones. P = media de la poblacin de proporciones. p = probabilidad de xito. q = probabilidad de fracaso. Para muestras grandes (n30), la distribucin de muestreo est, muy aproximadamente, normalmente distribuida. Ntese que la poblacin est binomialmente distribuida. La ecuacin es vlida tambin para una poblacin finita en la que se hace muestreo con reposicin.
-
Para poblaciones finitas en que se haga muestreo sin reposicin, la ecuacin queda sustituida por :
= =
La distribucin binomial
Una distribucin de probabilidad de una variable aleatoria discreta utilizada ampliamente es la distribucin binomial. Esta distribucin es apropiada para una variedad de procesos que describe datos discretos, que son resultado de un experimento el cual nos llevar a uno de slo dos resultados posibles que son mutuamente exclusivos, tales como muerto o vivo, enfermo o saludable, etc., en donde la obtencin del resultado deseado se considera como xito "p" y el resultado no deseado como fracaso "q", donde, q = 1 p
-
Proceso de Bernoulli Podemos describir el proceso de la manera siguiente: 1. Cada ensayo conduce a uno de dos resultados posibles, mutuamente exclusivos, uno denominado xito y el otro fracaso. 2. La probabilidad del resultado de cualquier intento permanece fijo con respecto al tiempo. 3. Los ensayos son estadsticamente independientes Si p y 1-p son las probabilidades de xito y fracaso respectivamente en cada ensayo, entonces, la probabilidad de obtener x xitos y n-x fracasos en algn
orden especfico se da por la siguiente ecuacin: px(1-p)n-x
entonces el nmero de formas en que podemos obtener x xitos en n ensayos es el nmero de combinaciones de x objetos seleccionados de un conjunto de n objetos (n/x) as llegamos al siguiente resultado:
-
= ; = 0,1,2,3,
Donde, n = nmero de ensayos realizados. p = probabilidad de xito. q = (1-p) = probabilidad de fracaso. n - x = nmero de fracasos. px = probabilidad favorable.
-
Un Proceso de Bernoulli no es otra cosa que la repeticin de un ensayo de Bernoulli. Si nos fijamos en el ejemplo de la moneda, en este caso estaremos estudiando cuntas veces sale "cara" o cuntas sale "cruz", o las probabilidades de que salga "cara", al menos una vez, de un nmero n de intentos.
-
Propiedades de la distribucin binomial a) la media: = np b) la varianza: 2 = npq
c) el coeficiente de sesgo: 3 =
d) desviacin tpica: = e) cuando p es menor que 0.5, la distribucin binomial est sesgada hacia la derecha. f) conforme p aumenta, el sesgo es menos notable. g) cuando p = 0.5, la distribucin binomial es simtrica. h) cuando p es mayor que 0.5, la distribucin esta sesgada hacia la izquierda.
-
Distribucin de probabilidad hipergeomtrica Si se selecciona una muestra aleatoria de n consumidores de una poblacin de N consumidores, el nmero x de usuarios que favorecen un producto especfico tendra una distribucin binomial. Cuando el tamao muestral n es pequeo respecto al nmero N de consumidores en la poblacin, el nmero x a favor del producto tiene una distribucin de probabilidad hipergeomtrica, cuya frmula es:
=
-
Donde: N = nmero de elementos en la poblacin. r = nmero de elementos que tienen una caracterstica especifica, por ejemplo el nmero de personas a favor un producto particular. n = nmero de elementos en el muestra.
En el caso de la distribucin Hipergeomtrica, a diferencia de la distribucin Binomial, los elementos se extraen simultneamente, o si es uno a uno, sin devolverlos antes de realizar la siguiente extraccin, de forma que un elemento no puede aparecer dos veces en una muestra. A esta manera de obtener la muestra se le llama muestreo sin reemplazo.
-
Medidas de tendencia central y de dispersin para la distribucin hipergeomtrica La distribucin hipergeomtrica al igual que otras distribuciones de probabilidades tiene un valor esperado o media () y una desviacin estndar (). Simblicamente, podemos representar la media de una distribucin hipergeomtrica como:
La media aritmtica: =
En la que: n = nmero de muestras. r = nmero de elementos de la muestra con ciertas caractersticas. N = tamao de la poblacin.
-
Podemos calcular la desviacin estndar como:
= ()
2(1)
Ejemplo: Una tienda de artculos elctricos tiene 20 planchas, de las cuales 5 son amarillas. Si se extraen aleatoriamente y sin sustitucin 10 planchas Cul es la probabilidad de que dos de ellas sean amarillas?
Solucin: En este caso se tiene una poblacin de 20 planchas (N = 20), de las cuales 5 son amarillas (r = 5) y se extrae una muestra de 10 planchas (n = 10). La variable aleatoria ser el nmero de planchas amarillas que hay en la muestra (entre las extradas), por lo que x = 2. Sustituyendo en el modelo de la distribucin Hipergeomtrica tenemos:
=522051022010
= 0,3483
-
La distribucin de probabilidad geomtrica En un experimento binomial se tiene una serie de eventos idnticos e independientes, y que cada uno origina un xito o un fracaso F, con p(E) = p y p(F) = 1- p = q. Si estamos interesados por el nmero x de pruebas hasta la observacin del primer xito, entonces x posee una distribucin de probabilidad geomtrica. Ntese que el nmero de pruebas podra seguir indefinidamente y que x es un ejemplo de variable aleatoria discreta que puede tomar un nmero infinito (pero contable) de valores. Las frmulas para la distribucin geomtrica son:
= 1
Donde, x = nmero de pruebas independientes hasta la ocurrencia del primer xito. p = probabilidad de xito en una sola prueba, q = 1 p.
-
Media =1
Desviacin estndar =1
2
La distribucin de probabilidad geomtrica es un modelo para el intervalo de tiempo que un jugador (o inversionista) tiene que esperar hasta ganar. La distribucin de probabilidad geomtrica tambin proporciona un modelo discreto para el lapso, digamos el nmero x de minutos, antes de que un consumidor en una fila o lnea de espera (en un supermercado, servicio de reparaciones, hospital, etc.) reciba la atencin. Este modelo discreto para la distribucin de probabilidad de tiempo de espera x se basa en la suposicin de que la probabilidad de recibir el servicio durante cualquier minuto es idntica e independiente del resultado durante cualquier otro minuto y que x se mide en minutos enteros.
-
Ejemplo: Se lanza un dado hasta que aparece el nmero 6. Cul es la probabilidad de que el nmero de lanzamientos sean 3?
Solucin: En este problema el xito es la aparicin del nmero 6 y la probabilidad de que salga el nmero 6 al lanzar un dado es 1/6, por lo que p = 1/6 y q = 5/6. Como nos interesa calcular la probabilidad de que el 6 aparezca en el tercer lanzamiento, entonces:
= 3 =1
6
5
6
2
= 0,1157
-
Distribuciones de Probabilidad
Uniforme, discreta, de parmetro N X ~ UD(N)
P(Xj) = 1/N j=1,2,,N
Se utiliza en muestreo de poblaciones de N elementos, con muestras de tamao n n
-
Distribuciones de Probabilidad
En una planilla de MINITAB se genera una columna con los primeros 30 nmeros naturales Calc>Random Data>Sample From Columns
Muestra al azar
-
Distribuciones de Probabilidad
Binomial de parmetros n y p X ~ Bin(n,p)
Se repite n veces un experimento en forma independiente, X es el nmero de veces que ocurre un evento que tiene probabilidad p de ocurrencia en los n ensayos.
-
Distribuciones de Probabilidad
Ejemplo En una interseccin Y, el 10% de los vehculos que transitan giran a la derecha. Si 20 vehculos se aproximan a la interseccin, hallar la probabilidad de que como mximo 3 vehculos giren a la derecha
-
Distribuciones de Probabilidad
Distribucin de Poisson de parmetro X ~ P0 ()
parmetro de intensidad media
El nmero de eventos se obtiene dentro de un intervalo continuo de tiempo, rea o espacio. El nmero de eventos en cualquier intervalo dado es independiente del nmero en cualquier otro intervalo no traslapado de la misma longitud La probabilidad de observar un cierto nmero de eventos es igual en todos los intervalos de la misma longitud
-
Distribuciones de Probabilidad
Ejemplo El nmero de accidentes por mes que ocurren en una determinada interseccin de una avenida especfica, es caracterizado por una distribucin de Poisson con tasa 1.62 accidentes por mes.
-
La distribucin de probabilidad normal El teorema del lmite central enuncia que las distribuciones muestrales de ciertas clases de estadsticos se aproximarn a la normalidad, a medida que el tamao de la muestra (n) se incrementa independientemente de la forma de la poblacin muestreada. Propiedades: 1. El rea comprendida por la curva es igual a 1, sin importar los valores de y 2. Se extiende para todos los valores de x entre - y 3. A causa de la simetra de la distribucin, la media, la moda y la mediana se encuentran en el centro.
-
Distribuciones de Probabilidad
Distribucin Normal X~ N(, 2)
Variable aleatoria X con valores en el intervalo (-, ) y con funcin de densidad
Los parmetros y 2 son la media y la varianza respectivas de la distribucin
-
Distribucin Normal N(, 2)
- +
-
Distribucin Normal N(, 2)
Simtrica alrededor de la media Asimetra estandarizada (sesgo): cero Curtosis :cero Media, moda, mediana iguales
- 2 + 2
-
Distribucin Normal N(, 2)
+ 3 - 3
-
P(X t)
X ~ N(1200, 802)
Distribucin Normal N(, 2)
-
Distribuciones de Probabilidad
Ejemplo [Cont. Ejemplo] En un estudio de velocidad, se registraron velocidades de punto de 200 vehculos en km/h, los vehculos fueron escogidos al azar. Si se asume que estas velocidades son caracterizados por una distribucin Normal con media 34 km/h y desvo padrn de 4 km/h
a. Determinar la probabilidad de que la velocidad sea mayor que
40 km/h b. Obtener la velocidad para la cual el 68% de las velocidades
registradas no supera dicha cantidad Velocidad.MTW
-
Distribuciones de Probabilidad
Calc>Probability Distributions>Normal
-
Distribuciones de Probabilidad
Calc>Probability Distributions>Normal
-
Distribuciones de Probabilidad
Grficos de probabilidad (Probability plot) P- P
Comparan una funcin de distribucin emprica acumulativa con una funcin de distribucin acumulativa terica de una variable. til para evaluar si un conjunto de datos sigue una distribucin especifica. Se grafican los percentiles de los datos versus los percentiles de una distribucin terica, de tal manera que los puntos debieran ajustarse aproximadamente a una lnea recta. Alejamiento de esta recta seala discrepancia con la distribucin terica.
-
Distribuciones de Probabilidad
P83,3851 datos = 6,03023 P83,3851 terico = 5,72818
Distribucin terica N(4,825; 0,9316)
-
Grficos de Probabilidad Normal
Cmo saber si la distribucin de un conjunto de datos es normal o aproximadamente normal? Los grficos de probabilidad normal usan la distribucin de porcentaje acumulativo de os datos para dar una muestra visual de la forma probable de la distribucin de los datos.
-
Grficos de Probabilidad Normal
-
Distribuciones de Probabilidad
Comparacin de la distribucin de la muestra con una distribucin normal Conjunto de n datos asociados a una medicin: X1, X2, ,Xn Se prueba la hiptesis H0 : La muestra sigue una distribucin normal Contra la hiptesis alternativa HA: La muestra no sigue una distribucin normal Anderson y Darling proponen un mtodo para probar la hiptesis H0
-
Distribuciones de Probabilidad
A valores ms pequeos del estadstico de Anderson Darling mejor es el ajuste a la distribucin normal. Una medida cuantitativa para la calidad del ajuste de los datos a la distribucin normal la proporciona un valor probabilstico p (p-valor). Si p-valor es menor que 0,05 se rechaza la hiptesis nula. El mtodo de Anderson Darling tambin se utiliza para verificar otras distribuciones de probabilidades continuas.
-
Distribuciones de Probabilidad
Tests de Normalidad
Un test de Normalidad es un mtodo estadstico para determinar si la distribucin de una muestra tiene las caractersticas de una distribucin Normal. Cuatro formas de verificar en Minitab: Graph > Probability Plot Stat > Basic Statistics > Normality Test Stat > Basic Statistics > Graphical Summary Stat > Quality Tools > Individual Distribution dentification
-
Distribuciones de Probabilidad
Velocidad.MTW
Stat > Basic Statistics > Normality Test
-
Distribuciones de Probabilidad
-
Distribucin Lognormal
La variable aleatoria X tiene una distribucin lognormal si la variable Y = ln X tiene una distribucin normal y : parmetro de forma (media de Y = Ln X) y : parmetro de localizacin (desviacin estndar de Y = Ln X)
-
Se utiliza cuando la distribucin de X tiene sesgo positivo. Esta distribucin sesgada puede generalmente estar bien representada por la distribucin lognormal de dos parmetros o de tres parmetros. Si X es una v. a. tal que Ln(X) tiene distribucin normal, entonces X tiene distribucin lognormal de dos parmetros. Si X es una v. a. tal que Ln(X+) tiene una distribucin normal, donde es constante, entonces X tiene distribucin lognormal de tres parmetros.
-
Distribuciones de Probabilidad
efecto de la cte
Distribucin de X
Distribucin de Ln X
Distribucin de Ln(X+)
-
Distribuciones de Probabilidad
Fsico Quimico.MTW
El test de Anderson-Darling se puede utilizar para verificar si un conjunto de datos no negativos sigue una distribucin lognormal. Stat > Quality Tools > Individual Distribution identification
-
Distribuciones de Probabilidad
-
Distribuciones de Probabilidad
-
Estimacin de parmetros Intervalos de confianza
-
Estimacin de Parmetros/Intervalos
Poblacin
La estadstica a menudo se describe como una disciplina cientfica relacionada con la coleccin, descripcin, anlisis e interpretacin de un conjunto de datos. Poblacin es el conjunto de todas las posibles observaciones de una caracterstica de inters. Dependiendo de la naturaleza del fenmeno bajo estudio, las poblaciones se pueden clasificar en poblacin finita o poblacin infinita.
-
Estimacin de Parmetros/Intervalos
Cuando el conjunto de individuos u objetos tomados sobre un tiempo particular es finito, entonces el conjunto de mediciones u observaciones de una caracterstica comn es una poblacin finita. Dos opciones para estudiar una caracterstica particular de una poblacin finita: I. Desarrollar un censo o conteo exhaustivo de todos los elementos que
comprenden la poblacin dada.
II. Estudiar un subconjunto de la poblacin y del conocimiento que se obtenga de este subconjunto extraer algunas conclusiones sobre la poblacin.
Generalmente se toma la segunda opcin, (problemas de costos, pruebas destructivas, etc.)
-
Estimacin de Parmetros/Intervalos
Cualquier estudio estadstico de una poblacin finita a menudo se denomina estudio enumerativo. Cuando se desea estudiar el comportamiento de un proceso sobre el tiempo, entonces la nocin de poblacin finita ya no existe en este contexto. Cuando se estudian procesos, se estn considerando procesos en marcha que generan eventos pasados, presentes y futuros. Dada la dimensin del tiempo, los estudios de procesos estn referidos frecuentemente como estudios de series de tiempo.
-
Estimacin de Parmetros/Intervalos
Es necesario pensar en poblaciones asociadas a procesos como poblaciones conceptuales. Una poblacin conceptual es la totalidad de las observaciones que pudieran ocurrir del desempeo de una determinada operacin en un modo particular. En un estudio enumerativo solamente existe una poblacin finita. En un estudio de serie de tiempo puede haber ms de una poblacin conceptual.
-
Estimacin de Parmetros/Intervalos
Muestreo
Un propsito importante para efectuar una investigacin es inferir o generalizar a partir de una muestra a una poblacin ms grande. Este proceso de inferencia se realiza mediante mtodos estadsticos basados en la probabilidad. Razones para muestrear: i. Las muestras pueden estudiarse con mayor rapidez que las poblaciones. ii. El estudio de una muestra es menos costoso que el de una poblacin entera. iii. En la mayora de las situaciones, el estudio de una poblacin entera es imposible. En ocasiones, el proceso del estudio destruye o agota el objeto que se est estudiando.
-
Estimacin de Parmetros/Intervalos
iv. Con frecuencia, los resultados de una muestra son ms precisos que los que se basan en una poblacin. Adems, es posible usar procedimientos ms costosos que mejoren la exactitud si slo se van a utilizar en una muestra, puesto que se llevarn a cabo en un nmero menor de veces. v. Si las muestras se seleccionan adecuadamente, es posible utilizar mtodos de probabilidad para estimar el error en estadsticos resultantes. Es este aspecto del muestreo el que permite construir enunciados de probabilidad respecto de las observaciones en estudio. vi. Las muestras pueden ser seleccionadas para reducir la heterogeneidad. En general mayor tamao de muestra no siempre significa mejor estimacin de parmetros, por lo tanto, se debe planear el tamao de la muestra apropiado para el estudio antes de iniciar la investigacin.
-
Estimacin de Parmetros/Intervalos
Mtodos de muestreo
La mejor manera de asegurarse que una muestra conducir a inferencias confiables y vlidas, es usar muestras de probabilidad en donde se conozca la probabilidad de cada elemento de la poblacin para ser incluido en la muestra. El mtodo de muestreo ms importante es el muestreo aleatorio simple. Aunque dependiendo del problema y con el objetivo de reducir los costos o aumentar la precisin, se pueden considerar otros tipos de muestreo, tales como, el muestreo sistemtico, muestreo estratificado, muestreo por conglomerados y muestreos no probabilsticos.
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos Stat> Basic Statistics> Graphical Summary
Velocidad.MTW
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
Tamao de Muestra para Estimar la Media en Poblaciones Finitas
El tamao de muestra necesario para estimar la media poblacional, con un error de estimacin no superior a d0 y un nivel de confianza de 100(1-)%, esta dado por
-
Estimacin de Parmetros/Intervalos
Cul debe ser el tamao de muestra para estimar la velocidad media con una confianza del 95% de confianza y un error de estimacin no superior a d0=2?
-
Estimacin de Parmetros/Intervalos Stat> Power and Sample Size> 1 Sample-Z
Velocidad.MTW
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos Stat> Basic Statistics> Graphical Summary
Velocidad.MTW
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
Un estudio piloto sobre condicin de pavimentos
utiliza el PCI como medida de deterioro, en 15
cuadrantes elegidos al azar proporcion una
desviacin estndar de 12.3
-
Estimacin de Parmetros/Intervalos
Cuntos cuadrantes deberan ser elegidos para estimar el PCI
promedio, con un error de estimacin no superior a 2.5 y una
confianza del 95%?
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
Stat> Basic Statistics> 1 Proportion
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
Se requieren 1752 ordenes de trabajo
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos
Ejemplo El archivo Velocidad.MTW contiene velocidades registradas de
una muestra de 200 vehculos en el ao 2008 y en una muestra
de 153 vehculos en el ao 2009.
2008 : Velocidad de vehculo en el 2008 2009 : Velocidad de vehculo en el 2009
-
Estimacin de Parmetros/Intervalos
Con un 95% de confianza se tiene que
18.085 2008 - 2009 19.668
Qu se puede concluir?
-
Estimacin de Parmetros/Intervalos
-
Estimacin de Parmetros/Intervalos Ejemplo
En un estudio sobre tiempos de uso de paraderos se encontr que para una muestra de 84 vehculos de un tipo especfico en la direccin N-S, 25 de ellos sobre pasaban el minuto. Mientras que en una muestra de 102 vehculos en la direccin S-N, 75 sobre pasaban el minuto. p1 : Proporcin de vehculos que sobre pasan el minuto, N-S p2 : Proporcin de vehculos que sobre pasan el minuto, S-N
-
Estimacin de Parmetros/Intervalos
Con un 95% de confianza se tiene que
-0.5676 p1 - p1 -0.3077
Qu se puede concluir?
-
TEST DE HIPTESIS
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis
-
Test de Hiptesis