clase 1-2

276
Curso: Estadística Tema 01: Conceptos Básicos Estadística

Upload: giancar

Post on 09-Nov-2015

213 views

Category:

Documents


1 download

DESCRIPTION

ESTADISTICA APLICADA

TRANSCRIPT

  • Curso: Estadstica

    Tema 01: Conceptos Bsicos Estadstica

  • CONTENIDO

    1. Introduccin 2. Procesamiento de muestras 2.1 Aleatoriedad 2.2 Poblacin y muestra 2.3 Representacin grfica de las muestras 3. Parmetros estadsticos 3.1 Media de la muestra 3.2 Mediana de la muestra 3.3 Moda 3.4 Varianza 3.5 Desviacin estndar 3.6 Percentil 3.7 Estadsticos de Asimetra 4. Muestreo Aleatorio

  • 1. Introduccin

    La estadstica es la disciplina interesada en la organizacin de datos obtenidos de

    mediciones u observaciones hechas en campo, los que son procesados con el fin de determinar las propiedades que caracterizan a una muestra o poblacin, para luego poder realizar pronsticos, tomar decisiones y llevar a cabo acciones; as se puede tener como ejemplo: planificar el transito vehicular, ejecucin de acciones contra enfermedades peligrosas, etc.

    2. Procesamiento de muestras

    Con esto se busca determinar los parmetros que caracterizan los datos de una poblacin.

  • 2.1 Aleatoriedad

    2.2 Poblacin y muestra

    Una expresin aleatoria es aquella en la que cada miembro de la poblacin tiene igual probabilidad de ser escogido.

    En la tabla N01, se presenta un ejemplo de cmo se anotan los registros muestrales, donde se puede identificar que el tamao de la muestra es n=14; en este caso n es igual al tamao de la poblacin (N).

  • Tabla N 01 Eventos ocurridos en el ao 2002

    N Tipo de eventos Frecuencia 1 Aluvin 1 2 Derrumbe 21 3 Deslizamiento 68 4 Granizada 6 5 Huayco 55 6 Incendio Urbano 125 7 Incendio forestal 16 8 Inundaciones 169 9 Lluvias intensas 135

    10 Maretazo 3 11 Sismo 1 12 Vientos fuertes 37 13 Tormentas elctricas 3 14 Otros 39

    Total 679

  • En la tabla anterior la columna que lleva de titulo frecuencia, hace referencia a la frecuencia absoluta, es decir el nmero de veces que ocurre un valor en una muestra o poblacin.

    2.3 Representacin grfica de las muestras

    Las posibilidades de representar grficamente a una muestra son muchas, pero solo unas pocas tendrn un significado entendible y legible con solo ver la grafica.

  • EVENTOS OCURRIDOS EN EL AO 2002

    0

    20

    40

    60

    80

    100

    120

    140

    160

    180

    Alu

    vi

    n

    De

    rru

    mb

    e

    De

    sliz

    amie

    nto

    Gra

    niz

    ada

    Hu

    ayco

    Ince

    nd

    io

    Urb

    ano

    Ince

    nd

    io

    fore

    stal

    Inu

    nd

    acio

    nes

    Llu

    vias

    in

    ten

    sas

    Mar

    etaz

    o

    Sism

    o

    Vie

    nto

    s fu

    erte

    s

    Torm

    en

    tas

    elc

    tric

    as

    Otr

    os

    TIPO DE EVENTO

    FREC

    UEN

    CIA

    AB

    SOLU

    TA

  • EVENTOS OCURRIDOS EL AO 2002

    0

    20

    40

    60

    80

    100

    120

    140

    160

    180

    Alu

    vi

    n

    Sism

    o

    Mar

    etaz

    o

    Torm

    en

    tas

    elc

    tric

    as

    Gra

    niz

    ada

    Ince

    nd

    io

    fore

    stal

    De

    rru

    mb

    e

    Vie

    nto

    s fu

    erte

    s

    Otr

    os

    Hu

    ayco

    De

    sliz

    amie

    nto

    Ince

    nd

    io

    Urb

    ano

    Llu

    vias

    in

    ten

    sas

    Inu

    nd

    acio

    nes

    TIPO DE EVENTO

    FREC

    UEN

    CIA

    AB

    SOLU

    TA

  • EVENTOS OCURRIDOS EL AO 2002

    0% 0% 0% 0% 1% 2% 3% 5% 6% 8%

    10%

    18%

    21%

    26%

    Aluvin

    Sismo

    Maretazo

    Tormentas elctricas

    Granizada

    Incendio forestal

    Derrumbe

    Vientos fuertes

    Otros

    Huayco

    Deslizamiento

    Incendio Urbano

    Lluvias intensas

    Inundaciones

  • 3.0 Parmetros estadsticos

    Son aquellos que caracterizan las propiedades mas importantes de una muestra.

    3.1 Media de la muestra

    La media de una muestra, x1, x2,...,xn; se define como:

    nn

    j

    j x...xxn

    xn

    x

    21

    1

    11

    Es decir la suma de todos los valores muestrales, divididos entre el tamao n de la muestra. Este valor indica el tamao promedio de los valores muestrales. Como ejemplo de aplicacin, podemos tomar los datos de la tabla N01 y hallar la media de los eventos ocurridos en el ao 2002

  • N Tipo de eventos Frecuencia 1 Aluvin 1 2 Derrumbe 21 3 Deslizamiento 68 4 Granizada 6 5 Huayco 55 6 Incendio Urbano 125 7 Incendio forestal 16 8 Inundaciones 169 9 Lluvias intensas 135

    10 Maretazo 3 11 Sismo 1 12 Vientos fuertes 37 13 Tormentas elctricas 3 14 Otros 39

    Total 679

    Tabla N 01 Eventos ocurridos en el ao 2002

    Valores muestrales: 14 (1, 21, 68, ..., 39) (mediciones u observaciones)

    Tamao de la muestra: 14 (nmero de valores muestrales).

    3921114

    1 ...x

    5.4814

    679x

  • 3.2 Mediana de la muestra

    Cuando la muestra es demasiado grande, se hace difcil ubicar la mediana, es por eso que es necesario establecer una formula para facilitar la bsqueda de la mediana, as como de las observaciones centrales de la muestra.

    Sea x1, x2,...,xn; una muestra de observaciones dispuestas en orden creciente. La mediana muestral es la observacin central si n es impar; caso contrario la mediana es el promedio de dos observaciones centrales.

    La mediana muestral se denota como: x~

    2

    1mediana la den Localizaci

    n

  • N Tipo de eventos Frecuencia

    1 Aluvin 1

    2 Sismo 1

    3 Maretazo 3

    4 Tormentas elctricas 3

    5 Granizada 6

    6 Incendio forestal 16

    7 Derrumbe 21

    8 Vientos fuertes 37

    9 Otros 39

    10 Huayco 55

    11 Deslizamiento 68

    12 Incendio Urbano 125

    13 Lluvias intensas 135

    14 Inundaciones 169

    Tabla N02

    Eventos ocurridos el ao 2002 (ordenados

    crecientemente segn su frecuencia)

    Como el nmero de valores muestrales es par, para determinar la mediana tenemos que encontrar la localizacin de la mediana.

    5.72

    114

    2

    1med L.

    n

    Entonces la mediana se obtiene de promediar los valores de la posicin 7 y 8 de los datos registrados

    292

    3721x~

  • 3.3 Moda de la muestra Es el valor de los datos con mayor frecuencia. En la tabla 2 se observa que el valor de la moda es 169.

  • 3.4 Varianza de la muestra

    La varianza S2 de una muestra x1, x2,...,xn; se define como:

    2212

    1

    2 ...1

    1

    1

    1xxxx

    nxx

    nS n

    n

    j

    j

    Es la suma de los cuadrados de las desviaciones de los valores muestrales con respecto a su media, dividida entre n-1. Mide la dispersin de los valores muestrales.

    As por ejemplo al procesar los datos presentados en la tabla N01, se obtiene que la varianza es:

    S2 = 3,136.27

  • 3.5 Desviacin estndar

    Esta dada por la raz cuadrada positiva de la varianza de la muestra, y se denota por la letra S.

    2SS

    3.6 Percentil

    Los percentiles son 99 valores que dividen a la distribucin en 100 partes iguales, conteniendo cada parte el 1% de los datos. Pk es el valor que deja el k% de los datos no superior a l.

  • Cuartiles Son un caso particular de los percentiles, hay 3: Q1 = P25 Q2 = P50 = mediana Q3 = P75

    Ejemplo: Dada la siguiente distribucin en el nmero de hijos de 100 familias, calcular sus cuartiles.

    xi ni Ni

    0 14 14

    1 10 24

    2 15 39

    3 26 65

    4 20 85

    5 15 100

  • Primer cuartil: n/4 = 25; primera Ni > 25 es Ni = 39 Q1 = 2

    Segundo cuartil: n/2 = 50; primera Ni > 50 es Ni = 65 Q2 = 3

    tercer cuartil: 3n/4 = 75; primera Ni > 75 es Ni = 85 Q3 = 4

  • 4. Muestreo aleatorio

    Es fundamental que la muestra seleccionada de una poblacin dada, represente adecuadamente a su poblacin, es decir que sus propiedades permitan obtener conclusiones acerca de la poblacin. Para lograr lo anterior se requiere que la muestra seleccionada sea aleatoria, es decir que cada elemento de la poblacin debe poseer una probabilidad conocida de ser considerada en la muestra.

  • Ejemplo

    Se desea extraer e inspeccionar una muestra de 10 tornillos, de un lote de 80, cmo seleccionar fsicamente 10 tornillos de manera que todas las muestras de tamao 10 sean equiprobables?

    Sol

    Para solucionar este caso se procede de la siguiente manera:

    1.- Los artculos del lote se enumeran del 1 al 80.

    2.- Se elige aleatoriamente los 10 artculos usando una tabla de nmeros aleatorios.

    Esto se logra eligiendo al azar una fila del 0 al 99 de la tabla de nmeros aleatorios, y una columna del 0 al 9 de la misma tabla. Para hacer esta seleccin se puede efectuar un experimento que consiste en lanzar una moneda, para el cual se procede de la siguiente manera:

  • Lanzar 7 veces una moneda y asignar el valor de 1 a las caras y 0 a los sellos, de esa forma se obtiene un nmero binario de siete dgitos, este nmero se usa si su valor es mayor de 0 y menor a 99. Al realizar un experimento se obtuvo el nmero binario 0011010 (=26).

    Se repite el experimento anterior, pero esta vez para encontrar un nmero binario de cuatro dgitos; asimismo este nmero se acepta si esta entre 0 y 9. Al realizar este experimento se obtuvo el nmero binario 0111 (=7).

    Habiendo encontrado los nmeros 26 y 7, se recurre a la tabla de nmeros aleatorios y dirigindonos a la fila 26 y columna 7 se obtiene el primer nmero aleatorio (1942), del cual solo se toman los dos primeros dgitos, en este caso 19; luego desplazndose hacia abajo en la misma columna se determinan los otros nmeros aleatorios, hasta completar los 10 nmeros que van a representar a la muestra pedida.

  • Tabla de nmeros aleatorios

    3690 2492 7171 7720 6509 7549 2330 5733 4730

    0813 6790 6858 1489 2669 3743 1901 4971 8280

    6477 5289 4092 4223 6454 7632 7577 2816 9002

    0772 2160 7236 0812 4195 5589 0830 8261 9232

    5692 9870 3583 8997 1533 6466 8830 7271 3809

    2080 3828 7880 0586 8482 7811 6807 3309 2729

    1039 3382 7600 1077 4455 8806 1822 1669 7501

    7227 0104 4141 1521 9104 5563 1392 8238 4882

    8506 6348 4612 8252 1062 1757 0964 2983 2244

    5086 0303 7423 3298 3979 2831 2257 1508 7642

    0092 1629 0377 3590 2209 4839 6332 1490 3092

    0935 5565 2315 8030 7651 5189 0075 9353 1921

    2605 3973 8204 4143 2677 0034 8601 3340 8383

    7277 9889 0390 5579 4620 5650 0210 2082 4664

    5484 3900 3485 0741 9069 5920 4326 7704 6525

    6905 7127 5933 1137 7583 6450 5658 7678 3444

    8387 5323 3753 1859 6043 0294 5110 6340 9137

    4094 4957 0163 9717 4118 4276 9465 8820 4127

    4951 3781 5101 1815 7068 6379 7252 1086 8919

    9047 0199 5068 7447 1664 9278 1708 3625 2864

    7274 9512 0074 6677 8676 0222 3335 1976 1645

    9192 4011 0255 5458 6942 8043 6201 1587 0972

    0554 1690 6333 1931 9433 2661 8690 2313 6999

    9231 5627 1815 7171 8036 1832 2031 6298 6073

    3995 9677 7765 3194 3222 4191 2734 4469 8617

    2402 6250 9362 7373 4757 1716 1942 0417 5921

    5295 7385 5474 2123 7035 9983 5192 1840 6176

    5177 1191 2106 3351 5057 0967 4538 1246 3374

    7315 3365 7203 1231 0546 6612 1038 1425 2709

    5775 7517 8974 3961 2183 5295 3096 8536 9442

    5500 2276 6307 2346 1285 7000 5306 0414 3383

    Tabla de nmeros aleatorios

    3690 2492 7171 7720 6509 7549 2330 5733 4730

    0813 6790 6858 1489 2669 3743 1901 4971 8280

    6477 5289 4092 4223 6454 7632 7577 2816 9002

    0772 2160 7236 0812 4195 5589 0830 8261 9232

    5692 9870 3583 8997 1533 6466 8830 7271 3809

    2080 3828 7880 0586 8482 7811 6807 3309 2729

    1039 3382 7600 1077 4455 8806 1822 1669 7501

    7227 0104 4141 1521 9104 5563 1392 8238 4882

    8506 6348 4612 8252 1062 1757 0964 2983 2244

    5086 0303 7423 3298 3979 2831 2257 1508 7642

    0092 1629 0377 3590 2209 4839 6332 1490 3092

    0935 5565 2315 8030 7651 5189 0075 9353 1921

    2605 3973 8204 4143 2677 0034 8601 3340 8383

    7277 9889 0390 5579 4620 5650 0210 2082 4664

    5484 3900 3485 0741 9069 5920 4326 7704 6525

    6905 7127 5933 1137 7583 6450 5658 7678 3444

    8387 5323 3753 1859 6043 0294 5110 6340 9137

    4094 4957 0163 9717 4118 4276 9465 8820 4127

    4951 3781 5101 1815 7068 6379 7252 1086 8919

    9047 0199 5068 7447 1664 9278 1708 3625 2864

    7274 9512 0074 6677 8676 0222 3335 1976 1645

    9192 4011 0255 5458 6942 8043 6201 1587 0972

    0554 1690 6333 1931 9433 2661 8690 2313 6999

    9231 5627 1815 7171 8036 1832 2031 6298 6073

    3995 9677 7765 3194 3222 4191 2734 4469 8617

    2402 6250 9362 7373 4757 1716 1942 0417 5921

    5295 7385 5474 2123 7035 9983 5192 1840 6176

    5177 1191 2106 3351 5057 0967 4538 1246 3374

    7315 3365 7203 1231 0546 6612 1038 1425 2709

    5775 7517 8974 3961 2183 5295 3096 8536 9442

    5500 2276 6307 2346 1285 7000 5306 0414 3383

  • En la tabla de nmeros aleatorios los resultados pueden ser los siguientes :

    19 44 83 91 55 55 53 03

    De los cuales se omiten los nmeros mayores a 80 y tambin los nmeros que se repiten, finalmente los nmeros seleccionados fueron:

    19 44 55 53 03 52 61 67 78 39

  • Generacin de nmeros aleatorios con mathematica:

    Do[Print[RandomInteger[{1,100}]],{n,10}] 51 86 49 39 98 55 5 68 89 7

  • MINITAB 16

  • Planilla de Datos (Worksheet)

    Los datos se pueden digitar directamente en Minitab o se pueden copiar desde otras aplicaciones y pegar en una worksheet o abrir archivos de diferentes aplicaciones tales como excel, dbase, origin, o archivos de texto .txt o .dat Abrir un archivo .MTW Pregunta2.MTW File > Open Worksheet > (buscar archivo Pregunta2.MTW en su carpeta de destino)

  • Manipulacin de Worksheets

    Con comandos en el men Data se pueden obtener subplanillas, dividir planillas, unir planillas, copiar planillas Abrir el archivo Fsico Qumico.MTW

  • Subplanillas Las subplanillas se pueden obtener de acuerdo a un o algunos criterios establecidos por el usuario: Un primer ejemplo; obtener una planilla solamente con datos relacionados con la estacin B de la 1 columna Data > Subset Worksheet

  • Un segundo ejemplo; obtener una planilla con datos solamente de Estacin A y Temperatura >= 10 C Data > Subset Worksheet >

  • Se pueden obtener subplanillas basadas en: Expresiones matemticas Nmeros de fila Un rango de datos Puntos Marcados

  • Dividir una Planilla

    Para dividir una planilla se recomienda que los criterios estn basados en datos cualitativos o codificados, puesto que se obtendrn tantas planillas como criterios tenga(n) la(s) columna(s) Ejemplo: Dividir la planilla Fsico Qumico segn la columna Estacin Data > Split Worksheet

  • Desapilar columnas

    Algunos de los comandos de Minitab permiten que datos de grupos estn desapilados en columnas diferentes. Mientras comandos de Minitab necesitan que los datos estn apilados. Fsico Qumico.MTW Los datos estn apilados segn Estacin

  • Desapilar pH y Temperatura segn Estacin Data > Unstack Columns

    Variables a Desapilar

    Criterio(s) o variable(s) de apilacin

    Desapila en la misma planilla

  • pH desapilado segn estacin

    Temperatura desapilada segn estacin

  • ANALISIS EXPLORATORIO DE DATOS

  • El anlisis exploratorio de datos permite la bsqueda de patrones en los datos, es una herramienta de utilidad en la generacin de hiptesis, conjeturas y preguntas de investigacin acerca de los fenmenos de donde los datos fueron obtenidos. Anlisis Clsico Problema Datos Modelo Anlisis Conclusiones

  • Distribucin de una variable

    En un conjunto de datos la frecuencia absoluta de un valor (o de un intervalo), es el nmero de veces en que la variable toma ese valor (o pertenece a ese intervalo). La frecuencia relativa es igual a la frecuencia absoluta dividida por el nmero de datos.

  • Medidas de Frecuencia

    Una forma de resumir datos es a travs de la Distribucin de Frecuencias. Esta Distribucin puede ser vista mediante Tablas y/o Grficos. En una Tabla se muestran los valores tabulados (o frecuencias) segn sus categoras. En herramientas grficas se suelen presentar estas categoras mediante segmentos de reas en diferentes formas.

    Tabla

    Grfico

    Eritrocitosis.MTW

  • Medidas de Frecuencia

    Los datos pueden ser recopilados de muchas formas y tamaos. Una de las formas ms comunes es una base de datos rectangular hechas de filas y columnas. Cada fila contiene informacin de un ente o individuo y comnmente es denominado de registro u observacin. Cada columna contiene informacin acerca de una caracterstica tal como sexo, fecha de nacimiento, etc. y es comnmente denominado de variables.

    Registros

    Variables

    Eritrocitosis.MTW

  • Ratios, Proporciones y Tasas

    Muchas de las variables que se trabajan son del tipo Nominal binarias. Por ejemplo, Vivo Muerto, Expuesto No Expuesto, etc. Debido a esto, es conveniente trabajar con Mtricas adecuadas para realizar comparaciones entre diferentes grupos de individuos diferentes individuos en un mismo grupo. Algunas de estas mtricas son los Ratios, Proporciones y Tasas.

    x e y son las cantidades que sern comparadas

    La constante 10n se utilizar para transformar el resultado de la divisin en una cantidad uniforme. 10n puede ser 1, 10, 100, 1000, etc. dependiendo del valor entero positivo n

    , , =

    10

  • Propiedades de una distribucin

    Posicin: En torno a qu valor central toma valores la variable Dispersin: el grado de concentracin de los valores que toma la

    variable alrededor de su posicin central Forma: distribucin simtrica o asimtrica, es decir si los valores

    se reparten del mismo modo a uno y otro lado del centro

  • Medidas de Frecuencia

    Es posible construir tablas sencillas para presentar la frecuencia de los valores de una variable especfica. Sin embargo, si estos valores de la variable especfica se incrementan en nmero de posibilidades, lo mejor es generar intervalos de clase para agrupar estos valores.

    Variable

  • Valores de Variable Cuantitativa X

  • Intervalo de Clase que contiene a los Valores de Variable X

  • Tabulacin de Datos Cualitativos o Categorizados Stat>Tables

    Tabulacin Unidimensional

    Trab_Altura.MTW

    Medidas de Frecuencia (Datos Cualitativos)

  • Estado Nutricional ndice de Masa Corporal categorizado

    Medidas de Frecuencia (Datos Cualitativos)

  • Tabulacin de Datos Cualitativos o Categorizados Stat>Tables

    Tabulacin Bidimensional (Tabulacin Cruzada)

    Trab_Altura.MTW

    Medidas de Frecuencia (Datos Cualitativos)

  • Estado Nutricional vs. Tabaquismo

    Medidas de Frecuencia (Datos Cualitativos)

  • Diagrama de Barras Se utilizan cuando en los datos se tienen varias categoras o clases de datos nominales u ordinales Graph>Bar Chart

    Trab_Altura.MTW

    Medidas de Frecuencia (Datos Cualitativos)

  • Diagrama de Barras

    Medidas de Frecuencia (Datos Cualitativos)

  • Diagrama de Barras

    Si se mantiene activa la ventana del grfico, al teclear el botn derecho del mouse se puede tener acceso a modificaciones al grfico

    Medidas de Frecuencia (Datos Cualitativos)

  • Grfico Circular Graph>Pie Chart

    Trab_Altura.MTW

    Medidas de Frecuencia (Datos Cualitativos)

  • Grfico Circular Graph>Pie Chart

    Trab_Altura.MTW

    Medidas de Frecuencia (Datos Cualitativos)

  • Diagrama de Barras Agrupadas Graph>Bar Chart

    Trab_Altura.MTW

    Medidas de Frecuencia (Datos Cualitativos)

  • Diagrama de Barras Agrupadas

    Medidas de Frecuencia (Datos Cualitativos)

  • DIAGRAMA DE PARETO

    Diagrama de barras simple, ordenada segn frecuencias descendentes. Basado en el principio de Pareto:

    20% de las fuentes causan el 80% de cualquier problema

    Indica la importancia relativa de los problemas en un formato rpido y fcil de interpretar.

    til para concentrarse en los problemas que ofrecen mayor impacto si se solucionan

  • Stat>Quality Tools>Pareto Charts

    Accidentes.MTW

  • Medidas de Frecuencia (Datos Cuantitativos)

    Histograma Se utiliza para obtener una estimacin rpida de la forma y de la variacin de los datos.

    Se divide el rango de variacin de los datos en un nmero adecuado de intervalos

    Sobre cada intervalo se dibuja un rectngulo con rea proporcional a la frecuencia de datos en el intervalo

  • Elementos para interpretar un Histograma:

    Identificar si se han utilizado frecuencias absolutas o relativas Cuntas modas hay? Existe algn dato atpico? En caso de asimetra simetra positiva o negativa? En torno a qu valor aproximado estn centrados los datos?

  • Medidas de Frecuencia (Datos Cuantitativos)

    Histograma Graph>Histogram

    Accidentes.MTW

  • Graph>Histogram

    Accidentes.MTW

  • Medidas de Frecuencia (Datos Cuantitativos)

    Diagrama de Puntos Si el conjunto de datos es pequeo, el Histograma podra no entregar una buena idea de la forma de la Distribucin

    Conjunto de datos pequeo o moderado Se divide el rango de variacin de los datos en un nmero adecuado

    de intervalos Cada dato se representa con un punto sobre la correspondiente

    marca de clase o localizacin del intervalo

  • Trab_Altura.MTW

    Ejemplo: Se desea averiguar la distribucin de colesterol total segn el hbito de fumar de los trabajadores. Graph>Dotplot

  • Diagrama de Puntos

    Trab_Altura.MTW

  • Diagrama de Puntos

    Trab_Altura.MTW

    Diagrama de puntos de colesterol total segn tabaquismo

  • 3.7 Estadsticos de asimetra Se define el momento central de orden p como:

    =1

    1

    Se define el coeficiente de curtosis como:

    2 =44 3

  • Y el Coeficiente de Asimetra de Fischer como:

    1 =33

  • Diagrama de Cajas (Box Plot)

    Los Boxplot permiten compara grficamente conjunto de datos o particionar una poblacin de datos en sub poblaciones Graph>Boxplot

  • Velocidad.MTW

  • Velocidad.MTW

  • Velocidad.MTW

  • Velocidad.MTW

  • Tema 02: Distribucin y Probabilidades

    1 Probabilidad El clculo de probabilidades constituye la base de la estadstica inferencial.

    1.1 Experimento

    Proceso por medio del cual se obtiene una medicin o una observacin, por ejemplo:

    (1)Lanzar un dado y observar el resultado.

    (2)Efectuar una medicin de la cantidad de vehculos que pasan por una avenida en un lapso de tiempo.

    (3)Elegir aleatoriamente a una persona y preguntarle su gasto diario en movilidad

  • 1.2 Ensayo

    Es la ejecucin de un experimento.

    1.3 Resultado o punto muestral

    Es el valor que arroja el experimento.

    1.4 Espacio muestral S

    Es el conjunto de todos los resultados posibles obtenidos al realizar un experimento.

    1) S = {1,2,3,4,5,6}.

    2) S : Son los #s no negativos en algn intervalo 0 x K.

    3) S = {G, N, I}; G: le gusta, N: no le gusta y I: Est indeciso.

  • 1.5 Eventos Se les llama as a los subconjuntos de S. Por ejemplo en (1) los eventos son:

    A = {1, 3, 5}, Nmeros impares

    B = {2, 4, 6}, Nmeros pares

    1.6 Probabilidad

    Si el espacio muestral S de un experimento consta de un nmero finito de resultados equiprobables, entonces la probabilidad P(A) de un evento es:

    Sen puntos de #

    Aen puntos de #AP

  • Ejemplo de Probabilidad

    Al lanzar un dado, Cual es la probabilidad P(A) de:

    a) Obtener por lo menos un cinco, y.

    b) De obtener un nmero par.

    En el lanzamiento de un dado, las probabilidades de sus resultados son todas iguales a 1/6, es por eso que se les llama equiprobables. Entonces las probabilidades solicitadas se pueden expresar como:

    puntos tres tiene;6 4 ,2B porque ,6

    3yBP

  • 1.7 Variable aleatoria

    Es aquella que asociada a un experimento cuyo valor es un nmero real depende del azar. Cuando un evento A que se desprende de un espacio muestral S, puede o no ocurrir.

    Por ejemplo, al aforar en una seccin determinada del ro, se encuentra que el volumen mensual de escurrimiento es a veces mayor de 300,000 m3, pero a veces es menor.

  • 2.0 Funciones de Probabilidad

    2.1 Funciones discretas de probabilidad

    Cuando el nmero de valores x que puede tomar una variable aleatoria X es finito, X se llama variable aleatoria discreta.

    Por ejemplo, al lanzar dos dados, la variable aleatoria X (experimento de lanzar los dados) puede generar valores finitos.

    X = D1+D2

    D1 y D2, son los puntos obtenidos por los dados; (ver en la tabla siguiente)

  • Tabla N 01

    1+1=2 2+1=3 3+1=4 4+1=5 5+1=6 6+1=7

    1+2=3 2+2=4 3+2=5 4+2=6 5+2=7 6+2=8

    1+3=4 2+3=5 3+3=6 4+3=7 5+3=8 6+3=9

    1+4=5 2+4=6 3+4=7 4+4=8 5+4=9 6+4=10

    1+5=6 2+5=7 3+5=8 4+5=9 5+5=10 6+5=11

    1+6=7 2+6=8 3+6=9 4+6=10 5+6=11 6+6=12

    En este caso el nmero total de resultados posibles del experimento es 36 y el nmero n de valores que puede tomar la variable aleatoria X es 11 (x = 2, 3, 4,..., 12).

    As mismo la probabilidad asociada a cada uno de estos n posibles valores de X se puede ver en la tabla N02 y en forma grfica en la figura N01.

  • Tabla N 02

    2 1 1/36

    3 2 2/36

    4 3 3/36

    5 4 4/36

    6 5 5/36

    7 6 6/36

    8 5 5/36

    9 4 4/36

    10 3 3/36

    11 2 2/36

    12 1 1/36

    x = valor de XNmero de resultados

    favorablesProbabilidad

  • FUNCIN MASA DE PROBABILIDAD DISCRETA

    1/36

    2/36

    3/36

    4/36

    5/36

    6/36

    5/36

    4/36

    3/36

    2/36

    1/36

    0

    3/36

    6/36

    2 3 4 5 6 7 8 9 10 11 12

    VALORES DE X

    PR

    OB

    AB

    ILID

    AD

  • FUNCIN DE DISTRIBUCIN DE PROBABILIDAD ACUMULADA

    (Se suma el valor anterior)

    0 /36

    6 /36

    12 /36

    18 /36

    24 /36

    30 /36

    36 /36

    2 3 4 5 6 7 8 9 10 11 12

    VALORES DE X

    PR

    OB

    AB

    ILID

    AD

    AC

    UM

    ULA

    DA

  • 2.2 Funciones continuas de probabilidad

    Cuando el nmero n de valores que puede tomar una variable aleatoria X es infinito, se le llama variable aleatoria continua; por ejemplo: el volumen de escurrimiento de un ro.

    Del ejemplo, de lanzar dos dados, imaginando que estos tienen infinitas caras, la funcin de probabilidad discreta del caso anterior se convierte ahora en una funcin de densidad de probabilidad.

  • FUNCIN DE DENSIDAD DE PROBABILIDAD (Ahora es variable continua)

    0

    6/36

    2 3 4 5 6 7 8 9 10 11 12

    VALORES DE X

    PR

    OB

    AB

    ILID

    AD

  • FUNCIN DE DISTRIBUCIN DE PROBABILIDAD CONTINUA

    (Sumndose los valores anteriores)

    0 /36

    6 /36

    12 /36

    18 /36

    24 /36

    30 /36

    36 /36

    2 3 4 5 6 7 8 9 10 11 12

    VALORES DE X

    PR

    OB

    AB

    ILID

    AD

    AC

    UM

    ULA

    DA

  • Cuando una variable aleatoria es continua, la probabilidad de que esta tome un valor exacto es siempre nula.

    0 xXP

    Y solo es posible hablar de probabilidades diferentes de cero para intervalos finitos.

    0 bXaP

    Entonces la funcin de distribucin continua de probabilidad se escribe:

    dxx

    xfxF

  • Ejemplo:

    Determinar el valor de la constante a de la funcin de densidad de probabilidad:

    parte otracualquier en 0

    50 2 xaxxf

    cul es la probabilidad de que un valor X seleccionado aleatoriamente de esta funcin: a) sea menor que 2? b) est entre 1 y 3? c) sea mayor que 4? d) sea mayor que 6? e) sea igual a 2.5?

    Solucin

    Segn los axiomas de probabilidad se sabe:

    15

    5

    0

    0

    dxxfdxxfdxxfdxxfxF

  • Sustituyendo los valores de f(x) en la funcin anterior, se tiene:

    13

    125

    300

    5

    0

    3

    5

    5

    0

    20

    aaxdxdxaxdx

    De donde se obtiene:

    125

    3a

    La funcin de densidad de probabilidad se escribe:

    125

    3 2xxf

    Y la funcin de distribucin de probabilidad resulta:

    125

    3xxF

  • Funcin de distribucin de probabilidad 125

    3xxF

    Entonces:

    a) sea menor que 2? 125

    822 XPF

    b) est entre 1 y 3? 125

    26

    125

    1

    125

    271331 FFXP

    c) sea mayor que 4? 125

    61

    125

    64141414 FXPXP

  • Experimento aleatorio: es aquel que bajo el mismo conjunto aparente de condiciones iniciales, puede presentar resultados diferentes, es decir, no se puede predecir el resultado exacto de cada experiencia particular. Evento simple E: es un resultado bsico de un experimento aleatorio que no puede descomponerse en resultados ms simples. Espacio muestral : Coleccin de todos los eventos simples de un experimento aleatorio. La probabilidad de un evento simple E, P(E), es un nmero que mide la verosimilitud de que el evento ocurra cuando se realice el experimento.

  • PROBABILIDAD Cuando un experimento es ejecutado, se obtiene una de las varias posibilidades de resultados. Debido al azar posiblemente no seamos capaces de predecir de antemano un resultado particular, sin embargo, emitimos una opinin de las chances de ocurrencias de dichos resultados. Se han propuesto algunas formas de calcular probabilidades 1.- Mtodo clsico 2.- Mtodo estadstico

  • 1. Mtodo Clsico Este mtodo es aplicable nicamente para el caso en que el experimento contenga un nmero finito de resultados: W1, , WN. Se asume que todos los resultados son equiprobables.

    Ejemplo: Suponga que un dado es lanzado al aire, dado que existen 6 posibilidades igualmente probables, se tiene que: = {w1, w2, , w6} P(wi) = 1/6 Si A es un evento tal que un nmero par ocurra, entonces P(A) = P(w2, w4, w6) = 3/6

  • 2. Mtodo Estadstico Suponga que A es un conjunto de resultados de un experimento. Suponga tambin que es posible repetir el experimento un nmero grande de veces. Si se denota por nA el nmero de ocurrencias de A en n repeticiones, entonces nA es llamada la frecuencia de A y fA = nA/n la frecuencia relativa de A.

    Se define =

    Ejemplo: Suponga que C denota la ocurrencia de una cara en un nico lanzamiento de una moneda; si en un nmero grande de lanzamientos el 50% ocurrieron caras, entonces P(cara) = ; si el 40% result en caras entonces P(cara) = 2/5 y as sucesivamente.

  • Mtodo Estadstico Calc>Random Data>Uniform

  • Mtodo Estadstico

    Calc>Random Data>Uniform

  • Mtodo Estadstico

    Calc>Calculator

  • Mtodo Estadstico

    Calc>Calculator

  • Mtodo Estadstico

    Graph>Scatterplot

  • Mtodo Estadstico

  • AC : suceso contrario a A : Suceso imposible : Suceso seguro A y B sucesos incompatibles si A B =

  • Definicin de Probabilidad

    Propiedades de probabilidades

  • Ejemplo:

  • Probabilidad Condicional

  • Ejemplo En un lote de estacionamiento hay 10 automviles estacionados, 3 rojos 4 verdes y 3 azules. Dos de Ellos salen del estacionamiento. Cul es la probabilidad de que: a) Exactamente uno de ellos sea rojo? b) Dos de ellos sean rojos? c) Por lo menos uno de ellos sea rojo? d) El segundo sea rojo?

  • Ejemplo En un lote de estacionamiento hay 10 automviles estacionados, 3 rojos 4 verdes y 3 azules. Dos de Ellos salen del estacionamiento. Cul es la probabilidad de que: a. Exactamente uno de ellos sea rojo?

  • b. Dos de ellos sean rojos? c.- Por lo menos uno de ellos sea rojo? d.-El segundo sea rojo?

  • DISTRIBUCIONES PROBABILSTICAS

  • Una variable aleatoria (v.a.) es una funcin definida sobre el espacio muestral con valores numricos. Una distribucin de probabilidad es un modelo matemtico que relaciona el valor de la v. a. con la probabilidad de ocurrencia de este valor en la poblacin. Si la v.a. solamente puede tomar ciertos valores, como los nmeros enteros 0,1,2,3,, la distribucin de probabilidad es una distribucin discreta. Cuando la v. a. que se mide se expresa en una escala continua, su distribucin de probabilidad es una distribucin continua.

  • Si se tiene una muestra aleatoria simple, es posible encontrar una distribucin a partir de la muestra que proporcionar un cierto parecido a la distribucin verdadera de la variable asociada con la poblacin. Es lo que se denomina funcin de distribucin emprica de la muestra. Cmo se define? Pues como una funcin real de variable real donde, a cada valor, se le asigna la frecuencia relativa acumulada muestral.

    Funcin de Distribucin Emprica

  • Funcin de Distribucin Emprica

  • Funcin de Distribucin Emprica Graph>Empirical CDF

    Velocidad.MTW

  • Funcin de Distribucin Emprica

    Velocidad.MTW

  • Ejercicio : Se pide calcular los valores de los percentiles 20 y 40 mediante la funcin de distribucin emprica, de la siguiente serie de valores: 102.2 96.3 377.7 119.9 221.1 32 153.8 199 261.9 58.7 160 209.8 270 60.4 171.9 142 138.3 83.5 172.1 148.5 13.5 289.4 183.6 269.4 18.1 299.9 197.9 118 110.5 300.7

  • El percentil 20 se obtiene por interpolacin sabiendo que ser un volumen de precipitacin entre el valor que est en la posicin sexta (19,35 %) y el valor que est en la posicin sptima (22,58 %) P19.35 83.5 P20 86.07 P22,58 96.3 El percentil 40 se obtiene por interpolacin sabiendo que ser un volumen de precipitacin entre el valor que est en la posicin duodcima (38,71 %) y el valor que est en la posicin dcimotercera (41,94 %) P38.71 138.3 P40 139.78 P41.94 142

    Solucin. Se deben ordenar los datos en orden creciente, y asignar a cada valor su probabilidad emprica en funcin del orden de situacin del valor y del nmero de datos. As para los dos primeros valores tendremos: 1 (primero) 13.5 Prob (X 13.5) = i/(N +1) = 1/(30+1) = 0.03226 (3.226 %) 2 (segundo) 18.1 Prob (X 18.1) = i/(N +1) = 2/(30+1) = 0.06452 (6.452 %)

  • Distribuciones de Probabilidad

    Discretas

    Continuas

    Uniforme discreta Binomial Poisson

    Normal Lognormal Exponencial Chi-cuadrado, etc

  • Distribuciones muestrales Consideremos todas las posibles muestras de tamao n en una poblacin dada (con o sin reposicin). Para cada muestra, podemos calcular un estadstico (tal como la media o la desviacin estndar o tpica), dicho estadstico vara de una muestra a otra. De esta manera obtenemos una distribucin de la estadstica que se llama distribucin de muestreo. Si denotamos la media y la desviacin tpica de la distribucin de muestreo de medias por y las de la poblacin por y , respectivamente, entonces:

    =

    =

    1

  • Donde: = la media de la distribucin de muestreo de las medias. = la media de la poblacin. = error estndar de la media de muestreo. = desviacin tpica de la poblacin. N = tamao de la poblacin. n = tamao de la muestra.

    Ejemplo: Supongamos que estamos interesados en una poblacin de 20 compaas del mismo tamao, todas estas compaas experimentan una produccin excesiva de trabajo. Nuestro estudio indica que la desviacin estndar de la distribucin de la produccin anual es igual a 75. Si muestreamos 5 de estas compaas (sin reemplazo), y calculamos el error estndar de la media para la poblacin finita:

    =75

    5 20 5

    20 1= 29.8

  • la fraccin n/N se define como la fraccin de muestreo. Cuando la fraccin de muestreo es pequea, el error estndar de la media para poblaciones finitas es cercano a la media para poblaciones infinitas

    Para valores grandes de n (n30), la distribucin de muestreo de medias es aproximadamente normal con media y desviacin tpica independientemente de la poblacin. Este resultado para una poblacin infinita es un caso especial del teorema del lmite central , en estas ocasiones se dice que la distribucin de muestreo es asintticamente normal.

  • El teorema central del lmite es uno de los resultados fundamentales de la estadstica. Este teorema nos dice que si una muestra es lo bastante grande (generalmente cuando el tamao muestral (n) supera los 30), sea cual sea la distribucin de la media muestral, seguir aproximadamente una distribucin normal. Es decir, dada cualquier variable aleatoria, si extraemos muestras de tamao n (n>30) y calculamos los promedios muestrales, dichos promedios seguirn una distribucin normal. Adems, la media ser la misma que la de la variable de inters, y la desviacin estndar de la media muestral ser aproximadamente el error estndar.

    Teorema de Limite Central

  • Distribucin de muestreo de proporciones Supongamos que una poblacin es infinita y que la probabilidad de ocurrencia de un suceso (su xito) es p, mientras la probabilidad de que no ocurra es q = 1 - p. Consideremos todas las posibles muestras de tamao n de tal poblacin, y para cada una de ellas determinemos la proporcin de xitos (P). Obtenemos as una distribucin de muestreo de proporciones cuya media p y su desviacin tpica p vienen dadas por:

    =

    =

  • donde: = media de muestreo de proporciones. P = media de la poblacin de proporciones. p = probabilidad de xito. q = probabilidad de fracaso. Para muestras grandes (n30), la distribucin de muestreo est, muy aproximadamente, normalmente distribuida. Ntese que la poblacin est binomialmente distribuida. La ecuacin es vlida tambin para una poblacin finita en la que se hace muestreo con reposicin.

  • Para poblaciones finitas en que se haga muestreo sin reposicin, la ecuacin queda sustituida por :

    = =

    La distribucin binomial

    Una distribucin de probabilidad de una variable aleatoria discreta utilizada ampliamente es la distribucin binomial. Esta distribucin es apropiada para una variedad de procesos que describe datos discretos, que son resultado de un experimento el cual nos llevar a uno de slo dos resultados posibles que son mutuamente exclusivos, tales como muerto o vivo, enfermo o saludable, etc., en donde la obtencin del resultado deseado se considera como xito "p" y el resultado no deseado como fracaso "q", donde, q = 1 p

  • Proceso de Bernoulli Podemos describir el proceso de la manera siguiente: 1. Cada ensayo conduce a uno de dos resultados posibles, mutuamente exclusivos, uno denominado xito y el otro fracaso. 2. La probabilidad del resultado de cualquier intento permanece fijo con respecto al tiempo. 3. Los ensayos son estadsticamente independientes Si p y 1-p son las probabilidades de xito y fracaso respectivamente en cada ensayo, entonces, la probabilidad de obtener x xitos y n-x fracasos en algn

    orden especfico se da por la siguiente ecuacin: px(1-p)n-x

    entonces el nmero de formas en que podemos obtener x xitos en n ensayos es el nmero de combinaciones de x objetos seleccionados de un conjunto de n objetos (n/x) as llegamos al siguiente resultado:

  • = ; = 0,1,2,3,

    Donde, n = nmero de ensayos realizados. p = probabilidad de xito. q = (1-p) = probabilidad de fracaso. n - x = nmero de fracasos. px = probabilidad favorable.

  • Un Proceso de Bernoulli no es otra cosa que la repeticin de un ensayo de Bernoulli. Si nos fijamos en el ejemplo de la moneda, en este caso estaremos estudiando cuntas veces sale "cara" o cuntas sale "cruz", o las probabilidades de que salga "cara", al menos una vez, de un nmero n de intentos.

  • Propiedades de la distribucin binomial a) la media: = np b) la varianza: 2 = npq

    c) el coeficiente de sesgo: 3 =

    d) desviacin tpica: = e) cuando p es menor que 0.5, la distribucin binomial est sesgada hacia la derecha. f) conforme p aumenta, el sesgo es menos notable. g) cuando p = 0.5, la distribucin binomial es simtrica. h) cuando p es mayor que 0.5, la distribucin esta sesgada hacia la izquierda.

  • Distribucin de probabilidad hipergeomtrica Si se selecciona una muestra aleatoria de n consumidores de una poblacin de N consumidores, el nmero x de usuarios que favorecen un producto especfico tendra una distribucin binomial. Cuando el tamao muestral n es pequeo respecto al nmero N de consumidores en la poblacin, el nmero x a favor del producto tiene una distribucin de probabilidad hipergeomtrica, cuya frmula es:

    =

  • Donde: N = nmero de elementos en la poblacin. r = nmero de elementos que tienen una caracterstica especifica, por ejemplo el nmero de personas a favor un producto particular. n = nmero de elementos en el muestra.

    En el caso de la distribucin Hipergeomtrica, a diferencia de la distribucin Binomial, los elementos se extraen simultneamente, o si es uno a uno, sin devolverlos antes de realizar la siguiente extraccin, de forma que un elemento no puede aparecer dos veces en una muestra. A esta manera de obtener la muestra se le llama muestreo sin reemplazo.

  • Medidas de tendencia central y de dispersin para la distribucin hipergeomtrica La distribucin hipergeomtrica al igual que otras distribuciones de probabilidades tiene un valor esperado o media () y una desviacin estndar (). Simblicamente, podemos representar la media de una distribucin hipergeomtrica como:

    La media aritmtica: =

    En la que: n = nmero de muestras. r = nmero de elementos de la muestra con ciertas caractersticas. N = tamao de la poblacin.

  • Podemos calcular la desviacin estndar como:

    = ()

    2(1)

    Ejemplo: Una tienda de artculos elctricos tiene 20 planchas, de las cuales 5 son amarillas. Si se extraen aleatoriamente y sin sustitucin 10 planchas Cul es la probabilidad de que dos de ellas sean amarillas?

    Solucin: En este caso se tiene una poblacin de 20 planchas (N = 20), de las cuales 5 son amarillas (r = 5) y se extrae una muestra de 10 planchas (n = 10). La variable aleatoria ser el nmero de planchas amarillas que hay en la muestra (entre las extradas), por lo que x = 2. Sustituyendo en el modelo de la distribucin Hipergeomtrica tenemos:

    =522051022010

    = 0,3483

  • La distribucin de probabilidad geomtrica En un experimento binomial se tiene una serie de eventos idnticos e independientes, y que cada uno origina un xito o un fracaso F, con p(E) = p y p(F) = 1- p = q. Si estamos interesados por el nmero x de pruebas hasta la observacin del primer xito, entonces x posee una distribucin de probabilidad geomtrica. Ntese que el nmero de pruebas podra seguir indefinidamente y que x es un ejemplo de variable aleatoria discreta que puede tomar un nmero infinito (pero contable) de valores. Las frmulas para la distribucin geomtrica son:

    = 1

    Donde, x = nmero de pruebas independientes hasta la ocurrencia del primer xito. p = probabilidad de xito en una sola prueba, q = 1 p.

  • Media =1

    Desviacin estndar =1

    2

    La distribucin de probabilidad geomtrica es un modelo para el intervalo de tiempo que un jugador (o inversionista) tiene que esperar hasta ganar. La distribucin de probabilidad geomtrica tambin proporciona un modelo discreto para el lapso, digamos el nmero x de minutos, antes de que un consumidor en una fila o lnea de espera (en un supermercado, servicio de reparaciones, hospital, etc.) reciba la atencin. Este modelo discreto para la distribucin de probabilidad de tiempo de espera x se basa en la suposicin de que la probabilidad de recibir el servicio durante cualquier minuto es idntica e independiente del resultado durante cualquier otro minuto y que x se mide en minutos enteros.

  • Ejemplo: Se lanza un dado hasta que aparece el nmero 6. Cul es la probabilidad de que el nmero de lanzamientos sean 3?

    Solucin: En este problema el xito es la aparicin del nmero 6 y la probabilidad de que salga el nmero 6 al lanzar un dado es 1/6, por lo que p = 1/6 y q = 5/6. Como nos interesa calcular la probabilidad de que el 6 aparezca en el tercer lanzamiento, entonces:

    = 3 =1

    6

    5

    6

    2

    = 0,1157

  • Distribuciones de Probabilidad

    Uniforme, discreta, de parmetro N X ~ UD(N)

    P(Xj) = 1/N j=1,2,,N

    Se utiliza en muestreo de poblaciones de N elementos, con muestras de tamao n n

  • Distribuciones de Probabilidad

    En una planilla de MINITAB se genera una columna con los primeros 30 nmeros naturales Calc>Random Data>Sample From Columns

    Muestra al azar

  • Distribuciones de Probabilidad

    Binomial de parmetros n y p X ~ Bin(n,p)

    Se repite n veces un experimento en forma independiente, X es el nmero de veces que ocurre un evento que tiene probabilidad p de ocurrencia en los n ensayos.

  • Distribuciones de Probabilidad

    Ejemplo En una interseccin Y, el 10% de los vehculos que transitan giran a la derecha. Si 20 vehculos se aproximan a la interseccin, hallar la probabilidad de que como mximo 3 vehculos giren a la derecha

  • Distribuciones de Probabilidad

    Distribucin de Poisson de parmetro X ~ P0 ()

    parmetro de intensidad media

    El nmero de eventos se obtiene dentro de un intervalo continuo de tiempo, rea o espacio. El nmero de eventos en cualquier intervalo dado es independiente del nmero en cualquier otro intervalo no traslapado de la misma longitud La probabilidad de observar un cierto nmero de eventos es igual en todos los intervalos de la misma longitud

  • Distribuciones de Probabilidad

    Ejemplo El nmero de accidentes por mes que ocurren en una determinada interseccin de una avenida especfica, es caracterizado por una distribucin de Poisson con tasa 1.62 accidentes por mes.

  • La distribucin de probabilidad normal El teorema del lmite central enuncia que las distribuciones muestrales de ciertas clases de estadsticos se aproximarn a la normalidad, a medida que el tamao de la muestra (n) se incrementa independientemente de la forma de la poblacin muestreada. Propiedades: 1. El rea comprendida por la curva es igual a 1, sin importar los valores de y 2. Se extiende para todos los valores de x entre - y 3. A causa de la simetra de la distribucin, la media, la moda y la mediana se encuentran en el centro.

  • Distribuciones de Probabilidad

    Distribucin Normal X~ N(, 2)

    Variable aleatoria X con valores en el intervalo (-, ) y con funcin de densidad

    Los parmetros y 2 son la media y la varianza respectivas de la distribucin

  • Distribucin Normal N(, 2)

    - +

  • Distribucin Normal N(, 2)

    Simtrica alrededor de la media Asimetra estandarizada (sesgo): cero Curtosis :cero Media, moda, mediana iguales

    - 2 + 2

  • Distribucin Normal N(, 2)

    + 3 - 3

  • P(X t)

    X ~ N(1200, 802)

    Distribucin Normal N(, 2)

  • Distribuciones de Probabilidad

    Ejemplo [Cont. Ejemplo] En un estudio de velocidad, se registraron velocidades de punto de 200 vehculos en km/h, los vehculos fueron escogidos al azar. Si se asume que estas velocidades son caracterizados por una distribucin Normal con media 34 km/h y desvo padrn de 4 km/h

    a. Determinar la probabilidad de que la velocidad sea mayor que

    40 km/h b. Obtener la velocidad para la cual el 68% de las velocidades

    registradas no supera dicha cantidad Velocidad.MTW

  • Distribuciones de Probabilidad

    Calc>Probability Distributions>Normal

  • Distribuciones de Probabilidad

    Calc>Probability Distributions>Normal

  • Distribuciones de Probabilidad

    Grficos de probabilidad (Probability plot) P- P

    Comparan una funcin de distribucin emprica acumulativa con una funcin de distribucin acumulativa terica de una variable. til para evaluar si un conjunto de datos sigue una distribucin especifica. Se grafican los percentiles de los datos versus los percentiles de una distribucin terica, de tal manera que los puntos debieran ajustarse aproximadamente a una lnea recta. Alejamiento de esta recta seala discrepancia con la distribucin terica.

  • Distribuciones de Probabilidad

    P83,3851 datos = 6,03023 P83,3851 terico = 5,72818

    Distribucin terica N(4,825; 0,9316)

  • Grficos de Probabilidad Normal

    Cmo saber si la distribucin de un conjunto de datos es normal o aproximadamente normal? Los grficos de probabilidad normal usan la distribucin de porcentaje acumulativo de os datos para dar una muestra visual de la forma probable de la distribucin de los datos.

  • Grficos de Probabilidad Normal

  • Distribuciones de Probabilidad

    Comparacin de la distribucin de la muestra con una distribucin normal Conjunto de n datos asociados a una medicin: X1, X2, ,Xn Se prueba la hiptesis H0 : La muestra sigue una distribucin normal Contra la hiptesis alternativa HA: La muestra no sigue una distribucin normal Anderson y Darling proponen un mtodo para probar la hiptesis H0

  • Distribuciones de Probabilidad

    A valores ms pequeos del estadstico de Anderson Darling mejor es el ajuste a la distribucin normal. Una medida cuantitativa para la calidad del ajuste de los datos a la distribucin normal la proporciona un valor probabilstico p (p-valor). Si p-valor es menor que 0,05 se rechaza la hiptesis nula. El mtodo de Anderson Darling tambin se utiliza para verificar otras distribuciones de probabilidades continuas.

  • Distribuciones de Probabilidad

    Tests de Normalidad

    Un test de Normalidad es un mtodo estadstico para determinar si la distribucin de una muestra tiene las caractersticas de una distribucin Normal. Cuatro formas de verificar en Minitab: Graph > Probability Plot Stat > Basic Statistics > Normality Test Stat > Basic Statistics > Graphical Summary Stat > Quality Tools > Individual Distribution dentification

  • Distribuciones de Probabilidad

    Velocidad.MTW

    Stat > Basic Statistics > Normality Test

  • Distribuciones de Probabilidad

  • Distribucin Lognormal

    La variable aleatoria X tiene una distribucin lognormal si la variable Y = ln X tiene una distribucin normal y : parmetro de forma (media de Y = Ln X) y : parmetro de localizacin (desviacin estndar de Y = Ln X)

  • Se utiliza cuando la distribucin de X tiene sesgo positivo. Esta distribucin sesgada puede generalmente estar bien representada por la distribucin lognormal de dos parmetros o de tres parmetros. Si X es una v. a. tal que Ln(X) tiene distribucin normal, entonces X tiene distribucin lognormal de dos parmetros. Si X es una v. a. tal que Ln(X+) tiene una distribucin normal, donde es constante, entonces X tiene distribucin lognormal de tres parmetros.

  • Distribuciones de Probabilidad

    efecto de la cte

    Distribucin de X

    Distribucin de Ln X

    Distribucin de Ln(X+)

  • Distribuciones de Probabilidad

    Fsico Quimico.MTW

    El test de Anderson-Darling se puede utilizar para verificar si un conjunto de datos no negativos sigue una distribucin lognormal. Stat > Quality Tools > Individual Distribution identification

  • Distribuciones de Probabilidad

  • Distribuciones de Probabilidad

  • Estimacin de parmetros Intervalos de confianza

  • Estimacin de Parmetros/Intervalos

    Poblacin

    La estadstica a menudo se describe como una disciplina cientfica relacionada con la coleccin, descripcin, anlisis e interpretacin de un conjunto de datos. Poblacin es el conjunto de todas las posibles observaciones de una caracterstica de inters. Dependiendo de la naturaleza del fenmeno bajo estudio, las poblaciones se pueden clasificar en poblacin finita o poblacin infinita.

  • Estimacin de Parmetros/Intervalos

    Cuando el conjunto de individuos u objetos tomados sobre un tiempo particular es finito, entonces el conjunto de mediciones u observaciones de una caracterstica comn es una poblacin finita. Dos opciones para estudiar una caracterstica particular de una poblacin finita: I. Desarrollar un censo o conteo exhaustivo de todos los elementos que

    comprenden la poblacin dada.

    II. Estudiar un subconjunto de la poblacin y del conocimiento que se obtenga de este subconjunto extraer algunas conclusiones sobre la poblacin.

    Generalmente se toma la segunda opcin, (problemas de costos, pruebas destructivas, etc.)

  • Estimacin de Parmetros/Intervalos

    Cualquier estudio estadstico de una poblacin finita a menudo se denomina estudio enumerativo. Cuando se desea estudiar el comportamiento de un proceso sobre el tiempo, entonces la nocin de poblacin finita ya no existe en este contexto. Cuando se estudian procesos, se estn considerando procesos en marcha que generan eventos pasados, presentes y futuros. Dada la dimensin del tiempo, los estudios de procesos estn referidos frecuentemente como estudios de series de tiempo.

  • Estimacin de Parmetros/Intervalos

    Es necesario pensar en poblaciones asociadas a procesos como poblaciones conceptuales. Una poblacin conceptual es la totalidad de las observaciones que pudieran ocurrir del desempeo de una determinada operacin en un modo particular. En un estudio enumerativo solamente existe una poblacin finita. En un estudio de serie de tiempo puede haber ms de una poblacin conceptual.

  • Estimacin de Parmetros/Intervalos

    Muestreo

    Un propsito importante para efectuar una investigacin es inferir o generalizar a partir de una muestra a una poblacin ms grande. Este proceso de inferencia se realiza mediante mtodos estadsticos basados en la probabilidad. Razones para muestrear: i. Las muestras pueden estudiarse con mayor rapidez que las poblaciones. ii. El estudio de una muestra es menos costoso que el de una poblacin entera. iii. En la mayora de las situaciones, el estudio de una poblacin entera es imposible. En ocasiones, el proceso del estudio destruye o agota el objeto que se est estudiando.

  • Estimacin de Parmetros/Intervalos

    iv. Con frecuencia, los resultados de una muestra son ms precisos que los que se basan en una poblacin. Adems, es posible usar procedimientos ms costosos que mejoren la exactitud si slo se van a utilizar en una muestra, puesto que se llevarn a cabo en un nmero menor de veces. v. Si las muestras se seleccionan adecuadamente, es posible utilizar mtodos de probabilidad para estimar el error en estadsticos resultantes. Es este aspecto del muestreo el que permite construir enunciados de probabilidad respecto de las observaciones en estudio. vi. Las muestras pueden ser seleccionadas para reducir la heterogeneidad. En general mayor tamao de muestra no siempre significa mejor estimacin de parmetros, por lo tanto, se debe planear el tamao de la muestra apropiado para el estudio antes de iniciar la investigacin.

  • Estimacin de Parmetros/Intervalos

    Mtodos de muestreo

    La mejor manera de asegurarse que una muestra conducir a inferencias confiables y vlidas, es usar muestras de probabilidad en donde se conozca la probabilidad de cada elemento de la poblacin para ser incluido en la muestra. El mtodo de muestreo ms importante es el muestreo aleatorio simple. Aunque dependiendo del problema y con el objetivo de reducir los costos o aumentar la precisin, se pueden considerar otros tipos de muestreo, tales como, el muestreo sistemtico, muestreo estratificado, muestreo por conglomerados y muestreos no probabilsticos.

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos Stat> Basic Statistics> Graphical Summary

    Velocidad.MTW

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

    Tamao de Muestra para Estimar la Media en Poblaciones Finitas

    El tamao de muestra necesario para estimar la media poblacional, con un error de estimacin no superior a d0 y un nivel de confianza de 100(1-)%, esta dado por

  • Estimacin de Parmetros/Intervalos

    Cul debe ser el tamao de muestra para estimar la velocidad media con una confianza del 95% de confianza y un error de estimacin no superior a d0=2?

  • Estimacin de Parmetros/Intervalos Stat> Power and Sample Size> 1 Sample-Z

    Velocidad.MTW

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos Stat> Basic Statistics> Graphical Summary

    Velocidad.MTW

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

    Un estudio piloto sobre condicin de pavimentos

    utiliza el PCI como medida de deterioro, en 15

    cuadrantes elegidos al azar proporcion una

    desviacin estndar de 12.3

  • Estimacin de Parmetros/Intervalos

    Cuntos cuadrantes deberan ser elegidos para estimar el PCI

    promedio, con un error de estimacin no superior a 2.5 y una

    confianza del 95%?

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

    Stat> Basic Statistics> 1 Proportion

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

    Se requieren 1752 ordenes de trabajo

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos

    Ejemplo El archivo Velocidad.MTW contiene velocidades registradas de

    una muestra de 200 vehculos en el ao 2008 y en una muestra

    de 153 vehculos en el ao 2009.

    2008 : Velocidad de vehculo en el 2008 2009 : Velocidad de vehculo en el 2009

  • Estimacin de Parmetros/Intervalos

    Con un 95% de confianza se tiene que

    18.085 2008 - 2009 19.668

    Qu se puede concluir?

  • Estimacin de Parmetros/Intervalos

  • Estimacin de Parmetros/Intervalos Ejemplo

    En un estudio sobre tiempos de uso de paraderos se encontr que para una muestra de 84 vehculos de un tipo especfico en la direccin N-S, 25 de ellos sobre pasaban el minuto. Mientras que en una muestra de 102 vehculos en la direccin S-N, 75 sobre pasaban el minuto. p1 : Proporcin de vehculos que sobre pasan el minuto, N-S p2 : Proporcin de vehculos que sobre pasan el minuto, S-N

  • Estimacin de Parmetros/Intervalos

    Con un 95% de confianza se tiene que

    -0.5676 p1 - p1 -0.3077

    Qu se puede concluir?

  • TEST DE HIPTESIS

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis

  • Test de Hiptesis