grado en ingeniería asignatura: estadística tema: 2. tema: 2 ......inferencia. Índice...

107
Grado en Ingeniería Grado en Ingeniería Grado en Ingeniería Grado en Ingeniería Asignatura: Estadística Asignatura: Estadística Tema: 2. Tema: 2. Probabilidad e inferencia Probabilidad e inferencia estadística estadística Asignatura: Estadística Asignatura: Estadística Tema: 2. Tema: 2. Probabilidad e inferencia Probabilidad e inferencia estadística estadística

Upload: others

Post on 06-Feb-2021

22 views

Category:

Documents


0 download

TRANSCRIPT

  • Grado en Ingeniería Grado en Ingeniería Grado en Ingeniería Grado en Ingeniería

    Asignatura: EstadísticaAsignatura: Estadística

    Tema: 2. Tema: 2. Probabilidad e inferencia Probabilidad e inferencia estadísticaestadística

    Asignatura: EstadísticaAsignatura: Estadística

    Tema: 2. Tema: 2. Probabilidad e inferencia Probabilidad e inferencia estadísticaestadística

  • Inferencia. ÍndiceInferencia. ÍndiceInferencia. ÍndiceInferencia. Índice

    Introducción Teoría de la probabilidad

    Experimentos aleatoriosProbabilidadVariables aleatorias

    Discretas. Distribución BinomialContinuas. Distribución Normal

    Inferencia estadística:

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 2

    Inferencia estadística:Ajuste a modelo de probabilidad

    Identificación de un modelo y estimación de parámetrosDiagnosisUtilización del modelo: cálculo de probabilidades

    Intervalos de confianza y contrastes de hipótesis:Estimadores y su distribuciónIntervalos de confianzaContraste de hipótesis

  • Inferencia estadísticaInferencia estadísticaInferencia estadísticaInferencia estadística

    Población

    Muestra

    Inferencia estadística: Proceso

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 3

    Inferencia estadística: Proceso mediante el cual se utiliza la información de la muestra para extraer conclusiones de la población

  • Ejemplo 1: ¿proporción poblacional?Ejemplo 1: ¿proporción poblacional?Ejemplo 1: ¿proporción poblacional?Ejemplo 1: ¿proporción poblacional?

    Supongamos que somos fabricantes de juguetes para niños. Para la fabricación de nuestra última novedad, dependemos de un proveedor que nos suministra los componentes electrónicos necesarios. La proporción de componentes La proporción de componentes La proporción de componentes La proporción de componentes defectuosos que consideramos admisible es 0.001. defectuosos que consideramos admisible es 0.001. defectuosos que consideramos admisible es 0.001. defectuosos que consideramos admisible es 0.001. Recibimos un lote de 50000 componentes, como no tenemos recursos para inspeccionarlos todos, se decide realizar una inspección de 500 componentes y en función de los resultados de esta inspección decidiremos aceptar o rechazar todo el lote.

    Frequency Table for Circuitos_Defec

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 4

    Recibimos el lote Inspeccionamos una muestra información de la muestra

    En la muestra observamos que la proporción de defectuosos es de 0.002. ¿con En la muestra observamos que la proporción de defectuosos es de 0.002. ¿con En la muestra observamos que la proporción de defectuosos es de 0.002. ¿con En la muestra observamos que la proporción de defectuosos es de 0.002. ¿con la información que nos suministra la muestra podemos rechazar el lote?.la información que nos suministra la muestra podemos rechazar el lote?.la información que nos suministra la muestra podemos rechazar el lote?.la información que nos suministra la muestra podemos rechazar el lote?.

    ------------------------------------------------------------------------ Relative Cumulative Cum. Rel.Class Value Frequency Frequency Frequency Frequency------------------------------------------------------------------------ 1 0 499 0.9980 499 0.9980 2 1 1 0.0020 500 1.0000------------------------------------------------------------------------

  • Ejemplo 2: ¿media y varianza poblacional?Ejemplo 2: ¿media y varianza poblacional?Ejemplo 2: ¿media y varianza poblacional?Ejemplo 2: ¿media y varianza poblacional?

    Supongamos que somos fabricantes de láminas de carbono. Una característica importante que debemos controlar es la resistencia a la rotura. El responsable de la planta ha establecido un valor objetivo, en función de lo que demanda el mercado: la resistencia media de todas las láminas que se fabriquen debe ser : la resistencia media de todas las láminas que se fabriquen debe ser : la resistencia media de todas las láminas que se fabriquen debe ser : la resistencia media de todas las láminas que se fabriquen debe ser igual o superior a 2800 N/mmigual o superior a 2800 N/mmigual o superior a 2800 N/mmigual o superior a 2800 N/mm2222 y la desviación típica no superior a 20 N/mm2.y la desviación típica no superior a 20 N/mm2.y la desviación típica no superior a 20 N/mm2.y la desviación típica no superior a 20 N/mm2.Para verificar si se cumple este criterio, y dado que no se pueden inspeccionar todas las láminas porque la prueba para determinar su resistencia supone la destrucción de la misma, se decide realizar la prueba a 80 laminas.

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 5

    En la muestra observamos que la resistencia media es de 2788.52 N/mm2, con una desviación de. 21.28 N/mm2 ¿con la información que nos suministra la ¿con la información que nos suministra la ¿con la información que nos suministra la ¿con la información que nos suministra la muestra podemos decir que el proceso de fabricación no cumple con el criterio muestra podemos decir que el proceso de fabricación no cumple con el criterio muestra podemos decir que el proceso de fabricación no cumple con el criterio muestra podemos decir que el proceso de fabricación no cumple con el criterio de calidad establecido por el responsable?.de calidad establecido por el responsable?.de calidad establecido por el responsable?.de calidad establecido por el responsable?.

    Summary Statistics for Resistencia

    Count = 80Average = 2788.52Median = 2788.78Standard deviation = 21.2788

    Histogram for Resistencia

    Resistencia

    freq

    uen

    cy

    2700 2730 2760 2790 2820 28500

    10

    20

    30

    40

  • Ejemplo 3: Comparación de poblaciones Ejemplo 3: Comparación de poblaciones Ejemplo 3: Comparación de poblaciones Ejemplo 3: Comparación de poblaciones

    Somos responsables de elegir donde se situará un nuevo parque eólico. Tenemos dos posibles localizaciones, dentro del mismo municipio. Para tomar nuestra decisión, recurrimos a la estadística.Se observa la velocidad del viento durante 730 horas de forma simultánea en dos localizaciones alternativas (variables Parque1 y Parque2). Se quiere utilizar estos datos para decidir en qué localización instalar un parque de producción de energía eólica.

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 6

    localización instalar un parque de producción de energía eólica.

    A la vista de los datos, ¿qué localización es más aconsejable?

    Summary Statistics

    Veloc_Parque1 Veloc_Parque2 ------------------------------------------------------------Count 730 730 Average 5.80179 5.63285 Median 5.31 5.045 Standard deviation 3.24126 3.25496 Minimum 0.27 0.14 Maximum 16.28 17.82 Lower quartile 3.26 3.24 Upper quartile 7.96 7.44 Skewness 0.649086 0.952801 Kurtosis -0.0911749 0.753856 Coeff. of variation 55.8664% 57.7853% ------------------------------------------------------------

    Box-and-Whisker Plot

    0 3 6 9 12 15 18

    Veloc_Parque1

    Veloc_Parque2

    Las medias muestrales son distintas.¿Son distintas la medias poblacionales?

  • Inferencia. ÍndiceInferencia. ÍndiceInferencia. ÍndiceInferencia. Índice

    Introducción Teoría de la probabilidad

    Experimentos aleatoriosProbabilidadVariables aleatorias

    Discretas. Distribución BinomialContinuas. Distribución Normal

    Inferencia estadística:

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 7

    Inferencia estadística:Ajuste a modelo de probabilidad

    Identificación de un modelo y estimación de parámetrosDiagnosisUtilización del modelo: cálculo de probabilidades

    Intervalos de confianza y contrastes de hipótesis:Estimadores y su distribuciónIntervalos de confianzaContraste de hipótesis

  • La probabilidad es el arma que vamos a utilizar para poder generalizar nuestras

    conclusiones a toda la población de referencia

    Teoría de la probabilidadTeoría de la probabilidadTeoría de la probabilidadTeoría de la probabilidad

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 8

    referencia

  • Teoría de la probabilidad. IntroducciónTeoría de la probabilidad. IntroducciónTeoría de la probabilidad. IntroducciónTeoría de la probabilidad. Introducción

    ExperimentoExperimentoExperimentoExperimento: Proceso de observar una característica. Experimento aleatorio:Experimento aleatorio:Experimento aleatorio:Experimento aleatorio: Experimento cuyo resultado es inciertoinciertoinciertoinciertoEjemplos:Ejemplos:Ejemplos:Ejemplos:

    Lanzar una moneda 3 veces y observar el numero de carasMedir el peso de un estudianteMedir la corriente en un cable de cobreMedir la temperatura de un fluido en un tanque (proceso industrial)

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 9

    Medir la temperatura de un fluido en un tanque (proceso industrial)Medir el caudal de un fluido que circula por una tuberíaEl numero mensual de reclamaciones de una compañíaEl tiempo de atención al cliente de una sucursal bancariaEl numero de articulo defectuosos de un lote de materia prima

  • Teoría de la probabilidad. IntroducciónTeoría de la probabilidad. IntroducciónTeoría de la probabilidad. IntroducciónTeoría de la probabilidad. Introducción

    Ejemplo: Nº de “seis” en el lanzamiento de tres dadosSi repetimos el experimento en distintos momentos obtenemos distintos resultados, además el resultado es inciertoresultado es inciertoresultado es inciertoresultado es incierto¿Por qué?¿Por qué?¿Por qué?¿Por qué?

    Movimiento de la manoFactores ambientales….

    FactoresFactoresFactoresFactoresno controladosno controladosno controladosno controlados

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 10

    ….

    El experimento esta sujeto a una componente aleatoriacomponente aleatoriacomponente aleatoriacomponente aleatoria

  • Teoría de la probabilidad. IntroducciónTeoría de la probabilidad. IntroducciónTeoría de la probabilidad. IntroducciónTeoría de la probabilidad. Introducción

    Todos tenemos la idea intuitiva de lo que es la probabilidad. Decimos de forma habitual cosas como:

    La probabilidad de que salga un seis al lanzar un dado es 1 entre 6Si realizo una apuesta simple la probabilidad de que me toque la primitiva es muy pequeña (1 entre 14 millones)1 entre 14 millones)1 entre 14 millones)1 entre 14 millones)

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 11

    muy pequeña (1 entre 14 millones)1 entre 14 millones)1 entre 14 millones)1 entre 14 millones)

    1P(A)0 ≤≤

    La probabilidad se define sobre un suceso y trata de cuantificar su

    incertidumbre

  • Inferencia. ÍndiceInferencia. ÍndiceInferencia. ÍndiceInferencia. Índice

    Introducción Teoría de la probabilidad

    Experimentos aleatoriosProbabilidadVariables aleatorias

    Discretas. Distribución BinomialContinuas. Distribución Normal

    Inferencia estadística:

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 12

    Inferencia estadística:Ajuste a modelo de probabilidad

    Identificación de un modelo y estimación de parámetrosDiagnosisUtilización del modelo: cálculo de probabilidades

    Intervalos de confianza y contrastes de hipótesis:Estimadores y su distribuciónIntervalos de confianzaContraste de hipótesis

  • Fenómenos y experimentos aleatoriosFenómenos y experimentos aleatoriosFenómenos y experimentos aleatoriosFenómenos y experimentos aleatorios

    Un experimento es determinista cuando existe un conjunto de circunstancias que, antes de su ejecución, determinan completamente su resultado.Un experimento es aleatorio si no podemos predecir su resultado de antemano:

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 13

    antemano:Se conocen previamente y con exactitud los posibles resultados del experimento.Es imposible saber su resultado antes de su realización.Se puede repetir indefinidamente, en las mismas condiciones iniciales, obteniendo resultados distintos.

  • SucesosSucesosSucesosSucesos

    El espacio muestral es el conjunto de todos los posibles resultados del experimento aleatorio, lo denotamos por E.

    Ejemplo: Experimento, lanzar dado, E={1,2,3,4,5,6}Un suceso es cualquier subconjunto del espacio muestral.

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 14

    muestral.Un suceso elemental un elemento del espacio muestral.

    Ejemplo: (lanzar dado), sale un seis, A={6}Un suceso compuesto es un conjunto de sucesos elmentales.

    Ejemplo: (lanzar dado), sale un número par B={2,4,6}

  • SucesosSucesosSucesosSucesos

    El suceso seguro es el que siempre ocurre al realizar el experimento, E.

    Ejemplo: (lanzar dado) E={1,2,3,4,5,6}

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 15

    El suceso imposible es el que nunca ocurre como resultado del experimento ∅.

    Ejemplo: (lanzar dado) sale un número negativo

  • Operaciones con sucesos (conjuntos)Operaciones con sucesos (conjuntos)Operaciones con sucesos (conjuntos)Operaciones con sucesos (conjuntos)

    Operación unión. Dados dos sucesos A y B, el suceso A∪B (alternativamente A+B) ocurre cuando ocurre A u ocurre B u ocurren ambos simultáneamente.

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 16

    A={1,2} ; B={2,3,4}

    A∪B ={1,2,3,4}

  • Operaciones con sucesos (conjuntos)Operaciones con sucesos (conjuntos)Operaciones con sucesos (conjuntos)Operaciones con sucesos (conjuntos)

    Operación intersección. Dados dos sucesos A y B, el suceso A∩B (alt. A⋅B) ocurre cuando ocurren simultáneamente A y B.

    A={1,2} ; B={2,3,4}

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 17

    A={1,2} ; B={2,3,4}

    A∩B ={2}

  • Operaciones con sucesos (conjuntos)Operaciones con sucesos (conjuntos)Operaciones con sucesos (conjuntos)Operaciones con sucesos (conjuntos)Suceso contrario (o complementario). Dado un suceso A, su contrario Ac (alt. A ) ocurre cuando A no ocurre.

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 18

    E={1,2,3,4,5,6} ; A={1,2}Ac={3,4,5,6}

  • Inferencia. ÍndiceInferencia. ÍndiceInferencia. ÍndiceInferencia. Índice

    Introducción Teoría de la probabilidad

    Experimentos aleatoriosProbabilidadVariables aleatorias

    Discretas. Distribución BinomialContinuas. Distribución Normal

    Inferencia estadística:

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 19

    Inferencia estadística:Ajuste a modelo de probabilidad

    Identificación de un modelo y estimación de parámetrosDiagnosisUtilización del modelo: cálculo de probabilidades

    Intervalos de confianza y contrastes de hipótesis:Estimadores y su distribuciónIntervalos de confianzaContraste de hipótesis

  • Definición de probabilidadDefinición de probabilidadDefinición de probabilidadDefinición de probabilidad

    Una probabilidad es una función P que asigna a cada suceso asociado al experimento un valor real tal que 1. 0 ≤ P(A) ≤ 1 ; 2. P(E ) = 1 ;3. Si A y B son mutuamente excluyentes (es decir A ∩ B = ∅)

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 20

    3. Si A y B son mutuamente excluyentes (es decir A ∩ B = ∅) P(Α ∪ Β)= P(A)+P(B).

    De las tres propiedades anteriores, deducimos que cualquier probabilidad satisface:1. Para cualesquiera A y B, P(A ∪ B) = P(A)+P(B)−P(A ∩ B )2. P(Ac) = 1−P(A)

  • Consideración finalConsideración finalConsideración finalConsideración final

    Leyes de los Grandes Números. Si repetimos muchas veces un experimento, la frecuencia relativa de un 0.

    60.

    8

    frecu

    enci

    a re

    lativ

    a ca

    ra

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 21

    frecuencia relativa de un suceso A cualquiera tiende a estabilizarse en torno a un valor (PROBABILIDAD DEL SUCESO). 0 200 400 600 800 1000

    0.0

    0.2

    0.4

    numero lanzamientos

    frecu

    enci

    a re

    lativ

    a ca

    ra

  • Descripción breve del temaDescripción breve del temaDescripción breve del temaDescripción breve del tema

    1. Introducción2. Fenómenos y experimentos aleatorios

    Sucesos y operaciones con sucesos (conjuntos)3. Concepto de probabilidad y propiedades

    Definición de probabilidadPrimeras propiedades de la probabilidad y alguna consideración

    4. Asignación de probabilidades en la práctica

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 22

    consideración4. Asignación de probabilidades en la práctica

    Equiprobabilidad, regla de Laplace5. Probabilidad condicionada

    Concepto de probabilidad condicionadaIndependencia de sucesos

    6. Teorema de BayesTeoremas de la probabilidad total y de Bayes

  • Equiprobabilidad, regla de LaplaceEquiprobabilidad, regla de LaplaceEquiprobabilidad, regla de LaplaceEquiprobabilidad, regla de Laplace

    Si un experimento tiene un número finito de resultados posibles y no hay razón que privilegie un resultado frente a otro, para cualquier A

    a favorables casos de número A =

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 23

    posibles casos de número

    a favorables casos de número)(

    A AP =

  • La probabilidad condicionadaLa probabilidad condicionadaLa probabilidad condicionadaLa probabilidad condicionada

    Dados dos sucesos A y B con P(B)>0, definimos la probabilidad de A condicionada a B como la probabilidad de que ocurra A sabiendo que ha ocurrido B,

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 24

    .

    P(B)

    B)P(AP(A|B)

    ∩= Α Α∩ΒΒ

  • Independencia entre sucesosIndependencia entre sucesosIndependencia entre sucesosIndependencia entre sucesos

    Dos sucesos A y B son independientes si

    P(A|B)=P(A)

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 25

    P(A|B)=P(A)

    Es decir que ocurra B es irrelevante para que ocurra A

  • Teorema de la probabilidad totalTeorema de la probabilidad totalTeorema de la probabilidad totalTeorema de la probabilidad total

    Dados A1, A2,…,An mutuamente excluyentes conA1 ∪ A2 ∪ … ∪ An =E, entonces la probabilidad de un sucesoB cualquiera viene dada por

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 26

    B|APAP BPn

    iii∑

    =

    =1

    )()()(

    Α1 Α2 ...

    Β

    Α3 Αn

  • Teorema de la probabilidad total Teorema de la probabilidad total -- EjemploEjemploTeorema de la probabilidad total Teorema de la probabilidad total -- EjemploEjemplo

    Supongamos que el mismo artículo es fabricado por dos máquinas: A y B. La probabilidad de que el articulo sea defectuoso varía según la máquina de que provenga, así el 2.2% de los artículos producidos por A son defectuosos, mientras que en el caso de B, el 1.4% de los artículos son defectuosos.

    Sabiendo que el 36% de los artículos producidos en una fábrica provienen de la máquina A y el resto de B, calcula la probabilidad de que un artículo de dicha fábrica sea defectuoso.

    B

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 27

    01688.064001403600220)()()()()( =×+×=+= ....BPD|BPAPD|APDP

    de dicha fábrica sea defectuoso.

    defectuoso

    Bpor producido

    Apor producido

    ≡≡≡

    D

    B

    A

    014.0)|(

    022.0)|(

    64.0)(

    36.0)(

    ==

    ==

    BDP

    ADP

    BP

    AP

  • Teorema de Teorema de BayesBayesTeorema de Teorema de BayesBayes

    Dados A1, A2,…,An mutuamente excluyentes conA1 ∪ A2 ∪ … ∪ An =E, y dado un suceso B cualquiera conP(B)>0, entonces se cumple

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 28

    B|APAP

    B|APAP

    BP

    BAP|BAP

    jjnj

    iiii )()(

    )()(

    )(

    )()(

    1=∑=∩=

  • Teorema de Teorema de BayesBayes –– Ejemplo (continuación)Ejemplo (continuación)Teorema de Teorema de BayesBayes –– Ejemplo (continuación)Ejemplo (continuación)

    Un artículo procedente de la fábrica con las máquinas A y B es defectuoso. Calcula la probabilidad de que haya sido producido por la máquina A

    )()|()()|(

    )()|(

    )(

    )()|(

    ×+××=∩=

    BPBDPAPADP

    APADP

    DP

    DAPDAP

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 29

    4692.064001403600220

    3600220)()|()()|()(

    =×+×

    ×=

    ×+×

    ....

    ..BPBDPAPADPDP

  • Inferencia. ÍndiceInferencia. ÍndiceInferencia. ÍndiceInferencia. Índice

    Introducción Teoría de la probabilidad

    Experimentos aleatoriosProbabilidadVariables aleatorias

    Discretas. Distribución BinomialContinuas. Distribución Normal

    Inferencia estadística:

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 30

    Inferencia estadística:Ajuste a modelo de probabilidad

    Identificación de un modelo y estimación de parámetrosDiagnosisUtilización del modelo: cálculo de probabilidades

    Intervalos de confianza y contrastes de hipótesis:Estimadores y su distribuciónIntervalos de confianzaContraste de hipótesis

  • Una variable aleatoria es una variable cuyo valor numérico está determinado por el resultado del experimento aleatorio

    Variables aleatoriasVariables aleatoriasVariables aleatoriasVariables aleatorias

    Ε S2

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 31

    S1

    a b

    X(s1)=a

    X(s2)=b

    X

  • Variables aleatoriasVariables aleatoriasVariables aleatoriasVariables aleatorias

    Lanzamos 2 veces una moneda. Podemos definir la variable aleatoria

    X = número de caras

    ΕCC

    XC

    CX

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 32

    XX

    0 2

    X(xx)=a

    X(cc)=2

    T

    XC

    1

    X(cx)=1

    X(xc)=1

    Definimos RX, rango de X, como el conjunto de posibles valores de X

  • Variables aleatorias. EjemplosVariables aleatorias. EjemplosVariables aleatorias. EjemplosVariables aleatorias. Ejemplos

    Nº de artículos defectuosos en un lote de materia primaNº de clientes atendidos al díaNº de BIT transmitidos correctamentePeso de las piezas fabricadasTemperatura del fluidoResistencia del material

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 33

    Resistencia del materialCorriente que circula por un cable…

  • Variables aleatorias. ClasificaciónVariables aleatorias. ClasificaciónVariables aleatorias. ClasificaciónVariables aleatorias. Clasificación

    Atendiendo al rango, las variables aleatorias se clasifican como:DiscretasDiscretasDiscretasDiscretas: El rango es finito o infinito numerable

    Nº de artículos defectuosos en un lote de materia primaNº de clientes atendidos al díaNº de BIT transmitidos correctamente

    Continuas:Continuas:Continuas:Continuas: El rango es un intervalo de la recta realPeso de las piezas fabricadasTemperatura del fluido

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 34

    Temperatura del fluidoResistencia del materialCorriente que circula por un cable

    Para definir perfectamente una variable aleatoria se necesita conocer:

    El conjunto de valores que toma la variable, el rangoel rangoel rangoel rangoCon que probabilidad toma esos valores, la distribuciónla distribuciónla distribuciónla distribución.

  • Variables aleatorias DiscretasVariables aleatorias DiscretasVariables aleatorias DiscretasVariables aleatorias Discretas

    Definimos la función de probabilidadfunción de probabilidadfunción de probabilidadfunción de probabilidad, p(x)=P(X=x). A cada valor de la variable le asocia su probabilidad.

    E = Lanzar 2 veces una moneda X = Número de caras

    0,5

    0,6

    C C X P

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 35

    0

    0,1

    0,2

    0,3

    0,4

    0,5

    0 1 2

    C

    C

    X

    X

    C

    X

    X

    C

    X PX 0 ¼=0.25

    1 2/4=0.5

    2 ¼=0.25

  • Variables aleatorias DiscretasVariables aleatorias DiscretasVariables aleatorias DiscretasVariables aleatorias Discretas

    Definimos la función de distribuciónfunción de distribuciónfunción de distribuciónfunción de distribución, F(x)=P(X ≤ x). A cada valor le asocia la probabilidad de que la variable sea menor o igual a él.

    Medidas característicasMedidas característicasMedidas característicasMedidas características

    Media: ∑== )(][ ii xpxXEµ

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 36

    Media:

    Varianza:

    ∑== )(][ ii xpxXEµ

    2222 ][][])[( XEXEXE −=−= µσ

    ∑= )(][ donde 22 ii xpxXE

  • Variables aleatorias continuasVariables aleatorias continuasVariables aleatorias continuasVariables aleatorias continuas

    Desafortunadamente, el método para describir la distribución de las v.a. discretas es inadecuado para describir una v.a. continuas, no se puede asociar a cada valor de la v.a. su probabilidad.Buscamos una función que nos permita calcular probabilidadesCandidatos a funciones de densidad,… muchos:

    0,4

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 37

    x

    den

    sity

    -5 -3 -1 1 3 50

    0,1

    0,2

    0,3

  • Variables aleatorias continuasVariables aleatorias continuasVariables aleatorias continuasVariables aleatorias continuas

    La función de densidad función de densidad función de densidad función de densidad describe la distribución de probabilidad de una variable continua

    ∫ =

    ≥∞

    ∞−b

    xxf

    xf

    1d)(

    0)(

    ∫=

  • Variables aleatorias continuasVariables aleatorias continuasVariables aleatorias continuasVariables aleatorias continuas

    Ejemplo:Ejemplo:Ejemplo:Ejemplo: Sea X el tiempo de funcionamiento de una maquina en un año (en horas x100)

  • Variables aleatorias continuasVariables aleatorias continuasVariables aleatorias continuasVariables aleatorias continuas

    Definimos la función de distribuciónfunción de distribuciónfunción de distribuciónfunción de distribución, F(x)=P(X ≤ x). A cada valor le asocia la probabilidad de que la variable sea menor o igual a él.

    Medidas característicasMedidas característicasMedidas característicasMedidas características

    Media: xxxfXE d)(][ ∫+∞

    ==µ

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 40

    Media:

    Varianza:

    xxxfXE d)(][-∫∞

    ==µ

    2222 ][][])[( XEXEXE −=−= µσ

    xxfxXE d)(][ donde-

    22∫

    +∞

    =

  • Variables aleatorias continuasVariables aleatorias continuasVariables aleatorias continuasVariables aleatorias continuas

    Observando conjuntos de datos observamos un patrón, un modelo que se repite con mucha frecuencia.

    Histogram for altura

    150 160 170 180 190 2000

    10

    20

    30

    40

    fre

    que

    ncy

    Histogram for Matematicas

    Matematicas

    fre

    que

    ncy

    5.8 6.3 6.8 7.3 7.8 8.3 8.80

    5

    10

    15

    20

    25

    30

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 41

    150 160 170 180 190 200

    altura Matematicas

    Altura alumnos Nota matemáticas

    Resistencia de láminas fabricadas Peso de piezas

    Histogram for PESO

    PESO

    fre

    que

    ncy

    98 99 100 101 1020

    10

    20

    30

    40

    Histogram for Resistencia

    Resistencia

    fre

    que

    ncy

    2700 2730 2760 2790 2820 28500

    10

    20

    30

    40

  • Modelos de distribución de probabilidad Modelos de distribución de probabilidad Modelos de distribución de probabilidad Modelos de distribución de probabilidad

    Cuando se estudian las variable aleatorias:Definir en cada problema los valores y las probabilidades pueden ser muy complejo.

    Ejemplo: Niños y niñas en familias de cuatro hijosEjemplo: Altura de individuos

    Lo simplificamos mediante distribuciones de probabilidad “conocidas”:

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 42

    “conocidas”:– Variables discretas: Distribución Binomial,…., – Variables continuas: Distribución Normal

    Mean10725520

    Exponential Distribution

    x

    den

    sity

    0 30 60 90 120 1500

    0,04

    0,08

    0,12

    0,16

    0,2Mean,Std. dev.

    0,10,1,50,21,11,2

    Normal Distribution

    x

    den

    sity

    -10 -6 -2 2 6 10 140

    0,1

    0,2

    0,3

    0,4Event prob.,Trials0,1,100,2,100,5,10

    Binomial Distribution

    x

    prob

    abili

    ty

    0 2 4 6 8 100

    0,1

    0,2

    0,3

    0,4

  • Proceso de Proceso de BernoulliBernoulliProceso de Proceso de BernoulliBernoulli

    Consideremos un experimento en el que se van realizando pruebas con las siguientes características:Cada prueba tiene dos posibles resultados

    Aceptable-defectuoso, niño-niña,…La probabilidad de éxito en cada prueba es constanteLas pruebas son independientes.

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 43

    Las pruebas son independientes.

    Ε Ε F E F Ε Ε

  • Proceso de Proceso de BernoulliBernoulliProceso de Proceso de BernoulliBernoulli

    Ejemplos:Ejemplos:Ejemplos:Ejemplos:Lanzamiento de una moneda:

    Posible resultado: Cara ó cruzProbabilidades contantes: P(Cara)=0.5; P(Cruz)=0.5Observaciones independiente

    Producción de piezas:Posible resultado: Defectuosa o Aceptable.Probabilidades fijas. P(Defectuosa)=0.01 ; P (Aceptable)=0.99

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 44

    Probabilidades fijas. P(Defectuosa)=0.01 ; P (Aceptable)=0.99Observaciones independientes (el observar si una pieza es defectuosa o aceptable, no me dice nada de si otra pieza es defectuosa o no)

    Sexo recién nacidos:Posible resultado: Niño ó Niña.Probabilidades fijas. P(Niño)=0.5 ; P (Niña)=0.5Observaciones independientes (El saber el sexo del último recién nacido en un hospital, no da información del sexo del próximo)

  • Proceso de Proceso de BernoulliBernoulli. Distribución . Distribución BinomialBinomialProceso de Proceso de BernoulliBernoulli. Distribución . Distribución BinomialBinomialEn un proceso de BernoulliTomamos una muestra de tamaño n, y contamos el numero de éxitos

    (por ejemplo, numero de defectuosos en 50 piezas)La distribución Binomial nos da la probabilidad de obtener un

    numero de éxitos (por ejemplo, nos da la probabilidad de obtener 4 defectos en 50 piezas

    X~B(n,p)

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 45

    Función de probabilidad Medidas características

    X~B(n,p)

    knk ppk

    nkXP −−

    == )1()( )1(2 pnp

    np

    −==

    σµ

  • Proceso de Proceso de BernoulliBernoulli. Distribución . Distribución BinomialBinomialProceso de Proceso de BernoulliBernoulli. Distribución . Distribución BinomialBinomial

    Distribución binomialDistribución binomialDistribución binomialDistribución binomial---- Función deFunción deFunción deFunción de probabilidadprobabilidadprobabilidadprobabilidad

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 46

  • Proceso de Proceso de BernoulliBernoulli. Distribución . Distribución BinomialBinomialProceso de Proceso de BernoulliBernoulli. Distribución . Distribución BinomialBinomial

    Ejemplo 1: Un aparato electrónico contiene 40 circuitos integrados. La probabilidad de que un circuito sea defectuoso es 0.01 y los circuitos son independientes. El aparato funciona solo si no hay ningún circuito defectuoso. ¿Cuál es la probabilidad de que el aparato funcione?

    Sea X= Número de circuitos defectuosos en los 40 de un aparatoLa probabilidad solicitada es P(X=0)¿Qué distribución sigue X?

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 47

    ¿Qué distribución sigue X?Se observan 40 pruebas de Bernoulli:

    Cada prueba, observar un circuito, tiene dos posibles resultados; funciona, no funcionaLa probabilidad de que un circuito funcione es constante, 0.01Los circuitos son independientes

    El número de defectuosos en 40 pruebas es una Binomial (40, 0.01)

    X∼B(40,0.01)

    400 )01.01(01.00

    40)0( −×

    ==XP

  • Ejemplo 1: Un aparato electrónico contiene 40 circuitos integrados. La probabilidad de que un circuito sea defectuoso es 0.01 y los circuitos son independientes. El aparato funciona solo si no hay ningún circuito defectuoso. ¿Cuál es la probabilidad de que el aparato funcione?

    Cumulative Distribution-----------------------

    Distribution: Binomial

    Proceso de Proceso de BernoulliBernoulli. Distribución . Distribución BinomialBinomialProceso de Proceso de BernoulliBernoulli. Distribución . Distribución BinomialBinomial

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 48

    Distribution: Binomial

    Lower Tail Area ()Variable Dist. 1 Dist. 2 Dist. 3 Dist. 4 Dist. 50 0.331028

  • Proceso de Proceso de BernoulliBernoulli. Distribución . Distribución BinomialBinomialProceso de Proceso de BernoulliBernoulli. Distribución . Distribución BinomialBinomial

    Ejemplo 2: Supongamos que recibimos un lote con muchas piezas y no tenemos recursos para inspeccionarlas todas. Para decidir si aceptamos el lote o lo rechazamos seleccionamos una muestra de 20 unidades y en función de las piezas defectuosas en la muestra rechazamos o aceptamos todo el lote.La regla de decisión es: aceptamos el lote si en la muestra hay como máximo 2 unidades defectuosas.

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 49

    como máximo 2 unidades defectuosas.

    Si la proporción de defectos en el lote fuera 0.05, ¿Cuál sería la probabilidad de calcular la probabilidad de rechazar el lote?

    Si la proporción de defectos en el lote fuera 0.2, ¿Cuál sería la probabilidad de calcular la probabilidad de rechazar el lote?

  • Proceso de Proceso de BernoulliBernoulli. Distribución . Distribución BinomialBinomialProceso de Proceso de BernoulliBernoulli. Distribución . Distribución BinomialBinomial

    Cumulative Distribution-----------------------

    Distribution: Binomial

    Lower Tail Area ()Variable Dist. 1 Dist. 2 Dist. 3 Dist. 4 Dist. 52 0.0754835 0.793915

    Dist.1 = Binomial(20, 0.05)Dist.2 = Binomial(20, 0.2)

    defectuosos = rechazo el lote si en la muestra hay más de 2 defectuosos

    Si p(D)=0.05 , P(rechazar el lote)= 0.0754

    Si p(D)=0.2 , P(rechazar el lote)= 0.7939

  • Variables aleatorias continuasVariables aleatorias continuasVariables aleatorias continuasVariables aleatorias continuas

    Ejemplo:Ejemplo:Ejemplo:Ejemplo: Sea X el tiempo de funcionamiento de una maquina en un año (en horas x100)

    4.04.0

    )()2.3(

    2.35.2

    2.3

    =−+

    ==<

    ∫∫

    ∫∞−

    dxxfXP

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 51

    74.0)5.2

    4.08.0(

    5.2

    4.0

    5.20

    =−+ ∫∫ dxxxdx

  • Distribución normal o gaussianaDistribución normal o gaussianaDistribución normal o gaussianaDistribución normal o gaussianaLa distribución normal es sin duda la distribución de probabilidad mas importante:

    Aproxima lo observado en muchos procesos de medición: medidas físicas del cuerpo humano, características psíquicas, medidas de calidad de procesos industriales En muchas situaciones otras distribuciones se pueden aproximar a una NormaEs la base de la inferencia estadística. Aunque una variable aleatoria no sea normal, la media de la muestras sigue una distribución normal

    Su importancia es una consecuencia del teorema central del límite: cuando

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 52

    Su importancia es una consecuencia del teorema central del límite: cuando los resultados de un experimentos son debidos a un conjunto muy grande de causas independientes, que actúan sumando sus efectos, siendo cada efecto de poca importancia respecto al conjunto, es esperable que los resultados sigan una distribución normal

    Mean,Std. dev.0,1

    Normal Distribution

    -5 -3 -1 1 3 5

    x

    0

    0,1

    0,2

    0,3

    0,4

    den

    sity

  • Distribución normalDistribución normalDistribución normalDistribución normal

    Su función de densidad es:

    2

    2

    2

    )(

    2

    1)( σ

    µ

    πσ

    −−=

    x

    exf2)(

    )(

    σµ=

    =

    XVar

    XE

    Media10

    0,4Sta. dev.

    Normal Distribution

    0,8

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 53

    10119

    0 3 6 9 12 15 180

    0,1

    0,2

    0,3

    Sta. dev.10.52

    den

    sity

    5 9 13 170

    0,2

    0,4

    0,6

    0,8

  • Distribución normalDistribución normalDistribución normalDistribución normal

    Regla empírica

    0,3

    0,4

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 54

    -5 -3 -1 1 3 50

    0,1

    0,2

    µ+σ µ+2σ µ+3σµ-σµ-2σµ-3σ

    0.680.95

    0.997

  • Distribución normalDistribución normalDistribución normalDistribución normal

    El tiempo de vida de un semiconductor sigue una distribución Normal con media 7000 horas y desviación típica 600 horas.

    ¿Cuál es la probabilidad de que el semiconductor falle antes de 6000 horas?¿Qué tiempo de vida es excedido por el 95.05% de los semiconductores?¿Cuál es la probabilidad de que el semiconductor falle entre las 6200 y las 7600 horas de vida?

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 55

    las 7600 horas de vida?

  • Modelos de distribución de probabilidadModelos de distribución de probabilidadModelos de distribución de probabilidadModelos de distribución de probabilidad

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 56

  • Inferencia. ÍndiceInferencia. ÍndiceInferencia. ÍndiceInferencia. Índice

    Introducción Teoría de la probabilidad

    Experimentos aleatoriosProbabilidadVariables aleatorias

    Discretas. Distribución BinomialContinuas. Distribución Normal

    Inferencia estadística:

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 57

    Inferencia estadística:Ajuste a modelo de probabilidad

    Identificación de un modelo y estimación de parámetrosDiagnosisUtilización del modelo: cálculo de probabilidades

    Intervalos de confianza y contrastes de hipótesis:Estimadores y su distribuciónIntervalos de confianzaContraste de hipótesis

  • Inferencia estadísticaInferencia estadísticaInferencia estadísticaInferencia estadística

    Población

    Muestra

    Inferencia estadística: Proceso

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 58

    Inferencia estadística: Proceso mediante el cual se utiliza la información de la muestra para extraer conclusiones de la población

  • Inferencia. ÍndiceInferencia. ÍndiceInferencia. ÍndiceInferencia. Índice

    Introducción Teoría de la probabilidad

    Experimentos aleatoriosProbabilidadVariables aleatorias

    Discretas. Distribución BinomialContinuas. Distribución Normal

    Inferencia estadística:

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 59

    Inferencia estadística:Ajuste a modelo de probabilidad

    Identificación de un modelo y estimación de parámetrosDiagnosisUtilización del modelo: cálculo de probabilidades

    Intervalos de confianza y contrastes de hipótesis:Estimadores y su distribuciónIntervalos de confianzaContraste de hipótesis

  • Ajuste a modelo de probabilidadAjuste a modelo de probabilidadAjuste a modelo de probabilidadAjuste a modelo de probabilidad

    Consiste en identificar el modelo de probabilidad que sigue la variable de interés. ¿Qué modelo ha generado los datos observados?Para ajustar un modelo de probabilidad para la variable:1. Analizar el tipo de variable y la información que suministra la

    muestra. 2. Proponer un modelo adecuado de distribución de probabilidad

    para la variable de interés (Normal, Exponencial, Poisson,…..).

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 60

    para la variable de interés (Normal, Exponencial, Poisson,…..).3. Estimar los parámetros desconocidos del modelo propuesto4. Comprobar que el modelo propuesto es “adecuado”

    El modelo ajustado te ayuda a tomar decisiones respecto a la población.

    Histogram for Azucar

    Azucar

    fre

    qu

    en

    cy

    0.94 0.96 0.98 1 1.020

    20

    40

    60

    80

    100

  • Ajuste de modelo: Identificación de modelo.Ajuste de modelo: Identificación de modelo.Ajuste de modelo: Identificación de modelo.Ajuste de modelo: Identificación de modelo.Se observa la aceleración en 155 coches (Seconds from 0 to 60 millas/hora).

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 61

    Teniendo en cuenta el tipo de variable y la información que suministra la muestra,

    Fuente: Archivo de datos del Statgraphics,Cardata.sf3

  • Ajuste de modelo: Identificación de modelo.Ajuste de modelo: Identificación de modelo.Ajuste de modelo: Identificación de modelo.Ajuste de modelo: Identificación de modelo.Se observa la aceleración en 155 coches.

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 62

    La distribución normal (función de densidad, una campaña de Gauss) parece que se ajusta bien.

    Fuente: Archivo de datos del Statgraphics,Cardata.sf3

  • Ajuste a modelo: Estimación de parámetrosAjuste a modelo: Estimación de parámetrosAjuste a modelo: Estimación de parámetrosAjuste a modelo: Estimación de parámetrosA la vista del histograma parece razonable proponer la distribución normalLa distribución normal depende de dos parámetros, la media y la varianza poblacional, ambos desconocidos (recordar que solo hemos observado una muestra, no toda la población).Para dar valores a los parámetros, estimarlos, utilizamos la información que suministra la muestra.

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 63

    Fuente: archivo de datos del statgraphics,cardata

    Count = 155Average = 16.2761Median = 15.8Variance = 6.35131Standard deviation = 2.52018Minimum = 11.2

  • Ajuste de modelo: Estimación parámetros Ajuste de modelo: Estimación parámetros Ajuste de modelo: Estimación parámetros Ajuste de modelo: Estimación parámetros

    muestra) varianzamuestra, (Media),( NN =σµ

    Histog ram fo r accel

    30

    40

    50

    frequ

    ency

    Estimación de parámetros

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 64

    Fuente: Archivo de datos del Statgraphics,Cardata.sf3

    10 14 18 22 26

    accel

    0

    10

    20

    30

    frequ

    ency

    )52.2;27.16(NSummary Statistics for accel

    Count = 155Average = 16.2761Median = 15.8Variance = 6.35131Standard deviation = 2.52018Minimum = 11.2

  • Ajuste a modelo: Diagnosis Ajuste a modelo: Diagnosis Ajuste a modelo: Diagnosis Ajuste a modelo: Diagnosis ¿el modelo de probabilidad estimado es idóneo? ¿los datos aportan evidencia suficiente en contra del modelo de probabilidad asumido?Gráficamente. Si observamos el grafico parece que los datos observados confirman el modelo propuesto

    Histog ram fo r accel

    30

    40

    50

    frequ

    enc

    y

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 65

    ¿hay alguna forma de verificar que el modelo propuesto es adecuado?

    10 14 18 22 26

    accel

    0

    10

    20

    30

    frequ

    enc

    y

  • Ajuste a modelo: Diagnosis Ajuste a modelo: Diagnosis Ajuste a modelo: Diagnosis Ajuste a modelo: Diagnosis

    El test de Bondad de Ajuste de Chi-Cuadrado de Pearson compara la frecuencia observada con la frecuencia esperada bajo el modelo propuesto, si existe mucha discrepancia entre lo observado y lo esperado entonces rechazamos el modelo propuesto

    Goodness-of-Fit Tests for accel

    Chi-Square Test---------------------------------------------------------------------------- Lower Upper Observed Expected Limit Limit Frequency Frequency Chi-Square---------------------------------------------------------------------------- at or below 12.4931 4 10.33 3.88 12.4931 13.4768 15 10.33 2.11 13.4768 14.1551 6 10.33 1.82 14.1551 14.7062 18 10.33 5.69

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 66

    14.1551 14.7062 18 10.33 5.69 14.7062 15.1906 13 10.33 0.69 15.1906 15.6376 13 10.33 0.69 15.6376 16.0653 13 10.33 0.69 16.0653 16.487 10 10.33 0.01 16.487 16.9146 10 10.33 0.01 16.9146 17.3616 10 10.33 0.01 17.3616 17.846 5 10.33 2.75 17.846 18.3972 10 10.33 0.01 18.3972 19.0755 7 10.33 1.08 19.0755 20.0591 9 10.33 0.17above 20.0591 12 10.33 0.27----------------------------------------------------------------------------Chi-Square = 19.8711 with 12 d.f. P-Value = 0.0695631

    Cuanto mas pequeño sea el p-valor mas evidencia tenemos en contra del modelo propuesto. Si p-valor < 0.05, rechazamos el modelo propuesto

  • Ajuste de modelo: Cálculo de probabilidadesAjuste de modelo: Cálculo de probabilidadesAjuste de modelo: Cálculo de probabilidadesAjuste de modelo: Cálculo de probabilidades

    )52.2;27.16(n Aceleració N→Conocer el modelo de probabilidad nos permite responder a preguntas relacionadas con la población.¿Cuál es la probabilidad de que la aceleración de un coche sea superior a 17 (Seconds from 0 to 60)?

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 67

    Fuente: Archivo de datos del Statgraphics,Cardata.sf3

    Tail Areas for accel

    area below 17.0 = 0.613034

    area below 14.6485 = 0.259191

    area below 16.2761 = 0.499993

    area below 17.9037 = 0.740802

    area below 19.5314 = 0.901767

  • Ajuste a modelo. Ejemplo 2: Proporción de defectosAjuste a modelo. Ejemplo 2: Proporción de defectosAjuste a modelo. Ejemplo 2: Proporción de defectosAjuste a modelo. Ejemplo 2: Proporción de defectos

    Los artículos fabricados los clasifico en defectuosos y no defectuosos.Observo 5000 artículos.

    Frequency Table for defecto

    ------------------------------------------------------------------------ Relative Cumulative Cum. Rel.Class Value Frequency Frequency Frequency Frequency------------------------------------------------------------------------No defectuoso 4495 0.8990 4495 0.8990

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 68

    Ejercicio:Identifica modelo de probabilidadEstima parámetro o parámetros desconocidosCalcular la probabilidad de que en un lote de 50 piezas haya mas de 3 defectuosas.

    No defectuoso 4495 0.8990 4495 0.8990Defectuoso 505 0.1010 5000 1.0000------------------------------------------------------------------------

  • Inferencia. ÍndiceInferencia. ÍndiceInferencia. ÍndiceInferencia. Índice

    Introducción Teoría de la probabilidad

    Experimentos aleatoriosProbabilidadVariables aleatorias

    Discretas. Distribución BinomialContinuas. Distribución Normal

    Inferencia estadística:

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 69

    Inferencia estadística:Ajuste a modelo de probabilidad

    Identificación de un modelo y estimación de parámetrosDiagnosisUtilización del modelo: cálculo de probabilidades

    Intervalos de confianza y contrastes de hipótesis:Estimadores y su distribuciónIntervalos de confianzaContraste de hipótesis

  • Estimadores y su distribuciónEstimadores y su distribuciónEstimadores y su distribuciónEstimadores y su distribución

    Definiciones del Tema 1 (Estadística Descriptiva)Definiciones del Tema 1 (Estadística Descriptiva)Definiciones del Tema 1 (Estadística Descriptiva)Definiciones del Tema 1 (Estadística Descriptiva)

    PoblaciónPoblaciónPoblaciónPoblación: conjunto de individuos sobre el cual estamos interesados en sacar conclusiones (habitualmente demasiado grande para abarcarlo).MuestraMuestraMuestraMuestra: subconjunto de la población al que tenemos acceso y sobre el que realizamos las observaciones.

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 70

    sobre el que realizamos las observaciones.ParámetroParámetroParámetroParámetro: cantidad numérica calculada sobre la población (ejemplos: media µ, varianza σ2 y proporción p). Determina completamente un modelos paramétricos.EstadísticoEstadísticoEstadísticoEstadístico: cantidad numérica calculada sobre la muestra. Cuando un estadístico conduce a un valor aproximado de un parámetro se le llama estimadorestimadorestimadorestimador del parámetro.

  • Estimadores y su distribuciónEstimadores y su distribuciónEstimadores y su distribuciónEstimadores y su distribución

    Una muestra aleatoria simple X1, X2,…, Xn está compuesta por nvariables aleatorias independientes con la misma distribución.

    EstimadoresEstimadoresEstimadoresEstimadoresMedia muestralMedia muestralMedia muestralMedia muestral: La utilizamos para estimar la media poblacional µ.

    Proporción muestralProporción muestralProporción muestralProporción muestral: La utilizamos para estimar la proporción

    ( )nNXn

    Xn

    ii σµ,

    1

    1

    ≈= ∑=

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 71

    Proporción muestralProporción muestralProporción muestralProporción muestral: La utilizamos para estimar la proporción poblacional p.

    Varianza muestralVarianza muestralVarianza muestralVarianza muestral: La utilizamos para estimar la varianza poblacional σ2.

    ∑= −

    −=n

    i

    i

    n

    XXS

    1

    22

    1

    )(

    −≈=n

    pppN

    n

    Xp i

    )1(,

    ticacaracterís ciertacon de númeroˆ

  • Inferencia. ÍndiceInferencia. ÍndiceInferencia. ÍndiceInferencia. Índice

    Introducción Teoría de la probabilidad

    Experimentos aleatoriosProbabilidadVariables aleatorias

    Discretas. Distribución BinomialContinuas. Distribución Normal

    Inferencia estadística:

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 72

    Inferencia estadística:Ajuste a modelo de probabilidad

    Identificación de un modelo y estimación de parámetrosDiagnosisUtilización del modelo: cálculo de probabilidades

    Intervalos de confianza y contrastes de hipótesis:Estimadores y su distribuciónIntervalos de confianzaContraste de hipótesis

  • Intervalos de confianzaIntervalos de confianzaIntervalos de confianzaIntervalos de confianza

    Los intervalos de confianza proporcionan una zona en la que previsiblemente estará el valor autentico del parámetro.Se calculan con una confianza determinada. Normalmente 95%

    Casos que veremos:Intervalo de confianza para la mediaIntervalo de confianza para la desviación típica (población normal)

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 73

    Intervalo de confianza para la desviación típica (población normal)Intervalo de confianza para la proporción

  • Intervalos de confianzaIntervalos de confianzaIntervalos de confianzaIntervalos de confianza

    Supongamos que somos fabricantes de laminas de carbono. Una característica importante que debemos controlar es la resistencia a la rotura. La resistencia observada en 80 laminas. Summary Statistics for Resistencia

    Count = 80Average = 2788.52

    Histogram for Resistencia

    freq

    uen

    cy

    20

    30

    40

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 74

    ¿Es el verdadero valor de la resistencia media de todas las laminas fabricadas 2788.52 ?

    Average = 2788.52Median = 2788.78Standard deviation = 21.2788

    Resistencia

    freq

    uen

    cy

    2700 2730 2760 2790 2820 28500

    10

  • Un intervalo de confianza proporciona una zona en la que con una confianza

    predeterminada estará el verdadero valor del parámetro

    Intervalo de confianzaIntervalo de confianzaIntervalo de confianzaIntervalo de confianza

    El verdadero valor de la resistencia media de todas las laminas fabricadas es con un nivel de confianza del 95%:

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 75

    laminas fabricadas es con un nivel de confianza del 95%:

    52.278879.2783

    Confidence Intervals for Resistencia

    95.0% confidence interval for mean: 2788.52 +/- 4.73538 [2783.79;2793.26]

    26.2793

  • Intervalos de confianzaIntervalos de confianzaIntervalos de confianzaIntervalos de confianza

    Las formulas para calcular los intervalos de confianza están en cualquiera de los libros indicados en la bibliografía.Por ejemplo:

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 76

  • Intervalo de confianza para la mediaIntervalo de confianza para la mediaIntervalo de confianza para la mediaIntervalo de confianza para la media

    Calculo del intervalo de confianza para la media.Menú Statgraphics:

    Describe / Numerical data / One-Variable Analysis…Tabular Option / Confidencel Intervals

    Confidence Intervals for Resistencia

    95.0% confidence interval for mean: 2788.52 +/- 4.73538 [2783.79;2793.26]

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 77

    95.0% confidence interval for mean: 2788.52 +/- 4.73538 [2783.79;2793.26]

    95.0% confidence interval for standard deviation: [18.4158;25.2042]

  • Intervalo de confianza para la desviación típicaIntervalo de confianza para la desviación típicaIntervalo de confianza para la desviación típicaIntervalo de confianza para la desviación típicaSupongamos que somos fabricantes de laminas de carbono. Una característica importante que debemos controlar es la resistencia a la rotura (distribuida según modelo normal). Se observa la resistencia en 80 laminas

    Summary Statistics for Resistencia

    Count = 80Average = 2788.52Median = 2788.78Standard deviation = 21.2788

    freq

    uenc

    y

    0

    10

    20

    30

    40

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 78

    El verdadero valor de la Deviación Típica de la resistencia de todas las laminas fabricadas es con un nivel de confianza del 95%:

    41.18

    Confidence Intervals for Resistencia

    95.0% confidence interval for mean: 2788.52 +/- 4.73538 [2783.79;2793.26]

    95.0% confidence interval for standard deviation: [18.4158;25.2042]

    20.25

    Standard deviation = 21.2788Resistencia

    2700 2730 2760 2790 2820 2850

  • Intervalo de confianza para la desviación típicaIntervalo de confianza para la desviación típicaIntervalo de confianza para la desviación típicaIntervalo de confianza para la desviación típica

    Calculo del intervalo de confianza para la desviación típicaMenú Statgraphics:

    Describe / Numerical data / One-Variable Analysis…Tabular Option / Confidencel Intervals

    Confidence Intervals for Resistencia

    95.0% confidence interval for mean: 2788.52 +/- 4.73538 [2783.79;2793.26]

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 79

    95.0% confidence interval for mean: 2788.52 +/- 4.73538 [2783.79;2793.26]

    95.0% confidence interval for standard deviation: [18.4158;25.2042]

  • Intervalo de confianza para la proporciónIntervalo de confianza para la proporciónIntervalo de confianza para la proporciónIntervalo de confianza para la proporción

    Los artículos fabricados los clasifico en defectuosos y no defectuosos. Observo 5000 artículos. Codificamos los valores. 0=No defectuoso, 1=Defectuoso

    Frequency Table for defecto

    ------------------------------------------------------------------------ Relative Cumulative Cum. Rel.Class Value Frequency Frequency Frequency Frequency------------------------------------------------------------------------No defectuoso 4495 0.8990 4495 0.8990Defectuoso 505 0.1010 5000 1.0000

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 80

    Intervalo de confianza para la proporción de artículos defectuosos fabricados

    Defectuoso 505 0.1010 5000 1.0000------------------------------------------------------------------------

    Confidence Intervals for Art_defect

    95.0% confidence interval for mean: 0.101 +/- 0.0083531 [0.0926469;0.109353]

  • En todo intervalo de confianza hay una noticia buena y otra mala:

    La buena: hemos usado una técnica que en % alto de casos acierta.La mala: no sabemos si ha acertado en nuestro caso.

    Interpretación de los intervalos de confianzaInterpretación de los intervalos de confianzaInterpretación de los intervalos de confianzaInterpretación de los intervalos de confianza

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 81

    Confidence Intervals for Resistencia

    95.0% confidence interval for mean: 2788.52 +/- 4.73538

  • Inferencia. ÍndiceInferencia. ÍndiceInferencia. ÍndiceInferencia. Índice

    Introducción Teoría de la probabilidad

    Experimentos aleatoriosProbabilidadVariables aleatorias

    Discretas. Distribución BinomialContinuas. Distribución Normal

    Inferencia estadística:

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 82

    Inferencia estadística:Ajuste a modelo de probabilidad

    Identificación de un modelo y estimación de parámetrosDiagnosisUtilización del modelo: cálculo de probabilidades

    Intervalos de confianza y contrastes de hipótesis:Estimadores y su distribuciónIntervalos de confianzaContraste de hipótesis

  • Contraste de HipótesisContraste de HipótesisContraste de HipótesisContraste de HipótesisContraste de HipótesisContraste de HipótesisContraste de HipótesisContraste de Hipótesis

    En investigaciones empíricas muchas veces existe una teoría preconcebida relativa a la característica de la población sometida a estudio. Este tipo de circunstancias es estudiado mediante un contraste de hipótesis, e implica la existencia de dos hipótesis que reflejan esta idea a priori y que tendremos que contratar con la realidad observada.

  • Contrastando una hipótesisContrastando una hipótesis

    ¿es la edad

    media 40 años?

    Son

    demasiados.

    ..

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 84

    años 20=X

    ¡Gran diferencia!

    Rechazo la hipótesis

    Muestra

    aleatoria

  • Contraste de Hipótesis: analogía con juicio penalContraste de Hipótesis: analogía con juicio penalContraste de Hipótesis: analogía con juicio penalContraste de Hipótesis: analogía con juicio penal1. Establecemos las hipótesis

    2. Se observan las pruebasSi las pruebas aportan suficiente evidencia en contra de H0, entonces rechazamos H0Si las pruebas no aportan suficiente evidencia, entonces no rechazamos H0

    culpable es acusado :

    inocente es acusado :

    1

    0

    ElH

    ElH La hipótesis nula es la hipótesis que mantendremos a no ser que haya suficiente evidencia para rechazarla (nunca se prueba)

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 85

    Es decir si hay mucha discrepancia entre las pruebas y H0, entonces rechazamos H0

    3. Errores

    Realidad

    Inocente culpable

    Decisión

    inocente - Error II

    Culpable Error I -

    El error que más nos preocupa es Error tipo I (rechazar H0 , siendo cierta). Realizaremos el contraste intentando controlar este error

    α=P(EI)=P(rechazar H0 / H0 es cierta)

    β= P(EI)=P(aceptar H0 / H0 es falsa)

  • Contraste de hipótesisContraste de hipótesisContraste de hipótesisContraste de hipótesis

    Contraste de hipótesis en estadística es contestar a preguntasSiempre se contesta en términos de probabilidadEs semejante a los intervalos de confianza.

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 86

    Es semejante a los intervalos de confianza. Hay contrastes que se pueden resolver utilizando intervalos de confianza

  • Contraste de Hipótesis. EtapasContraste de Hipótesis. EtapasContraste de Hipótesis. EtapasContraste de Hipótesis. Etapas

    Definir el contraste: Definir la hipótesis nula (H0 ) y hipótesis alternativa (H1 )Decidir:

    Rechazo H0 y acepto H1 (la muestra aporta suficientes pruebas en contra de la hipótesis nula) o Aceptar H0 (la muestra no aporta suficientes pruebas en contra

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 87

    Aceptar H0 (la muestra no aporta suficientes pruebas en contra de la hipótesis nula)

    La herramienta que vamos a utilizar para tomar la decisión es el p-valor. Si p-valor es pequeño rechazamos H0

  • Contraste de hipótesisContraste de hipótesisContraste de hipótesisContraste de hipótesis

    Un ingeniero esta interesado en la tasa de combustión de un combustible sólido. Él sospecha, y es lo que quiere demostrar que la tasa de combustión es en media superior a 40.

    Tomare una muestra y realizaré un contraste para demostrar mi

    Summary Statistics for Combustion

    Count = 100Average = 40.92Median = 40.897Variance = 1.09515Standard deviation = 1.04649Minimum = 38.4888

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 88

    demostrar mi sospecha Maximum = 43.6189

    Range = 5.1301Lower quartile = 40.1761Upper quartile = 41.6151Stnd. skewness = 0.873252Stnd. kurtosis = -0.129913

    Histog ram fo r Combustion

    38 39 40 41 42 43 44

    Combustion

    0

    5

    10

    15

    20

    25

    30

    frequ

    enc

    y

  • Contraste de hipótesis. Definir hipótesisContraste de hipótesis. Definir hipótesisContraste de hipótesis. Definir hipótesisContraste de hipótesis. Definir hipótesis

    Definir la Hipótesis nula y alternativa. Tipos de contrastes

    >≤

    01

    00

    :

    :

    µµµµ

    H

    H

    ≠=

    01

    00

    :

    :

    µµµµ

    H

    H

    Contrate Bilateral Contrastes unilaterales

    <≥

    01

    00

    :

    :

    µµµµ

    H

    H

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 89

    Hipótesis nulaHipótesis nulaHipótesis nulaHipótesis nula Hipótesis alternativaHipótesis alternativaHipótesis alternativaHipótesis alternativa

    a) La que contrastamos a) Niega a la hipótesis nulaLo que queremos demostrar

    b) Los datos pueden refutarla b) Los datos pueden demostrar evidencia a favor

    c) No debería ser rechazada sin una buena razón c) No debería ser aceptada sin una gran evidencia a favor

  • Definir el contraste: definir hipótesis nula e hipótesis alternativa

    Contrate de hipótesis. Definir hipótesisContrate de hipótesis. Definir hipótesisContrate de hipótesis. Definir hipótesisContrate de hipótesis. Definir hipótesis

    >= 40:0

    µµH¿es la tasa de combustión media

    del solido superior

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 90

    > 40:1 µH

    del solido superior a 40?

  • Contrate de hipótesis. DecisiónContrate de hipótesis. DecisiónContrate de hipótesis. DecisiónContrate de hipótesis. Decisión

    >=

    40:

    40:

    1

    0

    µµ

    H

    H¿es la tasa de combustión media del s superior a 40

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 91

    Intuitivamente rechazaremos H0 si la media muestral es mucho más grande que 40

    Para establecer un criterio para aceptar o rechazar la hipótesis nula utilizaremos el p-valor

    . 40 si rechazamos 0 >>XHGran diferencia entre lo observado y lo esperado

  • Contrate de hipótesis. Herramienta de decisión: pContrate de hipótesis. Herramienta de decisión: p--valorvalorContrate de hipótesis. Herramienta de decisión: pContrate de hipótesis. Herramienta de decisión: p--valorvalor

    El p-valor da una idea de lo verosímil que es la hipótesis nula con los datos que tenemosP-valor es bajo (menor que 0.05)…poco

    1

    0.75

    0.5 Acepto Η0

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 92

    que 0.05)…poco razonable que H0 sea verdadP-valor alto(mayor que 0.05)…es bastante posible que H0 se verdad

    0.025

    0 0.05Rechazo Η0

  • Contrate de hipótesis. DecisiónContrate de hipótesis. DecisiónContrate de hipótesis. DecisiónContrate de hipótesis. Decisión

    >=

    40:

    40:

    1

    0

    µµ

    H

    H¿es la tasa de combustión media del s superior a 40

    Hypothesis Tests for Combustion

    Sample mean = 40.92Sample median = 40.897

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 93

    t-test------Null hypothesis: mean = 40.0Alternative: greater than

    Computed t statistic = 8.79089P-Value = 1.9218E-7

    Reject the null hypothesis for alpha = 0.05.

    Tenemos evidencia suficiente para rechazar Η0

  • Contrastes de hipótesisContrastes de hipótesisContrastes de hipótesisContrastes de hipótesis

    Casos que veremos:Intervalo de confianza para la mediaIntervalo de confianza para la desviación típica (población normal) Intervalo de confianza para la proporciónComparación de poblaciones

    Comparación de medias

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 94

    Comparación de mediasComparación de varianzas (poblaciones normales)Comparación de proporciones

  • Contraste mediaContraste mediaContraste mediaContraste mediaUn fabricante de bolsas asegura que sus bolsas soportan al menos 17 Kg. Nosotros sospechamos que soportan menos.Tomamos una muestra de 238 datos. A la vista de los datos, tenemos evidencia en contra del fabricante.

    1. Definimos contraste ≥ 17: µH

    Summary Statistics for Bolsas

    Count = 238Average = 16.9259Standard deviation = 0.889525

    Histogram for Bolsas

    13 15 17 19 21

    Bolsas

    0

    20

    40

    60

    80

    100

    freq

    ue

    ncy

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 95

    1. Definimos contraste

    2. Calculamos el p-valor. Statgraphics (Describe / Numerical data / One-Variable Analysis/ Tabular Option / Confidencel Intervals)

    <≥

    17:

    17:

    1

    0

    µµ

    H

    H

    t-test------Null hypothesis: mean = 17.0Alternative: less than

    Computed t statistic = -1.28473P-Value = 0.100071

    Do not reject the null hypothesis for alpha = 0.05.

  • Contraste varianza. Solo para poblaciones normalesContraste varianza. Solo para poblaciones normalesContraste varianza. Solo para poblaciones normalesContraste varianza. Solo para poblaciones normalesLa temperatura ideal para una sala es 22 grados. El sistema refrigeración intenta mantener la temperatura alrededor de este valor objetivo. El sistema de refrigeración será de alta calidad si la desviación típica de la temperatura en menor de 0.3 grados. Sospechamos que este sistema no es de calidad altaSe realizan 67 observaciones. (hemos comprobado que se ajusta a una normal)

    1. Definimos contraste ≤ 3.0:0 σH

    Summary Statistics for Temperatura:Count = 67Average = 22.052Standard deviation = 0.499787

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 96

    1. Definimos contraste

    2. Calculamos el p-valor. Statgraphics (Describe / Hyphotesis tests)

    >≤

    3.0:

    3.0:

    1

    0

    σσ

    H

    H

    Hypothesis Tests----------------Sample standard deviation = 0.499787Sample size = 67

    95.0% lower confidence bound for sigma: [0.437922]

    Null Hypothesis: standard deviation = 0.3Alternative: greater thanComputed chi-squared statistic = 183.177P-Value = 5.82534E-13Reject the null hypothesis for alpha = 0.05.

  • Contraste Proporciones (muestras grandes)Contraste Proporciones (muestras grandes)Contraste Proporciones (muestras grandes)Contraste Proporciones (muestras grandes)El porcentaje de pupitres para zurdos en la Universidad es del 3% Suponemos que no hay pupitres para zurdos suficientes.Tomamos una muestra de 223 alumnos.

    Frequency Table for zurdos------------------------------------------------------------------------ Relative Cumulative Cum. Rel.Value Frequency Frequency Frequency Frequency------------------------------------------------------------------------diestros 214 0.9596 214 0.9596zurdos 9 0.0404 223 1.0000------------------------------------------------------------------------

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 97

    1. Definimos contraste

    2. Calculamos el p-valor. Statgraphics (Describe / Hyphotesis tests)

    >≤

    03.0:

    03.0:

    1

    0

    pH

    pH

    Hypothesis Tests----------------Sample proportion = 0.0404Sample size = 100

    Approximate 95.0% lower confidence bound for p: [0.0140121]

    Null Hypothesis: proportion = 0.03Alternative: greater thanP-Value = 0.352751Do not reject the null hypothesis for alpha = 0.05.

  • Comparación de proporcionesComparación de proporcionesComparación de proporcionesComparación de proporciones

    ¿El porcentaje de alumnos y alumnas zurdas es igual? Tomamos una muestra de 223 alumnos, y 212 alumnas:

    7.62% de chicos zurdos3.76% de chicas zurdas

    1. Definimos contraste

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 98

    1. Definimos contraste

    2. Calculamos el p-valor. Statgraphics (Compare / Hyphotesis tests)

    ==

    chicaschi

    chicaschi

    ppH

    ppH

    cos1

    cos0

    :

    :

  • Comparación de proporcionesComparación de proporcionesComparación de proporcionesComparación de proporciones2. Calculamos el p-valor. Statgraphics (Compare / Hyphotesis tests)

    Hypothesis Tests----------------Sample proportions = 0.0762 and 0.0376Sample sizes = 223 and 212

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 99

    Sample sizes = 223 and 212

    Approximate 95.0% confidence interval for difference between proportions: [-0.00462411;0.0818241]

    Null Hypothesis: difference between proportions = 0.0Alternative: not equalComputed z statistic = 1.73016P-Value = 0.0836016Do not reject the null hypothesis for alpha = 0.05.

    Warning: normal approximation may not be appropriate for small sample sizes.

  • Comparación de poblaciones NormalesComparación de poblaciones NormalesComparación de poblaciones NormalesComparación de poblaciones Normales

    Dos proveedores suministran bombillas ¿Hay diferencias significativas entre la duración de las bombillas de los dos proveedores? Tomamos una muestra de 200 bombillas de cada proveedor

    Box-and-Whisker Plot

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 100

    Box-and-Whisker Plot

    1000 1100 1200 1300 1400 1500 1600

    Bombillas1

    bombillas2

    Summary Statistics

    Bombillas1 bombillas2 ------------------------------------------------------------Count 250 250 Average 1291.63 1249.95 Standard deviation 61.1392 58.0918 ------------------------------------------------------------

  • Comparación de poblaciones NormalesComparación de poblaciones NormalesComparación de poblaciones NormalesComparación de poblaciones Normales

    ¿Hay diferencias significativas entre la duración de las bombillas de los dos proveedores?

    1. Definimos los contrastes

    2. Calculamos el p-valor. Statgraphics (Compare / Two Sample)

    ≠=

    211

    210

    :

    :

    µµµµ

    H

    H

    ≠=

    211

    210

    :

    :

    σσσσ

    H

    H

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 101

    2. Calculamos el p-valor. Statgraphics (Compare / Two Sample)a) Comparación desviaciones típicasb) Comparación de medias

  • Comparación de poblaciones NormalesComparación de poblaciones NormalesComparación de poblaciones NormalesComparación de poblaciones Normales

    ¿Hay diferencias significativas entre la duración de las bombillas de los dos proveedores? a) Comparación desviaciones típicas (las poblaciones

    deben ser normales)

    ≠=

    211

    210

    :

    :

    σσσσ

    H

    HComparison of Standard Deviations---------------------------------

    Bombillas1 bombillas2 ------------------------------------------------------------

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 102

    211 ------------------------------------------------------------Standard deviation 61.1392 58.0918Variance 3738.0 3374.66Df 249 249

    Ratio of Variances = 1.10767

    95.0% Confidence Intervals Standard deviation of Bombillas1: [56.2084;67.026] Standard deviation of bombillas2: [53.4067;63.6852] Ratio of Variances: [0.863529;1.42083]

    F-test to Compare Standard Deviations

    Null hypothesis: sigma1 = sigma2 Alt. hypothesis: sigma1 NE sigma2 F = 1.10767 P-value = 0.420353

  • Comparación de poblaciones NormalesComparación de poblaciones NormalesComparación de poblaciones NormalesComparación de poblaciones Normales

    ¿Hay diferencias significativas entre la duración de las bombillas de los dos proveedores? b) Comparación de medias

    ≠=

    211

    210

    :

    :

    µµµµ

    H

    H

    Comparison of Means

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 103

    Comparison of Means-------------------

    95.0% confidence interval for mean of Bombillas1: 1291.63 +/- 7.61579 [1284.01,1299.24]95.0% confidence interval for mean of bombillas2: 1249.95 +/- 7.23619 [1242.71,1257.18]95.0% confidence interval for the difference between the means assuming equal variances: 41.6787 +/- 10.4798 [31.1989,52.1585]

    t test to compare means

    Null hypothesis: mean1 = mean2 Alt. hypothesis: mean1 NE mean2 assuming equal variances: t = 7.81391 P-value = 0.0

  • Ahora podemos responder a las cuestiones Ahora podemos responder a las cuestiones planteadas en los ejemplos inicialesplanteadas en los ejemplos inicialesAhora podemos responder a las cuestiones Ahora podemos responder a las cuestiones planteadas en los ejemplos inicialesplanteadas en los ejemplos inicialesplanteadas en los ejemplos inicialesplanteadas en los ejemplos inicialesplanteadas en los ejemplos inicialesplanteadas en los ejemplos iniciales

  • Ejemplo 1: ¿proporción poblacional?Ejemplo 1: ¿proporción poblacional?Ejemplo 1: ¿proporción poblacional?Ejemplo 1: ¿proporción poblacional?

    Supongamos que somos fabricantes de juguetes para niños. Para la fabricación de nuestra última novedad, dependemos de un proveedor que nos suministra los componentes electrónicos necesarios. La proporción de componentes La proporción de componentes La proporción de componentes La proporción de componentes defectuosos que consideramos admisible es 0.001. defectuosos que consideramos admisible es 0.001. defectuosos que consideramos admisible es 0.001. defectuosos que consideramos admisible es 0.001. Recibimos un lote de 50000 componentes, como no tenemos recursos para inspeccionarlos todos, se decide realizar una inspección de 500 componentes y en función de los resultados de esta inspección decidiremos aceptar o rechazar todo el lote.

    Frequency Table for Circuitos_Defec

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 105

    Recibimos el lote Inspeccionamos una muestra) información de la muestra

    En la muestra observamos que la proporción de defectuosos es de 0.002. ¿con En la muestra observamos que la proporción de defectuosos es de 0.002. ¿con En la muestra observamos que la proporción de defectuosos es de 0.002. ¿con En la muestra observamos que la proporción de defectuosos es de 0.002. ¿con la información que nos suministra la muestra podemos rechazar el lote?.la información que nos suministra la muestra podemos rechazar el lote?.la información que nos suministra la muestra podemos rechazar el lote?.la información que nos suministra la muestra podemos rechazar el lote?.

    ------------------------------------------------------------------------ Relative Cumulative Cum. Rel.Class Value Frequency Frequency Frequency Frequency------------------------------------------------------------------------ 1 0 499 0.9980 499 0.9980 2 1 1 0.0020 500 1.0000------------------------------------------------------------------------

  • Ejemplo 2: ¿media y varianza poblacional?Ejemplo 2: ¿media y varianza poblacional?Ejemplo 2: ¿media y varianza poblacional?Ejemplo 2: ¿media y varianza poblacional?

    Supongamos que somos fabricantes de laminas de carbono. Una característica importante que debemos controlar es la resistencia a la rotura. El responsable de la planta ha establecido un valor objetivo, en función de lo que demanda el mercado: la resistencia media de todas las láminas que se fabriquen debe ser : la resistencia media de todas las láminas que se fabriquen debe ser : la resistencia media de todas las láminas que se fabriquen debe ser : la resistencia media de todas las láminas que se fabriquen debe ser igual o superior a 2800 N/mmigual o superior a 2800 N/mmigual o superior a 2800 N/mmigual o superior a 2800 N/mm2222 y la desviación típica no superior a 20 N/mm2.y la desviación típica no superior a 20 N/mm2.y la desviación típica no superior a 20 N/mm2.y la desviación típica no superior a 20 N/mm2.Para verificar si se cumple este criterio, y dado que no se pueden inspeccionar todas las láminas, porque la prueba para determinar su resistencia supone la destrucción de la misma, se decide realizar la prueba a 80 laminas.

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 106

    En la muestra observamos que la resistencia media es de 2788.52 N/mm2, con una desviación de. 21.28 N/mm2 ¿con la información que nos suministra la ¿con la información que nos suministra la ¿con la información que nos suministra la ¿con la información que nos suministra la muestra podemos decir que el proceso de fabricación no cumple con el criterio muestra podemos decir que el proceso de fabricación no cumple con el criterio muestra podemos decir que el proceso de fabricación no cumple con el criterio muestra podemos decir que el proceso de fabricación no cumple con el criterio de calidad establecido por el responsable?.de calidad establecido por el responsable?.de calidad establecido por el responsable?.de calidad establecido por el responsable?.

    Summary Statistics for Resistencia

    Count = 80Average = 2788.52Median = 2788.78Standard deviation = 21.2788

    Histogram for Resistencia

    Resistencia

    freq

    uen

    cy2700 2730 2760 2790 2820 2850

    0

    10

    20

    30

    40

  • Ejemplo 3: Comparación de poblaciones Ejemplo 3: Comparación de poblaciones Ejemplo 3: Comparación de poblaciones Ejemplo 3: Comparación de poblaciones

    Somos responsables de elegir donde se situará un nuevo parque eólico. Tenemos dos posibles localizaciones, dentro del mismo municipio. Para tomar nuestra decisión, recurrimos a la estadística.Se observa la velocidad del viento durante 730 horas de forma simultánea en dos localizaciones alternativas (variables Parque1 y Parque2). Se quiere utilizar estos datos para decidir en qué localización instalar un parque de producción de energía eólica.

    Ingeniería de grado. Estadística. Tema 2Número de transparencia: 107

    localización instalar un parque de producción de energía eólica.

    A la vista de los datos, ¿qué localización es más aconsejable?

    Summary Statistics

    Veloc_Parque1 Veloc_Parque2 ------------------------------------------------------------Count 730 730 Average 5.80179 5.63285 Median 5.31 5.045 Standard deviation 3.24126 3.25496 Minimum 0.27 0.14 Maximum 16.28 17.82 Lower quartile 3.26 3.24 Upper quartile 7.96 7.44 Skewness 0.649086 0.952801 Kurtosis -0.0911749 0.753856 Coeff. of variation 55.8664% 57.7853% ------------------------------------------------------------

    Box-and-Whisker Plot

    0 3 6 9 12 15 18

    Veloc_Parque1

    Veloc_Parque2

    Las medias muestrales son distintas.¿Son distintas la medias poblacionales?