modulo 100403_vol 2_jeammy_sierra.pdf

Upload: jpbikers10

Post on 18-Oct-2015

101 views

Category:

Documents


1 download

TRANSCRIPT

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

    ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA

    UNIDAD DE CIENCIAS BSICAS

    JEAMMY JULIETH SIERRA HERNNDEZ

    (Director Nacional de Curso)

    100403 INFERENCIA ESTADSTICA

    Vol. 2

    IBAGU

    FEBRERO 2013

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    2

    COMITE DIRECTIVO

    Jaime Alberto Leal Afanador

    Rector

    Constanza Abada Garca

    Vicerrectora Acadmica y de Investigacin

    Gloria Herrera

    Vicerrector de Medios y mediaciones Pedaggicos

    Maribel Crdoba Guerrero

    Secretaria General

    Inferencia Estadstica

    Tercera Versin

    Actualizacin por Jeammy Julieth Sierra Hernndez

    Autores Primera Edicin: Jorge Rondon Danis Brito

    Copyright

    Universidad Nacional Abierta y a Distancia

    ISBN

    2012

    Unidad de Ciencias Bsicas UNAD

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    3

    CAMPOS DE

    FORMACIN

    Bsica CRDITOS: 2 TRABAJO INDEPENDIENTE: 72

    Horas TIPO DE CURSO Terico CDIGO:100403 ACOMPAAMIENTO TUTORIAL: 24

    Horas

    OBJETIVO GENERAL:

    Que el estudiante comprenda, aplique y desarrolle la teora y las tcnicas de la

    inferencia estadstica en diversos campos de su saber formativo, y que dicha

    aplicacin se convierta en una herramienta de uso matemtico para la toma de

    decisiones sobre hiptesis cuantitativas de datos, basado en la informacin

    extrada de una muestra.

    OBJETIVOS ESPECFICOS:

    Que el estudiante identifique las tcnicas y procedimientos que se

    deben emplear para que las muestras sean representativas de la poblacin

    que se pretende estudiar, de forma que los errores en la determinacin de

    los parmetros de la poblacin objeto de estudio sean mnimos.

    Que el estudiante comprenda el comportamiento de una poblacin a

    partir del anlisis metdico de una muestra aleatoria de la misma, y que

    entienda que la inferencia inductiva de los parmetros estadsticos que

    estime sobre dicha muestra, conlleva un error, el cual es posible de ser

    cuantificado.

    Conocer los criterios tcnicos que hay que tener en cuenta antes

    de seleccionar un tamao de muestra.

    Identificar el tipo de muestreo de acuerdo a los objetivos del estudio.

    Diferenciar y analizar las ventajas y desventajas de la estimacin

    por intervalos de confianza y las pruebas de hiptesis.

    Determinar la prueba o tcnica apropiada a aplicar en las diferentes

    pruebas de hiptesis paramtricas y No paramtricas.

    COMPETENCIA GENERAL DE APRENDIZAJE:

    Identificar un procedimiento adecuado para seleccionar de una poblacin una

    parte de ella, con el fin de obtener resultados confiables y poder generalizar los

    resultados obtenidos a toda la poblacin.

    Determinar los estadsticos necesarios para el anlisis y solucin de situaciones

    que implican conjuntos de datos de su disciplina de formacin, por medio del

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    4

    conocimiento de la teora elemental del muestreo y de las distribuciones

    muestrales.

    Plantear y desarrollar el proceso de la inferencia estadstica para resolver

    problemas concretos de investigacin en el mbito de otras disciplinas.

    Aplicar apropiadamente los resultados tericos y metodolgicos de la inferencia

    estadstica de estimacin y prueba de hiptesis en el marco de la modelacin.

    Habilidad para planear una investigacin, diseo de instrumentos, definicin de

    variables, recoleccin de la informacin, resumen y presentacin de los datos.

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    5

    UNIDADES DIDCTICAS

    UNIDAD DOS: ......................................................................................................................................... 6

    PRUEBA DE HIPTESIS, ANLISIS DE VARIANZAS Y ESTADSTICAS NO PARAMTRICAS ..................... 6

    CAPITULO CUATRO: PRUEBAS DE HIPTESIS ................................................................................... 7

    Leccin 16: Conceptos Bsicos ..................................................................................................... 8

    Leccin 17: Pruebas para la Media y la Diferencia de medias con grandes muestras. ............. 14

    Leccin 18: Pruebas para la proporcin y la Diferencia de proporciones (siempre con grandes

    muestras). .................................................................................................................................... 26

    Leccin 19: Pruebas para la media y la diferencia de medias (muestras pequeas). ............... 34

    Leccin 20: Pruebas para la varianza.......................................................................................... 44

    CAPITULO CINCO: ANLISIS DE VARIANZA .................................................................................... 47

    Leccin 21: Generalidades .......................................................................................................... 49

    Leccin 22. Anlisis de Varianza de un Factor ............................................................................ 50

    Leccin 23. Comparacin Mltiple de Medias (Pruebas a Posteriori) .................................. 60

    Leccin 24. Anlisis de varianza con dos factores (diseo de bloques aleatorizados). ........... 61

    Leccin 25. Anlisis de varianza de dos factores con interaccin. (Diseo factorial). ............. 66

    CAPITULO SEIS: PRUEBAS NO PARAMETRICAS .............................................................................. 80

    Leccin 26. Generalidades .......................................................................................................... 82

    Leccin 27. Prueba de Bondad de Ajuste de Ji-cuadrado ................................................... 83

    Leccin 28. Prueba de Kolmogorov-Smirnov ............................................................................. 87

    Leccin 29. Prueba de Wilcoxon ................................................................................................. 88

    Leccin 30. Prueba de Mann-Whitney para muestras independiente y prueba de Kruskal-

    Wallis para comparar k muestras independientes..................................................................... 89

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    6

    UNIDAD DOS:

    PRUEBA DE HIPTESIS, ANLISIS DE VARIANZAS Y

    ESTADSTICAS NO PARAMTRICAS

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    7

    CAPITULO CUATRO: PRUEBAS DE HIPTESIS

    Introduccin

    En casos relacionados con situaciones especiales en las cuales se desea

    comprobar la efectividad de estndares preestablecidos, la tcnica de prueba de

    hiptesis resultaba bastante apropiada, por cuanto permite comprobar con

    bastante certeza el grado de acierto en la fijacin de stos.

    Una hiptesis estadstica se define como un supuesto hecho sobre algn

    parmetro de la poblacin. Por ejemplo, los siguientes enunciados podran ser

    tomados como hiptesis:

    - El ingreso promedio de los trabajadores de la fbrica es de $X.

    - El rendimiento promedio de los empleados de dos fbricas es

    diferente.

    - El promedio de duracin de las bombillas es de 1.000 horas.

    - El promedio de duracin de las llantas es de 100.000 kilmetros.

    Ya se ha recabado en muchas ocasiones, que el objetivo es tomar muestras

    para extraer alguna conclusin o inferencia sobre la poblacin y que el nico

    objetivo de examinar muestras, es que las poblaciones suelen ser demasiado

    grandes y costosas de estudiar.

    Objetivo general.

    Contrastar la validez de una hiptesis o conjetura que se haya planteado en relacin con una situacin determinada de la empresa, analizando errores estadsticos posibles en las pruebas de hiptesis Objetivos especficos.

    Examinar que se entiende por hiptesis y qu por prueba de hiptesis.

    Describir los pasos que se siguen para demostrar una hiptesis.

    Describir los errores estadsticos que se pueden presentar.

    Realizar pruebas en relacin con una y dos medias poblacionales, con una

    y dos colas.

    Realizar pruebas con una y dos proporciones poblacionales.

    Realizar pruebas de hiptesis para datos que se encuentran en una escala

    nominal u ordinal con aplicacin de la distribucin chi cuadrado.

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    8

    Leccin 16: Conceptos Bsicos

    16. DECISIONES ESTADSTICAS

    En la prctica, con frecuencia se tienen que tomar decisiones acerca de una

    poblacin con base en informacin muestral.

    A tales decisiones se les llama decisiones estadsticas. Por ejemplo, tal vez se

    tenga que decidir, con base en datos muestrales, si determinado suero es

    realmente eficaz en la curacin de una enfermedad, si un mtodo educativo es

    mejor que otro, o bien si una moneda est alterada o no.

    16.1. Hiptesis

    Hiptesis estadsticas: Cuando se trata de tomar una decisin es til hacer

    suposiciones o proposiciones (o conjeturas) acerca de la poblacin de que se

    trata. Muchos problemas de ingeniera, ciencia, y administracin, requieren que se

    tome una decisin entre aceptar o rechazar una proposicin sobre algn

    parmetro. A estas suposiciones, que pueden ser o no ciertas, se les llama

    hiptesis estadsticas. Estas hiptesis estadsticas son por lo general afirmaciones

    acerca de las distribuciones de probabilidad de las poblaciones.

    Este es uno de los aspectos ms tiles de la inferencia estadstica, puesto que

    muchos tipos de problemas de toma de decisiones, pruebas o experimentos en el

    mundo de la ingeniera, pueden formularse como problemas de prueba de

    hiptesis. Consultado en la Web de ITC (s.f).

    Otras definiciones

    Una hiptesis estadstica es una afirmacin para verificar acerca de las

    caractersticas de una o ms poblaciones. Alvarado, J. & Obagi, J. (2008)

    Una hiptesis estadstica es una aseveracin o conjetura acerca de la distribucin

    de la poblacin, afirmacin que generalmente est asociada a un subconjunto del

    espacio del parmetro correspondiente al modelo probabilstico que representa

    la citada poblacin. Mayorga, J. (2004, p. 189)

    Una hiptesis estadstica es un enunciado provisional referente a uno o ms parmetros de una poblacin o grupo de poblaciones. En el proceso de estadstica inferencial hay dos tipos de hiptesis:

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    9

    1. Hiptesis nula, designada mediante Ho y se lee H subcero. La letra H

    significa hiptesis y el subndice cero indica no hay diferencia. Por lo

    general en la hiptesis nula se plantea en trminos de no hay cambio, no

    hay diferencia, se plantea con el objetivo de aceptarla o rechazarla.

    2. Hiptesis alternativa, describe lo que se considerar si se rechaza la

    hiptesis nula. A menudo tambin se le denomina hiptesis de investigacin,

    y se designa por H1, que se lee h subuno

    Otras definiciones

    Hiptesis Nula: Es la conjetura inicial, es la suposicin que se hace sobre la

    base de la experiencia del pasado, el conocimiento a priori y las necesidades

    empresariales, es, en un comienzo la respuesta ms lgica al problema que

    se ha planteado; es el valor que se asumira como cierto de no poderse hacer

    la investigacin. La aseveracin se enuncia despus de la abreviatura y

    Mayorga, J. (2004, p. 189).

    Hiptesis Alternativa: A toda hiptesis que difiera de la hiptesis dada se le

    llama hiptesis alternativa. Por ejemplo, si una hiptesis es p = 0.5, la

    hiptesis alternativa puede ser 7 5 . La hiptesis

    alternativa a la hiptesis nula se denota H1. Murray, R. ()

    16.2. Prueba de hiptesis

    Prueba de hiptesis: Segn Mayorga, prueba de hiptesis es una de las

    acepciones ms comunes, al igual que Contraste de hiptesis o Docimacia, para

    lo que l prefiere llamar, como justifica en su libro, juzgamiento de hiptesis, que

    define como, el proceso que culmina con una decisin de rechazar o de no

    rechazar una hiptesis con base en la informacin de una muestra aleatoria

    de una poblacin para la cual se ha asumido un modelo probabilstico

    cuya funcin de densidad es ( ).

    Si se supone que una hiptesis es verdadera, pero se encuentra que los

    resultados que se observan en una muestra aleatoria difieren marcadamente de

    los resultados esperados de acuerdo con la hiptesis (es decir, esperados con

    base slo en la casualidad, empleando la teora del muestreo), entonces se dice

    que las diferencias observadas son significativas y se estar inclinado a rechazar

    la hiptesis (o por lo menos a no aceptarla de acuerdo con la evidencia obtenida).

    Murray, R. ()

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    10

    Pasos en una prueba de hiptesis

    La prueba de hiptesis consiste en aplicar tcnicas estadsticas que

    permitan aceptar o rechazar una hiptesis. Este procedimiento se conoce como

    contraste de hiptesis. Las pruebas de hiptesis utilizan un procedimiento

    de cinco pasos, los cuales se mencionan a continuacin:

    1. Plantear las hiptesis nula y alternativa. Definiendo la lateralidad de la

    prueba.

    2. Determinar el nivel de significancia. (valores aceptables de error I y II)

    3. Estimar el valor estadstico de prueba. (a partir de la muestra)

    4. Establecer la regla de decisin. (al comparar el valor crtico o terico con el

    de prueba)

    5. Tomar la decisin.

    Grfico 1. Pruebas de Hiptesis

    16.3. Tipos de error.

    La hiptesis nula y alternativa son entonces aseveraciones sobre la poblacin

    que compiten entre s, en el siguiente sentido: la hiptesis nula (Ho) es

    verdadera, o lo es la hiptesis alternativa (H1), pero no ambas. En el caso ideal,

    el procedimiento de prueba de hiptesis debe conducir a la aceptacin de Ho

    cuando sea verdadera y al rechazo de H1. Desafortunadamente no siempre es

    posible puesto que como las pruebas de hiptesis se basan en la informacin de

    la muestra, se debe considerar la posibilidad de cometer errores. La siguiente

    tabla muestra los dos tipos de errores que se pueden cometer:

    PRUEBAS DE HIPTESIS

    Muestras Grandes (Z-normal)

    *Meias

    *Proporciones

    *Diferencia de Medias

    *Diferencia de Proporciones

    Muestras pequeas n

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    11

    Tabla No.1 Tipos de errores

    DECISIN SOBRE Ho VERDADERA FALSA

    Aceptar H0 Correcta 1 Error tipo II

    Rechazar H0 Error tipo I Nivel de significancia

    Correcta 1 Potencia de la prueba

    Cuando se tiene una hiptesis esta puede ser verdadera o falsa y la decisin que

    se toma en la prueba es aceptar o rechazar la hiptesis. Si la decisin que se

    toma est de acuerdo con la realidad no se cometen errores, en este caso las

    dos buenas decisiones son: aceptar la hiptesis nula cuando es cierta o rechazar

    la hiptesis nula cuando es falsa.

    Pero cuando la decisin no est de acuerdo con la realidad se pueden comete r

    dos tipos de errores vistos anteriormente: rechazar la hiptesis nula cuando en

    realidad es cierta, llamado error tipo I representado por alfa ( ); aceptar la

    hiptesis nula cuando en realidad es falso, llamado error tipo II representado por

    beta ( ), llamados tambin nivel de significancia. El procedimiento utilizado

    consiste en limitarlos a un nivel preestablecido pequeo, generalmente 0.01

    0.05. Este planteamiento se le denomina la potencia de la prueba y se

    representa as:

    Probabilidad de cometer el error tipo I

    Probabilidad de rechazar Ho cuando es verdadera. Probabilidad de NO cometer el error tipo I (1 - ) Probabilidad de acertar la Ho cuando es verdadera.

    Probabilidad de cometer el error tipo II

    Probabilidad de aceptar Ho cuando es falsa. Probabilidad de NO cometer el error tipo II

    (1 - ) Probabilidad de rechazar Ho cuando es falsa.

    Toda prueba de hiptesis determina una regin de rechazo de la hiptesis

    llamada regin crtica, la cual depende del tipo de hiptesis que se pruebe y se

    determina utilizando un nivel de significancia .

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    12

    16.4. El Nivel mnimo o de rechazo.

    Al establecer una prueba de hiptesis una de las formas de llegar a una

    conclusin es a travs de la comparacin del valor crtico (o terico) con el de

    prueba. Otra forma de poder tomar una decisin es, usar en lugar del valor crtico, es decir, observar la probabilidad de rechazar Ho cuando es verdadera

    (error tipo I), o como afirma Alvarado, J.A y Otros (2008), responder a la pregunta:

    cul es el riesgo que debo correr para poder rechazar Ho? Si ese riesgo es

    grande, no se puede rechazar Ho; si es pequeo se rechaza Ho.

    El p-valor

    El mnimo de rechazo recibe tambin el nombre de valor p en el cual Ho sera rechazado. Si el p-valor es menor que el nivel de significancia, la hiptesis nula se

    rechaza. Lo puede encontrar en algunos textos como p-value en ingls. Ms

    adelante puede verse un ejemplo dnde se utiliza el p-value para rechazar la

    hiptesis nula.

    16.5. Lateralidad de las pruebas

    Dependiendo del planteamiento de la hiptesis alternativa (H1) se distingue dos

    tipos de pruebas:

    Pruebas bilaterales.

    Pruebas unilaterales

    Prueba Bilateral: El investigador desea comprobar la hiptesis de un cambio en

    el parmetro. El nivel de significancia se divide en dos y existen dos regiones de

    rechazo.

    En una prueba de hiptesis unilateral derecha, no se puede rechazar la

    hiptesis nula Ho, si el estadstico de prueba (o calculado) es menor o igual

    que el terico (tabulado). O lo mismo es, se rechaza la hiptesis nula cuando

    el valor calculado es mayor que el tabulado

    <

    Una prueba de hiptesis es significativa si el p-value es menor que el nivel de

    significacin, es decir:

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    13

    Prueba Unilateral Derecha: El investigador desea comprobar la hiptesis de un

    aumento en el parmetro, en este caso el nivel de significancia se carga todo

    hacia el lado derecho, para definir las regiones de aceptacin y de rechazo

    Prueba Unilateral Izquierda: El investigador desea comprobar la hiptesis de una

    disminucin en el parmetro, en este caso el nivel de significancia se carga todo

    hacia el lado izquierdo, para definir las regiones de aceptacin y de rechazo.

    Grfico No. 1. Prueba bilateral (o a dos colas)

    Pro

    bab

    ilid

    ad

    valor crtico Valor crtico

    Regin de rechazo

    /2

    1

    Regin de rechazo

    /2

    Regin de aceptacin

    Ho

    Verdadera)

    Prueba de hiptesis:

    Prueba de hiptesis:

    <

    Prueba de hiptesis:

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    14

    Grfico No. 2. Prueba unilateral izquierda (inferior)

    Grfico No. 3. Prueba unilateral derecha (superior)

    Leccin 17: Pruebas para la Media y la Diferencia de medias con

    grandes muestras.

    17. Prueba para la media y diferencia de medias (Muestras grandes

    ( )

    En las pruebas para la media de poblacin de muestra grande se distingue dos

    situaciones:

    Conocida la desviacin estndar de la poblacin.

    Desconocida la desviacin estndar de la poblacin.

    17.1. Prueba para la media (conocida la desviacin estndar poblacional).

    Cuando se tiene la oportunidad de conocer

    Pro

    ba

    bil

    ida

    d

    Valor crtico

    1

    Regin de rechazo Regin de aceptacin

    Ho (Verdadera)

    Pro

    bab

    ilid

    ad

    1

    Valor crtico

    Ho (verdadera)

    Regin de aceptacin Regin de rechazo

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    15

    17.1.1. Prueba bilateral (para la media)

    El procedimiento de prueba de hiptesis para pruebas bilaterales a cerca de la

    media de una poblacin, cuando se considera el caso de muestra grande 3

    en que el teorema del lmite central permite suponer que la media de la

    distribucin muestral de medias se puede aproximar a una distribucin normal de

    probabilidad, y la desviacin estndar de la poblacin es conocida, sigue la

    siguiente forma general:

    Muestra grande ( 3 ) Planteamiento de hiptesis:

    01

    00

    :

    :

    H

    H

    Estadstico de prueba para desviacin estndar poblacional conocida:

    Ecuacin No.1

    Regla de rechazo a un nivel de significancia :

    220 Z Zsi o -Zz si HRechazar

    Ejemplo

    La empresa coca cola ha establecido como poltica general para su produccin en

    pequea escala, un promedio ( ) de llenado para sus envases de 200

    centmetros cbicos con una desviacin estndar ( ) de 16 centmetros cbicos.

    Dado que recientemente se han contratado y diseado nuevos mtodos de

    produccin, utilizando un nivel de significancia del 0.01, se desea probar la

    hiptesis, que el promedio de llenado sigue siendo de 200 centmetros cbicos.

    Para tal efecto se tom una muestra de 100 envases llenos, los cuales mostraron

    una media de llenado de 203.5 centmetros cbicos.

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    16

    En los intervalos de confianza el alfa siempre se divide en

    dos, para distribuirlo en las dos colas, en las pruebas de

    hiptesis el alfa slo se divide, si la prueba es a dos colas

    Paso 1: Planteamiento de hiptesis

    Planteamiento de la hiptesis nula: la media poblacional es 200

    Planteamiento de la hiptesis alternativa: La media poblacional es

    diferente a 200. Estas hiptesis se expresan como sigue:

    Esta es una prueba de dos colas, debido a que la hiptesis alternativa ( ) es

    planteada en palabras de diferencia, es decir, la hiptesis no indica si la media

    es mayor o menor que 200.

    Paso 2: Nivel de significancia

    El nivel de significancia es de 0.01 que es el alfa ( ), la probabilidad de

    cometer el error de tipo uno, es decir la probabilidad de rechazar la hiptesis

    siendo verdadera. Para ste tipo de problema se utiliza la distribucin normal

    estandarizada en Z.

    Paso 3: Estadstico de prueba (o calculado)

    El valor estadstico de prueba para este tipo de problema es utilizando la

    distribucin normal estandarizada en Z:

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    17

    Se concluye que el llenado de los envases cumple con las polticas generales de

    la empresa, y la diferencia de promedios se atribuye a variaciones aleatorias.

    Paso 4: Estadstico terico (o tabulado) y regla de decisin

    La formulacin de la regla de decisin consiste en hallar el valor crtico de Z

    con una prueba de dos colas. En la tabla de la normal estndar (descargar

    tabla) se identifica el valor de Z correspondiente a una probabilidad igual

    1 2 1 5 995. El valor ms cercano a 0,995 es 0.995059 que

    corresponde a un valor de Z igual a 2.58, que es el valor crtico para la prueba

    de hiptesis. Dado que es una prueba de dos colas, se tendrn dos valores

    crticos, tal como se indica en el siguiente grfico:

    Grfico No. 4. Prueba bilateral (a dos colas)

    La regla de decisin es aceptar la hiptesis nula (Ho), puesto que el valor

    estadstico de prueba (2.19) ha cado en la zona de aceptacin de dicha

    hiptesis

    Paso 5: Tomar la Decisin

    Prueba de

    hiptesis para la

    media (Bilateral)

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    18

    17.1.2. Prueba unilateral (para la media)

    Con anterioridad de dijo que la hiptesis alternativa indica una direccin ya sea

    mayor que o menor que, la prueba es de una cola. El procedimiento para

    demostrar la hiptesis es por lo general igual a la prueba de dos colas, excepto

    que el valor crtico es diferente. Ahora se modificar la hiptesis alternativa del

    problema anterior, sobre el llenado de los envases de una factora de coca cola,

    pues se sospecha que el promedio de llenado est por encima de lo que la

    empresa determina (por eso en la hiptesis alterna se plantea una relacin mayor

    que).

    200:

    200:

    1

    0

    H

    H

    Igual al ejemplo anterior.

    Igual al ejemplo anterior.

    El valor crtico cambia. En la tabla de la distribucin normal se identifica el valor

    de Z correspondiente a una probabilidad igual 0,99. El valor ms cercano a 0,99

    corresponde a un valor de Z igual a 2.33, que es el valor crtico para la prueba de

    hiptesis. Dado que es una prueba de una cola, se tendr el valor crtico, tal como

    se indica en la siguiente grfica:

    Paso 1: Planteamiento de hiptesis

    Paso 2: Nivel de significancia

    Paso 3: Estadstico de prueba (o calculado)

    Paso 4: Estadstico terico (o tabulado) y regla de decisin

    Prueba de

    hiptesis para la

    media (unilateral)

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    19

    Grfico No. 5. Prueba unilateral derecha (superior)

    Igual, puesto que el valor estadstico de prueba est ubicado en la zona de

    aceptacin de la hiptesis nula, es decir, se est diciendo que el promedio de

    llenado es de 200, tal como est planteada la hiptesis nula.

    17.2. Prueba para la media (desconocida la desviacin estndar

    poblacional).

    En la mayora de los casos se desconoce la desviacin estndar de la poblacin

    , la cual debe calcularse en estudios previos o se estima utilizando la desviacin

    estndar de la muestra (s). En estos casos se utiliza la desviacin estndar de la

    muestra, quedando la frmula para el estadstico de prueba as:

    Ecuacin No.2

    Ejemplo

    Una cadena grande de almacenes expide su propia tarjeta de crdito y Ud. desea

    saber si los saldos promedios por crditos de los clientes son mayores que 400

    unidades monetarias. El nivel de significancia se fija en 0.05. Una revisin

    aleatoria de 172 clientes, revel que el promedio por crdito de los clientes es de

    407 unidades monetarias y la desviacin estndar de la muestra es de 38

    Pro

    bab

    ilid

    ad

    200

    Escala Z |2.33

    Ho (verdadera)

    Regin de aceptacin Regin de rechazo

    Paso 5: Tomar la Decisin

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    20

    unidades monetarias. Concluye UD. que la media poblacional es mayor que 400

    unidades monetarias?

    400:

    400:

    1

    0

    H

    H

    Dado que la hiptesis alternativa se enuncia mayor que, se aplica una cola a la

    derecha, y como la muestra es grande (n >= 30), se aplica la distribucin normal

    estandarizada en Z.

    El nivel de significancia se fija en 0.05

    42.2

    172

    38

    400407

    n

    S

    XZ

    Grfico No. 6. Prueba unilateral derecha (superior)

    El valor crtico es 1.645 y la ubicacin del estadstico de prueba se encuentra en la

    zona de rechazo de la hiptesis nula, por lo tanto se acepta la hiptesis

    alternativa.

    Pro

    bab

    ilid

    ad

    200

    Escala Z |2.42

    Ho (verdadera)

    Regin de aceptacin Regin de rechazo

    |1,645

    Unidades monetarias de crdito

    1- =0,95 = 0,05

    Paso 1: Planteamiento de hiptesis

    Paso 2: Nivel de significancia

    Paso 3: Estadstico de prueba (o calculado)

    Paso 4: Estadstico terico (o tabulado) y regla de decisin

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    21

    La decisin a tomar por Ud. es que el promedio de los crditos es mayor que 400

    unidades monetarias con un grado de confianza del 95%.

    17.3. Prueba para la diferencia de medias (desconocida la desviacin

    estndar poblacional).

    En la mayor parte de los casos no se conoce la varianza o desviacin estndar

    real de ninguna poblacin. En general la nica informacin que es posible obtener

    se relaciona con las medias muestrales y , las varianzas muestrales y

    y las desviaciones estndar de las muestras y . Si se hacen las suposiciones

    que las muestras se obtienen de manera aleatoria e independiente a partir de las

    poblaciones respectivas que tiene una distribucin normal y que las varianzas

    poblacionales son iguales, es decir,

    , se puede utilizar una prueba de

    distribucin normal de varianzas combinadas para determinar si existe una

    diferencia significativa entre las dos poblaciones.

    Recordemos que para diferencias de medias se utiliza el siguiente estadstico de

    prueba:

    ( ) ( )

    12

    1 22

    2

    Ecuacin No.3

    Ejemplo

    Una obra de construccin requiere un gran nmero de bloques de concreto. Dos

    empresas abastecedoras A y B licitan para su adjudicacin, y dentro del pliego de

    condiciones se estipula que la resistencia mnima es de 1.000 unidades mtricas a

    la resistencia, y el contrato se adjudicar a la empresa que mayor resistencia

    presente su producto.

    Se plantea la hiptesis nula (Ho) que no existe diferencia entre las resistencias

    medias a la compresin de los bloques de concreto. La hiptesis alternativa se

    plantea en trminos que hay alguna diferencia significativa entre las dos

    resistencias medias a la compresin. Simblicamente se expresa as:

    Paso 5: Tomar la Decisin

    Paso 1: Planteamiento de hiptesis

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    22

    BA

    BA

    H

    H

    :

    :

    1

    0

    Dado que la hiptesis alternativa no indica una direccin especfica, la prueba es

    de dos colas

    Se elige un nivel de significancia de 0.01. Esto equivale a cometer un error de tipo

    I. Se usar una distribucin normal estandarizada en Z, razn por la cual se debe

    seleccionar una muestra que al menos contenga como mnimo 30 unidades de

    bloque, cada una de las empresas licitantes.

    El estadstico de prueba a aplicar est dado por la siguiente frmula:

    12

    1 2

    2

    2

    Ecuacin No.4

    Suponga que Ud. Seleccion una muestra de cada una de las empresas licitantes

    y determin la resistencia a la compresin, con los siguientes resultados:

    Tabla No.2 Resultados de muestra

    Licitante A Licitante B

    X = 1.070 X = 1.020

    n = 81 n = 64

    S = 63 S = 57

    El valor del estadstico de prueba es:

    01.5

    98827.9

    50

    64

    57

    81

    63

    020.1070.122

    2

    2

    2

    1

    2

    1

    21

    n

    S

    n

    S

    XXZ

    Paso 2: Nivel de significancia

    Paso 3: Estadstico de prueba (o calculado)

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    23

    Recurdese que se seleccion un nivel de significancia del 0.01 y se utilizar una

    prueba de dos colas. Los valores crticos y zonas de aceptacin para las hiptesis

    se presentan en la siguiente figura:

    Grfico No. 7. Prueba bilateral (o a dos colas)

    El valor Z calculado queda en el rea de rechazo de la hiptesis nula, por lo tanto se

    concluye que la media poblacional de la resistencia a la compresin es diferente en las

    dos empresas y la diferencia no se debe al azar del muestreo, con un grado de confianza

    del 99%.

    17.4. Prueba para la diferencia de medias (Muestras independientes

    desviacin estndar poblacional conocida).

    ( 1 2)( 1 2)

    12

    1 22

    2

    Ecuacin No.5

    Pro

    bab

    ilid

    ad

    valor crtico -2.58| |2.58

    Regin de rechazo

    0.01/2= 0.005

    |5.01

    Regin de rechazo

    0.01/2=0.005

    Regin de aceptacin

    Resistencia ladrillos

    Ho (Verdadera)

    Paso 4: Estadstico terico (o tabulado) y regla de decisin

    Paso 5: Tomar la Decisin

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    24

    Si < < entonces No se rechaza

    Recuerde que es el estadstico de prueba (o calculado)

    Ejemplo

    Un constructor est considerando dos lugares alternativos (dos comunidades)

    para construir un centro comercial. Como los ingresos de los hogares de la

    comunidad son una consideracin importante en sta seleccin, desea probar que

    el ingreso promedio de la primera comunidad excede al promedio de la segunda

    comunidad en cuando menos $1.500 diarios. Con la informacin de un censo

    realizado el ao anterior sabe que la desviacin estndar del ingreso diario de la

    primera comunidad es de $1.800 y la de la segunda es de $2.400

    Para una muestra aleatoria de 30 hogares de la primera comunidad, encuentra

    que el ingreso diario promedio es de $35.500 y con una muestra de 40 hogares de

    la segunda comunidad el ingreso promedio diario es de $34.600. Pruebe la

    hiptesis con un nivel de confianza del 95 por ciento.

    15

    < 15

    Recordemos que el nivel de confianza es 95%

    Es decir 1 95 eso indica que:

    5

    El tamao de las muestras es grande y las varianzas poblacionales son conocidas,

    por consiguiente la estadstica de trabajo a utilizar la ecuacin 5.

    Paso 1: Planteamiento de hiptesis

    Paso 2: Nivel de significancia

    Paso 3: Estadstico de prueba (o calculado)

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    25

    Tabla No.3 Resultados de las comunidades

    Comunidad 1 Comunidad 2

    4

    34 6

    24

    12

    1 22

    2

    (35 346 ) 15

    18 2

    3 24 2

    4

    1 195

    Para un nivel de confianza del 95 %, ya que es una prueba de unilateral izquierda, lo que se busca es el valor crtico que deja por encima un 95% de rea, por tanto es lgico pensar que el valor ser un Z negativo, en la tabla de la distribucin normal se tiene un valor de Z de -1,64 (estadstico terico o tabulado). Como puede observarse en el grfico No.8, el estadstico de prueba se ubica en la zona de aceptacin de la hiptesis nula.

    Grfico No. 8. Prueba unilateral izquierda (cola inferior)

    Pro

    bab

    ilid

    ad

    = 0.05

    Valor crtico -1.64| -1.195|

    Regin de rechazo Regin de aceptacin

    Ho (Verdadera)

    Paso 4: Estadstico terico (o tabulado) y regla de decisin

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    26

    Por lo tanto, con una confiabilidad del 95 por ciento, la diferencia entre el ingreso promedio por hogar en las dos comunidades es mayor a $1.500 diarios.

    En una prueba de hiptesis la confiabilidad significa la probabilidad

    de no rechazar la hiptesis nula que es cierta, porque el nivel de

    confianza es la probabilidad que el estadstico de prueba se

    encuentre en la zona de aceptacin.

    Leccin 18: Pruebas para la proporcin y la Diferencia de

    proporciones (siempre con grandes muestras).

    18. Prueba de hiptesis para proporciones.

    Se entiende por proporcin, la porcin relativa o porcentaje que expresa la parte

    de la poblacin o muestra que tiene un atributo particular de inters como el

    resultado comparativo de contar algo, Se cuenta el nmero de partes defectuosas;

    se cuenta el nmero de votantes por la preferencia de un candidato. As la prueba

    de proporcin implica niveles nominales de medida.

    18.1. Prueba para una proporcin

    Para demostrar una proporcin muestral se requiere cumplir con ciertos principios

    binomiales, tales como:

    1. Los datos recolectados son el resultado de un conteo.

    2. El resultado de un experimento se clasifica en una de las dos

    categoras mutuamente excluyentes: un xito o un fracaso.

    3. La probabilidad de xito se mantiene constante.

    4. Los intentos para realizar cada experimento son independientes.

    5. El tamao de la muestra debe ser tan grande para que se d la

    siguiente condicin: (n)(p)>5 y (n)(1-p)>5

    Para realizar una prueba de hiptesis a fin de evaluar la magnitud de la diferencia

    entre la proporcin muestral p y la proporcin poblacional (P), se puede usar el siguiente estadstico de prueba:

    Paso 5: Tomar la Decisin

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    27

    n

    PP

    PPZ

    )1(

    Ecuacin No.6

    Dnde:

    P es la proporcin muestral.

    P es la proporcin poblacional.

    n es el tamao de la muestra.

    De otra manera, en lugar de examinar la proporcin de xitos en una muestra

    como en el caso anterior, es posible estudiar el nmero de xitos en una muestra,

    para determinar el nmero de xitos esperados o hipotticos en la poblacin, se

    utiliza el siguiente estadstico de prueba:

    qpn

    pnXZ

    Ecuacin No.7

    Dnde:

    X es el nmero de xitos en la muestra.

    P es la proporcin hipottica de xitos.

    Ejemplo

    Suponga que para que lo elijan a Ud. como alcalde, es necesario que logre al

    menos el 80% de los votos del barrio donde vive. Dado su inters decide hacer

    una encuesta en el barrio con una muestra de 2.000 personas, para ver la

    posibilidad y 1.550 dieron respuesta favorable por sus aspiraciones. Pruebe la

    hiptesis de favorabilidad, con un nivel de significancia del 0.05.

    Antes de realizar el procedimiento de los cinco pasos, veamos si cumple la

    condicin de:

    (n)(p)>5 (2.000)(0.8)>5 1.600>5 Cierto

    (n)(1-p)>5 (2.000)(0.2)>5 400>5 Cierto

    La hiptesis nula se plantea diciendo que Ud. s tiene el 80% de favorabilidad de

    voto en su barrio y la hiptesis alternativa en que no alcanza a tener este

    Paso 1: Planteamiento de hiptesis

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    28

    porcentaje de favorabilidad de voto. Simblicamente se expresa como sigue:

    80.0:

    80.0:

    1

    PH

    PHo

    La distribucin de probabilidad a utilizar es la normal estandarizada en Z, con un

    nivel de significancia del 5%, con una cola a la izquierda.

    n

    PP

    PPZ

    )1(

    Dnde:

    P es la proporcin muestral.

    P es la proporcin poblacional.

    n es el tamao de la muestra.

    Pn

    PP

    )1( Es el error estndar de la proporcin poblacional.

    Reemplazando los diferentes valores en la ecuacin se tiene:

    80.20089443.0

    025.0

    00008.0

    80.0775.0

    000.2

    )80.01(80.0

    80.0000.2

    550.1

    )1(

    n

    PP

    PPZ

    La regla de decisin se toma sobra la base de un valor critico calculado a partir de

    la tabla de distribucin Z, con un rea de 0.4500 (0.5000-0.0500)

    Paso 2: Nivel de significancia

    Paso 3: Estadstico de prueba (o calculado)

    Paso 4: Estadstico terico (o tabulado) y regla de decisin

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    29

    Grfico No. 9. Prueba unilateral izquierda (cola inferior)

    Como el valor Z (-2080) est en la regin de rechazo de la hiptesis nula,

    entonces se acepta la hiptesis alternativa y se concluye la favorabilidad de voto

    es menos al 80%.

    Ejemplo

    Probar al nivel de significancia del 0.01 la aseveracin que el 55% de las familias

    que planean adquirir una residencia en Melgar desea su ubicacin en un

    condominio. Para su estudio Ud. toma una muestra aleatoria de 400 familias que

    planean comprar una residencia en Melgar, de las cuales 228 familias desean en

    un condominio.

    La hiptesis nula se plantea diciendo que el 55% de las familias desean adquirir

    residencia en un condominio en Melgar.

    55.0:

    55.0:

    1

    PH

    PHo

    La distribucin de probabilidad a utilizar es la normal estandarizada en Z, con un

    nivel de significancia del 1%, con dos colas.

    Paso 5: Tomar la Decisin

    Paso 1: Planteamiento de hiptesis

    Paso 2: Nivel de significancia

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    30

    80.00248747.0

    02.0

    400

    )55.01(55.0

    55.0400

    280

    )1(

    n

    PP

    PPZ

    La regla de decisin se toma sobre la base del siguiente grfico:

    Grfico No. 10. Prueba Bilateral (a dos colas)

    La hiptesis nula que la proporcin verdadera es del 55% no es rechazada a un

    nivel de significancia del 1%, concluyendo que el 55% de las familias planean

    adquirir residencia vacacional en Melgar lo desean en un condominio.

    18.2. Prueba para diferencias entre dos proporciones

    Se presenta a continuacin un ejemplo donde se emplea la prueba de proporcin

    para dos poblaciones, utilizando el siguiente estadstico de prueba:

    21

    2121

    )1()1(

    )(

    n

    PP

    n

    PP

    PPPPZ

    CCCC

    Ecuacin No.8

    Paso 3: Estadstico de prueba (o calculado)

    Paso 4: Estadstico terico (o tabulado) y regla de decisin

    Paso 5: Tomar la Decisin

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    31

    Dnde:

    1n Es la cantidad seleccionada en una muestra.

    2n Es la cantidad seleccionada en la otra muestra.

    21

    21

    nn

    XXPC

    Es la media ponderada de las proporciones muestrales.

    1X Es la cantidad de xitos de la primera muestra.

    2X Es la cantidad de xitos de la segunda muestra.

    21yPP Proporcin de xitos de la poblacin uno y dos respectivamente.

    Ejemplo

    Una fbrica de perfumes ha desarrollado un nuevo producto. Varias pruebas de

    comparacin indican que el perfume tiene un buen potencial en el mercado. Sin

    embargo el departamento de mercadotecnia y publicidad quieren planear una

    estrategia de manera que el producto llegue e impresione al sector ms grande

    posible del pblico comprador. Una de las preguntas es si prefiera el perfume una

    proporcin mayor de mujeres jvenes o una proporcin mayor de mujeres

    maduras. Por tanto, existen dos poblaciones: una que consta de mujeres jvenes

    y otra de damas maduras. Se us una prueba estndar de aroma. Se

    seleccionaron aleatoriamente damas y se les pidi que olieran varios perfumes,

    incluyendo el que suelen usar, y por supuesto el nuevo perfume. La persona que

    realiza la prueba es la nica que conoce el nombre de los perfumes. Cada mujer

    selecciona el perfume que le agrada ms.

    La hiptesis nula se plantea diciendo que no hay diferencia entre la proporcin de

    mujeres jvenes y maduras que prefieren el nuevo perfume. La hiptesis

    alternativa se plantea que las dos proporciones no son iguales.

    211

    21

    :

    :

    PPH

    PPHo

    Se designa P subuno como la proporcin de mujeres jvenes y P subdos como la

    proporcin de mujeres maduras.

    Se decidi un nivel de significancia del 0.05.

    Paso 1: Planteamiento de hiptesis

    Paso 2: Nivel de significancia

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    32

    Los planes son tomar una muestra al azar de 100 mujeres jvenes designada por

    n subuno y una muestra de 200 mujeres mayores designada como n subdos. Los

    resultados una vez hecha el experimento dio los siguientes resultados: de las 100

    mujeres jvenes 20 eligieron el nuevo perfume, designando este valor como X

    subuno; y de las 200 mujeres maduras 100 prefirieron el nuevo perfume,

    designando este valor como X subdos.

    La proporcin ponderada, da como resultado:

    40.0300

    120

    200100

    10020

    21

    21

    nn

    XXPC

    0.506.0

    30.0

    200

    )40.01(40.0

    100

    )40.01(40.0

    200100

    10020

    )1()1(

    21

    21

    n

    PP

    n

    PP

    PPZ

    CCCC

    Los valores crticos para un nivel de significancia del 5% son 1.96 y +1.96. Igual

    que en los otros casos, la siguiente grafica establece la regla de decisin:

    Grfico No. 11. Prueba Bilateral (a dos colas)

    El valor de Z calculado de 5.0 se encuentra en el rea de rechazo de la hiptesis

    nula. Por tanto, la hiptesis que las proporciones son iguales se rechaza a un nivel

    del 5% de significancia.

    Paso 3: Estadstico de prueba (o calculado)

    Paso 4: Estadstico terico (o tabulado) y regla de decisin

    Paso 5: Tomar la Decisin

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    33

    Ejemplo

    Dos lotes de frutas conformados cada uno por 250 unidades son tratados y

    almacenados en iguales condiciones salvo que el lote No 1 est a temperatura

    ligeramente inferior que el lote No 2. Pasado un tiempo se encuentra que el lote

    No 1 hay 225 frutas sanas y en el lote No 2 hay 200 sanas. Probar la hiptesis que

    la temperatura ms baja favorece la conservacin de las frutas al nivel de

    significacin de 0.05.

    211

    21

    :

    :

    PPH

    PPHo

    Utilizando la distribucin de probabilidad normal con ensayo unilateral a la derecha

    con un nivel significativo de 0.05, el valor critico es de 1.645.

    13.30319.0

    10.0

    250

    )15.0)(85.0(

    250

    )15.0)(85.0(

    80.090.0

    )1()1(

    21

    21

    n

    PP

    n

    PP

    PPZ

    CCCC

    85.0250250

    200225

    21

    21

    nn

    XXPC

    Grfico No. 12. Prueba unilateral superior (cola derecha)

    Paso 1: Planteamiento de hiptesis

    Paso 2: Nivel de significancia

    Paso 3: Estadstico de prueba (o calculado)

    Paso 4: Estadstico terico (o tabulado) y regla de decisin

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    34

    Como 3.12>1.645 se rechaza la hiptesis nula y se acepta la hiptesis alternativa.

    La temperatura ms baja favorece la conservacin de las frutas.

    Leccin 19: Pruebas para la media y la diferencia de medias

    (muestras pequeas).

    19. Pruebas de hiptesis para pequeas muestras.

    Ahora veamos el caso en que las muestras son pequeas, 30n , pero donde la

    distribucin muestral del estadstico de prueba se puede aproximar a una

    distribucin t student. Dicha aproximacin es posible cuando los valores

    subyacentes de la poblacin son casi normalmente distribuidos, y cuando

    intervienen poblaciones donde las desviaciones estndar, aunque desconocidas,

    se sabe que son iguales. Habiendo estudiado pruebas para muestras grandes con

    todo detalle, podemos restringirnos a ejemplos en donde se aplique este tipo de

    distribucin.

    19.1. Prueba para media (pequea muestra)

    Si tambin es razonable suponer que la poblacin tiene una distribucin normal de

    probabilidad, con la distribucin t se puede hacer inferencia a cerca del valor de la

    media de la poblacin.

    Ejemplo

    Una compaa de seguros revela que en promedio la investigacin por demandas

    en accidentes y todos los trmites tiene un costo promedio de 60 unidades

    monetarias. Este costo se considera exagerado comparado con el de otras

    compaas del mismo tipo. A fin de evaluar el costo se seleccion una muestra

    aleatoria de 26 demandas recientes y se realiz el estudio de costos. Se concluy

    que el costo promedio es de 57 unidades monetaria con una desviacin estndar

    de 10 unidades monetarias. Con un nivel de significancia del 0.01 se puede decir

    que el estudio revel un costo menor al establecido por la empresa?

    La hiptesis nula se plantea en el sentido que el costo promedio es de 60

    Paso 5: Tomar la Decisin

    Paso 1: Planteamiento de hiptesis

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    35

    unidades monetarias. La hiptesis alternativa que el costo es menor a 60 unidades

    monetarias. Esto se expresa en la siguiente forma:

    60:

    60:

    1

    0

    H

    H

    La prueba es de una cola a la izquierda, segn el planteamiento de la hiptesis

    alternativa.

    Se usa un nivel de significancia del 0.01 con una distribucin t, en consideracin

    a que la muestra en menor a 30, es decir, es una pequea muestra.

    Utilizando los datos de la muestra, se utiliza la siguiente frmula como estadstico

    de prueba:

    530.1

    26

    10

    6057

    n

    S

    Xt

    Los valores crticos para la distribucin t se encuentran en la tabla

    correspondiente (anexo D), con 25 grados de libertad (26 1), prueba de una cola

    a un nivel de significancia de 0.01, correspondiendo un valor crtico de 2.485. En el

    siguiente figura se indica el presente planteamiento:

    Grfico No. 13. Prueba unilateral superior (cola derecha)

    Puesto que 1.53 se encuentra en la regin de aceptacin de la hiptesis nula a

    Paso 2: Nivel de significancia

    Paso 3: Estadstico de prueba (o calculado)

    Paso 4: Estadstico terico (o tabulado) y regla de decisin

    Paso 5: Tomar la Decisin

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    36

    un nivel del 1% de significancia, se concluye que los costos para los tramites de

    seguros de accidente no se han disminuido y se mantiene a un nivel promedio de

    costo de 60 unidades monetarias.

    Ejemplo

    Una empresa produce elementos con un promedio de 43 mm de largo. Un ajuste

    en las mquinas de produccin supone que dicho estndar ha cambiado. Se

    quiere probar sta hiptesis con un nivel de significancia del 0.02.

    Para afrontar el problema Ud. selecciona una muestra aleatoria de 12 elementos y

    procede a medir su largor con los siguientes resultados:

    Tabla No. 4. Seleccin muestra aleatoria

    Elemento 1 2 3 4 5 6 7 8 9 10 11 12

    Medida 42 39 42 45 43 40 39 41 40 42 43 42

    Plantea sus hiptesis:

    43:

    43:

    1

    0

    H

    H

    Como hiptesis nula que no se ha producido un cambio en las dimensiones del

    producto. Como hiptesis alternativa que se ha producido un cambio en las

    caractersticas internas del producto debido a los ajustes en las mquinas.

    Se dispone a probar la hiptesis con un nivel de significancia del 0.02, utilizando la

    distribucin t porque es una pequea muestra, con 11 grados de libertad

    aplicando el principio de (n- 1) y clculo para dos colas puesto que la hiptesis

    alternativa est planteada desde el punto de vista de diferente.

    El estadstico de prueba a utilizar es el siguiente:

    Paso 1: Planteamiento de hiptesis

    Paso 2: Nivel de significancia

    Paso 3: Estadstico de prueba (o calculado)

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    37

    n

    S

    Xt

    Procede al clculo de la media y la desviacin estndar muestral:

    5.4112

    498

    n

    XX

    78.1

    11

    35

    1

    2

    n

    XXS

    Con la informacin anterior, aplica la frmula del estadstico de prueba:

    92.2

    12

    78.1

    0.435.41

    n

    S

    Xt

    Para aplicar la regla de decisin, muestra en el siguiente grfico el planteamiento

    anterior:

    Grfico No. 14. Prueba Bilateral (a dos colas)

    La hiptesis nula que la media poblacional es 43 mm se rechaza a un nivel de

    significancia del 0.02 y se acepta la hiptesis alternativa, concluyendo que los

    ajustes en las mquinas s causaron un cambi en la calidad de control en el

    Paso 4: Estadstico terico (o tabulado) y regla de decisin

    Paso 5: Tomar la Decisin

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    38

    largor de los diferentes elementos que se producen.

    Anteriormente se analiz ampliamente la prueba de hiptesis para cuando las

    muestra son pequeas, es decir, el tamao de la muestra es menor a 30. A

    continuacin se propone un ejercicio de aplicacin, para que Ud. los desarrolle

    atendiendo las sugerencias dadas.

    19.2. Prueba para dos medias muestrales (pequea muestra)

    Una prueba que utiliza la distribucin t tambin puede aplicarse para comparar dos

    medias muestrales que tienen las siguientes caractersticas:

    1. Las poblaciones deben de distribuirse normalmente. 2. Las poblaciones deben de ser independientes. 3. Las varianzas de las poblaciones deben de ser iguales. 4. Las muestras tienen menos de 30 observaciones. 5. Las desviaciones estndar de las poblaciones no se conocen.

    Cuando se est frente a estas caractersticas, el estadstico de prueba a utilizar es

    el siguiente:

    2121

    2

    2

    21

    2

    1

    2121

    11

    2

    11

    )(

    nnnn

    nSnS

    XXt

    Ecuacin No.9

    Dnde:

    21 XyX Las medias de las muestras

    21ynn Los tamaos de las muestras

    2

    2

    2

    1 ySS Las varianzas de las muestras

    G.L. Grados de libertas, igual a = 221 nn

    Ejemplo

    Se ha propuesto realizar un examen de estadstica a dos grupos de estudiantes,

    con el propsito de saber si los grupos tienen similares conocimientos sobre

    pruebas de hiptesis. Para ello Ud. seleccion el grupo A compuesto de 5

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    39

    estudiantes de educacin a distancia y el grupo B compuesto por 6 estudiantes de

    educacin presencial, y los someti a la prueba, dando como resultado los

    siguientes tiempos en minutos:

    Tabla No. 5. Prueba para dos grupos

    Educacin a distancia Educacin presencial

    2

    4

    9

    3

    2

    3

    7

    5

    8

    4

    3

    Probar con un nivel de significancia del 0.10 si existe alguna diferencia de

    habilidad en los conocimientos de los dos grupos.

    Las hiptesis las plantea en los siguientes trminos:

    211

    21

    :

    :

    H

    Ho

    La hiptesis nula consistente en que los dos grupos no tienen alguna diferencia en

    la habilidad de conocimiento, y la hiptesis alternativa en que existe diferencia

    entre los grupos sobre la habilidad en la aplicacin de los conocimientos.

    Prueba la hiptesis con un nivel de significancia del 10%, utilizando la distribucin

    t student porque las muestras son menores que 30, con 9 grados de libertad (5+6

    2) y prueba de dos colas porque la hiptesis alternativa est planteada en

    funcin de diferente.

    Para el clculo del estadstico de prueba se requiere estimar las medias de los

    grupos y sus varianzas, los cuales se presentan en el siguiente cuadro:

    Paso 1: Planteamiento de hiptesis

    Paso 2: Nivel de significancia

    Paso 3: Estadstico de prueba (o calculado)

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    40

    Tabla No.6. Resultados para los grupos de estudiantes

    Grupo estudiantes a distancia Grupo presencial

    Media = 4 Media = 5

    Varianza = 8.5 Varianza = 4.4

    Muestra = 5 Muestra = 6

    6620.0

    6

    1

    5

    1

    265

    164.4155.8

    54

    11

    2

    11

    2121

    2

    2

    21

    2

    1

    21

    nnnn

    nSnS

    XXt

    Grfico No. 15. Prueba Bilateral (a dos colas). Diferencia de dos medias

    La decisin es no rechazar la hiptesis nula debido a que el valor del estadstico

    de prueba 06620 ha cado en la zona de aceptacin de dicha hiptesis,

    concluyendo que no existe diferencia en la habilidad de aplicacin de

    conocimientos entre los estudiantes a distancia y los estudiantes de presencial,

    con un nivel de significancia del 10%.

    Paso 4: Estadstico terico (o tabulado) y regla de decisin

    Paso 5: Tomar la Decisin

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    41

    19.3. Prueba de hiptesis para observaciones pareadas o relacionadas

    La caracterstica principal para aplicar este tipo de prueba, es que las muestras

    sean dependientes y el tamao de cada muestra sea inferior a 30 elementos

    seleccionados.

    Ejemplo

    Un grupo de alumnos registra un ndice de puntuacin en estadstica, que se

    considera muy bajo para aceptarlos al siguiente nivel. Proceden a tomar un curso

    de nivelacin, obteniendo los siguientes registros antes y despus del curso. Con

    un nivel de significancia del 0.05 probar si el curso de nivelacin mejor las

    condiciones del grupo.

    Antes 128 105 119 140 98 123 127 115 122 145

    Despus 135 110 131 142 105 130 131 110 125 149

    En estas condiciones hay un par de ndices de eficiencia para cada miembro del

    grupo, antes y despus del curso,; ste conjunto de pares es lo que se denomina

    muestra por pares. La prueba de hiptesis que se realiza para determinar si hay

    diferencia entre los ndices antes y despus del curso de nivelacin, es lo que

    denomina prueba de diferencia por pares. Obsrvese que las dos muestras, una

    antes y una despus, dependen entre s, debido a que los mismos alumnos estn

    en ambas pruebas, por tanto son dependientes.

    La muestra est constituida por la diferencia entre los registros de puntuacin

    antes y despus del programa. As, la media de las diferencias entre los registros

    de rendimiento, se designa mediante d . Se presenta a continuacin el

    procedimiento de la prueba:

    0:

    0:

    1

    d

    d

    H

    Ho

    La hiptesis nula plantea que no hay diferencia de eficiencia despus del curso. La

    hiptesis alternativa plantea que el programa de nivelacin mejor el nivel de los

    estudiantes.

    Paso 1: Planteamiento de hiptesis

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    42

    Se usa un nivel de significancia del 5%, la muestra seleccionada es de 10

    estudiantes considerada pequea muestra, la distribucin de probabilidad a utilizar

    es la t student, con n 1 grados de libertad.

    El estadstico de prueba a utilizar es:

    n

    S

    dt

    d

    Ecuacin No.10

    Dnde:

    d : es la media de la diferencia entre las observaciones por pares.

    dS : es la desviacin estndar de las diferencias entre las observaciones por

    pares.

    n: es el nmero de observaciones por pares.

    G.L: son los grados de libertad (n 1)

    Para determinar el clculo del estadstico de prueba se requiere conocer la media

    de las diferencias y su desviacin estndar, para lo cual procedemos a su clculo

    utilizando el siguiente cuadro:

    Tabla No. 7. Calculo estadstico sobre diferencia de medias

    Muestra Registro

    antes

    Registro

    despus

    Diferencia

    d

    Diferencia al

    cuadrado

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    128

    105

    119

    140

    98

    123

    127

    115

    122

    145

    135

    110

    131

    142

    105

    130

    131

    110

    125

    149

    7

    5

    12

    2

    7

    7

    4

    -5

    3

    4

    49

    25

    144

    4

    49

    49

    16

    25

    9

    16

    Sumas 46 386

    Paso 2: Nivel de significancia

    Paso 3: Estadstico de prueba (o calculado)

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    43

    60.410

    46

    n

    dd

    40.4

    110

    10

    46386

    1

    22

    2

    n

    n

    dd

    Sd

    Aplicando la frmula, se obtiene:

    30.3

    10

    4.4

    6.4

    n

    S

    dt

    d

    El valor crtico de t para esta prueba de una cola a la derecha, es 1.833 que se

    obtiene en la tabla de la distribucin t (anexo D), ubicando en la columna de la

    izquierda 9 grados de libertad y recorriendo a la derecha hasta la columna de una

    cola con 0.05 nivel de significancia. En la siguiente grfica se indica lo expuesto:

    Grfico No. 16. Prueba unilateral superior (cola derecha). Prueba de hiptesis por pares

    Como el valor t (3.30) est en la regin de rechazo de la hiptesis nula, entonces

    se acepta la hiptesis alternativa y se concluye que el programa de adiestramiento

    para los alumnos fue eficaz para aumenta su eficiencia.

    Paso 4: Estadstico terico (o tabulado) y regla de decisin

    Paso 5: Tomar la Decisin

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    44

    Leccin 20: Pruebas para la varianza

    20. Pruebas de hiptesis para la varianza

    Como su nombre lo indica, consiste en comparar tres o ms medias de una

    muestra para identificar su homogeneidad o variabilidad. esta tcnica estadstica,

    normalmente es utilizada para analizar resultados en la investigacin con diseos

    experimentales y cuasi-experimentales; muchas veces necesitamos comparar dos

    o ms distribuciones que corresponden a variaciones de una misma variable

    dependiente, afectada por una o ms variables independientes.

    Comparacin de dos varianzas poblacionales

    Su utilidad radica en determinar si una poblacin normal tiene ms variacin que

    otra poblacin que se considera tambin normal. Como ejemplo se pueden

    mencionar, si dos mquinas dedicadas a producir cierto artculo de precisin

    pueden ser confiables en el control de calidad, es decir, el producto tiene el mismo

    largor, el mismo dimetro y las variaciones presentadas son similares.

    Ejemplo

    La tasa media de rendimiento de dos tipos de acciones se puede apreciar en el

    siguiente cuadro, se desea saber si el rendimiento promedio es diferente a un nivel

    de significancia del 0.10.

    Tabla No. 8. Tasa de rendimiento de las acciones

    Acciones Rendimiento

    promedio

    Desviacin

    estndar

    Tamao de la

    muestra

    Tipo A

    Tipo B

    56

    58

    12

    5

    7

    8

    2

    2

    2

    11

    2

    2

    2

    1

    :

    :

    H

    Ho

    La variacin de los rendimientos promedios de las acciones es igual como la

    hiptesis nula. La variacin de los rendimientos de las acciones es diferente como

    Paso 1: Planteamiento de hiptesis

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    45

    hiptesis alternativa.

    Se selecciona un nivel de significancia de 0.01 utilizando la distribucin F.

    El valor del estadstico de prueba sigue una distribucin F, con la siguiente

    relacin:

    76.55

    122

    2

    2

    2

    2

    1 S

    SF

    Se acostumbra a colocar el mayor valor en el numerador, de tal forma que la

    relacin siempre ser por lo menos igual a uno.

    El valor crtico se obtiene del Anexo F, para lo cual se reproduce una parte de la

    tabla. Debido a que utiliza una prueba de dos colas, el nivel de significancia para

    cada cola ser de:

    05.02

    10.02

    .

    Grados de libertad para el numerador: n 1 = 7-1 = 6

    Grados de libertad para el denominador: n 1 = 8 1 = 7

    Para encontrar el valor crtico, se incorpora parte de la tabla F:

    Tabla No. 9. Grados libertad numerador denominador

    GRADOS LIBERTAD NUMERADOR

    G.L

    Denominador

    5 6 7 8

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    230

    19.3

    9.01

    6.26

    5.05

    4.39

    3.97

    3.69

    3.48

    3.33

    234

    19.3

    8.94

    6.16

    4.95

    4.28

    3.87

    3.58

    3.37

    3.22

    2.7

    19.4

    8.89

    6.09

    4.88

    4.21

    3.79

    3.50

    3.29

    3.14

    239

    19.4

    8.85

    6.04

    4.82

    4.15

    3.73

    3.44

    3.23

    3.07

    Paso 2: Nivel de significancia

    Paso 3: Estadstico de prueba (o calculado)

    Paso 4: Estadstico terico (o tabulado) y regla de decisin

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    46

    Dado que el valor de la distribucin F (5.76) se encuentra a la derecha del valor

    crtico (3.87), se acepta la hiptesis alternativa y se concluye que los rendimientos

    promedios de las acciones son diferentes.

    Ejercicios propuestos

    A continuacin se proponen dos ejercicios para que los desarrolle aplicando las

    sugerencias propuestas:

    1. Se lanza una moneda 200 veces y se obtienen 105 caras. Si el nivel de

    significancia es de 1% probar la hiptesis que la probabilidad de caras es de

    contra la hiptesis:

    a. Que es mayor de . b. Que es menor de . c. Que es diferente de .

    Sugerencia: En este caso utilice las propiedades de la distribucin binomial donde:

    1002

    1200 np 07.72121200 qpn

    qpnpnX

    Z

    2. Un fabricante de un empaque para harinas garantiza que tiene una efectividad

    de 95% en la proteccin contra la humedad durante un perodo de 6 meses. Se

    observ una muestra de 100 paquetes encontrndose resultados positivos en

    85 paquetes. Comprobar si la afirmacin del fabricante es verdadera con un

    nivel de significancia de 0.05.

    Sugerencia: Utilizar prueba de una proporcin.

    3. Un fabricante de pastas alimenticias sostiene que el contenido medio de

    protenas del producto es de 10.7. Un anlisis de una muestra de 8 paquetes

    dio como resultado un contenido medio de 10% con una desviacin de 1. Se

    puede aceptar como verdadera la afirmacin del fabricante a un nivel de 0.01?

    Sugerencia:

    Utilizar el siguiente estadstico de prueba:

    n

    S

    Xt

    Un ensayo unilateral con cola a la izquierda con un nivel significativo de 0.01 el

    valor crtico con 7 grados de libertad es igual a 3.0

    Paso 5: Tomar la Decisin

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    47

    CAPITULO CINCO: ANLISIS DE VARIANZA

    Introduccin.

    En esta unidad se prosigue con el anlisis de pruebas de hiptesis. Recuerde que

    en captulo anterior se examin la teora general de la prueba de hiptesis y se

    describi el caso en el que fue seleccionada una muestra grande a partir de la

    poblacin. Se emple la distribucin Z como base para determinar si es razonable

    concluir que una media calculada a partir de una muestra, proviene de una

    poblacin hipottica. Adems se prob si dos medias muestrales provienen de

    poblaciones iguales. Tambin se efectuaron pruebas de una y dos muestras para

    relaciones proporcionales utilizando la distribucin normal como entidad

    estadstica de prueba. Se utiliz la distribucin t como entidad estadstica de

    prueba para muestras pequeas (con menos de 30 observaciones)

    Cuando se desea conocer la homogeneidad que existe entre tres o ms medias

    muestrales, se procede a determinar la variabilidad entre esas medias, tcnica que

    se conoce como anlisis de varianza. Es decir, cuando productos o individuos

    son sometidos a tratamientos determinados para ver cmo stos influyen en

    resultados o comportamientos, lo ms aconsejable es utilizar la tcnica de anlisis

    de varianza.

    El objetivo del anlisis de varianza es determinar cules son las variables

    independientes de importancia en un estudio, y en qu forma interactan y afectan

    la respuesta.

    El Anlisis de varianza en el presente capitulo se encuentra dividido de la

    siguiente forma.

    Grfico No. 17. ANOVA

    ANALISIS DE VARANIZA

    De un Factor De dos Factores

    Con interaccin

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    48

    Objetivo general.

    Reconocer la importancia principios en que se basa y campos de aplicacin de la

    tcnica de Anlisis de Varianza.

    Objetivos especficos.

    Comprender la nocin general del anlisis de varianza.

    Realizar una prueba de hiptesis para determinar si dos varianzas

    muestrales provienen de poblaciones iguales.

    Probar e interpretar hiptesis aplicando el anlisis simple de varianza.

    Establecer y organizar datos en una tabla de ANOVA de una y de dos

    direcciones.

    Plantear, probar e interpretar hiptesis de anlisis de varianza de dos

    factores de diseo de bloque aleatorizado.

    Plantear, probar e interpretar hiptesis de anlisis de varianza de dos

    factores con interaccin o diseo de factorial.

    Definir los trminos tratamientos y bloques.

    Dar a conocer el manejo de la herramienta de Anlisis de varianza en

    Excel.

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    49

    Leccin 21: Generalidades

    Como su nombre lo indica, el ANALISIS DE VARIANZA, se utiliza para probar

    hiptesis sobre la igualdad de tres o ms medias poblacionales. Al comparar las

    varianzas muestrales, es posible sacar una conclusin o inferencia sobre los

    valores relativos de las medias poblacionales.

    21. Comparacin de ms de dos poblaciones

    Del anlisis de varianza, podemos decir que esta tcnica estadstica normalmente

    es utilizada para analizar resultados en la investigacin con diseos

    experimentales y cuasi-experimentales; muchas veces necesitamos comparar dos

    o ms distribuciones que corresponden a variaciones de una misma variable

    dependiente, afectada por una o ms variables independientes.

    El anlisis de varianza estudia la relacin entre una variable cualitativa (o variable

    independiente) con ms de dos categoras y una variable cuantitativa (o variable

    dependiente).

    Ejemplo

    Un agrnomo desea estudiar el rendimiento (en libras) de cuatro variedades

    diferentes de calabacitas.

    La variable cualitativa es el factor de este experimento, que en este caso es la

    variedad de calabacita, los niveles son cada una de las cuatro variedades. Y la

    variable cuantitativa es el rendimiento (en libras).

    El factor corresponde a la variable cualitativa y los niveles a las

    categoras de esa variable

    El anlisis de varianza tiene como objetivo identificar, si hay evidencia de una

    diferencia significativa entre los niveles, basados en las medias muestrales.

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    50

    21.1. Variabilidad producto de factores controlables e incontrolables

    Tericamente es posible dividir la variabilidad del resultado de un experimento en

    dos partes: la originada por factores o tratamientos que influyen directamente en el

    resultado del experimento, y la producida por el resto de factores desconocidos o

    no controlables, que se conoce con el nombre de error experimental. En el

    ejemplo anterior los factores desconocidos pueden ser: la humedad, la

    temperatura y plagas entre otros.

    21.2. Tipos de modelos

    Modelo de efectos fijos: Un modelo de anlisis de varianza es de efectos

    fijos cuando los resultados obtenidos slo son vlidos para esos determinados

    niveles del factor estudiado y lo que ocurra a otros niveles del factor puede ser

    diferente.

    Modelo de efectos aleatorios: Un modelo de anlisis de varianza es de

    efectos aleatorios cuando los resultados obtenidos son vlidos para cualquier

    nivel del factor estudiado.

    Modelo replicado: Un modelo es replicado si el experimento se repite varias

    veces para cada nivel del factor; en caso contrario se dice que el modelo es

    por unidad de casilla.

    21.3. Supuestos Del Anlisis De Varianza

    Para cada poblacin la variable de respuesta est normalmente distribuida.

    La varianza de la variable respuesta es la misma para todas las

    poblaciones.

    Las observaciones deben ser independientes.

    Leccin 22. Anlisis de Varianza de un Factor

    El anlisis de varianza simple se presenta cuando se tiene un solo factor

    estudiado en sus distintos niveles que influyen sobre una variable respuesta que

    mide el resultado del experimento, y el resto de los factores conforman el error

    experimental influyendo sobre la variable respuesta de manera no controlable. El

    factor se presenta con j niveles, y dentro de cada nivel se analiza una serie de

    observaciones del experimento en control (unidades experimentales) y su efecto

    sobre la variable respuesta, es decir, para cada nivel se repite el experimento

    varias veces (replicacin).

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    51

    El anlisis de varianza descompone la variabilidad del resultado de un

    experimento en componentes independientes (variacin total descompuesta en

    variaciones particulares).

    Ejemplo

    Se puede considerar los rendimientos de un mismo cultivo en parcelas diferentes,

    que aunque labradas en las mismas condiciones, producen cosechas que son

    distintas. La variabilidad de rendimientos es producida por factores o tratamientos

    controlables (abono, riego, etc.), donde cada factor o tratamiento puede presentar

    diferentes niveles (diferentes cantidades o calidades de abono, distinta intensidad

    de riego); tambin puede ser producida por otros factores o tratamientos no

    controlables (humedad relativa, clima, plagas, etc.).

    Tabla No. 10. Observaciones por cada nivel

    Nivel1 Nivel 2 Nivel j

    X11 X12 X1j X21 X22 X2j

    .

    .

    .

    .

    .

    .

    . . .

    Xi1

    Xi2

    Xij

    ijX : Observacin i-sima de la variable respuesta relativa al j-simo nivel de

    factor.

    En el ejemplo anterior, ijX es el rendimiento obtenido (variable respuesta) bajo el

    nivel j del factor (abono) en la observacin i-sima (Para cada nivel j de factor se

    repite el clculo de rendimiento veces para recoger el efecto del error

    experimental).

    : Tamao de la muestra para cada nivel (categoras de la variable cualitativa)

    En esta seccin se considera el anlisis de varianza de un solo factor, en el cual

    solo interviene en el experimento un solo tipo de tratamiento. Cuando se desea

    contrastar las hiptesis sobre la diferencia global entre tres o ms medias de

    poblacin, se aplica la distribucin de probabilidad F encontrando en cociente de

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    52

    dos varianzas calculadas a partir de los datos experimentales. El modelo lineal en

    que se basa el mtodo de anlisis de varianza de un solo factor es:

    ijiiJX

    Ecuacin No.11

    Dnde:

    Es la i-sima observacin del j-simo nivel experimental.

    La media de todas las observaciones de todas las poblaciones j del tratamiento. Es

    una constante.

    Efecto del tratamiento en la poblacin j. Son variables aleatorias independientes.

    Error aleatorio asociado a la i-sima observacin del factor de la poblacin j

    El efecto i del tratamiento o factor es la diferencia entre la gran media y la media

    J de la poblacin en tratamiento J, esto es:

    Ji .

    Ecuacin No.12

    Por consiguiente, si hay J tratamientos en un experimento, la suma de todos los J

    efectos de los tratamientos debe ser igual a cero:

    0111

    JJ

    J

    J

    J

    J

    J

    J

    J

    i

    Ecuacin No.13

    El ltimo trmino iK refleja la variabilidad dentro de cada una de las poblaciones

    en tratamiento, y su presencia se atribuye al proceso aleatorio, y se interpreta

    como lo resultante de la diferencia entre el resultado observado y la media de la

    poblacin del tratamiento:

    jijiJ X

    Ecuacin No.14

    El valor esperado o la esperanza de ij es igual a cero.

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    53

    El modelo se basa en las siguientes suposiciones:

    Admite que los errores aleatorios ij tienen una distribucin normal

    para cada poblacin en tratamiento J.

    Admite que los errores iJ se distribuyen independientemente tanto

    entre poblaciones en tratamiento como dentro de ellas.

    Acepta que la varianza 2 del error permanece constante para cada

    una de las poblaciones.

    Hiptesis del ANOVA de un factor.

    El anlisis de varianza se usa para probar la igualdad de K medias poblacionales

    y la forma general del planteamiento de las hiptesis es:

    Dnde: j = Media de la j-sima poblacin.

    La media general de las muestra, est representada por X , y es la suma de todas

    las observaciones divida entre la cantidad total de las mismas, expresada de la

    siguiente forma:

    Media General:

    t

    K

    j

    n

    i

    ij

    n

    X

    X

    j

    1 1

    Ecuacin No.15

    Dnde: Kt nnnn ...21

    Si el tamao de cada muestra es knnn T , , la ecuacin de la media general se

    reduce a:

    K

    X

    K

    n

    X

    n

    X

    X

    K

    j

    j

    K

    j

    n

    i

    ij

    t

    K

    j

    n

    i

    ij

    jj

    11 11 1

    Ecuacin No.16

    En otras palabras, cuando los tamaos de muestra son iguales, la media general

    muestral es justamente el promedio de las medias de las K muestras.

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    54

    Si supone que se ha tomado una muestra aleatoria simple de tamao jn de cada

    una de las K poblaciones, se tiene:

    ijX es la i-sima observacin del grupo, nivel j.

    jn es el nmero de observaciones del grupo, nivel j.

    n es el total del nmero de observaciones en todos los grupos combinados.

    K Es el nmero total de grupos, niveles del factor de inters.

    to. tratamiensimo-j del muestra la de MediaX j

    Pasos para la Realizar un anlisis de varianza.

    1. Establecer la hiptesis nula y alterna.

    2. Establecer el nivel de significancia

    3. Realizar el ANOVA

    4. Calcular el valor F o el valor crtico correspondiente al nivel de confianza

    fijado con los grados de libertad.

    5. Hallar el estadstico de prueba

    6. Tomar la decisin teniendo en cuenta que:

    crticoValor B

    A si H Rechaza 0

    Grfico No. 18. Distribucin F.

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    55

    Ejemplo 1

    Suponga que una empresa tiene tres dependencias diferentes en donde produce

    tubos de iluminacin, y desea verificar el control de calidad en cuanto a duracin

    se refiere de las bombillas, y para ello toma una muestra de 6 unidades de cada

    factora y las somete a desgaste hasta que dejan de iluminar con los siguientes

    resultados en horas:

    Tabla No. 11. Observaciones por cada nivel

    Observacin Planta 1 Planta 2 Planta 3 Total

    1 2 3 4 5 6

    85 75 82 76 71 85

    71 75 73 74 69 82

    59 64 62 69 75 67

    JX 79 74 66 73

    2

    JS 34 20 32

    JS 5.83 4.47 5.66

    Jn 6 6 6 18

    n

    J

    iJX!

    474 444 396 1314

    La media general es igual a:

    733

    219

    18

    667479

    3

    1

    J

    J

    J

    n

    X

    X

    Se observa que se obtienen las medias para cada tratamiento (79, 74 y 66) y una

    media general (73). Para llevar a cabo la prueba de la igualdad de las medias de

    la poblacin, se subdivide la variacin total en dos mediciones:

    Diferencia entre los grupos.

    Diferencia dentro de los grupos.

    La varianza de la muestra total se particiona en la varianza dentro de las plantas y

    la varianza entre las plantas, tal como se indica en el siguiente grfico:

    Grfico No. 18. Distribucin F.

    Variacin

    Total (VT) =

    Variacin Dentro

    del Grupo (VDG) + Variacin Entre

    Grupo (VEG)

  • UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA

    CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

    56

    Variacin total (VT)

    2

    1 1

    k

    j

    n

    i

    ij XXVT

    Ecuacin No.17

    6

    1 22

    22222

    3

    1 94673647359

    ...73757371...73757385

    i

    ij

    J

    XXVT

    Variacin dentro del grupo (VD