08 inferencia estadistica 2014

Upload: blajus1

Post on 11-Oct-2015

28 views

Category:

Documents


2 download

TRANSCRIPT

  • DEFINICIONSe define como un proceso por medio del cul se elaboran conclusiones probabilsticas en relacin a una poblacin, valindose de la informacin proporcionada por una muestra extrada de esa poblacin. Siendo las poblaciones descritas por medidas numricas descriptivas llamadas parmetros, la inferencia acerca de una poblacin es posible haciendo inferencias acerca de sus parmetros usando los estadsticos.

  • MuestraParmetros

    Estadsticos

  • reas de la inferencia estadsticaEstimacin de parmetrosResuelve situaciones en las que se busca conocer un dato o medida descriptiva de determinada poblacin (parmetro) a partir de datos o medida descriptiva de una muestra (estadstico) representativa.

    Prueba de hiptesisSirve para decidir si se rechaza o no una hiptesis estadstica establecida basndose en la informacin de una muestra. Se realiza una contrastacin de informacin entre la hiptesis estadstica existente y los resultados obtenidos de la muestra, para una corroboracin.

  • 1-ESTIMACIONLa estimacin es el proceso de utilizar datos muestrales para estimar los valores de parmetros desconocidos de una poblacin.La estimacin es un instrumento bsico para la toma de decisiones.La estimacin de parmetro puede adoptar la forma de un solo punto o un intervalo.

  • DATOS CONTINUOSPOBLACION

    MUESTRA

  • DATOS DICOTOMICOSPOBLACIONMUESTRA

  • 1.1Tipo de estimacin de parmetrosa) La estimacin por punto de parmetrosEl parmetro se obtiene directamente de los datos muestrales, como un nico valor. Especficamente, los estadsticos son introducidos en la frmula establecida como estimador para obtener el parmetro:n: # de muestra; z: desviacin normal (segn el grado de confianza)

  • Ejemplo 1:Se desea estudiar el salario promedio anual de los profesionales de salud de una compaa farmacutica. Para ello se tom una muestra de n=100 profesionales de la compaa, se registra el salario anual de cada profesional de salud en la muestra y se calculan la media y la desviacin estndar muestral de los salarios obtenindose:x= $7,750ys= $900Solucin::Salario promedio anual = x = $7,750

    Se estima que el salario promedio anual es de $7,750

  • Ejemplo 2: estimacin de una media aritmtica Se tiene inters en estimar la altura media de los alumnos de la Facultad de Medicina de la USMP. Se recurre a una muestra aleatoria de 36 alumnos y se obtienen los siguientes resultados:x= 170 cm;s= 20 cmLa estatura media de la poblacin de alumnos se representa con y la estimacin por punto de este parmetro est dada por:= 170 cm.

  • Ejemplo 3: estimacin de una proporcin Se tiene inters en estimar la proporcin de nios desnutridos menores de 5 aos e una determinada comunidad. Se selecciona una muestra de 100 nios menores de 5 aos y se determina que 45 estn desnutridos.

    SolucinSe quiere estimar una proporcin de poblacin (P), es decir, el cociente entre el nmero de nios menores de 5 aos desnutridos y el nmero de nios menores de 5 aos de la poblacin. El estimador para la estimacin por punto de este parmetro es la proporcin muestral (p), que equivale al cociente entre el nmero de nios menores de 5 aos desnutridos y el nmero de nios menores de 5 aos de la muestra. Por lo tanto: P = 0.45.

  • b- Estimacin por intervaloConsiste en determinar, mediante un estimador, 2 valores numricos llamados lmite inferior (L1) y lmite superior (L2). Con un cierto grado de confianza, se espera que estos lmites contengan el valor del parmetro que se quiere hallar. Es decir, el valor del parmetro debera encontrarse entre el lmite inferior y lmite superior obtenidos de la estimacin. Cabe mencionar que no todos los intervalos obtenidos de un estimador incluirn realmente al parmetro. Es por ello que se aplica el concepto de nivel de confianza.

  • PROPIEDADES:

    El parmetro poblacional debe ubicarse dentro del intervalo.

    El intervalo debe ser relativamente estrecho

  • ASPECTOS A TENER EN CUENTALos estimadores de intervalo se denominan comnmente intervalos de confianza.Los extremos superior e inferior de un intervalo de confianza se llaman lmites de confianza superior e inferior respectivamenteUn intervalo de confianza nos lleva de un solo valor estimado (la media muestral, proporcin muestral, diferencias entre medias y proporciones, etc.)a un recorrido de valores.

  • Intervalos De ConfianzaLa amplitud del intervalo de confianza basado en el valor muestral depende de:del error estndar de ese valor y del grado de confianza que queremos asociar con el intervalo resultante.

    INTERPRETACION:Intervalo de confianza al 95%.- Hay 95% de confianza de que el valor de la poblacin (parmetro) se halle dentro del intervalo.EE = S / nEE = / n 90% - 95% - 99%1.64 - 1.96 - 2.57

  • EJEMPLO DE ESTIMADORES

  • Caso 1- Intervalo de confianza para la media en muestras grandesLos valores de los lmites, inferior (L1) y superior (L2), se encuentran aplicando la frmula general: Por consiguiente, los lmites del intervalo se obtienen sumando o restando el error estndar al valor de la media muestral ( ). Especficamente, para hallar el lmite inferior (L1) se resta el error estndar y para hallar el lmite superior (L2) se suma el error estndar. Para explicar el uso de esta forma de estimacin se resolvern los ejemplos planteados anteriormente y otros.

  • Ejemplo 1: estimacin de una media aritmtica Se tiene inters en estimar la altura media de los alumnos de la Facultad de Medicina de la USMP. Se recurre a una muestra aleatoria de 36 alumnos y se obtienen los siguientes resultados: = 170 cm ; s= 20 cmSolucin Si no se especifica el grado de confianza

    = Z x s_

    , se utiliza por lo general 95%, lo cual corresponde a z= 1.96. Conociendo los datos. Se puede aplicar la frmula:

    Li = 170 - 1.96 x 20/6_ Ls = 170 + 1.96 x 20/6Por lo tanto, la estatura promedio de los estudiantes de la facultad de medicina de la USMP est comprendida entre 163.5 y 176.5 cm, con un grado de confianza del 95%. I.C. 95% (163.5 ; 176.5 cm)

    163.47 cm 176.53 cm

  • Parmetro

    Donde:X = media muestral t = Valor de t a un determinado nivel de confianzas = desviacin estndarn = muestra g.l= n- 1

  • Suponga que se desea estimar el peso promedio de los enfermosde hipotiroidismo. En una muestra de 30 pacientes se encontrun x = 71Kg y una S=5Kg.Para el 95% de confianza, los lmitesdel intervalo seran:

    X + t S nLimite inferior: 71 - 2.045 5 30=69.133 KgLimite superior: 71 + 2.045 5 30=72.867 Kgg.l=n-1=29

  • Con un 95% de nivel de confianza, el promedio del peso de los hipotiroideos en la poblacin se encuentra entre 69.133 Kg y 72.867 Kg.

  • Caso 3:Intervalo de confianza para la proporcin PLos valores de los lmites, inferior (L1) y superior (L2), se encuentran aplicando la frmula general:

    Por consiguiente, los lmites del intervalo se obtienen sumando o restando el error estndar al valor de la proporcin muestral (p). Especficamente, para hallar el lmite inferior (L1) se resta el error estndar y para hallar el lmite superior (L2) se suma el error estndar.

    Para explicar el uso de esta forma de estimacin se resolvern los ejemplos planteados anteriormente.

  • Parametro

    PDonde:p = proporcin muestralZ =Valor de Z a un determinado nivel de confianzan = muestra

  • Supngase que en una muestra de 2000 personas se encontr que250 son alcoholicos. Es decir, el porcentaje de alcoholicos en lamuestra es: p=250/2000x100=12.5%.Calcular el intervalo de confianza al 95%.

    p + Z pq nLmite inferior: 12.5 - 1.96 12.5x87.5 2000= 11.05%Lmite superior: 12.5 + 1.96 12.5x87.5 2000

    = 13.95%

  • Por lo tanto, con un nivel de confianza de 95%, se puede afirmar que el porcentaje de alcoholismo en la poblacin se encuentra entre 11.05% y 13.95%.

  • Ejemplo 2: estimacin de una proporcin Se tiene inters en estimar la proporcin de nios desnutridos menores de 5 aos e una determinada comunidad. Se selecciona una muestra de 100 nios menores de 5 aos y se determina que 45 estn desnutridos. SolucinComo fue mencionado, se utiliza un valor de z = 1.96. Con los datos conocidos, se aplica la frmula:

    Por lo tanto, la proporcin de nios menores de 5 aos desnutridos en dicha Comunidad est entre 0.352 y 0.548, con un intervalo de confianza del 95%.

  • Es una tcnica estadstica que se sigue para decidir si se rechaza o no una hiptesis estadstica en base a la informacin de una muestra. Es llamada tambin docimasia de hiptesis o contraste de hiptesis.

  • 2.1 Hiptesis estadsticaEs una afirmacin de lo que se cree sobre una poblacin, es decir, es un supuesto. Por lo general, esta hiptesis se refiere a los parmetros de la poblacin o a una situacin existente en la poblacin.

  • Tipos de hiptesis estadsticaExisten 2 tipos de hiptesis estadstica.

    Hiptesis nula (Ho): tambin llamada hiptesis de la no diferencia, pues plantea que los grupos comparados no difieren en la caracterstica (parmetro) en estudio. Por lo tanto, la diferencia observada en la investigacin es consecuencia del error de muestreo. La hiptesis nula (Ho) se plantea para ser rechazada o desacreditada, por lo general.

    Hiptesis alterna (H1): Son todas las alternativas o suposiciones para contrastar la hiptesis nula (Ho), es decir, aquellas que plantean una diferencia entre los parmetros involucrados y proponen que la diferencia observada es consecuencia efectiva entre las poblaciones de origen. La hiptesis alterna puede ser uni o bilateral.

  • EjemploUn investigador pretende estudiar en forma comparativa la eficacia de 2 tratamientos, tratamiento A y tratamiento B, para determinar cul es mejor.Ho: A - B= 0. La afirmacin de esta hiptesis es que el tratamiento A no difiere del tratamiento B.Con respecto al ejemplo, se pueden plantear varias alternativas. Una de ellas es H1: A - B > 0. La interpretacin es que el tratamiento A es mejor que el tratamiento B, siendo por consiguiente H1 unilateral a la derecha.

  • En la prueba de hiptesis se investiga la veracidad de ambos supuestos, lo cual conduce a rechazar una de estas 2 hiptesis y optar por la que tiene un planteamiento acertado. La eleccin de la hiptesis acertada se determina en base a probabilidades condicionales:

    = probabilidad de rechazar la Ho dado que la Ho es verdadera.(1 - ) = probabilidad de no rechazar la Ho dado que la Ho es verdadera. = probabilidad de no rechazar la Ho dado que la Ho es falsa.(1 - ) = probabilidad de rechazar la Ho dado que la Ho es falsa. y tienen una relacin inversamente proporcional, es decir, uno decrece a medida que el otro aumenta y viceversa. Aspectos a tener en cuenta

  • Nivel de significacin: Al hallar el valor , se puede tomar una decisin respecto a cul de las 2 hiptesis planteadas es verdadera y cual falsa. La toma de decisiones se resume en el siguiente cuadro:

    Decisin estadsticaHo verdaderoHo falsoRechazar HoError tipo I ()Decisin correcta (1 - )No rechazar HoDecisin correcta (1 - )Error tipo II ()

  • Error Tipo I / Error Tipo II.Cuando se toma una decisin estadstica, se puede cometer el error tipo I o el error tipo II.Para evitarlo, se considera el valor , que fue planteado anteriormente:= P(Rechazar Ho / Ho es verdadero)Representa la probabilidad de cometer un error tipo I. Es as que un valor mnimo de determina una menor probabilidad de cometer el error en el cual se estara rechazando una hiptesis nula (Ho) que es acertada. puede ser manejada por el investigador, por consiguiente es posible hallar su valor. Se ha establecido que un valor de menor al nivel de significancia, 5% o 1% dependiendo del caso, es un indicador de que la hiptesis nula (Ho) debe ser rechazada. De esta forma, indica el nivel de significacin de la prueba, pues permite diferenciar la regin de rechazo y no rechazo de la prueba. Es as que 1- indica el grado de confianza de la prueba.

  • Adems existe un valor , el cual no se maneja directamente por el investigador.= P(No rechazar Ho / Ho falso) y estn relacionados y ambos disminuyen su valor si se incrementa el tamao de muestra o si se mejora el diseo del estudio.1-= P(rechazar Ho /Ho es falso), tambin se denomina potencia de prueba. El valor mnimo que puede tomar es de 80%.