distribucion t student

5
DISTRIBUCION "t DE STUDENT" La prueba t-Student fue desarrollada en 1899 por el químico inglés William Sealey Gosset (1876-1937), mientras trabajaba en técnicas de control de calidad para las destilerías Guiness en Dublín. Se utiliza para contrastar hipótesis sobre medias en poblaciones con distribución normal. Para conocer si se puede suponer que los datos siguen una distribución normal, se pueden realizar diversos contrastes llamados de bondad de ajuste, de los cuales el más usado es la prueba de Kolmogorov. Existen dos versiones de la prueba t-Student: una que supone que las varianzas poblacionales son iguales y otra versión que no asume esto último. Para decidir si se puede suponer o no la igualdad de varianza en las dos poblaciones, se debe realizar previamente la prueba F-Snedecor de comparación de dos varianzas. Supóngase que se toma una muestra de una población normal con media y varianza σ 2 . Si × es el promedio de las n” observaciones que contiene la muestra aleatoria, entonces la distribución T= X μ S/ n es una distribución normal estándar. Supóngase que la varianza de la población σ 2 es desconocida. ¿Qué sucede con la distribución de esta estadística si se reemplaza σ por “s”? La distribución “t” proporciona la respuesta a esta pregunta. La media y la varianza de la distribución t son = 0 y σ 2 =v /( v2) para >2, respectivamente. La siguiente figura presenta la gráfica de varias distribuciones t. La apariencia general de la distribución “t” es similar a la de la distribución normal estándar: ambas son simétricas y unimodales, y el valor máximo de la ordenada se alcanza en la media =0. Sin embargo, la distribución “t” tiene colas más amplias que la normal; esto es, la probabilidad de las colas es mayor que en la distribución normal. A medida que el número de grados de libertad tiende a infinito, la forma límite de la distribución t es la distribución normal estándar.

Upload: elena-hernandez

Post on 11-Jan-2016

212 views

Category:

Documents


0 download

DESCRIPTION

texto universitario

TRANSCRIPT

Page 1: Distribucion t Student

DISTRIBUCION "t DE STUDENT"

La prueba t-Student fue desarrollada en 1899 por el químico inglés William Sealey Gosset (1876-1937), mientras trabajaba en técnicas de control de calidad para las destilerías Guiness en Dublín. Se utiliza para contrastar hipótesis sobre medias en poblaciones con distribución normal. Para conocer si se puede suponer que los datos siguen una distribución normal, se pueden realizar diversos contrastes llamados de bondad de ajuste, de los cuales el más usado es la prueba de Kolmogorov.

Existen dos versiones de la prueba t-Student: una que supone que las varianzas poblacionales son iguales y otra versión que no asume esto último. Para decidir si se puede suponer o no la igualdad de varianza en las dos poblaciones, se debe realizar previamente la prueba F-Snedecor de comparación de dos varianzas.

Supóngase que se toma una muestra de una población normal con media y varianza σ2. Si × es el promedio de las “n” observaciones que contiene la muestra aleatoria, entonces la distribución

T= X−μS/√n

es una distribución normal estándar. Supóngase que la varianza de la población σ2 es

desconocida. ¿Qué sucede con la distribución de esta estadística si se reemplaza σ por “s”? La distribución “t” proporciona la respuesta a esta pregunta.

La media y la varianza de la distribución t son = 0 y σ 2=v / (v−2) para >2, respectivamente.

La siguiente figura presenta la gráfica de varias distribuciones t. La apariencia general de la distribución “t” es similar a la de la distribución normal estándar: ambas son simétricas y unimodales, y el valor máximo de la ordenada se alcanza en la media =0. Sin embargo, la distribución “t” tiene colas más amplias que la normal; esto es, la probabilidad de las colas es mayor que en la distribución normal. A medida que el número de grados de libertad tiende a infinito, la forma límite de la distribución t es la distribución normal estándar.

Page 2: Distribucion t Student

Propiedades de las distribuciones t

1. Cada curva t tiene forma de campana con centro en 0.2. Cada curva t, está más dispersa que la curva normal estándar z.3. A medida que v aumenta, la dispersión de la curva t correspondiente disminuye.4. A medida que v→∞ , la secuencia de curvas t se aproxima a la curva normal estándar,

por lo que la curva z recibe a veces el nombre de curva t con gl=∞

Sea Z una variable aleatoria normal estándar y V una variable aleatoria chi cuadrada con v grados de libertad. Si Z y V son independientes, entonces, la distribución de la variable aleatoria t está dada por:

h (t )=[ v+12 ]( v2 )√ πv (

1+ t2

v )−( v+1)2 ,−∞<t<∞ .

Esta se conoce como la distribución t con v grados de libertad.

Sean X1, X2, . . . , Xn variables aleatorias independientes que son todas normales con media y

desviación estándar σ. Entonces la variable aleatoria T= X−μS/√n tiene una distribución t

con v=n−1 grados de libertad.

La distribución t difiere de la de Z en que la varianza de t depende del tamaño de la muestra y siempre es mayor a uno. Únicamente cuando el tamaño de la muestra tiende a infinito las dos distribuciones serán las mismas.

Se acostumbra representar con t∞ el valor t por arriba del cual se encuentra un área igual a ∞. Como la distribución t es simétrica alrededor de una media de cero, tenemost 1−α=−t α; es decir, el valor t que deja un área de 1−α a la derecha y por tanto un área de α a la izquierda, es igual al valor t negativo que deja un área de α en la cola derecha de la distribución. Esto es, t0.95 = -t0.05, t0.99=-t0.01, etc.

La distribución t se usa de manera extensa en problemas que tienen que ver con inferencia acerca de la media de la población o en problemas que implican muestras comparativas (es decir, en casos donde se trata de determinar si las medias de dos muestras son significativamente

diferentes). El uso de la distribución t para el estadístico T= X−μS/√n , requiere que X1, X2, …, Xn sea

normal. El uso de la distribución t y la consideración del tamaño de la muestra no se relaciona con el teorema del límite central.

DISTRIBUCIÓN “F” DE FISHER

Page 3: Distribucion t Student

La necesidad de disponer de métodos estadísticos para comparar las varianzas de dos poblaciones es evidente a partir del análisis de una sola población. Frecuentemente se desea comparar la precisión de un instrumento de medición con la de otro, la estabilidad de un proceso de manufactura con la de otro o hasta la forma en que varía el procedimiento para calificar de un profesor universitario con la de otro. Intuitivamente, podríamos comparar las varianzas de dos poblaciones, σ2

1 y σ22, utilizando la razón de las varianzas muestrales s2

1/s22. Si s2

1/s22 es casi igual a

1, se tendrá poca evidencia para indicar que s21 y s2

2 no son iguales. Por otra parte, un valor muy grande o muy pequeño para s2

1/s22, proporcionará evidencia de una diferencia en las varianzas de

las poblaciones.

La variable aleatoria F se define como el cociente de dos variables aleatorias ji-cuadrada independientes, cada una dividida entre sus respectivos grados de libertad. Esto es:

F=

Uv1Vv2

donde U y V son variables aleatorias ji-cuadrada independientes con grados de libertad v 1 y v2

respectivamente.

Sean U y V dos variables aleatorias independientes que tienen distribución ji cuadradas con v1 y v2

grados de libertad, respectivamente. Entonces la distribución de la variable aleatoria F=

Uv1Vv2

está

dada por:

h ( f )=¿

y se dice que sigue la distribución F con v1 grados de libertad en el numerador y v2 grados de libertad en el denominador.

Teorema: Si s12 y s2

2 son las varianzas muestrales independientes de tamaño n1 y n2 tomadas de poblaciones normales con varianzas σ 1

2y, σ 22respectivamente, entonces:

F=

S12

σ 12

S22

σ 22

=σ22S1

2

σ12S2

2

Tiene una distribución F con v1=n1−1 y v2=n2−1 grados de libertad.

Page 4: Distribucion t Student

La distribución F se usa en situaciones de dos muestras para realizar inferencias acerca de las varianzas de población, lo cual implica la aplicación del resultado del teorema arriba expuesto. Sin embargo, la distribución F se aplica a otros muchos tipos de problemas en los cuales están relacionadas las varianzas muestrales. De hecho la distribución F se llama distribución de razón de varianzas.