profesor : ing. oli eduardo carrillo msc. olicarrillo@yahoo · utilice un nivel de significancia de...

21
1 Profesor : Ing. Oli Eduardo Carrillo MSc. [email protected]

Upload: phamminh

Post on 24-Sep-2018

222 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Profesor : Ing. Oli Eduardo Carrillo MSc. olicarrillo@yahoo · Utilice un nivel de significancia de 0.01. 9 Datos: n=50 x . kg α 0.01 ... se utiliza para comparar varias medias de

1

Profesor : Ing. Oli Eduardo Carrillo MSc.

[email protected]

Page 2: Profesor : Ing. Oli Eduardo Carrillo MSc. olicarrillo@yahoo · Utilice un nivel de significancia de 0.01. 9 Datos: n=50 x . kg α 0.01 ... se utiliza para comparar varias medias de

2

Unidad I: Estimación de Parámetros.

Estimación de parámetros: Es el empleo de estadísticos para calcular los

respectivos parámetros poblacionales.

Estadísticos: son las medidas correspondientes a la muestra.

Parámetros: son las medidas correspondientes a la población.

Estimación por intervalo: Cuando el parámetro se considere comprendido

entre dos valores θi < θ < θs que se calcula a partir de una muestra

seleccionada, se denomina entonces intervalo de confianza del (1- α) 100%; y

la expresión 1- α: recibe el nombre de coeficiente de confianza “grado de

confianza”, los puntos extremos θs y θi se llaman límite de confianza superior y

límite de confianza inferior.

Estimación de un intervalo de confianza para la media poblacional

conociendo la desviación estándar σ: si x es la media de una muestra

aleatoria del tamaño n, de una población con varianza conocida (σ²), el

intervalo de confianza de (1- α) 100% para μ es:

Estimación de un intervalo de confianza para la media poblacional

desconociendo la desviación estándar: si y representan la media

extraída de una población normal con varianza desconocida σ², entonces el

intervalo de confianza del (1 – α) 100% para μ es:

Intervalo de confianza para μ con σ conocida:

Ejemplo del Intervalo de confianza para μ con σ conocida:

1. Se determina que la media de los promedios de los puntos de calidad de

una muestra aleatoria de 36 alumnos universitarios en el último año es

de 2.6. Encuentre los intervalos de confianza del 95% y 99% para la

varianza total de alumnos. Asuma una desviación estándar de la

población de 0.3.

Page 3: Profesor : Ing. Oli Eduardo Carrillo MSc. olicarrillo@yahoo · Utilice un nivel de significancia de 0.01. 9 Datos: n=50 x . kg α 0.01 ... se utiliza para comparar varias medias de

3

Datos:

= 2.6

a) 95%

b) 99%

μ=?

σ=?

n=36

a) Intervalo de confianza del 95%

( )

b) Intervalo de confianza del 99%

( )

Page 4: Profesor : Ing. Oli Eduardo Carrillo MSc. olicarrillo@yahoo · Utilice un nivel de significancia de 0.01. 9 Datos: n=50 x . kg α 0.01 ... se utiliza para comparar varias medias de

4

Intervalo de confianza para μ con σ desconocida:

Donde ⁄es un valor de distribución t con v= n-1 grados de libertad lo que

deja un área a la derecha de ⁄ .

Ejemplo:

Los contenidos de 7 recipientes similares de ácido sulfúrico son: 9.8; 10.2;

10.4; 9.8; 10; 10.2; 9.6 (litros). Encuentre un intervalo de confianza del 95%

para la media de todos los recipientes suponiendo una distribución

aproximadamente normal.

Datos:

n=7

(1 – α) 100% = 95%

μ=?

( )

( )

( )

( )

( )

( )

Page 5: Profesor : Ing. Oli Eduardo Carrillo MSc. olicarrillo@yahoo · Utilice un nivel de significancia de 0.01. 9 Datos: n=50 x . kg α 0.01 ... se utiliza para comparar varias medias de

5

( )

Intervalo de confianza para la varianza poblacional ( )

Si es la varianza de una muestra aleatoria de tamaño n de una población

normal entonces el intervalo de confianza de (1 – α) 100% para es:

( )

( )

Dónde: ⁄

⁄ son los valores de con v= n-1 grados de libertad

respectivamente a la derecha.

Ejemplo:

La varianza muestral de 10 paquetes de semillas de pasto que distribuye

determinada compañía es de 0.286. Se plantea la interrogante de conocer cuál

será el intervalo de confianza del 95% para la varianza de todos los paquetes

de semillas de pasto que distribuyó esta compañía.

Page 6: Profesor : Ing. Oli Eduardo Carrillo MSc. olicarrillo@yahoo · Utilice un nivel de significancia de 0.01. 9 Datos: n=50 x . kg α 0.01 ... se utiliza para comparar varias medias de

6

Datos:

n= 10

( )

Intervalo de confianza para con 95%

( )

( )( )

( )( )

Page 7: Profesor : Ing. Oli Eduardo Carrillo MSc. olicarrillo@yahoo · Utilice un nivel de significancia de 0.01. 9 Datos: n=50 x . kg α 0.01 ... se utiliza para comparar varias medias de

7

Unidad II: Prueba de Hipótesis.

Una hipótesis estadística se considera como una afirmación a cerca de una o

más poblaciones.

Características:

1.- La evidencia de la muestra que es inconsistente con la hipótesis planteada

conduce a un rechazo de la misma.

2.- La evidencia que apoya la hipótesis conduce a su aceptación.

Estructura:

1.- Hipótesis Nula: se refiere a cualquier hipótesis que se desea probar y se

representa (Ho).

2.- Hipótesis Alternativa: en una hipótesis estadística el rechazo de Ho da

como resultado la aceptación de la hipótesis alternativa representada por (Hi).

3.- Estadístico de prueba: se basa en la distribución que permita tomar el

control de la cantidad de elementos en el grupo de prueba. Pueden ser varias

(distribución normal, t, F, etc.).

4.- Error Tipo I: consiste en rechazar la hipótesis nula cuando esta en realidad

es verdadera.

5.- Error Tipo II: consiste en la aceptación de la hipótesis nula cuando en

realidad es falsa.

Clasificación:

{

{

Procedimiento para resolver prueba de hipótesis:

1.- Establecer la hipótesis nula Ho de que θ = θo

2.- Seleccionar la hipótesis alternativa Hi de una de las alternativas siguientes:

; ò .

3.- eleccionar el nivel de significancia de tamaño alfa (α).

Page 8: Profesor : Ing. Oli Eduardo Carrillo MSc. olicarrillo@yahoo · Utilice un nivel de significancia de 0.01. 9 Datos: n=50 x . kg α 0.01 ... se utiliza para comparar varias medias de

8

4.- Seleccionar el estadístico de prueba apropiado y establecer la región criica.

5.- Calcular el valor del estadístico de prueba de los datos muéstrales.

6.- Decisión: Rechazar Ho si el estadístico de prueba tiene un valor en la región

crítica; de otra forma aceptar Ho.

Formulas relacionadas a pruebas con una sola media y varianza

conocida:

Hipótesis

Criterio de Rechazo

Estadístico de Prueba

Ho: M = Mo

Hi: M ≠ Mo

(

)

Ho: M = Mo

Hi: M > Mo

Ho: M = Mo

Hi: M < Mo

Ejemplo:

Un fabricante de equipos deportivos ha desarrollado un nuevo sedal (y lo

sintético basado en nylon para pesca) el cual se considera que tiene una

resistencia a la ruptura de 8kg con desviaciones aproximadas a los 0.5kg.

Pruebe la hipótesis de que la media es 8 (M=8) en contra posición con la

alternativa de que μ es diferente a 8 (M ≠8) si se prueba una muestra aleatoria

de 50 sedales y se determina que la resistencia promedio a la ruptura es de

7.8kg. Utilice un nivel de significancia de 0.01.

Page 9: Profesor : Ing. Oli Eduardo Carrillo MSc. olicarrillo@yahoo · Utilice un nivel de significancia de 0.01. 9 Datos: n=50 x . kg α 0.01 ... se utiliza para comparar varias medias de

9

Datos:

n=50

x = .8kg

α= 0.01

M=8

M ≠8

σ=0.5kg

1) Ho: M=8

2) Hi: M ≠8

3) α= 0.01

4)

= 0.005

5) ( )

= -2.82

6) Decisión:

Se rechaza la hipótesis nula entonces se acepta la hipótesis alternativa.

Page 10: Profesor : Ing. Oli Eduardo Carrillo MSc. olicarrillo@yahoo · Utilice un nivel de significancia de 0.01. 9 Datos: n=50 x . kg α 0.01 ... se utiliza para comparar varias medias de

10

Formulas relacionadas a pruebas con una sola media y varianza

conocida:

Hipótesis

Criterio de Rechazo

Estadístico de Prueba

Ho: M = Mo

Hi: M ≠ Mo (

); v= n-1

Ho: M = Mo

Hi: M < Mo

Ho: M = Mo

Hi: M Mo

Ejemplo:

El Edison electric Institute (EEI) ha publicado cifras a cerca de la cantidad anual

de kwatts/horas consumidos por varias aparatos del hogar. Se afirma que las

aspiradoras consumen un promedio de 46 kW/h al año. Si una muestra

aleatoria de 12 hogares, indican que las aspiradoras consumen un promedio de

42 kW/h al año con una desviación estándar de 11.9kw/h. ¿Sugiere esto que

las aspiradoras consumen un promedio menor de 46kw/h al año? Tómese un

nivel de significancia del 0.05.

Datos:

Mo=46kw/h

n=12

x = 2 kw h

S= 11.9 kw/h

Hi< 46kw/h

α=0.05

Page 11: Profesor : Ing. Oli Eduardo Carrillo MSc. olicarrillo@yahoo · Utilice un nivel de significancia de 0.01. 9 Datos: n=50 x . kg α 0.01 ... se utiliza para comparar varias medias de

11

1) Ho: M=46

2) Hi: M <46

3) α=0.05

4)

5) ( )

= -1.16

6) Decision:

Aceptamos la Ho (hipótesis nula) y se comprueba que las aspiradoras

consumen 46kw/h al año.

Page 12: Profesor : Ing. Oli Eduardo Carrillo MSc. olicarrillo@yahoo · Utilice un nivel de significancia de 0.01. 9 Datos: n=50 x . kg α 0.01 ... se utiliza para comparar varias medias de

12

Fórmulas para pruebas relacionadas con proporciones:

Hipótesis

Región Critica

Estadístico de

Prueba

Ho: p=po

Hi: p ≠ po

( )

( )

Si P es menor o

igual que se

rechaza Ho. Ho: p=po

Hi: p po

( )

Ho: p=po

Hi: p po

( )

Procedimiento:

1.- Establecer la hipótesis nula p=po.

2.- Establecer la hipótesis alternativa Hi; seleccionando la alternativa más

conveniente p < po; p > po; p ≠ po.

3.- Escoge el nivel de significancia α.

4.- Utilizar el estadístico de prueba la dirección binomial de variable X con

p=po donde b (X, n, p).

5.- Calcular:

a) El número de éxitos de la variable X.

b) El valor apropiado de p.

6.- Decidir: Tomar la decisión en base al valor de p.

Page 13: Profesor : Ing. Oli Eduardo Carrillo MSc. olicarrillo@yahoo · Utilice un nivel de significancia de 0.01. 9 Datos: n=50 x . kg α 0.01 ... se utiliza para comparar varias medias de

13

Ejemplo:

Un constructor afirma que actualmente se instalan bombas de calefacción en

el 70% de todos los hogares en construcción de la ciudad Richmond.

¿Estaría usted de acuerdo con esta afirmación si una investigación aleatoria

de nuevas casas en esta ciudad indica que 8 de cada 15 tienen instaladas

bombas de calefacción? Utilice un nivel de significancia del 0.10.

Datos:

1) Ho: p= 0.70

2) Hi: p ≠ 0. 0

3) α=0.10

4) p= 0.70; n= 15; X=8

Distribución binomial.

5) Cálculos:

Si X < 0 > npo

npo= (15) (0.70)= 10.5

X < npo

8 < 10.5

( )

[ ( )]

[ ( )]

[( )]

[ ]

6) Decisión:

P<α rechaza

0.2622 < 0.10 ɇ

* e acepta Ho porque el valor de p es mayor que el valor de α

0.2622 > 0.10

Page 14: Profesor : Ing. Oli Eduardo Carrillo MSc. olicarrillo@yahoo · Utilice un nivel de significancia de 0.01. 9 Datos: n=50 x . kg α 0.01 ... se utiliza para comparar varias medias de

14

Unidad III: ANOVA

Análisis de Varianza (Anova): se utiliza para comparar varias medias de

tratamiento a fin de ver si provienen de la misma población.

Los supuestos fundamentales de las Anovas son:

1.- Formulas para el cálculo de la suma de cuadrados en muestras iguales

tamaños.

2.- Formulas para el cálculo de la suma de cuadrados en muestras de

diferentes tamaños.

Procedimiento:

1.- Se seleccionan muestras del tamaño n de cada una de las k poblaciones.

2.- Las k poblaciones se clasifican sobre la base de un criterio único

denominado tratamiento.

3.- Se debe asumir que k poblaciones son independientes y tienen una

distribución normal con media, y con una varianza común

.

4.- La hipótesis a probar será la siguiente:

Ho:

Hi: al menos dos de las medias no son iguales.

Tratamiento:

Total T

Media ȳ

5.- Formulas para el cálculo de la suma de cuadrados en muestras de

iguales tamaños:

∑ ∑ ( )

Suma total de cuadrados.

Page 15: Profesor : Ing. Oli Eduardo Carrillo MSc. olicarrillo@yahoo · Utilice un nivel de significancia de 0.01. 9 Datos: n=50 x . kg α 0.01 ... se utiliza para comparar varias medias de

15

Suma de cuadrados de tratamiento.

Suma de cuadrados del error.

Cuadrados de tratamiento medio.

( ) Cuadrados medio del error.

valor de la distribución aleatoria F, con k-1 y k(n-1) grados de

libertad.

*Ho se rechaza cuando [ ( )]

En resumen:

Fuente de variación

Suma de cuadrados

Grados de libertad

Cuadrados de medios

Calculada

Tratamientos

SSA

K-1

Error

SSE

K(n-1)

Total

SST

n k-1

Ejemplo:

Supóngase que un experimento industrial un ingeniero está interesado en

como varia la absorción media de humedad en el concreto de entre 5

diferente mezclas de concreto. Las mezclas varían en el porcentaje en peso

de cierto ingrediente importante. Se expone a la humedad durante 48 horas

y se deciden probar 6 para cada muestra o mezclar, lo que requiere un total

de 30 muestras.

Page 16: Profesor : Ing. Oli Eduardo Carrillo MSc. olicarrillo@yahoo · Utilice un nivel de significancia de 0.01. 9 Datos: n=50 x . kg α 0.01 ... se utiliza para comparar varias medias de

16

Los datos se registran en la siguiente tabla. Pruebe la hipótesis de que

con un nivel de significancia de 0.05 para los

datos tabulados.

Tabla 1: Absorción de humedad en muestras de concreto.

Mezcla (%de peso)

1 2 3 4 5

551 595 639 417 563

457 580 615 449 631

450 508 511 517 522

731 583 573 438 613

499 633 648 415 656

632 517 677 555 679

TOTAL 3320 3416 3663 2791 3664 16854

MEDIA 553,333333 569,333333 610,5 465,166667 610,666667 561,8

Datos:

α=0.05

n=6

k=5

1) Ho:

2) Hi: al menos 2 de las medias no son iguales.

3) α=0.05

Distribución F (tabla 6)

( ) ( )

4)

( )

( )( )

Page 17: Profesor : Ing. Oli Eduardo Carrillo MSc. olicarrillo@yahoo · Utilice un nivel de significancia de 0.01. 9 Datos: n=50 x . kg α 0.01 ... se utiliza para comparar varias medias de

17

( )

( )( )

( )

Fuente de variación

Suma de cuadrados

Grados de libertad

Cuadrados de medios

Calculada

Mezcla

85356.6

4

21339.15

=4.30

Error

124021

25

4960.84

Total

209377

29

26299.99

5) Se rechaza la hipótesis nula Ho

Se acepta que al menos dos mezclas no son iguales.

Análisis de varianza para muestras de tamaños diferentes:

∑∑( )

Page 18: Profesor : Ing. Oli Eduardo Carrillo MSc. olicarrillo@yahoo · Utilice un nivel de significancia de 0.01. 9 Datos: n=50 x . kg α 0.01 ... se utiliza para comparar varias medias de

18

Grados de libertad

SST= N-1

SSA= K-1

SSE= N-K

Ejemplo:

La Universidad Politécnica de Virginia de estados unidos diseño un

sistema para medir los niveles de actividad de fosfatasa alcalina del

suero en niños que padecían ataques convulsivos y quienes habían

recibido terapia anti convulsionante bajo el cuidado de un especialista

privado. Se encontraron 45 sujetos para el estudio y se clasificaron en 4

grupos de acuerdo con la medicina que se les proporciono.

A partir d muestras sanguíneas obtenidas de cada sujeto se

determinaron los niveles de (bessey – Lowry) y se registraron en la tabla

que se muestra. Pruebe la hipótesis con un nivel de significancia de 0.05,

de que el nivel promedio de actividad de fosfatasa alcalina del suero es el

mismo para los 4 grupos.

Nivel de actividad del suero fosfatado alcalino.

Grupo de Medicamento.

Page 19: Profesor : Ing. Oli Eduardo Carrillo MSc. olicarrillo@yahoo · Utilice un nivel de significancia de 0.01. 9 Datos: n=50 x . kg α 0.01 ... se utiliza para comparar varias medias de

19

G-1 G-2 G-3 G-4

49,2 97,07 62,1 110,6

44,54 73,4 94,95 57,1

45,8 68,5 142,5 117,6

95,84 91,85 53 77,71

30,1 106,6 175 150

36,5 0,57 79,5 82,9

82,3 0,79 29,5 111,5

87,25 0,77 78,4

105 0,81 127,5

95,22

97,5

105

58,05

86,6

58,35

72,8

116,7

45,15

70,35

77,4

TOTAL 1459,65 440,36 842,45 707,41 3449,87

MEDIA 72,9825 48,92889 93,60556 101,0586 79,14388

G-1=control (sin anti convulsivos).

G-2= fenobarbital.

G-3= carbamazepina.

G-4= otros anti convulsivos.

Datos:

1) Ho:

2) Hi: al menos 2 de las medias no son iguales.

3) α=0.05

4) Calculo:

Page 20: Profesor : Ing. Oli Eduardo Carrillo MSc. olicarrillo@yahoo · Utilice un nivel de significancia de 0.01. 9 Datos: n=50 x . kg α 0.01 ... se utiliza para comparar varias medias de

20

( )

=

( )

( )

( )

( )

( )

TABLA ANOVA

Fuente de variación

Suma de cuadrados

Grados de libertad

Cuadrados de medios

Calculada

Grupos de Medicamentos

13943.01

3

4647.66

=3.56

Error

53463.9

41

1303.99

Total

67406.91

44

5951.65

Page 21: Profesor : Ing. Oli Eduardo Carrillo MSc. olicarrillo@yahoo · Utilice un nivel de significancia de 0.01. 9 Datos: n=50 x . kg α 0.01 ... se utiliza para comparar varias medias de

21

5) Decisión:

Se rechaza la hipótesis nula Ho se acepta Hi.