ejercicios estadistica.docx

20
PRÁCTICA N°04 1) Los puntajes en la prueba final y en la prueba final del curso de estadística de una muestra de 7 estudiantes fueron las siguientes: a) Obtener la ecuación de regresión lineal de Y respecto a X. Siendo una regresión lineal y=a+ bx Y los parámetros son: i=1 7 y i =7 a+b i=1 7 x i i=1 7 y i x i =a i=1 7 x i +b i=1 7 x i 2 Parcial(X) Final(Y) XY X 2 Y 2 13 15 195 169 225 15 14 210 225 196 10 13 130 100 169 8 10 80 64 100 16 17 272 256 289 10 12 120 100 144 5 8 40 25 64 77 89 1047 939 1187 Hallando los parámetros a y b: PRUEBA FINAL 13 15 10 08 16 10 05 PRUEBA PARCIAL 15 14 13 10 17 12 08

Upload: jesusorozco

Post on 02-Dec-2015

218 views

Category:

Documents


4 download

TRANSCRIPT

Page 1: ejercicios estadistica.docx

PRÁCTICA N°041) Los puntajes en la prueba final y en la prueba final del curso de estadística de una

muestra de 7 estudiantes fueron las siguientes:

a) Obtener la ecuación de regresión lineal de Y respecto a X.

Siendo una regresión lineal y=a+bx

Y los parámetros son:

∑i=1

7

yi=7a+b∑i=1

7

x i

∑i=1

7

yi x i=a∑i=1

7

x i+b∑i=1

7

x i2

Parcial(X) Final(Y) XY X2 Y2

13 15 195 169 225

15 14 210 225 196

10 13 130 100 169

8 10 80 64 100

16 17 272 256 289

10 12 120 100 144

5 8 40 25 64

77 89 1047 939 1187

Hallando los parámetros a y b:

a=∑i=1

7

xi2∑i=1

7

y i−∑i=1

7

x i∑i=1

7

y i x i

n∑i=1

7

x i2−(∑

i=1

7

xi)2

Reemplazando:

a=(939)(89)−(77)(1047)

7 (939)−(77)2=4.5838

PRUEBA FINAL 13 15 10 08 16 10 05PRUEBA PARCIAL 15 14 13 10 17 12 08

Page 2: ejercicios estadistica.docx

b=n∑i=1

7

y i x i−∑i=1

7

x i∑i=1

7

y i

n∑i=1

7

x i2−(∑

i=1

7

x i)2

Reemplazando:

b=7 (1047)– (77)(89)7 (939)– (77)2

=0.7391

La ecuación será: y=4.5838+(0.7391) x

b) Estimar el puntaje en la prueba final de un estudiante que en la prueba parcial obtuvo 11

y=4.5838+(0.7391 ) (11)=12.7139

c) Estimar el puntaje en la prueba parcial de un estudiante que en la prueba final obtuvo 09

8=4.5838+(0.7391)xx=5.9751

d) Calcular e interpretar el coeficiente de correlación.

S=√1−Sxy2Sy2Hallar Sxy

2

Sxy2 =

∑i=1

7

y i2−¿a∑

i=1

7

y i−b∑i=1

7

y i x i

7¿

Sxy2 =

(1187)– 4.5838(89) – (0.7391)(1047)7

=0.7434

Hallar Sy2

Sy2=1187

7−( 897 )=7.9184

Page 3: ejercicios estadistica.docx

Calcular S

S=√1−0.74347.9184=0.9519

e) Calcular el error de estimación

Pero si Sxy2 =0.7434 , entonces:

Sxy=√0.7434=0.86222) Los datos que siguen muestran la mejora ( ganancia en velocidad de lectura; en

palabras por minuto? de seis estudiantes que participaron en un programa de velocidad en la lectura y el número de semanas que han participado en el programa:

a) Determinar la recta de mínimos cuadrados a partir de la cual podemos pronosticar la ganancia en velocidad de lectura de una persona que ha tomado parte en el programa un número de semanas dado.

1er etapa: Determinar y=f ( x )

Número de semanas (X)

4 2 8 6 9 3

Ganancia de velocidad (Y)

91 50 210 164 241 79

Page 4: ejercicios estadistica.docx

4 6 8 10 12 14 16 180

2

4

6

8

10

12

14

16

18

XY Dispersión

Número de semanas

Gana

ncia

de

velo

cidad

y=a+bx

2da etapa: Determinar los valores de a y b por el método de mínimos cuadrados

Ecuaciones normales de la recta:

∑i=1

6

yi=6a+b∑i=1

6

xi

∑i=1

6

yi x i=a∑i=1

6

x i+b∑i=1

6

x i2

Sustituir con la información de la tabla en las ecuaciones normales:

835=6a+32b

5534=32a+210b

X Y YX X2 Y2

4 91 364 16 82812 50 100 4 25008 210 1680 64 441006 164 984 36 268969 241 2169 81 580813 79 237 9 6241

32 835 5534 210 146099

Page 5: ejercicios estadistica.docx

Se resuelve el sistema por determinantes

∆=| 6 3232 210|=236

a=| 835 325534 210|236

=−1738236

=−7,3644

b=| 835 65534 32|236

=6484236

=27.4746

Se sustituye los resultados obtenidos y resulta:

y=−7,3644+27.4746 x

b) Estimar el incremento de velocidad de lectura que espera lograr una persona que toma parte del programa durante cinco semanas.

Reemplazamos en la ecuación:

y=−7.3644+27.4746 x

Donde x= 5 semanas

y=−7.3644+27.4746 (5)=130.0086

Rpta: Tendrá una ganancia de velocidad de 130.0086 formando parte del programa durante 5 semanas.

c) Calcular e interpretar el coeficiente de determinación

Sabemos que la fórmula del coeficiente de determinación es:

r=√ a∑i=16

y i+b∑i=1

6

y i x i−6 y2

∑i=1

6

y i2−6 y2

r=√−7.3644 (835 )+27.4746 (5534 )−6( 8356

)2

146099−6( 8356

)2

=√0.9932

r2=0.9932

Page 6: ejercicios estadistica.docx

Interpretación: El 99,32% de la variabilidad se ha explicado o eliminado gracias a la regla de regresión.

4) Se han estudiado las calificaciones de 60 estudiantes en las asignaturas de matemática y estadística, obteniéndose los siguientes resultados:

X: puntaje en matemáticaY: puntaje en estadística

X=13 Y=12.5 Sx = 2 Sy = 1.2 r = 0.9

a) Estimar el puntaje de un estudiante en Estadística si en matemática obtuvo 14

A la vez X e Y son medias aritméticas de las calificaciones de los 60 estudiantes.

Se sabe que:

r=SxySx S y

0.9=Sxy2(1.2)

Sxy=2.16

También se sabe que la pendiente de la recta es b:

b=SxySx2

2.164

=0.54

y=a+bx

12.5=a+0.54 (13)a=5.48

La ecuación de regresión es: y=a+bx

y=5.48+0.54(14)

y=13.04

Rpta: Estimando el puntaje de un estudiante en estadística que obtuvo 14 en matemática es: 13.04 el puntaje que obtuvo en estadística.

Page 7: ejercicios estadistica.docx

b) Para un estudiante que en Estadística obtuvo 10, que puntaje se estima obtendría en matemática.

En cambio para la otra ecuación de regresión es:

b=Sx S yS y2

2.161.44

=1.5

x=a+by

13=a+1.5(12.5)

a=−5.75

La ecuación de regresión es: x=−5.75+1.5 y

x=−5.75+1.5 (10)

x=9.25

Estimando el puntaje de un estudiante en matemática que obtuvo 10 en estadística es: 9.25 el puntaje que obtuvo en matemática.

5) Si y=2+0.8x ;Y=10, Sx2=49 , Sy

2=64 , obtener la ecuación de regresión lineal de X

sobre Y.

6) Para las variables X e Y tenemos que:

X=10 Y=20 Sx = 1.5 Sy = 2 r = 0.6

a) Obtener las ecuaciones de regresión lineal de Y sobre X y de X sobre Y.

Usando el coeficiente de correlación:

r=SxySx S y

0.6=Sxy2(1.5)

Sxy=1.8

Para la ecuación de regresión lineal de Y sobre X:

Page 8: ejercicios estadistica.docx

b=SxySx2 =

1.8(1.5)2

=0.8

y=a+bx20=a+0.8 (10)

a=12

La ecuación de regresión lineal de Y sobre X es: y=12+0.8x

Para la ecuación de regresión lineal de X sobre Y:

b=SxySx2 =

1.8(2)2

=0.45

x=a+by

10=a+0.45 (20)

a=1

La ecuación de regresión lineal de X sobre Y es: x=1+0.45 y

08) Las pruebas sobre el consumo de combustibles de un vehículo que viaja a diferentes velocidades produjeron los siguientes datos codificados:

VELOCIDAD (V) 20 30 40 50 60 70CONSUMO (C) 18.3 18.8 19.1 19.3 19.5 19.7

a) Ajustar a dichos datos una ecuación de regresión de la forma C=A+B/V.

V=Xi C=Yi XiYi Xi2

20 18,3 366 40030 18,8 564 90040 19,1 764 160050 19,3 965 250060 19,5 1170 360070 19,7 1379 4900

∑=270 ∑=114,7 ∑=5208 ∑=13900

Diagrama de dispersión según los datos de la tabla

Page 9: ejercicios estadistica.docx

10 20 30 40 50 60 70 8017.5

18

18.5

19

19.5

20

Series2Linear (Series2)

Velocidad

Cons

umo

∑i=1

N

Yi=N . A+B∑i=1

N

Xi

∑i=1

N

Yi . Xi=A .∑i=1

N

Xi+B .∑i=1

N

Xi2

Reemplazando:

114,7 = 6 A + 270 B

5208 = 270 A + 13900 B

A=17,92095238≈17.92 B=0 ,02657142857≈0 .03

Entonces la ecuación es:

C=17,92+ 0.03V

b) Estimar C para una velocidad de 45.

C=17,92+ 0.0345

C=17,92+ 0.0345

C=17.920667

Cuando la velocidad es 45, una estimación del consumo es 17.920667.

Page 10: ejercicios estadistica.docx

09) El número de bacterias por unidad de volumen en un cultivo tras X horas viene dado en la siguiente tabla:

a) Ajustar una curvatura de mínimos cuadrados de la forma Y=a .bx a los datos.

1ero Ordenamos en una tabla de distribución:

2do Graficamos los puntos respectivamente en el eje xy y luego trazamos la línea que pasa por casi la mayoría de los puntos.

0 1 2 3 4 5 6 70

50

100

150

200

250

300

Gráfica de dispersión de los puntos(X,Y)

Valores YLinear (Valores Y)

Número de horas

Núm

ero

de b

acte

rias

3ero hallamos los parámetros a , b por el método de mínimos cuadrados

∑i=1

N

logYi=N loga+ log b∑i=1

N

Xi

Número de horas (X) 0 1 2 3 4 5 6

Número de bacterias (Y) 32 47 65 92 132 190 275

xi yi Log Yi xi 2 xLogYi

0 32 1.505 0 01 47 1.672 1 1.6722 65 1.813 4 3.6263 92 1.964 9 5.8924 132 2.121 16 8.4845 190 2.278 25 11.396 275 2.439 36 14.634

21 833 13.792 91 45.698

Page 11: ejercicios estadistica.docx

∑i=1

N

Xi logYi=log a∑i=1

N

Xi+log b∑i=1

N

Xi ²

Luego nos va quedar así:

13.792=7 log a+21 log b

45.698=21 log a+91 logb

Resolvemos y nos da los valores de a, b

log a=∆a∆

=|13.792 2145.698 91|| 7 2121 91|

=295.414196

=1.507

log b=∆b∆

=| 7 13.79221 45.698|| 7 2121 91|

=30.254196

=0.1544

Reemplazando valores se obtiene:

logY=log a+X logb

logY=1.507+0.1544 X

log a=1.507

a = 32.1366

log b=0.1544

b = 1.4269

Remplazando en Y=a .bx

Y=(32.1366) .(1.4269)x

b) Estimar el valor de Y cuando X=7

Para calcular el valor de Y cuando X=7 reemplazamos en la ecuación:

Y=(32.1366)(1.4269)7

Y=387.0389

Page 12: ejercicios estadistica.docx

10) Los siguientes datos se refieren a las dosis de rayos cósmicos medidos a varias altitudes.

ALTURA (en pies) X: 50 450 780 1200 4100 4800 5300DOSIS Y: 28 30 32 36 51 58 69

a) Ajustar a esos datos una curva de la forma Y=a . ecX

Diagrama de dispersión según los datos de la tabla

0 1000 2000 3000 4000 5000 60000

10

20

30

40

50

60

70

80

Series2Exponential (Series2)

Altura

Dosis

Número de datos = N = 7

X Y50 28 1.4472 2500 72.3579

450 30 1.4771 202500 664.7046780 32 1.5051 608400 1174.0170

1200 36 1.5563 1440000 1867.56304400 51 1.7076 19360000 7513.30884800 58 1.7634 23040000 8464.45445300 69 1.8388 28090000 9745.9002

16980 304 11.2956 72743400 29502.3058

Page 13: ejercicios estadistica.docx

∑i=1

N

log y i=N log a+ logec∑i=1

N

xi

∑i=1

N

( log y i )x i=log a∑i=1

N

x i+ log ec∑i=1

N

(x i )2

Entonces reemplazando:

11.2956=7 ( loga )+16980¿

29502.3058=16980 (log a )+72743400¿

Resolviendo las ecuaciones se obtiene:

log a=1.452038481log ec=6.662724587∗10−5

a=28.3164

ec=1.000153427c=0.0015

Por lo tanto la ecuación exponencial es: Y=28.3164e0.0015X

b) Use el resultado obtenido en (a) para estimar la dosis media a una altitud de 3000pies

Reemplazando el valor de la altitud en la ecuación:

Y=28.3164e0.0015X

Y=28.3164e0.0015(3000)

Y=2548.9611

Entonces estimando el valor de la dosis cuando la altitud es 3000pies es: 2548.9611

11) La presión P (kg/cm3 ¿ de un gas correspondiente a diferentes volúmenes V (cm3) se registró de la siguiente manera:

Volumen (V) 50 60 70 90 100Presión (P) 64.7 51.3 40.5 25.9 7.8

La ley de presión de los gases ideales de la ecuación P.V a ¿ C, donde a y C son constantes.

a) Ajustar una recta a estos datos por el método de mínimos cuadrados.

1ero Ordenamos en una taba de distribución

Page 14: ejercicios estadistica.docx

2do Graficamos los puntos respectivamente en el eje XY y luego trazamos la línea que pasa por casi la mayoría de los puntos.

40 50 60 70 80 90 100 1100

10

20

30

40

50

60

70

Gráfica de dispersión de los puntos(X,Y)

Valores YLinear (Valores Y)

Volumen (V)

Pres

ión

(P)

3ero hallamos los parámetros a , b por el método de mínimos cuadrados

∑i=1

N

Yi=Na+b∑i=1

N

Xi

∑i=1

N

Yi . Xi=a∑i=1

N

Xi+b∑i=1

N

Xi ²

Luego nos va quedar así: 190 = 5a + 370b

12249 = 370a + 29100b

Resolvemos y nos da los valores de a, b

a = -1.053

b = 115.91512

xi yi xi yi xi 2 yi 2

50 64.5 3225 2500 4160.2560 51.3 3078 3600 2631.6970 40.5 2835 4900 1640.2590 25.9 2331 8100 670.81

100 7.8 780 10000 60.84370 190 12249 29100 9163.84

Page 15: ejercicios estadistica.docx

Remplazando en Y= a + bx

Y = -1.053 +115.92x

b) Estime P cuando V¿80 centímetros cúbicos.

Y=−1.053+115.92(80)

Y=9272.547

12) En la tabla siguiente, Y es la presión barométrica medida a la altura X sobre el nivel del mar.

Y (pulgadas) 29.9 29.4 29.0 28.4 27.7X (pies) 0 500 1000 1500 2000

a) Usar el método de mínimos cuadrados para ajustar una curva exponencial de la forma:

1ero Ordenamos en una taba de distribución

xi yi Log Yi xi 2 xLogYi

0 29.9 1.476 0 0500 29.4 1.468 250000 734

1000 29.0 1.462 1000000 14621500 28.4 1.453 2250000 2179.52000 27.7 1.442 4000000 28845000 144.4 7.301 7500000 7259.5

2do Graficamos los puntos respectivamente en el eje XY y luego trazamos la línea que pasa por casi la mayoría de los puntos.

0 500 1000 1500 2000 250026.5

27

27.5

28

28.5

29

29.5

30

30.5

Gráfica de dispersión de los puntos(X,Y)

Valores YLinear (Valores Y)

Pies

Pulg

adas

Page 16: ejercicios estadistica.docx

3ero hallamos los parámetros a , b por el método de mínimos cuadrados

∑i=1

N

logYi=N loga+ log b∑i=1

N

Xi

∑i=1

N

Xi logYi=log a∑i=1

N

Xi+log b∑i=1

N

Xi ²

Luego nos va quedar así:

7.301=5 log a+5000 log b

7259.5=5000 log a+7500000 log b

Resolvemos y nos da los valores de a, b

log a=∆a∆

=| 7.301 50007259.5 7500000|| 5 50005000 7500000|

=1846000012500000

=1.4768

log b=∆b∆

=| 5 7.3015000 7259.5|

| 5 50005000 7500000|

= −207.512500000

=−0.0000166

Reemplazando valores se obtiene:

logY=log a+X logb

logY=1.4768−0.0000166 X

log a=1.4768

a = 29.9778

log b=−0.0000166

b = 1

Remplazando en Y=a . e−bx

Y=(29.9778) . e−x

b) Estimar Y para una altura de 2500 pies.

Para calcular Y en la altura de 2500 pies reemplazamos X en la ecuación:

Y = 29.9778. e−x

Page 17: ejercicios estadistica.docx

Entonces tenemos:Y = 29.9778.e−(2500 )

Y=0

14) El número de pulgadas que una estructura recién construida que recién se ha hundido esta dado por:

Y=3−3e2x

Donde X es su edad en meses

X 2 4 6 12 18 24Y 1.07 1.88 2.26 2.78 2.97 2.99

Use el método de mínimos cuadrados para estimar a

X Y logy (logy)x X2

2 1.07 0.0294 0.0588 44 1.88 0.2742 1.0968 166 2.26 0.3541 2.1246 3612 2.78 0.4440 5.328 14418 2.97 0.4728 8.5104 32424 2.99 0.4757 11.4168 57666 13.95 2.0502 28.5354 1100

Reemplazando en la fórmula :

13.95=8 log a+66 logb

28.5354=66 loga+1100log b

log b=13.95−8 logb66

=28.5354−66 logA1100

232.5−(133.6 ) log a=28.5354−66 log a

203.9646=67 log a

log a=3,0172

a=103.0172=1040,3993