proyecto estadistica espol 1 parcial

57
ESCUELA SUPERIOR POLITECNICA DEL LITORAL

Upload: espol

Post on 22-Jun-2015

2.352 views

Category:

Education


7 download

DESCRIPTION

Estudio de población y muestra

TRANSCRIPT

Page 1: Proyecto estadistica ESPOL 1 parcial

ESCUELA SUPERIOR POLITECNICA DEL LITORAL

Page 2: Proyecto estadistica ESPOL 1 parcial

1. Introducción

1.1. De qué se trata el proyectoEn una comunidad rural del país, el número de menores de edad X, que residen en las viviendas, el número de mascotas Y, y la cantidad Z de mesas en las casas.

1.2. ObjetivoPoder diferenciar entre Población y Muestra además de, Parámetro Poblacional y Estimadores Muéstrales.

Utilizar los conocimientos adquiridos en clase para realizar los diferentes literales que se piden en el proyecto.

Desarrollar habilidades de análisis crítico y matemático en la materia de ESTADÍSTICA.

Realizar proyectos estadísticos de carácter serio y beneficioso para la sociedad.

1.3. Marco teóricoEn el proyecto que se presenta a continuación se va a constar de diferentes términos estadísticos los cuales, debemos tener muy claro su definición.

Entre estos tenemos:

PoblaciónEl concepto de población en estadística va más allá de lo que comúnmente se conoce como tal. Una población se precisa como un conjunto finito o infinito de personas u objetos que presentan características comunes.

En este caso la población consistirá en 270 elementos que crearemos a partir de la formula proporcionada por el ejercicio.

El tamaño que tiene una población es un factor de suma importancia en el proceso de investigación estadístico, y este tamaño vienen dado por el número de elementos que constituye una población puede ser finita o infinita. Cuando el número de elementos que integra una población es muy grande, se puede considerar a esta como una población infinita, por ejemplo; el conjunto de todos los números positivos. Una población finita es aquella que está formada por un limitado número de elementos.

Es a menudo imposible o poco práctico observar la totalidad de los individuos, sobre todos si estos son muchos. En lugar de examinar el grupo entero llamado población o universo, se examina una pequeña parte del grupo llamada muestra.

Muestra

Se llama muestra a una parte de la población a estudiar qué sirve para representarla.

El estudio de muestras es más sencillo que el estudio de la población completa; cuesta menos y lleva menos tiempo. Por último se aprobado que el examen de una población entera todavía permite la aceptación de elementos defectuosos, por tanto, en algunos casos, el muestreo puede elevar el nivel de calidad.

Page 3: Proyecto estadistica ESPOL 1 parcial

En nuestro caso, tomaremos una muestra de 100 elementos escogidos al azar para realizar el estudio además de establecer una relación entre la muestra y la población a fin de comparar datos y encontrar alguna tendencia si es que esta existe.

Una muestra representativa contiene las características relevantes de la población en las mismas proporciones que están incluidas en tal población. Los expertos en estadística recogen datos de una muestra. Utilizan esta información para hacer referencia sobre la población que está representada por la muestra.

En consecuencia muestra y población son conceptos relativos. Una población es un todo y una muestra es una fracción o segmento de ese todo.

Variable Aleatoria

Este es un elemento muy importante en nuestro proyecto ya que nos permitirá realizar estudios tanto a la población como a la muestra. En nuestro proyecto procederemos a trabajar con tres diferentes variables aleatorias.

Una variable aleatoria es aquella que asume diferentes valores a consecuencia de los resultados de un experimento aleatorio.

Estas variables pueden ser discretas o continuas. Si se permite que una variable aleatoria adopte solo un número limitado de valores, se le llama variable aleatoria discreta. por el contrario, si se le permite asumir cualquier valor dentro de determinados límites, recibe el nombre de variable aleatoria continua.

Función de probabilidad

Una distribución la podemos concebir con una distribución teórica de frecuencia, es decir, es una distribución que describe como se espera que varíen los resultados. Dado que esta clase de distribuciones se ocupan de las expectativas son modelos de gran utilidad para hacer inferencias y tomar decisiones en condiciones de incertidumbre.

Nuestra función de probabilidad estará definida en función de las variables X,Y,Z para la población y de x,y,z para la muestra.

Media

En estadística, la media es una medida de centralización. Se llama media de una distribución de estadística a la media aritmética de los valores de los distintos individuos que la componen.

Varianza

Esta medida se basa en la cuantificación de las distintas de los datos con respecto al valor de la media.

Page 4: Proyecto estadistica ESPOL 1 parcial

Moda

Es el valor que ocurre con mayor frecuencia en una muestra puede ser que no exista la moda y también es posible que exista más de una moda.

Mediana

Una mediana es el valor de la variable que deja el mismo número de datos antes y después que él una vez ordenados estos.

Matriz correlación

Es una representación ordenada de los coeficientes de correlación de cada variable con la otra variable y consigo misma.

Histograma

Es la manera más común de representar gráficamente la distribución de frecuencias de los datos. Se lo construye dibujando rectángulos cuya base corresponda a cada intervalo de clase y su altura, según el valor de la frecuencia.

Diagrama de Caja

Es un diagrama grafico que se usa para expresar en forma resumida, algunas medidas estadísticas de posición.

El diagrama de caja describe gráficamente el rango de los datos, el rango intercuartilico, los valores extremos y la ubicación de los cuartiles. Es una representación útil para comparar grupos de datos.

Page 5: Proyecto estadistica ESPOL 1 parcial

2. Determinación de Parámetros

2.1. Determinación del Vector de Medias

f ( xyz )=k ( x+ y ) ( z+1 ) , {x=0 , 1 ,2 ,3

y=0 ,1 , 2z=1 ,2 ,3

k∑Z =1

3

∑y=0

2

∑x=0

3

( x+ y ) (z+1 )=1

k∑Z =1

3

∑y=0

2

¿¿¿

k∑Z =1

3

∑y=0

2

( (0+ y )+(1+ y )+(2+ y )+(3+ y ) )(z+1)=1

k∑Z =1

3

∑y=0

2

(6+4 y )(z+1)=1

k∑Z =1

3

¿¿

k∑Z =1

3

((6 )+(10 )+ (14 ))( z+1 )=1

k∑Z =1

3

(30)( z+1 )=1

k ((30 ) (1+1 )+ (30 ) (2+1 )+(30 ) (3+1 ))=1

k ((30 ) (2 )+ (30 ) (3 )+ (30 ) (4 ))=1

k (60+90+120 )=1

k (270)=1

k= 1270

Page 6: Proyecto estadistica ESPOL 1 parcial

Resumen de las variables X Y Z de la población.

3210

Mediana

Media

2,102,052,001,951,90

1er cuartil 1,0000

Mediana 2,00003er cuartil 3,0000Máximo 3,0000

1,8874 2,1274

2,0000 2,0000

0,9239 1,0943

A-cuadrado 17,91

Valor P < 0,005

Media 2,0074Desv.Est. 1,0018Varianza 1,0037

Sesgo -0,618305Kurtosis -0,773988N 270

Mínimo 0,0000

Prueba de normalidad de Anderson-Darling

Intervalo de confianza de 95% para la media

Intervalo de confianza de 95% para la mediana

Intervalo de confianza de 95% para la desviación estándarIntervalos de confianza de 95%

Resumen para X

Page 7: Proyecto estadistica ESPOL 1 parcial

321

Mediana

Media

3,002,752,502,252,00

1er cuartil 2,0000

Mediana 2,00003er cuartil 3,0000Máximo 3,0000

2,1356 2,3237

2,0000 3,0000

0,7239 0,8574

A-cuadrado 24,65

Valor P < 0,005

Media 2,2296Desv.Est. 0,7850Varianza 0,6162

Sesgo -0,42940Kurtosis -1,25437N 270

Mínimo 1,0000

Prueba de normalidad de Anderson-Darling

Intervalo de confianza de 95% para la media

Intervalo de confianza de 95% para la mediana

Intervalo de confianza de 95% para la desviación estándarIntervalos de confianza de 95%

Resumen para Z

Marginal de x:

f ( x )=∑z=1

3

∑y=0

21

270( x+ y )(z+1)

210

Mediana

Media

2,001,751,501,251,00

1er cuartil 1,0000

Mediana 1,00003er cuartil 2,0000Máximo 2,0000

1,1776 1,3631

1,0000 2,0000

0,7140 0,8457

A-cuadrado 25,79

Valor P < 0,005

Media 1,2704Desv.Est. 0,7743Varianza 0,5995

Sesgo -0,50945Kurtosis -1,16042N 270

Mínimo 0,0000

Prueba de normalidad de Anderson-Darling

Intervalo de confianza de 95% para la media

Intervalo de confianza de 95% para la mediana

Intervalo de confianza de 95% para la desviación estándarIntervalos de confianza de 95%

Resumen para Y

Page 8: Proyecto estadistica ESPOL 1 parcial

f ( x )= 1270

∑z=1

3

∑y=0

2

( x+ y )(z+1)

f ( x )= 1270

∑z=1

3

(( x+(0 ) ) ( z+1 )+( x+(1 ) ) ( z+1 )+ ( x+ (2 ) ) ( z+1 )¿)¿

f ( x )= 1270

∑z=1

3

(x+( x+1 )+( x+2 )¿)(z+1)¿

f ( x )= 1270

∑z=1

3

(3 x+3¿)(z+1)¿

f ( x )= 1270

( (3 x+3 ) (1+1 )+(3 x+3 ) (2+1 )+ (3 x+3 ) (3+1 ) )

f ( x )= 1270

( (3 x+3 ) (2 )+(3 x+3 ) (3 )+(3 x+3 ) ( 4 ) )

f ( x )= 1270

(9 (3 x+3))

f ( x )= 27270

(x+1)

f ( x )= 110

(x+1)

Valor esperado de x:

ux=E ( x )=∑x=0

3

xf (x)

ux=∑x=0

3

x110

(x+1)

ux=1

10∑x=0

3

x (x+1)

ux=1

10(0 (0+1 )+1 (1+1 )+2 (2+1 )+3 (3+1 ) )

ux=1

10(0+2+6+12 )

ux=2010

ux=2

Page 9: Proyecto estadistica ESPOL 1 parcial

Marginal de y:f ( y )=∑x=0

3

∑z=1

31

270(x+ y )(z+1)

f ( y )= 1270

∑x=0

3

∑z=1

3

(x+ y )(z+1)

f ( y )= 1270

∑x=0

3

(( x+ y ) (1+1 )+( x+ y ) (2+1 )+( x+ y ) (3+1 )¿)¿

f ( y )= 1270

∑x=0

3

(2 (x+ y )+3 ( x+ y )+4 ( x+ y )¿)¿

f ( y )= 1270

∑x=0

3

9(x+ y¿)¿

f ( y )= 9270

∑x=0

3

(x+ y¿)¿

f ( y )= 130

∑x=0

3

(x+ y¿)¿

f ( y )= 130

( (0+ y )+(1+ y )+ (2+ y )+(3+ y ))

f ( y )= 115

(3+2 y )

Valor esperado de y:

uy=E ( y )=∑y=0

2

yf ( y)

uy=∑y=0

2

y1

15(3+2 y )

uy=1

15∑y=0

2

y (3+2 y )

uy=1

15(0 (3+2 (0 ) )+1 (3+2 (1 ) )+2 (3+2 (2 ) ))

uy=1

15(0+5+14 )

uy=1915

Page 10: Proyecto estadistica ESPOL 1 parcial

uy ≈ 1 .27

Marginal de z:f ( z )=∑x=0

3

∑y=0

21

270( x+ y )(z+1)

f ( z )= 1270

∑x=0

3

∑y=0

2

( x+ y )(z+1)

f ( z )= 1270

∑x=0

3

( ( x+0 ) ( z+1 )+( x+1 ) (z+1 )+( x+2 ) ( z+1 )¿)¿

f ( z )= 1270

∑x=0

3

( ( x )+( x+1 )+( x+2 )¿)(z+1)¿

f ( z )= 1270

∑x=0

3

(3x+3¿)(z+1)¿

f ( z )= 1270

∑x=0

3

3(x+1¿)(z+1)¿

f ( z )= 3270

∑x=0

3

( x+1¿)(z+1)¿

f ( z )= 190

∑x=0

3

(x+1¿)(z+1)¿

f ( z )= 190

((0+1 ) ( z+1 )+(1+1 ) ( z+1 )+ (2+1 ) ( z+1 )+(3+1 ) ( z+1 ))

f ( z )= 190

(1 ( z+1 )+2 ( z+1 )+3 ( z+1 )+4 ( z+1 ))

f ( z )= 190

10(z+1)

f ( z )=1090

(z+1)

f ( z )=19(z+1)

Valor esperado de z:

uz=E ( z )=∑z=1

3

zf (z)

uz=∑z=1

3

z19(z+1)

Page 11: Proyecto estadistica ESPOL 1 parcial

uz=19∑z=1

3

z ( z+1 )

uz=19

( 1 (1+1 )+2 (2+1 )+3(3+1))

uz=19

(2+6+12 )

uz=19

(20 )

uz=209

uz ≈ 2. 22

Vector de Medias

X=(ux

u y

uz)

X=( 21 . 272. 22)

Page 12: Proyecto estadistica ESPOL 1 parcial

2.2. Determinación de la Matriz de Varianzas y Covarianzas

Hallamos primero las condicionales:

f ( x , y )=∑z=1

31

270( x+ y ) ( z+1 )

f ( x , y )= 1270

∑z=1

3

( x+ y ) ( z+1 )

f ( x , y )= 1270

( ( x+ y ) (1+1 )+ ( x+ y ) (2+1 )+( x+ y ) (3+1 ) )

f ( x , y )= 1270

(2 ( x+ y )+3 ( x+ y )+4 ( x+ y ) )

f ( x , y )= 1270

9 (x+ y)

f ( x , y )= 130

( x+ y )

f ( x , z )=∑y=0

21

270( x+ y ) (z+1 )

f ( x , z )= 1270

∑y=0

2

( x+ y ) (z+1 )

f ( x , z )= 1270

(( x+0 ) ( z+1 )+( x+1 ) ( z+1 )+( x+2 ) (z+1 ))

f ( x , z )= 1270

( ( x+0 )+( x+1 )+( x+2 ) )(z+1)

f ( x , z )= 1270

(3 x+3 )(z+1)

f ( x , z )= 3270

( x+1 )(z+1)

f ( x , z )= 3270

( x+1 )(z+1)

f ( x , z )= 190

( x+1 )(z+1)

Page 13: Proyecto estadistica ESPOL 1 parcial

f ( y , z )=∑x=0

31

270( x+ y ) ( z+1 )

f ( y , z )= 1270

∑x=0

3

( x+ y ) ( z+1 )

f ( y , z )= 1270

((0+ y ) ( z+1 )+ (1+ y ) ( z+1 )+(2+ y ) ( z+1 )+ (3+ y ) ( z+1 ))

f ( y , z )= 1270

( (0+ y )+ (1+ y )+(2+ y )+(3+ y ) )(z+1)

f ( y , z )= 1270

(6+4 y )(z+1)

f ( y , z )= 2270

(3+2 y )(z+1)

f ( y , z )= 1135

(3+2 y )(z+1)

Ahora hallamos los respectivos valores esperados de cada condicional para así poder calcular las covarianzas:

E [ xy ]=∑x=0

3

∑y=0

2

xy1

30(x+ y)

E [ xy ]= 130

∑x=0

3

∑y=0

2

x2 y+ y2 x

E [ xy ]= 130

∑x=0

3

¿¿

E [ xy ]= 130

∑x=0

3

(¿ (0 )+( x2+x )+(2 x2+4 x ))¿

E [ xy ]= 130

∑x=0

3

(¿3 x2+5 x )¿

E [ xy ]= 130

¿

E [ xy ]= 130

(0+(3+5 )+(12+10 )+(27+15 ))

E [ xy ]= 130

(0+(3+5 )+(12+10 )+(27+15 ))

Dado que la covarianza entre la variable “x” y “y” es negativa podemos concluir significa que existe una relación lineal inversa perfecta (negativa) entre las dos variables. Lo que significa que las puntuaciones bajas en X se asocian con los

Page 14: Proyecto estadistica ESPOL 1 parcial

E [ xy ]= 130

72

E [ xy ]=125

E [ xy ]=2.4

Cov ( x , y )=E [ xy ]−ux uy

Cov ( x , y )=2.4 – 2(1.27)

Cov ( x , y )=−0.14

E [ xz ]=∑x=0

3

∑z=1

3

xz1

90( x+1 )(z+1)

E [ xz ]= 190

∑x=0

3

∑z=1

3

(x2 z2+x2 z+x z2+xz )

E [ xz ]= 190

∑x=0

3

¿¿¿

E [ xz ]= 190

∑x=0

3

20 x2+20 x

E [ xz ]= 190

∑x=0

3

20(x¿¿2+x)¿

E [ xz ]=2090

∑x=0

3

(x¿¿2+x)¿

E [ xz ]=29

((0 )2+0 )+( (1 )2+1 )+ ((2 )2+2 )+((3 )2+3)¿

E [ xz ]=29

(0 )+(2 )+ (6 )+(12)¿

E [ xz ]=29

20

E [ xz ]=409

E [ xz ] ≈ 4.44

Una covarianza 0 se interpreta como la no existencia de una relación lineal entre las dos variables estudiadas(x,z).

Dado que la covarianza entre la variable “x” y “y” es negativa podemos concluir significa que existe una relación lineal inversa perfecta (negativa) entre las dos variables. Lo que significa que las puntuaciones bajas en X se asocian con los

Page 15: Proyecto estadistica ESPOL 1 parcial

Cov ( x , z )=E [ xz ]−ux uz

Cov ( x , z )=4.44 – 2(2.22)

Cov ( x , z )=0

E [ yz ]=∑y=0

2

∑z=1

3

yz1

135(3+2 y )(z+1)

E [ yz ]= 1135

∑y=0

2

∑z=1

3

yz (3+2 y )(z+1)

E [ yz ]= 1135

∑y=0

2

∑z=1

3

( 3 y z2+3 yz+2 y2 z2+2 y2 z )

E [ yz ]= 1135

∑y=0

2

¿¿

E [ yz ]= 1135

∑y=0

2

(3 y+3 y+2 y2¿+2 y2+12 y+6 y+8 y2+4 y2+27 y+9 y+18 y2+6 y2)¿

E [ yz ]= 1135

∑y=0

2

(40¿ y2+60 y )¿

E [ yz ]= 1135

∑y=0

2

20 (2¿ y2+3 y)¿

E [ yz ]= 20135

∑y=0

2

(2¿ y2+3 y)¿

E [ yz ]= 20135

( (2 (0 )2+3 (0 ) )+(2 (1 )2+3 (1 ) )+(2 (2 )2+3 (2 ) ))

E [ yz ]= 20135

(0+5+14)

E [ yz ]= 20135

19

E [ yz ]=380135

E [ yz ] ≈ 2.81481

Cov ( y , z )=E [ yz ]−uy uz

Una covarianza 0 se interpreta como la no existencia de una relación lineal entre las dos variables estudiadas (y,z).

Page 16: Proyecto estadistica ESPOL 1 parcial

Cov ( y , z )=380135

– ( 3830

)( 209

)

Cov ( y , z )=0

Ahora hallamos las varianzas de cada variable:

E [ x2 ]=∑x=0

3

x2 110

(x+1)

E [ x2 ]= 110

∑x=0

3

x2(x+1)

E [ x2 ]= 110

∑x=0

3

(x3+ x2)

E [ x2 ]= 110

[ ( (0 )3+ (0 )2 )+( (1 )3+(1 )2 )+( (2 )3+(2 )2 )+((3 )3+ (3 )2 )]

E [ x2 ]= 110

(50)

E [ x2 ]=5

Var ( x )=E [ x2 ]−u2

Var ( x )=5−(2)2

Var ( x )=1

E [ y2 ]=∑y=0

2

y2 115

(3+2 y )

E [ y2 ]= 115

∑y=0

2

y2(3+2 y )

E [ y2 ]= 115

∑y=0

2

(3 y3+2 y2)

E [ y2 ]= 115

[(3 (0 )3+2 (0 )2 )+(3 (1 )3+2 (1 )2 )+(3 (2 )3+2 (2 )2 )]

E [ y2 ]= 115

(37)

E [ y2 ] ≈2.47

Var ( y )=E [ x2 ]−u2

Page 17: Proyecto estadistica ESPOL 1 parcial

Var ( y )=2.47−(1.27 )2

Var ( y )=0.85

E [ z2 ]=∑z=1

3

z2 19(z+1)

E [ z2 ]=19∑z=1

3

z2(z+1)

E [ z2 ]=19∑z=1

3

(z3+z2)

E [ z2 ]=19[( (1 )3+ (1 )2)+ ((2 )3+(2 )2 )+( (3 )3+ (3 )2 )]

E [ z2 ]=19(50)

E [ z2 ]≈5.56

Var ( z )=E [ z2 ]−u2

Var ( z )=5.56−(2.22)2

Var ( z )=0.63

Matriz de varianzas y covarianzas

Var ( x ) Cov ( x , y ) Cov ( x , z )Cov ( y , x ) Var ( y ) Cov ( y , z )Cov ( z , x ) Cov ( z , y ) Var ( z )

1 −0.14 0−0.14 0.85 0

0 0 0.63

2.2. Determinación de la Matriz de Correlación

Page 18: Proyecto estadistica ESPOL 1 parcial

ρ xy=Cov ( x , y )

Var (x ) Var ( y )

ρ xy=−0.14

(1)(0.85)

ρ xy=−0.16

ρ xz=Cov ( x , z )

Var ( x )Var ( z )

ρ xz=0

(1)(0.63)

ρ xz=0

ρ yz=Cov ( y , z )

Var ( y )Var ( z )

ρ yz=0

(0.85)(0.63)

ρ yz=0

Matriz de correlación

1 ρ xy ρxz

ρ yx 1 ρ yz

ρzx ρ zy 1

1 −0.16 0−0.16 1 0

0 0 1

Dado que la correlación entre “x” y “y” está cercana a 0 su correlación es muy débil.

Dado que la correlación entre “x” y “z” es 0 no están correlacionados linealmente.

Dado que la correlación entre “y” y “z” es 0 no están correlacionados linealmente.

Page 19: Proyecto estadistica ESPOL 1 parcial

3. Estadística Descriptiva Univariada y Multivariada3.1. Toma de una muestra de tamaño 100

Variables x y z1. 0 1 12. 0 2 13. 0 2 14. 0 2 25. 0 2 26. 0 2 37. 0 2 38. 0 2 39. 1 0 110. 1 0 211. 1 0 212. 1 0 313. 0 1 214. 0 1 215. 0 1 316. 0 1 317. 1 1 118. 1 1 119. 1 1 120. 1 1 221. 1 1 222. 1 1 323. 1 1 324. 1 1 325. 1 2 126. 1 2 127. 1 2 128. 1 2 129. 1 2 230. 1 2 231. 1 2 332. 1 2 333. 1 2 334. 1 2 335. 2 0 136. 2 0 137. 2 0 138. 2 0 239. 2 0 240. 2 0 341. 2 1 1

Page 20: Proyecto estadistica ESPOL 1 parcial

42. 2 1 143. 2 1 244. 2 1 245. 2 1 346. 2 1 347. 2 1 348. 2 1 349. 2 2 150. 2 2 151. 2 2 252. 2 2 353. 2 2 354. 3 0 155. 3 0 156. 3 0 257. 3 0 258. 3 0 359. 3 0 360. 3 0 361. 3 0 362. 3 0 363. 3 1 164. 3 1 165. 3 1 166. 3 1 167. 3 1 268. 3 1 269. 3 1 270. 3 1 271. 3 1 272. 3 1 373. 3 1 374. 3 1 375. 3 1 376. 3 1 377. 3 1 378. 3 2 179. 3 2 180. 3 2 181. 3 2 182. 3 2 183. 3 2 284. 3 2 285. 3 2 286. 3 2 287. 3 2 3

Page 21: Proyecto estadistica ESPOL 1 parcial

88. 3 2 389. 3 2 390. 3 2 391. 3 2 392. 3 2 393. 3 2 394. 3 2 395. 3 2 396. 3 2 397. 3 2 398. 3 2 399. 3 2 3

100. 3 2 3

3.2. Tabulación (Tabla de Frecuencias) y Gráficos (Histogramas, Ojivas y Diagrama de Cajas) para las 3 variables, Medidas de Tendencia Central, Dispersión, Posición y Sesgo.

TABLA DE FRECUENCIAS DE LA VARIABLE XX FRECUENCIA FRECUENCI

A RELATIVAFRECUENCIA ACUMULADA

FRECUENCIA RELATIVA

ACUMULADA0 12 0,12 12 0,121 22 0,22 34 0,342 19 0,19 53 0,533 47 0,47 100 1

TABLA DE FRECUENCIAS DE LA VARIABLE YY FRECUENCIA FRECUENCI

A RELATIVAFRECUENCIA ACUMULADA

FRECUENCIA RELATIVA

ACUMULADA0 19 0,19 19 0,191 36 0,36 55 0,552 45 0,45 100 1

TABLA DE FRECUENCIAS DE LA VARIABLE ZZ FRECUENCIA FRECUENCI FRECUENCIA FRECUENCIA

Page 22: Proyecto estadistica ESPOL 1 parcial

A RELATIVA ACUMULADA RELATIVA ACUMULADA

1 29 0,29 29 0,292 26 0,26 55 0,553 45 0,45 100 1

Page 23: Proyecto estadistica ESPOL 1 parcial
Page 24: Proyecto estadistica ESPOL 1 parcial
Page 25: Proyecto estadistica ESPOL 1 parcial
Page 26: Proyecto estadistica ESPOL 1 parcial
Page 27: Proyecto estadistica ESPOL 1 parcial

MEDIDAS DE TENDENCIA CENTRAL DE X

Media

x=∑i=1

100 x i

n

x=2.01

Mediana

Mediana=X

( n2+1)

+ X n2

2

Mediana=2

Moda

Moda=3

Podemos decir que la media (aritmética) es la cantidad total de la variable distribuida a partes iguales entre cada observación.

Page 28: Proyecto estadistica ESPOL 1 parcial

DISPERSION DE LA VARIABLE X

Varianza

S2=∑i=1

100 (x−x)2

n−1

S2=1.1817

Desviación estándar

S=√∑i=1

100 ( x−x)2

n−1

S=¿1,0870

Coeficiente de Variación

CV =√∑i=1

100 (x−x)2

n−1

∑i=1

100 x i

n

=Sx

CV =¿0,54082993

Page 29: Proyecto estadistica ESPOL 1 parcial

POSICION DE LA VARIABLE X

Percentil 95

i=0. i∗(n+1)

i=0.95∗(101)=95.95

x (i . a )=x i+(0. a )∗( x i+1−x i )

x (95.95 )=3+ (0.95 )∗(3−3)

P (95 )=3

Percentil 35

i=0. i∗(n+1)

i=0.35∗(101)=35.35

x (i . a )=x i+(0. a )∗( x i+1−x i )

x (35.35 )=2+(0.35 )∗(2−2)

P (35 )=2

Decil 9

i=0. i∗(n+1)

i=0.09∗(101)=90.9

x (i . a )=x i+(0. a )∗( x i+1−x i )

x (90.9 )=3+ (0.9 )∗(3−3)

D (9 )=3

Decil 2

i=0. i∗(n+1)

i=0.02∗(101)=20.2

x (i . a )=x i+(0. a )∗( x i+1−x i )

x (20.2 )=1+(0.2 )∗(1−1)

D (2 )=1

Decil 7

i=0. i∗(n+1)

i=0.07∗(101)=70.7

x (i . a )=x i+(0. a )∗( x i+1−x i )

x (70.7 )=3+( 0.7 )∗(3−3)

D (7 )=3

Cuartil 1

i=0. i∗(n+1)

i=0.25∗(101)=25.25

x (i . a )=x i+(0. a )∗( x i+1−x i )

x (25.25 )=1+(0.25 )∗(1−1)

Q (1 )=1

Cuartil 2

i=0. i∗(n+1)

i=0.50∗(101)=50.50

x (i . a )=x i+(0. a )∗( x i+1−x i )

x (50.50 )=2+(0.50 )∗(2−2)

Q (2 )=2

Cuartil 3

i=0. i∗(n+1)

i=0.75∗(101)=75.75

x (i . a )=x i+(0. a )∗( x i+1−x i )

x (75.75 )=3+(0.75 )∗(3−3)

Q (3 )=3

Page 30: Proyecto estadistica ESPOL 1 parcial

OTROS CALCULOS DE LA VARIABLE X

Coefciente de asimetría

C=E(x−ux)

3

σ3

C=u3

σ3

C=−0.59784

Coeficiente de Kurtosis

C=E(x−ux)

4

σ4

C=u4

σ4

C=¿-1.0648

Rango Intercuartil

RI=Q3−Q1

RI=3−1=2

Rango

R=X100−X1

R=3−0=1

Un resultado negativo significa que la distribución se sesga a la derecha.

El resultado muestra que se trata de una distribución platicúrtica, es decir, con una reducida concentración alrededor de los valores centrales de la distribución.

Page 31: Proyecto estadistica ESPOL 1 parcial

MEDIDAS DE TENDENCIA CENTRAL DE Y

Media

y=∑i=1

100 y i

n

y=1.26

Mediana

Mediana=Y

( n2+1)

+Y n2

2

Mediana=1

Moda

Moda=2

Podemos decir que la media (aritmética) es la cantidad total de la variable distribuida a partes iguales entre cada observación.

Page 32: Proyecto estadistica ESPOL 1 parcial

DISPERSION DE LA VARIABLE Y

Varianza

S2=∑i=1

100 ( y− y )2

n−1

S2=0.5782

Desviación estándar

S=√∑i=1

100 ( y− y )2

n−1

S=¿0,7603

Coeficiente de Variación

CV =√∑i=1

100 ( y− y )2

n−1

∑i=1

100 y i

n

=Sy

CV =¿0,60347832

Page 33: Proyecto estadistica ESPOL 1 parcial

POSICION DE LA VARIABLE Y

Percentil 95

i=0. i∗(n+1)

i=0.95∗(101)=95.95

y (i . a )= y i+(0.a )∗( y i+1− y i )

y (95.95 )=2+ (0.95 )∗(2−2)

P (95 )=2

Percentil 35

i=0. i∗(n+1)

i=0.35∗(101)=35.35

y (i . a )= y i+(0.a )∗( y i+1− y i )

y (35.35 )=1+(0.35 )∗(1−1)

P (35 )=1

Decil 9

i=0. i∗(n+1)

i=0.09∗(101)=90.9

y (i . a )= y i+(0.a )∗( y i+1− y i )

y (90.9 )=2+ (0.9 )∗(2−2)

D (9 )=2

Decil 2

i=0. i∗(n+1)

i=0.02∗(101)=20.2

y (i . a )= y i+(0.a )∗( y i+1− y i )

y (20.2 )=1+(0.2 )∗(1−1)

D (2 )=1

Decil 7

i=0. i∗(n+1)

i=0.07∗(101)=70.7

y (i . a )= y i+(0.a )∗( y i+1− y i )

y (70.7 )=2+ (0.7 )∗(2−2)

D (7 )=2

Cuartil 1

i=0. i∗(n+1)

i=0.25∗(101)=25.25

y (i . a )= y i+(0.a )∗( y i+1− y i )

y (25.25 )=1+(0.25 )∗(1−1)

Q (1 )=1

Cuartil 2

i=0. i∗(n+1)

i=0.50∗(101)=50.50

y (i . a )= y i+(0.a )∗( y i+1− y i )

y (50.50 )=1+(0.50 )∗(1−1)

Q (2 )=1

Cuartil 3

i=0. i∗(n+1)

i=0.75∗(101)=75.75

y (i . a )= y i+(0.a )∗( y i+1− y i )

y (75.75 )=2+(0.75 )∗(2−2)

Q (3 )=2

Page 34: Proyecto estadistica ESPOL 1 parcial

OTROS CALCULOS DE LA VARIABLE Y

Coefciente de asimetría

C=E( y−u y)

3

σ3

C=u3

σ3

C=−0.47838

Coeficiente de Kurtosis

C=E( y−u y)

4

σ4

C=u4

σ4

C=¿-1.11718

Rango Intercuartil

RI=Q3−Q1

RI=2−1=1

Rango

R=Y 100−Y 1

R=2−0=2

Un resultado negativo significa que la distribución se sesga a la derecha.

El resultado muestra que se trata de una distribución platicúrtica, es decir, con una reducida concentración alrededor de los valores centrales de la distribución.

Page 35: Proyecto estadistica ESPOL 1 parcial

MEDIDAS DE TENDENCIA CENTRAL DE Z

Media

z=∑i=1

100 zi

n

z=2.16

Mediana

Mediana=Z

( n2+1)

+Z n2

2

Mediana=2

Moda

Podemos decir que la media (aritmética) es la cantidad total de la variable distribuida a partes iguales entre cada observación.

Page 36: Proyecto estadistica ESPOL 1 parcial

Moda=3

DISPERSION DE LA VARIABLE Z

Varianza

S2=∑i=1

100 (z−z)2

n−1

S2=0.7216

Desviación estándar

S=√∑i=1

100 ( z−z)2

n−1

S=¿0,8495

Coeficiente de Variación

CV =√∑i=1

100 (z−z)2

n−1

∑i=1

100 zi

n

=Sz

CV =¿0,3933

Page 37: Proyecto estadistica ESPOL 1 parcial

POSICION DE LA VARIABLE Z

Percentil 95

i=0. i∗(n+1)

i=0.95∗(101)=95.95

z (i . a )=zi+(0. a )∗( zi+1− zi )

z (95.95 )=3+ (0.95 )∗(3−3)

P (95 )=3

Percentil 35

i=0. i∗(n+1)

i=0.35∗(101)=35.35

z (i . a )=zi+(0. a )∗( zi+1− zi )

z (35.35 )=2+(0.35 )∗(2−2)

P (35 )=2

Decil 9

i=0. i∗(n+1)

i=0.09∗(101)=90.9

z (i . a )=zi+(0. a )∗( zi+1− zi )

z (90.9 )=2+(0.9 )∗(2−2)

D (9 )=2

Decil 2

i=0. i∗(n+1)

i=0.02∗(101)=20.2

z (i . a )=zi+(0. a )∗( zi+1− zi )

z (20.2 )=1+(0.2 )∗(1−1)

D (2 )=1

Decil 7

i=0. i∗(n+1)

i=0.07∗(101)=70.7

z (i . a )=zi+(0. a )∗( zi+1− zi )

z (70.7 )=3+ (0.7 )∗(3−3)

D (7 )=3

Cuartil 1

i=0. i∗(n+1)

i=0.25∗(101)=25.25

z (i . a )=zi+(0. a )∗( zi+1− zi )

z (25.25 )=1+(0.25 )∗(1−1)

Q (1 )=1

Cuartil 2

i=0. i∗(n+1)

i=0.50∗(101)=50.50

z (i . a )=zi+(0. a )∗( zi+1− zi )

z (50.50 )=2+(0.50 )∗(2−2)

Q (2 )=2

Cuartil 3

i=0. i∗(n+1)

Page 38: Proyecto estadistica ESPOL 1 parcial

i=0.75∗(101)=75.75

z (i . a )=zi+(0. a )∗( zi+1− zi )

z (75.75 )=3+(0.75 )∗(3−3)

Q (3 )=3

OTROS CALCULOS DE LA VARIABLE Z

Coefciente de asimetría

C=E(z−uz)

3

σ3

C=u3

σ3

C=−0.31444

Coeficiente de Kurtosis

C=E(z−uz)

4

σ 4

C=u4

σ4

C=¿-1.54880

Rango Intercuartil

RI=Q3−Q1

RI=3−1=2

Rango

R=X100−X1

R=3−1=2

Vector de Medias

Un resultado negativo significa que la distribución se sesga a la derecha.

El resultado muestra que se trata de una distribución platicúrtica, es decir, con una reducida concentración alrededor de los valores centrales de la distribución.

Page 39: Proyecto estadistica ESPOL 1 parcial

X=( xyz )

X=( 2.011 . 262.16 )

3.4. Determinación de la Matriz de Varianzas y Covarianzas Muestral S

sXY=∑i=1

n

(x i−x )( y i− y )

n−1

sXY= -0.0626

sYZ=∑i=1

n

( y i− y )( zi−z )

n−1

sYZ=0.0484

sXZ=∑i=1

n

( xi−x )( zi−z )

n−1

sXZ= 0.0984

Matriz de Varianzas y Covarianzas

1.1817 −0.0626 0.0984−0.0626 0.5782 0.04840.0984 0.0484 0.7216

3.5. Determinación de Medias Condicionales

En este caso por ser negativa dependencia inversa o negativa, es decir, a grandes valores de x corresponden pequeños valores de y.

En este caso hay dependencia directa (positiva), es decir, a grandes valores de y corresponden grandes valores de z.

En este caso hay dependencia directa (positiva),

es decir, a grandes valores de x corresponden grandes valores de z.

Page 40: Proyecto estadistica ESPOL 1 parcial

Para determinar las medias condicionales debemos tener los siguientes datos en cuenta:

f ( x )= 110

(x+1)

f ( y )= 115

(3+2 y )

f ( z )=19(z+1)

f ( x , y )= 130

( x+ y )

f ( x , z )= 190

( x+1 )(z+1)

f ( y , z )= 1135

(3+2 y )(z+1)

Primero tenemos que ver si son independientes o no, para saberlo hay que hacer una igualdad que si se cumple es independiente caso contrario no son independientes:

f ( x , y )=f ( y )∗f ( x )

Si son independientes

E [ x¿ ]=∑ [ x ]

Pero si no son independientes

E [ x¿ ]=∑ x f (x ¿ )

Donde f ( x ¿ )

f ( x ¿ )= f ( x , y )f ( y )

Calculo de E ( x¿ )

110

( x+1 ) 115

(3+2 y )= 130

(x+ y )

f ( x ) f ( y ) ≠ f ( x , y )

No son independientes

f ( x ¿ )= f ( x , y )f ( y )

Page 41: Proyecto estadistica ESPOL 1 parcial

f ( x ¿ )=

130

(x+ y )

115

(3+2 y)

f ( x ¿ )= 15(x+ y)30(3+2 y )

f ( x ¿ )=12

(x+ y)(3+2 y )

E ( x¿ )=∑x=0

3

x f ( x ¿ )

E ( x¿ )=∑x=0

3

x12

(x+ y )(3+2 y )

E ( x¿=0 )=∑x=0

3

x12

(x+ y )(3+2 y)

E ( x¿=0 )=∑x=0

3

x12

(x+0)(3+2(0))

E ( x¿=0 )=∑x=0

3

xx6

E ( x¿=0 )=16∑x=0

3

x2

E ( x¿=0 )=16

[12+22+32 ]

E ( x¿=0 )=16

[ 1+4+1 ]

E ( x¿=0 )=146

E ( x¿=0 )=73

Page 42: Proyecto estadistica ESPOL 1 parcial

E ( x¿ )=∑x=0

3

x f ( x ¿ )

E ( x¿ )=∑x=0

3

x12

(x+ y )(3+2 y )

E ( x¿=1 )=∑x=0

3

x12

(x+ y)(3+2 y )

E ( x¿=1 )=∑x=0

3

x12

(x+1)(3+2(1))

E ( x¿=1 )=∑x=0

3

x12

(x+1)5

E ( x¿=1 )= 110

∑x=0

3

[x2+x ]

E ( x¿=1 )= 110

¿

E ( x¿=1 )=2010

E ( x¿=1 )=2

E ( x¿ )=∑x=0

3

x f ( x ¿ )

E ( x¿ )=∑x=0

3

x12

(x+ y )(3+2 y )

E ( x¿=2 )=∑x=0

3

x12

(x+ y)(3+2 y )

Page 43: Proyecto estadistica ESPOL 1 parcial

E ( x¿=2 )=∑x=0

3

x12

(x+2)(3+2(2))

E ( x¿=2 )=∑x=0

3x2

(x+2)7

E ( x¿=2 )= 114

∑x=0

3

[ x2+2 x ]

E ( x¿=2 )= 114

¿

E ( x¿=2 )= 114

[ 3+8+15 ]

E ( x¿=2 )=2614

E ( x¿=2 )=137

Calculo de E ( y ¿ )

110

( x+1 ) 115

(3+2 y )= 130

(x+ y )

f ( x ) f ( y ) ≠ f ( x , y )

No son independientes

f ( y ¿ )= f ( x , y )f (x )

f ( y ¿ )=

130

(x+ y)

110

(x+1)

f ( y ¿ )=10 (x+ y)30 (x+1)

f ( y ¿ )=13

(x+ y)(x+1)

E ( y ¿ )=∑y=0

2

y f ( y¿ )

Page 44: Proyecto estadistica ESPOL 1 parcial

E ( y ¿ )=∑y=0

2

y13

(x+ y )(x+1)

E ( y ¿=0 )=∑y=0

2

y13

(x+ y )(x+1)

E ( y ¿=0 )=∑y=0

2

y13

(0+ y)(0+1)

E ( y ¿=0 )=∑y=0

2

yy3

E ( y ¿=0 )=13∑y=0

2

y2

E ( y ¿=0 )=13

[12+22 ]

E ( y ¿=0 )=53

E ( y ¿ )=∑y=0

2

y f ( y¿ )

E ( y ¿ )=∑y=0

2

y13

(x+ y )(x+1)

E ( y ¿=1 )=∑y=0

2

y13

(x+ y)(x+1)

E ( y ¿=1 )=∑y=0

2

y13

(1+ y)(1+1)

E ( y ¿=1 )=∑y=0

2

y( y+1)

6

E ( y ¿=1 )=16∑y=0

2

[ y2+ y ]

E ( y ¿=1 )=16

¿

E ( y ¿=1 )=86

E ( y ¿=1 )=43

Page 45: Proyecto estadistica ESPOL 1 parcial

E ( y ¿ )=∑y=0

2

y f ( y¿ )

E ( y ¿ )=∑y=0

2

y13

(x+ y )(x+1)

E ( y ¿=2 )=∑y=0

2

y13

(x+ y)(x+1)

E ( y ¿=2 )=∑y=0

2

y13

(2+ y )(2+1)

E ( y ¿=2 )=∑y=0

2

y( y+2)

9

E ( y ¿=2 )=19∑y=0

2

y ( y+2)

E ( y ¿=2 )=19∑y=0

2

[ y2+2 y ]

E ( y ¿=2 )=19¿

E ( y ¿=2 )=119

E ( y ¿ )=∑y=0

2

y f ( y¿ )

E ( y ¿ )=∑y=0

2

y13

(x+ y )(x+1)

E ( y ¿=3 )=∑y=0

2

y13

(x+ y)(x+1)

E ( y ¿=3 )=∑y=0

2

y13

(3+ y )(3+1)

E ( y ¿=3 )=∑y=0

2

y13

(3+ y )(3+1)

E ( y ¿=3 )=∑y=0

2

y( y+3)

12

Page 46: Proyecto estadistica ESPOL 1 parcial

E ( y ¿=3 )= 112

∑y=0

2

y ( y+3)

E ( y ¿=3 )= 112

∑y=0

2

[ y2+3 y ]

E ( y ¿=3 )= 112

¿

E ( y ¿=3 )= 112

[ 4+10 ]

E ( y ¿=3 )=1412

E ( y ¿=3 )=76

Calculo de E ( x¿ )

( 110

( x+1 ))( 19

( z+1 ))= 190

( x+1 )(z+1)

190

( x+1 ) ( z+1 )= 190

( x+1 ) (z+1 )

f ( x ) f ( z )=f (x , z )

∴Son independientes

E ( x¿ )=E( x)

E ( x¿ )=2.01

Para cualquier valor de z donde z toma los valores de {1,2,3}

Calculo de E ( z¿ )

( 110

( x+1 ))( 19

( z+1 ))= 190

( x+1 )(z+1)

190

( x+1 ) ( z+1 )= 190

( x+1 ) (z+1 )

f ( z ) f ( x )=f (x , z )

∴Son independientes

E ( z¿ )=E( z)

Page 47: Proyecto estadistica ESPOL 1 parcial

E ( z¿ )=2.16

Para cualquier valor de x donde x toma los valores de {0,1,2,3}

Calculo de E ( y ¿ )

( 115

(3+2 y ))( 19

( z+1 ))= 1135

(3+2 y )(z+1)

1135

(3+2 y ) ( z+1 )= 1135

(3+2 y ) ( z+1 )

f ( y ) f ( z )=f ( y , z )

∴Son independientes

E ( y ¿ )=E ( y )

E ( y ¿ )=1.26

Para cualquier valor de z donde z toma los valores de {1, 2, 3}

Cálculo de E ( z¿ )

( 115

(3+2 y ))( 19

( z+1 ))= 1135

(3+2 y )(z+1)

1135

(3+2 y ) ( z+1 )= 1135

(3+2 y ) ( z+1 )

f ( z ) f ( y )=f ( y , z )

∴Son independientes

E ( z¿ )=E( z)

E ( z¿ )=2.16

Para cualquier valor de y donde y toma los valores de {0, 1, 2}

3.6.

Determinación de la Matriz de Correlación Muestral R

Page 48: Proyecto estadistica ESPOL 1 parcial

r=s XY

sx s y

r= -0,07573303

r=sXZ

sx s z

r=0,4626313

r=sYZ

s y s z

r=0,2039315

Matriz de Correlación

1 −0,07573303 0,4626313−0,07573303 1 0,2039315

0,4626313 0,2039315 1

4. Determinación de errores post experimentales

Para el siguiente cálculo vamos a usar las siguientes formulas:

%Error media=|Media poblacional−Media muestral|

Media poblacional∗100

%Error varianza=|Varianza poblacional−Varianza muestral|

Varianza poblacional∗100

Errores

x y zMedia poblacional 2,00 1,27 2,22Media muestral 2,01 1,26 2,16%Error 0,50 0,79 2,70

x y zVarianza poblacional 1,00 0,85 0,63Varianza muestral 1,18 0,58 0,72%Error 18 31,98 14,54

Dado que la correlación entre

“x” y “y” está cercana a 0 su

Si r está cercano a 0, X y Z su correlación es

Si r está cercano a 0, Y y Z su correlación es

muy débil.

Page 49: Proyecto estadistica ESPOL 1 parcial

Podemos concluir que de la muestra tomada las medias muestran un porcentaje de error muy pequeño e insignificante por lo que no afecta a los datos reales y podemos tener buenas conclusiones de como se comportaría la población estudiada.

En cambio con la muestra tomada las varianzas muestran un porcentaje de error muy alto que puede considerárselo como un error muy grande por lo que afectaría al tener que analizar el comportamiento de la población estudiada.

5. Conclusiones Al finalizar este proyecto puedo recordar todo lo ocurrido durante la realización de este

por lo que he llegado a algunas conclusiones: Una vez encontrada las características descriptivas tanto de la población como de la

muestra concluyo que, si bien trabajar con una pequeña muestra facilita los cálculos esta nos proporciona datos reales ya que si se trabaja con una muestra que tenga un margen de error mínimo no se pierde información puesto que cuando uno trabaja con una población generalmente es una población demasiada grande. Inclusive en el cálculo de la varianza en el ejercicio llegue a encontrar un error (31.98%) que puede considerárselo como un error grande, así que es preferible trabajar otra muestra con la finalidad resultados veraces aunque esto nos signifique un mayor esfuerzo pero sabremos con exactitud el comportamiento de dicha población.

La muestra nos proporciona una tendencia con la cual podríamos suponer que es la misma de la población. Nos facilita los cálculos y es muy útil cuando no necesitamos de información precisa pero como dicho anteriormente, no deberíamos confiarnos en los resultados obtenidos debido a que no trabajamos con una muestra que tiene un margen de error grande.

Los gráficos fueron de mucha utilidad, de manera muy sencilla me proporciono una idea de las tendencias de las variables por lo que pude imaginar una posible respuesta a las actividades pedidas.

Establecer la función de probabilidad empleando variables aleatorias discretas es muy útil sobre todo cuando se desea trabajar con enormes cantidades de datos ya que, podemos encontrar una relación de estos para poder facilitar los cálculos estadísticos.

Recomendaciones

Es necesario realizar un estudio metódico, con tiempo acerca de las muestras para poder presentar datos fiables.

Es necesario estimas o suponer ciertos parámetros que ayuden a un análisis de éstas para que posean cierta “correspondencia.”

6. Bibliografía

PROBABILIDAD Y ESTADÍSTICA: Fundamentos y Aplicaciones. Autor: Gaudencio Zurita Herrera. ISBN: 9789978310557. ICM – ESPOL. Guayaquil – Ecuador. www.icm.espol.edu.ec

Page 50: Proyecto estadistica ESPOL 1 parcial

INTRODUCCION A LA PROBABILIDAD Y ESTADISTICA de BEAVER, ROBERT J. y BEAVER, BARBARA M. y MENDENHALL, WILLIAM. ISBN: 9789706861955. Nº Edición: 1ª ED. Año de edición: 2003. Plaza edición: MEXICO

Rodríguez Ojeada L. Probabilidad y Estadística Básica para Ingenieros. ICM – ESPOL. Guayaquil – Ecuador. www.icm.espol.edu.ec

Meet Minitab 15 para Windows Enero 2007