estaditica deber varios

67
UNIVERSIDAD POLITÉCNICA ESTATAL DEL CARCHI ESCUELA DE COMERCIO EXTERIOR ESTADISTICA INFERENCIAL MSC: JORGE POZO DIANA ERAZO SEXTO “A” Tulcán – Ecuador 2012

Upload: kami-hernandez

Post on 25-May-2015

753 views

Category:

Documents


2 download

DESCRIPTION

estadistica deber chi cuadrado

TRANSCRIPT

Page 1: Estaditica deber varios

UNIVERSIDAD POLITÉCNICA ESTATAL DEL CARCHI

ESCUELA DE COMERCIO EXTERIOR

ESTADISTICA INFERENCIAL

MSC: JORGE POZO

DIANA ERAZO

SEXTO “A”

Tulcán – Ecuador

2012

Page 2: Estaditica deber varios

TEMA: Prueba De Hipótesis, T De Student Y Chi Cuadrado

Problema. El desconocimiento de prueba de hipótesis, t de student y chi cuadrado no permite un buen desempeño en la realización de ejercicios relacionados al entorno.

Objetivo General:

Aplicar los conocimientos de una forma adecuada resolviéndolos problemas

que se presentan

Objetivos Específicos:

Realizar una investigación de los temas mencionados

Resolver problemas de comercio exterior

Conocer los diferentes temas de estadística inferencial.

Justificación.-

La estadística inferencial es muy importantes dentro del comercio

internacional, puesto que existen diferentes problemas relacionados al

comercio exterior, por medio de la correlación lineal y regresión y otros temas

relacionados permite dar solución a los mismos.

A través de la ejecución de los ejercicios enriqueceremos nuestros

conocimientos, los que a futuro serán aplicados en el campo laboral acorde al

comercio exterior.

Además se genera un amplio interés al realizar este trabajo, puesto que

poseeremos más conocimientos sobre Estadística inferencial para poderlos

aplicar en nuestra carrera profesional.

Page 3: Estaditica deber varios

MARCO TEORICO

T DE STUDENT

Es una distribución de probabilidad que surge del problema

de estimar la media de una población normalmente distribuida cuando

el tamaño de la muestra es pequeño.

Aparece de manera natural al realizar la prueba t de Student para la

determinación de las diferencias entre dos medias muestrales y para la

construcción del intervalo de confianza para la diferencia entre las medias de

dos poblaciones cuando se desconoce la desviación típica de una población y

ésta debe ser estimada a partir de los datos de una muestra.

La distribución t de Student es la distribución de probabilidad del cociente

donde

Z tiene una distribución normal de media nula y varianza 1

V tiene una distribución ji-cuadrado con   grados de libertad

Z y V son independientes

Si μ es una constante no nula, el cociente   es una variable aleatoria

que sigue la distribución t de Student no central con parámetro de no-

centralidad  .

Aparición y especificaciones de la distribución t de Student

Supongamos que X1,..., Xn son variables aleatorias independientes distribuidas

normalmente, con media μ yvarianza σ2. Sea

Page 4: Estaditica deber varios

la media muestral. Entonces

sigue una distribución normal de media 0 y varianza 1.

Sin embargo, dado que la desviación estándar no siempre es conocida de

antemano, Gosset estudió un cociente relacionado,

donde

es la varianza muestral y demostró que la función de densidad de T es

donde   es igual a n − 1.

La distribución de T se llama ahora la distribución-t de Student.

El parámetro   representa el número de grados de libertad. La distribución

depende de  , pero no de   o  , lo cual es muy importante en la práctica.

Intervalos de confianza derivados de la distribución t de Student

El procedimiento para el cálculo del intervalo de confianza basado en la t de

Student consiste en estimar la desviación típica de los datos S y calcular el

error estándar de la media  , siendo entonces el intervalo de confianza

para la media =   .

Es este resultado el que se utiliza en el test de Student: puesto que la

diferencia de las medias de muestras de dos distribuciones normales se

Page 5: Estaditica deber varios

distribuye también normalmente, la distribución t puede usarse para examinar

si esa diferencia puede razonablemente suponerse igual a cero.

PRUEBA DE HIPÓTESIS

La estadística inferencial es el proceso de usar la información de una muestra

para describir el estado de una población. Sin embargo es frecuente que

usemos la información de una muestra para probar un reclamo o conjetura

sobre la población. El reclamo o conjetura se refiere a una hipótesis. El

proceso que corrobora si la información de una muestra sostiene o refuta el

reclamo se llama prueba de hipótesis (Tenorio Bahena, Jorge, 2006).

Los términos prueba de hipótesis y probar una hipótesis s utilizan

indistintamente. La prueba de hipótesis comienza como una afirmación, o

suposición sobre un parámetro de la población, como la media poblacional

(Tamayo y Tamayo, Mario, 2010).

Una prueba de hipótesis consiste en contratar dos hipótesis estadísticas. Tal

contraste involucra la toma de decisión acerca de las hipótesis. La decisión

consiste en rechazar o no una hipótesis a favor de otra. (Lincoln L., 2008)

Hipótesis Nula (Ho).- Se refiere siempre a un valor específico del parámetro

de la población, no a una estadística de muestra. La letra H significa hipótesis y

el subíndice cero no hay diferencia por lo general hay un “no” en la hipótesis

nula que indica que “no hay cambio” podemos rechazar o aceptar “Ho”. (Pick,

Susan y López, Ana Luisa., 2009).

Hipótesis Alternativa (Ha).- Es cualquier hipótesis que sea diferente de la

nula es una afirmación que se acepta si los datos muéstrales proporcionan

Page 6: Estaditica deber varios

evidencia suficiente de que la hipótesis nula es falsa, se le conoce también

como hipótesis de investigación el planteamiento de hipótesis alternativa nunca

contiene un signo de igualdad con respecto al valor especificado del parámetro

(Pick, Susan y López, Ana Luisa., 2009).

Ejemplo.

EJEMPLO 1:

Para evaluar el nivel mental de los ingresantes de la Universidad se

estandarizo la habilidad mental encontrándose un C.I. (coeficiente intelectual)

promedio de 101,2 con una desviación estándar de 13,8. Aplicada de la prueba

a una muestra de 60 ingresantes de esta universidad se calculó que el C.I.

promedio es de 106,4 con una desviación estándar de 16,4. ¿El nivel mental de

los ingresantes es superior al término medio?

Variable de estudio: La habilidad mental de los X estudiantes.

µ = rendimiento mental promedio de los ingresantes.

X = rendimiento promedio de la muestra.

Solución:

1) Ho: µ= 101,2

Ha: µ > 101,2

2) Prueba unilateral de acuerdo a Ha.

3) Realizar la prueba de los niveles de significación de 5% y 1%.

4) Se admite que la variable aleatoria de la prueba es la media de los

coeficientes de inteligencia Xi.

5) Como n > 30 podemos usar una distribución normal de probabilidades

para calcular los valores críticos y elaborar el esquema grafico de la

prueba 99%.

Page 7: Estaditica deber varios

6) Calculo estadístico de la prueba.

Z= Xi−µQ

Q=QxQ

√n= 13

√60=1,78

Z=106,4−101,21,78

=2,92

7) Toma de decisiones:

A los niveles de significancia de 0,05 ^ 0,01 observamos que el estadístico Z=

2,92 se ubica en la zona de rechazo, esta significancia que la prueba es muy

significativa luego rechazamos la Ho: µ= 101,2 y no rechazamos que el nivel

mental de los ingresantes es superior al término medio.

CHI-CUADRADO

El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una

comparación global de grupos de frecuencias. Para este problema el método

es diferente, pues el test que se utiliza se denomina Chi-Cuadrado de Pearson,

y con ese test lo que queremos determinar es si la frecuencia observada de un

fenómeno es significativamente igual a la frecuencia teórica prevista, o sí, por

el contrario, estas dos frecuencias acusan una diferencia significativa para, por

ejemplo, un nivel de significación del 5%. Las posibles aplicaciones son

muchas: elección de un cartel turístico publicitario presentado a grupos de

clientes; comparar la rentabilidad de un proyecto hotelero en dos espacios

Page 8: Estaditica deber varios

turísticos; determinar las preferencias o gustos de los turistas por determinados

espacios geográficos, o por determinados servicios hoteleros, etc.

El método que se sigue es el siguiente:

1) Se designan las frecuencias observadas con letras minúsculas y con letras

mayúsculas las frecuencias esperadas o teóricas.

2) Las frecuencias se presentan en cuadros o tablas con un cierto número de

columnas y de filas. Pueden ser tablas de 1 x 2, o de 2 x 2 etc. Aplicaremos el

método con una tabla 1 x 2; y después con una tabla 2 x 2. Supongamos que

se ha comprobado fallas leves (atributos) en dos proyectos turísticos que no

han satisfecho plenamente a la clientela.

Estas fallas han ocurrido en los sitios turísticos A y B. O sea, de un total de 102

fallas, 59 han tenido lugar en el sitio A y 43 fallas en el sitio B. Formulamos la

hipótesis nula que no existe relación entre el número de fallas y el hecho de

que hayan ocurrido en los sitios A y B. Si la hipótesis nula no se rechaza,

quiere decir que cada sitios es independiente del hecho y entonces no existe

razón para suponer que por ejemplo A es menos predispuesto a fallas que B.

Si se rechaza la hipótesis nula, entonces alguno de los dos sitios si está

propenso a mayor número de fallas. Para este análisis se aplica el test Chi-

cuadrado de Pearson. Vamos a observar los datos empíricos (59 y 43= 102) y

los datos esperados o sea una repartición por igual de las fallas entre el

proyecto A y el B (51 y 51 = 102). a = 59 b = 43 A = 51 B = 51 La fórmula que

permite obtener el Chi-cuadrado incluye una corrección igual a O.50 por ser

muestras pequeñas y su valor estimado con la fórmula es 2,206.

Al ir a la tabla del encontramos que para un grado de libertad, el valor del Chi-

cuadrado debe ser igual o mayor que 3,841 para un nivel de significación del

5%. Dado que el valor encontrado en el anterior cálculo es igual a : 2,206,

podemos admitir que la hipótesis nula es correcta, pues no existe razón para

suponer que se produzcan más fallas en el espacio turístico

A que en el espacio B. Si la tabla es de 2 x 2 De nuevo el fin del test es

comparar las frecuencias observadas empíricamente de dos muestras, con las

frecuencias esperadas o teóricas. Dos procedimientos de refrigeración ("x" e

Page 9: Estaditica deber varios

"y") se han ensayado en el Dpto. de Alimentos y Bebidas de un Hotel con el fin

de aumentar la duración de las materias primas perecederas. Los resultados

son según atributos cualitativos los siguientes: Primero veremos las frecuencias

empíricas u observadas: Refrigeración X : fracasos =77; éxitos =63 y el total

140. Y para la Refrigeración Y: fracasos = 54; éxitos = 66 y el total 120. Los

totales de las tres columnas son: 131,129 y 260. En seguida veremos las

frecuencias teóricas o esperadas: Refrigeración X : fracasos = 70,54;

éxitos=69,46 y el total 140. Refrigeración Y : fracasos =60,46; éxitos = 59,54 y

el total 120. Todos los totales de las tres columnas son; 131,129 y 260. Las

frecuencias teóricas fueron estimadas de esta manera:a1 = 131 x 140 / 260 =

70,54; b1 = 129 x 140 / 260 = 69,46; a2 = 131 x 120 / 260 = 60,46; b2 = 129 x

120 / 260 = 59,54.

Cuando las muestras son pequeñas se aplica en la fórmula una corrección

igual a 0,50. Y al aplicar la fórmula del Chi-cuadrado obtenemos el valor de:

2,200. De nuevo se compara el resultado 2,20 con el de la tabla para un grado

de libertad y para el nivel de significación del 5% con un valor de 3,841. La

diferencia entre las dos muestras no es significativa y no se puede llegar a

ninguna conclusión razonada sobre los dos procedimientos de refrigeración.

Distribución Chi-cuadrado de Pearson

Tabla de la función de distribución:

P(

n≤ z) = p

z: valor tabulado

p: probabilidad acumulada

n: grados de libertad

Para ver el cuadro seleccione la opción "Descargar" del menú superior

Page 10: Estaditica deber varios

ABSTRACT

T OF STUDENT

Is a probability distribution that arises the problem of estimating the mean of a

normally distributed population when the sample size is small.

Occurs naturally when performing the Student t test to determine differences

between two sample means and to build the confidence interval for the

difference between the means of two populations is unknown when the

standard deviation of a population and it must be estimated from data of a

sample.

HYPOTHESIS TESTING

Inferential statistics is the process of using information from a sample to

describe the status of a population. However, it is often use information from a

sample to prove a claim or conjecture on the population. The claim or

conjecture refers to a hypothesis. The process that confirms whether the

information from a sample stands or refute the claim is called hypothesis

testing.

Page 11: Estaditica deber varios

The terms of hypothesis testing and test a hypothesis s used interchangeably.

Hypothesis testing begins as a statement or assumption about a population

parameter, as the population mean.

A hypothesis test is to hire two statistical hypotheses. This contrast involves

making decisions about the hypothesis. The decision is to reject or not a

hypothesis in favor of another.

CHI-SQUARE

The so-called Chi-square test is very common the need to make an overall

comparison of groups of frequencies. For this problem the method is different,

the test used is called Chi-square test, and with that we want to test is whether

the observed frequency of a phenomenon is significantly equal to the expected

theoretical frequency, or yes, on the contrary, these two frequencies show a

significant difference, for example, a significance level of 5%. The possible

applications are many: Choosing a tourist poster advertising presented to client

groups, to compare the profitability of a hotel project in two tourist areas,

determine the preferences or tastes of tourists from certain geographical areas

or for certain hotel services, etc.

Ejercicios.

La calificación de un grupo de estudiantes en el examen parcial (x) y en

el examen final (y), fueron las siguientes.

x y x Y X y x y12 15 18 20 15 17 13 148 10 12 14 12 15 10 13

10 12 10 12 11 12 12 1513 14 12 10 12 13 13 149 12 14 16 11 12 12 13

14 15 9 11 10 13 16 1811 16 10 13 14 12 15 17

Page 12: Estaditica deber varios

a) Determinar la ecuación de regresión lineal de Y en X

X y xy X2 Y2 (xi-x) (xi-x)2 (yi-y) (yi-y)2

12 15 180 144 225 0 0 -1 18 10 80 64 100 4 17 4 15

10 12 120 100 144 2 4 2 313 14 182 169 196 -1 1 0 09 12 108 81 144 3 9 2 3

14 15 210 196 225 -2 4 -1 111 16 176 121 256 1 1 -2 518 20 360 324 400 -6 35 -6 3812 14 168 144 196 0 0 0 010 12 120 100 144 2 4 2 312 10 120 144 100 0 0 4 1514 16 224 196 256 -2 4 -2 59 11 99 81 121 3 9 3 8

10 13 130 100 169 2 4 1 115 17 255 225 289 -3 9 -3 1012 15 180 144 225 0 0 -1 111 12 132 121 144 1 1 2 312 13 156 144 169 0 0 1 111 12 132 121 144 1 1 2 310 13 130 100 169 2 4 1 114 12 168 196 144 -2 4 2 313 14 182 169 196 -1 1 0 010 13 130 100 169 2 4 1 112 15 180 144 225 0 0 -1 113 14 182 169 196 -1 1 0 012 13 156 144 169 0 0 1 116 18 288 256 324 -4 15 -4 1715 17 255 225 289 -3 9 -3 10

338 388 4803 4222 5528   142   151

x=∑ xi

n

x=33828

=12

y=∑ yi

n

y=38828

=14

b=n∑ xiyi−∑ xi∑ yi

n∑ X i2−¿¿¿

Page 13: Estaditica deber varios

b=28 (4803 )− (338 )(388)28(4222)−(338)2

b=134484−131144118216−114244

b=0,85

a=Y−b Xa=14−0,85 (12 )=3,80

Y=a+bxy=3,8+0,85 x

El gerente de personal de la empresa P&C quiere estudiar la relación

entre el ausentismo y la edad de sus trabajadores. Tomo una muestra

aleatoria de 10 trabajadores de la empresa y encontró los siguientes

datos.

Edad (año) 25 46 58 37 55 32 4

1

50 23 60

Ausentismo (días por

año)

18 12 8 15 10 13 7 9 16 6

a) Use el método de mínimos cuadrados para hallar la ecuación muestral

que relaciona las dos variables.

Edad (años)

Ausentismo

x Y X Y X2 Y2 (xi-x) (xi-x)2 (yi-y) (yi-y)2

25 18 450 625 324 -17,7 313,29 6,6 43,5646 12 552 2116 144 3,3 10,89 0,6 0,3658 8 464 3364 64 15,3 234,09 -3,4 11,5637 15 555 1369 225 -5,7 32,49 3,6 12,9655 10 550 3025 100 12,3 151,29 -1,4 1,9632 13 416 1024 169 -10,7 114,49 1,6 2,56

Page 14: Estaditica deber varios

41 7 287 1681 49 -1,7 2,89 -4,4 19,3650 9 450 2500 81 7,3 53,29 -2,4 5,7623 16 368 529 256 -19,7 388,09 4,6 21,1660 6 360 3600 36 17,3 299,29 -5,4 29,16

427 114 4452 19833 1448 1600,1 148,4

y=a+b x

b=n∑ xi y i−∑ x∑ y

n∑ x2−¿¿

x=∑ xi

n

x=42710

=42.7

y=∑ yi

n

Page 15: Estaditica deber varios

y=11410

=11.4

b=10 (4452 )−(427 )(114 )10 (19833)−(427)2

=¿

b= 44520−48678198330−182329

=¿

b=−415816001

=−0.26

a= y−bxa=11.4−(−0.26 )42.7=22.502y=22.502−0.26 x=ecuacion lineal .

b) Calcule el coeficiente de determinación. De su comentario sobre el

ajuste de la línea de regresión a los datos de la muestra.

r=n∑ xy−∑ x∑ y

√¿¿¿r=10¿¿

r= 4158

√(16001)(1484)

r= 41584872.93

=0.85

En la gráfica se puede observar que se obtiene una regresión lineal negativa y

los puntos de dispersión no se encuentran tan dispersos a la línea.

Page 16: Estaditica deber varios

En un estudio para determinar la relación entre edad (X) y presión

sanguínea (Y) una muestra aleatoria de 9 mujeres ha dado los

siguientes resultados.

x 54 40 70 35 62 45 55 50 38

y 148 123 155 115 150 126 152 144 114

a) Encuentre la ecuación de regresión de Y en X y estime la presión sanguínea

para una mujer de 75 años.

b) Utilizando t-Student pruebe la hipótesis B=0.9, contra la hipótesis B > 0,9 al

nivel de significación a=0.05

c) Pruebe la hipótesis nula Ho: p=0,9 contra H1: p > 0.9

Número Edad(X) Presión (Y) X2 Y2 X*Y (X-X)2 (Y-Y)2

1 54 148 2916 21904 7992 16,90 136,11

2 40 123 1600 15129 4920 97,79 177,78

3 70 155 4900 24025 10850 404,46 348,44

4 35 115 1225 13225 4025 221,68 455,11

5 62 150 3844 22500 9300 146,68 186,78

6 45 126 2025 15876 5670 23,90 106,78

7 55 152 3025 23104 8360 26,12 245,44

8 50 144 2500 20736 7200 0,01 58,78

9 38 114 1444 12996 4332 141,35 498,78

449 1227 23479 169495 62649 1078,89 2214,00

X=∑ Yn

=49,88

Y=∑ Xn

=136,33

Page 17: Estaditica deber varios

Sxy=∑❑

xy

n−x y

Sxy=626499

−(49,88 ) (136,33 )

Sxy=6961−6800,14=160,86

Sx=❑√∑❑❑ (X1−X ) ²n

Sx=❑√ 1078,899

Sx=10,95

Sy=❑√∑❑

(Y 1−Y )2

n

Sy=❑√ 22149Sy=15,68

S x2=∑❑

x2

n−X 2

Sx ²=234799

−(49,88)2

Sx ²=2608,77−2488.01=120,76

b=SXYSx ²

Page 18: Estaditica deber varios

b=171,696120,76

b=1.42

a=Y−b X

a=136,33− (1.42 ) (49,88 )

a=65,50

Ecuación lineal de las dos variables.

y=a+bx

y=1.42+65,50x

r=n∑

xy−∑❑

x∑❑

y

❑√¿¿¿

r=9¿¿

r= 12918❑√(9710)(19926)

r=0,928

Diagrama de dispersión en el plano cartesiano

Page 19: Estaditica deber varios

0 200 400 600 800 1000 1200 14000

10

20

30

40

50

60

70

80

Series2

PASOS DE UNA PRUEBA DE HIPOTESIS

Primer paso formular la hipótesis nula y la hipótesis alternativa

Hipótesis nula

Ho = β=0

La hipótesis alternativa

Ha= β<0; β>0

Segundo paso determinar si la prueba es unilateral o bilateral

Bilateral

Tercer paso Asumir el nivel se significación de la prueba

99% ± 2.58

Cuarto paso determinar la distribución muestral que se usara en la prueba

n<30

Quinto paso elaborar el esquema de la prueba

Page 20: Estaditica deber varios

-2.58 +2.58

Sexto paso calcular el estadístico de la prueba

z= Pm−poQp

z=0.073−0

0 z=0 .013

Q=❑√ SX2+SY 2

n

Q=❑√ 120,76+2469

Q=1.90

QP=❑√ PQn

QP=❑√ 0 (1.90)9

QP=0

Pm= pn

Pm=0.739

Pm=0.08

Page 21: Estaditica deber varios

En un estudio para determinar la relación entre edad (X) y presión

sanguínea (Y) una muestra aleatoria de 9 mujeres ha dado los

siguientes resultados:

X 54 40 70 35 62 45 55 50 38Y 148 123 155 115 150 126 152 144 114

a) Halle la ecuación de regresión de Y en X y estime la presión sanguínea

para una mujer de 75 años.

b) Utilizando t-Student pruebe la hipótesis β=0.9, contra la hipótesis β>0.9

al nivel de significación α=0,05.

c) Pruebe la hipótesis Ho : ρ=0.9 contra H 1: ρ>0.9

a) Determinar la ecuación lineal de las dos variables.

Desarrollo

X Y X Y X2 Y2 (xi-x) (xi-x)2 (yi-y) (yi-y)2

54 148 7992 2916 21904 4,11 16,90 11,67 136,1140 123 4920 1600 15129 -9,89 97,79 -13,33 177,7870 155 10850 4900 24025 20,11 404,46 18,67 348,4435 115 4025 1225 13225 -14,89 221,68 -21,33 455,1162 150 9300 3844 22500 12,11 146,68 13,67 186,7845 126 5670 2025 15876 -4,89 23,90 -10,33 106,7855 152 8360 3025 23104 5,11 26,12 15,67 245,4450 144 7200 2500 20736 0,11 0,01 7,67 58,7838 114 4332 1444 12996 -11,89 141,35 -22,33 498,78

449 1227 62649 23479 169495 0,00 1078,89 0,00 2214

Primer caso

Yr=Y +r ( sysx ) x−r ( sysx ) x

X=∑ x1n

= 4499

=49,89

Y=∑ y1n

=12279

=136.33

Page 22: Estaditica deber varios

r=n∑ xy−∑ x∑ y

√¿¿¿

r=9 (62649 )−(449)(1227)

√¿¿¿

r= 12918

√9710∗19926= 1291813909,76

=0.93

sx=√∑ ¿¿¿¿

sx=√ 1078,899=10.94→desviacion standar

s x2=¿

sy=√∑ ¿¿¿¿

sy=√ 22149 =15,68→desviacionstandar

s y2=¿

Yr= y+r ( sysx ) x−r ( sysx ) x

Yr=136.33+0.93( 15,6810,94 ) x−0.93 ( 15,6810,94 )49,89

Yr=136,33+1,33x−66,35

Yr=69,98+1,33x

Para una persona de 75 años vamos a encontrar la presión sanguínea.

Yr=69,98+1,33(70)

Yr=169,73

Page 23: Estaditica deber varios

El gerente de ventas de una cadena de tiendas obtuvo información de

los pedidos por internet y del número de ventas realizadas por esa

modalidad. Como parte de su presentación en la próxima reunión de

vendedores al gerente le gustaría dar información específica sobre la

relación entre el número de pedidos y el número de ventas realizadas.

TIENDA 1 2 3 4 5 6 7 8 9 10

NÚMERO

DE

PEDIDOS

50 56 60 68 65 50 79 35 4215

NÚMERO

DE

VENTAS

45 55 50 65 60 40 75 30 3812

a) Use el método de mínimos cuadrados para expresar la relación entre

estas dos variables.

b) Haga un análisis de los coeficientes de regresión.

c) ¿Proporcionan los datos suficiente evidencia para indicar que las

unidades producidas aportan información para producir los gastos

generales?

d) Realice un análisis de la bondad del ajuste de la ecuación de regresión

lineal.

e) ¿Qué puede usted concluir acerca de la correlación poblacional entre

gastos generales y unidades producidas?

Desarrollo

TIENDA NÚMERO DE

NÚMERO DE

XY X2 X-X (X-X)2 Y2 Y-X (Y-X)2

Page 24: Estaditica deber varios

PEDIDOS VENTAS1 50 45 2250 2500 -2 4 2025 -2 42 56 55 3080 3136 4 16 3025 8 643 60 50 3000 3600 8 64 2500 3 94 68 65 4420 4624 16 256 4225 18 3245 65 60 3900 4225 13 169 3600 13 1696 50 40 2000 2500 -2 4 1600 -7 497 79 75 5925 6241 27 729 5625 28 7848 35 30 1050 1225 -17 289 900 -17 2899 42 38 1596 1764 -10 100 1444 -9 81

10 15 12 180 225 -37 1369 144 -35 1225TOTAL 520 470 27401 30040 0 3000 25088 0 2998

X=52010

=52

Y=47010

=47

r=n∑ xy−∑ x∑ y

√¿¿¿

r=10(27401)−(520)(470)

√¿¿¿

r= 274010−244400√(300400−270400)(250880−220900)

r= 29610

√(30000)(29980)

r= 29610

√899400000

r= 29610

√29989,99833r=0,987

SX=√∑ ¿¿¿¿

sx=√ 300010 =17,32→desviacion st andar

s x2=¿

Page 25: Estaditica deber varios

sy=√∑ ¿¿¿¿

sy=√ 299810 =17,31→desviacion standar

s y2=(17,31)=299,64→varianza

b=n∑ xy−∑ x∑ y

n∑ x2−¿¿¿

b=10 (27401 )−(520)(470)10 (30040 )−(520 )

b=274010−244400300400−270400

b=2961030000

b=0,987

a= y−bx

a=47−0,987 (52)

a=¿ -4,324

Ecuación lineal de las dos variables.

y=a+bx

y=−4,324+0,987 x

PASOS DE UNA PRUEBA DE HIPOTESIS

1. Formular la hipótesis nula y la hipótesis alternativa

Hipótesis nula

Ho = β=0

La hipótesis alternativa

Ha= β<0; β>0

2. Determinar si la prueba es unilateral o bilateral

Page 26: Estaditica deber varios

Bilateral

3. Asumir el nivel se significación de la prueba

95% ± 1,96

4. Determinar la distribución muestral que se usara en la prueba

n<30

Como n es menor que 30 utilizaremos la T de estudent

5. Elaborar el esquema de la prueba

-1.96 +1.96

6. Calcular el estadístico de la prueba

z= Pm−poQp

z=0.0987−0

10 z=9,87∗10−3 (0,00987)

Q=√ SX 2+SY 2

n

Q=√ 299,98+299,6410

Q=7,74

QP=√ PQn

QP=√ 0(7,74)10

Page 27: Estaditica deber varios

QP=0

Pm= pn

Pm=0,98710

Pm=0,0987

En este caso la hipótesis nula se acepta. Es decir si existe relación entre el

número de pedidos y las ventas que se realizan en las tiendas.

Con los siguientes datos muestrales

Coeficiente de inteligencia: IQ 135 115 95 100 110 120 125 130 140

Notas de un examen 16 13 12 12 14 14 15 15 18

a) Halle la ecuación de regresión muestral

b) Interprete la pendiente de parcial.

c) Utilizando t-Student pruebe la hipótesis 𝛃 = 0, contra la hipótesis 𝛃>0 al

nivel de significación α=0,05. ¿Se puede aceptar que 𝛃=1?

d) El grado de asociación entre las dos variables.

e) Utilizando t-Student pruebe la hipótesis p=0 contra la hipótesis p>0 al

nivel de significación α= 0,05

Coeficiente de iteligencia IQ (X)

Notas de un exámen (Y)

XY X2 Y 2 X i−X (X ¿¿i−X )2¿

135 16 2160 18225 256 16,11 259,57115 13 1495 13225 169 -3,89 15,12

95 12 1140 9025 144 -23,89 570,68100 12 1200 10000 144 -18,89 356,79110 14 1540 12100 196 -8,89 79,01120 14 1680 14400 196 1,11 1,23125 15 1875 15625 225 6,11 37,35130 15 1950 16900 225 11,11 123,46140 18 2520 19600 324 21,11 445,68

Page 28: Estaditica deber varios

1070 129 15560 129100 1879   1888,89

X=Σ X i

n

X=10709

=118,89

Y=ΣY i

n

Y=1299

=14,33

SXY=ΣXYn

−XY

SXY=155609

−(118,89×14,33)

SXY=25,195

SX=√ Σ(X i−X )2

n

SX=√ 1888,899

SX=14,487

SX2=209,876

b=SXY

SX2

b= 25,195209,876

b=0,12

Page 29: Estaditica deber varios

a=Y−b X

a=14,33−0,12(118,89)

a=0,0632

Y=a+bx

Y=0,0632+0,12x

1) Ho= 0

Ha>0

2) Es unilateral con cola derecha

3) NC= 95%

Nivel de significación α=0,05

Z= 1,65

4) n < 30 9 < 30 t—Student

5)

Z= 1,65

Zona de aceptación

Zona de rechazo

Page 30: Estaditica deber varios

r=n∑ xy−∑ x∑ y

√¿¿¿

r=9 (15560 )−(1070)(129)

√¿¿¿

r=0,9357

X Y XY X2 Y2 X1-X(X1-X

)2 Y1-Y (Y1-Y )2

0 64 0 0 4096 -1,0 1,0 -10,8 117,01 69 69 1 4761 0,0 0,0 -5,8 33,82 94 188 4 8836 1,0 1,0 19,2 368,10 55 0 0 3025 -1,0 1,0 -19,8 392,61 60 60 1 3600 0,0 0,0 -14,8 219,52 92 184 4 8464 1,0 1,0 17,2 295,30 70 0 0 4900 -1,0 1,0 -4,8 23,21 80 80 1 6400 0,0 0,0 5,2 26,92 89 178 4 7921 1,0 1,0 14,2 201,20 84 0 0 7056 -1,0 1,0 9,2 84,41 82 82 1 6724 0,0 0,0 7,2 51,62 99 198 4 9801 1,0 1,0 24,2 584,90 73 0 0 5329 -1,0 1,0 -1,8 3,31 76 76 1 5776 0,0 0,0 1,2 1,42 95 190 4 9025 1,0 1,0 20,2 407,40 77 0 0 5929 -1,0 1,0 2,2 4,81 56 56 1 3136 0,0 0,0 -18,8 354,02 80 160 4 6400 1,0 1,0 5,2 26,90 50 0 0 2500 -1,0 1,0 -24,8 615,81 50 50 1 2500 0,0 0,0 -24,8 615,82 89 178 4 7921 1,0 1,0 14,2 201,20 70 0 0 4900 -1,0 1,0 -4,8 23,21 65 65 1 4225 0,0 0,0 -9,8 96,32 90 180 4 8100 1,0 1,0 15,2 230,60 64 0 0 4096 -1,0 1,0 -10,8 117,01 67 67 1 4489 0,0 0,0 -7,8 61,12 80 160 4 6400 1,0 1,0 5,2 26,9

∑27 ∑2020 ∑2221 ∑45∑15631

0∑0,0 ∑18,0 ∑0,0

∑5184,1

Determine la ecuación de regresión de gastos sobre ingresos

Page 31: Estaditica deber varios

Y=∑ YN

=74,81

X=∑ XN

=1

r=n∑ xy−∑ x∑ y

√¿¿¿

r=27 (2221 )−(27 )(2020)

√ [27 (45 )−(27)2 ] [27 (156310)−(2020)2 ]

r= 54278247,75

=0,66

DESVIACIÓN

Sx=√∑ ( X1−X )2

n

Sx=√ 1827Sx=0,81

Sy=√∑ (Y 1−Y )2

n

Sy=√ 5184,127

Sy=13,86

ECUACIÓN

Y R=Y +r ( SySx ) x−r ( SySx )x

Page 32: Estaditica deber varios

Y R=74,81+0.66 ( 13,860,81 ) x−0.66( 13,860,81 )1 Y R=74,81+11,167 x−11,16

Y R=63,648+11,167 x

Las cantidades de un compuesto químico (Y) que se disuelve en 100

gramos de agua a diferentes temperaturas (X) se registraron en la tabla

que sigue:

X (ºC) Y gramos0

1530456075

101527334650

81223304052

101425324353

91624354254

111826344555

0 0.5 1 1.5 2 2.50

20

40

60

80

100

120

Nivel Socioeconomico

Gast

os e

n ed

ucac

ión

Page 33: Estaditica deber varios

a) Encuentre la ecuación de regresión de Y en X

b) Estime la varianza de la regresión poblacional

c) Determine el coeficiente de regresión estandarizado beta

d) Calcule el error estándar de la pendiente b. Además desarrolle un

intervalo de confianza del 95% para β. ¿Se puede aceptar que β=0.6?

e) Determine un intervalo de confianza del 95% para la cantidad promedio

de producto químico que se disolverá en 100 gramos de agua a 50ºC.

f) Determine un intervalo de predicción del 95% para la cantidad de

producto químico que se disolverá en 100 gramos de agua a 50ºC.

Desarrollo:

X (°C) Y gramos01530456075

101527334650

81223304052

101425324353

91624354254

111826344555

11,81525

32,843,252,8

225 180,6

X (°C)Y

gramos XY X2 Y 2(X i−X )2 (Y i−Y )2

0 11,8 0 0 139,24 1406,25 139,2415 15 225 225 225 225 22530 25 750 900 625 900 62545 32,8 1476 2025 1075,84 2025 1075,8460 43,2 2592 3600 1866,24 3600 1866,2475 52,8 3960 5625 2787,84 5625 2787,84

∑ 225 ∑ 180,6 ∑ 9003 ∑ 12375 ∑ 6719,16 ∑ 13781,25 ∑ 6719,16

x=∑ 225

6=37,5

y=∑ 180,6

6=30,1

Page 34: Estaditica deber varios

r=N (∑ XY )− (∑ X ) (∑Y )

√ [N (∑ X2 )−(∑ X )2 ] [N (∑ Y 2 )−(∑ Y )2 ]

r=6 (9003 )−(225 ) (180,6 )

√ [6 (12375 )−(225 )2 ] [6 (6719,16 )−(180,6 )2 ]

r= 54018−40635

√ [ (74250−50625 ) (40314,96−32616,36 ) ]

r= 13383

√ (23625 ) (7698,6 )

r= 13383

√181879425

r= 1338313486,27

r=0,992

SEGUNDO MÉTODO

y= y+r ( SySx ) x−r ( SySx )

y=30,1+ (0,992 )( 33,4647,93 ) x−(0,992 )( 33,4647,93 )y=30,1+ (0,992 ) (0,70 ) x− (0,992 ) (0,70 )

y=30,80+0,70 x

y=−29,4+0,70 x

Sy=√∑ ( xi−x)2

n=√ 6719,166

=√1119,86=33,46

Sx=√∑ ( yi− y )2

n=√ 13781,256

=√2296,88=47,93

Primer paso formular la hipótesis nula y la hipótesis alternativa

Hipótesis nula

Page 35: Estaditica deber varios

Ho = β=0.6

La hipótesis alternativa

Ha= β<0.6; β>0.6

Segundo paso determinar si la prueba es unilateral o bilateral

Bilateral

Tercer paso Asumir el nivel se significación de la prueba

95% ± 1.96

Cuarto paso determinar la distribución muestral que se usará en la prueba

n>30

Quinto paso elaborar el esquema de la prueba

-1.96 +1.96

CONCLUSIONES

La Estadística Inferencial nos ayudan a una correcta forma de emplear el mecanismo en cuanto a encontrar valores de las variables.

Page 36: Estaditica deber varios

Los ejercicios vinculados al comercio exterior ayudan a una mejor comprensión.

El realizar ejercicios de reforzamiento ayudan a un fácil manejo de la Estadística Inferencial.

RECOMENDACIONES

Auto educarnos realizando ejercicios que nos ayuden a nuestro desarrollo

Investigar término desconocidos acerca del tema Proponer un intercambio de ideas con los compañeros para aclarar

dudas Reforzar nuestros conocimientos mediante nuestra investigación.

ANEXOS

Un estudio en el departamento de investigación de logística acerca de la

aceptabilidad de la creación de la empresa de transporte pesado se ha

aplicado una encuesta a las diferentes entidades de transporte,

exportadores, importadores de la localidad, obteniéndose los resultados

que presenta la siguiente tabla.

CREAR EMPRESA DE TRANSPORTE PESADO

Grado de perjuicio

Transportistas

Empresas de transporte

Exportadores

Importadores

TOTAL

Aceptable 220 230 75 40 565No

aceptable150 250 50 30 480

TOTAL 370 480 125 70 1045

El nivel de significancia es de α=0.10 determinar las variables de la

aceptabilidad de la creación de la empresa de transporte pesado y el lugar de

la creación de la empresa.

1). H 0 : la aceptabilidad y el lugar de la creación de la empresa de transporte

pesado.

H 1: Existe aceptabilidad en la localidad.

Page 37: Estaditica deber varios

2). La prueba es unilateral y la cola es derecha.

3). Asumimos el nivel de significancia de α=0.10

4). Utilizaremos la distribución muestral de Chi-Cuadrado porque las dos

variables son cualitativas.

5). Esquema de la prueba

gl=(c−1 ) (F−1 )

gl=(4−1 ) (2−1 )=3

gl=3

α=0.10

x2=(n−1)S2

σ2

x2(3)=(6−1)1052

1452

x2(3)=2,62

6). Calculo del estadístico de la prueba

x2=∑ ij(Oij−Eij )

2

Eij

CREAR EMPRESA DE TRANSPORTE PESADO

Grado de perjuicio

Transportistas

Empresas de transporte

Exportadores

Importadores

TOTAL

Aceptable

220

230 75 40 565

No aceptable

150

250 50 30 480

TOTAL370

480 125 70 1045

200,0

220,4 57,42

32,15

37,8567,5259,5

169,9

2,62

Page 38: Estaditica deber varios

Una empresa bananera ECUABANANO realiza exportaciones hacia

América Latina, sin embargo está considerando ampliar el destino de

sus exportaciones hacia Norte América, debido a que las exportaciones

han crecido notablemente en los dos anteriores años se han presentado

los siguientes datos:

Sur América Centro américa

México Total

2010 5000 7000 8500 205002011 6500 8000 9500 24000Total 11500 15000 18000 44500

(valor en cajas)

El nivel de significancia es de α=0.10 determinar las variables de la

aceptabilidad de la ampliación de las exportaciones de ECUABANANO hacia

norte américa.

Desarrollo:

1). H 0 : les aceptable la ampliación de las exportaciones de ECUABANANO

Ha : No Existe aceptabilidad de la ampliación de las exportaciones de

ECUABANANO

2). La prueba es unilateral y la cola es derecha.

3). Asumimos el nivel de significancia de α=0.10

4). Utilizaremos la distribución muestral de Chi-Cuadrado porque las dos

variables son cualitativas.

5). Esquema de la prueba

gl=(c−1 ) (F−1 )

gl=(4−1 ) (2−1 )=3

gl=3

α=0.10

Page 39: Estaditica deber varios

¿(6−1)1052

1452

x2(3)=6,251

6). Calculo del estadístico de la prueba

x2=∑ ij(Oij−Eij )

2

Eij

7. Se acepta la Ha debido a que está en zona de rechazo, es decir que esta

bananera no debería ampliar las exportaciones en el 2012 y 2013, debe

asegurar el crecimiento d exportaciones para poder tomar esta decisión.

En una empresa exportadora en un nuevo proceso artesanal de

fabricación de cierto artículo que está implantado, se ha considerado

que era interesante ir anotando periódicamente el tiempo medio (medido

en minutos) que se utiliza para realizar una pieza (variable Y) y el

número de días desde que empezó dicho proceso de fabricación

(variable X). Con ello, se pretende analizar cómo los operarios van

adaptándose al nuevo proceso, mejorando paulatinamente su ritmo de

producción conforme van adquiriendo más experiencia en él. A partir de

las cifras recogidas, que aparecen en la tabla adjunta, se decide ajustar

una función exponencial que explique el tiempo de fabricación en

función del número de días que se lleva trabajando con ese método.

X Y10 35

6,251

Grado de perjuicio

Importadores

Exportadores

Transportistas TOTAL

Aceptable

5000

8500 20500

No aceptable

6500

9500 24000

TOTAL 11500 15000 18000 44500

8292,13

9707,86

5297,75

6202,25

6910,11

8089,89

Page 40: Estaditica deber varios

20 2830 2340 2050 1860 1570 13

Tiempo en min. (X)

N° de días (Y)

XY X2

10 35 350 100 -30 900

20 28 560 400 -20 40030 23 690 900 -10 10040 20 800 1.600 0 050 18 900 2.500 10 10060 15 900 3.600 20 40070 13 910 4.900 30 900

∑ X=¿¿ 280

∑Y=¿¿152

∑ XY=¿¿5.110

∑ X2=¿¿14.000

0 ∑ (Xi−X )2=¿¿2.800

a) Determinar la ecuación lineal de las dos variables

X=∑ Xi

n

X=2807

X=40

Y=∑Yi

n

Y=1527

Y=21,71

S∗Y=∑ XY

n−X Y

Page 41: Estaditica deber varios

S∗Y=5.1107

−(40)(21,71)

S∗Y=730−868,4

S∗Y=−138,4

Sx=√∑ (Xi−X )2

n

Sx=√ 2.8007Sx=20 S x2=400

b=S∗Y

Sx2

b=−138,4400

b=−0,35

a=Y−b X

a=40−(−0,35∗21,71)

a=47,59

Ecuación

Y=a+bx

Y=47,59−0,35x

b) Trace el diagrama de dispersión en el plano cartesiano

Page 42: Estaditica deber varios

0 10 20 30 40 50 60 70 800

5

10

15

20

25

30

35

40

Tiempo en minutos (X)

N° d

e dí

as (Y

)

c) ¿Qué tiempo se predeciría para la fabricación del artículo cuando

se lleven 100 días?

Y=47,59−0,35x

100=47,59−0,35 x

100−47,59−0,35

=−x

x=149,74minutos

d) ¿Qué tiempo transcurriría hasta que el tiempo de fabricación que se

prediga sea de 10 minutos?

Y=47,59−0,35x

Y=47,59−0,35 (10 )

Y=44,09días

En la comercialización de manzanas, una empresa exportadora envía

semanalmente lotes de 50 cajas al exterior, cada caja tiene un peso

aproximado de 20 kilos. Las cajas son previamente almacenadas. Para

el control de calidad se

examinan al azar, si en alguna caja encuentran por lo menos una

manzana malograda, esta es calificada mala. Para que pase el control

Page 43: Estaditica deber varios

mediante la inspección de la muestra no debe haber caja malograda, si

solo ex is te una ca ja es ta será cambiada , s i hay más de 1

en las 5 inspeccionadas, inspeccionaran las cincuenta cajas. Según las

estadísticas pasadas de un total de 40 envíos, registro lo siguiente: Se

puede afirmar que la variable número de cajas malogradas en la

muestra de 5 sigue una distribución Binomial?.

manzanas rojas verdes ambosGrandes 3 5 5 13Medianas 5 4 8 17pequeñas 7 9 6 22

total 15 18 19 52

1)

H0: La variable número de cajas sigue una distribución Binomial.

Ha: No siguen una Binomial.

2) La prueba es unilateral y de una cola derecha

3) Nivel de significación 0.10

4) Utilización del chi cuadrado

5) Esquema de la prueba

Gl = (c-1) (f-1)

= (3-1) (3-1)

= 4

α = 0.10

En la tabla de chi cuadrada obtenemos

X2 (4) = 7.779

6) Calculo del estadístico de la prueba

Page 44: Estaditica deber varios

x2=∑ij

(Oij−E ij)2

E ij

Calculo de las pruebas esperadas.

E11=(15∗13)52

=3.75

E12=(18∗13 )52

=4.5

E13=(19∗13 )52

=4.75

E21=(15∗17 )52

=4.90

E22=(18∗17 )52

=5.88

E23=(19∗17 )52

=6.21

E31=(15∗22 )52

=6.35

E32=(18∗22 )52

=7.62

E33=(19∗22 )52

=8.04

manzanas Rojas verdes ambosGrandes 3.75 4.5 4.75

133 5 5Medianas 4.90 5.88 6.21

175 4 8pequeñas 6.35 7.62 8.04

227 9 6total

15 18 19 52

Page 45: Estaditica deber varios

X2=(3−3.75)2

3.75+

(5−4.5)2

4.5+(5−4.75)2

4.75+(5−4.90)2

4.90+

(4−5.88)2

5.88+(8−6.21)2

6.21+(7−6.35)2

6.35+(9−7.62)2

7.62+(6−8.04 )2

8.04

x2= 0.15+ 0.06+ 0.01+ 0.002+0.60+0.52+ 0.07+ 0.25+ 0.52

x2=2.182

7)

ZA ZR

2.182 7.779

ZA= aceptamos la hipótesis nula porque La variable número de cajas

sigue una distribución Binomial.

En un estudio realizado en Tulcán acerca si es factible la creación de la

Zona Franca en la ciudad, para la cual se aplicó una encuesta a las

personas que se dedican al comercio exterior según su actividad,

obteniéndose los resultados que se presentan a continuación:

Actividad de Comercio ExteriorFactibilidad Importadores Exportadores Agentes de

AduanaTotal

Si 18 20 38 76No 12 8 14 34

Total 30 28 52 110

Al nivel de significación α= 0.05, determinar que las variables factibilidad de

creación de Zona Franca y actividad de comercio exterior son independientes.

Page 46: Estaditica deber varios

a)

Ho= factibilidad de creación de Zona Franca y la actividad de comercio exterior

son independientes;

H1=existe dependencia entre las dos variables.

b) La prueba es unilateral y de cola derecha.

c) Asumimos el nivel de significación de α= 0.05

d) Utilizaremos la distribución muestral de Chi-cuadrado porque las dos

variables son cualitativas

e)

gl= (C-1)(F-1)

gl= (3-1)(2-1) = 2

α= 0.05

x2(2)=5.991

f)

Actividad de Comercio ExteriorFactibilidad Importadores Exportadores Agentes de

AduanaTotal

Si E11 E12 E13 76No E21 E22 E23 34

Total 30 28 52 110

E11=30×76110

=20,73

E12=28×76110

=19,35

E13=52×76110

=35,93

E21=30×34110

=9,27

Page 47: Estaditica deber varios

E22=28×34110

=8,65

E23=52×34110

=16,07

Ei 20,73 19,35 35,93Oi 18 20 38

9,27 8,65 16,0712 8 14

x2=∑ (Ci−Ei )2

Ei

x2=(18−20,73)2

20,73+(20−19,35)2

19,35+(38−35,93)2

35,93+(12−9,27 )2

9,27+(8−8,65)2

8,65+(14−16,07)2

16,07

x=1,62

g) Vemos que el valor se encuentra en la zona de aceptación por lo tanto

aceptamos la Ho.

Un grupo de estudiantes quiere determinar si la creación de una

empresa de alquiler de contenedores para el trasporte de mercancías

entre Colombia y Ecuador, se obtiene los siguientes datos.

EMPRESA DE ALQUILER DE CONTENEDORES

Grado de

perjuicio

Transportistas

Empresas de transporte

Exportadores

Importadores

TOTAL

Están de

acuerdo

392 222 331 123 1068

No Están

de acuerdo

122 324 122 323 891

TOTAL 514 546 453 446 1959

Page 48: Estaditica deber varios

El nivel de significancia es de α=0.05 determinar las variables de la

aceptabilidad de la creación de la empresa.

1). H 0 : la aceptabilidad de la creación de la empresas.

H 1: Existe aceptabilidad.

2). La prueba es unilateral y la cola es derecha.

3) Asumimos el nivel de significancia de α=0.05

4) Utilizaremos la distribución maestral de Ji-Cuadrado porque las dos variables

son cualitativas.

5) Esquema de la prueba

gl=(c−1 ) (F−1 )

gl=(4−1 ) (2−1 )=3

gl=3

6) Calculo del estadístico de la prueba

x2=∑ ij(Oij−Eij )

2

Eij

EMPRESA DE DE ALQUILER DE CONTENEDORESGrado de perjuicio Transportistas

Empresas de transporte

Exportadores Importadores TOTAL

Están de acuerdo

392

222

331 123

1068

No Están de acuerdo

122 324

122

323

891

TOTAL 514 546 453 446 1959

297,66280.22 246.96

206,03

243,14

233,77 248,33 202,85

Page 49: Estaditica deber varios

x2=∑ (o−E)2

E

x2=6,62

El concesionario Imbauto realiza una importación consistente en

vehículos marca Toyota RAN, dicha empresa encargo un estudio para

determinar la relación entre los gastos de publicidad semanal por

televisión y la venta de los vehículos. En el estudio se obtuvieron los

siguientes resultados.

Semanas Gasto publicidad Ventas

123456789

200150300290350270400350400

29500147505900073750885001327504425044250177000

Semana Volumen Valorx Y xy

1 200 29500 5900000 40000 870250000 -101,1 10223,23 -44250 1958062500,002 150 14750 2212500 22500 217562500 -151,1 22834,23 -59000 3481000000,003 300 59000 17700000 90000 3481000000 -1,1 1,23 -14750 217562500,004 290 73750 21387500 84100 5439062500 -11,1 123,43 0 0,005 350 88500 30975000 122500 7832250000 48,9 2390,23 14750 217562500,006 270 132750 35842500 72900 17622562500 -31,1 967,83 59000 3481000000,007 400 44250 17700000 160000 1958062500 98,9 9779,23 -29500 870250000,008 350 44250 15487500 122500 1958062500 48,9 2390,23 -29500 870250000,009 400 177000 70800000 160000 31329000000 98,9 9779,23 103250 10660562500,00

2710 663750 218005000 874500 70707812500 58488,89 21756250000,00

ሺ݅݅݅݅݅݅݅݅݅݅݅݅݅ݔ ݅ െݔ�ሻଶ ݅ െݕ�ത ሺ݅ െݕ�ሻଶ

x⃑ = ∑xin

= 27109

= 301,11

6,62 7,815

Page 50: Estaditica deber varios

y⃑ = ∑ yin

= 6637509

= 73750

Prime Método

yr= y⃑+r ( sysx )x−r ( sysx

) x⃑

yr=73750+0,51( 49166,6789,61 ) x−0,51( 49166,6789,61 )301,11yr=73750+0,51 (548,67 ) X−0,51 (548,67 )301,11

yr=73750+¿279,82x – 84257,11

yr=¿-10507,11 + 279,82 x

r= n∑ xy−¿¿¿

r= 9 (218005000 )−(2710 )(663750)√¿¿¿

r= 163.282.500

√ [(7870500)−(7344100) ] [(6,3637)−(4,4056)]

r= 163282500

√ [526400 ] [0,0000000000195 ]

r= 163282500321048921,5

r= 0,51

sx=√∑¿¿¿

sx=√ 58488,899

Sx= 80,61

s x2=6498,77

sy=√∑¿¿¿

sy=√ 217562500009

Sy= 49166,67

Page 51: Estaditica deber varios

a) Determinar la ecuación lineal de las 2 variables

yr=¿-10507,11 + 279,82 x

b) Trace un diagrama de dispersión en el plano cartesiano.

100 150 200 250 300 350 400 4500

20000400006000080000

100000120000140000160000180000200000

YLinear (Y)

Axis Title

Axis Title

c) Estime el gasto que corresponde a una venta semanal de 28750$

yr=¿-10507,11 + 279,82 x

y=−10507,11+279,82(28750)

y=−10507,11+8044825

y=8.034 .317,89

d) Si la venta es de $26027,72 que gasto puede realizar dicho obrero

en la semana

yr=¿-10507,11 + 279,82 x

yr=¿-10507,11 + 279,82 (26027,72)

y=−10507,11+¿7283076,61

y=7.272 .569,50

e) Si el gasto es de $450 cuál es su venta.

yr=¿-10507,11 + 279,82 x

Page 52: Estaditica deber varios

450=−10507,11+279,82x

450+10507,11279,82

= x

X= 39,16

Si la vida media de operación de una pila de linterna es de 24 horas y

está distribuida nor malmente con una desviación de 3 horas. ¿Cuál es

la probabilidad de que una muestra aleatoria de 100 pilas tenga una

media que se desvíe por más de 30 minutos del Promedio?

SOL UCIÓN

Z= X−u∅√n

Omed= ∅√n

P (X>24.5horas )=4.85

µ=30horas deduracion

σ = 3 horas n= 100 pilas

Z=1.6

P=0.5−0.4515=4.85%

Establecer la relación entre el número de pólizas de seguros contratados

durante la semana anterior “X” y el número de vehículos con seguro que

Page 53: Estaditica deber varios

salieron con mercancía de exportación desde el Ecuador “Y”. Calcular la

ecuación.

X Y XY X2 X−X ¿ Y2 Y−Y ¿

10 12 120 100 -6,14

37,73 144,00 -7,14

51,02

12 13 156 144 -4,14

17,16 169,00 -6,14

37,73

15 15 225 225 -1,14

1,31 225,00 -4,14

17,16

16 19 304 256 -0,14

0,02 361,00 -0,14

0,02

18 20 360 324 1,86

3,45 400,00 0,86

0,73

20 25 500 400 3,86

14,88 625,00 5,86

34,31

22 30 660 484 5,86

34,31 900,00 10,86

117,88

∑ X=¿¿113

∑Y=¿¿134

∑ XY=¿¿2325

∑ X2=¿¿1933

∑ ¿¿108,86 ∑Y 2=¿¿2824,00

∑ ¿¿258,86

X=∑ Xi

n

X=1137

X=16,14

Y=∑Yi

n

Y=1347

Y=19,14

sx=√∑ ¿¿¿¿

sx=√ 108,867sx=3,94

s2 x=15,55

Page 54: Estaditica deber varios

sy=√∑ ¿¿¿¿

sy=√ 258,867

sy=6,08

s2 y=36,98

r=N ¿¿

r=7 (2325 )−(113 )(134)

√ [7 (1933 )−(12769)] [7 (2824 )−(17956)]

r=16275−15142√(762)(1812)

r=0,964213766

Primera forma de cálculo

Y R=Y +r ( sysx )X−r ( sysx )X

Y R=19,14+0,964213766( 6,083,94 )X−0,964213766 ( 6,083,94 )(16,14)Y R=19,14+1,49 X−24,01

Y R=−4,87+1,49 X