ejercicios de estadistica

UNIVERSIDAD POLITÉCNICA ESTATAL DEL CARCHI

ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN COMERCIAL

INTERNACIONAL

TEMA: Aplicación de Ejercicios de estadística

Msc. Jorge pozo

Integrante

Ayala Maricela

NIVEL: 6TO “A”

Periodo – 2012

TEMA: Aplicación de Ejercicios de estadística

Problema:

La dificultad del estudiante para calcular los Ejercicios de estadística

Objetivos:

Objetivo General.

Identificar como calcular los Ejercicios de estadística

Objetivos Específicos.

Recopilar conceptos sobre los Ejercicios de estadística

Analizar los conceptos sobre los Ejercicios de estadística

Poner en práctica los conocimientos sobre los Ejercicios de estadística

Justificación

Este trabajo se realiza para que el estudiante sea práctico en el cálculo de la

correlación y relación lineal y domine bien el tema y se involucre en

investigaciones cada vez más profundas analizando algunas características

generales como es la de calcular el coeficiente de correlación r de Pearson de

acuerdo a los datos planteados, al observar los resultados se puede sacar

importantes análisis con el fin de determinar si es aceptable o no el tipo de

caso aplicado,

Desarrollo

CORRELACIÓN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOS EN

CLASES

El presente tema nos conduce a calcular el coeficiente de correlación r, que

nos proporciona información de la fuerza de la relación que existe entre dos

conjuntos de datos que se encuentran agrupados, cada uno de ellos formando

por separados una distribución de frecuencias, mejor dicho teniendo por

separado sus intervalos de clase con sus respectivas frecuencias.

Para realizar una exposición del tema en forma más entendible, presentamos el

ejemplo del Cuadro Nº 4.1.7.

Ejemplo:

Calcular el grado de correlación entre las puntaciones obtenidas en inventario

de hábitos de estudio y los puntajes obtenidos en un examen de Matemática,

aplicados a un total de 134 alumnos de un colegio de la localidad.

CUADRO Nº 4.1.7

X Hábitos de estudio

Y Matemática

20→30 30→40 40→50 50→60 Total

f y

70→80 3 2 2 7

60→70 1 0 4 5 10

50→60 2 6 16 3 27

40→50 4 14 19 10 47

30→40 7 15 6 0 28

20→30 8 2 0 1 11

10→20 1 1 2 4

Total f x 23 40 48 23 134

Podemos notar que el problema no es tan simple, como el caso anterior, dado

que ahora los datos se han clasificado en una tabla de doble entrada Nº 4.1.7.

Este cuadro muestra, en la primera columna del lado izquierdo los intervalos de

clase de la variable Y, los que cubren todos los posibles datos acerca de las

puntuaciones alcanzadas por los estudiantes en la prueba de Matemática.

Nótese que los intervalos crecen de abajo hacia arriba. En la fila superior se

presentan los intervalos de clase todos los 134 posibles datos acerca de los

puntajes obtenidos por los estudiantes en la variable hábitos de estudios

representados por la letra X.

Dentro del Cuadro Nº 4.1.7 en los casilleros interiores o celdas de la tabla, se

encuentran las frecuencias de celdas f xy que corresponden a puntajes que

pertenecen tanto a un intervalo de la variable Y como a un intervalo de la

variable X.

En la fila interior del Cuadro se presentan los totales de los puntajes de la

variable X, hábitos de estudio. Esos totales se llaman frecuencias marginales

de la variable X y se representan por f x.

En la última columna de la derecha se encuentran los totales de los puntajes de

la variable rendimiento en matemática. Estos totales se denominan frecuencias

marginales de la variable Y.

Cuando los datos se presentan tal como el presente caso, formando tablas de

doble entrada, es conveniente usar el método clave que expondremos a

continuación porque con este procedimiento se evita manejar grandes

números, como sería el caso si se emplearán las fórmulas para trabajar con la

calculadora de bolsillo.

La fórmula que utilizaremos es la siguiente:

r=n∑ f xyux uy−¿ (∑ f xux )(∑ f y uy)

√ [n∑ f xu2x−(∑ f xux)

2 ] [n f yu2y−(∑ f y uy )2 ]

¿

Para obtener los datos que deben aplicarse en la fórmula Nº 4.1.2., vamos a

construir el cuadro auxiliar Nº 4.1.8, al mismo tiempo que se explica el

significado de los símbolos de esa fórmula.

Lo primero que hacemos es reemplazar los intervalos horizontales y verticales

por sus respectivas marcas de clase; a continuación adicionaremos al Cuadro

Nº 4.1.7, cinco columnas por el lado derecho; cuyos encabezamientos son: f y

para la primera uy para la segunda, f yu y para la tercera, f yu2y para la cuarta y

f xy uxuy para la quinta columna.

Por la parte inferior del cuadro le adicionamos cuatro filas que se nombran: f x

para la primera ux para la segunda fila que está debajo de la anterior, f x ux para

la tercera fila y por último, f x u2x para la cuarta fila que está debajo de todas; de

esta manera se va elaborando el Cuadro Auxiliar Nº 4.1.8.

1) Para determinar las frecuencias marginales que se deben colocar en la

columna f ypara la primera uy para la segunda, f yu y para la tercera, f y

sumamos las frecuencias de las celdas que están en la misma fila de la

marca de clase 75, obtenemos: 3+2+2=7, número que se escribe en el

primer casillero o celda de la columna f ypara la primera uy para la segunda,

f yu y para la tercera,f y . En la fila de la marca de clase 65, sumamos

1+4+5=10, número que se escribe debajo del 7.

Para la fila de la marca de clase 55, tenemos: 2+6+16+3=27.

Para la fila de la marca de clase 45, se tiene: 4+14+19+10=47.

En igual forma: 7+15+6=28.

Lo mismo: 8+2+1=11

Y en la última fila: 1+1+2=4

A continuación sumamos estas frecuencias marginales de la variable Y:

7+10+27+47+28+11+4=134 es el total general.

2) Ahora a determinar las frecuencias marginales de la variable X: En columna

encabezada con la marca de clase 25 sumemos verticalmente las

frecuencias: 1+2+4+7+8+1=23.

En la columna encabezada con 35, tenemos: 3+6+14+15+2=40

En la siguiente: 2+4+16+19+6+1=48

En la última: 2+5+3+10+1+2=23

3) Centremos nuestra atención en la columna encabezada f ypara la primera

uy para la segunda, f yu y para la tercera,uy este signo significa desviación

unitaria, y procedemos en la misma forma que en las Tablas Nº 2.1.2 y Nº

2.1.3 (b). recuerden que las desviaciones unitarias positivas: +1, +2, y +3

corresponden a los intervalos mayores y por el contrario las desviaciones

unitarias negativas: -1, -2 y -3 corresponden a los intervalos menores. Como

origen de trabajo se tomó la marca de clase 45 y por lo tanto su desviación

unitaria es cero.

4) Luego vamos a determinar las desviaciones unitarias horizontales de la

variable X. el origen de trabajo es la marca de clase 45 que se halla en la

fila superior del cuadro, por esa razón, escribimos cero debajo de la

frecuencia marginal 48. Las desviaciones unitarias negativas: -1 y -2 se

escriben a la izquierda cero, porque se corresponden con los intervalos de

clase que tienen menores marcas de clase y que están a la izquierda de 45.

La desviación unitaria positiva, se corresponde con el intervalo de mayor

marca de clase, 55 (en parte superior del Cuadro Nº 4.1.8.)

5) A continuación vamos a determinar los valores que deben colocarse en la

columna encabezada f yu y; este símbolo indica que se debe multiplicar

cada valor de f y por su correspondiente valor de uy, así: 7(+3)=21;

10(+2)=20; 27(+1)=27; 47(0)=0; 28(-1)=-28; 11(-2)=-22 y 4(-3)=-12.

Sumando algebraicamente, tenemos: 21+20+27=68 los positivos: y (-

28)+ (-22)+ (-12)=-62 los negativos.

Por último: 68-62=6 total, que se coloca en la parte inferior de la columna

Para obtener los valores de la cuarta columna encabezada f yu2y debemos

tener en cuenta que (uy ¿ ( f yu y )=f yu2y, por lo tanto basta multiplicar cada valor

de la segunda columna por su correspondiente valor de la tercera columna así

se obtiene el respectivo valor de la cuarta columna. En efecto:

(+3)(21)=63; (+2)(20)=40; (+1)(27)=27; 0*0=0; (-1)(-28)=28; (-2)(-22)=44 y (-3)(-

12)=36

La suma: 63+40+27+28+44+36=238

Ahora nos fijamos horizontalmente en la tercera fila. Tenemos que ( f x ¿(ux)=

f x ux por consiguiente basta multiplicar verticalmente un valor de la primera fila

por su correspondiente valor de la segunda dila para obtener el respectivo valor

de la tercera fila.

(23)(-2)=-46; (40)(-1)=-40; (48)(0)=0 y (23)(+1)=23

Sumando horizontalmente:

(-46)+ (-40)+ (23)=-86+23=-63

Vamos por la cuarta fila; vemos que (ux ) ( f xux )=f x u2x. Luego basta multiplicar

cada elemento de la segunda fila por su correspondiente elemento de la tercera

fila para obtener el respectivo elemento de la cuarta fila así:

(-2)(46)=92; (-1) (-40)=40; 0*0=0 y (+1) (23)=23

Para obtener los valores de la quinta columna ∑ f xyuxu y observamos que hay

tres factores; el 1º es la frecuencia f xy de la celda o casillero que se está

considerando, el segundo factor es la desviación unitaria ux, el tercer factor es

la desviación unitaria uy. Por tanto el procedimiento será el siguiente: Tomemos

el número 3 que es la frecuencia de la celda determinada por el cruce de los

intervalos que tienen la marcha de clase 75 horizontalmente y 35

verticalmente.

Bajemos la vista del número 3 hacia donde se halla el respectivo valor (-1) de

la desviación unitaria ux (ver la línea punteada).

Para indicar el tercer factor corremos la vista del número 3 hacia su derecha

hasta llegar a la columna de las desviaciones unitarias uy y ubicamos el número

+3 (ver la línea punteada) formemos el producto de estos tres números: (3) (-1)

(+3)=-9. Este número -9 encerrado en un semicírculo lo escribimos en la celda

elegida.

En la misma fila tomamos la celda siguiente: (2) (0) (+3)=0

Continuando hacia la derecha: (2) (+1) (+3)=6

CUADRO AUXILIAR Nº 4.1.8

CUADRO CORREGIDO DEL CUADRO AUXILIAR Nº 4.1.8

La fórmula del paso (9) lleva el signo para indicar que se deben sumar

horizontalmente los números que están encerrados en los semicírculos de esa

primera fila elegida, así: -9+0+6=-3. Este número se escribe en la quinta

columna.

Trabajemos con la siguiente fila: (1) (-2) (+2)=-4 se encierra en un semicírculo.

(0)(-1)(+2)=0

(4)(0)8+2)=0

(5)(+1)(+2)=10

Sumando 0+0+10=10

Ahora con la tercera fila:

(2)(-2)(+1)=-4

(6)(-1)(+1)=-6

(16)(0)(+1)=0

(3)(+1)(+1)=3

Sumando: (-4)+(-6)+0+3=-7

Cuarta fila:

(7)(-2)(-1)=14

(15)(-1)(-1)=15

(6)(0)(-1)=0

(0)(+1)(-1)=0

La suma es: 14+15=29

(8)(-2)(-2)=32

(2)(-1)(-2)=4

(0)(0)(-2)=0

(1)(+1)(-2)=-2

La suma es: 32+4-2=34

Séptima fila:

(1)(-2)(-3)=6

(1)(0)(-3)=-6

(2)(1)(-3)=-6

Sumando: 6+0-6=0

Sumando los valores de la columna quinta.

-3+6-7+0+29+34+0=69-10=59

Reuniendo los resultados anteriores, se tienen los datos para aplicar en fórmula

Nº 4.1.2.

n=134

∑ f xyuxu y=59

∑ f xux=−63

∑ f y uy=6

∑ f xu2x=155

∑ f y u2y=238

r=(134) (59 )−(−63)(6)

√ [ (134 )(155)−(−63)2 ] [(134)(238 )−(6)2 ]

r= 7906+378√(20770−3969)(31892−36)

r= 8284

√535212656

r= 828423134.66

r=0.358

RELACIONES

La correlación se ocupa de establecer la magnitud y la dirección de las

relaciones. Antes de profundizar en estos aspectos particulares de las

relaciones, analizaremos algunas características generales de éstas, con las

cuales podemos comprender mejor el material específico acerca de la

correlación.

RELACIONES LINEALES

Para iniciar nuestro análisis de las relaciones, veamos una relación entre dos

variables. La siguiente tabla muestra el salario mensual que percibieron cinco

agentes ventas y el valor en dólares de la mercancía vendida por cada uno de

ellos en ese mes.

AGENTE VARIABLE X MERCANCÍA

VENDIDA ($)

Y VARIABLE

SALARIO ($)

1

2

3

4

5

0

1000

2000

3000

4000

500

900

1300

1700

2100

Podemos analizar mejor la relación entre estas variables si trazamos una

gráfica utilizando los valores X y Y, para cada agente de ventas, como los

puntos de dicha gráfica. Él es una gráfica de dispersión o dispersigrama.

Una gráfica de dispersión o dispersigrama es una gráfica de parejas de

valores X y Y.

La gráfica de dispersión para los datos de los agentes de ventas aparece en

la figura 6.1. En relación con esta figura, vemos que todos los puntos caen

sobre una línea recta. Cuando una línea recta describe la relación entre dos

variables, se dice que esta relación lineal.

Una relación lineal entre dos variables es aquella que puede representarse

con la mejor exactitud mediante una

línea recta.

Observe que no todas las relaciones son

lineales; algunas son curvilíneas. En

este caso, al trazar una gráfica de dispersión para las variables X y Y, una

línea curva ajusta mejor a los datos que una línea recta.

CÁLCULO DE LA (r) DE PEARSON

La ecuación para calcular la r de Pearson mediante datos:

r=∑ z x z yN−1

Donde∑ z x z yes la suma de los productos de cada pareja de puntajes z.

Para utilizar esta ecuación, primero hay que convertir cada dato en bruto en su

valor transformado. Esto puede tardar mucho tiempo y crear errores de

redondeo. Con algún álgebra, esta ecuación se puede transformar en una

ecuación de cálculo que utilice datos en bruto:

ECUACIÓN PARA EL CÁLCULO DE LA (r) DE PEARSON

r=∑ XY−¿¿¿

Donde: ∑ XY es la suma de los productos de cada pareja X y Y, ∑ XY

también se llama la suma de productos cruzados.

La tabla 6.4 contiene algunos de los datos hipotéticos reunidos a partir de cinco

sujetos.

Datos hipotéticos para el cálculo de la r de Pearson

TABLA 6.4

SUBJETIVO X Y X2 Y 2 XY

A 1 2 1 4 2

B 3 5 9 25 15

C 4 3 16 9 12

D 6 7 36 49 42

E 7 5 49 25 35

TOTAL 21 22 111 112 106

r=∑ XY−¿¿¿

r=106−

21(22)5

√ [111−(21)2

5 ] [112−(22)2

5 ]

r= 13.618.616

r=0.731

r=0.73

Utilicemos estos datos para calcular la r de Pearson:

r=∑ XY−¿¿¿

∑ XYes la suma de los productos cruzados; se determina multiplicando los

datos X y Y para cada sujeto y luego sumando los productos resultantes. El

cálculo de ∑ XY y de los otros términos aparece en la tabla 6.4. al sustituir

estos valores en la ecuación anterior, obtenemos.

r=106−

21(22)5

√ [111−(21)2

5 ] [112−(22)2

5 ]

r= 13.618.616

r=0.731

r=0.73

PROBLEMA DE PRÁCTICA 6.1

Resolvamos otro ejercicio. Esta utilizaremos los datos de la tabla 6.1. Para su

conveniencia, hemos reproducido estos datos en las primeras tres columnas de

la tabla 6.5. En este ejemplo tenemos una relación lineal imperfecta y estemos

interesados en calcular la magnitud y dirección de la relación mediante la r de

Pearson. La solución también aparece en la tabla 6.5.

IQ y el promedio de las calificaciones: cálculo de la r de Pearson

TABLA 6.5

ESTUDIANTE

NÚMERO

IQX PROMEDIO

DE DATOS Y

X2 Y 2 XY

1

2

3

4

5

6

7

8

9

10

11

12

110

112

118

119

122

125

127

130

132

134

136

138

1.0

1.6

1.2

2.1

2.6

1.8

2.6

2.0

3.2

2.6

3.0

3.6

12,100

12,544

13,924

14,161

14,884

15,625

16,129

16,900

17,424

17,956

18,496

19,044

1.00

2.56

1.44

4.41

6.76

3.24

6.76

4.00

10.24

6.76

9.00

12.96

110.0

179.2

141.6

249.9

317.2

225.0

330.2

260.0

422.4

384.4

408.0

496.8

TOTAL 1503 27.3 189,187 69.13 3488.7

r=∑ XY−¿¿¿

r=3488.7−

1503(27.3)12

√ [189,187−(1503)2

12 ] [69.13−(27.3)2

12 ]

r=69.37581.088

r=0.856

r=0.86

PROBLEMA DE PRÁCTICA 6.2

Tratemos de resolver otro problema. ¿Se ha puesto a reflexionar si es verdad

que los opuestos se atraen? Todos hemos estado ante parejas en las que sus

miembros parecen ser muy diferentes entre sí. ¿Pero esto es lo usual? ¿Qué

fomenta la atracción: las diferencias o las similitudes? Un psicólogo social

abordó este problema pidiendo a 15 estudiantes que respondieran un

cuestionario relacionado con un sus actitudes hacia una amplia gama de

temas. Tiempo después les mostró las “actitudes” de un extraño hacia los

mismos temas y les pidió que evaluaran su agrado o inclinación por el extraño

y si, probablemente, disfrutarían el trabajar con él. En realidad, las “actitudes”

del extraño fueron elaboradas por el experimentador y variaron de sujeto a

sujeto, con respecto a la proporción de actitudes similares que hubo entre el

extraño y el individuo que participó en el experimento. De esa manera, se

obtuvieron datos, para cada sujeto a sus actitudes y la atracción que sintió

hacia un extraño, basada en las actitudes de este último hacia los mismos

temas. Si los iguales se atraen, entonces debería existir una relación directa

entre la atracción hacia un extraño y la proporción de actitudes similares. Los

datos se presentan en la tabla 6.6. Entre mayor sea la atracción, más alto será

el puntaje. El puntaje de atracción máximo es de 14. Calcule el coeficiente de

correlación r de Pearson * para determinar si existe una relación directa entre la

similitud de actitudes y el grado de atracción.

Datos y solución del problema de práctica 6.2

TABLA 6.6

ESTUDIANTE

NÚMERO

PROPORCIÓN DE

ACTITUDES

SIMILARES X

ATRACCIÓN

Y

X2 Y 2 XY

1

2

3

4

0.30

0.44

0.67

0.00

8.9

9.3

9.6

6.2

0.090

0.194

0.449

0.000

79.21

86.49

92.16

38.44

2.670

4.092

6.432

0.000

5

6

7

8

9

10

11

12

13

14

15

0.50

0.15

0.58

0.32

0.72

1.00

0.87

0.09

0.82

0.64

0.24

8.8

8.1

9.5

7.1

11.0

11.7

11.5

7.3

10.0

10.0

7.5

0.250

0.022

0.336

0.102

0.518

1.000

0.757

0.008

0.672

0.410

0.058

77.44

65.61

90.25

50.41

121.00

136.89

132.25

53.29

100.00

100.00

56.25

4.400

1.215

5.510

2.272

7.920

11.700

10.005

0.657

8.200

6.400

1.800

TOTAL 7.34 136.5 4.866 1279.69 73.273

r=∑ XY−¿¿¿

r=73.273−

7.34(136.5)15

√ [4.866−(7.34)2

15 ] [1279.69−(136.5)2

15 ]

r=6.4796.916

r=0.937

r=0.94

Por lo tanto, con base en estos estudiantes, existe una relación muy fuerte

entre las similitudes y las atracciones.

Una segunda interpretación de la r de Pearson. La r de Pearson también se

puede interpretar en términos de la variabilidad de Y explicada por medio de X.

este punto de vista produce más información importante acerca de r y la

relación entre X y Y. Considere, por ejemplo, la figura 6.9, en la cual se

muestra una relación imperfecta entre X y Y. En este ejemplo, la variable X

representa una competencia de ortografía y la variable Y la habilidad en la

escritura de seis estudiantes de tercer grado. Suponga que queremos predecir

la calificación en la escritura de María, la estudiante cuya calificación en

ortografía es de 88. Si no hubiese una relación entre la escritura y la ortografía.

EJERCICIOS DE APLICACIÓN

1. En un largo curso de introducción a la sociología, un profesor hace dos

exámenes. El profesor quiere determinar si las calificaciones de los

estudiantes en el segundo examen correlacionadas con las

calificaciones del primero. Para facilitar la los, se elige una muestra de

ocho estudiar calificaciones aparecen en la siguiente tabla.

ESTUDIANTE EXÁMEN 1 EXÁMEN 2

1

2

3

4

5

6

7

60

75

70

72

54

83

80

60

100

80

68

73

97

85

8 65 90

a. Construya una gráfica de dispersión para datos, utilizando la

calificación del primer examen como la variable X. ¿Parece lineal

la relación? Y 2

b. Suponga que existe una relación lineal en calificaciones de los

dos exámenes, calcule la r de Pearson.

c. ¿Qué tan bien explican la relación, las calificaciones del segundo

examen?

50 55 60 65 70 75 80 850

20

40

60

80

100

120

Series2

r=∑ XY−¿¿¿

r=46239−365027

8

√ [39739−(559)2

8 ][54687−(653)2

8 ]r=¿0,629531757

Se puede decir que es una relación Baja y positiva que los dos exámenes

tienen entre si

2. Un investigador realiza un estudio de la relación entre el consumo de

cigarros y las enfermedades determinan la cantidad de cigarros fumados

diariamente y de días de ausencia en el trabajo dura último año debido a

una enfermedad para 13 individuos en la compañía donde trabaja este

investigador. Los datos aparecen en la tabla anexa.

SUJETO CIGARROS

CONSUMIDOS

DÍAS DE

AUSENCIA

1

2

3

4

5

6

7

8

9

10

11

0

0

0

10

13

20

27

35

35

44

53

1

3

8

10

4

14

5

6

12

16

10

12 60 16

a. Construya una gráfica de dispersión para estos datos: ¿Se ve una

relación lineal?

b. Calcule el valor de la r de Pearson.

c. Elimine los datos de los sujetos 1, 2, 3, 10, 11 y 12. Esto

disminuye el rango de ambas variables. Vuelva a calcular r para

los sujetos restantes. ¿Qué afecto tiene la disminución del rango

sobre r?

d. A utilizar todo el conjunto de datos, ¿qué porcentaje de la

variabilidad en el número de días de ausencia es explicado por la

cantidad de cigarros fumados diariamente? ¿De qué sirve ese

valor?

0 10 20 30 40 50 60 700

2

4

6

8

10

12

14

16

18

Series2

r=∑ XY−¿¿¿

r=3391−31185

12

√ [12193−(297)2

12 ] [1203−(105)2

12 ]

r=¿ 0,6753

5 10 15 20 25 30 35 400

2

4

6

8

10

12

14

16

Series2

r=∑ XY−¿¿¿

r=1197−7140

6

√ [3842−(140)2

6 ][517−(51)2

6 ]

r=¿ 0,0318

3. Un educador ha construido un examen para las aptitudes mecánicas y

desea determinar si éste es confiable, mediante dos administraciones

con un lapso de 1 mes entre ellas. Se realiza un estudio en el cual 10

estudiantes reciben dos administraciones del examen, donde la segunda

administración ocurre un mes después que la primera. Los datos

aparecen en la tabla.

a. Construya una gráfica de dispersión para las parejas de datos.

b. Determine el valor de r.

c. ¿Sería justo decir que éste es un examen confiable? Explique esto al

utilizar r2.

SUJETO ADMINISTRACIÓ

N 1

ADMINISTRACIÓ

N 2

1

2

3

4

5

6

7

8

9

10

10

12

20

25

27

35

43

40

32

47

10

15

17

25

32

37

40

38

30

49

5 10 15 20 25 30 35 40 45 500

10

20

30

40

50

60

Series2

r=∑ XY−¿¿¿

r=9907−85263

10

√ [9905−(291)2

10 ] [9977−(293)2

10 ]

r=¿ 0,9881

La investigación no es confiable por que los datos son tomados en dos fecha

totalmente distintas

4. Un grupo de investigadores ha diseñado un cuestionario sobre la

tensión, consistente en 15 sucesos. Ellos están interesados en

determinar si existe una coincidencia entre dos culturas acerca de la

cantidad relativa de ajustes que acarrea cada suceso. El cuestionario se

aplica a 300 estadounidenses y 300 italianos. Cada individuo debe

utilizar el evento “matrimonio” como estándar y juzgar los demás eventos

en relación con el ajuste necesario para el matrimonio. El matrimonio

recibe un valor arbitrario de 50 puntos. Si se considera que un evento

requiere de más ajustes que el matrimonio, el evento debe recibir más

de 50 puntos. El número de puntos excedentes depende de la cantidad

de ajustes requeridos. Después de que cada sujeto de cada cultura ha

asignado puntos a todos los eventos, se promedian los puntos de cada

evento. Los resultados aparecen en la siguiente tabla:

EVENTOS ESTADOUNIDENSES ITALIANOS

Muerte de la esposa

Divorcio

Separación de la pareja

Temporada en prisión

Lesiones personales

Matrimonio

Despedido del trabajo

Jubilación

Embarazo

Dificultades sexuales

Reajustes económicos

Problemas con la familia

política

Problemas con el jefe

Vacaciones

Navidad

100

73

65

63

53

50

47

45

40

39

39

29

23

13

12

80

95

85

52

72

50

40

30

28

42

36

41

35

16

10

a. Suponga que los datos tienen al menos una escala de intervalo y

calcule la correlación entre los datos estadounidenses y la de los

italianos.

b. Suponga que los datos sólo tienen una escala ordinal y calcule la

correlación entre los datos de ambas culturas.

0 20 40 60 80 100 1200

102030405060708090

100

Series2

r=∑ XY−¿¿¿

r=39766− 491992

15

√ [39391−(691)2

15 ][42644−(712)2

15 ]

r=¿ 0,8519

La r es alta y positiva es decir que los comportamiento de las dos

nacionalidades son bastante similares

INDIVIDUO EXÁMEN CON LÁPIZ

Y PAPEL

SIQUIATRA

A

SIQUIATRA

B

1

2

3

4

5

6

7

8

9

10

11

12

48

37

30

45

31

24

28

18

35

15

42

22

12

11

4

7

10

8

3

1

9

2

6

5

9

12

5

8

11

7

4

1

6

2

10

3

5. Un psicólogo ha construido un examen lápiz - papel, a fin de medir la

depresión. Para comparar los datos del examen con los datos de los

expertos, 12 individuos “con perturbaciones emocionales” realizan el

examen lápiz – papel. Los individuos también son calificados de manera

independiente por dos siquiatras, de acuerdo con el grado de depresión

determinado por cada uno como resultado de entrevistas detalladas. Los

datos aparecen a continuación. Los datos mayores corresponden a una

mayor depresión.

a. ¿Cuál es la correlación entre los datos de los dos siquiatras?

b. ¿Cuál es la correlación entre las calificaciones del examen con

lápiz y papel y los datos de cada siquiatra?

0 2 4 6 8 10 12 140

2

4

6

8

10

12

14

Series2

r=∑ XY−¿¿¿

r=628−650

12

√ [650−(78)2

12 ] [650−(78)2

12 ]

r=¿ 0,8519

La relación se da con un mismo criterio por los psiquiatras

10 15 20 25 30 35 40 45 500

2

4

6

8

10

12

14

Series2

r=∑ XY−¿¿¿

r=2729−29250

12

√ [12941−(375)2

12 ][650−(78)2

12 ]r=¿ 0,6973

La relación entre las dos variables es baja y positiva

10 15 20 25 30 35 40 45 500

2

4

6

8

10

12

14

Series2

r=∑ XY−¿¿¿

r=2729−29250

12

√ [12941−(375)2

12 ][650−(78)2

12 ]r=¿ 0,697

6. Para este problema, suponga que usted es un psicólogo que labora en

el departamento de recursos humanos de una gran corporación. El

presidente de la compañía acaba de hablar con usted acerca de la

importancia de contratar personal productivo en la sección de

manufactura de la empresa y le ha pedido que ayude a mejorar la

capacidad de la institución para hacer esto. Existen 300 empleados en

esta sección y cada obrero fabrica el mismo artículo. Hasta ahora, la

corporación sólo ha recurrido a entrevistas para elegir a estos

empleados. Usted busca bibliografía y descubre dos pruebas de

desempeño, lápiz – papel, bien estandarizadas, y piensa que podrían

estar relacionados con los requisitos desempeño de esta sección. Para

determinar si alguna de ellas se puede utilizar como dispositivo de

selección, elige 10 empleados representativos de la sección de

manufactura, garantizando que un amplio rango de desempeño quede

representado en la muestra, y realiza las dos pruebas con cada

empleado. Los datos aparecen en la siguiente tabla.

Mientras mayor sea la calificación, mejor será el desempeño. Las

calificaciones de desempeño en el trabajo. Las calificaciones de

desempeño fabricados por cada empleado por semana, promediados

durante los últimos 6 meses.

a. Construya una gráfica de dispersión del desempeño en el trabajo

y la primera prueba, utilizando la prueba 1 como la variable X.

¿Parece lineal la relación?

b. Suponga que la relación anterior es lineal y calcule el valor de la r

de Pearson.

c. Construya una gráfica de dispersión del desempeño en el trabajo

y la segunda prueba, utilizando la prueba 2 como la variable X.

¿Parece lineal la relación?

d. Suponga que la relación anterior es lineal, calcule el valor de la r

de Pearson.

e. Si sólo pudiera utilizar una de las pruebas para la selección de los

empleados, ¿utilizaría alguna de ellas? En tal caso, ¿cuál de

ellas? Explique.

EMPLEADO 1 2 3 4 5 6 7 8 9 10Desempeño en el trabajo 50 74 62 90 98 52 68 80 88 76

Examen 1 10 19 20 20 21 14 10 24 16 14Examen 2 25 35 40 49 50 29 32 44 46 35

8 10 12 14 16 18 20 22 24 260

20

40

60

80

100

120

Series2

r=∑ XY−¿¿¿

r=12804−123984

10

√ [3026−(168)2

10 ] [56772−(738)2

10 ]

r=¿ 0,5917

20 25 30 35 40 45 50 550

20

40

60

80

100

120

Series2

r=∑ XY−¿¿¿

r=29542−284130

10

√ [15493−(385)2

10 ] [56772−(738)2

10 ]

r=¿ 0,9076

Análisis

El trabajo realizado acerca de cómo realizar calcular la correlación y relación

lineal se analizado que es un método el cual permite comparar e interpretar

resultados a través de la recolección de datos de cualquier institución con el

objetivo de llegar a establecer deducciones.

Conclusión.

Al realizar el trabajo permite que cada uno de nosotros tenga conocimientos

claros acerca de la correlación y relación lineal para poner en práctica en los

problemas que se presentan el mundo en especial de comercio exterior,

ayudan a interpretar datos en forma resumida los datos planteados y a dar

solución al problema.

Recomendación

El tema de investigación es de mucha relevancia porque la correlación y

relación lineal nos permiten determinar un promedio de algunos datos

estadísticos, tomando variables correspondientes para la interpretación de los

datos.

Lincografía.

www.profesorenlinea.cl/.../EstadisticaMediaMedianaModa.htm

Cronograma

Actividades Abril

días2

1

2

2

2

3

2

4

Definición

del tema x

Problema de

investigación x

Objetivos x

Justificación

de la

investigación

x

Marco

Referencialx

Aspectos

metodológic

os

x x

Pres. Proy. X

Recursos

PRESUPUESTO

Trabajo

CANTID

ADValor

unitarioPRESUPUESTO

PAPEL 20 0,02 0,40IMPRESIÓN 20 0,06 1,20INTERNET 2 0,5 1,00TOTAL 2.60

DESARROLLO DE EJERCICIOS HIPOTESIS

1.- El banco de préstamos estudia la relación entre ingreso (X) y de ahorros (Y)

mensuales de sus clientes.

Meses 1 2 3 4 5 6 7 8 9

Ingresos 350 400 450 500 950 850 700 900 600

Ahorro 100 110 130 160 350 350 250 320 130

a) Determinar la ecuación lineal de las dos variables.

y=a+bx

y=−73,89+0.45 x

b) Trace el diagrama de dispersión en el plano cartesiano

300 400 500 600 700 800 900 10000

50

100

150

200

250

300

350

400

f(x) = 0.451626016260163 x − 74.9186991869919R² = 0.926205705264043

Ingresos

Ahor

ros

c) Estime el ingreso que corresponde a un ahorro semanal de 90 dólares.

y=−73,89+0.45 x

y=−73.89+0.45 (90 )=−33.39

d) Si el ahorro es de 200 dólares que gasto puede realizar el obrero en

dicha semana.

y=−73.89+0.45 x y=−73.89+0.45 (200 )=16.11

e) Si el ingreso es de 350 dólares cual es el salario.

y=−73.89+0.45 x

350=−73.89+0.45 x

x=350+73,890,45

x=941,97

Desarrollo

MesesIngresos(X)

Ahorros (Y) X2 Y 2 X*y (X−Ẍ )2 (Y−Ӯ )2

1 350 100 122500 10000 35000 80277,78 12345,682 400 110 160000 12100 44000 54444,44 10223,463 450 130 202500 16900 58500 33611,11 6579,014 500 160 250000 25600 80000 17777,78 2612,35

5 950 350902500 122500 332500

100277,78 19290,12

6 850 350 722500 122500 297500 46944,44 19290,127 700 250 490000 62500 175000 4444,44 1512,358 900 320 810000 102400 288000 71111,11 11856,799 600 130 360000 16900 78000 1111,11 6579,01

5700 1900402000

0 491400138850

0410000,0

0 90288,89

∑X ∑Y

∑X 2

∑Y 2

∑X∗Y

∑ (X−Ẍ )2

∑ (Y−Ӯ )2

Primer caso

Yr=Y +r ( sysx ) x−r ( sysx ) x

X=∑ x1n

=57009

=633.33

Y=∑ y1n

=19009

=211.11

r=n∑ xy−∑ x∑ y

√¿¿¿

r=9 (1388500 )−(5700)(1900)

√¿¿¿

r= 1666500

√3690000∗812600=16665001731616

=0.96

sx=√∑ ¿¿¿¿

sx=√ 4100009=213.44→desviacion standar

s x2=¿

sy=√∑ ¿¿¿¿

sy=√ 90288,899=100,16→desviacionstandar

s y2=¿

Yr= y+r ( sysx ) x−r ( sysx ) x

Yr=211.11+0.96 ( 100,16213,44 ) x−0.96 ( 100,16213,44 )633,33

Yr=211,11+0,45 x−285,31

Yr=−74,2+0,45x

2.- Un comerciante mayorista encargo un estudio para determinar la relación

entre los gastos de publicidad semanal por radio y las ventas de sus productos.

En el estudio se obtuvieron los siguientes resultados.

Semana 2 3 4 5 6 7 8 9 10 11

Gasto de Publicidad ($) 30 20 40 30 50 70 60 80 70 80

Venta ($) 300 250 400 - 550 750 630 930 700 840

En la quinta semana por diversos motivos no se pudo hacer el estudio

a) Determine la ecuación de regresión de ventas sobre gastos de

publicidad

Meses

Gastos publicidad (X)

Ventas (Y)

X2 Y 2 X*y (X−Ẍ )2 (Y−Ӯ )2

1 30 300 900 90000 9000 653,09 86697,53

2 20 250400 62500 5000 1264,20

118641,98

3 40 400 1600 160000 16000 241,98 37808,644 50 550 2500 302500 27500 30,86 1975,315 70 750 4900 562500 52500 208,64 24197,536 60 630 3600 396900 37800 19,75 1264,20

7 80 9306400 864900 74400 597,53

112597,53

8 70 700 4900 490000 49000 208,64 11141,989 80 840 6400 705600 67200 597,53 60297,53

500 5350 31600 3634900 338400 3822,22454622,2

2

∑X ∑Y

∑X 2

∑Y 2

∑X∗Y

∑ (X−Ẍ )2

∑ (Y−Ӯ )2

Primer caso

Yr= y+r ( sysx ) x−r ( sysx ) x

X=∑ x1n

=5009

=55,55

Y=∑ y1n

=53509

=594,44


√¿¿¿r=9¿¿

r= 370600

√(34400)(4091600)

r= 370600375168,02

=0.99

¿√∑ ¿¿¿¿

sx=√ 3822,229=20,61→desviacion standar

s x2=¿sy=√∑ ¿¿¿¿

sy=√ 454622,229=224,75→desviacionstandar

s y2=(224,75)=50512,56→varianza

Yr=594,44+0.99( 224,7520,61 )x−0.99 ( 224,7520,61 )55,55Yr=594,44+10,79 x−599,71

Yr=−5,27+10,79 x


√¿¿¿

r=9¿¿

r= 370600

√(34400)(4091600)

r= 370600375168,02

=0.99

b. Estime la cosecha si se aplica 12 sacos de fertilizantes.

10 20 30 40 50 60 70 80 900

100200300400500600700800900

1000

Gastos

Vent

as

a) Determina el coeficiente de determinación. De su comentario sobre este

valores

Yr=−5,27+10,79 x

yr= -5,27 + 10,79(30)

yr= 318,43

3.- Se obtuvieron los siguientes datos para determinar la relación entre cantidad

de fertilizante y producción de papa por hectárea.

Sacos de fertilizante por hectárea 3 4 5 6 7 8 9 10 11 12

Rendimiento en quintales 45 48 52 55 60 65 68 70 74 76

a) Encuentre la ecuación de regresión de la cosecha sobre el fertilizante,

por el método de mínimos cuadrados.

Y=a+bx

a=Y−b X

b=n∑ xiyi−∑ xi∑ yi

n∑ X i2−¿¿¿

Periodo

Sacos de fertilizantes X

Rendimiento en quinta (Y) X2 Y 2 X*y (X−Ẍ )2 (Y−Ӯ )2

1 3 45 9 2025 135 20,25 265,692 4 48 16 2304 192 12,25 176,893 5 52 25 2704 260 6,25 86,494 6 55 36 3025 330 2,25 39,695 7 60 49 3600 420 0,25 1,696 8 65 64 4225 520 0,25 13,697 9 68 81 4624 612 2,25 44,898 10 70 100 4900 700 6,25 75,699 11 74 121 5476 814 12,25 161,2910 12 76 144 5776 912 20,25 216,09

75 613 645 38659 4895 82,50 1082,10

∑X ∑Y

∑X 2

∑Y 2

∑X∗Y

∑ (X−Ẍ )2

∑ (Y−Ӯ )2

x=∑ xi

n

x=7510

=7,5

y=∑ yi

n

y=61310

=61,3

b=10 (4895 )−(75 ) (613 )10 (645 )−(75 )2

b=48950−459576450−5625

b=2993825

=3,63

a=61,3−3,63 (7,5 )=34,07

y=34,07+3,63 x

b. Estime la cosecha si se aplica 12 sacos de fertilizantes ¿Cuánto es el error o

residual?

y=34,07+3,63 x

y=34,07+3,63 (12 )=77.63-76=1.63 es el error.

b) Determina el coeficiente de determinación. De su comentario sobre este

valores

r=N ¿¿

r=10 (4895 )−(75 )(613)

√¿¿¿

r= 48950−45975√ (6450−5625 )(386590−375769)

r= 2975

√ (825 )(10821)

r= 2975

√ (8927325 )

r= 29752987,86

r=0,75

4.- El número de horas de estudio invertidas y las calificaciones finales en un

curso de matemáticas de una muestra 10 alumnos ha dado los siguientes

resultados:

Alumno A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 Horas de estudio 14 16 22 20 18 16 18 22 10 8Calificación 12 13 15 15 17 11 14 16 8 5

a) Determine la recta de regresión de la calificación sobre el número de

horas de estudio invertidos. Interprete la ecuación de regresión.

Alumno

Horas de estudio X

Calificación (Y) X2 Y 2 X*y (X−Ẍ )2 (Y−Ӯ )2

1 14 12 196 144 168 5,76 0,362 16 13 256 169 208 0,16 0,163 22 15 484 225 330 31,36 5,764 20 15 400 225 300 12,96 5,765 18 17 324 289 306 2,56 19,366 16 11 256 121 176 0,16 2,567 18 14 324 196 252 2,56 1,968 22 16 484 256 352 31,36 11,569 10 8 100 64 80 40,96 21,16

10 8 5 64 25 40 70,56 57,76164 126 2888 1714 2212 198,40 126,40

∑X ∑Y

∑X 2

∑Y 2

∑X∗Y

∑ (X−Ẍ )2

∑ (Y−Ӯ )2

X=∑ X iN

X=16410

X=16,4

Y=∑Y iN

Y=12610

Y=12,6

SXY=∑ XY

n– XY

SXY=221210

−(16,4)(12,6)

SXY=221,2−206,64

SXY=14,56

SX=√∑ (X i−X )2

N

SX=√ 198,4010}

SX=4,45

SX 2=19,84

b=SXYSX 2

b=14,5619,84

b=0,734

a=Y−b X

a=12,6−0,73(16,4)

a=0,565

Y=a+bx

Y=0,565+0,734 x

5.- Una muestra de 60 de las 350 agencias de ventas de automóviles de una

importadora registrada en un mes con X (autos vendidos por agencia), Y

(ventas en miles de dólares) ha dado los siguientes resultados:

x=10 , y=10 , ∑ x2=7000 ,∑ y2=42000 , ∑ xy=8000

a) Determine la ecuación de regresión: Y=a+bX

sxy=∑ xy

n−x y

sxy=800060

−10∗20=−66.67

s x2=∑ x2

n−¿

s x2=700060

−¿

b= sxys x2

=−66.6716.67

=−4

a= y−bx

a=20−(−4 ) (10 )=60

Ecuación

y=a+bx

y=60−4 x

b) Calcule el coeficiente de terminación ¿Qué porcentaje de la variación

total es explicada por la regresión?

y=∑ y

n

∑ y= y n

∑ y=20∗60=1200

x=∑ x

n

∑ x=xn

∑ x=10∗60=600


√¿¿¿

r=60 (8000 )−(600)(1200)

√¿¿¿

r= −240000254358.44

=−0,94

6.- Los contadores con frecuencia estiman los gastos generales basados en el

nivel de producción. En la tabla que sigue se da la información recabada sobre

gastos generales y las unidades producidas en 10 plantas y se desea estimar

una ecuación de regresión para estimar gastos generales futuros.

Gastos generales ($)

300

1000

1100

1200 600 800 900 500 400 200

Unidades producidas 15 45 55 75 30 40 45 20 18 10

a) Determine la ecuación de regresión y haga un análisis del coeficiente de

regresión.

Periodos

Gasto generales X

Unidades producidas (Y) X2 Y 2 X*y (X−Ẍ )2 (Y−Ӯ )2

1 300 15 90000 225 4500 160000,00 412,09

2 1000 45100000

0 2025 45000 90000,00 94,09

3 1100 55121000

0 3025 60500 160000,00 388,09

4 1200 75144000

0 5625 90000 250000,00 1576,095 600 30 360000 900 18000 10000,00 28,096 800 40 640000 1600 32000 10000,00 22,097 900 45 810000 2025 40500 40000,00 94,098 500 20 250000 400 10000 40000,00 234,099 400 18 160000 324 7200 90000,00 299,2910 200 10 40000 100 2000 250000,00 640,09

7000 353600000

0 1624930970

01100000,0

0 3788,10

∑X ∑Y

∑X 2

∑Y 2

∑X∗Y

∑ (X−Ẍ )2

∑ (Y−Ӯ )2

X=∑ X iN

X=7 00010

X=700

Y=∑Y iN

Y=35310

Y=35,3

SXY=∑ XY

n– X∗Y

SXY=30970010

−(700)(35,3)

SXY=30970−24710

SXY=6260

SX=√∑ (X i−X )2

N

SX=√ 110000010

SX=331,66

SX 2=109998,36

b=SXYSX 2

b= 6260109 998,36

b=0,06

a=Y−b X

a=35,3−0,06(700)

a=−6,7

Y=a+bx

Y=−6,7+0,06 x

ejercicios de estadistica

Documents