ejercicios de estadistica
TRANSCRIPT
UNIVERSIDAD POLITÉCNICA ESTATAL DEL CARCHI
ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN COMERCIAL
INTERNACIONAL
TEMA: Aplicación de Ejercicios de estadística
Msc. Jorge pozo
Integrante
Ayala Maricela
NIVEL: 6TO “A”
Periodo – 2012
TEMA: Aplicación de Ejercicios de estadística
Problema:
La dificultad del estudiante para calcular los Ejercicios de estadística
Objetivos:
Objetivo General.
Identificar como calcular los Ejercicios de estadística
Objetivos Específicos.
Recopilar conceptos sobre los Ejercicios de estadística
Analizar los conceptos sobre los Ejercicios de estadística
Poner en práctica los conocimientos sobre los Ejercicios de estadística
Justificación
Este trabajo se realiza para que el estudiante sea práctico en el cálculo de la
correlación y relación lineal y domine bien el tema y se involucre en
investigaciones cada vez más profundas analizando algunas características
generales como es la de calcular el coeficiente de correlación r de Pearson de
acuerdo a los datos planteados, al observar los resultados se puede sacar
importantes análisis con el fin de determinar si es aceptable o no el tipo de
caso aplicado,
Desarrollo
CORRELACIÓN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOS EN
CLASES
El presente tema nos conduce a calcular el coeficiente de correlación r, que
nos proporciona información de la fuerza de la relación que existe entre dos
conjuntos de datos que se encuentran agrupados, cada uno de ellos formando
por separados una distribución de frecuencias, mejor dicho teniendo por
separado sus intervalos de clase con sus respectivas frecuencias.
Para realizar una exposición del tema en forma más entendible, presentamos el
ejemplo del Cuadro Nº 4.1.7.
Ejemplo:
Calcular el grado de correlación entre las puntaciones obtenidas en inventario
de hábitos de estudio y los puntajes obtenidos en un examen de Matemática,
aplicados a un total de 134 alumnos de un colegio de la localidad.
CUADRO Nº 4.1.7
X Hábitos de estudio
Y Matemática
20→30 30→40 40→50 50→60 Total
f y
70→80 3 2 2 7
60→70 1 0 4 5 10
50→60 2 6 16 3 27
40→50 4 14 19 10 47
30→40 7 15 6 0 28
20→30 8 2 0 1 11
10→20 1 1 2 4
Total f x 23 40 48 23 134
Podemos notar que el problema no es tan simple, como el caso anterior, dado
que ahora los datos se han clasificado en una tabla de doble entrada Nº 4.1.7.
Este cuadro muestra, en la primera columna del lado izquierdo los intervalos de
clase de la variable Y, los que cubren todos los posibles datos acerca de las
puntuaciones alcanzadas por los estudiantes en la prueba de Matemática.
Nótese que los intervalos crecen de abajo hacia arriba. En la fila superior se
presentan los intervalos de clase todos los 134 posibles datos acerca de los
puntajes obtenidos por los estudiantes en la variable hábitos de estudios
representados por la letra X.
Dentro del Cuadro Nº 4.1.7 en los casilleros interiores o celdas de la tabla, se
encuentran las frecuencias de celdas f xy que corresponden a puntajes que
pertenecen tanto a un intervalo de la variable Y como a un intervalo de la
variable X.
En la fila interior del Cuadro se presentan los totales de los puntajes de la
variable X, hábitos de estudio. Esos totales se llaman frecuencias marginales
de la variable X y se representan por f x.
En la última columna de la derecha se encuentran los totales de los puntajes de
la variable rendimiento en matemática. Estos totales se denominan frecuencias
marginales de la variable Y.
Cuando los datos se presentan tal como el presente caso, formando tablas de
doble entrada, es conveniente usar el método clave que expondremos a
continuación porque con este procedimiento se evita manejar grandes
números, como sería el caso si se emplearán las fórmulas para trabajar con la
calculadora de bolsillo.
La fórmula que utilizaremos es la siguiente:
r=n∑ f xyux uy−¿ (∑ f xux )(∑ f y uy)
√ [n∑ f xu2x−(∑ f xux)
2 ] [n f yu2y−(∑ f y uy )2 ]
¿
Para obtener los datos que deben aplicarse en la fórmula Nº 4.1.2., vamos a
construir el cuadro auxiliar Nº 4.1.8, al mismo tiempo que se explica el
significado de los símbolos de esa fórmula.
Lo primero que hacemos es reemplazar los intervalos horizontales y verticales
por sus respectivas marcas de clase; a continuación adicionaremos al Cuadro
Nº 4.1.7, cinco columnas por el lado derecho; cuyos encabezamientos son: f y
para la primera uy para la segunda, f yu y para la tercera, f yu2y para la cuarta y
f xy uxuy para la quinta columna.
Por la parte inferior del cuadro le adicionamos cuatro filas que se nombran: f x
para la primera ux para la segunda fila que está debajo de la anterior, f x ux para
la tercera fila y por último, f x u2x para la cuarta fila que está debajo de todas; de
esta manera se va elaborando el Cuadro Auxiliar Nº 4.1.8.
1) Para determinar las frecuencias marginales que se deben colocar en la
columna f ypara la primera uy para la segunda, f yu y para la tercera, f y
sumamos las frecuencias de las celdas que están en la misma fila de la
marca de clase 75, obtenemos: 3+2+2=7, número que se escribe en el
primer casillero o celda de la columna f ypara la primera uy para la segunda,
f yu y para la tercera,f y . En la fila de la marca de clase 65, sumamos
1+4+5=10, número que se escribe debajo del 7.
Para la fila de la marca de clase 55, tenemos: 2+6+16+3=27.
Para la fila de la marca de clase 45, se tiene: 4+14+19+10=47.
En igual forma: 7+15+6=28.
Lo mismo: 8+2+1=11
Y en la última fila: 1+1+2=4
A continuación sumamos estas frecuencias marginales de la variable Y:
7+10+27+47+28+11+4=134 es el total general.
2) Ahora a determinar las frecuencias marginales de la variable X: En columna
encabezada con la marca de clase 25 sumemos verticalmente las
frecuencias: 1+2+4+7+8+1=23.
En la columna encabezada con 35, tenemos: 3+6+14+15+2=40
En la siguiente: 2+4+16+19+6+1=48
En la última: 2+5+3+10+1+2=23
3) Centremos nuestra atención en la columna encabezada f ypara la primera
uy para la segunda, f yu y para la tercera,uy este signo significa desviación
unitaria, y procedemos en la misma forma que en las Tablas Nº 2.1.2 y Nº
2.1.3 (b). recuerden que las desviaciones unitarias positivas: +1, +2, y +3
corresponden a los intervalos mayores y por el contrario las desviaciones
unitarias negativas: -1, -2 y -3 corresponden a los intervalos menores. Como
origen de trabajo se tomó la marca de clase 45 y por lo tanto su desviación
unitaria es cero.
4) Luego vamos a determinar las desviaciones unitarias horizontales de la
variable X. el origen de trabajo es la marca de clase 45 que se halla en la
fila superior del cuadro, por esa razón, escribimos cero debajo de la
frecuencia marginal 48. Las desviaciones unitarias negativas: -1 y -2 se
escriben a la izquierda cero, porque se corresponden con los intervalos de
clase que tienen menores marcas de clase y que están a la izquierda de 45.
La desviación unitaria positiva, se corresponde con el intervalo de mayor
marca de clase, 55 (en parte superior del Cuadro Nº 4.1.8.)
5) A continuación vamos a determinar los valores que deben colocarse en la
columna encabezada f yu y; este símbolo indica que se debe multiplicar
cada valor de f y por su correspondiente valor de uy, así: 7(+3)=21;
10(+2)=20; 27(+1)=27; 47(0)=0; 28(-1)=-28; 11(-2)=-22 y 4(-3)=-12.
Sumando algebraicamente, tenemos: 21+20+27=68 los positivos: y (-
28)+ (-22)+ (-12)=-62 los negativos.
Por último: 68-62=6 total, que se coloca en la parte inferior de la columna
Para obtener los valores de la cuarta columna encabezada f yu2y debemos
tener en cuenta que (uy ¿ ( f yu y )=f yu2y, por lo tanto basta multiplicar cada valor
de la segunda columna por su correspondiente valor de la tercera columna así
se obtiene el respectivo valor de la cuarta columna. En efecto:
(+3)(21)=63; (+2)(20)=40; (+1)(27)=27; 0*0=0; (-1)(-28)=28; (-2)(-22)=44 y (-3)(-
12)=36
La suma: 63+40+27+28+44+36=238
Ahora nos fijamos horizontalmente en la tercera fila. Tenemos que ( f x ¿(ux)=
f x ux por consiguiente basta multiplicar verticalmente un valor de la primera fila
por su correspondiente valor de la segunda dila para obtener el respectivo valor
de la tercera fila.
(23)(-2)=-46; (40)(-1)=-40; (48)(0)=0 y (23)(+1)=23
Sumando horizontalmente:
(-46)+ (-40)+ (23)=-86+23=-63
Vamos por la cuarta fila; vemos que (ux ) ( f xux )=f x u2x. Luego basta multiplicar
cada elemento de la segunda fila por su correspondiente elemento de la tercera
fila para obtener el respectivo elemento de la cuarta fila así:
(-2)(46)=92; (-1) (-40)=40; 0*0=0 y (+1) (23)=23
Para obtener los valores de la quinta columna ∑ f xyuxu y observamos que hay
tres factores; el 1º es la frecuencia f xy de la celda o casillero que se está
considerando, el segundo factor es la desviación unitaria ux, el tercer factor es
la desviación unitaria uy. Por tanto el procedimiento será el siguiente: Tomemos
el número 3 que es la frecuencia de la celda determinada por el cruce de los
intervalos que tienen la marcha de clase 75 horizontalmente y 35
verticalmente.
Bajemos la vista del número 3 hacia donde se halla el respectivo valor (-1) de
la desviación unitaria ux (ver la línea punteada).
Para indicar el tercer factor corremos la vista del número 3 hacia su derecha
hasta llegar a la columna de las desviaciones unitarias uy y ubicamos el número
+3 (ver la línea punteada) formemos el producto de estos tres números: (3) (-1)
(+3)=-9. Este número -9 encerrado en un semicírculo lo escribimos en la celda
elegida.
En la misma fila tomamos la celda siguiente: (2) (0) (+3)=0
Continuando hacia la derecha: (2) (+1) (+3)=6
CUADRO AUXILIAR Nº 4.1.8
CUADRO CORREGIDO DEL CUADRO AUXILIAR Nº 4.1.8
La fórmula del paso (9) lleva el signo para indicar que se deben sumar
horizontalmente los números que están encerrados en los semicírculos de esa
primera fila elegida, así: -9+0+6=-3. Este número se escribe en la quinta
columna.
Trabajemos con la siguiente fila: (1) (-2) (+2)=-4 se encierra en un semicírculo.
(0)(-1)(+2)=0
(4)(0)8+2)=0
(5)(+1)(+2)=10
Sumando 0+0+10=10
Ahora con la tercera fila:
(2)(-2)(+1)=-4
(6)(-1)(+1)=-6
(16)(0)(+1)=0
(3)(+1)(+1)=3
Sumando: (-4)+(-6)+0+3=-7
Cuarta fila:
(7)(-2)(-1)=14
(15)(-1)(-1)=15
(6)(0)(-1)=0
(0)(+1)(-1)=0
La suma es: 14+15=29
(8)(-2)(-2)=32
(2)(-1)(-2)=4
(0)(0)(-2)=0
(1)(+1)(-2)=-2
La suma es: 32+4-2=34
Séptima fila:
(1)(-2)(-3)=6
(1)(0)(-3)=-6
(2)(1)(-3)=-6
Sumando: 6+0-6=0
Sumando los valores de la columna quinta.
-3+6-7+0+29+34+0=69-10=59
Reuniendo los resultados anteriores, se tienen los datos para aplicar en fórmula
Nº 4.1.2.
n=134
∑ f xyuxu y=59
∑ f xux=−63
∑ f y uy=6
∑ f xu2x=155
∑ f y u2y=238
r=(134) (59 )−(−63)(6)
√ [ (134 )(155)−(−63)2 ] [(134)(238 )−(6)2 ]
r= 7906+378√(20770−3969)(31892−36)
r= 8284
√535212656
r= 828423134.66
r=0.358
RELACIONES
La correlación se ocupa de establecer la magnitud y la dirección de las
relaciones. Antes de profundizar en estos aspectos particulares de las
relaciones, analizaremos algunas características generales de éstas, con las
cuales podemos comprender mejor el material específico acerca de la
correlación.
RELACIONES LINEALES
Para iniciar nuestro análisis de las relaciones, veamos una relación entre dos
variables. La siguiente tabla muestra el salario mensual que percibieron cinco
agentes ventas y el valor en dólares de la mercancía vendida por cada uno de
ellos en ese mes.
AGENTE VARIABLE X MERCANCÍA
VENDIDA ($)
Y VARIABLE
SALARIO ($)
1
2
3
4
5
0
1000
2000
3000
4000
500
900
1300
1700
2100
Podemos analizar mejor la relación entre estas variables si trazamos una
gráfica utilizando los valores X y Y, para cada agente de ventas, como los
puntos de dicha gráfica. Él es una gráfica de dispersión o dispersigrama.
Una gráfica de dispersión o dispersigrama es una gráfica de parejas de
valores X y Y.
La gráfica de dispersión para los datos de los agentes de ventas aparece en
la figura 6.1. En relación con esta figura, vemos que todos los puntos caen
sobre una línea recta. Cuando una línea recta describe la relación entre dos
variables, se dice que esta relación lineal.
Una relación lineal entre dos variables es aquella que puede representarse
con la mejor exactitud mediante una
línea recta.
Observe que no todas las relaciones son
lineales; algunas son curvilíneas. En
este caso, al trazar una gráfica de dispersión para las variables X y Y, una
línea curva ajusta mejor a los datos que una línea recta.
CÁLCULO DE LA (r) DE PEARSON
La ecuación para calcular la r de Pearson mediante datos:
r=∑ z x z yN−1
Donde∑ z x z yes la suma de los productos de cada pareja de puntajes z.
Para utilizar esta ecuación, primero hay que convertir cada dato en bruto en su
valor transformado. Esto puede tardar mucho tiempo y crear errores de
redondeo. Con algún álgebra, esta ecuación se puede transformar en una
ecuación de cálculo que utilice datos en bruto:
ECUACIÓN PARA EL CÁLCULO DE LA (r) DE PEARSON
r=∑ XY−¿¿¿
Donde: ∑ XY es la suma de los productos de cada pareja X y Y, ∑ XY
también se llama la suma de productos cruzados.
La tabla 6.4 contiene algunos de los datos hipotéticos reunidos a partir de cinco
sujetos.
Datos hipotéticos para el cálculo de la r de Pearson
TABLA 6.4
SUBJETIVO X Y X2 Y 2 XY
A 1 2 1 4 2
B 3 5 9 25 15
C 4 3 16 9 12
D 6 7 36 49 42
E 7 5 49 25 35
TOTAL 21 22 111 112 106
r=∑ XY−¿¿¿
r=106−
21(22)5
√ [111−(21)2
5 ] [112−(22)2
5 ]
r= 13.618.616
r=0.731
r=0.73
Utilicemos estos datos para calcular la r de Pearson:
r=∑ XY−¿¿¿
∑ XYes la suma de los productos cruzados; se determina multiplicando los
datos X y Y para cada sujeto y luego sumando los productos resultantes. El
cálculo de ∑ XY y de los otros términos aparece en la tabla 6.4. al sustituir
estos valores en la ecuación anterior, obtenemos.
r=106−
21(22)5
√ [111−(21)2
5 ] [112−(22)2
5 ]
r= 13.618.616
r=0.731
r=0.73
PROBLEMA DE PRÁCTICA 6.1
Resolvamos otro ejercicio. Esta utilizaremos los datos de la tabla 6.1. Para su
conveniencia, hemos reproducido estos datos en las primeras tres columnas de
la tabla 6.5. En este ejemplo tenemos una relación lineal imperfecta y estemos
interesados en calcular la magnitud y dirección de la relación mediante la r de
Pearson. La solución también aparece en la tabla 6.5.
IQ y el promedio de las calificaciones: cálculo de la r de Pearson
TABLA 6.5
ESTUDIANTE
NÚMERO
IQX PROMEDIO
DE DATOS Y
X2 Y 2 XY
1
2
3
4
5
6
7
8
9
10
11
12
110
112
118
119
122
125
127
130
132
134
136
138
1.0
1.6
1.2
2.1
2.6
1.8
2.6
2.0
3.2
2.6
3.0
3.6
12,100
12,544
13,924
14,161
14,884
15,625
16,129
16,900
17,424
17,956
18,496
19,044
1.00
2.56
1.44
4.41
6.76
3.24
6.76
4.00
10.24
6.76
9.00
12.96
110.0
179.2
141.6
249.9
317.2
225.0
330.2
260.0
422.4
384.4
408.0
496.8
TOTAL 1503 27.3 189,187 69.13 3488.7
r=∑ XY−¿¿¿
r=3488.7−
1503(27.3)12
√ [189,187−(1503)2
12 ] [69.13−(27.3)2
12 ]
r=69.37581.088
r=0.856
r=0.86
PROBLEMA DE PRÁCTICA 6.2
Tratemos de resolver otro problema. ¿Se ha puesto a reflexionar si es verdad
que los opuestos se atraen? Todos hemos estado ante parejas en las que sus
miembros parecen ser muy diferentes entre sí. ¿Pero esto es lo usual? ¿Qué
fomenta la atracción: las diferencias o las similitudes? Un psicólogo social
abordó este problema pidiendo a 15 estudiantes que respondieran un
cuestionario relacionado con un sus actitudes hacia una amplia gama de
temas. Tiempo después les mostró las “actitudes” de un extraño hacia los
mismos temas y les pidió que evaluaran su agrado o inclinación por el extraño
y si, probablemente, disfrutarían el trabajar con él. En realidad, las “actitudes”
del extraño fueron elaboradas por el experimentador y variaron de sujeto a
sujeto, con respecto a la proporción de actitudes similares que hubo entre el
extraño y el individuo que participó en el experimento. De esa manera, se
obtuvieron datos, para cada sujeto a sus actitudes y la atracción que sintió
hacia un extraño, basada en las actitudes de este último hacia los mismos
temas. Si los iguales se atraen, entonces debería existir una relación directa
entre la atracción hacia un extraño y la proporción de actitudes similares. Los
datos se presentan en la tabla 6.6. Entre mayor sea la atracción, más alto será
el puntaje. El puntaje de atracción máximo es de 14. Calcule el coeficiente de
correlación r de Pearson * para determinar si existe una relación directa entre la
similitud de actitudes y el grado de atracción.
Datos y solución del problema de práctica 6.2
TABLA 6.6
ESTUDIANTE
NÚMERO
PROPORCIÓN DE
ACTITUDES
SIMILARES X
ATRACCIÓN
Y
X2 Y 2 XY
1
2
3
4
0.30
0.44
0.67
0.00
8.9
9.3
9.6
6.2
0.090
0.194
0.449
0.000
79.21
86.49
92.16
38.44
2.670
4.092
6.432
0.000
5
6
7
8
9
10
11
12
13
14
15
0.50
0.15
0.58
0.32
0.72
1.00
0.87
0.09
0.82
0.64
0.24
8.8
8.1
9.5
7.1
11.0
11.7
11.5
7.3
10.0
10.0
7.5
0.250
0.022
0.336
0.102
0.518
1.000
0.757
0.008
0.672
0.410
0.058
77.44
65.61
90.25
50.41
121.00
136.89
132.25
53.29
100.00
100.00
56.25
4.400
1.215
5.510
2.272
7.920
11.700
10.005
0.657
8.200
6.400
1.800
TOTAL 7.34 136.5 4.866 1279.69 73.273
r=∑ XY−¿¿¿
r=73.273−
7.34(136.5)15
√ [4.866−(7.34)2
15 ] [1279.69−(136.5)2
15 ]
r=6.4796.916
r=0.937
r=0.94
Por lo tanto, con base en estos estudiantes, existe una relación muy fuerte
entre las similitudes y las atracciones.
Una segunda interpretación de la r de Pearson. La r de Pearson también se
puede interpretar en términos de la variabilidad de Y explicada por medio de X.
este punto de vista produce más información importante acerca de r y la
relación entre X y Y. Considere, por ejemplo, la figura 6.9, en la cual se
muestra una relación imperfecta entre X y Y. En este ejemplo, la variable X
representa una competencia de ortografía y la variable Y la habilidad en la
escritura de seis estudiantes de tercer grado. Suponga que queremos predecir
la calificación en la escritura de María, la estudiante cuya calificación en
ortografía es de 88. Si no hubiese una relación entre la escritura y la ortografía.
EJERCICIOS DE APLICACIÓN
1. En un largo curso de introducción a la sociología, un profesor hace dos
exámenes. El profesor quiere determinar si las calificaciones de los
estudiantes en el segundo examen correlacionadas con las
calificaciones del primero. Para facilitar la los, se elige una muestra de
ocho estudiar calificaciones aparecen en la siguiente tabla.
ESTUDIANTE EXÁMEN 1 EXÁMEN 2
1
2
3
4
5
6
7
60
75
70
72
54
83
80
60
100
80
68
73
97
85
8 65 90
a. Construya una gráfica de dispersión para datos, utilizando la
calificación del primer examen como la variable X. ¿Parece lineal
la relación? Y 2
b. Suponga que existe una relación lineal en calificaciones de los
dos exámenes, calcule la r de Pearson.
c. ¿Qué tan bien explican la relación, las calificaciones del segundo
examen?
50 55 60 65 70 75 80 850
20
40
60
80
100
120
Series2
r=∑ XY−¿¿¿
r=46239−365027
8
√ [39739−(559)2
8 ][54687−(653)2
8 ]r=¿0,629531757
Se puede decir que es una relación Baja y positiva que los dos exámenes
tienen entre si
2. Un investigador realiza un estudio de la relación entre el consumo de
cigarros y las enfermedades determinan la cantidad de cigarros fumados
diariamente y de días de ausencia en el trabajo dura último año debido a
una enfermedad para 13 individuos en la compañía donde trabaja este
investigador. Los datos aparecen en la tabla anexa.
SUJETO CIGARROS
CONSUMIDOS
DÍAS DE
AUSENCIA
1
2
3
4
5
6
7
8
9
10
11
0
0
0
10
13
20
27
35
35
44
53
1
3
8
10
4
14
5
6
12
16
10
12 60 16
a. Construya una gráfica de dispersión para estos datos: ¿Se ve una
relación lineal?
b. Calcule el valor de la r de Pearson.
c. Elimine los datos de los sujetos 1, 2, 3, 10, 11 y 12. Esto
disminuye el rango de ambas variables. Vuelva a calcular r para
los sujetos restantes. ¿Qué afecto tiene la disminución del rango
sobre r?
d. A utilizar todo el conjunto de datos, ¿qué porcentaje de la
variabilidad en el número de días de ausencia es explicado por la
cantidad de cigarros fumados diariamente? ¿De qué sirve ese
valor?
0 10 20 30 40 50 60 700
2
4
6
8
10
12
14
16
18
Series2
r=∑ XY−¿¿¿
r=3391−31185
12
√ [12193−(297)2
12 ] [1203−(105)2
12 ]
r=¿ 0,6753
5 10 15 20 25 30 35 400
2
4
6
8
10
12
14
16
Series2
r=∑ XY−¿¿¿
r=1197−7140
6
√ [3842−(140)2
6 ][517−(51)2
6 ]
r=¿ 0,0318
3. Un educador ha construido un examen para las aptitudes mecánicas y
desea determinar si éste es confiable, mediante dos administraciones
con un lapso de 1 mes entre ellas. Se realiza un estudio en el cual 10
estudiantes reciben dos administraciones del examen, donde la segunda
administración ocurre un mes después que la primera. Los datos
aparecen en la tabla.
a. Construya una gráfica de dispersión para las parejas de datos.
b. Determine el valor de r.
c. ¿Sería justo decir que éste es un examen confiable? Explique esto al
utilizar r2.
SUJETO ADMINISTRACIÓ
N 1
ADMINISTRACIÓ
N 2
1
2
3
4
5
6
7
8
9
10
10
12
20
25
27
35
43
40
32
47
10
15
17
25
32
37
40
38
30
49
5 10 15 20 25 30 35 40 45 500
10
20
30
40
50
60
Series2
r=∑ XY−¿¿¿
r=9907−85263
10
√ [9905−(291)2
10 ] [9977−(293)2
10 ]
r=¿ 0,9881
La investigación no es confiable por que los datos son tomados en dos fecha
totalmente distintas
4. Un grupo de investigadores ha diseñado un cuestionario sobre la
tensión, consistente en 15 sucesos. Ellos están interesados en
determinar si existe una coincidencia entre dos culturas acerca de la
cantidad relativa de ajustes que acarrea cada suceso. El cuestionario se
aplica a 300 estadounidenses y 300 italianos. Cada individuo debe
utilizar el evento “matrimonio” como estándar y juzgar los demás eventos
en relación con el ajuste necesario para el matrimonio. El matrimonio
recibe un valor arbitrario de 50 puntos. Si se considera que un evento
requiere de más ajustes que el matrimonio, el evento debe recibir más
de 50 puntos. El número de puntos excedentes depende de la cantidad
de ajustes requeridos. Después de que cada sujeto de cada cultura ha
asignado puntos a todos los eventos, se promedian los puntos de cada
evento. Los resultados aparecen en la siguiente tabla:
EVENTOS ESTADOUNIDENSES ITALIANOS
Muerte de la esposa
Divorcio
Separación de la pareja
Temporada en prisión
Lesiones personales
Matrimonio
Despedido del trabajo
Jubilación
Embarazo
Dificultades sexuales
Reajustes económicos
Problemas con la familia
política
Problemas con el jefe
Vacaciones
Navidad
100
73
65
63
53
50
47
45
40
39
39
29
23
13
12
80
95
85
52
72
50
40
30
28
42
36
41
35
16
10
a. Suponga que los datos tienen al menos una escala de intervalo y
calcule la correlación entre los datos estadounidenses y la de los
italianos.
b. Suponga que los datos sólo tienen una escala ordinal y calcule la
correlación entre los datos de ambas culturas.
0 20 40 60 80 100 1200
102030405060708090
100
Series2
r=∑ XY−¿¿¿
r=39766− 491992
15
√ [39391−(691)2
15 ][42644−(712)2
15 ]
r=¿ 0,8519
La r es alta y positiva es decir que los comportamiento de las dos
nacionalidades son bastante similares
INDIVIDUO EXÁMEN CON LÁPIZ
Y PAPEL
SIQUIATRA
A
SIQUIATRA
B
1
2
3
4
5
6
7
8
9
10
11
12
48
37
30
45
31
24
28
18
35
15
42
22
12
11
4
7
10
8
3
1
9
2
6
5
9
12
5
8
11
7
4
1
6
2
10
3
5. Un psicólogo ha construido un examen lápiz - papel, a fin de medir la
depresión. Para comparar los datos del examen con los datos de los
expertos, 12 individuos “con perturbaciones emocionales” realizan el
examen lápiz – papel. Los individuos también son calificados de manera
independiente por dos siquiatras, de acuerdo con el grado de depresión
determinado por cada uno como resultado de entrevistas detalladas. Los
datos aparecen a continuación. Los datos mayores corresponden a una
mayor depresión.
a. ¿Cuál es la correlación entre los datos de los dos siquiatras?
b. ¿Cuál es la correlación entre las calificaciones del examen con
lápiz y papel y los datos de cada siquiatra?
0 2 4 6 8 10 12 140
2
4
6
8
10
12
14
Series2
r=∑ XY−¿¿¿
r=628−650
12
√ [650−(78)2
12 ] [650−(78)2
12 ]
r=¿ 0,8519
La relación se da con un mismo criterio por los psiquiatras
10 15 20 25 30 35 40 45 500
2
4
6
8
10
12
14
Series2
r=∑ XY−¿¿¿
r=2729−29250
12
√ [12941−(375)2
12 ][650−(78)2
12 ]r=¿ 0,6973
La relación entre las dos variables es baja y positiva
10 15 20 25 30 35 40 45 500
2
4
6
8
10
12
14
Series2
r=∑ XY−¿¿¿
r=2729−29250
12
√ [12941−(375)2
12 ][650−(78)2
12 ]r=¿ 0,697
6. Para este problema, suponga que usted es un psicólogo que labora en
el departamento de recursos humanos de una gran corporación. El
presidente de la compañía acaba de hablar con usted acerca de la
importancia de contratar personal productivo en la sección de
manufactura de la empresa y le ha pedido que ayude a mejorar la
capacidad de la institución para hacer esto. Existen 300 empleados en
esta sección y cada obrero fabrica el mismo artículo. Hasta ahora, la
corporación sólo ha recurrido a entrevistas para elegir a estos
empleados. Usted busca bibliografía y descubre dos pruebas de
desempeño, lápiz – papel, bien estandarizadas, y piensa que podrían
estar relacionados con los requisitos desempeño de esta sección. Para
determinar si alguna de ellas se puede utilizar como dispositivo de
selección, elige 10 empleados representativos de la sección de
manufactura, garantizando que un amplio rango de desempeño quede
representado en la muestra, y realiza las dos pruebas con cada
empleado. Los datos aparecen en la siguiente tabla.
Mientras mayor sea la calificación, mejor será el desempeño. Las
calificaciones de desempeño en el trabajo. Las calificaciones de
desempeño fabricados por cada empleado por semana, promediados
durante los últimos 6 meses.
a. Construya una gráfica de dispersión del desempeño en el trabajo
y la primera prueba, utilizando la prueba 1 como la variable X.
¿Parece lineal la relación?
b. Suponga que la relación anterior es lineal y calcule el valor de la r
de Pearson.
c. Construya una gráfica de dispersión del desempeño en el trabajo
y la segunda prueba, utilizando la prueba 2 como la variable X.
¿Parece lineal la relación?
d. Suponga que la relación anterior es lineal, calcule el valor de la r
de Pearson.
e. Si sólo pudiera utilizar una de las pruebas para la selección de los
empleados, ¿utilizaría alguna de ellas? En tal caso, ¿cuál de
ellas? Explique.
EMPLEADO 1 2 3 4 5 6 7 8 9 10Desempeño en el trabajo 50 74 62 90 98 52 68 80 88 76
Examen 1 10 19 20 20 21 14 10 24 16 14Examen 2 25 35 40 49 50 29 32 44 46 35
8 10 12 14 16 18 20 22 24 260
20
40
60
80
100
120
Series2
r=∑ XY−¿¿¿
r=12804−123984
10
√ [3026−(168)2
10 ] [56772−(738)2
10 ]
r=¿ 0,5917
20 25 30 35 40 45 50 550
20
40
60
80
100
120
Series2
r=∑ XY−¿¿¿
r=29542−284130
10
√ [15493−(385)2
10 ] [56772−(738)2
10 ]
r=¿ 0,9076
Análisis
El trabajo realizado acerca de cómo realizar calcular la correlación y relación
lineal se analizado que es un método el cual permite comparar e interpretar
resultados a través de la recolección de datos de cualquier institución con el
objetivo de llegar a establecer deducciones.
Conclusión.
Al realizar el trabajo permite que cada uno de nosotros tenga conocimientos
claros acerca de la correlación y relación lineal para poner en práctica en los
problemas que se presentan el mundo en especial de comercio exterior,
ayudan a interpretar datos en forma resumida los datos planteados y a dar
solución al problema.
Recomendación
El tema de investigación es de mucha relevancia porque la correlación y
relación lineal nos permiten determinar un promedio de algunos datos
estadísticos, tomando variables correspondientes para la interpretación de los
datos.
Lincografía.
www.profesorenlinea.cl/.../EstadisticaMediaMedianaModa.htm
Cronograma
Actividades Abril
días2
1
2
2
2
3
2
4
Definición
del tema x
Problema de
investigación x
Objetivos x
Justificación
de la
investigación
x
Marco
Referencialx
Aspectos
metodológic
os
x x
Pres. Proy. X
Recursos
PRESUPUESTO
Trabajo
CANTID
ADValor
unitarioPRESUPUESTO
PAPEL 20 0,02 0,40IMPRESIÓN 20 0,06 1,20INTERNET 2 0,5 1,00TOTAL 2.60
DESARROLLO DE EJERCICIOS HIPOTESIS
1.- El banco de préstamos estudia la relación entre ingreso (X) y de ahorros (Y)
mensuales de sus clientes.
Meses 1 2 3 4 5 6 7 8 9
Ingresos 350 400 450 500 950 850 700 900 600
Ahorro 100 110 130 160 350 350 250 320 130
a) Determinar la ecuación lineal de las dos variables.
y=a+bx
y=−73,89+0.45 x
b) Trace el diagrama de dispersión en el plano cartesiano
300 400 500 600 700 800 900 10000
50
100
150
200
250
300
350
400
f(x) = 0.451626016260163 x − 74.9186991869919R² = 0.926205705264043
Ingresos
Ahor
ros
c) Estime el ingreso que corresponde a un ahorro semanal de 90 dólares.
y=−73,89+0.45 x
y=−73.89+0.45 (90 )=−33.39
d) Si el ahorro es de 200 dólares que gasto puede realizar el obrero en
dicha semana.
y=−73.89+0.45 x y=−73.89+0.45 (200 )=16.11
e) Si el ingreso es de 350 dólares cual es el salario.
y=−73.89+0.45 x
350=−73.89+0.45 x
x=350+73,890,45
x=941,97
Desarrollo
MesesIngresos(X)
Ahorros (Y) X2 Y 2 X*y (X−Ẍ )2 (Y−Ӯ )2
1 350 100 122500 10000 35000 80277,78 12345,682 400 110 160000 12100 44000 54444,44 10223,463 450 130 202500 16900 58500 33611,11 6579,014 500 160 250000 25600 80000 17777,78 2612,35
5 950 350902500 122500 332500
100277,78 19290,12
6 850 350 722500 122500 297500 46944,44 19290,127 700 250 490000 62500 175000 4444,44 1512,358 900 320 810000 102400 288000 71111,11 11856,799 600 130 360000 16900 78000 1111,11 6579,01
5700 1900402000
0 491400138850
0410000,0
0 90288,89
∑X ∑Y
∑X 2
∑Y 2
∑X∗Y
∑ (X−Ẍ )2
∑ (Y−Ӯ )2
Primer caso
Yr=Y +r ( sysx ) x−r ( sysx ) x
X=∑ x1n
=57009
=633.33
Y=∑ y1n
=19009
=211.11
r=n∑ xy−∑ x∑ y
√¿¿¿
r=9 (1388500 )−(5700)(1900)
√¿¿¿
r= 1666500
√3690000∗812600=16665001731616
=0.96
sx=√∑ ¿¿¿¿
sx=√ 4100009=213.44→desviacion standar
s x2=¿
sy=√∑ ¿¿¿¿
sy=√ 90288,899=100,16→desviacionstandar
s y2=¿
Yr= y+r ( sysx ) x−r ( sysx ) x
Yr=211.11+0.96 ( 100,16213,44 ) x−0.96 ( 100,16213,44 )633,33
Yr=211,11+0,45 x−285,31
Yr=−74,2+0,45x
2.- Un comerciante mayorista encargo un estudio para determinar la relación
entre los gastos de publicidad semanal por radio y las ventas de sus productos.
En el estudio se obtuvieron los siguientes resultados.
Semana 2 3 4 5 6 7 8 9 10 11
Gasto de Publicidad ($) 30 20 40 30 50 70 60 80 70 80
Venta ($) 300 250 400 - 550 750 630 930 700 840
En la quinta semana por diversos motivos no se pudo hacer el estudio
a) Determine la ecuación de regresión de ventas sobre gastos de
publicidad
Meses
Gastos publicidad (X)
Ventas (Y)
X2 Y 2 X*y (X−Ẍ )2 (Y−Ӯ )2
1 30 300 900 90000 9000 653,09 86697,53
2 20 250400 62500 5000 1264,20
118641,98
3 40 400 1600 160000 16000 241,98 37808,644 50 550 2500 302500 27500 30,86 1975,315 70 750 4900 562500 52500 208,64 24197,536 60 630 3600 396900 37800 19,75 1264,20
7 80 9306400 864900 74400 597,53
112597,53
8 70 700 4900 490000 49000 208,64 11141,989 80 840 6400 705600 67200 597,53 60297,53
500 5350 31600 3634900 338400 3822,22454622,2
2
∑X ∑Y
∑X 2
∑Y 2
∑X∗Y
∑ (X−Ẍ )2
∑ (Y−Ӯ )2
Primer caso
Yr= y+r ( sysx ) x−r ( sysx ) x
X=∑ x1n
=5009
=55,55
Y=∑ y1n
=53509
=594,44
r=n∑ xy−∑ x∑ y
√¿¿¿r=9¿¿
r= 370600
√(34400)(4091600)
r= 370600375168,02
=0.99
¿√∑ ¿¿¿¿
sx=√ 3822,229=20,61→desviacion standar
s x2=¿sy=√∑ ¿¿¿¿
sy=√ 454622,229=224,75→desviacionstandar
s y2=(224,75)=50512,56→varianza
Yr=594,44+0.99( 224,7520,61 )x−0.99 ( 224,7520,61 )55,55Yr=594,44+10,79 x−599,71
Yr=−5,27+10,79 x
r=n∑ xy−∑ x∑ y
√¿¿¿
r=9¿¿
r= 370600
√(34400)(4091600)
r= 370600375168,02
=0.99
b. Estime la cosecha si se aplica 12 sacos de fertilizantes.
10 20 30 40 50 60 70 80 900
100200300400500600700800900
1000
Gastos
Vent
as
a) Determina el coeficiente de determinación. De su comentario sobre este
valores
Yr=−5,27+10,79 x
yr= -5,27 + 10,79(30)
yr= 318,43
3.- Se obtuvieron los siguientes datos para determinar la relación entre cantidad
de fertilizante y producción de papa por hectárea.
Sacos de fertilizante por hectárea 3 4 5 6 7 8 9 10 11 12
Rendimiento en quintales 45 48 52 55 60 65 68 70 74 76
a) Encuentre la ecuación de regresión de la cosecha sobre el fertilizante,
por el método de mínimos cuadrados.
Y=a+bx
a=Y−b X
b=n∑ xiyi−∑ xi∑ yi
n∑ X i2−¿¿¿
Periodo
Sacos de fertilizantes X
Rendimiento en quinta (Y) X2 Y 2 X*y (X−Ẍ )2 (Y−Ӯ )2
1 3 45 9 2025 135 20,25 265,692 4 48 16 2304 192 12,25 176,893 5 52 25 2704 260 6,25 86,494 6 55 36 3025 330 2,25 39,695 7 60 49 3600 420 0,25 1,696 8 65 64 4225 520 0,25 13,697 9 68 81 4624 612 2,25 44,898 10 70 100 4900 700 6,25 75,699 11 74 121 5476 814 12,25 161,2910 12 76 144 5776 912 20,25 216,09
75 613 645 38659 4895 82,50 1082,10
∑X ∑Y
∑X 2
∑Y 2
∑X∗Y
∑ (X−Ẍ )2
∑ (Y−Ӯ )2
x=∑ xi
n
x=7510
=7,5
y=∑ yi
n
y=61310
=61,3
b=10 (4895 )−(75 ) (613 )10 (645 )−(75 )2
b=48950−459576450−5625
b=2993825
=3,63
a=61,3−3,63 (7,5 )=34,07
y=34,07+3,63 x
b. Estime la cosecha si se aplica 12 sacos de fertilizantes ¿Cuánto es el error o
residual?
y=34,07+3,63 x
y=34,07+3,63 (12 )=77.63-76=1.63 es el error.
b) Determina el coeficiente de determinación. De su comentario sobre este
valores
r=N ¿¿
r=10 (4895 )−(75 )(613)
√¿¿¿
r= 48950−45975√ (6450−5625 )(386590−375769)
r= 2975
√ (825 )(10821)
r= 2975
√ (8927325 )
r= 29752987,86
r=0,75
4.- El número de horas de estudio invertidas y las calificaciones finales en un
curso de matemáticas de una muestra 10 alumnos ha dado los siguientes
resultados:
Alumno A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 Horas de estudio 14 16 22 20 18 16 18 22 10 8Calificación 12 13 15 15 17 11 14 16 8 5
a) Determine la recta de regresión de la calificación sobre el número de
horas de estudio invertidos. Interprete la ecuación de regresión.
Alumno
Horas de estudio X
Calificación (Y) X2 Y 2 X*y (X−Ẍ )2 (Y−Ӯ )2
1 14 12 196 144 168 5,76 0,362 16 13 256 169 208 0,16 0,163 22 15 484 225 330 31,36 5,764 20 15 400 225 300 12,96 5,765 18 17 324 289 306 2,56 19,366 16 11 256 121 176 0,16 2,567 18 14 324 196 252 2,56 1,968 22 16 484 256 352 31,36 11,569 10 8 100 64 80 40,96 21,16
10 8 5 64 25 40 70,56 57,76164 126 2888 1714 2212 198,40 126,40
∑X ∑Y
∑X 2
∑Y 2
∑X∗Y
∑ (X−Ẍ )2
∑ (Y−Ӯ )2
X=∑ X iN
X=16410
X=16,4
Y=∑Y iN
Y=12610
Y=12,6
SXY=∑ XY
n– XY
SXY=221210
−(16,4)(12,6)
SXY=221,2−206,64
SXY=14,56
SX=√∑ (X i−X )2
N
SX=√ 198,4010}
SX=4,45
SX 2=19,84
b=SXYSX 2
b=14,5619,84
b=0,734
a=Y−b X
a=12,6−0,73(16,4)
a=0,565
Y=a+bx
Y=0,565+0,734 x
5.- Una muestra de 60 de las 350 agencias de ventas de automóviles de una
importadora registrada en un mes con X (autos vendidos por agencia), Y
(ventas en miles de dólares) ha dado los siguientes resultados:
x=10 , y=10 , ∑ x2=7000 ,∑ y2=42000 , ∑ xy=8000
a) Determine la ecuación de regresión: Y=a+bX
sxy=∑ xy
n−x y
sxy=800060
−10∗20=−66.67
s x2=∑ x2
n−¿
s x2=700060
−¿
b= sxys x2
=−66.6716.67
=−4
a= y−bx
a=20−(−4 ) (10 )=60
Ecuación
y=a+bx
y=60−4 x
b) Calcule el coeficiente de terminación ¿Qué porcentaje de la variación
total es explicada por la regresión?
y=∑ y
n
∑ y= y n
∑ y=20∗60=1200
x=∑ x
n
∑ x=xn
∑ x=10∗60=600
r=n∑ xy−∑ x∑ y
√¿¿¿
r=60 (8000 )−(600)(1200)
√¿¿¿
r= −240000254358.44
=−0,94
6.- Los contadores con frecuencia estiman los gastos generales basados en el
nivel de producción. En la tabla que sigue se da la información recabada sobre
gastos generales y las unidades producidas en 10 plantas y se desea estimar
una ecuación de regresión para estimar gastos generales futuros.
Gastos generales ($)
300
1000
1100
1200 600 800 900 500 400 200
Unidades producidas 15 45 55 75 30 40 45 20 18 10
a) Determine la ecuación de regresión y haga un análisis del coeficiente de
regresión.
Periodos
Gasto generales X
Unidades producidas (Y) X2 Y 2 X*y (X−Ẍ )2 (Y−Ӯ )2
1 300 15 90000 225 4500 160000,00 412,09
2 1000 45100000
0 2025 45000 90000,00 94,09
3 1100 55121000
0 3025 60500 160000,00 388,09
4 1200 75144000
0 5625 90000 250000,00 1576,095 600 30 360000 900 18000 10000,00 28,096 800 40 640000 1600 32000 10000,00 22,097 900 45 810000 2025 40500 40000,00 94,098 500 20 250000 400 10000 40000,00 234,099 400 18 160000 324 7200 90000,00 299,2910 200 10 40000 100 2000 250000,00 640,09
7000 353600000
0 1624930970
01100000,0
0 3788,10
∑X ∑Y
∑X 2
∑Y 2
∑X∗Y
∑ (X−Ẍ )2
∑ (Y−Ӯ )2
X=∑ X iN
X=7 00010
X=700
Y=∑Y iN
Y=35310
Y=35,3
SXY=∑ XY
n– X∗Y
SXY=30970010
−(700)(35,3)
SXY=30970−24710
SXY=6260
SX=√∑ (X i−X )2
N
SX=√ 110000010
SX=331,66
SX 2=109998,36
b=SXYSX 2
b= 6260109 998,36
b=0,06
a=Y−b X
a=35,3−0,06(700)
a=−6,7
Y=a+bx
Y=−6,7+0,06 x