regresion

21
 L e  r o n 2 5.2 Reg r esión Las t é cnicas d e regresión e s un proceso que perm i te hace r predicciones sobre los valores de cie rta variab le Y a partir de los de o t ra X ent re las q ue se i ntuye queexiste una re laci ón. Para il ustrar mej ora l lect or por e je mplo si se compara la esta turam edia en centímetr os en el eje X y la estatura media en met ros en el eje Y al obs e rvar a un grupo de personas, no esnecesa rio hac e r gr andes esfuer zo s para saber que la relación que hay entre ambas es: y = X / 100 Encambio e sta r el ac n senc il la puede s e r más compleja, si por e jemplo se compara n e stas misma s personas colocando e n el e je X a la estatura m edia e n cent ímet r os y en el eje Y el peso en ki l ogramos. E s ta rel a ción requiere de un a nál isis y solo después del mi smo s e puede concluir: y = ± La razón es que no es cierto que con cida la a l tura de un ind i viduo, no puede deter- minar su peso exacto, s i dos pe rsona s que miden 1 7 0 cm pueden tener pesos d e 60 y 65 k ilos. Sin emb argo, algun a rel aci ón entre ellas debe existir, pues parece mucho más 1 20 3 11 1

Upload: camilo-torres-medina

Post on 05-Nov-2015

9 views

Category:

Documents


0 download

DESCRIPTION

regresion

TRANSCRIPT

  • L e e e ro n 2

    5.2 RegresinLas tcnicas de regresin es un proceso que permite hacer predicciones sobre los

    valores de cierta variable Y (dependiente), a partir de los de otra X (independiente),entre las que se intuye que existe una relacin.

    Para ilustrar mejor al lector por ejemplo si se compara la estatura media en centmetrosen el eje X y la estatura media en metros en el eje Y al observar a un grupo de personas, noes necesario hacer grandes esfuerzos para saber que la relacin que hay entre ambas es:

    y = X / 100

    En cambio esta relacin sencilla puede ser ms compleja, si por ejemplo se comparanestas mismas personas colocando en el eje X a la estatura media en centmetros y enel eje Y el peso en kilogramos. Esta relacin requiere de un anlisis y solo despus delmismo se puede concluir:

    y = X - 110 error

    La razn es que no es cierto que conocida la altura de un individuo, no puede deter-minar su peso exacto, si dos personas que miden 170 cm pueden tener pesos de 60 y65 kilos. Sin embargo, alguna relacin entre ellas debe existir, pues parece mucho ms

    1203111

  • ESTADSTICA 11

    probable que un individuo de 200 cm pese ms que otro que mida 120 cm. Es ms, deacuerdo a lo mencionado, la conclusin Y = X - 110 error, parece acertada.

    A la relacin entre dos o ms variable a partir de una serie de datos, se le denominaRegresin.

    Cuando la relacin esta dada por: Y = f(x)

    Se le denomina Relacin Funcional y el criterio para construir Y, es que la diferenciaentre Y e Y sea pequea; es decir, que el error de estimacin sea pequeo.

    y = f(x), y - y = error

    La Relacin Funcional puede tambin ser a la inversa, es decir que X estn en funcinde Y; pero este tipo de relacin no se ver en este Manual Auto Instructivo.

    Cuando se utilizan solamente dos variables, la Regresin es denominada SIMPLE; encambio, cuando se utilizan ms de dos variables, la Regresin es MULTIPLE.

    5.2.1 Ajuste en una funcin de regresin simple

    Significa buscar o definir la funcin que exprese con mayor precisin la relacin entrevariables. Grficamente ser aquella funcin que mejor se adecu a la nube de puntos. Eneste sentido, es recomendable como primer paso construir el "diagrama o nube de puntos",luego analizar su forma y decidir el tipo de funcin matemtica para la lnea de regresin.

    Analticamente, la relacin Y = f(x). permite obtener valores estimados Y a partir delos valores reales de X, entonces el problema del ajuste de una funcin es que la dife-rencia o sesgo (e.) entre los valores reales de Y y los estimados Y sea mnimo, para cadavalor se tendra: ~ = Y-Y. Entonces se trata de un problema de minimizacin, el mismoque se resuelve con el Mtodo de los Mnimos Cuadrados.

    El ajuste de funciones de regresin simple, se pueden utilizar diversas funcionesmatemticas conocidas, tales como:

    La Lnea Recta Y= a + bX La Parbola Y= a + bX + CX2 La Curva Potencial Y = ex- La Curva Exponencial Y= abX La Hiprbola Equiltera : Y = a/X La Curva Logstica l/y = a + bcx La Curva Gompertz Y = ab=

    Cada una de estas funciones tiene una forma particular para un conjunto determinadode valores (X, Y), Y definido por el valor de los parmetros o coeficientes de la respecti-va ecuacin. Por una nube de puntos pueden pesar una infinidad de lneas o funciones,de esta familia habr una que es la funcin que mejor se ajusta a la nube de puntos.

    12041

  • W A L TE R e s P E D E S RA M R EZ

    La operacin para determinar la funcin de regresin ptima, se conoce como "Ajus-te de una funcin de regresin", En este Manual se tratar solamente de Regresinsimple para la recta y para la parbola, que son las ms usadas por tener mayor aplica-cin estadstica en los negocios,

    El problema de ajuste de una funcin de regresin a un conjunto de n valores (X, Y),comprende tres pasos:

    1 Graficar el diagrama de esparcimiento o una nube de puntos (X, Y).

    2 Definir la forma de la funcin de regresin (recta, parbola, exporiencial, etc.).

    3 Determinar el valor numrico de los parmetros de la funcin elegida. Losparmetros de la funcin de regresin se obtienen a partir de las Ecuaciones Normalesobtenidas por el Mtodo de los Mnimos Cuadrados.

    5.2.2 El mtodo de Los mnimos cuadrados

    Establece que la mejor recta o curva posible es aquella que minimiza la suma de loscuadra~os de las desviaciones entre los puntos dados V y los correspondientes a dichacurva Y.

    I e2 = I (V -\IV = Error MnimoDonde Y = f(X), es la ecuacin elegida para la funcin de regresin; sin embargo, no

    es suficiente con elegir la funcin de regresin, por que en la nube de datos se puedentrazar en diferentes formas la misma funcin con el mismo error de clculo. Por estarazn se busca a aquel trazo de la funcin que al ser elevado el error al cuadrado, d elmnimo error.

    Con el mtodo de Mnimos cuadrados se logra calcular los parmetros de la ecuacinelegida (Recta, Parbola, etc.). Tambin con los mismos parmetros, se pueden hallarlos coeficientes de correlacin respectivos.

    5.2.3 Regresin lineal simple

    A la regresin lineal se le conoce como Regresin de la Recta, la que se define de lasiguiente manera:

    v = a + b (X) e

    A partir de esta definicin; se puede estimar el valor de "Y", no considerando elerror:

    y = a + b (X)

    a20S.

  • ESTADSTICA 11

    En la ecuacin, los parmetros son:

    a = Origen (Es el valor de Y, cuando X = O)

    b = Pendiente (Es la variacin constante positiva o negativa de Y , por cada valorque cambie X)

    Tales parmetros, como ya se ha mencionado en el tem anterior, se calcularn uti-lizando el mtodo por Mnimos Cuadrados, que se define basado en la ecuacin de larecta, de la siguiente manera:

    I Y = a(n) + b IX

    IXY = a IX + b IX2Para hallar los parmetros respectivos (a y b), basados en el mtodo de clculo por

    Mnimos Cuadrados, el alumno puede utilizar cualquiera de las siguientes soluciones:

    a) Solucin por eliminacin de uno de los parmetros para encontrar el otro:

    Para este caso utilizan las ecuaciones simultaneas, en donde con un valor artificialnegativo se iguala el coeficiente de una de las incgnitas de la ecuacin para eliminarlo.Operacin que se repite hasta quedarse con una incgnita, que es fcil de despejar enuna ecuacin.

    b) Solucin a travs de matrices y determinantes, que concluyen en:

    L:y;x2 - L:XYL:Xa = _nL:X2-L:XL:X

    b = nL:XY - L:XL:YnL:X 2 - L:XL:X

    e) Solucin a travs de las medias, que concluye en:

    a = y - b X b = [ (:XY - n X Y ) / (X - nX 2) ]

    12061

  • [1

    I L

    l

    WAL TER CSPED ES RAM REZ

    Ejercicios resueltos

    1) Hallar la ecuacin de la recta con las variables: X (nmero de vendedores) e Y(valor de ventas realizadas al mes en miles).

    La informacin que se tiene es la siguiente:

    Nmero de vendedores (X) 10 122 4 5 15 16Ventas en miles (Y) 8,5 9,3 16,4 18,6 20,2 25,26,4

    Solucin:

    Con el mtodo por Mnimos cuadrados, se primero se calculan las sumatoriascorrespondientes a la ecuacin de la recta:

    X V XV X2

    2 6,4 12,8 44 8,5 34,0 165 9,3 46,S 25

    10 16,4 164,0 100

    12 18,6 223,2 14415 20,2 303,0 22516 25,2 403,2 256

    11: 64 104,6 1186,7 770

    Con estos datos para hallar los parmetros "a" y "b", el alumno puede escogercualquiera de las soluciones planteadas por el mtodo por Mnimos Cuadrados:

    a) Solucin por eliminacin:

    1o Se reemplazan las sumatorias halladas en las ecuaciones simultneas definidaspor el mtodo Mnimos Cuadrados:

    1: V = a(n) + b 1:X 104,6 = 7a + 64b (1)1:XV = a 1:X + b 1:X2 1186 = 64a + 770b (2)

    20 Se elimina "a" multiplicando la ecuacin (1) por - 64 Y la ecuacin (2) por 7

    ( 104,6 = 7a + 64b) - 64 - 6694,4 = ~-4096b (3)(1186,7 = 64a + 770b) 7 8306,9 = .448 + 5390b (4)

    1612,S = 1294b

    Entonces: b = 1612,S / 1294 = 1,25

    12071

  • ESTADSTICA 11

    3 Hallado "b" se reemplaza este valor en la ecuacin (1):

    104,6 = 7a + 64 (1,25)Entonces: a = 24,6 /7

    104,6 = 7a + 803,5

    104,6 - 80 = 7a

    4 La ecuacin de la recta ser: Y = 3,5 + 1,25Xb) Solucin por determinantes:

    Aqu se reemplazan las sumatorias en las frmulas siguientes halladas formando ma-trices con las ecuaciones por mnimos cuadrados y resueltas por determinantes:

    a =:TI:X2_~n2:X2-2:XLX =

    104,6(770) -1186,7(64)7(770) - 64(64)

    4593,2

    1294,0 = 3,5

    b = n2:Xl' - 2:X2:Yn2:X 2 - 2:XLX

    b =7(1186,7)-64(104,6) __1612,5 = 1 25,7(770)-64(64) 1294,0

    La ecuacin de la recta ser: Y = 3,5 + 1,25X

    e) Solucin por promedios:

    x = LX / n = 64/7 = 9,14 y LY / n = 104,6/ 7 = 14,94

    b = [ (LXY - n X Y ) / (LX2 - nX 2) ]b = [(1186,7 - (7 x 9,14 x 14(94)) / (770 - (7 x 9(142))]

    b = [(1186,7 - 955(86) / (770 - 584(78)] b = [230,84/ 185,22] 1,25

    a = y - bX = 14,94 - 1,25(9,14) = 14,94 - 11,43 = 3,5

    La ecuacin de la recta ser: Y = 3,5 + 1,25XEl alumno puede ver que por cualquiera de los mtodos de solucin expuestos, la

    respuesta es la misma; pues puede escoger el mtodo que sea ms fcil para usted oel que ms le agrade.

    2) Hallar la ecuacin de la recta con las variables: X (nmero de gastos por inversin)e y (utilidades anuales en miles).

    La informacin que se tiene es la siguiente:

    Nmero de gastos por inversin (X) 5 11 4 5 3 2Utilidades anuales en miles (Y) 31 40 30 34 25 20

    111208&

  • WALTER CSPEDES RAMREZ

    Solucin:

    Con el mtodo por Mnimos cuadrados, se primero se calculan las sumatoriascorrespondientes a la ecuacin de la recta:

    x V XV X25 31 155 25

    11 40 440 121

    4 30 120 16

    5 34 170 25

    3 25 75 9

    2 20 40 4

    I~ 30 180 1000 200Para hallar los parmetros "a" y "b", se ha escogido la solucin por determinantes.

    a = L:YL:X2 -~nL:X2-L:XLX"

    a =180(200)-1000(30)6(200) - 30(30)

    6000 = 20300

    b = nL:XY - L:XL Yn:L:X 2 - L:XLX

    b = 6(1000)-30(180) = 600= 26(200) - 30(30) 300

    La ecuacin de la recta ser: Y = 20 + 2X

    12091

  • ESTADSTICA 11

    Resolver los siguientes ejercicios propuestos sobre Regresin Lineal Simple:

    1) Hallar la ecuacin de la recta con las variables: X (nmero de desaprobados) e Y(nmero de matriculados). La informacin que se tiene es la siguiente:

    Nmero de desaprobados (X) 4 6 6 S 7 10 8 7Nmero de matriculados (Y) 16 20 25 26 30 32 33 33

    Resp: Y = 8,94 + 2,71X2) Hallar la ecuacin de la recta con las variables: X (nmero de gastos por inversin)

    e Y (utilidades anuales en miles). La informacin que se tiene es la siguiente:

    Nmero de gastos por inversin (X) 2 S S 8 10Utilidades anuales en miles (Y) 48,S 95,2 88,3 110,4 115,6

    Resp: Y = 43,33 + 8,04X5.2.4 Regresin de la parbola

    Se conoce a la regresin de la parbola como Regresin Parablica, la que se definede la siguiente manera:

    y = a + b (X) + e (X2) e

    A partir de esta definicin; se puede estimar el valor de "Y", no considerando elerror:

    y = a + b (X) + e (X2)

    En la ecuacin, los parmetros son:

    a = Origen (Es el valor de Y, cuando X = O)

    b = Pendiente (Es la variacin constante positiva (hacia arriba) o negativa (haciaabajo) de Y, por cada valor que cambie X)

    e = Curvatura (es el arco que determina la curva; si es negativo, la curva es convexa,y si es positivo, la curva es cncava.

    Tales parmetros, se calcularn utilizando el mtodo por Mnimos Cuadrados, que sedefine basado en la ecuacin de la parbola, de la siguiente manera:

    :E Y = a (n) + b:EX + e :EX2:EXV = a:EX + b :EX2 + e :EX3:EX2Y = a :EX2 + b :EX3 + e :EX4

    12101

  • WAL TER CSPED ES RAMfREZ

    Para hallar los parmetros respectivos (a, b y c)), basados en el mtodo de clculopor Mnimos Cuadrados, el alumno puede encontrar la solucin por eliminacin de losparmetros en las ecuaciones simultaneas.

    Ejercicios resueltos

    1) Hallar la ecuacin de la parbola con las variables: X (nmero de vendedores) e Y(valor de ventas realizadas al mes en miles).

    La informacin que se tiene es la siguiente:

    Nmero de vendedores (X) 2 4 5 10 12 15 16Valor de ventas realizadas al mes en 6,4 8,5 9,3 16,4 18,6 20,2 25,2

    miles (Y)

    Solucin:

    Con el mtodo por Mnimos cuadrados, se primero se calculan las sumatoriascorrespondientes a la ecuacin de la recta, de la siguiente manera:

    x y XY X2 X3 X4 X2y2 6,4 12,8 4 8 16 25,6

    4 8,5 34,0 16 64 256 136,0

    5 9,3 46,5 25 125 625 232,5

    10 16,4 164,0 100 1000 10000 1640,0

    12 18,6 223,2 144 1728 20736 2678,4

    15 20,2 303,0 225 3375 50625 4545,0

    16 25,2 403,2 256 4096 65536 6451,2

    11: 64 104,6 1186,7 770 10396 147794 15708,7

    Con estos datos para hallar los parmetros "a", "b" y "c", por el mtodo por MnimosCuadrados, se reemplazan las sumatorias respectiva en las frmulas:

    1: Y = a (n) + b 1:X + e 1:X21:XY = a 1:X + b 1:X2 + e 1:X31: X2Y = a 1:X2 + b 1:X3 + e 1:X4

    104,6 = 7a + 64b + 770c (1)1186,7 = 64a + 770b + 10396c (2)

    1 5708,7 = 770a + 10396b + 147794c (3)

    121 11

  • ESTADSTICA 11

    1 Se elimina "a" de las ecuaciones (1) y (2)

    104,6 = 7a + 64b + 770c (- 64)1186,7 = 64a + 770b + 10396c (7)

    - 6694,4 = -448a - 4096b - 49280c8306,9 = 448a + 5390b + 72772c1612,5 1294b + 23492c (4)

    2 Se elimina "a" de las ecuaciones (1) y (3)

    104,6 = 7a + 64b + 770c (- 64)1186,7 = 64a + 770b + 10396c (7)

    - 6694,48306,9

    =~8a - 4096b - 49280c= 44 + 5390b + 72772c,

    612,5 1294b + 23492c (4)

    3 Se elimina "b" de las ecuaciones (4) Y (5)

    -~664b - 78839152c

    4342~ + 81643636c1612,5 = 1294b + 23492c (-3356)4202,7 = 3356b + 63094c ( 1294)

    -5411550,0 =

    5438293,8 =

    26743,8 = 2804484c

    e = 26743,8 / 2804484 = 0,00954 Se reemplaza "c" en la ecuacin (4)

    1612,5 = 1294b + 23492 (0,0095)1294b = 1612,5 - 223,174

    1612,5 = 1294b + 223,1741294b = 1389,326

    b = 1389,326 / 1294 = 1,075 Se reemplaza "b" y "c" en la ecuacin (1)

    104,6 = 7a + 64(1,07) + 770(0,0095)7a = 104,6 - 68,48 - 7,315 = 28,805

    104,6 = 7a + 38,48 + 7,315

    a = 28,805/ 7 = 4,115La ecuacin de la parbola ser: Y = 4,115 + 1,07X + 0,0095X2Resolver los siguientes ejercicios propuestos sobre Regresin de la Parbo-

    la:

    1) Hallar la ecuacin de la parbola con las variables: X (nmero de desaprobados) ey (nmero de matriculados).

    La informacin que se tiene es la siguiente:

    Nmero de desaprobados (X) I 4 ==12121

  • WAL TER CSPED ES RAMREZ

    Nmero de matriculados (Y)

    2) Hallar la ecuacin de la parbola con las variables: X (nmero de gastos porinversin) e Y (utilidades anuales en miles).

    La informacin que se tiene es la siguiente:

    Nmero de gastos por inversin (X) 2 5 5 8 10Utilidades anuales en miles (Y) 48,S 95,2 88,3 110,4 115,6

    Resp: Y = 9,28 + 22,15X - 1,16X2

    12131

  • L e e e ro n 3

    5.3 CorrelacinEs la relacin existente entre las variables que se investigan. Cuando se utilizan so-

    " lamente dos variables, la Correlacin de Pearson es denominada SIMPLE; en cambio,cuando se utilizan ms de dos variables, la Correlacin es MULTIPLE.

    El valor del ndice de correlacin vara en el intervalo [-1, +1]:

    1 Si r = O, no existe relacin entre las variables. Pero esto no necesariamente implicauna independencia total entre las dos variables, es decir, que la variacin de una de ellaspuede influir en el valor que pueda tomar la otra.

    2 Si r = 1, existe una correlacin positiva perfecta. El ndice indica una dependenciatotal entre las dos variables denominada relacin directa; cuando una de ellas aumenta,la otra tambin lo hace en idntica proporcin. Si < r < 1, existe una correlacinpositiva.

    3 Si r = -1, existe una correlacin negativa perfecta. El ndice indica una dependenciatotal entre las dos variables llamada relacin inversa; cuando una de ellas aumenta, laotra disminuye en idntica proporcin. Si -1 < r < O, existe una correlacin negativa.

    12151

  • ESTADSTICA 11

    El signo de la correlacin depende del signo de la pendiente "b": es decir, si la pendientees positiva, la correlacin es positiva; y si la pendiente es negativa, la correlacin esnegativa.

    Suponiendo que se esta investigando dos variables mediante la ecuacin de la recta,pero no se esta conforme con los resultados, entonces decide utilizar la funcin de laparbola. Para determinar cual de las dos funciones matemtica se ajusta mejor a losdatos que se investiga, se calcula el ndice de correlacin para ambas ecuaciones y elvalor ms cercano a 1, determina cual de las dos ecuaciones se ajusta mejor a los datos.

    5.3.1 Esquema de una correlacin de Pearson

    yy

    ~y

    r-------~--------------------y

    L--------------+------------_x

    L (Y - Y)2 = L (Y _y)2 + L (Y - y )2

    Donde:

    L (Y - Y)2L (Y -y )2L (y -Y)2

    : Variacin total: Variacin no explicada: Variacin explicada

    Al correlacionar dos o ms variable, se generan dos tipos de coeficientes que son:

    5.3.1.1 Coeficiente de determinacin (r2)

    r2 = Variacin Explicada _ (Y - y)2Variacin Total - (Y - Y)2

    O tambin:

    r2 = 1- Variacin No Explicada =1- (Y - y)2Variacin Total (Y - Y)2

    12161

  • WAL TER CSP ED ES RAM REZ

    El coeficiente de determinacin es un indicador que nos seala en que proporcin lavariacin de la variable dependiente (Y), puede explicarse por la variacin de la variableindependiente eX).

    Por ejemplo: Y = Ventas X = Publicidad r2 = 82,16%;

    Significa que el 82,16% de las ventas se deben a la publicidad

    5.3.1.2 Coeficiente de correlacin (r)

    r 1- Variacin No Explicada = 1- L:(Y - ~)2Variacin Total L:(Y _ y)2

    r Variacin ExplicadaVariacin Total

    Como habr observado, el coeficiente de correlacin es la raz cuadrada del coeficientede determinacin y es un indicador que nos seala:

    10 En que proporcin se asemejan los valores reales que se investigan con los valorescalculados por la funcin matemtica empleando la misma variable independiente.

    20 Cuando se utilizan las funciones de la recta y de la parbola a la vez, nos dice quefuncin tiene mejor ajuste a los datos.

    Por ejemplo: Y = Ventas X = Publicidad r = 94,64%;

    Significa que existe una relacin directa del 94,64% entre las ventas y la publicidad

    . 5.3.2 Correlacin simple

    Se refiere a la correlacin existente solamente entre dos variables. En esta unidad,nicamente se ver la correlacin lineal y la correlacin de la parbola tal como se hi-ciera con la regresin.

    5.3.2.1 Correlacin lineal simple

    Los coeficientes de la correlacin lineal simple con el mtodo por Mnimos Cuadrados,se definen en forma abreviada de la siguiente manera:

    al Coeficientes de determinacin de la recta

    r2 = aL:Y + bL:XY - ny2L:y2 _ ny2

    12171

  • ESTADSTICA 11

    b) Coeficientes de correlacin de la recta

    aY + bLXY - ny2y2 _ny2r

    Ejercicios resueltos

    1) Hallar los coeficientes de determinacin y de correlacin de la recta, con lasvariables: X (nmero de vendedores) e Y (valor de ventas realizadas al mes en miles).

    La informacin que se tiene es la siguiente:

    Nmero de vendedores (X) 2 4 5 10 12 15 16Valor de venta en miles (Y) 6,4 8,5 9,3 16,4 18,6 20,2 25,2

    Solucin:

    Con el mtodo por Mnimos cuadrados, se primero se calculan las sumatoriascorrespondientes a la ecuacin de la recta:

    x V XV X2 V22 6,4 12,8 4 41,04 8,5 34,0 16 72,3

    5 9,3 46,5 25 86,510 16,4 164,0 100 269,012 18,6 223,2 144 346,015 20,2 303,0 225 408,0

    16 25,2 403,2 256 635,0I~ 64 104,6 1186,7 770 1857,8

    Con las sumatorias se hallan los parmetros "a" y "b" (solucin por determinantes).

    a = lLX2 -LXYLXnU2-LX'LX

    a = 104,6(770)-1186,7(64)7(770) - 64(64)

    4593,2= 3,51294,0

    b = n:LXY - LXLYnX2 -LXLX

    b = 7(1186,7)- 64(104,6) _ 1612,5 = 1 25,7(770)-64(64) 1294,0

    12181

  • I WALTER CSPEDES RAMREZ

    a) Clculo del coeficiente de determinacin:

    r2 = a2:Y + bLXY - ny2 = 3,5(104,6) + 1,25(1186,7) -7(104,6/7)2 = 291,682:y2 _ ny2 1857,8 -7(104,6/7)2 294,68

    0,9898

    b) Clculo del coeficiente de correlacin:

    r = ~O,9898 = 0,9949

    2) Hallar los coeficientes de determinacin y de correlacin de la recta, con las varia-bles: X (nmero de gastos por inversin) e Y (utilidades anuales en miles).

    La informacin que se tiene es la siguiente:

    Nmero de gastos por inversin (X) 5 11 4 5 3 2Utilidades anuales en miles (Y) 31 40 30 34 25 20

    Solucin:

    Con el mtodo por Mnimos cuadrados, se primero se calculan las sumatoriascorrespondientes a la ecuacin de la recta:

    x V XV X2 V25 31 155 25 961

    11 40 440 121 16004 30 120 16 9005 34 170 25 11563 25 75 9 6252 20 40 4 400

    I~ 30 180 1000 200 5642Con las sumatorias se hallan los parmetros "a" y "b" (se utilizar la solucin por

    determinantes).

    a = LITX2

    - LXYLX a = 180(200) -1000 (30) 6000= 20nLX2-LXLX 6(200) - 30(30) 300

    b = nLXY -LXLY b = 6(1000) - 30(180) = 600 = 2nLX2 -LXLX 6(200) - 30(30) 300

    1219;

  • ESTADSTICA 11

    a) Clculo del coeficiente de determinacin

    r2 _aLY +bLXY _ny2 _20(180)+2(1000)-6(180/6)2Ly2 - ny2 5642 - 6(180/6)2

    200 =: 0,8264242

    b) Clculo del coeficiente de correlacin

    r =: .J0,8264 =: 0,9091

    Resolver los siguientes ejercicios propuestos sobre correlacin lineal simple:

    1) Hallar los coeficientes de determinacin y de correlacin de la recta, con lasvariables: X (nmero de desaprobados) e Y (nmero de matriculados).

    La informacin que se tiene es la siguiente:

    Nmero de desaprobados (X) 4 6 6 5 7 10 8 7Nmero de matriculados (Y) 16 20 25 26 30 32 33 33

    Resp: r2 =: 0,5849, r =: 0,7648

    2) Hallar los coeficientes de determinacin y de correlacin de la recta, con las varia-bles: X (nmero de gastos por inversin) e Y (utilidades anuales en miles).

    La informacin que se tiene es la siguiente:

    Nmero de gastos por inversin (X) 2 5 5 8 10Utilidades anuales en miles (Y) 48,5 95,2 88,3 110,4 115,6

    Resp: r2 =: 0,8695, r =: 0,9325

    5.3.2.2 Correlacin de la parbola

    Los coeficientes de la correlacin de la parbola con el mtodo por Mnimos Cuadra-dos, se definen en forma abreviada de la siguiente manera:

    a) Coeficientes de determinacin de la parbola

    r2 =: aLY + bLXY + cX2y - ny2Ly2 _ ny2

    b) Coeficientes de correlacin de la parbola

    aLY +bLXY +cX2y _ny2Ly2 _ ny2

    r

    12201

  • WA.L TER e sPED ES RAM REZ

    Ejercicio resuelto

    Hallar la ecuacin de la parbola con las variables: X (nmero de vendedores) e Y(valor de ventas realizadas al mes en miles).

    Nmero de vendedores (X) 2 4 5 10 12 15 16Valor de ventas en miles (Y) 6,4 8,5 9,3 16,4 18,6 20,2 25,2

    Solucin:

    Con el mtodo por Mnimos cuadrados, se primero se calculan 'las sumatoriascorrespondientes a la ecuacin de la recta:

    x V XV X2 X3 X4 X2V V22 6,4 12,8 4 8 16 25,6 41,04 8,5 34,0 16 64 256 136,0 72,35 9,3 46,S 25 125 625 232,5 86,5

    10 16,4 164,0 100 1000 10000 1640,0 269,012 18,6 223,2 144 1728 20736 2678,4 346,015 20,2 303,0 225 3375 50625 4545,0 408,0

    16 25,2 403,2 256 4096 65536 6451,2 635,0Il: 64 104,6 1186,7 770 10396 147794 15708,7 1857,8

    Los parmetros "a", "b" y ":c:", fueron hallados en el ejercicio 1 del tem 5.2.4correspondiente a la regresin de la parbola y estos son: a = 4,l15;b = 1,07 Yc = 0,0095.

    a) Coeficientes de determinacin (r2):

    r2 = aL:Y + bLXY + cX2y - ny2L:y2 _ ny2

    r2 _4,115(104,6) + 1,07(1186,7) + 0,0095(15708) -7(104,6/7)2 _ 286,41= 0,97191857,8 - 7(104,6/7)2 294,68

    b) Clculo del coeficiente de,correlacin:

    r = ~O,9719 = 0,9858

    ~221.

  • ESTADSTICA I1

    Resolver los siguientes ejercicios propuestos sobre correlacin de la par-bola:

    1) Hallar los coeficientes de determinacin y de correlacin de la parbola, con lasvariables: X (nmero de desaprobados) e Y (nmero de matriculados).

    Nmero de desaprobados (X) 4 6 6 5 7 10 8 7Nmero de matriculados (Y) 16 20 25 26 30 32 33 33

    Resp: r2 = 0,7462, r ~ 0,8638

    2) Hallar los coeficientes de determinacin y de correlacin de la parbola, con lasvariables: X (nmero de gastos por inversin) e Y (utilidades anuales en miles).

    Nmero de gastos por inversin (X) 2 5 5 8 10Utilidades anuales en miles (Y) 48,5 95,2 88,3 110,4 115,6

    Resp: r2 = 0,9904, r = 0,9952

    5.3.3 Correlacin de Spearman (p)

    .Este modelo de correlacin asocia dos variables, es un modelo No Paramtrico que notrabaja con la informacin directa, sino que la trasforma en orden creciente a partir del 1

    En estadstica, el coeficiente de correlacin de Spearman, p (rho), es una medidade la correlacin (la asociacin o interdependencia) entre dos variables aleatorias con-tinuas. La interpretacin de coeficiente de Spearman es igual que la del coeficiente decorrelacin de Pearson. Oscila entre -1 y +1, indicndonos asociaciones negativas opositivas respectivamente. O (cero), significa que no hay correlacin pero no necesaria-mente que no hay independencia.

    Para calcular p, los datos son ordenados y reemplazados por su respectivo orden. Elestadstico p viene dado por la expresin:

    61:,d21-----

    n (n2 -1)Donde:

    d: es la diferencia de comparar el ordenen que quedaron ambas variablesn: es el nmero de parejas entre las dos variables.

    En caso de existencia de datos iguales, se les da el orden que les corresponde ig-norando que son iguales; es decir, como si fueran datos diferentes, luego se saca elpromedio del orden asignado a todos los datos iguales y se les reasigna este promedioa todos ellos.

    E2221

  • WALTER CSPEDES RAMREZ

    Ejercicio resuelto

    Se tiene el Coeficiente de Inteligencia (C.I.) de 10 nios y el nmero de horas queven televisin a la semana (Tv.), mediante la correlacin de Spearman, determine si hayinfluencia de la televisin en la inteligencia de los nios:

    Coeficiente de 106 86 100 100 99 103 97 113 113 110Inteligencia

    Nmero de horas 7 O 28 50 28 28 20 12 7 17de Tv.

    Solucin:

    1 Se ordenan los datos de la primera columna generalmente en forma creciente.2 Se crean dos columnas ms donde se cambia el valor respectivo por el nmero

    de orden que les toc.i

    ~ 3 Finalmente se diferencia el orden de ambas columnas dando lugar a "d", la mismaque es elevada al cuadrado. Ntese que al c.I. = 100 le toca el orden 4 y tambin el 5;

    ~ como este dato est repetido, se le reasigna el promedio de ambos (4 + 5) / 2 = 4,5.

    C.I. Tv. Orden C.I Orden Tv. d d2

    86 O 1 1 O O97 20 2 6 4 1699 28 3 8 5 25

    100 28 4,5 8 3,5 12,25100 50 4,5 10 5,5 30,25103 28 6 8 2 4106 7 7 2,5 4,5 20,25110 17 8 5 3 9113 7 9,5 2,5 7 49113 12 9,5 4 5,5 30,25

    I: 196,00

    p6'L.d2

    1-----n (n2 -1)

    = 1- 6 (196)10 (100 -1)

    1 - 1,1879 = - 0,1879

    12231

  • ESTADSTICA 11

    Interpretacin de los resultados:

    Existe una correlacin no significativa inversa (-18,79%) entre el coeficiente deinteligencia de los nios y las horas que le dedican a la televisin; es decir que mshoras de televisin puede afectar la Inteligencia de los nios.

    Resolver los siguientes ejercicios propuestos sobre Correlacin de Spear-man:

    1) Hallar el coeficiente de de Spearman comparando las edades con ~valuacin:

    Edades 25 16 30 33 45 18Evaluacin 45 82 56 62 80 65

    Resp: - 0,2

    2) Hallar el coeficiente de de Spearman comparando el nmero de vendedores con elvolumen de ventas, que se da a continuacin:

    Nmero de vendedores 5 6 3 3 4 18 10Volumen de ventas (miles) 45 82 16 26 20 650 240

    Resp: 0,9375.

    3) Hallar el coeficiente de de Spearman comparando las tallas con pesos:

    Tallas (cm) 125 145 198 180 174 152 166 182 180 173 162 171Peso (kg) 38 52 77 89 88 45 58 74 70 86 70 70

    Resp: 0,7850

    12241