regresion lineal

2
Respecto a su valor medio y. Por otra parte, el primer sumando del segundo término es la variación no explicada (VNE) por la recta de regresión, representando la variación de los datos, o residuos, alrededor de Dicha recta. Al ´ultimo sumando se le llama variación explicada (VE), ya que es la parte de la variación total que se explica por la recta ajustada. De esta forma, la variación total se descompone en dos variaciones, no explicada y explicada por la recta de regresión V T = V NE + V E (17.22) Introduciendo la expresión (17.21) en la relación (17.20) para el coeficiente de correlación, se llega a Es decir, r2, conocido como coeficiente de determinación, puede interpretarse como la fracción de la variación total que se explica por la recta de regresión. Así, un coeficiente de correlación próximo a ±1indica que casi todas las variaciones encontradas en y son explicadas por la recta (teniéndose una buena correlación), mientras que si r es 0, la recta de regresión apenas sirve para explicar las variaciones y la correlación lineal será pobre. Como ejemplo, si r = 0.95, podemos deducir que aproximadamente el 90% de las variaciones de y son debidas a la regresión lineal. Aunque el análisis de la regresión lineal y la derivación del coeficiente de correlación parecen un método muy adecuado para estudiar la relación entre dos variables, hay que indicar que tiene importantes debilidades. En particular: Tanto la recta de regresión como el coeficiente de correlación no son robustos, en el sentido de que resultan muy afectados por medidas particulares que se alejen mucho de la tendencia general. No hay que olvidar que el coeficiente de correlación no es más que una medida resumen. En ningún caso puede substituir al diagrama de dispersión, que siempre habrá que construir para extraer más información. Formas muy diferentes de la nube de puntos pueden conducir al mismo coeficiente de correlación.

Upload: cesar-reiker-valdiviezo

Post on 06-Nov-2015

212 views

Category:

Documents


0 download

TRANSCRIPT

Respecto a su valor medio y. Por otra parte, el primer sumando del segundo trmino es la variacin no explicada (VNE) por la recta de regresin, representando la variacin de los datos, o residuos, alrededor deDicha recta. Al ultimo sumando se le llama variacin explicada (VE), ya que es la parte de la variacin total que se explica por la recta ajustada. De esta forma, la variacin total se descompone en dos variaciones, no explicada y explicada por la recta de regresin

V T = V NE + V E (17.22)Introduciendo la expresin (17.21) en la relacin (17.20) para el coeficiente de correlacin, se llega a

Es decir, r2, conocido como coeficiente de determinacin, puede interpretarse como la fraccin de la variacin total que se explica por la recta de regresin. As, un coeficiente de correlacin prximo a 1indica que casi todas las variaciones encontradas en y son explicadas por la recta (tenindose una buena correlacin), mientras que si r es 0, la recta de regresin apenas sirve para explicar las variaciones y la correlacin lineal ser pobre. Como ejemplo, si r = 0.95, podemos deducir que aproximadamente el 90% de las variaciones de y son debidas a la regresin lineal.Aunque el anlisis de la regresin lineal y la derivacin del coeficiente de correlacin parecen un mtodo muy adecuado para estudiar la relacin entre dos variables, hay que indicar que tiene importantes debilidades.En particular:

Tanto la recta de regresin como el coeficiente de correlacin no son robustos, en el sentido de que resultan muy afectados por medidas particulares que se alejen mucho de la tendencia general.

No hay que olvidar que el coeficiente de correlacin no es ms que una medida resumen. En ningn caso puede substituir al diagrama de dispersin, que siempre habr que construir para extraer ms informacin. Formas muy diferentes de la nube de puntos pueden conducir al mismo coeficiente de correlacin.

El que en un caso se obtenga un coeficiente de correlacin bajo no significa que no pueda existir correlacin entre las variables. De lo nico que nos informa es de que la correlacin no es lineal (no se ajusta a una recta), pero es posible que pueda existir una buena correlacin de otro tipo.

Un coeficiente de correlacin alto no significa que exista una dependencia directa entre las variables. Es decir, no se puede extraer una conclusin de causa y efecto basndose nicamente en el coeficiente de correlacin. En general hay que tener en cuenta que puede existir una tercera variable escondida que puede producir una correlacin que, en muchos casos, puede no tener sentido.