itc instituto tecnolÓgico de la … · anÁlisis multivariado a travÉs de ecuaciones de...

120
INSTITUTO TECNOLÓGICO DE LA CONSTRUCCIÓN DELEGACIÓN JALISCO MAESTRÍA EN VALUACIÓN INMOBILIARIA E INDUSTRIAL " MÉTODO DE AVALÚO DE BIENES INMUEBLES UTILIZANDO EL ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" TESIS Para Obtener el Grado de Maestro en Valuación Inmobiliaria e Industrial PRESENTA José María Rodríguez Uribe. ASESOR Dr. Arturo Perlasca Lobato Estudios con Reconocimiento de Validez Oficial por parte de la Secretaria de Educación Pública, conforme al acuerdo RVOE SEP No.2003368 de fecha 17 de Diciembre del 2003 ITC

Upload: phungduong

Post on 28-Jul-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

INSTITUTO TECNOLÓGICO DE LA CONSTRUCCIÓN

DELEGACIÓN JALISCO

MAESTRÍA EN VALUACIÓN INMOBILIARIA E INDUSTRIAL

" MÉTODO DE AVALÚO DE BIENES INMUEBLES UTILIZANDO EL ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE

PREDICCIÓN. (Con base al principio de la Red Neural)"

TESIS

Para Obtener el Grado de Maestro en Valuación Inmobiliaria e Industrial

PRESENTA José María Rodríguez Uribe.

ASESOR Dr. Arturo Perlasca Lobato

Estudios con Reconocimiento de Validez Oficial por parte de la Secretaria de Educación Pública, conforme al acuerdo RVOE SEP

No. 2003368 de fecha 17 de Diciembre del 2003

ITC

Page 2: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

AGRADECIMIENTOS:

ADIÓS Por darme de nuevo la oportunidad de concluir otra de mis metas.

A MIS PADRES José María y Ma. Ignacia, que desde el cielo, sé que están contentos por este logro, ya que siempre recibí de ellos el consejo de la superación

A MI ESPOSA: Ma. Dolores, por todo su amor, apoyo y paciencia en la realización de este trabajo.

A MIS HIJOS: A mis tres amores; José María, Niza Fernanda y Miriam Guadalupe, para inculcar en ellos el espíritu de superación, además de ser ellos la razón de mi existir

A MIS HERMANOS: Ma. Cruz, Ma Dolores, Enedina, Juan Ignacio y Héctor Martín, por su amor y confianza y seguir atendiendo lo que nuestros padres siempre nos pidieron Estar siempre unidos

A MIS FAMILIARES: Gisela, Alfonso, Leonardo, Yudany, Benjamín, Gloria, Araceh, por formar con todos ellos una bonita familia.

Page 3: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

DEDICATORIAS:

> Al Dr. Arturo Perlasca Lobato por ser mi Maestro, guía y motivarme siempre en la elaboración de esta tesis.

> Al Arq. Juan Manuel Bravo Armejo, ya que siempre me ha brindado su apoyo y consejos, y que sin su ayuda no hubiera sido posible realizar este trabajo.

> A mi Alma Mater el Instituto Tecnológico de la Construcción.

> A mis maestros, por todas sus enseñanzas, mi amistad, agradecimiento y recuerdo siempre.

> A mis compañeros de Clase por brindarme su amistad.

> Al personal de la CMIC delegación Jalisco por todas sus atenciones.

GRACIAS.

José María.

Page 4: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

RESUMEN

El presente estudio de investigación aborda la problemática en la subjetividad para determinar el valor de un bien inmueble, ya que aparte de los métodos comunmente utilizados para este fin, no se utilizan determinantes estadísticos confiados y validados como lo es el Análisis Multivanado

Un método comúnmente utilizado es el de Valor de Mercado, pero presenta imprecisión cuando hay escasez de comparables, haciéndolo subjetivo y al criterio del valuador y oferta -demanda, estando sujeto a especulación

El valor de mercado representa las vanables involucradas en su conjunto, pero no considera el tratamiento, correlación y causalidad entre ellas

En otros países se han llegado a establecer métodos valuatonos con la correlación de éstas variables de mercado, utilizano el Análisis Multivanado y las Redes Neutrales Artificiales (RNA), pero en nuestro país no ha sido así, aún no se establece un intento formal de ello

El objetivo de este estudio es el de establecer y aplicar un Método, a través deLAnálisis Multivanado, determinando Ecuaciones de Predicción y así obtener el valor comercial de un bien inmueble

Para dar sustento a esta investigación se expresan los conceptos y teorías del Análisis Multivanado estadístico así como los principios de Red Neural Artificial (RNA) como manejo de comprensión en el tratamiento de los datos

Con base en un estudio correlacional estableciendo ecuaciones estructurales y de predicción se plantea la siguiente Hipótesis

H1: El valor de un bien inmueble calculado a partir de la aplicación del Análisis Multivanado (SPSS) es más justo y equitativo que el valor de un bien inmueble calculado por el Método de Mercado (Homologación)

Se descnben los supuestos y sus conceptos del Análisis Multivanado que exigen en el tratamiento de la información, que exista Lineandad Homocedasticidad Independencia, Normalidad y datos dentro de rango

Se toma una muestra de treinta y cinco avalúos practicados a casas habitación Tipo Medio y Medio-Superior, con su valor comercial en la zona de Zapopan, Jalisco Teniéndose una muestra de 13 vanables y 455 datos con lo que se estructura el modelo

Page 5: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Se utiliza el paquete estadístico SPSS por ser el más apropiado para este caso con el fin de determinar la correlación de variables y tener un grado aceptable de predicción

Tomando los datos originales de la muestra, las correlaciones se distorsionan, violándose los supuestos, por lo tanto se tiene que recurrir a la Transformación de Datos, siendo el Ln (Logaritmo Natural) la función más adecuada y que corngió el cumplimiento de las restricciones mejorando la calidad de la muestra

Se realiza una segunda corrida del paquete con datos transformados, obteniéndose un Coeficiente de Determinación muy aceptable, lográndose casi la correlación absoluta. Y partiendo de ello se obtiene la ecuación de predicción que estima el valor comercial del bien inmueble.

La Ecuación de Predicción del estudio es,

Valor Comercial de Inmueble = -1690483 + 47946.29 (No. Cajones estacionamiento) +• (-25.422)( Edad de la Vivienda) + 14233.033 (Edo. de Conservación) + 157 168 ($/M2 Construcción) + 94788.9 (No. de Baños) +- 58890.04 ( No. De Niveles) + (-16057 7) (No. Recámaras) +7850.595 (Sup Construcción) +456.407 (Sup. Terreno) +- (-18155 8) (Topografía) + (-8680 549) (Ubica Manzana) + (-13337 8) (Ubic Zona)

Por último se realiza un ejemplo de aplicación de la Ecuación Predictiva para determinar valores comerciales de bienes inmuebles de Tipo Medio en la zona de la muestra

Page 6: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

ÍNDICE :

CAPITULO I INTRODUCCIÓN Homologando la Homolagación 1

1.1. Problema de investigación 3 1.1.1. Esquema del problema 5

1.2. Justificación 6 1.2.1. Económica 1.2.2. Teórica 1.2.3. Social 1.2.4. Metodológica

1.3. Alcance 7 Línea de Investigación Giro y/o tema Área geográfica

1.4. Objetivos 7 1.4.1. Genérico 1.4.2. Específicos

CAPÍTULO II MARCO TEÓRICO 2.1. Regresión Lineal 8

~ Tipos de Regresión Lineal 8 Introducción a la Regresión Lineal 10 Clasificación de los Modelos 11 Objetivos de los Modelos 12 Estimación de la Recta de Regresión 13 Coeficiente de Determinación 13 Regresión No Lineal y Supuestos del Modelo 15 Aplicación y Alcance de la Técnicas Multivariadas 17 Tipos de Variables 18 Enfoque délos Métodos Multivariados 18 Inferencia Estadística 19 Análisis de la Regresión Múltiple 20 Aplicaciones 21

2.2. Redes Neurales 23 Red Neural Artificial. 25 Funcionamiento 25 Diseño y Programación de una Red Neural Artificial 26 Estructura y ventajas 27 Tipologías de las RNA 28 Modelos y Topología. 28 Aprendizaje y Tipo de entrada. 29 Aplicaciones 30 Similitud y diferencias entre el Análisis Multivariado y las RNA 30

Page 7: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

CAPITULO III MÉTODO 3.1. Tipo de Investigación 31 3.2. Hipótesis 31 3.3. Modelo Operacional de las variables 34 3.4. Descripción de las variables de la Hipótesis 35 3.5. Diseño de Investigación 36

CAPITULO IV ANÁLISIS MULTIVARIADO DEL VALOR COMERCIAL DEL INMUEBLE CON DATOS SIN TRANSFORMAR.

Paso 1 4.1. Definición del problema de investigación 38 4.2. Objetivo. 38 4.3. El modelo es apropiado para ser resuelto por el

método de regresión múltiple 38 4.4. Selección de la variable dependiente e

Independientes 39

Paso 2 4.5. Tamaño de la muestra. 41

Paso 3 4.6. Supuestos en el análisis de regresión múltiple 42

- 4.7. Corrida 1 en SPSS con datos sin transformar 42 4.8. Análisis de la corrida 1. 43

CAPITULO V: VALIDACIÓN DE SUPUESTOS CON DATOS TRANSFORMADOS

5.1. Estrategia de transformación. 45

5.2 Tabla con datos transformados. 45

CAPITULO VI: ESTIMACIÓN DEL MODELO DE REGRESIÓN

Paso 4 6.1. Corrida 2 en SPSS con Datos Transformados . 46 6.2. Estimación del modelo de regresión 46 6.3. Análisis de la Corrida 2. 48 Paso 5 6.4. Determinación de la ecuación de predicción. 50 6.5. Ejemplo de Aplicación 51

CAPITULO Vil CONCLUSIONES Y RECOMENDACIONES

BIBLIOGRAFÍA

Page 8: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

CAPÍTULO I : INTRODUCCIÓN

Una de las razones de la presente investigación se debe a que hay mucho que trabajar respecto a las metodologías utilizadas en la elaboración de los avalúos y por lo consiguiente quiero citar parte del texto del artículo escrito por el Arq. Enrique Cervera Muñoz, Especialista en Valuación de Bienes, Especialista en Sistema de Información Geográfica, miembro del Instituto Mexicano de la Valuación de Veracruz A.C, que fue publicado en la revista No, 10 "Valuador Profesional" año 3, 4to. Trimestre del 2006. titulada :

HOMOLOGANDO LA HOMOLOGACIÓN.

"La homologación es una herramienta que se ha estado empleando en los últimos años para la realización de los avalúos inmobiliarios del sistema financiero en nuestro país, en especial para el crédito de vivienda, pero que al usarse en forma exagerada y sin análisis, tenemos como resultado, avalúos tendenciosos manipulados desde las fórmulas del formatito único que el valuador no puede meter mano, debido al bloqueo de celdas de dicho formato, que te proporcionan para hacer avalúos, llevando la homologación como dice un colega a definirla así: Si a un elefante le cortas sus patas, le tuerces la cola y le reduces la trompa, entonces tendrás un puerquito y viceversa"

El mismo tema de la homologación siempre ha creado controversia porque cada valuador, unidad de valuación o institución, desea tener la verdad única y perfecta y con ello, demostrar a los demás que no piensen como ellos, con todos los términos negativos que se pueden imaginar, desde malos valuadores hasta corruptos.

En los resultados de los avalúos en la mayoría de las veces existen discusiones y controversias debido al empleo de la homologación. Y esto originado por las siguientes razones:

Primero : Porque tenemos que homologar el conocimiento ya que no todos estudiamos en la misma universidad, la misma licenciatura y los mismos postgrados.

Segundo : Porque tenemos que homologar la experiencia; hay colegas que tiene un año de valuar, otros 5 años, otos 15, y otros 25 años, la pregunta es : ¿tendremos el mismo punto de vista?.

1

Page 9: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Tercero : Habría que homologar el curriculum vitae, hay colegas que han sido burócratas toda la vida, otros (para valuar inmuebles) jamás han construido obras con recursos propios, otros han construido obras bajo la responsiva de terceros, otros han tenido diferente actividad y ajena a la valuación ¿Se imaginan esta torre de babel? ¿Nos pondremos honestamente de acuerdo? ¿ Quién tiene la verdad absoluta?

Estas son algunas de las variables que hacen que no nos pongamos de acuerdo para valuar. Y entrando al tema de la homologación Cervera Muñoz comenta que el diccionario expresa Acción y efecto de homologar y ¿homologar? Equiparar, poner en relación de igualdad dos cosas.

Analizando el formato en el capítulo de homologación de predios surge la siguiente pregunta ¿Porqué crecen o existe las ciudades? Exacto! Porque en una de esas respuestas nos dice que no hay predios!! ¿Entonces de dónde salen tantos comparables? Además que no se utilicen como datos después de seis meses.

En conclusión homologuemos:

Primero : La homologación solo debe ser usada si el valuador la considera útil al caso y si así lo fuera, que determine su número de comparables razonando el uso de la homologación en texto o fórmula matemática.

Segundo : Dejar en libertad ai valuador profesional independiente para que busque innovar sus avalúos, ya que si nos volvemos empleados de las unidades de valuación (como actualmente funciona) Qué sentido tienen los Colegios, Universidades, congresos, Asociaciones , etc. Si el formato único no admite cambios? Es un verdadero insulto para el postgraduado y mas para los que tienen doctorado.

Y POR ÚLTIMO HAY QUE RECORDAR LO QUE DIJO BENJAMÍN FRANKLIN "NO HAY INVERSIÓN MÁS RENTABLE QUE LA DEL CONOCIMIENTO"

2

Page 10: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

1.1. Problema de investigación.

Desde hace algunos años, varios investigadores, han creado modelos que faciliten la actividad humana y la profesionalicen, como ejemplo podemos mencionar los programas estadísticos de Regresión Lineal a través del Análisis Multivariado y otras más que simulan la actividad cerebral, como lo son las Redes Neurales Artificiales (RNA) con el propósito de crear una forma de inteligencia artificial, ambas para la solución de problemas.

La Ley de Valuación del Estado de Jalisco en su Capítulo VI (de los dictámenes de valor) en su artículo 42 dice "La elaboración de los dictámenes deben formularse con métodos y criterios adecuados y uniformes, que permitan determinar de la mejor manera posible el valor de los bienes valuados"

Recordando uno de los principios de Valuación (de Substitución) que supone lo siguiente: "Inmuebles similares se venderán a precios similares". En donde el Método de Mercado se basa en la búsqueda de referenciales comparables o similares al inmueble objeto del avalúo dentro del mercado inmobiliario, para obtener una estimación de valor de una propiedad .

Hasta aquí todo funciona bien en el método, pero se tiene un problema, cuando debido a la escasez e insinceridad de comparables, no es posible tener una muestra representativa de inmuebles similares oor lo regular se recurre al proceso de corregir u homologar dichos referenciales. mediante expresiones lógico-matemáticas y "forzar" el dato referencia!, para asemejarlo artificialmente al inmueble obieto del avalúo.

Los principales ajustes que se llevan a cabo incluyen las relacionados con las principales características físicas del predio, su ubicación, uso, superficie, forma , servicios, condiciones de venta y el tiempo que tomará la operación a partir de la fecha de venta. Ahora recordemos la siguiente regla para hacer dichos ajustes :

"Una propiedad comparable se ajusta siempre, ya sea positiva o negativamente para hacerla tan parecida a la propiedad sujeto tanto como sea posible".

Esto significa que una propiedad que tiene mejores características que la propiedad sujeto se debe aiustar para abajo y una propiedad que tiene peores características que la propiedad sujeto se debe a justar para arriba .

En lo anterior existe un problema de presencia de factores de subjetividad en la determinación del valor de un inmueble, causados por los criterios empleados por el profesional valuador al aplicar uno o varios "factores de corrección" a una serie de referenciales, que evidentemente afectan la exactitud del cálculo del valor del bien.

3

Page 11: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Dentro del sector de la valuación inmobiliaria, la utilización del Análisis Multivariado, y las Redes Neurales Artificiales (RNA), ha sido casi nula, el gremio de los valuadores inmobiliarios desconoce en su mayoría, la posibilidad de aplicar software como apoyo en la elaboración de sus dictámenes valuatorios.

En otros países viendo esta problemática se consideraron a las técnicas de Regresión Múltiple como una potente e innovadora herramienta para el cálculo del valor de los bienes como el perfeccionamiento de la "metodología de mercado", ya que los propios referenciales se "auto corrigen" entre sí, sin tener la necesidad de utilizar criterios subjetivos por parte del valuador profesional.

Por todo lo anterior es necesario que en el área de la Valuación Inmobiliaria, se esté a la vanguardia en cuanto a los métodos y técnicas que se van a utilizar para la elaboración de los avalúos, es decir, necesitamos que nuestro gremio profesionalice la actividad valuatoria, y así poder determinar resultados válidos y de calidad, y por consiguiente corresponder a la confianza que los clientes depositan en los profesionales de la valuación.

Por lo cual se ha detectado el siguiente problema:

"En el Método de Mercado existen factores de subjetividad en la determinación del valor de un inmueble, causados por los criterios empleados por el profesional valuador, además de un desconocimiento y nula aplicación de nuevas técnicas como son el Análisis Multivariado y las Redes Neurales Artificiales como apoyo para la determinación del valor comercial de un bien en los avalúos inmobiliarios."

4

Page 12: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

1.1.1. Esquema del problema.

Clientes que esperan avalúos confiables y de calidad.

La manipulación en la técnica de homologación para determinar el Valor de Mercado no es confiable, por la escasez de comparables y el criterio del valuador, haciéndola subjetiva.

Incapacidad de realizar avalúos en otras partes del mundo.

Mantener el mismo nivel de calidad en los avalúos que se realizan en otros países.

Existe subjetividad en la determinación dei valor de un bien inmueble. No se utilizan métodos estadísticos confiables estructurados como lo es el Análisis Multivariado

Falta de conciencia de los valuadores en la profesionalización de su actividad valuatoria.

Desconocimiento y falta de capacitación de los valuadores en la utilización de técnicas nuevas. Paquetes como (RNA) y (SPSS).

Falta de credibilidad de los valuadores en la aplicación de técnicas diferentes. Es necesario Innovar la educación y romper paradigmas.

Page 13: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

1.2. Justificación

1.2.1. Económica

Los beneficios que esperan de este estudio en términos económicos radican en una mejor determinación en términos monetarios (dinero) de cada bien raíz, este resultado que es numérico, debe ser, específico y objetivo, representando una mayor probabilidad del valor de la propiedad en estudio.

Por otro lado también con una buena determinación del valor, las instituciones financieras disminuyen el riesgo que asumen al conceder créditos hipotecarios.

1.2.2. Teórica

Los beneficios que se esperan de este estudio en términos teóricos son que el método se basa en la teoría de las Redes Neurales con la aplicación del Análisis Multivariado para predecir a través de ecuaciones el valor comercial de un bien inmueble.

1.2.3. Social

Los beneficios que se esperan de este estudio en términos sociales radican en establecer un equilibrio entre las fuerzas de mercado, determinando la existencia de un mercado estable, sano y justo.

1.2.4. Metodológica

Se aplicarán modelos estructurados soportados por el Análisis Multivariado en el tratamiento de la información para establecer modelos matemáticos, por medio de Ecuaciones de Predicción y con el apoyo de la teoría de las Redes Neutrales.

6

Page 14: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

1.3. Alcance.

Línea de investigación. Inmobiliaria (Práctica valuatoria)

Tema y/o giro. Análisis Multivariado en la valuación y principios de las redes neurales

Área geográfica. General.

1.4. Objetivos.

1.4.1. Genérico.

Establecer y aplicar un método de avalúo de bienes inmuebles utilizando el Análisis Multivariado a través de Ecuaciones de Predicción para obtener el Valor Comercial de un bien inmueble.

1.4.2. Específicos.

• Describir y analizar la problemática en la valuación de bienes inmuebles • Exponer la Teoría del Análisis Multivariado y la teoría de las Redes

Neurales Artificiales (RNA). • Utilizar métodos estadísticos de Análisis Multivariado (SPSS) en la

elaboración de avalúos inmobiliarios. • Establecer Ecuaciones de Predicción y su comportamiento. • Analizar los resultados obtenidos del Análisis Multivariado, y verificar su

factibilidad de aplicación.

• Proponer la aplicación de las nuevas tecnologías como una novedosa herramienta.

7

Page 15: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

CAPÍTULO II: MARCO TEÓRICO

2.1 REGRESIÓN LINEAL

La regresión lineal es un modelo matemático mediante ei cual es posible inferir datos acerca de una población. Se conoce como regresión lineal ya que usa parámetros lineales (potencia 1).

Es un método de análisis de los datos que sirve para poner en evidencia las relaciones que existen entre diversas variables.

Tipos de regresión lineal

Existen diferentes tipos de regresión lineal que se clasifican de acuerdo a sus parámetros:

• Regresión lineal simple.

Sólo se maneja una variable independiente, por lo que sólo cuenta con dos parámetros. Son de la forma:

K = fa + faXi + Si

Donde £i es el error asociado a la medición del valor X, y siguen los supuestos

de modo que £* ~ -¿v (0,0" ) ̂ m e c j ¡ a Q varianza constante e igual a un error asociado a

la medición / del valorXip y siguen los supuestos de modo que £¿ ~ i V l U ' ü ) ( media 0,

varianza constanteeigual a u n a y £ ' Ei con l T 3).

• Regresión lineal múltiple

Hasta ahora hemos considerado únicamente el caso de la regresión simple. En el caso más general de la regresión múltiple, existen dos o más variables independientes:

= bo +-biXi + ¿2X2 -*-...

La estimación de los coeficientes de una regresión múltiple es un cálculo bastante complicado y laborioso, por lo que se requiere del empleo de programas de computación especializados. Sin embargo, la interpretación de los coeficientes es similar al caso de la regresión simple: el coeficiente de cada variable independiente mide el efecto separado que esta variable tiene sobre la variable dependiente. El coeficiente de determinación, por otro lado, mide el porcentaje de la variación total en "Y" que es explicado por la variación conjunta de las variables independientes.

*

8

Page 16: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Para calcular los parámetros debe tomarse en cuenta que se está refiriendo a matrices:

8={X'XYlX'Y

Las técnicas de regresión permiten hacer predicciones sobre los valores de cierta variable Y (dependiente), a partir de los de otra X (independiente), entre las que intuimos que existe una relación.

A la deducción, a partir de una serie de datos, de este tipo de relaciones entre variables, es lo que denominamos regresión.

Mediante las técnicas de regresión de una variable Y sobre una variable X, buscamos una función quesea una buena aproximación de una nube de puntos (x,,y,), mediante una curva del tipo. Y=f(x) Para ello hemos de aseguramos de que la diferencia entre los valores y¡ e $\ sea tan pequeña como sea posible.

Y

\L3/

^ T \ j

__^%--~* >¿

Aproximación

Observarían

( x . , y . )

i . l \

Mediante las técnicas de regresión inventamos una variable Y como función de otra variable X (o viceversa),

Y=f(x)

Esto es lo que denominamos relación funcional. El criterio para construir Y , tal como citamos anteriormente, es que la diferencia entre Ye sea pequeña.

Y= f(x) Y - Y = error

El término que hemos denominado error debe ser tan pequeño como sea posible.

B objetivo será buscarla función (también denominada modelo de regresión)

Y= f(x) que lo minimice.

Page 17: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Modela Lineal

Buen, ajuste

Cuando x cieos, yctece

Modelo lineal Mal ajuste

Cuando x crece, 9 y crece

Modela no lineal

Buen ajuste

Cuando x crece, y crece

• Modelo Lineal

v* Buen ajuste

Cuando x crece;

y decrece •

Modelo no lineal

Buen ajuste

Cuando x crece,

ydecrece •

Variables no relacianadas Ninguna curva de regresión

es adecuada . •

• • • #

Introducción a la regresión lineal

El objeto de un análisis de regresión es investigar la relación estadística que existe entre una variable dependiente (Y) y una o más variables independientes (Xx,Xz,xz^ y P a r a p o d e r realizar investigación, se debe postular una relación funcional entre las variables. Debido a su simplicidad analítica, la forma funcional que más se utiliza en la práctica es la relación lineal. Cuando solo existe una variable independiente, esto se reduce a una línea recta:

Y = b0+b,X

donde los coeficientes 60 y 61 son parámetros que definen la posición e

inclinación de la recta. (Nótese que hemos usado el símbolo especial Y para representar el valor de Y calculado por la recta. Como veremos, el valor real de Y rara vez coincide exactamente con el valor calculado, por lo que es importante hacer esta distinción.)

El parámetro 60, conocido como la "ordenada en el origen," nos indica cuánto es Y cuando X - 0. El parámetro 61, conocido como la "pendiente," nos indica cuánto aumenta "Y" por cada aumento de una unidad en "X". Nuestro problema consiste en obtener estimaciones de estos coeficientes a partir de una muestra de observaciones sobre las variables "Y" y "X". En el análisis de regresión, estas estimaciones se obtienen por medio del método de mínimos cuadrados.

10

Page 18: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Clasificación de los modelos.

Los modelos de regresión se pueden clasificar de dos formas:

Según la metodología utilizada para su estudio:

1.- Modelos de regresión paramétrícos. Se supone que la función de regresión, m, que relaciona a la variable respuesta

con las variables regresoras pertenece una determinada familia paramétrica: m (x) = m (<5, X) , dondex=(*i.--- ,Xfc)ya=(ai,... ,OP)EQPC^P

Por ejemplo, se supone que la familia paramétrica es lineal, m (x) = m (a, x) = a0 4- <iiXi 4- . . . 4- afcX&. En este caso, el problema básico es estimar los parámetros de la familia supuesta a partir de las observaciones muéstrales. En el ejemplo anterior hay que estimar los parámetros ao.a^o:...,^. También se debe contrastar la hipótesis de que la función de regresión pertenece a la familia paramétrica supuesta. Este enfoque es el que se ha estudiado clásicamente y que con mayor frecuencia se utiliza en la práctica.

2.-Modelos de regresión no paramétrícos. Es un enfoque alternativo que está teniendo una gran aceptación, con este

método no se hace ninguna suposición acerca de la forma funcional de la regresión y j e estima la función de regresión punto a punto. Ésto es, se estima el valor de m(2M,x2,i»• • • j^ijk) en un enrejado (grid) de valores {(xi,ux%^ • • • »afc¿)}¡ = iN de las variables regresoras.

Los métodos de regresión no paramétrica. también llamados de suavización de la función de regresión, se han desarrollado a partir de los años setenta y tienen una gran aceptación por varios motivos: son versátiles, permiten observar comportamientos locales y para su desarrollo teórico utilizan hipótesis muy débiles. Un inconveniente de estos métodos es que exigen una razonable capacidad de cálculo computacional, problema que se ha solventado en los últimos años con el continuo y rápido avance de los medios computacionales.

No deben de considerarse los métodos de regresión paramétricos y los no paramétricos como competidores sino como métodos complementarios. Siendo recomendable, en la práctica, utilizar ambos enfoques, pues los dos métodos proporcionan información complementaria acerca del problema en estudio.

•4Según la forma de recogida muestral, se distinguen dos tipos de modelos de regresión:

1 .-Modelos de regresión de diseño fiio: En estos modelos las variables regresoras son valores predeterminados. Este

modelo se utiliza en el estudio del comportamiento de una variable respuesta cuando las variables regresoras varían en una determinada dirección. En este caso se debe diseñar y realizar un experimento en el que las variables regresoras se muevan en dicha dirección. Por tanto, en este diseño se controla en todo momento el valor de las variables regresoras.

11

Page 19: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

2.- Modelos de regresión con diseño aleatorio

En estos modelos las variables regresoras son variables aleatorias. Se utiliza este modelo cuando se estudia la relación entre la variable respuesta y las variables regresoras a partir de una muestra obtenida de la observación de las variables en unidades de experimentación elegidas al azar. Esto es, el experimentador es un observador pasivo en la recogida muestral y los resultados sólo serán válidos para el rango de variación conjunta de las variables implicadas en el estudio.

Objetivos de los Modelos de Regresión

Los Modelos de Regresión estudian la relación estocástica cuantitativa entre una variable de interés y un conjunto de variables explicativas. Estos modelos son muy utilizados y su estudio conforma un área de investigación clásica dentro de la disciplina de la Estadística desde hace muchos años.

Cuando se estudia la relación entre una variable de interés, variable respuesta o variable dependiente CHy un conjunto de variables regresoras (explicativas, independientes) (Xi,X2, ••-, Xk\ puede darse las siguientes situaciones:

Existe una relación funcional entre ellas, en el sentido de que el conocimiento de las ''variables regresoras determina completamente el valor que toma la variable respuesta,

ésto es, Y = m(X\,X-i,...,Xk).

Ejemplo: la relación que existe entre el tiempo (V) que tarda un móvil en recorrer una distancia y dicha distancia (X) a velocidad constante

No exista ninguna relación entre la variable respuesta y las variables regresoras, en '*'el sentido de que el conocimiento de éstas no proporciona ninguna información sobre

el compartamiento de la otra.

Ejemplo: la relación que existe entre el dinero (Y) que gana una persona adulta mensualmente y su altura (X).

El caso intermedio, existe una relación estocástica entre la variable respuesta y las ""•"variables regresoras, en el sentido de que el conocimiento de éstas permiten predecir

con mayor o menor exactitud el valor de la variable respuesta. Por tanto siguen un modelo de la forma: Y=m(X1X2 Xk)±s,

siendo m la función de regresión desconocida y £ una variable aleatoria de media cero (el error de observación).

Las relaciones estocásticas son las que ocurren en la mayoría de las situaciones y su estudio se corresponde con los denominados Modelos de Regresión.

12

Page 20: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

El objetivo básico en el estudio de un modelo de regresión es el de estimar la función de regresión, m, y el modelo probabilístico que sigue el error aleatorio e, ésto es, estimar la función de distribución F=- de la variable de error. La estimación de ambas funciones se hace a partir del conocimiento de una muestra de las variables en estudio, {((*!.* X2.¡ Xfc.¡), Yi) : i = 1, 2 . . . . , n)

Una vez estimadas estas funciones se tiene conocimiento de:

La relación funcional de la variable respuesta con las variables regresoras, dada por "••la función de regresión que se define como sigue,

m(xl,... ,xfc) = E(Y/X1 = i ! , . . . ,Xk = i f c ) . Esto permite tener una idea general del comportamiento de la variable respuesta en función de las regresoras. Se puede estimar y predecir el valor de la variable respuesta de un individuo del que

"•"se conocen los valores de las variables regresoras. Ésto, es, de un individuo t se sabe que Xi = x^,t,...Xk - xkit, entonces se puede predecir el valor de Y t y calcular un intervalo de predicción del mismo.

Estimación de la Recta de Regresión :

En la práctica, los cálculos relacionados con un análisis de regresión se efectúan por medio de programas de computadora, por lo que los cálculos detallados en esta sección se incluyen únicamente a título de ilustración.

Para estimar los coeficientes por medio de mínimos cuadrados, se utilizan las siguientes fórmulas:

6, 1X7-

" I X 2 -

= y-b]x

-yXX -xTX

Coeficiente de Determinación (R2).

Una pregunta importante que se plantea en el análisis de regresión es la siguiente: ¿Qué porcentaje de la variación total en "Y" se debe a la variación en "X"? En otras palabras, ¿cuál es la proporción de la variación total en "Y" que puede ser "explicada" por la variación en "X"? El estadístico que mide esta proporción o porcentaje se denomina coeficiente de determinación:

le 2

* =l~UY-yf

13

Page 21: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Una vez ajustada la recta de regresión a la nube de observaciones es importante disponer de una medida que mida la bondad del ajuste realizado y que permita decidir si el ajuste lineal es suficiente o se deben buscar modelos alternativos. Como medida de bondad del ajuste se utiliza el coeficiente de determinación definido como sigue:

o bien

n

- E (& 2 _ scE í = 1

scG A .

E (y* 1 = 1

R2 = i *=? = ! -scG

-y)2

-Q)2

n - 2 32R

l l - l s^

Como scE< scG, se verifica que 0 < R2 < 1.

El coeficiente de determinación mide la proporción de variabilidad total de la variable dependiente OOrespecto a su media que es explicada por el modelo de regresión. Es usual expresar esta medida en tanto por ciento, multiplicándola por cien.

- Por otra parte, teniendo en cuenta que v, -V = áfa - *), se se obtiene:

„2

R2 = ,2 _ SXY

Dadas dos variables aleatorias cualesquiera X e Y , una medida de la relación lineal que hay entre ambas variables es el coeficiente de correlación definido por:

Cov (X Y) p~ <T(X)<T(Y)

donde ¿K^Orepresenta la desviación típica de la variable x (análogamente para oW)). Un buen estimador de este parámetro es el coeficiente de correlación lineal muestral (o coeficiente de correlación de Pearson), definido por:

S.KY

Sx Sy signo (íij) v R2.

Por tanto, ré~1^ i]. Este coeficiente es una buena medida de la bondad del ajuste de la recta de regresión. Evidentemente, existe una estrecha relación entre r y ó, aunque estos estimadores proporcionan diferentes interpretaciones del modelo:

* res una medida de la relación lineal entre las variablesXe Y. * á, mide el cambio producido en la variable Y al realizarse un cambio de una unidad en la variable x.

14

Page 22: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

De las definiciones anteriores se deduce que:

*xv o <=> <i1 = o <̂ > r = o .

Es importante estudiar si r es significativo (distinto de cero) ya que ello implica que el modelo de regresión lineal es significativo. Desafortunadamente la distribución de r es complicada pero para tamaños muéstrales mayores que 30 su desviación típica es <r(r)~i/v£ y puede utilizarse la siguiente regla

2 \r\ > —7= => r e s significativo (con a — 0'05)

\¡n

En la interpretación del coeficiente de correlación se debe tener en cuenta que:

• r= ±1 indica una relación lineal exacta positiva (creciente) o negativa (decreciente),

• r = 0 indica la no existencia de relación lineal estocástica, pero no [ndica independencia de las variables ya que puede existir una relación no lineal incluso exacta,

• valores intermedios de r (0 < r < 1 ó -1 < r < 0) indican la existencia de una relación lineal estocástica, más fuerte cuanto más próximo a +1 (ó -1) sea el valor de r.

Supuestos del modelo de regresión lineal

Para poder crear un modelo de regresión lineal, es necesario que se cumpla con los siguientes supuestos:

1. La relación entre las variables es lineal. (LINEARIDAD) 2. Los errores son independientes. (INDEPENDENCIA) 3. Los errores tienen varianza constante. (HOMOSCEDASTICIDAD) 4. Los errores tienen una distribución normal. (NORMALIDAD) 5. Los datos no estén fuera del límite de control (OUTLIERS)

Regresión no lineal

La regresión lineal no siempre da buenos resultados, porque a veces la relación entre Y y X no es lineal sino que exhibe algún grado de curvatura. La estimación directa de los parámetros de funciones no-lineales es un proceso bastante complicado. No obstante, a veces se pueden aplicar las técnicas de regresión lineal por medio de transformaciones de las variables originales.

15

Page 23: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Una función no-lineal que tiene muchas aplicaciones es la función exponencial:

Y = AX°

donde A y b son constantes desconocidas. Si aplicamos logaritmos, esta función también puede ser expresada como:

log(Y) = log(A) + b.log(X)

ahora la siguiente Consideremos regresión lineal:

log(Y) = b0 +• bilog(X)

En esta regresión (denominada regresión doble-log), en lugar de calcular la regresión de "Y" contra "X", calculamos la regresión del logaritmo de "Y" contra el logaritmo de "X". Comparando estas dos ecuaciones, podemos apreciar que el coeficiente es un estimador de log(A), mientras que es un estimador de ub" (el exponente de la función exponencial). Este modelo es particularmente interesante en aplicaciones econométricas, porque el exponente "£>" en una función exponencial mide la elasticidad de "Y" respecto de "X"

16

Page 24: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Aplicaciones de las Técnicas Multivariadas.

Las aplicaciones de la estadística multivariada están presentes en distintas áreas o ramas de la ciencias, como por ejemplo en:

• Investigación de mercados (para identificar características de los individuos con el propósito de determinar qué tipo de personas compran determinado producto)

• El sistema de educación de cualquier tipo de especialidad (para conocer los estudiantes que tendrán éxito y concluirán satisfactoriamente sus estudios)

• La agricultura (al estudiar la resistencia de determinado tipo de cosechas a daños por plagas y sequías)

• El deporte (para conocer a partir de medidas antropométricas las posibilidades de obtener buenos resultados en un deporte específico)

• La psicología (al estudiar la relación entre el comportamiento de adolescentes y actitudes de los padres)

• La economía (para conocer el nivel de desarrollo de un territorio en relación con otros y realizar inferencias a partir de variables económicas fundamentales, entre otros).

Los datos multivariados surgen cuando a un mismo individuo se le mide más de una característica de interés. Un individuo puede ser un objeto o concepto que se puede medir. Más generalmente, los individuos son llamados unidades experimentales. Ejemplos de objetos: personas, animales, casas, terrenos,

— compañías, países, etc. Ejemplos de conceptos: amor, amistad, noviazgo, etc. Una variable es una característica o atributo que se le mide a un individuo.

Alcances de las técnicas multivariadas:

1) Simplificación. Los métodos multivariados son un conjunto de técnicas que permiten al investigador interpretar y visualizar conjuntos grandes de datos (tanto en individuos como en variables), a partir de su simplificación o reducción.

2) Relación: Encontrar relaciones entre variables, entre individuos y entre ambos.

2.1) Relación entre variables: Existe relación entre variables cuando las mismas miden características comunes.

Ejemplo: Suponga que se realizan exámenes de español, matemática e historia a estudiantes, seleccionados en las entidades turísticas del país, para el ingreso en la carrera de licenciatura en turismo. Si cada uno de los estudiantes obtiene calificaciones altas, regulares o bajas en los tres exámenes, entonces los exámenes estarían relacionados entre sí. En este caso, la característica común que estos exámenes pueden estar midiendo podría ser la "inteligencia general" que les permita comenzar esa carrera universitaria.

17

Page 25: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

2.2) Relación entre individuos: Existe relación entre individuos si alguno de ellos son semejantes entre sí.

Ejemplo: Suponga que se evalúan diferentes tipos de cervezas respecto a su nivel de aceptación y se miden, por ejemplo, los consumos de las mismas para diferentes grupos de edades, se podría esperar que las cervezas claras y oscuras tengan algún tipo de relación, o que ios tipos de cervezas sean totalmente diferentes.

Tipos de variables

Numéricas Continuas Discretas

Categóricas Ordenadas No ordenadas

En los métodos multivariados, se supone que las variables están correlacionadas, pero las observaciones sobre los individuos son independientes. Generalmente se supone también que el conjunto de variables que intervienen en el análisis poseen una distribución normal rrlultivariada. Esta suposición permite que el análisis multivariado se desarrolle paralelamente al correspondiente análisis univariado basado en una distribución normal.

Enfoques de ios métodos multivariados:

1) Dirigidas o motivadas por las variables: se enfocan en las relaciones entre variables.

Ejemplos: matrices de correlación, análisis de componentes principales, análisis de factores y análisis de regresión.

2) Dirigidas o motivadas por los individuos: se enfocan en las relaciones entre individuos.

Ejemplos: análisis discriminante, análisis de conglomerados y análisis multivariado de varianza.

Análisis exploratorio multivariado

Las estadísticas descriptivas (multivariadas), como su nombre lo indica, sirven para describir el comportamiento de un conjunto de datos, entre ellas las más importantes son:

Media Muestral Varianza Muestral

• Correlación Muestral Diagrama de Dispersión

• Componentes Principales 18

Page 26: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Inferencia estadística

El problema de inferencia estadística consiste en aproximar el valor de ciertas características poblacionales (llamadas parámetros) por medio de resúmenes (llamados estadísticas) generados a partir de la información contenida en una muestra obtenida de la población.

• Estimación Puntual: El problema de estimación puntual consiste en proporcionar un valor puntual que aproxime al parámetro de interés. Los métodos clásicos de estimación puntual de parámetros son: método de momentos y método de máxima verosimilitud.

• Pruebas de Hipótesis: El problema de contraste de hipótesis en estadística consiste en decidir cuál de dos hipótesis es correcta. La decisión se toma de acuerdo con la información de la muestra. La prueba de hipótesis de mayor importancia en datos multivariados es probar si la correlación entre dos variables es significativamente distinta de cero.

• Intervalos de Confianza:

El calcular un intervalo de confianza es un problema de estimación por intervalo, en donde lo que se proporciona es un conjunto de valores altamente posibles como aproximaciones al parámetro.

Al igual que en el caso de pruebas de hipótesis, el intervalo de confianza de mayor interés es el de la correlación entre dos variables.

Uso de correlaciones para agrupar variables. Es posible que cuando se tiene un conjunto grande de variables, exista cierta relación entre algunas de las variables. El coeficiente de correlación entre parejas de variables permite agrupar variables de tal manera que variables en el mismo grupo tengan correlaciones altas y variables en grupos diferentes tengan correlaciones bajas.

19

Page 27: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Técnicas Seleccionadas del Análisis Multivariado

• Análisis de Regresión Múltiple

La regresión es una técnica utilizada para la investigación y modelación de las relaciones existentes entre variables que inciden en un determinado fenómeno de la realidad.

En un sentido amplio, la regresión es un proceso que tiene como finalidad ajustar un modelo a un conjunto de datos u observaciones. En realidad, la ecuación de regresión es sólo una aproximación de la relación existente entre las variables. La regresión puede ser utilizada como herramienta descriptiva o como herramienta inferencial.

En el primer caso, el investigador puede estar interesado en encontrar la mejor ecuación lineal de predicción. También puede controlar un conjunto de factores presentes en el fenómeno para evaluar.

En el segundo caso, o sea, inferencial, el investigador está interesado en realizar estimaciones de los parámetros poblacionales a través del examen de una muestra de observaciones y verificar algunas pruebas de hipótesis tales como si existe realmente una relación lineal entre las variables independientes, o sea, si una variable independiente específica no tiene efecto lineal sobre la dependiente.

„ Análisis de Componentes Principales

El Análisis de Componentes Principales (ACP), es una técnica estadística que fue propuesta a principios del siglo XIX por Karl Pearson como parte del análisis de factores. Sin embargo la complejidad de los cálculos retrasó su desarrollo hasta la aparición de los computadores y su utilización en la segunda mitad del siglo XX.

El ACP permite reducir la dimensionalidad de los datos, transformando el conjunto de "p" variables originales en otro conjunto de "q" variables, llamadas componentes principales. Las "p" variables son medidas sobre cada uno de los "n" datos, obteniéndose una matriz de datos de orden np (p < n). En el ACP existe la opción de usar la matriz de correlaciones o bien, la matriz de covarianzas.

En la primera opción (de correlaciones) se le está dando la misma importancia a todas y a cada una de las variables; esto puede ser conveniente cuando el investigador considera que todas las variables son igualmente relevantes.

La segunda opción (de covarianzas) se puede utilizar cuando todas las variables tengan las mismas unidades de medida y además, cuando el investigador juzga conveniente destacar cada una de las variables en función de su grado de variabilidad. Las "q" nuevas variables (componentes principales) son obtenidas como combinaciones lineales de las variables originales. Los componentes se ordenan en función del porcentaje de varianza explicada. En este sentido, el primer componente será el más importante por ser el que explica mayor porcentaje de la varianza de los datos. Queda a criterio del investigador decidir cuántos componentes se elegirán en el estudio. El ACP tiene la ventaja de no exigir supuestos tales como la normalidad.

Page 28: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Aplicaciones

Entre los usos más frecuentes del ACP están:

1. Como técnica de análisis exploratorio que permite descubrir interrelaciones entre los datos y de acuerdo con los resultados, proponer los análisis estadísticos más apropiados.

2. Reducirla dimensionalidad de la matriz de datos con el fin de evitar redundancias y destacar relaciones. En la mayoría de los casos, tomando sólo los primeros componentes, se puede explicar la mayor parte de la variación total contenida en los datos originales.

3. Construir variables no observables (componentes) a partir de variables observables. Por ejemplo, la inteligencia de una persona no es observable directamente, en cambio, se puede medir distintos aspectos de ésta mediante pruebas psicométricas.

4. Bajo ciertas circunstancias, es de gran utilidad usar estos componentes _ incorrelacionados. como datos de entrada para otros análisis. Por ejemplo, en el

caso de la regresión múltiple cuando las variables independientes presentan alta colinealidad es preferible hacer la regresión sobre los componentes principales en lugar de usar las variables originales.

Análisis Discriminantes

Técnica y herramienta estadística que permite predecir el comportamiento nominal de una variable dependiente a través de una combinación lineal de las variables independientes, también llamadas variables predictivas, características o parámetros, que hagan que los puntajes promedios de las categorías de las variables dependientes en ésta combinación lineal se diferencien en forma máxima.

Utilizada en investigaciones de mercado, por ejemplo, para predecir si las ventas potenciales en un territorio dado de mercado serán "buenas" o "malas" Jas variables dependientes, con base en ciertas evaluaciones sobre el ingreso personal disponible por territorio, densidad de población y número de ventas al detalle, las variables predictivas.

Son dos los objetivos centrales del análisis discriminante:

1. Predecir la categoría de una unidad de análisis u objeto o individuo.

2. Determinar cuales son las variables predictoras con mayor poder discriminante para clasificar a las unidades de análisis para que tengan uno o el otro atributo de la variable dependiente,

21

Page 29: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

La forma de conseguir ios objetivos es vía la obtención de una función discriminante:

FD = B1 X1 + 62 X2 + + Bm Xm

donde xm es la m-ésima variable independiente. La función discriminante obtenida por programas computacionales como el systat, BMD-07M o el statgrafics determinan los valores para cada variable independiente de los 13. que reciben el nombre de coeficientes discriminantes, betas discriminantes o pesos discriminantes.

Cada beta discriminante calculado tiene un monto o coeficiente determinado y su correspondiente signo positivo o negativo. El coeficiente de los betas determina el peso de cada una de las variables independientes en la discriminación y el signo, positiva a negativo, representa su asignación en uno u otro de los subgrupos definidos por las variables dependientes.

La finalidad es remplazar una unidad de análisis, objeto o individuo de la población objetivo con sus variables independientes, parámetros o característica en la función obtenida y calcular a priori su categoría.

Algebráicamnte la función discriminante representa una combinatoria lineal de los datos originales que maximizan la razón de variabilidad entre grupos a variabilidad intra grupos. El criterio que se utiliza para decidir cuando son diferentes al máximo la variabilidad de grupos es la prueba análisis de varianza F o también denominada F de Snedecor, conocida para hallar diferencias entre las varianzas.

~ Por lo tanto, los coeficientes discriminantes se derivan de tal forma que:

Variabilidad entre Grupos p = sea máxima

Variabilidad intra Grupos

El punto de partida de cualquier análisis discriminante es la determinación de la matriz de datos de variables dependientes, de carácter nominal, la que puede ser calculada por componentes principales o dadas.

22

Page 30: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

2.2.- REDES NEURALES

Las Recles Neurales Artificiales (RNA) o en inglés eximo (ANN) están compuestas de un gran número de elementos de procesamiento, profundamente interconectados (neuronas) trabajando simultáneamente para la solución de problemas específicos. Las RNA al igual que las personas aprenden de la experiencia.

Se trata de una nueva forma de cómputo, que es capaz de manejar las imprecisiones e incertidumbres que aparecen cuando se trata de resolver problemas relacionados con el mundo real, ofreciendo soluciones precisas y de fácil implementación.

Las RNA están compuestas de muchos elementos sencillos que operan simultáneamente, el diseño de la red está determinado mayormente por las conexiones entre sus elementos, simulando de esta forma las conexiones de las neuronas cerebrales.

Su funcionamiento está basado en que una de las misiones en una red neural consiste en simular las propiedades observadas en los sistemas neuronales biológicos a través de modelos matemáticos recreados mediante' mecanismos artificiales (como un circuito integrado, un ordenador o un conjunto de válvulas). El objetivo es conseguir que las máquinas den respuestas similares a las que es capaz el cerebro.

Una red neural se compone de unidades llamadas neuronas. Cada neurona recibe una serie de entradas a través de interconexiones y emite una salida. Esta salida viene dada por tres funciones:

1. Una función de propagación (también conocida como función de excitación), que por lo general consiste en el sumatorio de cada entrada multiplicada por el peso de su interconexión (valor neto). Si el peso es positivo, la conexión se denomina excitatoria; si es negativo, se denomina inhibitoria.

2. Una función de activación, que modifica a la anterior. Puede no existir, siendo en este caso la salida la misma función de propagación.

3. Una función de transferencia, que se aplica al valor devuelto por la función de activación. Se utiliza para acotar la salida de la neurona y generalmente viene dada por la interpretación que queramos darle a dichas salidas. Algunas de las más utilizadas son la sigmoide (para obtener valores en el intervalo [0,1]) y la hiperbólica-tangente (para obtener valores en el intervalo [-1,1]).

Su diseño de las Redes Neurales está basado con un paradigma convencional de programación en ingeniería del software, el objetivo del programador es modelar matemáticamente (con distintos grados de formalismo) el problema en cuestión y posteriormente formular una solución (programa) mediante un algoritmo codificado que tenga una serie de propiedades que permitan resolver dicho problema.

23

Page 31: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Las Redes de Neurales Artificiales (RNA) tienen muchas ventajas debido a que están basadas en la estructura del sistema nervioso, principalmente el cerebro entre las cuales se tienen las siguientes :

• Aprendizaje: Las RNA tienen la habilidad de aprender mediante una etapa que se llama etapa de aprendizaje. Esta consiste en proporcionar a la RNA datos como entrada a su vez que se le indica cuál es la salida (respuesta) esperada.

• Auto organización: Una RNA crea su propia representación de la información en su interior, descargando al usuario de esto.

• Tolerancia a fallos. Debido a que una RNA almacena la información de forma redundante, ésta puede seguir respondiendo aceptablemente aún si se daña parcialmente.

• Flexibilidad: Una RNA puede manejar cambios no importantes en la información de entrada, como señales con ruido u otros cambios en la entrada (ej. si la información de entrada es la imagen de un objeto, la respuesta correspondiente no sufre cambios si la imagen cambia un poco su brillo o el objeto cambia ligeramente)

• Tiempo real: La estructura de una RNA es paralela, por lo cuál si esto es implementado con computadoras o en dispositivos electrónicos especiales, se pueden obtener respuestas en tiempo real.

En las RNA la capacidad de aprendizaje a través de ensayos repetidos, las ha hecho muy populares en una amplia variedad de aplicaciones en todas las ciencias, como la Ingeniería, Medicina, Economía, Psicología, etc. por mencionar algunas.

24

Page 32: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Red neuronal artificial

Una de las variantes en el tratamiento multivariado de datos es la teoría de la red neural la cual es la base de en la entrada de datos con base en la experiencia y este estimulo provoca una respuesta

En el campo de la inteligencia artificial se refiere habitualmente de forma más sencilla como redes de neuronas o redes neuronales, las redes de neuronas artificiales (denominadas habitualmente como RNA o en inglés como: "ANN"[1]) son un paradigma de aprendizaje y procesamiento automático inspirado en la forma en que funciona el sistema nervioso de los animales. Se trata de un sistema de interconexión de neuronas en una red que colabora para producir un estímulo de salida.

Capa de Capa Capa de entrada oculta salida

Entrada 1

Salida

Entrada n

Red neuronal artificial perceptrón simple con n neuronas de entrada, m neuronas en su capa oculta y una neurona de salida.

Funcionamiento

Una de las misiones en una red neuronal consiste en simular las propiedades observadas en los sistemas neuronales biológicos a través de modelos matemáticos recreados mediante mecanismos artificiales (como un circuito integrado, un ordenador o un conjunto de válvulas). El objetivo es conseguir que las máquinas den respuestas similares a las que es capaz el cerebro que se caracterizan por su generalización y su robustez.

J i H

£3 Perceptrón con 2 entradas

25

Page 33: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Una red neuronal se compone de unidades llamadas neuronas. Cada neurona recibe una serie de entradas a través de interconexiones y emite una salida. Esta salida viene dada por tres funciones:

1. Una función de propagación (también conocida como función de excitación), que por lo general consiste en el sumatorio de cada entrada multiplicada por el peso de su interconexión (valor neto). Si el peso es positivo, la conexión se denomina excitatoria; si es negativo, se denomina inhibitoria.

2. Una función de activación, que modifica a la anterior. Puede no existir, siendo en este caso la salida la misma función de propagación.

3. Una función de transferencia, que se aplica al valor devuelto por la función de activación. Se utiliza para acotar la salida de la neurona y generalmente viene dada por la interpretación que queramos darle a dichas salidas. Algunas de las más utilizadas son la sigmoide (para obtener valores en el intervalo [0,1]) y la hiperbólica-tangente (para obtener valores en el intervalo [-1,1]).

Diseño y programación de una RNA

Con un paradigma convencional de programación en ingeniería del software, el objetivo del programador es modelar matemáticamente (con distintos grados de formalismo) el problema en cuestión y posteriormente formular una solución (programa) mediante un algoritmo codificado que tenga una serie de propiedades que permitan resolver dicho problema. En contraposición, la aproximación basada en las RNA parte de un conjunto de datos de entrada suficientemente significativo y el objetivo es conseguir que la red aprenda automáticamente las propiedades deseadas. En este sentido, el diseño de la red tiene menos que ver con cuestiones como los flujos de datos y la detección de condiciones, y más que ver con cuestiones tales como la selección del modelo de red, la de las variables a incorporar y el preprocesamiento de la información que formará el conjunto de entrenamiento. Asimismo, el proceso por el que los parámetros de la red se adecúan a la resolución de cada problema no se denomina genéricamente programación sino que se suele denominar entrenamiento.

Por ejemplo, en una red que se va a aplicar al diagnóstico de imágenes médicas; durante la fase de entrenamiento el sistema recibe imágenes de tejidos que se sabe son cancerígenos y tejidos que se sabe son sanos, así como las respectivas clasificaciones de dichas imágenes. Si el entrenamiento es el adecuado, una vez concluido, el sistema podrá recibir imágenes de tejidos no clasificados y obtener su clasificación sano/no sano con un buen grado de seguridad. Las variables de entrada pueden ser desde los puntos individuales de cada imagen hasta un vector de características de las mismas que se puedan incorporar al sistema (por ejemplo, procedencia anatómica del tejido de la imagen o la edad del paciente al que se le extrajo la muestra)

26

Page 34: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Estructura

La mayoría de los científicos coinciden en que una RNA es muy diferente en términos de estructura de un cerebro animal. Al igual que el cerebro, una RNA se compone de un conjunto masivamente paralelo de unidades de proceso muy simples y es en las conexiones entre estas unidades donde reside la inteligencia de la red. Sin embargo, en términos de escala, un cerebro es muchísimo mayor que cualquier RNA creada hasta la actualidad, y las neuronas artificiales también son más simples que su contrapartida animal.

Biológicamente, un cerebro aprende mediante la reorganización de las conexiones sinápticas entre las neuronas que lo componen. De la misma manera, las RNA tienen un gran número de procesadores virtuales interconectados que de forma simplificada simulan la funcionalidad de las neuronas biológicas. En esta simulación, la reorganización de las conexiones sinápticas biológicas se modela mediante un mecanismo de pesos, que son ajustados durante la fase de aprendizaje. En una RNA entrenada, el conjunto de los pesos determina el conocimiento de esa RNA y tiene la propiedad de resolver el problema para el que la RNA ha sido entrenada.

Por otra parte, en una RNA, además de los pesos y las conexiones, cada neurona tiene asociada una función matemática denominada función de transferencia. Dicha función genera la señal de salida de la neurona a partir de las señales de entrada. La entrada de la función es la suma de todas las señales de entrada por el peso asociado a la conexión de entrada de la señal. Algunos ejemplos de funciones de transferencia son la función escalón, la lineal o mixta, la sigmoidal y la función gaussiana.

Ventajas

Las Redes de Neuronas Artificiales (RNA) tienen muchas ventajas debido a que están basadas en la estructura del sistema nervioso, principalmente el cerebro.

• Aprendizaje: Las RNA tienen la habilidad de aprender mediante una etapa que se llama etapa de aprendizaje. Esta consiste en proporcionar a la RNA datos como entrada a su vez que se le indica cuál es la salida (respuesta) esperada.

• Auto organización: Una RNA crea su propia representación de la información en su interior, descargando al usuario de esto.

• Tolerancia a fallos. Debido a que una RNA almacena la información de forma redundante, ésta puede seguir respondiendo aceptablemente aún si se daña parcialmente.

• Flexibilidad: Una RNA puede manejar cambios no importantes en la información de entrada, como señales con ruido u otros cambios en la entrada (ej. si la información de entrada es la imagen de un objeto, la respuesta correspondiente no sufre cambios si la imagen cambia un poco su brillo o el objeto cambia ligeramente)

• Tiempo real: La estructura de una RNA es paralela, por lo cuál si esto es implementado con computadoras o en dispositivos electrónicos especiales, se pueden obtener respuestas en tiempo real.

21

Page 35: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Tipología de las RNA Modelos

Existe una serie de modelos que aparecen en la mayoría de estudios académicos y la bibliografía especializada.

Perceptrón Adaline Perceptrón multicapa Memorias asociativas Máquina de Bolzman Máquina de Cauchy Redes de Elman Redes de Hopfield Red de contrapropagación Redes de neuronas de base radial Redes de neuronas de aprendizaje competitivo Redes de Kohonen o mapas autoorganizados Crecimiento dinámico de células Gas Neuronal Creciente Redes ART (Adaptative Resonance Theory)

Topología

Una primera clasificación de las redes de neuronas artificiales que se suele hacer es en función del patrón de conexiones que presenta. Así se definen tres tipos básicos de redes:

• Dos tipos de redes de propagación hacia delante o acíclicas en las que todas las señales van desde la capa de entrada hacia la salida sin existir ciclos, ni conexiones entre neuronas de la misma capa.

o Monocapa. Ejemplos: perceptrón, Adaline. o Multicapa. Ejemplos: perceptrón multicapa.

• Las redes recurrentes que presentan al menos un ciclo cerrado de activación neuronal. Ejemplos: Elman, Hopfield, máquina de Bolzman.

28

Page 36: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Aprendizaje

Una segunda clasificación que se suele hacer es en función del tipo de aprendizaje de que es capaz (si necesita o no un conjunto de entrenamiento supervisado). Para cada tipo de aprendizaje encontramos varios modelos propuestos por diferentes autores:

• Aprendizaje supervisado: necesitan un conjunto de datos de entrada previamente clasificado o cuya respuesta objetivo se conoce. Ejemplos de este tipo de redes son: el perceptrón simple, la red Adaline, el perceptrón multicapa y la memoria asociativa bidireccional.

» Aprendizaje no supervisado o autoorganizado: no necesitan de tal conjunto previo. Ejemplos de este tipo de redes son: las memorias asociativas, las redes de Hopfield, la máquina de Bolzman y la máquina de Cauchy, las redes de aprendizaje competitivo, las redes de Kohonen o mapas autoorganizados y las redes de resonancia adaptativa (ART)

• Redes híbridas: son un enfoque mixto en el que se utiliza una función de mejora para facilitar la convergencia. Un ejemplo de este último tipo son las redes de base radial.

Tipo de entrada

Finalmente también se pueden clasificar las RNA según sean capaces de procesar información de distinto tipo en:

* Redes analógicas: procesan datos de entrada con valores continuos y, habitualmente, acotados. Ejemplos de este tipo de redes son: Hopfield, Kohonen y las redes de aprendizaje competitivo.

• Redes discretas: procesan datos de entrada de naturaleza discreta; habitualmente valores lógicos booleanos. Ejemplos de este segundo tipo de redes son: las máquinas de Bolzman y Cauchy, y la red discreta de Hopfield.

29

Page 37: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Aplicaciones

Las características de las RNA las hacen bastante apropiadas para aplicaciones en las que no se dispone a priori de un modelo identificable que pueda ser programado, pero se dispone de un conjunto básico de ejemplos de entrada (previamente clasificados o no). Asimismo, son altamente robustas tanto al ruido como a la disfunción de elementos concretos y son fácilmente paralelizables.

Esto incluye problemas de clasificación y reconocimiento de patrones de voz, imágenes, señales, etc. Asimismo se han utilizado para encontrar patrones de fraude económico, hacer predicciones en el mercado financiero, hacer predicciones de tiempo atmosférico, etc.

También se pueden utilizar cuando no existen modelos matemáticos precisos o algoritmos con complejidad razonable; por ejemplo la red de Kohonen ha sido aplicada con un éxito más que razonable al clásico problema del viajante (un problema para el que no se conoce solución algorítmica de complejidad polinómica).

Otro tipo espfecial de redes neuronales artificiales se ha aplicado en conjunción con los algoritmos genéticos (AG) para crear consoladores para robots. En este tipo de aplicación el genoma del AG lo constituyen los parámetros de la red (topología, algoritmo de aprendizaje, funciones de activación, etc.) y la adecuación de la red viene dada por la adecuación del comportamiento exhibido por el robot controlado (normalmente una simulación de dicho comportamiento)

2.3 Similitudes y diferencias entre el análisis multivariado y la red neural

En realidad en el tratamiento de entrada de datos es el mismo principio solo que la expresión de comportamiento es distinta, el análisis multivariado utiliza una ecuación deteminante con un comportamiento lineal y la red neural Logarítmico así:

ANÁLISIS MULTIVARIADO.- Indica un comportamiento Lineal del modelo. Las variables dicotómicas son lineales ya que las mismas son de la forma:

RED NEURAL.- Indica un comportamiento No Lineal del modelo. Las variables dicotómicas no son lineales ya que las mismas son de la forma:

P(Y = 1) = —^ l + e

Se tiene la idea que la red neural da mejores correlaciones, en realidad el análisis multivariado dará las mismas o mejores correlaciones si se recurre a la transformación de datos adecuada.

30

Page 38: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

CAPÍTULO III MÉTODO

3.1. Tipo de Investigación

• Correlaciona! : El caso en estudio es del tipo correlacional multivariada, ya que determina y mide las variables del Método de avalúo de Bienes Inmuebles a través de las técnicas del Análisis Multivariado (SPSS) y se apoya en la teoría de las Redes Neurales Artificiales (RNA) y con base en ello se establece una propuesta, (Ecuación de Predicción) se aplica y se evalúan los resultados.

3.2. Hipótesis:

H1: El valor de un bien inmueble calculado a partir de la aplicación del Análisis Multivariado (SPSS) es más justo y equitativo que el valor de un bien inmueble calculado por el Método de Mercado. (Homologación)

Esta investigación incluyó 35 avalúos relacionados con las distintas variables comprendidas en el estudio y los resultados fueron procesados en una versión en inglés del programa SSPS (Statistical Package for the Social Sciences), el cual también fue utilizado para llevar a cabo su análisis estadístico, por lo que algunas de las tablas de resultados se presentan en este idioma.

Una técnica para probar la relación que existe entre diversas variables es la regresión lineal, la cual es un procedimiento estadístico para estimar la ecuación de la recta que describe mejor la relación entre dos variables. La regresión lineal puede ser utilizada para resumir datos, pero también para analizar y explicar las relaciones que existen entre diversas variables (NORUSIS, 1993). La regresión lineal ha sido ampliamente utilizada por los investigadores en las ciencias sociales y de la conducta para explicar distintos fenómenos (LEWIS- BECK, 1980; SCHROEDER, SJOQUIST & STEPHAN, 1986.

Ciertamente, la regresión lineal establece una relación entre dos variables; sin embargo, generalmente los fenómenos no se encuentran relacionados con una sola variable. Consecuentemente, los investigadores han incorporado el uso de la correlación y regresión múltiple para obtener una explicación más completa.

La regresión múltiple o multivariada es un método estadístico caracterizado por la existencia de una variable dependiente "Y", la cual es vista como una función lineal de distintas variables independientes (BERRY, 1993; LEWIS-BECK, 1980).

31

Page 39: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Una de las preocupaciones principales de los investigadores que utilizan diseños de investigación explicativos es probar la validez de las relaciones que existen entre diversas variables. Estas relaciones, denominadas hipótesis o teorías, generalmente establecen la medida en que una variable dependiente es influenciada por una o más variables independientes (SCHROEDER, SJOQUIST & STEPHAN, 1986). Los investigadores y los especialistas en estadística han hecho uso de diferentes notaciones para representar la ecuación de la regresión lineal múltiple.

McGrath (1975) utiliza la siguiente ecuación para denotar un modelo lineal explicativo:

Y = RO XO + ÍJ1 XI + R2 X2 + Ii3 X3 + e

En esta ecuación, "Y" representa la variable dependiente, XO es una variable única, siempre igual a 1, mientras que XI, X2, y X3 simbolizan las variables dependientes, y S1, S2, y S3 denotan los coeficientes Beta o coeficientes de regresión parciales, los cuales representan la magnitud del cambio en la variable dependiente con los efectos de las otras variables independientes mantenidos constantes, o en otros términos, la contribución única de cada variable independiente (MCGRATH, 1975; BRYMAN & CRAMER, 1994). Desde el punto de vista de la investigación explicativa, los coeficientes de regresión parciales pueden ser interpretados como la medida del efecto o el impacto que cada X tiene sobre Y cuando todas las otras variables independientes son controladas o mantenidas constantes (BERRY, 1993; GRIM & YARNOLD, 1995).

__ Finalmente, el símbolo "e" en la ecuación de la regresión indica la proporción de la varianza que no es explicada por las variables independientes incluidas en la ecuación.

Los proyectos de investigación pueden ser diseñados para predecir o para explicar un fenómeno, aunque ambos propósitos no son mutuamente excluyentes puesto que explicación y predicción son conceptos complementarios e interrelacionados (GRIM & YARNOLD, 1995). "La investigación predictiva podría, por ejemplo, servir como una fuente de discernimientos y supuestos que conducen a formulaciones teóricas...la investigación explicativa puede ser utilizada como el medio más poderoso de predicción" (PEDHAZUR, 1982, p. 136).

Una de las formas de que el valor de una variable sea compatible con los valores de otras es transformando dicho valor a una escala logarítmica. En diversos estudios se ha transformado el valor de la variable a valores logarítmicos, puesto que esta variable es representada por una escala de valores muy grande. Tomando en consideración lo anterior, en este estudio las variables fueron transformadas a un orden de magnitud más bajo, utilizando valores logarítmicos v de esa forma ajustar sus valores antes de llevar a cabo las correlaciones y regresiones.

Consecuentemente, el modelo para las ecuaciones de esta investigación fue el de ecuaciones de regresión logarítmicas, el cual es representado por Finkelstein & Levin (1990) en los siguientes términos:

log Y = a + R1 XI + B2 X2 + Bk Xk + e

32

Page 40: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Como ha sido mencionado con anterioridad, la variable dependiente en una ecuación de una regresión múltiple es calculada por la suma de los factores explicativos más un término de error de dicho modelo. Los valores de los factores son denominados coeficientes de regresión parciales. Norussi (1993) Otros autores señalan que solamente si todas las variables independientes son medidas utilizando las mismas unidades, sus coeficientes podrán ser comparados directamente. Cuando las variables difieren substancialmente en sus unidades de medida, los coeficientes de la variable independiente deberán ser calculados en coeficientes Beta, los cuales pueden ser calculados directamente del coeficiente de regresión utilizando la siguiente ecuación (Norussi, 1993):

beta k = Bk = (Sk)Sy

donde Sk es la desviación estándar de cada variable independiente k y Sy la desviación estándar de la variable dependiente.

La primera fase del análisis estadístico consistió en realizar una primera corrida en el programa SPSS con los datos tal y cual como se sacaron de los 35 avalúos y se obtuvo de una tabla de los coeficientes de correlación de Pearson, incluyendo todas las variables consideradas en el estudio. Esto permitió la identificación de las variables independientes, con correlaciones significativas respecto a la variable dependiente, así como de aquellas en donde los coeficientes de correlación no eran significativos,. Asimismo, permitió identificar aquellas variables independientes que presentaban un alto grado de correlación entre ellas, en otras palabras, que variables presentaban un ajto grado de colinearidad

La siguiente fase del análisis estadístico consistió en revisar la forma en que se comportaron las variables y verificarla violación o no de los supuestos de la regresión..

Enseguida se propone la transformación de los datos de las variables a base logarítmica (Ln , Logaritmo Natural), por ser ésta la más apropiada para el caso en estudio. La opción de SPSS para llevar a cabo las regresiones fue "entered" ya que incluye y examina todas las variables en un solo paso.

Y finalmente se revisan los resultados de la segunda corrida y si éstos son satisfactorios en todos los supuestos se propone la Ecuación de Predicción.

33

Page 41: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

3.3 Modelo Operacional de las variables

X1

X2

X3

X4

X5

X6

X8

X9

X10

X11

Ubicación del bien con respecto a la zona

Ubicación del terreno con respecto a la manzana

Configuración topográfica del terreno

Superficie del terreno

Superficie de Construcción

No. de recamaras

X7 No de baños

Cajones de estacionamiento

Edad de la vivienda

Estado de conservación

Numero de niveles

VARIABLES INDEPENDIENTES

VARIABLE DEPENDIENTE

Valor Comercial de la casa

Y1

34

Page 42: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

3.4 Descripción de las variables

3.4.1. Variables independientes:

• X1 UBICACIÓN DEL BIEN CON RESPECTO A LA ZONA Ubicación 1 Regular Ubicación 2 Bueno Ubicación 3 Muy Bueno

• X2 UBICACIÓN DEL TERRENO CON RESPECTO A LA MANZANA. Ubicación 1 . Lote medianero Ubicación 2 : Lote en esquina Ubicación 3 Lote cabecera de manzana

• X3 CONFIGURACIÓN TOPOGRÁFICA DEL TERRENO : Configuración 1 . Con pendiente Configuración 2 : Sensiblemente plano Configuración 3 : Plano

• X4 SUPERFICIE DEL TERRENO: Superficie en M2.

• X5 SUPERFICIE DE CONSTRUCCIÓN: Superficie en M2

• X6 No. DE RECAMARAS: Cantidad en número.

• X7 No. DE BAÑOS: Cantidad en número

• X8 CAJONES DE ESTACIONAMIENTO : Cantidad en numero.

• X9 EDAD DE LA VIVIENDA : Cantidad en numero

• X10 ESTADO DE CONSERVACIÓN Estado 1 Malo Estado 2 Regular Estado 3 Bueno Estado 4 Muy Bueno Estado 5 Nuevo

• X11 NUMERO DE NIVELES Cantidad en numero

• X12 $/M2 DE CONSTRUCCIÓN Cantidad en número

Variable Dependiente: Y1 . VALOR DEL INMUEBLE:

Valor comercial de la vivienda en pesos ($)

Page 43: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Diseño de la Investigación.

• NO EXPERIMENTAL: Dada la dificultad por parte del investigador para manipular las variables del Método Análisis Multivariado, en la aplicación de avalúo de Bienes Inmuebles, solo se estudia el fenómeno en su contexto natural.

PROCEDIMIENTO Y MÉTODO :

• Primer paso:

Se hace la primera corrida tomando en cuenta todas las variables propuestas, con datos sin transformar.

• Segundo paso:

Se analizan los resultados y se desechan las variables espurias.

• Tercer paso:

Se revisa el Coeficiente de Correlación "R2"

Si R2 > 0.85 es aceptable y quiere decir que las variables del modelo están prediciendo el valor con un 85 % de confianza y nos quedamos con ella.

• Cuarto paso:

Valorar los supuestos de :

• NORMALIDAD ~"i ver que los datos estén normalizados y lineales • LINEALIDAD J~

• HOMOCEDASTICIDAD ~ 1 _ ver el ruido y rebote de datos • HETEROESTACIDAD J

• OUTLIERS • ver los datos fuera de rango (datos mentirosos)

Revisar las gráficas . Si hay ruido hay que quitarlo

36

Page 44: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

• Quinto paso:

Se hace la Transformación de los Datos.

La matriz propuesta se transforma, utilizando Ln (Logaritmo Natural)

Se hace una segunda corrida con datos transformados.

Se revisan los supuestos.

Se estima el modelo de regresión que mas se adecué.

• Sexto paso:

Se determina la Ecuación de Predicción:

Y = Ln(X1) + Ln(X2) + Ln(X3) + + Ln(Xn)

• Séptimo paso:

Entonces a futuro yo tengo una casa del tipo medio, en la cual se pretende conocer su Valor Comercial, se procede a :

Aplicar la Ecuación de Predicción obtenida, como un ejemplo de aplicación..

Se analiza el resultado obtenido.

Se hacen las conclusiones y recomendaciones pertinentes

Page 45: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

CAPÍTULO IV: ANÁLISIS MULTIVARIADO DEL VALOR COMERCIAL DEL INMUEBLE.

(DATOS, SIN TRANSFORMAR)

Paso 1

Definición del Problema de Investigación

El modelo, los datos y su respectivo análisis deberán proporcionarnos un entendimiento, explicación, y predicción en la relación estadística que existe entre el valor comercial de un inmueble y las variables seleccionadas, conocer que tanta fuerza de asociación (dependencia), y que tan sensible y/o vulnerable es valor comercial ante los cambios de las demás variables.

Objetivo

Desarrollar un modelo estadístico que nos permita determinar la fuerza de asociación (covariación), entre el Valor Comercial del inmueble (variable criterio) y las variables consideradas (variables de predicción), con la intención de determinar que tan vulnerable es el valor comercial ante el movimiento de alguna o algunas de estes variables relacionadas con el.

El problema es apropiado para ser resuelto por el método de regresión múltiple?

Si, ya que deseamos buscar una asociación (correlación) entre el valor comercial del inmueble y las variables asociadas. Así como encontrar un modelo estadístico por medio de una ecuación de predicción del comportamiento. Por otro lado todas ellas están expresadas en una escala de razón ó métrica y en mismas fechas de ocurrencia, por lo que la escala permite utilizar la estadística paramétrica.

Por lo tanto el problema cuenta con las características para ser resuelto por el método de análisis multivariado, y con el apoyo de la teoría de red neural.

38

Page 46: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Selección de variable dependiente e independientes.-

NUMERO DE DATOS : 35 VARIABLE INDEPENDIENTE : 1 VARIABLES INDEPENDIENTES : 12

DESCRIPCIÓN DE LAS VARIABLES

VARIABLE

(1) Valor Comercial de la casa

(1) Ubicación en la zona

(2) Ubicación del terreno con respecto a la manzana

(3) Configuración topográfica del terreno.

(4) Superficie del terreno

(5) Superficie de construcción

" (6) Numero de recámaras

(7) Numero de baños

(8) Cajones, de estacionamiento

(9) Edad de la vivienda

(10) Estado de conservación

(11) Numero de Niveles

(12) $ / M2 de construcción

CLASE

Dependiente

Independiente

Independiente

Independiente

Independiente

Independiente

Independiente

Independiente

Independiente

Independiente

Independiente

Independiente

Independiente

TIPO

Métrica

String

String

String

Métrica

Métrica

Métrica

Métrica

Métrica

Métrica

String

Métrica

Métrica

VARIABLE DEPENDIENTE:

o Valor Comercial del Inmueble.- (variable métrica) Es el valor (justo de mercado) en dinero (pesos) conclusivo que lleva

acabo el valuador ponderando los resultados de los diferentes enfoques utilizados en la valuación de un bien raiz.

39

Page 47: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

VARIABLES INDEPENDIENTES

(1) Ubicación en la zona : (variable string) Se refiere a la afectación del valor de un predio según su ubicación dentro de un area de valor especifica, y pueden ser

(1) Regular (2) Bueno (3) Muy bueno

(2) Ubicación del terreno con respecto a la manzana (vanable stnng) Significa en donde se encuentra localizado el predio con relación a la manzana y pueden ser

(1) Lote medianero (2) Lote en esquina (3) Cabecera de manzana

(3) Configuración topográfica del terreno (variable stnng) Consiste en señalar los accidentes topográficos del terreno en cuestión, que podrían ser

(1) Con pendiente (2) Sensiblemente plano (3) Plano

(4) Superficie del terreno (variable métrica) Es el total de metros cuadrados del terreno

(5) Superficie de construcción (variable métnca) Es el total de metros cuadrados construidos en toda la vivienda

(6) Numero de recamaras (variable métrica) Es el total de recamaras existentes en la vivienda.

(7) Numero de baños (variable métnca) Es el total de baños existentes en la vivienda

(8) Cajones de estacionamiento (vanable métrica) Es el total de espacios destinados para la guarda de vehículos dentro de la vivienda

(9) Edad de la vivienda (vanable métrica) Es el numero de anos transcurridos desde la construcción o puesta en marcha original de la vivienda

(10) Estado de conservación (variable stnng) Son las condiciones en las que se encuentra la vivienda y pueden ser

(1)Malo (2)Regular (3)Bueno (4)Muy Bueno (5)Nuevo

(11) Numero de niveles (variable métrica) Es el total de pisos o niveles con los que cuenta la vivienda

(12) Relación Valor comercial I m2 de construcción (vanable métnca) Es la razón matemática que relaciona el valor comercial de cada bien inmueble entre los metros cuadrados totales construidos

40

Page 48: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Paso 2

Tamaño de la muestra

La muestra se obtuvo mediante una investigación de 35 avalúos bancarios practicados por un profesional en valuación en la Ciudad de Zapopan, Jalisco, durante el ano 2006.

El tipo de vivienda al cual fue enfocada la investigación es de tipo Medio, con un Rango de Valor Comercial que fluctúa desde $ 1 '000,000.00 hasta los $ 2'000,000.00

Teniendo en cuenta el radio de observaciones recomendado por el libro Multivariate Data Analysis With Readings de JosephF. Hair, para no afectar la potencia de la regresión ni la R2, se optó por tomar el tamaño de muestra de la Ciudad de Zapopan, esto es, de 35 observaciones por variable del bien inmueble, así pues no se infringe la relación menos de 5 observaciones por variable, ni más de 1000, teniendo así un tamaño adecuado de muestra.

Como se menciona se tiene una relación lineal entre las variables métricas, por lo tanto no se utilizarán ni se necesitan variables adicionales ni variables dummy.

A continuación se presenta la base de datos de la muestra de 455 observaciones correspondiente a la siguiente matriz obtenida en la investigación :

41

Page 49: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

z o o <. m < X

< (0

<

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

z •o o < o m

Mariano Otero 5095 La Calma Zapopan

Santa Elena 172 El Capullo Zapopan

Corona Boreal 4012 Arboledas Zapopan

Serenidad 19 San Isidro Zapopan

Av. Guadalupe 6460 Parque Guadalupe Zapopan

Paseo del Castillo 60-31 San Isidro Zapopan

Felipe Zetter 5407 Paseos del Sol Zapopan

Daniel Combonie 855 Hda. la Herradura Zapopar

Frank Shuberth 5676 La Estancia Zapopan

Avila Camacho 3254 Res. Patria Zapopan

Rinconada de la Almería 1476 Las Alamedas Zap

Alíioth 4172 Residencial Arboledas Zapopan

Galileo Galilei 4120 Arboledas Zapopan

Mozart 5651 La Estancia Zapopan

Volcan Qurnceo 139 E! Colli Zapopan

Mariano Otero 5203 Arboledas Zapopan

Av Guadalupe 2280 Bugamb. Country Zapopan

Nicolas Copernico 4314 Arboledas Zapopan

Camino Antiguo a Tesistan 1690 Zapopan

Volcan Paricutm 4590 El Coli) Urbano Zapopan

Y=VARIABLE

DEPENDIENTE

< CO

<

< UJ

o _ l < o te UJ E O O tx o _ i

2 $ 1,584,000.00

$ 970,000.00

$ 1,190,000.00

$ 980,000.00

$ 1,600,000.00

$ 1,507,000.00

$ 2,000,000.00

$ 1,770,000.00

$ 1,366,000.00

$ 1,680,000 00

$ 1,121,000.00

$ 994,000 00

$ 1,976,000 00

$ 2,200,000.00

S 920,000 00

$ 1,455,000.00

S 1,300,000.00

S 1,768,000 00

$ 975,000 00

$ 1,403.000 00

VARIABLES INDEPENDIENTES

X1

u

_2 3 O l

¿i —. 0)

m

fi < — - 1 O Z = UJ 0)

ü < o m

2

1

3

1

2

1

2

1

3

3

2

3

3

3

2

3

2

3

1

2

X2

21 " - K O

TO

o u UJ « *S o: 5 o (K < ^ UJ y !?.

ii

2 O T

§ S i a JD UJ 0) CD

3 a: s E

2

2

2

1

2

X3

ni s a < o < *

s i Z Ü «i •O -p o-O - " . 2 < =

S o l U- a —

O UJ 5 3

2

3

2

3

3

3

3

2

3

2

2

3

3

2

3

3

3

2

3

E. O z UJ a: K UJ H-- J UJ a o UJ z o CO Z tu E

35:50 x 8.00

18.00x11.00

8.00x25.00

18-90x7.00

6.00x17.00

23.00x7.00

9.00x27.50

7.55x19.25

S.00 x 25.02

8.69 x 16.89

18.70x7.00

18.40 x 7.00

29.20 x 8.50

8.00 x 25.09

16 46x6.36

32.50 x 8 00

19.75x6.60

8 00 x 35 00

6 00 x 19 00

18 17x7 10

X4

E O z UJ DI cu UJ 1 -_ l UJ

o a t o LL. ce UJ

a.

284.00

198.00

200.00

132.30

102.00

161.00

247.50

145.34

200.16

146.77

130.90

128 80

248.20

200 72

104 68

260 00

130.35

280 00

114 00

129 00

X5

£ z • O

o o ZJ OL

\-co z o o UJ o UJ

o u . DL su a. =i co

215.56

140.00

273.00

140 75

163.00

158.00

271.00

206.00

133.00

197.00

91 00

88.24

217.00

244 00

126 62

179 00

135 00

236 00

121 00

144 00

X6

g co <

E •< o UJ

a: UJ

a o o: UJ

•=) Z

2

3

3

3

3

2

3

3

3

3

3

3

4

5

3

4

3

3

3

3

X7

<o O z < m UJ

a o QL UJ

E

z

2

2.5

2

2 5

2.5

2.5

2 5

2.5

2

2.5

2

2.5

3

4

2 5

3

3

2 5

3

2 5

X8

sr o i -z UJ

< z o o < t-V) UJ UJ a co UJ z o —> < o 2

1

1

2

2

2

2

2

2

2

1

2

2

2

2

2

2

2

2

1

X9

o 1^ co c ai

O z UJ

> > < _ l UJ

a a < a UJ

25

30

27

0

0

0

22

0

3

5

0

8

17

16

0

25

0

30

0

0

X10

-g 2 JS ¡i tu — o

ís¡ o £¿£ o "o 3-i s a -i -3 UJ s a

CO ^ >>

o — * ^ -D m

SI U J 3

3

3

2

5

5

5

3

3

4

4

5

3

3

4

5

3

5

3

5

5

X11

co UJ _ j UJ > z t u a o ce UJ

Z

1

1

1

2

1

2

2

2

1

2

1

2

2

2

2

2

2

2

2

2

X12

UJ

a CM

< O

or UJ

o o rr O

sí !i 31 UJ O o: o

$ 7,348.30

$ 6,928.57

$ 4,358.97

$ 6,96270

$ 9,815.95

$ 9,537.97

$ 7,380.07

$ 8,592.23

$ 10,270.68

$ 8,527.92

$ 12,318.68

$ 11,26473

$ 9,105.99

$ 9,016.39

$ 7,265.83

$ 8,128 49

$ 9,629.63

$ 7,491.53

S 8,057 85

S 9,743.06

Page 50: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

w

in

>

< O

c oí

a.

¡a

c TJ CP

01

tO

K)

O) O

O

O

3-

01

TJ 8L

o>

N

0

] X

! O

T

J 0)

:3

CO

-

J 4

>

0 0 0 0 0 CJ

LO

-0 O

O

X

to

4» ho

to

0 b 0 03

CO

b 0 0 to

Ul

Kl

O

Ji to

O

K>

O

>

Q.

O

C

X a:

c X

«;

01

cj

to

ro

<

07

&

C

3 <'

CD

a.

0) •_

N

01

TJ O

"O

0]

in

IO

L0

O

O

O

O

O

O

CJ

LO

Ul

O

X

Is)

O b 0 Ul

O

O

O to

Ul

01

0 0 LO

LO

ro

en

•&

.

K)

4f>

CO

"CD

C

O

W

CO

O

O 3 3 0 0 « 0 01

a.

01

•vi

Ol

CO

"0

3 a 0 w

a.

en

CI

<t

IM

TJ O

TJ 0) ho

to

0 0 0 0 0 N>

M

0=

0 0 X ho

ho

-fe.

-^1

CO

U

l ho

to

CO

0 0 to

ho

ro

ho

IM

w

W

CD

a>

(J

N)

CO

w

ho

33

CP

O

3 CD

0

1 a 0 01

Ul

Ul

01 I 0>

0 in

3 a.

01

Ul

-t

IP

TJ m

<

Dl

n N

•i

TJ O

•a

o>

3 CD

C

O

O

O

O

O

O ro

CO

CO

4*

O

X ho

0 0 0 0 bo

0 0 LO

0 0 CO

M

Ul

ro

4».

*.

to

10

Ul

ho

4*.

ho w

53

0 -\

c 0 to

CO

-J r*

01 >

CQ

e 0) en

N

oi

"O

O

-a

3 *•

ai

0 0 0 0 0 ro

ho

-j

0 a X CD

b 0 to

CO

b 0 Ul

01 b 0 to

ro

- ho

0 to

ho

-J w

4-

01

w

0 H

0 Q.

O"

TJ

CD

O

00

--1

hO

TJ

01

CO

CD

O

Ul

D.

Ü

Cfl

O

N

01

"O

0 TJ 03

3 C

J

O

O

O

O

O

O

M

ho

0 0 X CO

w

0 LO

Ul

O

IO

Ul

b 0 to

is)

Ui

M

O

Ui

ho

0 en

0 b 0

K)

CO

&

(/1

0 ip

m

Ul

Ul

to

CO

>

0 0 cn a.

rp

O

e 0) a 01

c (P

N

01

TJ O

TJ 01

3 W

-

J -

J

O

O

O b 0 M

to

-J

O

O

X to

ID

bo

0 0 co

0)

0 ho

CO

b 0 w

to

ho

0 LO

_,

is 0 Vi

Ul

CO

CO

>

3 i 01

LO

a>

to

4a

-r-

0 3 •1

CO

0 3 &•

N

01

•a

0 •0 0)

3 40

CD

-

J O

O

O

b 0 LO

to

at

LO

Ul

X

~¿

C

D

'•P*

O

ho

to

to

w

b 0 w

M

Ul

N)

ui

to

IS)

in

CO

"•

vl

to

ho

Co

•vl

0 (3

(0

txt

<

0 to 5 0 T

J 0

1 %

0 <n

a CP_

W

0 N

Q)

TJ O

T3 0)

3 in LO

O

) C

Jl

0 0 0 b 0 ho

to

to

to

Ul

0 X

CO

01

0 CD

¡O

Ul

to

b 0 iy>

CO

- <D

W

K)

«A

O)

"ro

to

0 *w

to

10

en

CO

0

1 01

O

c a.

01

w

to

N

r-

0 3 01

CO

0 3 W

N

01

TJ O

TJ 03

3 O

C

O

O

O

O b 0 to

_L b 0 X

CO

b 0 0)

0 b 0 o>

b 0 CO

to

Ul

- M

Ul

w - -J

Is)

tn

w

3 C_ s 3 CO

0 en

0 0 *

• to

CO

C

D 5"

3 01

w

a.

m

G)

0) a 1 T

J fp

*N

0)

TJ to

0 0 0 0 b 0 to

w

^1 bo

Ul

X IS

01

0 i! ^ ho

01 b 0 41

CJ to

-J «.

ho

<a

~w

00

0) ho

OS

to

J>

r-

0 3 Dl

cn

<

3.

ED

C

D

ro

0 r-

0 3 0)

cn a (p

fp 3 0 N

01

TJ 0 TJ 01

tf

l

O

tJ

O

O

O b 0 - to

CO

b 0 X —̂

0

9 b 0 b 0 to

w

CO

b 0 w

ro

Ul

-i

to

tn

(j ho

Ul

CO

ID

-&

. to

0

1

to

w

<

0)_

cb~

a.

m

W

01

3 Tl $ 3 O

35'

0 0 ¡0

w

<; i a.

(P g C

D

N

01

0 Ul

to

0 0 0 b 0 - LO

Ol b 0 X

-J

U>

O

O

Ul b 0 to

4».

b 0 LO

to

Ul

to

0 Ui

ho

CO

'J

i-C

O

LO

CO

-J

to

TJ

01 D

3"

01

3 cn

01

Ul

O)

0 z 1 Q.

(P

N

01

TJ O

TJ 0)

3 to

0 0 0 0 b 0 ro

to

Ui

b 0 X 01 b 0 to

0 b 0 Isj

to

b 0 co

to

Ul

- O)

CO

W

tV)

-J

OJ

CD

0

0 y

_1

0 -1

X

0 0) n c CD

8 0 ^1

-1

to ET

cn

Í c oT

tn N

D)

TJ O

TJ 01

3 ÜJ

0 0 0 0 b 0 Is

)

W

-J

b 0 X _k

(D

b 0 LO

LO

b 0 W

CO

b 0 is)

to

- Ul

tJ Isl

CO

C

O

. 0 U

l C

O

CA

SA

HA

BIT

AC

IÓN

UB

ICA

CIÓ

N

VA

LO

R C

OM

ER

CIA

L D

E L

A C

AS

A (

$}

UB

ICA

CIÓ

N E

N L

A Z

ON

A

(1) R

eg

ula

r (2

) B

ue

no

(3)

Mu

y B

ue

no

UB

ICA

CIÓ

N D

EL

TE

RR

EN

O C

ON

RE

SP

EC

TO

A

LA M

AN

ZA

NA

(1

) M

ed

ian e

ro {2

) E

squ

ina

(3)C

ab

ece

ra d

e m

an

zan

a)

CO

NF

IGU

RA

CIÓ

N

TO

PO

GR

ÁF

ICA

D

EL

TE

RR

EN

O

(1)

Co

n p

en

die

nte

- (2

) se

nci

ble

me

nte

pla

no

-(3

) P

lan

o

i D

IME

NS

ION

ES

DE

L T

ER

RE

NO

(m)

SU

PE

RF

ICIE

DE

L T

ER

RE

NO

(m2)

SU

PE

RF

ICIE

DE

CO

NS

TR

UC

CIÓ

N (m

2)

ME

RO

DE

RE

MA

RA

S (#

)

ME

RO

DE

BA

ÑO

S (#

)

CA

JON

ES

DE

ES

TA

CIO

NA

MIÉ

NT

0(#

)

ED

AD

DE

LA

VlV

IÉN

DA

fen

os)

ES

TA

DO

DE

CO

NS

ER

VA

CIÓ

N (E

sca

la d

e L

ike

r d

el 1

-5)

(1) M

alo

(2

) Re

gu

lar (

3) B

ue

no

(4)

Mu

y B

ue

no

(5)

NU

evo

NU

ME

RO

DE

NIV

EL

ES

RE

LA

CIÓ

N

VA

LO

R

CO

ME

RC

IAL

/ M

2 D

E

CO

NS

TR

UC

CIÓ

N

Page 51: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Paso 3:

Supuestos en el análisis de regresión múltiple:

1.- LINEALIDAD, la linealidad en el fenómeno de medida.

2.- HOMOCEDASTICIDAD, la varianza constante en los términos de error.

3.- INDEPENDENCIA, la Independencia en los términos del error.

4.- NORMALIDAD, la normalidad de la distribución de los términos del error.

5.- OUTLIERS, datos fuera del límite de control.

Como paso inicial se procede ha realizar una corrida para determinar las posibles violaciones a los supuestos como para ver el comportamiento de la correlación entre las variables, esto se realizó con los datos normales tal y como se extrajo la muestra, análisis por niveles (con datos sin transformar).

A continuación se presentan los resultados obtenidos en la primera corrida en el programa SPSS.:

Page 52: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

CORRIDA #1

DA TOS SIN TRANSFORMAR

PROGRAMA SPSS

Page 53: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

C \WINDOWS\Desktop\TESIS MAESTRIAUose Ma Rdgz BUENO\Chema1 sav

vaiorcom ubicazon , ubicatm topogra supterr supconst nrecama nbaños

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

$1584000

$970 000

$1190000

$980,000

$1600000

$1507000

$2000000

$1770000

$1366000

$1680000

$1121000

$994,000

$1976000

$2200000

$920,000

$1455000

$1300000

$1768000

$975,000

$1403000

$1220000

$910 000

$1052000

$1403000

$2110000

$1081000

$1365000

$1197000

$1377000

$1370000

i . 1

2 1 3

1 1 2 i

3 1 3

1 1 2

2

1 2

2 1

1

3

3

2

3

3

3

2

3

2

3

1

2

2

2 2

2 1

3

3

3

2

3

2

2

3

3

2

3

3

3

2

3

3

2 1 2

1 1 3

1 1 3

2 1 I

3 | 1

2

3

2

2

2 1

3

1

2

2

2

2

284 00

198 00

200 00

132 30

102 00

161 00

247 50

145 34

200 16

146 77

130 90

128 80

248 20

200 72

104 68

260 00

130 35

280 00

114 00

129 00

133 00

90 00

105 00

144 00

177 41

160 00

191 25

123 19

208 60

13810

i

215 56

140 00

273 00

140 75

163 00

158 00

271 00

206 00

133 00

197 00

91 00

88 24

217 00

244 00

126 62

179 00

135 00

236 00

121 00

144 00

138 00

123 00

124 00

238 00

226 00

146 00

217 00

137 00

moo mm

2

3

3

3

3

2

3

3

3

3

3

3

4

5

3

4

3

3

3

3

2

3

3

3

4

3

3

3

3

§

2

3

2

3

3

3

3

3

2

3

2

3

3

4

3

3

3

3

3

3

2

3

3

3

3

3

3

3

2;

§

Page 54: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

C.\WINDOWS\Desktop\TESIS MAESTRIAVJosé Ma Rdgz BUEN0\Chema1.sav

cajesta edadvivi edocons nniveles m2const

1

2

3

4

5

2

1

1

4.

2 ,

25

30

27

0

0

3

3

2

5

5

1

1

1

2

1 h

$7348 3

$6928 6

$4359 0

$6962.7

$9816.0

6

7

8

9

10

11

12

13

14

15

16

17

18

19

2

2

2

2

2

1

2

2

_ 2

2

2

2

2

2

0

22

0

3

5

0

8

17

16

0

25

0

30

0

5

3

3

4

4

5

3

3

4

5

3

5

3

5

2

2

2

1

2

* 1

2

2

2

2

2

2

2

2

$9538.0

$7380.1

$8592.2

$10271

$8527.9

$12319

$11265

$9106.0

$9016.4

$7265.8

$8128.5

$9629.6

$7491.5

$8057 9

20 $9743 1

21

22

23

24

25

1

1

2

1

2

15

6

0

25

7

3

3

5

3

4

2

3

2

2

2

$8840 6

$7398 4

$8483 9

$5895 0

$9336 3

26

27

28

2a

30

. 1

1

1

2

2

2

25

19

15

1U

0

3

3

3

5

• 1

1

2

2

i

2

• 1

$7404 1

$6290.3

$8737.2

Si 0756

$10960

Page 55: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

C \WINDOWS\Desktop\TESIS MAESTRIAUosé Ma. Rdgz BUENO\Chema1.sav

valorcom ubicazon ubicatm ' topogra ' supterr supconst ! nrecama nbaños I

31

32

33

34

35

1

$1146000

$981,000

$1233000

$2300000

$1874000

i

2

2

2

3

3

1

1

2

1

1

1

1

2

3

2

3

3

1

133.00 !

I 100.80

179.52 ,

250.00

170 00

156.00

103.00

128.00

256.00

183 00

3

3

3

3

3

2 ;

3

2 , I

3 I

3

Page 56: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

C \WINDOWS\Desktop\TESIS MAESTRIA\José Ma. Rdgz BUEN0\Chema1 sav

cajesta edadvivi ' edocons nniveles ¡ m2const '<

3 1 <

32

33

34

35

1

2

2

2

2

1 20

i

4

22

15

0

1

3

4

3

4

4

\. 2

2

2 I

2

2 i

$7346.2

$9524 3

$9632.8

$8984.4

$10240

Page 57: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Regression

Descriptive Statistics

Valor Comercial

Cajones Estacionamiento Edad de la Vivienda en años Estado de Conservación Costo M2 de Construcción Número de Baños

No. de Niveles Número de Recamaras Superficie Construcción Superficie de Terreno TOPOGRA UBICATM Ubicación en la Zona

Mean ********

1.71

11.17

3.74

$8616.49

2.53

1.80

3.06

168.7763

166.9883

2.54 1.17

2.14

Std. Deviation $390437

46

10.72

92

$1641.62

.42

.47

.54

52.6345

54.3727

.56

.38

.73

N 35

35

35

35

35

35

35

35

35

35

35 35

35

Page 58: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Correlations

Pearson Valor Comercial Correlation Cajones

Estacionamiento Edad de la Vivienda en años Estado de Conservación

Costo M2 de Construcción Numero de Baños No de Niveles Numero de Recamaras Superfiae Construcaon Superficie de Terreno TOPOGRA UBICATM Ubicación en la Zona

Sig Valor Comeraal (1-tailed) Cajones

Estacionamiento Edad de la Vivienda en años Estado de Conservaaon Costo M2 de Construcaon Numero de Baños No de Niveles Numero de Recamaras Superficie Construcaon Superficie de Terreno TOPOGRA UBICATM Ubicaaón en la Zona

Valor Comercial

1 000

378

131

-074

125

451

079

392

753

597

603 116

346

013

227

336

237

003

326

010

000

000

000 253

021

Cajones Estacionamiento

378

1 000

-331

309

377

273

136

187

027

190

278 120

125

013

026

035

013

056

218

141

440

138

053 246

237

Edad de la

Vivienda en años

131

-331

1 000

-799

-572

-044

-208

095

511

656

' -021 -015

281

227

026

000

000

402

116

294

001

000

453 467

051

Estado de Conservación

-074

309

-799

1 000

450

211

081

-029

-403

-475

051 129

-337

336

035

000

003

112

321

435

008

002

386 230

024

Costo M2 de

Construcción 125

377

-572

450

1 000

-033

-056

055

-518

-189

-036 110

146

237

013

000

003

426

374

378

001

139

418 264

201

Page 59: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Correlations

Pearson Valor Comercial Correlation Cajones

Estacionamiento Edad de la Vivienda en años Estado de Conservación Costo M2 de Construcción Número de Baños No. de Niveles Número de Recamaras Superficie Construcción Superficie de Terreno TOPOGRA UBICATM Ubicación en la Zona

Sig. Valor Comercial (1-taiJed) Cajones

Estacionamiento Edad de la Vivienda en años Estado de Conservación Costo M2 de Construcción Número de Baños

No de Niveles Número de Recamaras Superficie Construcción Superficie de Terreno TOPOGRA UBICATM Ubicación en la Zona

Número de Baños

451

273

-044

211

-033

1.000

401

708

322

110

.245

.244

.130

.003

.056

.402

.112

426

009

000

030

265

078 079

229

No. de Niveles

079

136

-208

081

-056

401

1.000

162

018

-.257

200

195

-085

.326

.218

.116

.321

.374

.009

177

460

068

125 131

314

Número de Recamaras

392

187

095

-029

055

708

162

1.000

270

176

089 094

351

.010

.141

.294

435

378

000

177

058

156

306 296

019

Superficie Construcción

753

027

511

-403

-518

322

018

.270

1.000

.654

.552 014

.242

.000

440

.001

008

.001

030

460

058

000

000 469

081

Superficie de

Terreno 597

190

656

-475

- 189

110

-257

176

654

1.000

.272

-.010

393

.000

.138

.000

002

139

265

068

156

000

057 477

010

TOPOGRA 603

278

-021

051

-036

245

200

089

.552

.272

1.000 239

.020

.000

.053

.453

.386

418

078

125

306

000

057

083

454

Page 60: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Correlations

Pearson Valor Comercial Correlation Cajones

Estacionamiento

Edad de la Vivienda en años Estado de Conservación Costo M2 de Construcción Número de Baños No. de Niveles Número de Recamaras Superfide Construcción

Superfide de Terreno TOPOGRA UBICATM Ubicadón en la Zona

Sig. Valor Comercial (1-tailed) Cajones

Estadonamíento Edad de la Vivienda en años Estado de Conservación Costo M2 de Construcción Número de Baños No. de Niveles Número de Recamaras Superfide Construcción

Superficie de Terreno TOPOGRA UBICATM Ubicadón en la Zona

UBICATM .116

120

-.015

.129

.110

.244

.195

.094

.014

-.010

.239 1.000

.120

.253

.246

.467

.230

.264

.079

.131

.296

.469

.477

083

.246

Ubicación en la Zona

.346

.125

.281

-.337

.146

.130

-.085

.351

.242

.393

.020

.120

1.000

.021

.237

.051

.024

.201

.229

.314

.019

081

.010

.454 246

Page 61: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Variables Entered/Removed*1

Model 1

Vanables Entered

Ubicadón en la Zona, TOPOGR A, Costo M2de Construe ción, No de Niveles, UBICAT M, Número de Recamar as, Cajones Estadona miento, Estado de Conserva ción, Superficie de Terreno, Número de Baños, Superficie Construe don, Edad déla Vivienda en años3

Vanables Removed Method

Enter

*

a. All requested variables entered.

b. Dependent Variable: Valor Comercial

Model Summary13

Model 1

R 976a

R Square 953

Adjusted R Square

927

Std Error of

the Estimate

Page 62: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Model Summary15

Model 1

Change Statistics R

Square Change

953 F Change

37 229 df1

12 df2

22

Sig. F Change

000 Durbm-Watson

2.125

a. Predictors: (Constant), Ubicación en la Zona, TOPOGRA, Costo M2 de Construcción, No. de Niveles, UBICATM, Número de Recamaras, Cajones Estacionamiento, Estado de Conservación, Superficie de Terreno, Número de Baños, Superficie Construcción, Edad de la Vivienda en años

b Dependent Vanable Valor Comercial

ANOVA"

Model 1 Regression

Residual Total

Sum of Squares 4.9E+12 2.4E+11 5.2E+12

df 12 22 34

Mean Square 4.1E+11 1.1E+10

F 37.229

Sig. .000a

a. Predictors: (Constant), Ubicación en la Zona, TOPOGRA, Costo M2 de Construcción, No. de Niveles, UBICATM, Número de Recamaras, Cajones Estacionamiento, Estado de Conservación, Superficie de Terreno, Número de Baños, Superficie Construcción, Edad de la Vivienda en años

b. Dependent Variable: Valor Comercial

Page 63: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Coefficients3

Model 1 (Constant)

Cajones Estacionamiento Edad de la Vivienda en años Estado de Conservaaón Costo M2 de Construcción Número de Baños No. de Niveles Número de Recamaras Superficie Construcción Superficie de Terreno TOPOGRA UBICATM Ubicación en la Zona

Unstandardized Coefficients

B 9 275E-09

-1 61E-09

7 425E-10

1 617E-09

1.000

3.146E-09

-1.17E-09

-7.23E-10

1.000

-Z37E-09

5.682E-10 -1.74E-09

1.604E-09

Std Error 000

000

000

000

000

000

.000

.000

.000

000

.000 000

.000

Standardi zed

Coefficie nts

Beta

000

000

000

765

000

.000

.000

1.157

.000

.000

.000

.000

t 071

-261

296

122

7.9E+07

187

-183

-.058

9.2E+07

-252

067

-279

.331

Sig 944

797

770

904

000

854

.856

.955

.000

803

.947 783

.744

95% Confidence Interval for B

Lower Bound

000

000

000

000

1.000

000

000

000

1.000

000

.000 000

000

Upper Bound

000

000

000

000

1.000

.000

000

.000

1.000

.000

000 000

.000

Page 64: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Collinearity Diagnostics3

Model 1

Dimension 1

2 3 4 5

6 7 8 9 10 11 12 13

Eigenvalue 11 972

588 101

9 303E-02

6 607E-02 5 891E-02 4132E-02 3 000E-02 1 747E-02

1.582E-02 8.999E-03 4.921 E-03 2.995E-03

Condition Index

1 000 4 514

10910

11 344

13 462 14 256

17 022 19.977 26 179

27 511 36.475 49.323 63.221

Page 65: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Collinearity Diagnostics3

Model Dimension 1 1

2 3 4 5 6 7 8 9 10 11 12 13

Vanance Proportions

TOPOGRA 00 00 01 02 01 02 00 14 30 02 45 01 02

UBICATM 00 00 11 28 35 05 00 06 03 02 06 03 01

Ubicación en la Zona

00 00 25 10 03 23 01 02 00 25 11 00 00

a Dependent Vanable Valor Comercial

Residuals Statistics3

Predicted Value

Residual Std Predicted Value Std Residual

Minimum

$862497

-$210760

-1 438

-2 004

Maximum

$119656

2 195

1 138

Mean

$00

000

000

Std Deviaton

$381165

$84584 4

1 000

804

N

35

35

35

35

a Dependent Vanable Valor Comercial

Charts

Page 66: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Histogram

Dependent Variable: Valor Comercial

iT o

Std. Dev = 80

Mean = 0.00

N = 35.00

-2.00 -1.50 -1.00 -.50 0.00 .50 1.00

-1.75 -1.25 -.75 -.25 .25 .75 1.25

Regression Standardized Residual

Normal P-P Plot of Regression Sta

Dependent Variable: Valor Comerc 1.00-

.75-

O u_ O. E 3 O -o <D "C <D Q. X HI

.50-

25-

0.00 0 00 25 50 75 1 00

Observed Cum Prob

Page 67: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Scatterplot

Dependent Variable: Valor Comercial

CO

o CD E o O

o CO >

2400000.

2200000H

2000000 -

1800000-

1600000-

14000001

1200000-

1000000-

800000_

- 2 - 1 0 1 2 3

Regression Standardized Predicted Value

Partial Regression Plot

Dependent Variable: Valor Comercial 200000 -,

100000-1

§ -100000-

CD

E O -200000-

o

> -300000 ,

-ft) ^8 ^6 ^4 ^2 0 2~ 4 6 8

Cajones Estacionamiento

Page 68: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

I

Partial Regression Plot

Dependent Variable: Valor Comercial

200000.

100000 -.

OJ

§ -1 ooooo ̂ E

O -200000-O > -300000 _| _ ^

-10 0 10

Edad de la Vivienda en años

Partial Regression Plot

Dependent Variable: Valor Comercial

*~ 200000-J -j

100000- '

0-

§ -100000 H

(U

E Q -200000 -I O > -300000 ̂

-15 -10 -5 0 0 5 10

Estado de Conservación

Page 69: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Partial Regression Plot

Dependent Variable: Valor Comercial

400000 T

200000 -

0-

§ -200000 H

a>

E O -4000001

I — I

O > -600000 _¡

-2000 -1000 0 1000

Costo M2 de Construcción /

Partial Regression Plot

Dependent Variable: Valor Comercial 200000. •

100000-

0-

- -100000-i

E O -200000-

o > -300000 ̂

-"6 ^4 ^2

Número de Baños

7Q 2 4

Page 70: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Partial Regression Plot

Dependent Variable: Valor Comercial

200000

100000-

0J

§ -100000 H

E O -200000-

I ! > -300000 J [

-1.0 -.5 0.0 .5 1.0 No. de Niveles

Partial Regression Plot

Dependent Variable: Valor Comercial

~" 200000-, ,

100000-

0-

| § -100000-<5 E O -200000 -.

> -300000 ! -8 -6 ~^4 ^2 oTo 2 4 6

Número de Recamaras

Page 71: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Partial Regression Plot

Dependent Variable: Valor Comercial 400000-

200000-

§ -200000-1

¡D

E O -400000-

O

> -600000 -80 -60 -40 -20

Superficie Construcción

20 40 60

Partial Regression Plot

Dependent Variable: Valor Comercial

(0

'tí <D

E o ü O CD >

100000-

0-

-100000-

-200000-

-300000

-

3

a

a

a a

a

a

a

a

3 ^

a

a ,̂ c a a

°

.-j

-80 -60 -40 -20 20 40 60

Superficie de Terreno

Page 72: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Partial Regression Plot

Dependent Variable: Valor Comercial 200000

100000

§ -100000

E O -200000

o > -300000

-.6 -.4 -.2 0.0 .2 .4 .6 .8 1.0

TOPOGRA

Partial Regression Plot

Dependent Variable: Valor Comercial 200000

100000-

§ -100000

E O -200000

o > -300000

UBICATM

"'&&

Page 73: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Partial Regression Plot

Dependent Variable: Valor Comercial

200000T

100000-

0-

•§ -100000-<D

E O -200000-

o > -300000

-1.5 -1.0 -.5 0.0 .5 1.0 1.5

Ubicación en la Zona

Page 74: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Correlación:

Tabla (Descriptive statistics).- Se puede observar que con los datos normales tal y como se obtuvieron de la muestra las bandas de ¡a media y desviación estándar se van a valores sumamente altos, aunque siguen conservando su relación de dispersión, desviación estándar/media, también se observa que se están tomando en cuenta las 455 observaciones de la muestra

Tabla (Correlations).- Se puede ver una alta correlación entre la mayoría de las variables independientes y el valor comercial del inmueble, Pearson Correlation, hay que destacar que existen variables con poca significancia en el modelo particularmente la que presentan valores p < 0 125 Edo de conservación, No De Niveles, Ubicación del terreno el la Manzana

VARIABLE CORRELACIÓN PEARSON

Valor Comercial Inmueble Cajones de estacionamiento Edad vivienda en años

Estado de conservación $ / M2 construcción Número de baños Número de niveles Número de recamaras Superficie de construcción Superficie de construcción Topografía del terreno

Ubicación del terreno respecto a la manzana Ubicación en la zona

1.0 0.378 0.131

- 0.074 0.125 0.451 0.079 0.392 0.753

0.597

0.603 0.116 0.348

Tabla Model Sumary.- Se tienen valores de R (0 976), R2 ajustada (0 953), sumamente aceptables, Así como el indicador de Durbm Watson nos indica un aceptable valor de 2 123 un poco alejado del valor óptimo de 1.5 , esto nos da indicios de cierta redundancia en los datos (ruido)

43

Page 75: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

1.- Linealidad, Normalidad, Homocedasticidad.-

Grado en que cambia el coeficiente de regresión asociado a la variable dependiente, esto se muestra en la tabla anterior por la gran dispersión de correlaciones entre las variables, mostrándose problemas de linealidad, nótese en la gráfica 2 el espacio vacío que existe en el histograma y la curtosis hacia la derecha. Se muestra violación a estos supuestos. En el histograma de residuales , y gráfica de la normal, se observa que hay problema de normalidad en la muestra, esto se puede determinar por simple inspección visual (mismo caso que el de linealidad). Así también se tiene en la tabla Residual Statistics una alta desviación estándar de los datos que inclusive se salen de formato, lo que indica que los datos no están normalizados y muy dispersos.

"A mayor desviación estándar menor poder de predicción "

En todas las gráficas con variables de baja correlación se presentan problemas de independencia, y outliers.

Problemática.- Con los datos tal y como se tomaron de la muestra se presentan violaciones a los supuestos del modelo de regresión, por lo que los datos de la muestra presentan redundancia y ruido.

Solución: Dado a la violación a los supuestos y demás consideraciones se tiene que recurrir a la transformación de datos

44

Page 76: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

CAPÍTULO V: VALIDACIÓN DE SUPUESTOS CON DATOS TRANSFORMADOS

Estrategia de transformación.-

La naturaleza de los datos, indican que para cumplir con los supuestos del análisis multivariado utilizar la función matemática determinada por el Logaritmo Natural (Ln) de las variables para evitar la amplitud y el rebote de datos

TRANSFORMACIÓN = \n(Y)

Donde

Y = valóretelasvariables

Cada una de ellas de t = 1, 2, 3, 4, 35

A continuación se presenta solo la primera página de cómo quedaron los datos ya transformados a través del logaritmo natural.

POR LO TANTO AL HACER LA TRANSFORMACIÓN DE LOS DATOS YA NO SE VIOLAN LOS SUPUESTOS DE LA REGRESIÓN LINEAL MÚLTIPLE

45

Page 77: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

NOIOOnyiSNOO aa ziAi nviouaiAioo aoivA NOIOVISH

S313AIN aa oaaiAinN

OAanN (g)ouana Anj/y (fr)ouana (£) jB|nBay(2) O|B|/\|(L) (s-H

aP

jaM!l

ap B|Bosg) NOI3VAcl3SNOO 30 O0VJLS3

(soye U9)\/aN3|A|/v VI 30 0V03

(#)01N3IIAIVN0|0V1S3 30 S3N0rV0

(#) soisiva 30 oy3iAir\N

(#) svu vi/\iyo3ci 30 oa3i/\inN

(Z^ÍNOIOOfiyiSNOO 30 3IOIdcl3dnS

(3^)oN3aa3i isa 3ioua3dns

(w)ON3Uy31130 S3NOISN3IAII0

oueid (e)-ouB|d ajuawaiqpuas (3)

-ajuaipuad UOQ ([) ON3ettJ3.L

130 vouyaoodoi NpiovynoidNoo

(BUBZUBIU

ap BjaoaqBo(e)-BU!nbsa (z>ojaue!pa|/\| (0 VNVZNVIAI VI v oiosdsaa NOD 0N3aa3i 130 Noiovoian

ouana AniAl (e) ouang (z) jB|nBay (L) VNOZ VI N3 NOlOVOISfl

($) VSVO VI 30 1VI0U3IAI00 aoivA

Npiovoian

NOIOVliaVH vsvo

s CO

0 0 0

0

0

O)

CM

CO

ro O) tp 0

ro en ID

0

Cn CO

0

ro ro iri

O)

CD

iri

O)

q •1—

0 0 0 d

ro en CD

0

in r-CM

c ro Q. O D. (0

N ro E TO

O CD

_l

in

0 m 0

a 0 0

c S ro 2

^*

ro CO

CO

0 0 0

0

0

0

ro

0 0 0 b

co cn ci

O) O) 0

CN

CO CO CN

iri

ro en CD

0

0 0 0

0

0 0 0

0

m CO 1--;

ro

c ro Q. 0 a rs

N .2. 13 Q.

ro O ¡Ü CN I

s-

CO c <u

LU

8 c «J

CV)

CM

0 CO ro CO

0 0 q ci

ro cn CD

CO CD CN

CO

0 0 0 0

ro en CO

0

cn en 0

en 0 CD

iri

CO en CN

in

t

en en q —̂

0 0 q d

en en q

en CO

en ro

c ro a. 0 Q_ <o

N <A CO

TJ <L>

O

1 CN

O

"¡5 <u k_ 0 m CO c 0 k-0

0

CO

CO

CO

co

ro en CD

0

en 0 co

0 0 q d

ro en co 0

CD

en 0

en en 0

Is-

on

in CO CO

CO en CD

CD

0 0 0

ci

0 0 q CD

in en 1"-; ro

c ra a 0

§-N 0

L. T3 jñ c ra

co en

•a ra

•a 'c <D

1—

co -*

CM

cn

en

0 0 0 d

en 0 CD

0 0 0

b

CO en CO

d

CD

cn d

cn cn 0

cn q iri

m CM CD

en cn q

0 0 0 0

ro cn CO

0

CD CO CM

c ra a. 0 Ci­ra

N a) a 3 ro

TJ ra 3

CD

cr k-

ro 0-0

CD

co 4)

a.

ro T5 ra 3

CD

1 m

CO CO

b

ro cn CO

0

cn 0 CO

0

0

q d

ro cn cq 0

CD

cn d

ro cn co

ro CD

q iri

CO 0

iri

cn cn q

ro cn CD

d

0 0 q d

CO CM CM

«+'

c ro Q-0 a. ro

N 0

"O

'jw

c CO

CO

ro Ó CD O

(0

Ü

"53 -0

0 a> u) ro

ti­

co

0 cn CO

ro cn CO

0

cn cn 0

cn 0 ro

ro cn cq d

CD

q d

cn cn 0

CM 0 CD

in

in

iri

cn cn q

0 0 0 d

CO cn CD

0

cn 0 in

c ro a. 0 a ra

N

O CO

"33 •0

</> 0 o> <n ro

0.

O

m

1 N 0)

a

"03 LL

h-

O) in q cri

ro cn CO

d

cn cn 0

0 0 q d

ro cn CO

d

CO

d

cn cn 0

CO CM ro iri

cn r-cn

cn cn q

0 0 0 0

0 0 0 d

CO CO CO

ro a 0 a ro

N ro

3

-a ra t <u

X _tg

ro -a X in in CO

<u 'c 0

E 0

O

"35 'c ra

Q

CO

ro CM

cri

0 0 0

0

CO 00 ro

cn cn q

CO cn CO

d

ro cn CD

d

cn cn 0

0 cn CO

cn cn CM

iri

*

ro en CD

d

0 0 q d

cn cn q

CM

•Or

c ro a. 0 a. CO

N ro ü c ro

+-» </> tu ro

_l CD r^-CD

in

€ 3

SZ co J¿ c ro it cn

in q cri

ro cn CO

d

CD co ro

cn 0 tp

ro cn cq 0

CO

cn 0

cn cn 0

ro CO

CM

iri

cn CO cn

cn cn q

0 0 0 d

cn cn q

CO

ro

c ra a. 0 a. ra

N

CO

J= CO

a (A CD

Dd

m CM CO

0 -C u ra E ra

O ro

1 0

cn

cri

0 0 0 d

cn 0 CO

0 0 0

0

0 0 0

d

ro cn CD

d

cn cn 0

m

CO

CO

cn q d

0 0 0 d

ro cn CD

d

0 CO cn CO

a. ro

N 10 ro

-O a> E ro

< (A ro

_J

CO

ra •c ID

E < jo (U

TJ

ra -0 ra c 0 0 c

'-

cn CM ro cri

ro cn tp d

cn cn 0

cn 0

CM

ro cn tp d

CO

q d

cn cn 0

0 CO

co in co

CO

cn tp d

0 0 0 d

cn cn q

cn 0 CO

ro

c ra a. 0 a

N w ra

•a <p 0

-Q

< ro 0

c <D

•a 10 0)

o: CM I

s-

g

5 CM

Is

-

cri

ro cn CO

0

cn cn 0

CO

ro CO

CM

ro cn CO

0

cn cn q

CD co CO

0 CO

ro iri

in

iri

cn cn q

0 0 0 d

cn cn q

Is-

cn

c ro a. 0 a ra

N U5 CO

0)

O

•e < 0 CM

]j3

To CD 0

"fa CD

CO

0

cri

CO cn CD

d

CD co CO

CO I

s-

h-

CM

CO cn q d

CO CO CO

cn 0 co

Is-

cn •*

in

CM O CO

iri

cn en q

co cn cp d

O) cn q

0 CD

c ro Q. 0 Q_

ro N ro o c ^ w LU ra

_J

m CD m •c ra N O

2

t

cn CO

co

ro cn CD

d

cn 0 CO

0 0 q d

CO

q 0

to cn 0

cn cn 0

5 cq

in CO

CO cn tp d

0 0 q d

CO

cn cp d

CM CO 1^

ro

c ra Q-0 a. ro

N

"5 O

¡Ü

cn co

0 a) 0

c '3

O c ro 0

0

>

10

CO O

q cri

ro cn cp d

cn cn 0

cn

CM

co'

CO cn q d

cn cn q

co CO ro

Is-

00

iri

CO m iri

cn cn q

0 0 0 0

cn cn q

cn

ra Q. 0 Q.

ra N in (0

-a 0}

0

•e < CO 0

m 0

B O 0 c ro

ro 2

tc

CO

Is-

cri

ro cn tp d

cn 0 CD

0

0

q d

ro cn tp 0

cn cn q

cn en 0

m 0 cn

0 I

s-

co

cn cn q

0 0 0 0

ro cn

d

CO I

s-

q •<•

c ro Q. 0 Q-ro

N £>

3

0

O

J3

E ro ra 3

CQ

O CO CN CM

<u Q-3

ro T3 ro 3

CD

Is-

CM CM

q co

ro cn tp d

cn en 0

0

ro

ro cn cq d

CO

q d

cn en 0

CO

iri

m CO

q in

cn cn q

ro cn to 0

en cn q

m 00 CO

c ro Q_ 0 Ci­ro

N w ro

•0 <u 0

_Q k.

<

CO

•<f 0 Ü

'c <u CL 0 0 (0

ro 0 0

Z CO

cn q CO

ro cn q d

cn 0 to

0 0 q b

ro cn CD

d

cn cn 0

en cn 0

to cn I

s-

CO ro

n cn q d

0 0 q d

0 0 q d

0 cn

CO

c ro Q-0 a. ro

N O cn CD

c

u> <a

r-

ro 0 3 OJ

'•4-'

c < 0

c E ro

O

cn

CO

cn

ro cn q d

cn 0 CO

0 0 q 0

0 0 0 d

to —̂ cn d

cn cn 0

0 I

s-

cn

0 to CO

•*'

cn cn q

CO

cn q d

n cn q d

in

c ro a. 0 Ci­ro

N 0 c ro •e D "0

O

¡Ü 0 cn m •*

c +-» 3 0

ro Q.

c ro 0

0

>

0 CM

Page 78: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

NoioonnisNoo aa ziAi nviodaiAioo ucnvA Noioviaa

san3AiN aa oyaiAinN

oAanN (9)ouana An|/\| (»oiiana (c) jB|nBay(2) o|B|/\| (0 (S-k I^P-OMH

ap B|BOS3) NOI0VAH3SNO0 30 O0V1S3

(SOUB ua)vaN3IAIA VI 30 0V03

(#)01N3IIAIVN0I0V1S3 30 S3NOrV0

(#) SONVS aa oaaiAinN

(#) svuviAiyoau aa OÍJBIAION

(3Lu)NpiDonaisNoo aa aiouaadns

(3^)oNaayai isa 3iouH3dns

(^)ON3dH31130 S3NOISNai/\|ia 1

ouB|d (£)-ouB|d ejuaiuaiqpuas (2)

•a^uaipuad UOQ (0 ON3Ua31

13a vouyyoodoi NoiovanoidNoo

(euezueiu

ap BjaoaqBo(£)-BU!nbs3 (¿)-ojauejp3|/\|

(0 VNVZNVIAI VI V O103dS3H

Noo oNayaai isa Noiovoian

ouanaAn|/\i (e) ouang (Z)

jB|nBay ([) \/|\|0Z VI N3 NOlOVOIOfl

($) VSVO VH 30 "1VIOH3IAIOO clOIVA

Npiovoian

NOIOVliaVH VSVO

CO 0

CO

co CO CO

0

CO CO 0

00 0 r-c\i

0 0 0

0

CO co CD

0

CO en co 0

CN O)

0 CD CO

CO CO 0

0 0 p 0

CO CO CD O

O

c CO 0. 0 Q. co

N CO

jg '5

5 CD 1"-r--

0 u en 0) 3 Ü CO 0

s H 0

CM

CD 0 CO

00

CO CO 0

co CD 0

CM CO 1"-;

0 0 0 0

CO

O) 0

en CD 0

CM

CO

0 0 10

CO

cq 0

0 0 0

0

CO CO CO

0

CNJ

co

c ro Q. 0 a. co

N "0 CO

"3! -0

CD

d) 3

fX

0

CO

m CO

O)

E CD

-C

O CO

>> CD

CL CM CM

co

0

CO

CO CO CO O

CO 0 CO

0 0 0

ó

co CO CO

0

CO •<—

CO

0

CO CO 0

0 CN CO

ID CO

CO CO 0

0 0 p 0

0 0 0

0

CO co CO

CO

N JU "¡D >

"55 -0

CO 0 L-(D >

>

CO CM CM

0 0 en 0 c CO

u. c CD

co CD

TJ

ju To > CO CM

CM CO CO

CO

CO CO CO

0

CO CO 0

CO

CM

co

0 0 0

0

CO T_ CO

0

CO CO 0

in

0 r-~ CO

•il-

CO CO 0

0 0 0 0

0 0 p 0

in T—

TB" Q. 0 a CO

N 0

CO

'«r E CD

<u TJ CO CO

E 0

_J

CO

0

CM en CD

TJ

5> > en CD E 0

•* CM

CM

•<•

ai

CO CO CO

0

CO CO CO

CO •<* CO

CO CD CD

ó

CO CO

p

co CO CO

3 lh

00

in

*

CD

0

0 0 p 0

CO co CO

ó

CM CO

in

a. CO

N CD a. 3

CO •a CO

3

CD CU

TJ in CO

E

5 CO CO CM M-0 Ü en 0

CQ

c CO 3

-J

c CO

CO

CM

0

CO

0 0 0

0

co CO 0

CO

CM

CO

0 0 0

0

CO

co 0

CO CO 0

CO CO

m

0

0 0 0 0

0 0 p 0

CD CO

p T—

CO O) CO CO

c CO a 0 a. CD

N CO

±i c 0

CQ

CO

E 0

_l •r-CM 01 CO

CO •a 3 Ü CO k-t_ CO

CQ

CO CM

CO

CO CO CD

0

CO CO 0

CM

0 0 0

ó

CO CO

p

CO CO 0

0 CO CO

iri

m CM

in

CO a> CD

ó

0 0 0 ó

CO CO CD

ci

CM

c CO Q. O

a CO

N "0 CO

13 -0 en 0

en CO

a. 0

<* CM O > CD

DO (U D) 1» O

-3

CM

in

0 ai

CO CO CD

ci

CO CO 0

CO

0

CM

CO

CO

0

CO

^^ a> ci

CO CO 0

0 CM O)

CO

CO CO co CD

CO CO CO

0'

CO 0

m CO CO

CO

c co a. 0 a. co

N

.-S c 0

CQ CO

E 0

_i

>* CM CO CO

JO

'3 O) c

< CO CM

CO CO CN

co

0 0 p 0

O) O) 0

CO 0

CO

CM

CO CO CO CD

CO CO

co ci

CO CO 0

CM in CO

0

CO

in

CO O) CO

ci

0 0 0

0

CO CO CO CD

m CO

c CO a. 0

& N CD CL 3 (0

•a CO 3

(3 CU

-a in 0 0

< CO CM in m en cu L_ O

en

CD

3 CO CN

s CO

CO

CO CO CO <3

CO 0 CO

0 0 0

C3

CO ai CD

ci

CD

0

CO CO 0

CO CM CO

CO 0 CO

CO a> CO

eb

0 0 0 ci

CO CO CO

ci

0

CO

N-

c CO

a 0 a. CO

N

0

co "53 TJ en O cu en CO

a. CN

f̂ CO 0

+-» cu

•c Q. O

0 \-O CO

CM O CO CO

CO CO CO

ci

CO CO 0

CD CO CO

CM

0 0 0

ci

co CO

cq ó

CO o> 0

0 in 0 in

0 O) co

CO CO CD

ó

0 0 0

0'

CO CO CO

ci

CN in en co

c CO 0. 0

Q.

CO

N en

JO '5

< en CO

_l

CO CO t—

0

'3

0

S

CN CO

CO

CO CO CO CD

CD CO CO

CD CO CO

CO CO CO Ó

CO

P CD

CO CD O

in CO CO

CO

CO

CO CO 0

CO CO cq CD

CO CO cq 0'

CO CO

co

c CO Q. O Q. CO

N 0 CO >. cu Q-

<U

H en CD

TJ C cu 0 CO

X CO m in CO

0 TJ CO <u c 0

'a?

a: CM CO

CO

—̂ CO

CO CO p ó

CO CO 0

CD 0

co

co CO CO CD

CO CO CD CD

CO O) O

CN in

0 CO

in

CO CO CO CD

0 0 p 0

co CO ID

ó

m CM 0

CO Q-0 D. CO

N

ai CL

CD cu

TJ en 0

TJ CO h-

CL 00 in r̂-"<*

'& CO

CO

0

CO 0 0

'c E 0

Q

CO CO

CO 0

CO

CO CO cq CD

CD CO co

co 0

CN

(O CO CO CD

CO CD

p

CO CO 0

m

in in

CM

m m

CO CO

p

0 0 0 ci

CO CO 0

CO

CO

^1-

CO Q. O Q. CO

N TJ CO

TJ

"12 cu >

'c

I JO To > CN CM CO m >^ cu X 3

r X 3 O

TJ < CO

-íl­eo CM

ai

CO CO CO CD

CO CO co

0 0 0

CD

CO CO

cq ó

CD

CO

ci

CD CO 0

CD 0 CM

in

CO CO

m

CD CD 0

0 0 0

CD

CD CO O

•«1-

c CO o_ 0 a. CO

N CO

+¿ To a. CO

JZ O

"5 O

CO CM CM CD

CU a. 3 (0

T! CD 3

O

> < in CO

Page 79: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

CORRIDA #2

DATOS TRANSFORMADOS

PROGRAMA SPSS

Page 80: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

C \WINDOWS\Desktop\TESIS MAESTRIAVJose Ma Rdgz BUENO\Chema 2 sav

valorcom ubicazon ubicatm topogra supterr supconst

14 27546 693147 000000 1 098612 5 648974 5 373239

13 78505 000000 000000 693147 5 288267 4 941642

13 98946 1 098612 000000 1 098612 5 298317 5 609472

4

5

13 79531 000000

14 28551 693147

000000

000000

693147

1 098612

4 885072

4 624973

4 946985

5 093750

23

24

25

13 86620

1415412

1^56220

000000

000000

693147

000000

000000

1 098612

1 098612

000000 1 098612

4 653960

4 969813

5178463

nrecama

693147

1 098612

1 098612

1 098612

1 098612

6

7

8

9

10

11

12

13

14.

15

16

17

18

19

20

21

22

14 22563

14 50866

14 38649

14 12740

14 33430

13 92973

13 80949

14 49659

- 14 60397

13 73213

14 19052

14 07787

14 38536

13 79019

1415412

14 01436

13 72120

000000

693147

000000

1 098612

1 098612

693147

1 098612

1 098612

1 098612

693147

1 098612

693147

1 098612

000000

693147

693147

693147

693147

000000

000000

000000

000000

000000

000000

000000

693147

000000

000000

000000

693147

000000

693147

000000

000000

1 098612

1 098612

1 098612

693147

1 098612

693147

693147

1 098612

1 098612

693147

1 098612

1 098612

1 098612

693147

1 098612

1 098612

693147

5 081404

5511411

4 979076

5 299117

4 988867

'4 874434

4 858261

5 514235

5 301911

4 650908

5 560682

4 870223

5 634790

4 736198

4 859812

4 890349

4 499810

5 062595

5 602119

5 327876

4 890349

5 283204

4 510860

4 480060

5 379897

5 497168

4 841190

5 187386

4 905275

5 463832

4 795791

4 969813

4 927254

4 812184

693147

1 098612

1 098612

1 098612

1 098612

1 098612

1 098612

1 386294

1 609438

1 098612

1 386294

1 098612

1 098612

1 098612

1 098612

693147

1 098612

4 820282

5 472271

5 420535

1 098612

1 098612

1 386294

26

27

28

29

30

13 89340

1412666

13 99533

14 13542

14 13032

1 098612

693147

1 098612

693147

693147

000000

000000

693147

000000

000000

000000

693147

693147

693147

693147

5 075174

5 253581

4 813728

5 34Ü4Í9

4 906015

4 983607

5 379897 I

4 919981

4 652030

4 828314

1 098612

1 098612

1 098612

1 09bbl2

1 098612 , i

Page 81: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

C \WINDOWS\Desktop\TESIS MAESTRIAUose Ma Rdgz BUENO\Chema 2 sav

nbaños cajesta edadvivi edocons nniveles m2const

1

2

3

4

5

6

7

8

9

10

11

12

13 !

1-H 15

| 16

17

18

19

20

21

22

23

24

25

26

27

28 I

29 '

30 !

693147

916291

693147

916291

916291

916291

916291

916291

693147

916291

693147

916291

1 098612

1 386294

916291

1 098612

1 098612

916291

1 098612

916291

693147

916291

916291

916291

1 098612

916291

1 098612

916291

693147

916291

693147

000000

000000

693147

693147

693147

693147

693147

693147

693147

000000

693147

693147

693147

693147

693147

693147

693147

693147

000000

000000

000000

693147

000000

693147

000000

000000

693147

693147

693147

3 218876

3 401197

3 295837

000000

000000

000000

3 091042

000000

1 098612

1 609438

000000

2 079442

2 833213

2 772589

000000

3 218876

000000

3 401197

000000

000000

2 708050

1 791759

000000

3 218876

1 945910

3 218876

2 944439

2 708050

2 302585

000000

1 098612

1 098612

693147

1 609438

1 609438

1 609438

1 098612

1 098612

1 386294

1 386294

1 609438

1 098612

1 098612

1 386294

1 609438

1 098612

1 609438

1 098612

1 609438

1 609438

1 098612

1 098612

1 609438

1 098612

1 386294

1 098612

1 098612

1 098612

1 098612

1 609438

000000

000000

000000

693147

000000

693147

693147

693147

000000

693147

000000

693147

693147

693147

693147

693147

693147

693147

693147

693147

693147

1 098612

693147

693147

693147

000000

693147

693147

000000

693147

8 902225

8 843409

8 379992

8 848323

9191764

9163036

8 906539

9 058614

9 237048

9 051101

9 418872

9 329432

9 116688

9 106800

8 890938

9 003131

9 172600

8 921528

8 994402

9184310

9 087108

8 909016

9 045922

8 681853

9141664

8 909790

8 746768

9 075348

9 283388

9 302008 J , , . . L

Page 82: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

C \WINDOWS\Desktop\TESIS MAESTRIA\Jose Ma Rdgz BUENO\Chema 2 sav

31

32

33

34

35

valorcom

13 95179

13 79633

14 02496

14 64842

14 44359

ubicazon

693147

693147

693147

1 098612

1 098612

ubicatm

000000

693147

000000

000000

000000

topogra

693147

1 098612

693147

1 098612

1 098612

supterr

4 890349

4613138

5190287

5 521461

5 135798

supconst

5 049856

4 634729

4 852030

5 545177

5 209486

nrecama

1 098612

1 098612

1 098612

1 098612

1 098612

Page 83: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

C:\WINDOWS\Desktop\TESIS MAESTRIAVJosé Ma. Rdgz BUENO\Chema 2.sav

nbaños cajesta edadvivi edocons nniveles ! m2const

31

32

33

693147

916291

693147

.000000

693147

.693147

2.995732

1 386294

3.091042

1.098612

1.386294

1.098612

693147

693147

693147

8 901932

9.161599

9 172931

34 1.098612 693147 2.708050 1.386294 693147 9.103242

35 916291 .693147 000000 1.386294 693147 9.234100

Page 84: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Regression

Descriptive Statistics

Valor Comercial Cajones Estacionamiento Edad de la Vivienda en años Estado de Conservación Costo M2 de Construcción Número de Baños No. de Niveles

Número de Recamaras Superficie Construcción

Superficie de Terreno TOPOGRA UBICATM Ubicación en la Zona

Mean 14 12422

49510513

1 744000

1 290514

9 042212

91517948

.54629826

1.103112

5.082004

5.068551

.90503732

.11882523

.69353435

Std. Deviation 26764961

31770349

1 391148

24639969

20466141

.15828981

.30932872

17164627

.30959088

.31668792

.25420476

.26504927

.39615762

N 35

35

35

35

35

35

35

35

35

35

35 35

35

Page 85: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Correlations

Pearson Valor Comercial Correlation Cajones

Estacionamiento Edad de la Vivienda en años Estado de Conservación Costo M2 de Construcción Numero de Baños

No de Niveles

Numero de Recamaras Superficie Construcción Superficie de Terreno TOPOGRA UBICATM Ubicación en la Zona

Sig Valor Comeraal (1-tailed) Cajones

Estacionamiento Edad de la Vivienda en años Estado de Conservaaon Costo M2 de Construcción Numero de Baños

No de Niveles Numero de Recamaras Superficie Construcción Superficie de Terreno TOPOGRA UBICATM Ubicación en la Zona

Valor Comercial

1 000

365

179

-050

161

370

083

281

758

626

580 119

327

016

152

387

177

014

318

051

000

000

000 247

028

Cajones Estacionamiento

365

1 000

-283

339

426

283

186

168

034

159

300 120

094

016

050

023

005

049

142

167

424

181

040 246

296

Edad de la

Vivienda en años

179

-283

1 000

-835

-462

-042

- 121

128

460

613

-067 -011

380

152

050

000

003

405

244

232

003

000

351 475

012

Estado de Conservación

-050

339

-835

1 000

516

261

139

-005

-385

-464

' 069 139

-301

387

023

000

001

065

213

488

011

002

346 213

039

Costo M2 de

Construcción 161

426

-462

516

1 000

015

030

051

-522

-170

-001

135

160

177

005

003

001

465

432

385

001

165

498

220

179

Page 86: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Correlations

Pearson Valor Comeraal Correlation Cajones

Estacionamiento Edad de la Vivienda en años Estado de Conservación Costo M2 de Construcción Numero de Baños

No de Niveles

Número de Recamaras Superficie Construcaon Superfiae de Terreno TOPOGRA UBICATM Ubicación en la Zona

Sig Valor Comeraal (1-tailed) Cajones

Estaaonamiento Edad de la Vivienda en años Estado de Conservaaón Costo M2 de Construcaon Número de Baños

No de Niveles Numero de Recamaras Superficie Construcción Superficie de Terreno TOPOGRA UBICATM Ubicación en la Zona

Numero de Baños

370

283

-042

261

015

1 000

461

626

310

072

217

232

049

014

049

405

065

465

003

000

035

340

105 090

389

No de Niveles

083

186

- 121

139

030

461

1 000

168

052

-257

272 219

-087

318

142

244

213

432

003

167

384

068

057 103

310

Numero de Recamaras

281

168

128

-005

051

626

168

1 000

209

137

021 035

312

051

167

232

488

385

000

167

114

217

453 421

034

Superficie Construcción

758

034

460

-385

-522

310

052

209

1 000

654

502 014

177

000

424

003

011

001

035

384

114

000

001 468

155

Superficie de

Terreno 626

159

613

-464

-170

072

-257

137

654

1 000

216 -026

351

000

181

000

002

165

340

068

217

000

107 441

019

TOPOGRA 580

300

-067

069

-001

217

272

021

502

216

1 000

229

-027

000

040

351

346

498

105

057

453

001

107

093

439

Page 87: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Correlations

Pearson Valor Comercial Correlation Cajones

Estacionamiento

Edad de la Vivienda en años Estado de Conservación Costo M2 de Construcción Número de Baños No. de Niveles Número de Recamaras Superficie Construcción Superficie de Terreno TOPOGRA UBICATM Ubicación en la Zona

Sig. Valor Comercial (1-tailed) Cajones

" " Estacionamiento Edad de la Vivienda en años Estado de Conservación Costo M2 de Construcción Número de Baños

No. de Niveles Número de Recamaras Superficie Constnjcaon Superficie de Terreno TOPOGRA UBICATM Ubicación en la Zona

UBICATM 119

120

-011

139

135

.232

219

.035

.014

-.026

.229 1 000

.101

.247

.246

.475

.213

.220

.090

103

421

468

441

093

282

Ubicación en la Zona

327

094

380

-301

160

049

-087

312

177

351

-027 101

1.000

028

.296

012

.039

179

389

310

034

155

019

439 282

Page 88: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Variables Entered/Removed"

Model 1

Vanables Entered

Ubicación en la Zona, TOPOGR A, Costo M2de Construe ción, Número de Baños, UBICAT M, Superficie de Terreno, Cajones Estaciona miento, No. de Niveles, Número de Recamar as, Estado de Conserva ción, Superficie Construe cion, Edad de la Vivienda en años3

Vanables Removed Method

Enter

a. All requested variables entered.

b Dependent Variable: Valor Comercial

Model Summary"

Model 1

R 1 000a

R Square 1 000

Adjusted R Square

1 000

Std Error of

the Estimate 8 59E-09

Page 89: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Model Summary13

Model 1

Change Statistics R

Square Change

1.000 F Change

2.8E+15 df1

12 df2

22

Sig F Change

000 Durbin-Watson

1.899

a Predictors- (Constant), Ubicación en la Zona, TOPOGRA, Costo M2 de Construcción, Número de Baños, UBICATM, Superficie de Terreno, Cajones Estacionamiento, No de Niveles, Número de Recamaras, Estado de Conservación, Superficie Construcción, Edad de la Vivienda en años

b Dependent Vanable Valor Comercial

ANOVA"

Model 1 Regression

Residual Total

Sum of Squares

2.436 1.622E-15

2.436

df 12 22 34

Mean Square

.203 7 375E-17

F 2.7E+15

Sig. 000a

a. Predictors: (Constant), Ubicación en la Zona, TOPOGRA, Costo M2 de Construcción, Número de Baños, UBICATM, Superficie de Terreno, Cajones Estacionamiento, No. de Niveles, Número de Recamaras, Estado de Conservación, Superficie Construcción, Edad de la Vivienda en años

b. Dependent Variable. Valor Comercial

Page 90: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Coefficients3

Model 1 (Constant)

Cajones Estacionamiento Edad de la Vivienda en años Estado de Conservación Costo M2 de Construcción Numero de Baños

No de Niveles Número de Recamaras Superficie Construcción Superfiae de Terreno TOPOGRA UBICATM

Ubicación en la Zona

Unstandardized Coefficients

B -1690483

47946 290

-25 422

14233 033

157 168

94788 900

58890 040

-16057 7

7850 595

456 407

-18555 8 -8680 549

-13337 8

Std Error 266709 7

53914 319

4485 489

39469 400

19 703

81041 181

49457 597

54332 249

776 625

726 065

48194 398 53610 736

31837 089

Standard! zed

Coefficie nts

Beta

056

-001

033

661

102

071

-022

1 058

064

-027 -009

-025

t -6 338

889

-006

361

7 977

1 170

1 191

-296

10 109

629

-385

-162

-419

Sig 000

383

996

722

000

255

246

770

000

536

704 873

679

95% Confidence Interval for B

Lower Bound

-2243605

-63865 2

-9327 756

-67621 5

116 306

-73280 2

-43678 7

-128736

6239 973

-1049 360

-118505

-119862

-79363 9

Upper Bound

-1137361

159757 7

9276 912

96087 559

198 030

262858 0

161458 8

96620 475

9461 216

1962174

81393 302 102501 3

52688 251

Page 91: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Collinearity Diagnostics3

Model 1

Dimension 1

2 3 4 5 6 7

8 9 10 11

12 13

Eigenvalue 11 031

812 506 240 178

140 5 467E-02 2.201 E-02 8.366E-03 5.163E-03 1.304E-03 7.459E-04 6.958E-05

Condition Index

1 000 3.687 4 668 6 775 7 865

8 875 14 205 22.389 36.312 46.224

91.988 121.611 398.162

A

Page 92: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Collinearity Diagnostics3

Model Dimension 1 1

2 3 4 5 6 7 8 9 10 11 12 13

Vanance Proportions

TOPOGRA 00 00 00 00 00 01 51 05 00 10 19 02 12

UBICATM 00 78 04 00 04 01 02 00 07 02 02 00 00

Ubicación en la Zona

00 00 03 18 01 51 04 01 06 01 00 01 14

a. Dependent Vanable: Valor Comercial

Residuals Statistics3

Predicted "Value Residual Std. Predicted Value

Std. Residual

Minimum

13.72120

-5.5E-09

-1.506

-639

Maximum

14.64842

4.50E-09

1.959

518

Mean

14.12422

8.63E-16

000

000

Std. Deviation

.26764961

2.30E-09

1.000

265

N

35

35

35

35

a. Dependent Vanable- Valor Comercial

Charts

Page 93: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Histogram

Dependent Variable: Valor Comercial 8_-

iT o

-50 -25 0 00

Std Dev= 26

Mean = 00

N = 35 00

25 50

Regression Standardized Residual

Normal P-P Plot of Regression Sta

Dependent Variable: Valor Comerc 1 00

75 T

2 Q.

£ 3 O T3 a> o CD a. X LU

50

?5

OUU

0 00 25 50 75 1 00

Observed Cum Prob

Page 94: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Partial Regression Plot

Dependent Variable: Valor Comercial

CO

"S CD E o O u. O CO >

.000000000

.000000000

.000000000

0.000000000

-.000000000

-.000000000-

-.000000000-

-.000000000

Cajones Estacionamiento

Partial Regression Plot

Dependent Variable: Valor Comercial .000000000

.000000000

.000000000-

.000000000

n p 0) -.000000000-E o

*¿ -.000000000-o > -.000000000

-2.0

3

-1.5 -1.0 0.0 1.0

Edad de la Vivienda en años

Page 95: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Partial Regression Plot

Dependent Variable: Valor Comercial .000000000

.000000000-

.000000000

.000000000

-.000000000-1

-.000000000

-.000000000

Estado de Conservación

Partial Regression Plot

Dependent Variable: Valor Comercial

.2-

.1-

0.0-

-.1-

-.2-

-.3-

-.4

-a

3

a

a cP

IS

a

-.3 -.2 -.1 0.0 .1

Costo M2 de Construcción

Page 96: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Partial Regression Plot

Dependent Variable: Valor Comercial .000000000

.0000000004

.000000000

.000000000 CO

'££ (D E o o o > -.000000000

.000000000

-.000000000

-.3 -.2 -.0

Número de Baños

.2

Partial Regression Plot

Dependent Variable: Valor Comercial

'o 0)

E o u o CD >

.000000000-

.000000000

.000000000-

-.000000000-

-.000000000 j

-.000000000

D

o D

° o a o

n

D a a D

a a

• D a •

u o

o

a

a

a

-.6 -.4 -.2 0.0 .2

No. de Niveles

Page 97: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Partial Regression Plot

Dependent Variable: Valor Comercial

CO

"2 CD E o O w o CO >

-.2

Número de Recamaras

-.o

.000000000-

.000000000 i

.000000000-

-.000000000-

-.000000000-

-.000000000

=

G

o

a

"

-

3

a

c

n a

o

ib

•p

3

=

-

"

=

a

Partial Regression Plot

Dependent Variable: Valor Comercial

eg CJ

<D E o ü i _ o CO

>

.2-

.1-

0.0-

-.1-

-.2-

-.3-

-.4

o <*>

a *

•P

a a

a a

cP a

O

-.3 -.2 - 1 0.0 1

Superficie Construcción

Page 98: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Partial Regression Plot

Dependent Variable: Valor Comercial .000000000

.000000000-

.000000000

.000000000

-.000000000-1

.000000000

.000000000

Superficie de Terreno

Partial Regression Plot

Dependent Variable: Valor Comercial .000000000

.000000000-

.000000000

.000000000

..ooooooooo

..ooooooooo

TOPOGRA

Page 99: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Partial Regression Plot

Dependent Variable: Valor Comercial

o i_

£ o ü o >

.000000000

.000000000

.000000000

0.000000000

-.000000000

-.000000000-1

-.000000000

-.000000000

UBICATM

Partial Regression Plot

Dependent Variable: Valor Comercial .000000000

.000000000-

.000000000

.000000000-

n p OJ -.000000000 E o ^ -.000000000-o > -.000000000

-.8 -.4 -.2 0.0

Ubicación en la Zona

Page 100: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

CAPÍTULO VI: ESTIMACIÓN DEL MODELO DE REGRESIÓN

Paso 4

Estimación del modelo de regresión

Una vez que se han cumplido los supuestos a partir de los datos transformados, procederemos a estimar el modelo de regresión que más se adecué, y que sirva en cualquier otra circunstancia

4 .1 - Corrida de la correlación múltiple en el paquete SPSS Método Entered

Interpretación de los cuadros de la corrida de SPSS Método Entered

Tabla.- (Descriptive Statistics), Se pueden observar tanto los valores de la media como de la desviación estándar de las variables, lo significante se encuentra en el

Valor de la Dispersión = Desviación estándar/ Media

Variable Valor Comercial Cajones de estacionamiento Edad de la Vivienda en años Estado de Conservación $ / M2 de Construcción Número de baños Número de Niveles Número de recámaras Superficie de construcción

Desviación Estándar / Media 0.018949 0.641689 0.797676 0.190931 0.022634 0.172960 0.566226 0.155602 0.060919

j Superficie de terreno 0.062481 | Topografía 0.280878 ; Ubicación con respecto a la mzna. 2.230581 ; Ubicación en la zona ; 0.571216

46

Page 101: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

En esta medida de dispersión se observa que los datos de la muestra más homogéneos son los de superficie de construcción, superficie del terreno contrastando con los de Número de niveles y Estado de Conservación que son los que presentan la mayor dispersión, se puede considerar que todos los resultados están del orden, también se puede ver que al estandarizar los datos las magnitudes bajaron, en la columna N se observa que el tamaño de muestra considerado es de 455

En este caso utilizamos el método Entered, el cual considera a aun tiempo a todas las variables, los métodos que considera el paquete SPSS son

• Entered.- Mete o incluye y examina todas vanables en un solo paso

• Stepwise.- Mete las variable y examina una por una en orden de mayor correlación y eliminando las no significativas

• Remove.- Remueve vanables de un bloque en un solo paso

• Backward.- Elimina variables manteniendo todas las variables en un bloque de un solo paso, y entonces remueve una al tiempo basándose en un criteno de remoción

• Forward.- Selecciona una variable para mantenerla en bloque, una a la vez basándose en un criterio de entrada

El nivel de tolerancia para los criterios default es 0.0001

47

Page 102: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Tabla (Correlations).- Se puede ver una alta correlación entre la mayoría de las variables independientes y el valor comercial del inmueble, Pearson Correlation, hay que destacar que existen variables con poca significancia en el modelo particularmente la que presentan valores p < 0 125 Edo de conservación, No De Niveles, Ubicación del terreno el la Manzana

VARIABLE CORRELACIÓN PEARSON (transformada)

Valor Comercial Inmueble Cajones de estacionamiento Edad vivienda en años Estado de conservación Valor Comercial / M2 construcción Número de baños Número de niveles Número de recámaras Superficie de construcción Superficie de terreno Topografía del terreno

Ubicación del terreno respecto a la manzana Ubicación en la zona

1.0 0.365 0.179 - 0.050 0.161 0.370 0.083 0.281 0.758 0.626 0.580 0.119 0.327

Tabla Model Sumary.-

R.- Existe una correlación total de todas las variables del modelo R= 1 0, esto indica una alta correlación entre todas las variables ( Más tres sigma)

R square.- R2=1 0 El modelo explica en totalidad el valor comercial del bien inmueble, esto indica que el modelo tiene muy buena representación con las variables que se escogieron

R square Ajusted - R2a=i 0, este coeficiente elimina el efecto del numero de variables, en otras palabras el número de variables influye en el valor de R2, por medio de este coeficiente se elimina esta influencia, con lo que este valor marca una alta explicación de las vanables independientes elegidas para el modelo ya que es de 1 0,

48

Page 103: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

1.- Linealidad, Normalidad, Homocedasticidad.-

Grado en que cambia el coeficiente de regresión asociado a la variable dependiente, esto se muestra en la tabla anterior por la poca dispersión de correlaciones entre las variables, no hay problemas de linealidad, nótese en la gráfica 2 lo homogéneo de la distribución normal. En el histograma de residuales , y gráfica de la normal, no se observan problemas, esto se puede determinar por simple inspección visual (mismo caso que el de linealidad) Así también se tiene en la tabla Residual Statistics muy baja estándar de los datos q, lo que indica que los datos están normalizados.

El Coeficiente de determinación se obtiene de.

2 = (n-l)R2-p_ a i

n-\- p

Donde. n =Número de casos = 455 P =No. de variables independientes = 11

La contribución en el ajuste por el número de variables es muy pequeño, es de 0.995-0 99)= 005 esto hace más valido nuestro modelo

(Std. Error of the Estimate) Al transformar los datos encontramos un error estándar del estimado muy pequeño, esto es de 8 59 E-10, considerado bueno, y esta dado en la escala de la variable dependiente

(Model Summary) - R2change= 0 995 se observa muy aceptable ya que nos indica la correlación global de las variables

Tabla 21.-(Coefficents)

Aquí aparecen los coeficientes (betas), que conformarán nuestra ecuación del modelo de regresión múltiple, lo que se encuentra cuestionable es el valor de significancia en la constante de 290 muy bajo y bastante aceptable

49

Page 104: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Paso 5

1.- Determinación de la ecuación de predicción

La forma genérica para la ecuación de predicción es:

Y = J3Í K + P2XZ

+ P3X3 + P4X* + P5X5 + P6X6 + P0

Por lo que tomando los coeficientes de las variables indicados en el Tabla (Coefficients), y considerando las transformaciones que realizamos, obtenemos la ecuación de predicción para nuestro modelo, la cual es:

Valor Comercial de Inmueble = -1690483 + 47946.29 (No Cajones estacionamiento) + (-25.422X Edad de la Vivienda) + 14233.033 (Edo. De Conservación) + 157.168 ($/M2 construcción) + 94788.9 (No. De Baños) + 58890.04 ( No. De Niveles) + (-16057.7) (No. Recamaras) + 7850.595 (sup construcción) +456.407 (sup terreno) + (-18155.8) (Topografía) + (-8680.549) (ubica manzana) + (-13337.8) (ubiczona)

50

Page 105: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

6.5. EJEMPLO DE APLICACIÓN

A continuación se hace la aplicación de la Ecuación de Predicción encontrada con un ejemplo a un caso real de avalúo.

51

Page 106: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

1

M E D 1 A

A R M 0 N 1 C A

1 2 3 4 S 6 7 8 9 10 11 12

VARIABLES Constante beta No. Cajones de estacionamiento Edad de la vivienda Estado de conservación $/M2 de construcción No. de Baños No. de Niveles No. de Recámaras Superficie de construcción Superficie de terreno Topografía del terreno Ubicación con la manzana Ubicación en la zona

COEF. BETA

-1690483 47946.29 -25.422

14233.033 157.168 94788.9 58890.04 -16057.7 7850.595 456.407 -18155.8

-8680.549 -13337.8

VALOR CALCULADO CON LOS CQEF, BETA PE LA EC, DE PREDICCIÓN

VALOR CALCULADO CON LOS RESULTADOS DE LA MEDIA ARMÓNICA

VALORES

-1690483 74,796.21

-278.88 50,242.61

1,299,936.53 234,128.58 96,579.67

-47,691.37 1,207,971.05

69,191.30 -43,392.36

-9,461.80 -24,541.55

1,216,996.99

1,316,457.00

En esta tabla se analiza la ecuación de predicción para vivienda de tipo medio, usando la media armónica de todos y cada uno de los 35 datos de la matriz original (datos sin transformar) para analizar su comportamiento respecto a esta medida

Page 107: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

1

M

1 2 3 4 S 6 7 8 9 10 11 12

VARIABLES Constante beta No. Cajones de estacionamiento Edad de la vivienda Estado de conservación $/M2 de construcción No. de Baños No. de Niveles No. de Recámaras Superficie de construcción Superficie de terreno Topografía del terreno Ubicación con la manzana Ubicación en la zona

COEF. BETA -1690483 47946.29 -25.422

14233.033 157.168 94788.9 58890.04 -16057.7 7850.595 456.407 -18155.8 -8680.549 -13337.8

VALOR CALCULADO CON LOS COEF, BETA DE LA EC, PE PREDICCIÓN

VALORES -1690483 78,631.92

-361.25 51,665.91

1,328,383.94 236,972.25 101,879.77 -48,333.68

1,264,730.85 72,541.33

-44,844.83 -9,809.02

-26,675.60 1,314,298.59

VALOR CALCULADO CON LOS RESULTADOS DE LA MEDIA GEOMÉTRICA 1,361,661.00

En esta tabla se analiza la ecuación de predicción para vivienda de tipo medio, usando la media geométrica de todos y cada uno de los 35 datos de la matriz original (datos sin transformar) para analizar su comportamiento respecto a esta medida

Page 108: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

M E D 1 A

A R 1 T M E T 1

C

A

1 2 3 4 5 6 7 8 9 10 11 12

VARIABLES

Constante beta No. Cajones de estacionamiento Edad de la vivienda Estado de conservación $/M2 de construcción No. de Baños No. de Niveles No. de Recámaras Superficie de construcción Superficie de terreno Topografía del terreno Ubicación con la manzana Ubicación en la zona

COEF. BETA

-1690483 47946.29 -25.422

14233.033 157.168 94788.9 58890.04 -16057.7 7850.595 456.407 -18155.8

-8680.549 -13337.8

VALOR CALCULADO CON LOS COEFf BETA DE LA EG. PE

*

PREDICCIÓN

VALOR CALCULADO CON LOS RESULTADOS DE LA MEDIA ARITMÉTICA

VALORES

-1690483 81,988.16

-432.17 53,231.54

1,354,159.49 239,815.92 106,002.07 -49,136.56

1,325,023.42 76,215.40

-46,115.73 -10,156.24 -28,542.89

1,411,569.40

1,410,800.00

En esta tabla se analiza la ecuación de predicción para vivienda de tipo medio, usando la media aritmética de todos y cada uno de los 35 datos

de la matriz original (datos sin transformar) para analizar su comportamiento respecto a esta medida

Page 109: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

EJEMPLO DE APLICACIÓN DE LA ECUACIÓN D&PREDICCIÓN A UN CASO REAL

Av.

G U A D A L U P E

6 2 2 6

6

8

10 11 12

VARIABLES

Constante beta No. Cajones de estacionamiento

Edad de la vivienda Estado de conservación

$/M2 de construcción No. de Baños No. de Niveles

No. de Recámaras Superficie de construcción

Superficie de terreno Topografía del terreno

Ubicación con la manzana Ubicación en la zona

COEF. BETA

-1690483 47946.29 -25.422

14233.033 157.168 94788.9 58890.04 -16057.7 7850.595 456.407 -18155.8

-8680.549 -13337.8

VALORES DE LAS VARIABLES Constante

2 (Cajones de estac.) cero años (Nueva)

5 (Muy bueno) 10,212.00

2.5 (baños) 2 (Niveles)

3 (Recámaras) 183.50 (M2) 169.60 (M2)

1 (Topografía Plana) 1 (Lote medianero)

2* (Bueno)

VALOR TOTAL CALCULADO CON LOS COEF. BETA PE LA EC. DE PREDICCIÓN

VALORES PARCIALES

-1690483 95,892.58

0.00 71,165.17

1,604,999.62 236,972.25 117,780.08 -48,173.10

1,440,584.18 77,406.63 -18,155.80 -8,680.55

-26,675.60 $1,852,632.45

AVALUÓ # 04147 REALIZADO EL 08-DIC-2006 CUYO VALOR COMERCIAL FUE DE | $1,874,0Q0^00|

1,852,632/1,874,000

0.9886

DIFERENCIA DE $21,367.55

Page 110: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

AVALUÓ INMOBILIARIO Clave Avaluó SHF 1900 3061 4-400 29302

Avalúo No 04147 / 2006

UBICACIÓN DEL INMUEBLE

Cal le :

n ú m e r o e x t .

c o n f rente al .

e n t r e l as c a l l e s d e

Co lon ia

C.P

D e l e g a c i ó n o Mun i c ip io

Ciudad o Pob lac i ón

E s t ado

VALOR COMERCIAL

F e c h a de l a va lúo

AV GUADALUPE N° 6 2 2 6

15-G JARDÍN DE LAS DALIAS ( LOTE 15 MANZANA G)

AL ORIENTE CON RESPECTO A LA MANZANA DE SU

UBICACIÓN

JARDÍN DE LOS TULIPANES Y DE LAS ORQUÍDEAS

RESIDENCIAL PLAZA GUADALUPE CONDOMINIO JARDINES

DE CHAPALITA

4 5 0 1 0

ZAPOPAN

ZAPO PAN

JALISCO

$ 1 , 8 7 4 , 0 0 0 . 0 0

8 de D ic iembre de 2 0 0 6

Pagina 1

ñ

6 1? 2009 04147 AV GUADALUPES 6226 JARDÍN DE LAS DAUAS N 1 5-G J DF CHAPALITA 2AP0PAN JAI

Page 111: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

AVALUÓ INMOBILIARIO Clave Avalúo SHF. 1900 3061 4400 29302

Avalúo No.

04147 / 2006

VIL-RE SUM EN DE VALORES

RESULTADO DE VALORES ESTIMADOS :

COMPARATIVO DE MERCADO :

VALOR FÍSICO O DE COSTOS :

INGRESOS (VALOR POR CAPITALIZACIÓN DE RENTAS)

$

$

1,874,000

1,521,528

NO APLICA

VIII.- CONSIDERACIONES PREVIAS A iXcONCLÜSIÓÑ

Por las Características del Inmueble y por su Proposito se Considera como Valor Comercial, al Valor Comparativo de Mercado en Números Redondos.

I X . - C O N C L U S I Ó N

V A L O R C O M E R C I A L $ 1,874,000

UN MILLÓN OCHOCIENTOS SETENTA Y CUATRO MIL PESOS 00/100 M.N.

ESTA CANTIDAD REPRESENTA EL VALOR COMERCIAL AL DÍA : 8 de Diciembre de 2006

VALOR REFERIDO AL:

VALUADOR PROFESIONAL FUNCIONARIO AUTORIZADO

ARQ. JUAN MANUEL BRAVO ARMEJO MAE. & MVII Controlad*» : ING. ABEL GODINEZ MARUN

Especialidad : Inmuebles Registro ante la SHF: '0600775 GFB OIN 070 0300392

Registro ante la institución : Registro ante la SJtiF :

NOTA: EL PRESENTE AVALÚO NO TENDRÁ VALIDEZ PARA FINES DISTINTOS DE LO ESPECIFICADO EN EL PROPOSITO , DEBERÁ CONTENER SELLO Y FIRMA DE LOS FUNCIONARIOS AUTORIZADOS.

El presente avalúo se compone de

Fotografías Síntesis Anexas

12 6 1 5 24 HOJAS

página 12

6-12-8009- 04147- AV. GUADALUPE N" 6226. JARDÍN DE LAS DALIAS N415-Q. J. DE CHAPAUTA 2AP0PAN. JAL

Page 112: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

CONCLUSIONES :

• El uso de la Técnica de Regresión Múltiple es una poderosa herramienta para el avalúo de bienes inmuebles, ya que permite obtener resultados coherentes

• Los resultados obtenidos en la presente investigación, presentan un alto índice de determinación y precisan la Ecuación Predictiva del valor de un bien inmueble.

• Se probó la Ecuación de Predicción obtenida con los resultados de la Matriz de datos sin transformar, con respecto a la Media Armónica, Media Geométrica y Media Aritmética, presentado una variación poco significativa en los resultados de valor que van de mayor a menor dispersión, lo cual nos permite tener un alto grado de predicción.

• Por último se tomó un 36vo. dato que quedó fuera de la matriz original con la finalidad de comparar el resultado del valor comercial emitido en dicho avalúo practicado por un profesional de la valuación, con los coeficientes betas obtenidos, y las variables propias del bien valuado, esto en la misma zona de la muestra, obteniéndose, lo siguiente:

Valor Comercial emitido en el avalúo $ 1'874,000.00 Valor Comercial aplicando la Ecuación $ 1'852,632.45

diferencia de $ 21,367.55

Por todo lo anterior se concluye que la Ecuación encontrada predice con un alto índice de confiabilidad y confirma la Hipótesis de esta investigación que es :

"El valor de un bien inmueble calculado a partir de la aplicación del Análisis Multivanado (SPSS) es más justo y equitativo que el valor de un bien inmueble calculado por el Método de Mercado (Homologación)"

• Y que la homologación solo debe ser usada si el valuador la considera útil al caso y si así lo fuera, que determine su número de comparables razonando su uso.

Page 113: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

RECOMENDACIONES:

• Se recomienda que se pruebe la ecuación obtenida, y se comparen los resultados con otros avalúos que hayan sido realizados por diferentes peritos valuadores pero en zonas diferentes, para analizar su comportamiento.

• Se propone que se sigan haciendo investigaciones para encontrar nuevas ecuaciones de predicción, para diferentes tipos de construcción como el residencial y el económico, ya que la que se obtuvo predice para bienes inmuebles de tipo medio, porque los datos de la muestra así fueron establecidos.

• Se exhorta al gremio de valuadores profesionales a empezar a utilizar nuevas metodologías en la elaboración de avalúos inmobiliarios como lo son software de Análisis Multivariado y de Redes Neurales Artificiales, ya que en otros países ya se ha desarrollado mucho en este campo y como la nueva globalización así lo demanda que pueda cualquier valuador nuestro competir con cualquiera de otros países y estar al mismo nivel de ellos.

BIBLIOGRAFÍA

• JosephF. Hair, Rolph E. Anderson, Ronald L. Tatham Multivariate Data Analysis With Readings Editorial Prentice Hall, cap. 1,2,3, 3A Magdalena Ferraz Aramaz,

• SPSS para Windows, Programación y Análisis, Me Graw Hill

• Paquete de Computación SPSS for Windows Versión 7 5

• Hair, J F , Anderson, R E , Tatham, R L , BLACK, W C 1995 Multivariate Data Analysis 4ta Ed Prentice Hall - Upper Saddle River, New Jersery

• Pérez López, C. (2001). Técnicas estadísticas con SPSS. Universidad Complutense de Madrid.

• Pitarque A.Roy y Ruiz J. Redes Neurales vs Modelos estadísticos, simulaciones sobre tareas de predicción. Universidad de Palencia España.

Page 114: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

GLOSARIO DE TÉRMINOS :

Red neural, red neuronal

Definición Un modelo artificial de neuronas en el cerebro, consistente usualmente en una computadora provista de nodos o células interconectados que pueden poseer uno de dos valores, sí o no, con enlaces calibrados para tener valores numéricos (llamados pesos) para dejar pasar flujos de potencial Dichos flujos adquieren patrones dictados por el peso de los enlaces A veces se usa la palabra neural para una red artificial, reservado "neuronal" para la biológica

neurona

Definición. Hay dos tipos de células cerebrales, las neuroglias (a la vez aislantes eléctricos, fábricas bioquímicas y eliminadoras de detritos producidos por accidentes) -se estiman en el 90 % del total - y las neuronas (que descargan o están en descanso) -que solo son el 10 % restante. Estas últimas tienen diferentes tamaños y formas y -presumiblemente- cumplen diferentes funciones dependiendo de la estructura, el neurotransmisor usado y su ubicación en el cerebro Se las simula en computación con un amplificador operacional y otros dispositivos electrónicos, sobre todo de toma a tierra (Hopfield y otros). Esto ignora la importantísima contribución de los neurotransmisores o neurohumores en la operación neuronal, pero involucra un punto de partida para la comprensión de cuánto resta por comprender en detalle las redes neuronales como sistemas complejos fuertemente interrelacionados.

Dendrite Synapse

Myelin Sheath

Axon

Synapse

Cell Body

Page 115: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

perceptrón

Definición Un modelo electrónico probabilístico del almacenaje y de la organización cerebrales en el cerebro Este modelo, propuesto en la década de 1950 por Rosenblatt, es el abuelo de las modernas redes neurales. Sus unidades son células electrónicas que exhiben características de procesamiento adaptables o cambiables a través de la exposición repetida al aprendizaje, esto es, a ser expuestas a una entrada o input repetido

realimentación o retroalimentación

Definición: En fisiología, señales hacia el cerebro provenientes de órganos y sentidos fisiológicos monitoreados. En psicología, señales o pistas que ayudan en la confirmación de la interpretación que hacemos de un input. En redes neurales, retropropagación de señales de error que ayuda a la corrección y ajuste de los pesos en el proceso de aprendizaje Lo contrario a retroalimentación se suele llamar avanacción, esto es, acción hacia adelanten.

disparo

Definición: El proceso por el cual se activa una célula nerviosa o un nodo de una red neuronal. Cuando se aplica un potencial eléctrico a las neuronas o a los nodos de una red artificial hasta el punto de superar cierto umbral, se dice que la célula puede disparar permitiéndole propagar el potencial eléctrico

Tune

Page 116: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

peso

Definición En inteligencia artificial la palabra "peso" aparece con motivo del nivel de confianza que en forma abstracta se le confiere a la cantidad de activación que difunde desde una neurona a las que le siguen en una red neuronal natural o desde un nodo a los que lo siguen en una red neural artificial Cuando se aumenta el peso de las entradas a una neurona o nodo, es más fácil lograr superar el umbral de disparo del mismo y se propaga la señal del potencial de acción

conexionismo, computación conexionista

Definición: Conjunto de teorías sobre la estructura de enlaces caóticos del cerebro y su modelización usando redes neurales artificiales. El conexionismo involucra un esquema masivamente paralelo en el cual el aspecto saliente es la estructura de enlaces con sus pesos (niveles de flujo eléctrico admisible por el enlace). Ambos son críticos.

La computación conexionista es la que emplea redes neurales para sus programas de inteligencia artificial. Se la denomina asimismo computación subsimbólica. Sus posibilidades están consideradas en el ensayito sobre la "Paradoja de la cognición".

redes neurales y método científico

Definición La tradición del método científico, aplicada al caso de los ensayos con redes neurales artificiales, establece que las hipótesis que se pretenden confirmar con el empleo de ellas debieran indicarse con claridad por adelantado, para mostrar el logro de lo planeado a continuación Esto no siempre se hace tal cual. Se prueba una red con cierta arquitectura para ver el resultado, procediendo en forma difusa, por prueba y error Es entonces una tecnología típica

Page 117: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

conducta

Definición Comportamiento o acción como respuesta a estímulos externos e internos, que se pueden interpretar como cascada de subcomportamientos Cualquier animal provisto de sistema nervioso muestra un amplio repertorio de reflejos (donde un estímulo del ambiente provoca una respuesta típica), taxas (como las de evitar zonas nesgosas y preferir zonas donde se encuentra la pareja sexual, comida, etc) y patrones de acción fija (como la de acicalarse si no hay nada que hacer, o la de huir frente al nesgo) Hay conductas basadas en reflejos, conducta táxica (basada en taxas), conducta basada en patrones de acción fija, y combinaciones o cascadas que parten de un cebado inicia y que a veces intercalan subconductas caóticas con valor de supervivencia. Además el animal tiene factores internos y el ser humano y otros animales supenores tienen estados mentalesque lo llevan a conductas influidas por ellos.

El sistema robótico más sencillo que muestra conductas y hábitos es uno compuesto de sensores y efectores. Los sensores están conectados directamente a los efectores y ya sea los activan o los inhiben. (Exagerando, algo parecido es lo que afirmaban los conductivistas clásicos de mitad de siglo, acerca del ser humano, negando todo estado mental intermedio). En los robotitos denominados Stiquitos esto se nota claramente Un sistema de control primitivo es suficiente como para inducir una conducta táxica. Como caso límite, el protozoario unicelular, aloja su sistema de control completo en una célula. En animales con sistema nerviosos aparece la necesidad del envío de señales químicas y eléctricas entre los sensores y los efectores. Las señales químicas fueron quizás anteriores en el tiempo, sirviendo el flujo de sangre(en animales superiores) como transportador de hormonas y otras biomoléculas señalizadoras. La conección de interneuronas hace esto mismo eléctricamente. Con química y con electricidad las habilidades conductuales puede ser que mejoren con respecto a la ligadura directa sensor/efector, pero su razón principal estriba en el mayor tamaño del animal provisto de sistema nervioso.

Las conductas pueden ser debidas a una arquitectura de subsumción, que consiste en un cierto número de subrredes neuronales, sistemas distribuidos, que controlan numerosas conductas La explicación mecanística de las conductas, esto es, el correlato neuronal de la conducta, es la ciencia y la bioingeniería denominada Neuroetología, el estudio de los mecanismos neuronales que están dando ocasión a la conducta Por extensión la Neuroetología Computacional (Randall Beer) es la disciplina que usa el modelado de circuitos neuronales artificiales similares a los animales denominados simples (invertebrados), circuitos que no son para nada simples Esos estudios se muestran como mapas formados por módulos conductuales Tanto Randall Beer como Christian Balkenius tiene valiosas contribuciones a estos enfoques que intentan avanzar de conductas simples a otras más complejas

Page 118: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Típico aspecto de una RNA

M M M M M M M J row M M BUM ma M M m m w r n n i i i n i i i M i i i i m i n t i i i w win w m m i n w i i M M

v»S^^É^^^Jf^P^. /

/

•r Y ' ÍK IE

«MWi

Page 119: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Regresión lineal es un modelo matemático mediante el cual es posible inferir datos acerca de una población Se conoce como regresión lineal ya que usa parámetros lineales (potencia 1)

Regresión no lineal es un problema de inferencia para un modelo tipo basado en datos multidimensionales x , y , donde f es alguna función no lineal respecto a algunos parámetros desconocidos 9

La regresión estadística o regresión a la media es la tendencia de una medición extrema a presentarse más cercana a la media en una segunda medición. La regresión se utiliza para predecir una medida basándonos en el conocimiento de otra.

Análisis de varianza En estadística, análisis de varianza (ANOVA, según terminología inglesa) es una colección de modelos estadísticos y sus procedimientos asociados. El análisis de varianza sirve para comparar si los valores de un conjunto de datos numéricos son significativamente distintos a los valores de otro o más conjuntos de datos. El procedimiento para comparar estos valores está basado en la varianza global observada en los grupos de datos numéricos a comparar. Típicamente, el análisis de varianza se utiliza para asociar una probabilidad a la conclusión de que la media de un grupo de

_ puntuaciones es distinta de la media de otro grupo de puntuaciones.

Estadística multivariante Los métodos estadísticos multivariantes y el análisis multivariante son herramientas estadísticas que estudian el comportamiento de tres o más variables al mismo tiempo. Se usan principalmente para buscar las variables menos representativas para poder eliminarlas, simplificando así modelos estadísticos en los que el número de variables sea un problema y para comprender la relación entre varios grupos de variables. Algunos de los métodos más conocidos y utilizados son la Regresión lineal y el Análisis discriminante

Análisis de covaríanza El análisis de covananza o ANCOVA, acrónimo del inglés analysis of covanance, es un modelo lineal general con una variable cuantitativa y uno o más factores. El ANCOVA es una fusión del ANOVA y de la regresión lineal múltiple. Es un procedimiento estadístico que permite eliminar la heterogeneidad causada en la variable de interés (variable dependiente) por la influencia de una o más variables cuantitativas (covanables) Básicamente, el fundamento del ANCOVA es un ANOVA al que a la variable dependiente se le ha eliminado el efecto predicho por una o más covanables por regresión lineal múltiple La inclusión de covariables puede aumentar la potencia estadística porque a menudo reduce la variabilidad.

Page 120: ITC INSTITUTO TECNOLÓGICO DE LA … · ANÁLISIS MULTIVARIADO A TRAVÉS DE ECUACIONES DE PREDICCIÓN. (Con base al principio de la Red Neural)" ... el uso de la homologación en

Mínimos cuadrados Mínimos cuadrados es una técnica de optimización matemática que, dada una serie de mediciones, intenta encontrar una función que se aproxime a los datos (un "mejor ajuste") Intenta minimizar la suma de cuadrados de las diferencias ordenadas (llamadas residuos) entre los puntos generados por la función y los correspondientes en los datos. Específicamente, se llama mínimos cuadrados promedio (LMS) cuando el número de datos medidos es 1 y se usa el método de descenso por gradiente para minimizar el residuo cuadrado. Se sabe que LMS minimiza el residuo cuadrado esperado, con el mínimo de operaciones (por iteración) Pero requiere un gran número de iteraciones para converger.

Correlación En probabilidad y estadística, la correlación indica la fuerza y la dirección de una relación lineal entre dos variables aleatorias. Se considera que dos variables cuantitativas están correlacionadas cuando los valores de una de ellas varían sistemáticamente con respecto a los valores homónimos de la otra: si tenemos dos variables (A y B) existe correlación si al aumentar los valores de A lo hacen también los de B y viceversa.

Coeficiente de Variabilidad Es la razón de la desviación estándar con respecto

a la media de una distribución-

Análisis de Regresión: Es el estudio de la relación observada entre variables.

Coeficiente de Determinación R2:Es la proporción de la variación total en "Y" que puede ser explicada por la relación lineal con "X".

Coeficiente de Correlación: O llamada también Correlación de Pearson, y es el índice que mide la relaciónlineal entre las variables en estudio,