estimaciÓn de avaluos masivos mediante...

ESTIMACIÓN DE AVALUOS MASIVOS MEDIANTE INTELIGENCIA ARTIFICIAL

APLICANDO LAS HERRAMIENTAS DE ALGORITMOS GENETICOS EN LAS UPZ

BOLIVIA Y GRANJAS DE TECHO CON VIGENCIA EN EL AÑO 2015

JUAN SEBASTIAN NIETO ARANGUREN

CODIGO: 20092025055

UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS

FACULTAD DE INGENIERÍA

INGENIERÍA CATASTRAL Y GEODESIA

BOGOTÁ D.C.

2016

ESTIMACIÓN DE AVALUOS MASIVOS MEDIANTE INTELIGENCIA ARTIFICIAL

APLICANDO LAS HERRAMIENTAS DE ALGORITMOS GENETICOS EN LAS UPZ

BOLIVIA Y GRANJAS DE TECHO CON VIGENCIA EN EL AÑO 2015

JUAN SEBASTAN NIETO ARANGUREN

20092025055

Trabajo de grado mediante la modalidad de monografía

EDWIN ROBERT PEREZ CARVAJAL

UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS

FACULTAD DE INGENIERÍA

INGENIERÍA CATASTRAL Y GEODESIA

BOGOTÁ D.C.

2016

[3]

NOTA DE ACEPTACIÓN Y OBSERVACIÓN

____________________________________________________________________________

____________________________________________________________________________

____________________________________________________________________________

_________________________________________________________________________

____________________________________________________________________________

____________________________________________________________________________

____________________________________________________________________________

_________________________________________________________________________

PRESIDENTE O DIRECTOR

_____________________________________

REVISOR O JURADO

_____________________________________

ESTUDIANTE O AUTOR

_____________________________________

[4]

DEDICATORIA

Esta tesis se la dedico a mi Dios quién supo guiarme por el buen camino, darme fuerzas para

seguir adelante y no desmayar en los problemas que se presentaban, enseñándome a encarar las

adversidades sin perder nunca la dignidad ni desfallecer en el intento.

A mi familia quienes por ellos soy lo que soy. Para mis padres por su apoyo, consejos,

comprensión, amor, ayuda en los momentos difíciles, y por ayudarme con los recursos

necesarios para estudiar. Me han dado todo lo que soy como persona, mis valores, mis

principios, mi carácter, mi empeño, mi perseverancia, mi coraje para conseguir mis objetivos.

A mi hermana y tía por estar siempre presentes, acompañándome para poderme realizar tanto

en los momentos duros como los momentos felices. A mis compañeros y profesores tanto tutores

como participes en mi formación profesional que siempre me he encomendado mi conocimiento

en sus manos.

[5]

CONTENIDO

INDICE DE ILUSTRACIONES .................................................................................................................. 7

ÍNDICE DE TABLAS .................................................................................................................................. 8

ÍNDICE DE ECUACIONES ........................................................................................................................ 9

1. INTRODUCCIÓN .............................................................................................................................. 10

2. ANTECEDENTES .............................................................................................................................. 11

3. OBJETIVOS ....................................................................................................................................... 12

3.1 OBJETIVO GENERAL ...................................................................................................................... 12

3.2 OBJETIVOS ESPECÍFICOS .............................................................................................................. 12

4. PLANTEAMIENTO DEL PROBLEMA ............................................................................................ 12

5. JUSTIFICACIÓN ............................................................................................................................... 13

6. MARCO TEÓRICO CONCEPTUAL ................................................................................................ 14

6.1 INTRODUCCIÓN ACERCA DE LA INTELIGENCIA ARTIFICIAL ............................................. 14

6.1.1. ALGORITMOS GENETICOS ........................................................................................... 16

6.1.2 PROGAMACIÓN GENÉTICA .......................................................................................... 21

6.1.3 ESTRATEGIAS EVOLUTIVAS ....................................................................................... 23

6.1.4 PARADIGMAS DE LA COMPUTACIÓN EVOLUTIVA ............................................... 24

6.1.5 VENTAJAS DE LAS TÉCNICAS ..................................................................................... 25

6.2 AVALÚOS .......................................................................................................................................... 26

7. MARCO ESPACIAL .......................................................................................................................... 29

7.1 UPZ 72 BOLIVIA ............................................................................................................................... 30

7.2 UPZ 112 GRANJAS DE TECHO ....................................................................................................... 34

8. MARCO TEMPORAL ........................................................................................................................ 38

9. METODOLOGIA ............................................................................................................................... 38

9.1 FASES: ................................................................................................................................................ 40

9.2 INFORMACION ................................................................................................................................. 43

9.3 ANÁLISIS EXPLORATORIO DE DATOS ...................................................................................... 43

9.4 SOFTWARE ....................................................................................................................................... 43

10. DESARROLLO DE LA PROPUESTA .............................................................................................. 44

10.1 DATOS ............................................................................................................................................. 44

10.2 VARIABLES .................................................................................................................................... 44

[6]

10.3 ARQUITECTURA DEL PROGRAMA ............................................................................................. 48

10.3.1 DESCRIPCIÓN DEL PROGRAMA .................................................................................. 48

10.3.2 REQUISITOS PARA EL PROGRAMA ............................................................................ 50

10.3.3 VISTA LOGICA DEL PROGRAMA ..................................................................................... 51

10.3.4 PARAMETROS DEL PROGRAMA ...................................................................................... 52

10.4 BITACORA EXPERIMENTAL ................................................................................................. 57

10.5 RESULTADOS ........................................................................................................................... 60

10.6 ANÁLISIS DE RESULTADOS ................................................................................................. 73

10.6.1 GRAFICO DE TENDENCIA LINEAL.............................................................................. 78

10.6.2 TABLA RESUMEN UPZ GRANJAS DE TECHO ZHF 6222115153113 ........................ 84

10.6.3 CUADRO DE ERRORES E-P DEL MRNL Y ML ............................................................ 86

11. CONCLUSIONES .............................................................................................................................. 89

12. RECOMENDACIONES FUTURAS .................................................................................................. 90

13. BIBLIOGRAFÍA ................................................................................................................................ 91

ANEXOS A: CUADROS RESUMENES DE LAS UPZ BOLIVIA Y GRANJAS DE TECHO SEGÚN

CODIGO DE SECTOR .............................................................................................................................. 94

ANEXOS B: CUADROS RESUMENES DE LAS UPZ BOLIVIA Y GRANJAS DE TECHO SEGÚN

CODIGO DE USO ...................................................................................................................................... 99

ANEXOS C: CUADROS RESUMENES DE LAS UPZ BOLIVIA Y GRANJAS DE TECHO SEGÚN

ZHF 104

ANEXOS D: CUADROS RESUMENES DE LAS UPZ BOLIVIA Y GRANJAS DE TECHO SEGÚN

ZHF-AVALÚOS....................................................................................................................................... 105

ANEXOS E: GRAFICOS UPZ BOLIVIA Y GRANJAS DE TECHO SEGÚN ZHF-USOS ................. 114

[7]

INDICE DE ILUSTRACIONES

Ilustración 1: Pseudocódigo Algoritmo Genético Simple 21

Ilustración 2: Diagrama de árbol representación matemática 23

Ilustración 3: Diagrama de pastel con sus respectivos porcentajes de uso del suelo en la UPZ Bolivia 31

Ilustración 4: Imagen UPZ 72 Bolivia 33

Ilustración 5: Diagrama de pastel con sus respectivos porcentajes de uso del suelo en la UPZ Granjas de Techo 35

Ilustración 6: Imagen UPZ 112 Granjas de Techo 37

Ilustración 7: Diagrama general básico de algoritmo genético 38

Ilustración 8: Flujograma de algoritmos genéticos para hallar el óptimo valor de un avaluó con vigencia actual 39

Ilustración 9: Diagrama de flujo con los posibles pasos del algoritmo genético canónico y sus fases 40

Ilustración 10: Diagrama de flujo con los posibles pasos de programación genética y sus fases 41

Ilustración 11: Diagrama de flujo con los posibles pasos de estrategias evolutivas y sus fases 42

Ilustración 12: Ejemplo de recombinación de parámetros para la etapa de curce 42

Ilustración 14: Cuadro comparativo de todos las variables posibles en la regresión 47

Ilustración 15: Variables tomadas de la BD de Catastro con significancia nula en la regresión 48

Ilustración 16: Base de datos de la UAECD con sus variables dependientes (clases) e independientes (atributos) 51

Ilustración 17: Flujograma del programa explicando paso a paso cada proceso con sus respectivas funciones 51

Ilustración 18: Base de datos en Excel donde se guardara en Matlab VCONS 57

Ilustración 19: BD .mat almacenada y exportada desde el software conocido como interfaz 58

Ilustración 20: Ventana flotante recopilando las mejores regresiones para la clasificación deseada 58

Ilustración 21: Tabla final con los errores de cada regresión, la solución de la regresión y el parámetro fijado 59

Ilustración 22: Regresión obtenida del programa guardado en consola “Command Window” 59

Ilustración 23: Componentes de una ZHF Urbana (COLOMBIA, 2011) 67

Ilustración 24: Tendencia Lineal Entrenamiento-Pronostico del Vm2C 79

Ilustración 25: Tendencia Lineal Entrenamiento-Pronostico del VtC 80

Ilustración 26: Tendencia Lineal Entrenamiento-Pronostico del Vm2T 81

Ilustración 27: Tendencia Lineal Entrenamiento-Pronostico del VtT 82

Ilustración 28: Tendencia Lineal Entrenamiento-Pronostico del Avaluó 83

[8]

ÍNDICE DE TABLAS

Tabla 1: Barrios por localidad Engativá 30

Tabla 2: Normas Urbanísticas de la UPZ 72 Bolivia 32

Tabla 3: Barrios por localidad Fontibón 34

Tabla 4: Normas Urbanísticas de la UPZ 112 Granjas de Techo 36

Tabla 5: Descripción de las variables independientes para la solución a las regresiones 45

Tabla 6: Descripción de las variables dependientes o resultados de las regresiones 46

Tabla 7: Requisitos físicos del software AG 50

Tabla 8: Cuadro resumen según Código de Sector UPZ Bolivia 61

Tabla 9: Cuadro resumen según Código de Sector UPZ Granjas de Techo 62

Tabla 10: Tabla 11: Cuadro resumen según Código de Uso UPZ Bolivia 63

Tabla 12: Cuadro resumen según Código de Uso UPZ Granjas de Techo 64

Tabla 13: Cuadro resumen según ZHF UPZ Bolivia 65

Tabla 14: Cuadro resumen según ZHF UPZ Granjas de Techo 66

Tabla 15: Cuadro resumen según ZHF E-P UPZ Bolivia 68

Tabla 16: Cuadro resumen según ZHF E-P UPZ Granjas de Techo 69

Tabla 17: Cuadro resumen de la UPZ Bolivia ZHF_MRL 71

Tabla 18: Cuadro resumen de la UPZ Granjas de techo ZHF_MRL 72

Tabla 19: Errores estimados de la UPZ Bolivia 76

Tabla 20: Errores estimados de la UPZ Granjas de Techo 77

Tabla 21: Valores Mínimo-Máximo-Promedio UPZ Granjas de Techo ZHF 6222115153113 84

Tabla 22: Cuadro resumen de errores MAPE UPZ Bolivia 86

Tabla 23: Cuadro resumen de errores MAPE UPZ Granjas de Techo 87

[9]

ÍNDICE DE ECUACIONES

Ecuación 1: Modelo para calcular el avalúo por método de costo de reposición 28

Ecuación 2: Calculo del avalúo catastral 29

Ecuación 3: Calculo del avalúo Catastral con componentes finales 29

Ecuación 4: Error Absoluto hallada en la regresión obtenida 53

Ecuación 5: Error Absoluto en función de la solución del AG sintetizado 53

Ecuación 6: Función fitness para el conjunto de errores hallados en la regresión obtenida 54

Ecuación 7: Regresión obtenida mediante el proceso de selección 54

Ecuación 8: Regresión opcional generada arbitrariamente 54

Ecuación 9: Regresión hibrida o regresión mejorada a partir de la recombinación de ambas partes 54

Ecuación 10: Regresión hibrida con operadores de selección y cruzamiento 55

Ecuación 11: Regresión Mutada Final 56

Ecuación 12: Regresión final mediante Algoritmos Genéticos (AG’s) 56

Ecuación 13: Regresión final con estimadores 56

Ecuación 14: Regresión final con ajuste de betas 60

Ecuación 15: Formula implícita de RAE 73

Ecuación 16: Formula implícita de MAE 74

Ecuación 17: Formula implícita de RRSE 74

Ecuación 18: Formula implícita de RMSE 74

Ecuación 19: Formula implícita de MAPE 75

[10]

1. INTRODUCCIÓN

Actualmente en Bogotá, se ha dado bastante importancia acerca de un factor sumamente

relevante que ha venido incrementando considerablemente y es el precio del suelo. Ya que para

la sociedad es una gran necesidad poder participar en el uso del suelo sea para vivienda,

comercio, industrial, educacional, entre otros tipos de actividades del uso del suelo; es vital saber

cómo se origina este tipo de variable y como se valúa monetariamente frente a otros suelos

pertenecientes a estas.

Se establece como punto de referencia geográfica una UPZ la cual limitara el estudio sobre el

valor del suelo, principalmente se escogerá una UPZ debido a que contiene una cantidad

considerable de predios a avaluar y que nos facilita el trabajo al momento de sugerir

información. A partir de la información suministrada de la UPZ se procederá a calcular el valor

comercial que contiene cada uno de los predios para así estimar un avaluó en general de todos

los inmuebles.

El principal motivo de esta investigación es comparar avalúos obtenidos de la entidad UAECD

frente a avalúos resultantes por medio de algoritmos genéticos. La idea es crear una serie de

procedimientos matemáticos que ayuden a optimizar datos para aproximarnos más al resultado

deseado queriendo hacer métodos alternativos a los ya impuestos por dicha entidad.

Pero como se entiende que para estimar un avaluó masivo se necesita tener dos tipos de

informaciones tanto física como económica “ZHF y ZHGE” para esta investigación se basara

únicamente en las ZHGE ya que con los datos numéricos de los avalúos independientes, se sabrá

la estimación que este tendrá sobre la aglomeración de precios del suelo.

Es de vital importancia señalar que este tipo de procedimiento requiere cierto conocimiento

lógico; por ende se pretende adquirir un estudio sobre las pautas generales en las cuales un

algoritmo genético debe de pasar. Se detallara más adelante cada instrucción de manera ordenada

como debe de comportarse los datos frente a los procedimientos como Selección, Cruce y

Mutación que son los pilares más importantes a la hora de implementar un algoritmo genérico.

[11]

2. ANTECEDENTES

Se ha evidenciado bastante trabajo con respecto a inteligencia artificial y con mayor precisión en

cuanto a redes neuronales. Según un estudio que se elaboró en Estados Unidos en el estado de

Carolina del Norte; para lograr un avaluó inmobiliario como allá se denomina, se propuso una

estimación diferente al modelo de regresión múltiple para determinar el avaluó de 191 viviendas

resueltas por medio del método de comparación de mercado tradicional (Puppio, 1989). Como

conclusión al que llego este profesor fue que es mucho más factible solucionar un conjunto de

avalúos por método de RNA Redes Neuronales Artificiales que por estimación de regresión

múltiple. Aun así, se tiene que tener en cuenta algunas variables como Edad, Área, Vetustez,

para analizar alguna significancia mediante estadística inferencial.

Por otro lado, se han establecido para cualquier tipo de aplicación algoritmos genéticos de los

cuales en la mayoría de los casos ha tenido resultados esperados y los cuales, han evolucionado

la manera de resolver cualquier tipo de problemas cotidianos. En la universidad de Chile,

analizan el comportamiento mediante redes neuronales artificiales RNA y algoritmos genéticos

AG’s y crean modelos multivariados dinámicos para determinar la variación de signo en la IPSA

Índice de Precio de Selección de Acciones (F, 2004). Dando así como resultado una comparación

de ambas técnicas como óptimas en el desarrollo de este artículo; Mientras las redes neuronales

facilitaron las cosas con respectos a la variación de los datos en un determinado tiempo, los

algoritmos genéticos toman como mejor resultado a que la variación del signo depende

esencialmente de variables como la inversión y capacidad de rentabilidad.

También, se ha indagado mucho con el tema del valor del metro cuadrado que posee un predio

en Bogotá; ya que estiman una mejor exactitud y precisión de los datos resultantes usando

método de kernels y RNA que manejando este tipo de situaciones mediante modelos

econométricos (Gómez Morales & Hernández , 2009). Aunque mostraría una alta capacidad

explicativa no ofrecía la precisión de estimación deseada, mientras que con RNA si se obtuvo

una precisión adecuada en el valor del metro cuadrado de construcción. Para complementar el

resultado de las RNA, se estableció como ya se había mencionado el método de kernels mediante

maquinas con vectores de soporte que vendrían siendo técnicas de clasificación en las que los

datos de entrada son transformados implícitamente a un espacio nuevo. Al final se analizó y

comparo mediante una correlación los resultados obtenidos de metro cuadrado por RNA y esta

misma variable por el método de kernels al cual se concluyó que ambos modelos eran factibles

para solucionar el problema planteado.

Para finalizar este ítem, se creó una tesis en lima de la universidad nacional de Trujillo trata

sobre la aplicación de dos algoritmos de búsqueda a la selección de individuos óptimos en la

población inicial de un algoritmo genético, y la consiguiente comparación entre ambos. El

primero de ellos es el algoritmo meta-heurístico grasp, y el segundo es el algoritmo cuántico de

crover. El algoritmo cuántico de crover forma parte de una nueva generación en la ciencia de la

[12]

computación: La computación cuántica. Por tanto hace uso de conceptos matemáticos y físicos

completamente distintos a los usados en la programación clásica (Acuña Lozano & Vergara

Azabache, 2013).

3. OBJETIVOS

3.1 OBJETIVO GENERAL

Verificar la validez del uso de herramientas de algoritmos genéticos para estimar avalúos

masivos en las UPZ de Bolivia y Granjas de Techo en la ciudad de Bogotá durante la

vigencia 2015.

3.2 OBJETIVOS ESPECÍFICOS

Confrontar los resultados de los algoritmos genéticos con los modelos de regresión

tradicionalmente utilizados.

Generar un código en Matlab que permita la implementación de algoritmos genéticos en

valuación masiva.

Implementar el modelo propuesto en las UPZ 72 Bolivia y 112 Granjas de Techo.

4. PLANTEAMIENTO DEL PROBLEMA

Preguntas surgen como ¿no habrá otro procedimiento para poder mirar el comportamiento de

esta abundancia de precios diferente a una regresión lineal que cumple con dar un resultado pero

al mismo tiempo no es el más adecuado para solucionar este tipo de aplicaciones? ¿Existirá

diferentes pautas para poder llegar con exactitud al resultado deseado? ¿Qué otras herramientas

básicas podemos identificar para poder alcanzar el propósito de algún inconveniente diario? Aquí

es donde uno comienza a examinar que el paradigma al que uno se enfrenta en la vida no es más

que un modelamiento de ideas de simple solución. En algunos casos el problema yace de ciertas

dificultades debido a su complejidad de incógnitas pero que al mismo tiempo la lógica humana

es tan grandiosa que ante cualquier adversidad puede solucionarse de manera efectiva. He aquí

donde se empezara a mirar un problema al que una población está enfrentando de manera

rutinaria y que hoy por hoy es de suma importancia para la necesidad humana y es el precio del

suelo.

[13]

Recientemente, la gente se ha puesto a pensar cómo se obtiene realmente el precio del suelo al

cual estamos destinados a interactuar desde que nacemos y que es de gran importancia para el

desarrollo del territorio. Objetivamente se ha indagado sobre esos factores que hacen que el suelo

cada vez más este aumentando de valor y también la razón primordial a que cada persona tiende

a acaparar este bien a desear.

Pero el desconocimiento que hay sobre estos estudios cada vez obliga más a investigar por medio

del avance tecnológico a facilitarnos cada día el asunto del avaluó; existen muchos métodos de

hallar un avaluó las que son confiables por expertos profesionales pero la dificultad fundamental

yace del que cuando se tiene una muestra a gran escala, no sabemos organizar muy bien todos

esos datos y lo que realmente se logra es linealizar estos datos de tal manera que solo se recurre a

este proceso para lograr solucionar un estudio masivo.

5. JUSTIFICACIÓN

En una ciudad como Bogotá que ha estado creciendo exponencialmente durante los últimos años,

ha venido a sufrir diferentes cambios en cuanto a la concepción territorial. Cada vez el terreno,

suelo, tierra es más apetecida debió a la gran carencia que tiene este fenómeno con relación a

beneficios económicos a los que estamos acostumbrados a vivir en el presente. Una de las

razones más importantes para darle importancia a este impacto es porque podemos mejorar el

proceso mediante el cual se evalúa un predio y se puede comparar frente a una inteligencia

básica capaz de resolver problemas de cotidianidad en este caso el precio del suelo.

La ignorancia de estas herramientas como inteligencia artificial y todos los tipos de

conocimientos basados en la lógica en este caso aritmética nos pueden ayudar a optimizar este

tipo de situaciones; la intención de estos instrumentos de conocimiento es empezar a utilizarlas

para satisfacer sesgos que se tienen sobre el cálculo masivo de una UPZ de una manera más

subjetiva y de un mejor entendimiento para así crear un estudio diferente al que se ha venido

manejando como linealizar los datos. Cabe recalcar que la finalidad de este ideal es estructurar

un método diferente al de parametrizar de manera lineal los datos para así poder obtener

información extrapolarizada de forma efectiva.

Para finalizar, la mejor manera de verificar si la investigación va de manera correcta con el

propósito a fin que es comparar los resultados arrojados de la solución del problema junto con

los datos obtenidos por la UAECD y analizar qué tan relevantes se comportan cada uno; de ahí

optaremos por elegir el mejor modelo para dar como fin a la investigación planteada.

[14]

6. MARCO TEÓRICO CONCEPTUAL

6.1 INTRODUCCIÓN ACERCA DE LA INTELIGENCIA ARTIFICIAL

La Inteligencia Artificial (IA) es la rama de las Ciencias de la Computación que estudia el

software y hardware necesarios para simular el comportamiento y comprensión humanos. El

objetivo último de la IA es simular la inteligencia humana en una máquina creando robots que

sean conscientes y con sentimientos reales, similares a los humanos. Uno de los problemas más

difíciles es la simulación de la conciencia, cualidad humana que hace que nos demos cuenta de

nuestra propia existencia (Malpica Velasco, 2005).

Con el transcurrir de los tiempos, la tecnología se ha desarrollado de tal modo de que ayuda al

ser humano con tareas de optimización de datos; un gran número de información a veces es útil

para resolver necesidades importantes como también puede ser bastante innecesario recolectar

toda la información obtenida.

Una máquina que llegue a ejecutar una serie de programas, algoritmos, series numéricas, etc. Ya

es en sí un milagro para el desarrollo tecnológico; pero para llegar a ello se necesitó de muchos

años de intentos fallidos, accidentes y bastante tiempo en comenzar con una nueva era. En si

todo este tipo de avance solo puede significar una cosa y es Inteligencia Artificial. Se denomina

este término o como algunos autores lo llaman inteligencia computacional es una ciencia la cual

de manera multidisciplinaria (ciencias naturales básicas) ayudan a solucionar paradigmas

cotidianos que posee la humanidad (Yu, 8).

Por otro lado, en el origen y desarrollo de la IA Inteligencia Artificial confluyeron dos puntos de

vista: el científico, que intenta simular con el computador la verificación de teorías sobre los

mecanismos de la inteligencia; y el de ingeniería, que intenta dar a los computadores capacidades

lo más cercanas posibles a las intelectuales. Para ello los usuarios de AI se han debido enfrentar a

cuestiones nuevas y muy variadas, y al pretender resolverlas ha desarrollado un enorme conjunto

de innovadoras técnicas: representación y modelización del conocimiento, búsqueda heurística,

aprendizaje automático, y técnicas de razonamiento aproximado entre muchas otras. (Moscovitz)

El nacimiento de la Inteligencia Artificial se sitúa en una reunión celebrada en el Dartmouth

College (Hanover, EE.UU) en 1956, en la que se planteó la posibilidad de construir maquinas

inteligentes. Llama la atención que en esa fecha la informática apenas se había desarrollado y ya

se planteaba la posibilidad de diseñar mecanismos inteligentes.

En aquella reunión se encontraban entre otros Claude Shannon, padre de la Teoría de la

Información; Marvin Minsky, que más tarde demostraría las limitaciones de ciertos modelos de

redes neuronales; Herbert Simon, premio Nobel de Economía quienes además desarrollo el

primer programa de Inteligencia Artificial.

[15]

Reconocido en general como los primeros trabajos en IA son tres por Warren McCulloch y

Walter Pitts (1943) aplicados al conocimiento de la filosofía básica y funcionamiento de las

neuronas en el cerebro, el análisis formal de la lógica proposicional de Russell y Whitehead y la

teoría de la computación de Turing (UNAM, 2006).

Se dice que para solucionar un problema del vivir se tienen que recurrir a 5 paradigmas de la IA

Inteligencia Artificial, pero solo se pueden aplicar sabiendo bien el problema a plantear y

mirando una solución objetiva es la manera correcta de utilizar este tipo de paradigmas. Cabe

aclarar que depende de la magnitud del problema se pueden usar de 1 hasta 3 paradigmas para

ejecutar bien la misión de las ya mencionadas y que no son necesarias usarlas todas a la vez

(Engelbrecht, 2007).

Artificial Neural Networks “Redes Neuronales Artificiales”(NN)

Evolutionary Computation “Computación Evolutiva” (EC)

Swarm Intelligence “Inteligencia de Enjambre” (SI)

Artificial Immune Systems “Sistema Inmune Artificial” (AIS)

Fuzzy Systems “Sistemas Difusos” (FS)

Las aplicaciones más frecuentes de la inteligencia artificial incluyen campos como la robótica, el

análisis de imágenes o el tratamiento automático de textos. En robótica, uno de los campos de

investigación actual con mayor proyección es del aprendizaje adaptativo, en el que un sistema

robotizado explora diferentes configuraciones con el objetivo de realizar un movimiento

complejo (caminar, agarrar un objeto, realizar una trayectoria, etc.). El objetivo podría ser, por

ejemplo, que un robot cuadrúpedo se levante y ande de forma autónoma, de forma que siga un

proceso de exploración y aprendizaje similar al que realiza un recién nacido durante los primeros

meses de vida. Un sistema de IA en este caso se encargaría de explorar diferentes movimientos

de forma aleatoria, midiendo las variables de cada articulación y comprobando en cada momento

el grado de éxito alcanzado por cada secuencia de acciones (altura del centro de masas,

desplazamiento horizontal, fluctuaciones en la posición vertical, etc.). El sistema de IA

modularía la ejecución de las diferentes acciones, incrementando la probabilidad de aquellas que

presenten un mejor rendimiento y restringiendo las que no comporten una mejora de la función

objetivo. Un área afín a la robó- tica es la de las interfaces cerebro-computadora (BCI, Brain-

computer Interfaces), sistemas artificiales que interactúan con el sistema nervioso mediante

señales neurofisiológicas con el objetivo asistir a personas discapacitadas durante la ejecución de

determinadas tareas motoras (Benítez, Escudero, & Kanaan, 2003).

Todas estas herramientas son utilizadas para crear modelos híbridos a través de modelos ya

postulados por diferentes creadores. En nuestro caso, vamos a fijarnos más en modelos

econométricos de los cuales hay cierto sesgamiento en cuanto a estimar un valor y especialmente

su utilizara la herramienta (EC) Evolutionary Computation también conocida como algoritmos

genéticos para precisar mucho mejor el valor de las respectivas Unidades de Planeamiento Zonal.

[16]

6.1.1. ALGORITMOS GENETICOS

Explícitamente, un algoritmo genético conocido como AG es un método que nace de la

programación que consiste principalmente en acoplar la evolución biológica de manera

codificada o computarizada para resolver posibles problemas del vivir común. Dado un problema

específico a resolver, la entrada del AG es un conjunto de soluciones potenciales a ese problema,

codificadas de alguna manera, y una métrica llamada función óptima “Función Fitness” que

permite evaluar cuantitativamente a cada candidata. Estas candidatas suelen ser soluciones que

con certeza se saben que funcionan, con el único propósito de que los AG las mejore, Pero estas

se pueden dar aleatoriamente (Marczyk, 2004).

El problema de los AG consiste en encontrar la mejor pronóstico o hipótesis como los menciona

algunos autores dentro de un numero sin fin de posibles predicciones hacia la solución correcta.

Esta hipótesis es la que optimizara alfanuméricamente un problema en cuestión Función Fitness.

Un ejemplo claro es si la tarea de aprendizaje es el problema de aproximar Una función dada

desconocidos ejemplos de entrenamiento de su entrada y salida, luego la palabra optima podría

definirse como la exactitud de la hipótesis sobre estos datos de entrenamiento. Por otro lado, Si

la tarea es aprender una estrategia para jugar al ajedrez, fitness podría definirse como el número

de juegos ganados por el individuo cuando se juega contra otros individuos en la población

actual (Mitchell, 1997).

A estos algoritmos se deben tener en cuenta probabilísticamente las operaciones con las cuales

ingresan estas hipótesis; “El algoritmo opera iterativamente la actualización de un conjunto de

hipótesis, llamada la población. En cada iteración, todos miembros de la población se evalúan de

acuerdo con la función óptima. Una nuevo población se genera seleccionando

probabilísticamente los individuos más aptos de la población actual. Algunos de estos individuos

seleccionados se llevan adelante en la población próxima generación intacto. Otros se utilizan

como base para la creación de nuevos individuos descendencia mediante la aplicación de las

operaciones genéticas como el cruce y mutación.” (Mitchell, 1997).

Como se mencionó en el párrafo anterior, se mencionan algunas de las etapas o parámetros por

las cuales tiene que pasar un algoritmo genético para llegar a la solución más óptima:

Tamaño de la población o muestra

Probabilidad de Selección (Función Fitness)

Probabilidad de Cruce (Crossover)

Probabilidad de Mutación

A continuación, hablaremos de cada uno de los parámetros mencionados que debe de llevar un

AG.

[17]

TAMAÑO DE LA POBLACION

Este parámetro indica la cantidad o número de muestra o población que tenemos para resolver el

problema. En caso de que esta medida sea insuficiente, el algoritmo genético tiene pocas

posibilidades de realizar reproducciones con lo que se realizaría una búsqueda de soluciones

escasa y poco óptima. Por otro lado si la población es excesiva, el algoritmo genético será

excesivamente lento. Se ha investigado y has hecho deducciones de que hay un límite a partir

del cual es indiferente elevar o reducir el tamaño de la muestra; por lo que también a esta

muestra se tendrá en cuenta cierta velocidad por la cual se van a procesar los datos.

PROBABILIDAD DE SELECCIÓN O FUNCION FITNESS

Un algoritmo genético puede utilizar muchas técnicas diferentes para seleccionar a los individuos

que deben copiarse hacia la siguiente generación, pero abajo se listan algunos de los más

comunes. Algunos de estos métodos son mutuamente exclusivos, pero otros pueden utilizarse en

combinación, algo que se hace a menudo.

Algunos de estos métodos en el proceso de selección serian según Adam Marczyk:

Selección elitista:

Se garantiza la selección de los miembros más aptos de cada generación. (La mayoría de

los AG no utiliza elitismo puro, sino que usan una forma modificada por la que el

individuo mejor, o algunos de los mejores, son copiados hacia la siguiente generación en

caso de que no surja nada mejor).

Selección proporcional a la optimización:

Los individuos más aptos tienen más probabilidad de ser seleccionados, pero no la

certeza.

Selección por rueda de ruleta:

Una forma de selección proporcional a lo óptimo en la que la probabilidad de que un

individuo sea seleccionado es proporcional a la diferencia entre su aptitud y la de sus

competidores. (Conceptualmente, esto puede representarse como un juego de ruleta -cada

individuo obtiene una sección de la ruleta, pero los más aptos obtienen secciones mayores

que las de los menos aptos. Luego la ruleta se hace girar, y en cada vez se elige al

individuo que ``posea'' la sección en la que se pare la ruleta).

Selección escalada:

Al incrementarse la optimización media de la población, la fuerza de la presión selectiva

también aumenta y la función óptima se hace más discriminadora. Este método puede ser

[18]

útil para seleccionar más tarde, cuando todos los individuos tengan una aptitud

relativamente alta y sólo les distingan pequeñas diferencias en la aptitud.

Selección por torneo:

Se eligen subgrupos de individuos de la población, y los miembros de cada subgrupo

compiten entre ellos. Sólo se elige a un individuo de cada subgrupo para la reproducción.

Selección por rango:

A cada individuo de la población se le asigna un rango numérico basado en su aptitud, y

la selección se basa en este ranking, en lugar de las diferencias absolutas en aptitud. La

ventaja de este método es que puede evitar que individuos muy aptos ganen dominancia

al principio a expensas de los menos aptos, lo que reduciría la diversidad genética de la

población y podría obstaculizar la búsqueda de una solución aceptable.

Selección generacional:

La descendencia de los individuos seleccionados en cada generación se convierte en toda

la siguiente generación. No se conservan individuos entre las generaciones.

Selección por estado estacionario:

La descendencia de los individuos seleccionados en cada generación vuelve al acervo

genético preexistente, reemplazando a algunos de los miembros menos aptos de la

siguiente generación. Se conservan algunos individuos entre generaciones.

Selección jerárquica:

Los individuos atraviesan múltiples rondas de selección en cada generación. Las

evaluaciones de los primeros niveles son más rápidas y menos discriminatorias, mientras

que los que sobreviven hasta niveles más altos son evaluados más rigurosamente. La

ventaja de este método es que reduce el tiempo total de cálculo al utilizar una evaluación

más rápida y menos selectiva para eliminar a la mayoría de los individuos que se

muestran pocos o nada prometedores, y sometiendo a una evaluación de optimidad más

rigurosa y computacionalmente más costosa sólo a los que sobreviven a esta prueba

inicial.

PROBABILIDAD DE CRUCE CROSSOVER

Si lo viéramos por la parte genética esta indicaría la frecuencia con la cual se producen cruces

entre atributos que posee el padre es decir, que haya probabilidad de reproducción entre ellos.

En caso de que no exista probabilidad de reproducción, los hijos serán copias exactas se los

padres. En caso de haberla, los hijos tendrán partes de los atributos de los padres. Si la

[19]

probabilidad de cruce es del 100% el hijo se crea totalmente por cruce, no por partes (Arranz de

la Peña & Parra Truyol, 2014).

Como en el caso de la selección o función fitness, también existen diferentes métodos para el

proceso de cruce según Arranz y Parra:

Crossover un punto:

Los 2 datos más relevantes (Datos Padres) se dividen por un punto. Se copia la

información genética de uno de los datos padres desde el inicio hasta el punto de cruce y

lo faltante se copia del otro dato relevante.

Crossover dos puntos:

Es muy similar al caso anterior pero para esta situación, los padres se cortan por dos

puntos. Se copiará al descendiente los genes de un atributo progenitor desde el principio

hasta el primer punto de cruce, los genes del otro progenitor desde el primer punto de

cruce hasta el segundo y del segundo punto de cruce hasta el final se copiará del otro

progenitor.

Crossover Uniforme:

Cada gen del descendiente se obtiene de cualquiera de los padres de forma aleatoria. Una

opción es generar un número aleatorio. Si este número supera un cierto umbral se elegirá

un padre determinado y si no lo supera se elige al otro.

Otra opción es seleccionar una máscara. En caso de que el bit correspondiente a la

máscara esté a 1, se copia el gen de un progenitor y en caso de que esté a 0 se copia el

gen del otro progenitor.

Crossover Aritmético:

Los progenitores se recombinan según algún operador aritmético para generar su

descendiente.

PROBABILIDAD DE MUTACIÓN

La mutación se considera un operador básico, que proporciona un pequeño elemento de

aleatoriedad en la vecindad (entorno) de los individuos de la población. Si bien se admite que el

operador de cruce es el responsable de efectuar la búsqueda a lo largo del espacio de posibles

soluciones, también parece desprenderse de los experimentos efectuados por varios

investigadores que el operador de mutación va ganando en importancia a medida que la

población de individuos va convergiendo (Lawrence, 1985).

[20]

El principal objetivo que tiene la mutación es el de introducir un nuevo material genético en un

individuo creado; es decir, para añadir diversidad a las características genéticas de la población.

Para (Schaffer, A. Caruana, J. Eshelman, & Das, 1989), encuentran que el efecto del cruce en la

búsqueda es inferior al que previamente se esperaba. Utilizan la denominada evolución primitiva,

en la cual, el proceso evolutivo consta tan solo de selección y mutación. Encuentran que dicha

evolución primitiva supera con creces a una evolución basada exclusivamente en la selección y

el cruce. Otra conclusión de su trabajo es que la determinación del valor óptimo de la

probabilidad de mutación es mucho más crucial que el relativo a la probabilidad de cruce.

Adicionalmente a lo que se refirió en el anterior ítem con respecto a las partes de un algoritmo

genético, se hablara también de los diferentes tipos de algoritmos genéricos. Esto con base a que

se utilizara dentro de nuestra investigación tres diferentes algoritmos que nos ayudara a resolver

y optimizar la solución del problema a estudiar:

ALGORITMO GENETICO SIMPLE O CANONICO

Un algoritmo genético simple es en realidad en cuanto a complejidad es el algoritmo más

elemental que se puede tratar en toda la investigación. Ya que sus componentes principales de us

pseudocódigo se derivan de por lo menos un tamaño de población, una selección, un cruce y una

mutación. Es por lo general con el que las personas empiezan a tratar debido a que no es tan

riguroso como lo son otros algoritmos que veremos a continuación.

BEGIN /* Algoritmo Genético Simple */

Generar una población inicial.

Computar la función de evaluación de cada individuo.

WHILE NOT Terminado DO

BEGIN /* Producir nueva generación */

FOR Tamaño población/2 DO

BEGIN /*Ciclo Reproductivo */

Seleccionar dos individuos de la anterior generación,

Para el cruce (probabilidad de selección proporcional

A la función de evaluación del individuo).

Cruzar con cierta probabilidad los dos

Individuos obteniendo dos descendientes.

Mutar los dos descendientes con cierta probabilidad.

Computar la función de evaluación de los dos

Descendientes mutados.

Insertar los dos descendientes mutados en la nueva generación.

END

[21]

IF la población ha convergido THEN

Terminado:= TRUE

END

END Ilustración 1: Pseudocódigo Algoritmo Genético Simple. Fuente: Diseño de un controlador PI óptimo usando Algoritmos

Genéticos

Este código es muy ilustrativo en todos los autores relacionados con algoritmos genéticos ya que

muestra cada paso que tiene que llevar un algoritmo genético.

Según (Acuña Lozano & Vergara Azabache, 2013)

Al crear un algoritmo genético simple es necesario de una codificación o representación del

problema, que resulte preparada al mismo. Además se requiere una función de ajuste o

adaptación al problema, la cual asigna un número real a cada posible solución codificada.

Durante la ejecución del algoritmo, los padres deben ser seleccionados para la reproducción, a

continuación dichos padres seleccionados se cruzarán generando dos hijos, sobre cada uno de los

cuales actuará un operador de mutación. El resultado de la combinación de las anteriores

funciones será un conjunto de individuos (posibles soluciones al problema), los cuales en la

evolución del Algoritmo Genético formarán parte de la siguiente población.

6.1.2 PROGAMACIÓN GENÉTICA

La programación genética GP Genetic Programming se centra principalmente en la evolución de

los genotipos. Su representación es muy similar a un diagrama de árbol o grafico de decisiones

pero con la condición de que este pase por todos los procesos que se llevan en un algoritmo

genético (Tamaño, Selección, Cruce, Mutación); aunque se le da mucha más relevancia a los

operadores de Cruzamiento y mutación. Para cada generación, cada programa evolucionado

(individual) se ejecuta para medir su desempeño dentro del dominio del problema. El resultado

obtenido a partir del programa de ordenador evolucionado se utiliza entonces para cuantificar la

aptitud de dicho programa. El principal investigador en establecer estos tipos de algoritmos es

conocido como Nils Aall Barricelli, quien empezó a describir sus estudios en la simbiogénesis y

algoritmos evolutivos.

Por otro lado, La Programación Genética PG, es un retoño de los Algoritmos Genéticos, en la

cual los cromosomas que sufren la adaptación son en sí mismos programas de computador. Se

usan operadores genéticos especializados que generalizan la recombinación sexual y la mutación,

para los programas de computador estructurados en árbol que están bajo adaptación. La PG trata

de resolver uno de las cuestiones más excitantes e interesantes de las ciencias de la computación:

¿cómo pueden aprender los computadores a solucionar problemas sin que se les programe

explícitamente? En otras palabras, la cuestión es cómo podemos hacer para que los

computadores hagan lo que tienen que hacer, sin necesidad de la intervención humana que les

diga exactamente como lo deben hacer.

[22]

El espacio de búsqueda de la PG es el espacio de todos los posibles programas de computador

compuestos de funciones y elementos terminales apropiados al dominio del problema. Las

funciones pueden ser operaciones aritméticas, operaciones de programación, funciones

matemáticas, funciones lógicas, y funciones específicas del dominio del problema.

El diagrama de árbol se ha conocido dentro de la programación básica como aquella herramienta

que sirve para organizar, ejecutar y solucionar cualquier tipo de paradigma de manera efectiva.

Muchos programadores recurren a este tipo de técnica debido a que a partir de la toma de

decisiones es mucho más claro pensar como un diagrama paso a paso a pensar de manera teórica

sin ningún orden el resultado a obtener.

Es muy importante tener en cuenta estos dos aspectos:

Individuos adaptables:

Este tipo de aspecto es completamente diferente al de un AG donde el tamaño de la población se

fija. En cuanto a la programación genética, la población se halla de acuerdo a su tamaño, forma y

complejidad ya que no todos tienden a adaptarse a un mismo comportamiento. En cuanto a la

forma y complejidad se pueden fijar a diferentes operadores de reproducción; mientras que el

tamaño se refiere al número de ramificaciones o nodos que posee el diagrama.

Gramática especifica del dominio:

Manejar una gramática fácilmente definida en el cual refleje con precisión el problema a tratar.

Para adquirir buenos resultados frente a la GP, se debe de entender aparte de tener reglas y

funciones ya definidas, operadores cuya misión es como cualquier otra de la programación

básica.

Tipo de dato (numero, texto, decimales, booleanos, etc)

Operadores aritméticos (suma, resta, multiplicación, división)

Operadores lógicos (Verdadero, Falso, mayor que, menor que, igual)

Operador de bucles (If-Else, for, switch, While, Do-While)

Entre otros, y estos operadores se ubicaran como podrán observar en la Ilustración 2. En cada

ramificación que posee el diagrama de árbol.

[23]

Ilustración 2: Diagrama de árbol representación matemática. Fuente: Computational Intelligence Introduction

Cabe aclarar que entre más limitaciones y reglas posea la construcción de GP, más efectivo será

el planteamiento del paradigma y más preciso será el resultado esperado. Este tipo de

programación tuvo un desarrollo muy frecuente; en especial para aquellos problemas que surgen

con muchos obstáculos y restricciones de principio.

6.1.3 ESTRATEGIAS EVOLUTIVAS

Las estrategias evolutivas ES viene siendo un proceso computacional el cual trabaja con una

población de individuos que pertenecen a un dominio. Este tipo de método pertenece

esencialmente a los AG pero con la diferencia de que la ES principalmente busca tanto la

evolución genotípica como fenotípica; importante saber que esta representación se hace de forma

vectorial.

Cada individuo es representado por sus bloques de construcción genética y un conjunto de

parámetros de la estrategia que modela el comportamiento de esa persona en su entorno.

Evolución consiste entonces de evolucionar tanto las características genéticas y los parámetros

de la estrategia, en la evolución de las características genéticas son controlados por los

parámetros de la estrategia (Rechenberg, Zurada, & Marks, 1994).

En las estrategias evolutivas, la representación se utiliza es un vector de valores reales de

longitud fija. Al igual que con el bit de cuerdas de algoritmos genéticos, cada posición en el

[24]

vector corresponde a una característica del individuo. Sin embargo, las características son

consideradas como de comportamiento en lugar de estructural.

Según Schwefel interpreto como: "En consecuencia, se espera que las interacciones no lineales

arbitrarias entre características durante la evaluación que obliga a un enfoque más holístico a la

evolución de las soluciones" (Beyer & Schwefel, 2002).

Las estrategias evolutivas manejan ciertas propiedades que los AG; principalmente se maneja

tanto la selección, como la mutación y sus operaciones son para búsqueda óptima de la posible

solución. Estos operadores funcionan en bucles de manera que iteración del bucle se llama una

generación. La secuencia de las generaciones se continúa hasta que se cumpla un criterio de

terminación.

Beyer y Schwefel citan que “En lo que se refiere a espacios de búsqueda con valores reales, la

mutación se realiza normalmente mediante la adición de una distribución normal valor aleatorio

a cada componente del vector. El tamaño del paso o la fuerza de mutación (es decir, la

desviación estándar de la distribución normal) a menudo se rigen por la auto-adaptación.

Tamaños de paso individuales para cada coordenada o correlaciones entre las coordenadas o bien

se rigen por la auto-adaptación o por la matriz de covarianza de adaptación (CMA-ES).”

Por otro lado la selección según Marks dice que como las estrategias de evolución son

determinísticas, es mejor optar por elegir a la población por medio de los rankings de

optimización y no por los valores de fitness reales. Al final, el mejor gen (el más apto que tiene

atributos de su progenitor) es operado matricialmente frente a su competencia (genes hermanos)

hasta así lograr un mejor resultado reemplazando al padre que viene siendo el máximo local

(mejor resultado).

6.1.4 PARADIGMAS DE LA COMPUTACIÓN EVOLUTIVA

El término “computación evolutiva” o “algoritmos evolutivos” engloba una serie de técnicas

inspiradas en los principios de la teoría Neo-Darwiniana de la evolución natural. En términos

generales, para simular el proceso evolutivo en una computadora se requiere:

Codificar las estructuras que se replicarán (o sea, una estructura de datos que se utilice

para almacenar a un “individuo”).

Operaciones que afecten a los “individuos” (típicamente, se usa cruce y mutación).

Una función de aptitud que nos indique qué tan buena es una solución con respecto a las

demás.

Un mecanismo de selección que implemente el principio de “supervivencia del más apto”

de la teoría de Darwin.

[25]

Aunque hoy en día es cada vez más difícil distinguir las diferencias entre los distintos tipos de

algoritmos evolutivos existentes, por razones sobre todo históricas, suele hablarse de tres

paradigmas principales:

Programación Evolutiva

Estrategias Evolutivas

Algoritmos Genéticos

Cada uno de estos paradigmas se originó de manera independiente y con motivaciones muy

distintas, por lo que procederemos a describir brevemente a cada uno de ellos de forma

totalmente independiente

6.1.5 VENTAJAS DE LAS TÉCNICAS

Es importante destacar las diversas ventajas que presenta el uso de técnicas evolutivas para

resolver problemas de búsqueda y optimización (Fogel, 2005):

Simplicidad Conceptual.

Amplia aplicabilidad.

Superiores a las técnicas tradicionales en muchos problemas del mundo real.

Tienen el potencial para incorporar conocimiento sobre el dominio y para hibridarse con

otras técnicas de búsqueda/optimización.

Pueden explotar fácilmente las arquitecturas en paralelo.

Son robustas a los cambios dinámicos.

Para finalizar, es importante mencionar que la computación evolutiva, como disciplina de

estudio, ha atraído la atención de un número cada vez mayor de investigadores de todo el mundo.

Esta popularidad se debe, en gran medida, al enorme éxito que han tenido los algoritmos

evolutivos en la solución de problemas del mundo real de gran complejidad. De tal forma, es de

esperarse que en los años siguientes el uso de este tipo de técnicas prolifere aún más. Nótese, sin

embargo, que es importante tener en mente que los algoritmos evolutivos son técnicas

heurísticas. Por tanto, no garantizan que convergerán al óptimo de un problema dado, aunque en

la práctica suelen aproximar razonablemente bien el óptimo de un problema en un tiempo

promedio considerablemente menor que los algoritmos deterministas. Esta distinción es

importante, pues el papel de las técnicas heurísticas es el de servir normalmente como último

recurso para resolver un problema en el que los algoritmos convencionales (típicamente

deterministas) no funcionan o tienen un costo computacional prohibitivo. Esto implica que antes

de decidir recurrir a los algoritmos evolutivos, debe analizarse la factibilidad de utilizar otro tipo

de técnicas. Este paso, que pudiese parecer obvio para muchos, en la práctica suele omitirse en

muchos casos y de ahí que exista bastante escepticismo por parte de aquellos que acostumbran a

trabajar únicamente con algoritmos deterministas. El uso apropiado y pertinente de los

[26]

algoritmos evolutivos será sin duda la base de su futuro como alternativa para la solución de

problemas complejos y de ahí que se enfatice su importancia.

6.2 AVALÚOS

Con respecto a los avalúos se definirá de forma sencilla como la estimación del valor de un

inmueble reflejado en cifras monetarias por medio de un dictamen técnico imparcial, a través de

sus características físicas, de uso, de investigación y el análisis de mercado, tomando en cuenta

las condiciones físicas y urbanas del inmueble. Un avalúo, nos da una base sobre la cual

comenzar una negociación.

Existen diferentes tipos de avalúos pero para nuestro trabajo de investigación nos centraremos en

indagar sobre dos avalúos específicos:

Avalúo Catastral

Avalúo Comercial

Los avalúos catastrales según el (COLOMBIA, 2011) consisten “en la determinación del valor

de los predios, obtenido mediante investigación y análisis estadístico del mercado inmobiliario.

El avalúo catastral de cada predio se determinará por la adición de los avalúos parciales

practicados independientemente para los terrenos y para las edificaciones en él comprendidos”.

Es necesario también tener en cuenta que este tipo de avalúos solamente tienen acceso a

realizarlo las autoridades catastrales de dicha ciudad o dicho municipio; ya que son los

encargados de realizar el estudio de las áreas Geoeconómicas las cuales determinarán los valores

unitarios para edificaciones y para terrenos.

Mientras que los avalúos comerciales determinar el valor real de una propiedad en un momento

determinado, de acuerdo con sus características físicas y topográficas, además de las variables de

entorno que afectan positiva o negativamente el precio de transacción del predio. Para este tipo

de avalúos debe de ser supervisado por un perito que es contratado por una persona, empresa o

banco los cuales aparte de encargarse de realizar el estudio valuatorios y aspectos físicos del

respectivo inmueble.

Como se pudo notar se habló principalmente de que es un avalúo, pero exactamente un avalúo no

es más que el estudio Fisico-Economico que puede tener un inmueble en un tiempo determinado.

Pero realmente los que acabamos de decir es solo la definición de un avaluó puntual (individual)

cuando realmente lo que se quiere investigar es un avaluó a nivel masivo

Un avaluó masivo es el estudio preliminar de varios avalúos puntuales en los cuales se manejan

principalmente dos variables importantes:

[27]

ZHF (Zonas Homogéneas Físicas)

ZHGE (Zonas Homogéneas GeoEconómicas)

Las ZHF según (COLOMBIA, 2011) “Son espacios geográficos con características similares en

cuanto a vías, topografía, servicios públicos, uso actual del suelo, norma de uso del suelo,

tipificación de las construcciones y/o edificaciones, áreas homogéneas de tierra, disponibilidad

de aguas superficiales permanentes u otras variables que permitan diferenciar estas áreas de las

adyacentes” mientras las ZHGE “Son los espacios geográficos determinados a partir de Zonas

Homogéneas Físicas con valores unitarios similares en cuanto a su precio, según las condiciones

del mercado inmobiliario”.

Según la RESOLUCIÓN NÚMERO 620 del 23 Septiembre 2008, el INSTITUTO

GEOGRÁFICO “AGUSTÍN CODAZZI” establece los procedimientos para los avalúos

ordenados dentro del marco de la Ley 388 de 1997, estos son los métodos usados para realizar

avalúos urbanos o rurales en Colombia.

Los métodos se encuentran en los artículos 1 al 4 de la resolución.

Artículo 1º: MÉTODO DE COMPARACIÓN O DE MERCADO. Es la técnica valuatoria que

busca establecer el valor comercial del bien, a partir del estudio de las ofertas o transacciones

recientes, de bienes semejantes y comparables al del objeto de avalúo. Tales ofertas o

transacciones deberán ser clasificadas, analizadas e interpretadas para llegar a la estimación del

valor comercial.

Artículo 2º: MÉTODO DE CAPITALIZACIÓN DE RENTAS O INGRESOS. Es la técnica

valuatoria que busca establecer el valor comercial de un bien, a partir de las rentas o ingresos que

se puedan obtener del mismo bien, o inmuebles semejantes y comparables por sus características

físicas, de uso y ubicación, trayendo a valor presente la suma de los probables ingresos o rentas

generadas en la vida remanente del bien objeto de avalúo, con una tasa de capitalización o

interés.

Parágrafo: Se entiende por vida remanente la diferencia entre la vida útil del bien y la edad que

efectivamente posea el bien. Para inmuebles cuyo sistema constructivo sea muros de carga, la

vida útil será de 70 años; y para los que tengan estructura en concreto, metálica o mampostería

estructural, la vida útil será de 100 años.

Artículo 3º: MÉTODO DE COSTO DE REPOSICIÓN. Es el que busca establecer el valor

comercial del bien objeto de avalúo a partir de estimar el costo total de la construcción a precios

de hoy, un bien semejante al del objeto de avalúo, y restarle la depreciación acumulada. Al valor

así obtenido se le debe adicionar el valor correspondiente al terreno. Para ello se utilizará la

siguiente fórmula:

[28]

𝑉𝑐 = {𝐶𝑡 − 𝐷} + 𝑉𝑡

Ecuación 1: Modelo para calcular el avalúo por método de costo de reposición

En donde:

𝑉𝑐 = 𝑉𝑎𝑙𝑜𝑟 𝑐𝑜𝑚𝑒𝑟𝑐𝑖𝑎𝑙

𝐶𝑡 = 𝐶𝑜𝑠𝑡𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑙𝑎 𝑐𝑜𝑛𝑠𝑡𝑟𝑢𝑐𝑐𝑖ó𝑛

𝐷 = 𝐷𝑒𝑝𝑟𝑒𝑐𝑖𝑎𝑐𝑖ó𝑛

𝑉𝑡 = 𝑉𝑎𝑙𝑜𝑟 𝑡𝑒𝑟𝑟𝑒𝑛𝑜

Parágrafo: Depreciación. Es la porción de la vida útil que en términos económicos se debe

descontar al inmueble por el tiempo de uso, toda vez que se debe avaluar la vida remanente del

bien.

Existen varios sistemas para estimar la depreciación, siendo el más conocido el Lineal, el cual se

aplicará en el caso de las maquinarias adheridas al inmueble. Para la depreciación de las

construcciones se deben emplear modelos continuos y no los discontinuos o en escalera. Deberá

adoptarse un sistema que tenga en cuenta la edad y el estado de conservación, tal como lo

establece Fitto y Corvini, para lo cual se presentan las ecuaciones resultantes del ajuste para los

estados 1, 2, 3 y 4. (Ver capítulo VII De las Fórmulas Estadísticas).

Artículo 4º: MÉTODO (TÉCNICA) RESIDUAL. Es el que busca establecer el valor comercial

del bien, normalmente para el terreno, a partir de estimar el monto total de las ventas de un

proyecto de construcción, acorde con la reglamentación urbanística vigente y de conformidad

con el mercado del bien final vendible, en el terreno objeto de avalúo.

Para encontrar el valor total del terreno se debe descontar al monto total de las ventas

proyectadas, los costos totales y la utilidad esperada del proyecto constructivo. Es indispensable

que además de la factibilidad técnica y jurídica se evalúe la factibilidad comercial del proyecto,

es decir la real posibilidad de vender lo proyectado.

Parágrafo: Este método (técnica) debe desarrollarse bajo el principio de mayor y mejor uso,

según el cual el valor de un inmueble susceptible de ser dedicado a diferentes usos será el que

resulte de destinarlo, dentro de las posibilidades legales y físicas, al económicamente más

rentable, o si es susceptible de ser construido con distintas intensidades edificatorias, será el que

resulte de construirlo, dentro de las posibilidades legales y físicas, con la combinación de

intensidades que permita obtener la mayor rentabilidad, según las condiciones de mercado.

Según la UAECD para ellos establecer el avaluó catastral se tienen que tener en cuenta la

formula encontrada en la siguiente ecuación:

[29]

𝐴𝑣𝑎𝑙ú𝑜 𝐶𝑎𝑡𝑎𝑠𝑡𝑟𝑎𝑙 = [{𝐴𝑇 × 𝑉𝑚2𝑇} + {𝐴𝐶 × 𝑉𝑚2𝐶}]

Ecuación 2: Calculo del avalúo catastral

Dónde:

𝐴𝑇 = Á𝑟𝑒𝑎 𝑡𝑒𝑟𝑟𝑒𝑛𝑜

𝑉𝑚2𝑇 = 𝑉𝑎𝑙𝑜𝑟 𝑚𝑒𝑡𝑟𝑜 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑑𝑒𝑙 𝑡𝑒𝑟𝑟𝑒𝑛𝑜

𝐴𝐶 = Á𝑟𝑒𝑎 𝑐𝑜𝑛𝑡𝑟𝑢𝑐𝑐𝑖ó𝑛

𝑉𝑚2𝐶 = 𝑉𝑎𝑙𝑜𝑟 𝑚𝑒𝑡𝑟𝑜 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑑𝑒 𝑐𝑜𝑛𝑠𝑡𝑟𝑢𝑐𝑐𝑖ó𝑛

Otra forma de ver esta ecuación más fácil es componiendo sus variables endógenas y fusionando

de tal modo que queden en términos entendibles como:

𝐴𝑣𝑎𝑙ú𝑜 𝐶𝑎𝑡𝑎𝑠𝑡𝑟𝑎𝑙 = 𝐴𝑣𝑎𝑙ú𝑜 𝑇𝑒𝑟𝑟𝑒𝑛𝑜 + 𝐴𝑣𝑎𝑙ú𝑜 𝐶𝑜𝑛𝑠𝑡𝑟𝑢𝑐𝑐𝑖ó𝑛

Ecuación 3: Calculo del avalúo Catastral con componentes finales

Dónde:

𝐴𝑣𝑎𝑙ú𝑜 𝑇𝑒𝑟𝑟𝑒𝑛𝑜 = 𝐴𝑇 × 𝑉𝑚2𝑇

𝐴𝑣𝑎𝑙ú𝑜 𝐶𝑜𝑛𝑠𝑡𝑟𝑢𝑐𝑐𝑖ó𝑛 = 𝐴𝐶 × 𝑉𝑚2𝐶

Algo muy importante que imponer en este punto es que a partir de estas fórmulas, se mostrara los

avalúos elaborados por los AG’s tanto de la UPZ Bolivia, como la UPZ Granjas de techo como

la Ecuación 2. Para que el lector tenga conocimiento alguno en el tema de variables endógenas

que los avalúos tan solo se tienen en cuenta así.

7. MARCO ESPACIAL

Nuestra área de interés se basa fundamentalmente en la ciudad de Bogotá dentro del casco

urbano debido a que la zona de estudio se encuentra estructurada por medio de UPZ; los lugares

que hacen parte de nuestros parámetros son:

UPZ 72 Bolivia

UPZ 112 Granjas de techo

[30]

Estos vienen siendo nuestras zonas de estudio ya que son zonas en las cuales se tiene una

cartografía actualmente vigente.

7.1 UPZ 72 BOLIVIA

La UPZ 72 Bolivia se localiza en la zona noroccidental de la localidad de Engativá, tiene una

extensión de 474,5 hectáreas, que equivalen al 13,2% del total de área de las UPZ de esta

localidad. Esta UPZ limita, al norte, con la UPZ Tibabuyes de la localidad de Suba; al oriente,

con las UPZ Minuto de Dios; al sur, con las UPZ Garcés Navas; y al occidente, con el municipio

de Cota. En cuanto a vías y ríos esta UPZ limita al norte con el rio juan Amarillo; al sur con la

calle 80 (Avenida Medellín); al oriente con la futura Avenida Longitudinal de Occidente ALO y

por ultimo al occidente con el rio Bogotá (Planeación, 2014).

En cuanto a Vías, se pueden establecer que la UPZ domina las siguientes calzadas:

Avenida Medellín ( Cl 80 )

Avenida Longitudinal de Occidente (ALO)

Avenida Morisca ( Cl 91 )

Avenida Bolivia ( Kr 104)

Avenida del Cortijo

Con respecto a los barrios se distribuyen en diferentes zonas de la UPZ:

Tabla 1: Barrios por localidad Engativá

UPZ Barrios

72. Bolivia

Bochica II

Bolivia

Ciudadela Colsubsidio

El Cortijo

El Dorado Fuente: Alcaldía de Bogotá

En cuanto a la centralidades Son espacios que concentran una gran actividad económica o de

servicios a la comunidad, por ejemplo comercio, oficinas o equipamientos. Ellas facilitan o

mejoran la integración internacional, nacional, con la región, o entre diferentes sectores de la

ciudad. Para dicha UPZ existe una centralidad vital que es la que aporta gran parte de actividad

socioeconómica aparte del sistema de transporte masivo Transmilenio (Desde la estación minuto

de Dios hasta el Portal 80):

[31]

Centro Comercial Unicentro del Occidente:

El 26 de octubre de 2004, fue inaugurado dicho centro comercial, comprende un área de

5,5 Ha, dotado de 153 locales y 644 parqueaderos. Esta localizado dentro del barrio

ciudadela Colsubsidio.

En cuanto al uso del suelo; Bolivia maneja exclusivamente 3 usos de los cuales implica un gran

porcentaje en cuanto a tipo residencial debido a que como la UPZ tiene una extensión total de

aproximadamente 474,50 Ha, el 68% comprende un uso de tipo residencial, el 25% de uso de

estructura ecológica principal y tan solo el 7% corresponde a un uso de tipo dotacional como se

puede describir en la Ilustración 3 y su reglamentación en la Ilustración 4.

Ilustración 3: Diagrama de pastel con sus respectivos porcentajes de uso del suelo en la UPZ Bolivia. Fuente: Excel 2010

Estructura

ecológica

principal

25%

Dotacional

7%

Residencial

68%

Uso del suelo UPZ 72 Bolivia

[32]

Tabla 2: Normas Urbanísticas de la UPZ 72 Bolivia

Fuente: Alcaldía de Bogotá decreto 309 septiembre 27 del 2004

En cuanto a la destinación que tiene el uso residencial se podría clasificar de dos maneras tanto

PH (Propiedad Horizontal) y NPH (No propiedad Horizontal). Existen 27682 unidades bajo el

reglamento de PH y para NPH una predominancia de 1580 unidades sumando un total de 29262

unidades residenciales para toda la UPZ. En la UPZ Bolivia se ubican grandes urbanizaciones

residenciales como son la ciudadela Colsubsidio, agrupación de vivienda Bolivia, agrupación el

Cortijo, entre otras (Bogotá A. M., DINÁMICA DE LAS CONSTRUCCIÓN POR USOS

LOCALIDAD ENGATIVÁ, 2012).

Ya para finalizar mostraremos de manera detallada la cartografía general que posee la UPZ

Bolivia con sus respectivas calles, Usos y sitios de interés:

[33]

Ilustración 4: Imagen UPZ 72 Bolivia. Fuente: ArcGIS 10.3; Basemap: World_Imagery

[34]

7.2 UPZ 112 GRANJAS DE TECHO

La UPZ 112 Granjas de Techo es de clasificación predominantemente industrial y se localiza al

suroriente de la localidad de Fontibón, tiene una extensión de 477,6 hectáreas, equivalentes al

14,35% del total del área de las UPZ de la localidad. Del total de hectáreas, 24 corresponden a

suelo protegido. Esta UPZ limita, por el norte, con las UPZ Modelia y Ciudad Salitre Occidental

y en la mitad de estas se encuentra la avenida del Ferrocarril de Occidente; por el oriente, con las

localidades de Teusaquillo y Puente Aranda, separada por la avenida carrera 68; por el sur, con la

localidad de Kennedy, serradas por el rio Fucha y la calle 13 o avenida Centenario. Por el

occidente, con la UPZ Fontibón estando de por medio la avenida Longitudinal de Occidente.

(ALO) (Bogotá A. M., DINÁMICA DE LA CONSTRUCCIÓN POR USOS LOCALIDAD

FONTIBÓN, 2012).

En cuanto a Vías, se pueden establecer que la UPZ domina las siguientes calzadas:

Avenida Ciudad de Cali (Carrera 84)

Avenida Agoberto Mejía (Carrera 80)

Avenida Ferrocarril del Occidente (Calle 22)

Avenida Centenario (Calle 13)

Avenida Boyacá (Carrera 72)

Con respecto a los barrios se distribuyen en diferentes zonas de la UPZ:

Tabla 3: Barrios por localidad Fontibón

UPZ Barrios

112. Granjas de Techo

El Tintal II

El Tintal Central

Ferrocaja

Vereda el Tintal II

El Tintal A.S.D.

El Vergel

Interindustrial

Villa Alsacia

Franco

Montevideo

Granjas de Techo Fuente: Alcaldía de Bogotá

Entre las diferentes centralidades que se manejan es esta UPZ se encuentran:

Supermercado MAXI (easy)

[35]

Anteriormente conocido como centro comercial ACATADAO fue fundado hacia finales

del 2013 con el único propósito de competir a nivel mayorista frente a los demás

supermercados de cadena como Carrefour “actualmente Jumbo” y Exito en cuanto a

variedad de productos no solo comestibles sino también en cuanto a electrodomésticos y

accesorios para el hogar. Posee un área de construcción de aproximadamente 1,7 Ha;

donde hoy en día fue modificado por herramientas para el hogar y la construcción.

Centro Comercial Hayuelos

Hayuelos Centro Comercial y Empresarial, abrió sus puertas en el mes de abril del 2008 y

hace parte de la denominada zona H de Bogotá. Este proyecto ganador se realizó con el

esfuerzo de diferentes personas que se comprometieron con el desarrollo urbanístico de la

ciudad. Fue diseñado con un concepto vanguardista que integra amplias zonas, tres tipos

de locales, oficinas, espacios públicos llenos de luz y lugares para eventos que son ideales

para la diversión y entretenimiento de todos los visitantes. Cuenta con 5,6 Ha en los

cuales: 292 locales, 101 oficinas, 4 salones de conferencias y eventos, zona de cafés y

1996 parqueaderos.

Con respecto a la UPZ Granjas de Techo, posee 3 usos de suelos en los cuales se designan de

manera simultánea. En primer lugar y es en la UPZ lo que más predomina tenemos el uso

industrial que abarca el 53% de toda la zona; luego con un 32% se encuentra el uso del suelo

cuya referencia es de Área Urbana Integral y por ultimo con un restante del 15% es contenido

por el uso Residencial. A continuación mostraremos tanto en la Ilustración 5 el diagrama de

pastel respecto a los diferentes usos del suelo y en la Tabla 4 la normatividad del suelo para

dicha UPZ

Ilustración 5: Diagrama de pastel con sus respectivos porcentajes de uso del suelo en la UPZ Granjas de Techo. Fuente: Excel 2010

Residencial

15%

Industrial

53%

Area urbana

integral

32%

Uso del suelo UPZ 112 Granjas de

techo

[36]

Tabla 4: Normas Urbanísticas de la UPZ 112 Granjas de Techo

Fuente: Alcaldía de Bogotá decreto 622 diciembre 29 del 2006

A diferencia de la anterior UPZ Bolivia, Esta se caracteriza por tener una gran extensión de uso

Industrial, en este uso se encuentra aproximadamente 616 unidades pero destinado a solo

bodegas. Lo que nos deja con que construcciones para solo industrialización existen 246

unidades en actual uso y dejando por último el uso residencial en los cuales de PH existen 12836

unidades y en NPH 139 unidades. La vivienda en PH se ubica hacia el costado occidental de la

UPZ en el polígono conformado por la avenida Boyacá y la avenida Longitudinal de Occidente

(ALO) entre avenida Ferrocarril del Occidente y avenida Centenario; mientras que la vivienda

reglamentadas en NPH se encuentran descentralizadas y dispersas en todo el perímetro que

conlleva dicha UPZ .

Por último, se mostrara de manera detallada la cartografía general que posee la UPZ Bolivia con

sus respectivas calles, Usos y sitios de interés:

[37]

Ilustración 6: Imagen UPZ 112 Granjas de Techo. Fuente: ArcGIS 10.3; Basemap: World_Imagery

[38]

8. MARCO TEMPORAL

Como se pudo entender en el titulo se busca información de avalúos con vigencia del 2015 ya

que se va a representar estos insumos de manera actual; ya que la UAECD facilitara los datos

almacenados dentro de sus bases de datos respectivos para realizar un mejor resultado mediante

los algoritmos genéticos. Una vez comprobados estos y resueltos, se corroborara frente a los

resultados obtenidos de catastro por medio de la econometría estimando los valores linealmente.

Se espera una aproximación de un mes máximo dos para poder establecer los parámetros

necesarios en la investigación de un mejor modelo de estimación en avalúos masivos es una idea

innovadora y predispuesta a poner en práctica en las diferentes entidades privadas o públicas

para mejorar dicho calculo.

9. METODOLOGIA

Para poder garantizar el éxitos de dicha experimentación se debe realizar a partir de unos datos

suministrados por la UAECD de las UPZ 72 Bolivia y 112 Granjas de Techo con vigencia 2015

se efectuara un análisis exploratorio de los datos con el ánimo de generar una estratificación para

utilizarlos en un algoritmo basado en algoritmos genéticos que nos permita minimizar los

errores y la estimación de los avalúos masivos comparados con los avalúos vigentes de dicha

entidad.

Para contextualizar el tema de los avalúos, no se sabe cómo se calculan exactamente estos avaluó

por la entidad de la UAECD; por lo tanto, abarcaremos toda posibilidad de generar este cálculo

mediante los diferentes procesos con los se ejecuta un avaluó comercial. Recordaremos algunos

tipos de cálculo de avalúos que existen en vigencia actual en el capítulo de análisis y resultados.

A continuación se mostrara en la Ilustración 8 el flujograma general de los diferentes procesos

por el cual pasara los datos tomados por la UAECD con vigencia del 2015:

Ilustración 7: Diagrama general básico de algoritmo genético. Fuente: Educagratis_Algoritmos Genéticos Online

[39]

Ilustración 8: Flujograma de algoritmos genéticos para hallar el óptimo valor de un avaluó con vigencia actual. Fuente: SmartDraw

[40]

9.1 FASES:

Sea Algoritmos Genéticos Simples, Programación Genética o Estrategias Evolutivas; existen

procesos similares para poder llegar al resultado requerido; se hablara de cada algoritmo y sus

posibles características metodológicas:

Algoritmo Genético Canónico

Ilustración 9: Diagrama de flujo con los posibles pasos del algoritmo genético canónico y sus fases

Un algoritmo genético canónico se diferencia de los otros debido a que para todas las

operaciones como la selección, cruce y mutación son más simples de elaborar y que todas se

deben cumplir a diferencia de la programación genética o estrategias evolutivas que lo que

buscan es operar la mutación y cruzamiento de manera compleja y exacta.

[41]

Programación Genética

Ilustración 10: Diagrama de flujo con los posibles pasos de programación genética y sus fases

Se busca en esta clase de algoritmo crear programas óptimos a partir de programas básicos. Lo

que se pretende es crear programas estándares en la selección, cruce y mutación que a la hora de

llamar a las funciones, se ejecuta el programa principal y que las posibles soluciones sean mucho

mejores que las soluciones iniciales en otras palabras que los posibles resultados vayan

evolucionando hasta que la última generación sea mucho mejor que la primera generación de

resultados.

Así mismo terminar la sucesión cuando el programa sea lo bastante bueno para acotejar los

resultados entre algoritmos genético simple, programación genética y estrategias evolutivas con

los resultados de la UAECD. Mostrando sus ventajas, desventajas y proximidades de cada uno de

los esquemas a realizar.

[42]

Estrategias Evolutivas

Ilustración 11: Diagrama de flujo con los posibles pasos de estrategias evolutivas y sus fases

A diferencia de los algoritmos explicados en las dos fases anteriores, las estrategias evolutivas

miran principalmente los genotipos y fenotipos. Para este algoritmo se utilizara de manera

vectorial, todas las variables sean dependientes o independientes cada dato en una posición y se

empezara a operar de manera individual.

Ilustración 12: Ejemplo de recombinación de parámetros para la etapa de curce

[43]

9.2 INFORMACION

Como se utilizaran datos realizados por la UAECD, se tendrán en cuenta que los avalúos

realizados por esta entidad son completamente validos predio a predio; pero ya lo que

necesitamos saber es el avaluó masivo de nuestras zonas de intereses, es bueno replantear las

posibles soluciones que nos dan en nuestro ejercicio de optimizar mejor el resultado. Sería bueno

acotejar o ponderar los resultados esperados tanto para nuestra solución a tratar como la solución

de la entidad pública.

9.3 ANÁLISIS EXPLORATORIO DE DATOS

Los datos obtenidos por la entidad son calculados mediante regresiones lineales estimando

variables como área de terreno, área de construcción, fachada entre otras variables como

estimadores para encontrar la solución probabilísticamente más precisa que puede calcularse.

Para establecer un mejor resultado como se han obtenido en los avalúos puntuales, se necesitara

hacer su respectiva teoría de errores y sus diferentes técnicas como:

RAE

MAE

RMSE

RRSE

MAPE

Mínimos y Máximos tanto de Errores como de Valores Reales y Valores Calculados

Para las diferentes variables que se maneja normalmente en un avaluó puntual y se explicara

dada una de estas siglas en el desarrollo del proyecto.

9.4 SOFTWARE

Los algoritmos genéticos se programaran mediante software conocido como Matlab en cuanto al

código fuente, diagrama de árbol mediante programa de flujograma a partir del programa en

código y resultados finales Excel o cualquier programa para estadística descriptiva y graficas

mostrando los resultados estadísticos.

[44]

10. DESARROLLO DE LA PROPUESTA

10.1 DATOS

Antes de poder hablar acerca de la interpretación del programa, se debe enfocar cuales fueron los

datos a tratar durante el desarrollo de la propuesta de investigación. Como eje principal se

enfatizará en que los datos fueron suministrados por la UAECD. Los cuales se acceden

fácilmente a la base de datos respectivos a las zonas encomendadas por dicha entidad para

extraer la información relevante para poder evaluar y descifrar los avalúos catastrales referidos

de las UPZ Bolivia y Granjas de Techo. Esta información está conformada por dos archivos

importantes; el primero consta de una base de datos elaborada por el programa Excel, en el que

se describe la información alfanumérica referentemente de las UPZ a estudiar y el segundo

archivo consiste en la identificación geométrica y visual de los predios encontrados dentro de

dichas UPZ en un formato tipo shape visualizado dentro de una Geodatabase (ArcGIS 10.3)

cuyo software permite la previa interpretación de los SIG (Sistemas de Información Geográfica).

Entre ellos, la base de datos contiene la información de 65133 datos entre las dos UPZ para las

cuales, 34657 datos pertenecen a la UPZ Bolivia y 28702 a la PZ Granjas de techo; ya que los

datos restantes (1774 datos), nos ofrecieron la suficiente información para corroborar con la

regresión a estudiar. Por otro lado en la Geodatabase encontramos información geográfica de las

UPZ con sus respectivos atributos alfanuméricos dando un total de 3179 datos que por

consiguiente llevan a una inconsistencia bastante elevada de los datos suministrados en la BD de

Excel; Por lo tanto solo se enfocara en estudiar la BD proporcionada por Excel sin descartar de

que la información geográfica va a ser de gran importancia para delimitar nuestra zona de

interés.

10.2 VARIABLES

Como se había enunciado anteriormente, existe una BD elaborada en Excel de la UAECD en las

cuales tanto para la UPZ Bolivia como para la UPZ Granjas de techo posee la misma cantidad de

variables, este también fue un parámetro de criterio que resulta eliminar los 1774 datos que se

había mencionado en el titulo anterior y por no contener ninguna de las variables totales que

mencionaremos a continuación:

[45]

CODIGO_BARRIO

CODIGO_MANZANA

CODIGO_PREDIO

CODIGO_CONSTRUCCION

CODIGO_RESTO

CEDULA_CATASTRAL

CHIP

TIPO_PROPIEDAD

CODIGO_DESTINO

AREA_TERRENO

VALOR_M2_TERRENO

VALOR_AVALUO

AVALUO_ANO

CLASE_PREDIO

DIRECCION_REAL

CODIGO_ESTRATO

AREA_CONSTRUIDA

VALOR_M2_CONSTRUCCION

LOTSECT_ID

LOTMANZA_ID

LOTPRED_ID

LOTMANZ_ID

LOTLOTE_ID

LOTZHF_ID

LOTZHG_ID

LOTUNIDAPH

LOTDISTRIT

LOTTIPO

LOTLSIMBOL

LOTDISPERS

ESCALA

SHAPE_AREA

SHAPE_LEN

CODIGO_BARRIO1

CODIGO_MANZANA1

CODIGO_PREDIO1

CODIGO_CONSTRUCCION1

CODIGO_RESTO1

CODIGO_USO

UNIDAD_CALIFICADA

AREA_USO

PUNTAJE

PISOS

AVANCE_CONSTRUCCION

VALOR_UNIT_CONSTRUCCION

VETUSTEZ

Asumiendo así que cada una de estas variables explicaría características esenciales que posee un

predio dentro de cada UPZ. Por otro lado, de todo este conjunto de variables, solo se tomara las

variables más significativas que se estudiara para describir la regresión (variables independientes).

A continuación, se nombrara las variables dependientes a tratar para acoplar a la regresión:

Tabla 5: Descripción de las variables independientes para la solución a las regresiones

VARIABLES

INDEPENDIENTES

DESCRIPCIÓN

AREA_CONSTRUCCION

O AREA_TERRENO (X1)

Área construcción o área terreno dependiendo a la regresión que se

vaya a establecer (Terreno-Construcción)

AREA_USO (X2) Cuanta Área se va a tratar para los diferentes usos que sufre el predio

PUNTAJE (X3) Clasificación del predio según su actualización catastral

PISOS (X4) El número de niveles de construcción en altura que padece el predio

VETUSTEZ (X5) Duración que posee el predio a partir de que su respectiva

identificación

[46]

Cada una de estas variables estará asociada a las incógnitas o expresiones conocidas en la

econometría como variables independientes denominadas como (X1, X2, X3, X4, X5, X6 y X7).

Siendo así, se comprenderá las variables dependientes que resolverán las regresiones y que hacen

parte del cálculo del avaluó de cada UPZ conocidas como variables dependientes; entre esas se

encuentra:

Tabla 6: Descripción de las variables dependientes o resultados de las regresiones

VARIABLES

DEPENDIENTES (Y)

DESCRIPCIÓN

VALOR_M2_TERRENO

(YVT)

Valor monetario por m2

que posee el terreno del predio tratado.

AV TERR_CAT15 (YAT) Valor monetario total que conserva el terreno del predio a analizar.

VALOR_M2_CONST

(YAC)

Valor monetario por m2

que posee la construcción en cuanto a

Materiales y soportes del cual se va a afectar el predio.

VCONS (YVT) Valor monetario total que posee el predio de construcciones.

Estas variables se tuvieron en consideración y se tomaron como parte de la regresión mediante

el estudio de minería de datos “Data Mining” que en otras palabras viene siendo un proceso no

trivial de identificación válida, novedosa, potencialmente útil y entendible de patrones

comprensibles que se encuentran ocultos en los datos (Fayyad, 1996).

El data mining es una tecnología compuesta por etapas que integra varias áreas y que no se debe

confundir con un gran software. Durante el desarrollo de un proyecto de este tipo se usan

diferentes aplicaciones software en cada etapa que pueden ser estadísticas, de visualización de

datos o de inteligencia artificial, principalmente. Actualmente existen aplicaciones o

herramientas comerciales de data mining muy poderosas que contienen un sinfín de utilerías que

facilitan el desarrollo de un proyecto. Sin embargo, casi siempre acaban complementándose con

otra herramienta. (Vallejos, 2006)

Ahora, se mostrara por medio del software WEKA, algunas graficas por la cuales se obtuvo una

mejor perspectiva acerca de las variables independientes que se deben incluir a la hora de

encontrar nuestra regresión de interés; Este software es importante tener en cuenta, ya que no

solo miramos a través de diagramas de dispersión el mejor comportamiento de las variables, sino

que también tiene en cuenta las variables que no presenta alguna significancia exacta dentro de la

regresión lineal.

X(coord) (X6) Latitud en coordenadas cartesianas del predio a identificar

Y(coord) (X7) Longitud en coordenadas cartesianas del predio a identificar

[47]

Ilustración 13: Cuadro comparativo de todos las variables posibles en la regresión Fuente: Software WEKA

Como pueden observar en todos los escenarios, tenemos la clasificación de LOTZHF_ID con la

cual se va a analizar todas las variables dependientes. Teniendo en cuanta el cuadro comparativo

de la Ilustración 14, prestamos atención a que los datos tienen un comportamiento bastante

complejo pero que aun así la cantidad de datos es bastante rigurosa y completa. Por lo que

podemos utilizar estas variables para describir mejor la regresión deseada.

Nota:

“Teniendo en cuenta ítems importantes para calcular une avalúo como Puntaje, Áreas (Terreno

y construcción), Vetustez y precio o valor de Mt2 (Terreno y construcción) son las otras

variables lo que ayudan a mejorar el estudio del avaluó puntual.”

[48]

Ilustración 14: Variables tomadas de la BD de Catastro con significancia nula en la regresión Fuente: Software WEKA

Luego, tenemos en la Ilustración 15 otras variables que para catastro vienen siendo importante

en sus informes colocar para proyectar un completo avaluó pero que al final no tiene mucha

significancia matemática analizar estas incógnitas inmobiliarias debido a que no posee un valor

adecuado para proyectar y concatenar en la regresión a calcular. También como se dan cuenta, en

los cuadros de comparación, estos datos son muy pocos y bastantes pequeños como para

simularlos en el software y obtener una solución apta al estudio de los predios en particular.

10.3 ARQUITECTURA DEL PROGRAMA

10.3.1 DESCRIPCIÓN DEL PROGRAMA

Recapitulando los títulos anteriores, el software a codificar nos ayudara a establecer y mejorar la

teoría que se ha venido estableciendo para calcular avalúos masivos por medio de la inteligencia

[49]

artificial. Como se había dicho anteriormente, en Colombia para estos tiempos se ha venido

manejando la econometría como un modelo matemático que nos permite establecer y calcular

una cantidad de datos y variables experimentadas en la vida real para mejorar el rendimiento de

algún fenómeno bastante engorroso; por lo que para nosotros los avalúos masivos se determinan

a partir de una cierta cantidad de datos y variables que requieren ser calculados para aproximar a

un valor monetario de un terreno que en este estudio se adaptara para una UPZ.

La econometría nos ayuda a evaluar por medio de estimadores fenómenos económicos como los

avalúos masivos que intenta describir una patología natural mediante modelos que permitan

examinar los factores por la cual se establece el valor de un predio o en nuestro caso el valor de

una UPZ. La variables tanto dependientes (variables a resolver) como variables independientes

(que nos ayudaran a resolver las variables dependientes), hacen parte de la econometría junto con

unos estimadores que ayudan a mejorar el resultado esperado por medio de la estadística.

Pero para ser más precisos en estas afirmaciones y aun para estos tiempos la econometría no nos

ayuda a establecer mejores resultados para nuestro estudio del valor de una UPZ; la econometría

a pesar de que nos demuestra de manera aproximada los valores a los que se quieren recurrir, no

posee la precisión exacta para demostrar los cambios drásticos que posee las variables a la hora

de ser tratadas y que por consiguiente lo que en algunos indicios hace es que estima valores

bastante elevados no uniformes respecto a la muestra a evaluar o simplemente elimina variables

debido a que no corrobora a su nivel de significancia para resolver este fenómeno. Por lo que se

introduce algo de inteligencia artificial para reforzar estos vacíos que posiblemente puedan

mejorar tanto rendimiento como precisión de los datos a procesar dejándonos así, una solución

más óptima y razonable a la que se puede calcular simplemente con la econometría. No digo que

la econometría en estos casos sea obsoleta; sino que para algunos fenómenos como lo es el

cálculo del valor de un avaluó masivo, se necesita más de una ciencia que acompañe a mejorar

los resultados debido a su nivel de incertidumbre y complejidad que maneja al momento de

proponer alguna solución efectiva.

Ya para finalizar este ítem, la idea de utilizar algoritmos genéticos es para evolucionar la muestra

de manera de que cuando yo tenga una solución, esta será temporal frente a otros resultados que

puedan ser mejor establecidos y no depreciando el resultado más aproximado y eliminarlo por

completo frente a otro resultado que quizás no tenga una relevancia fuerte para ser utilizado en la

solución a un fenómeno complejo, según (Velasquez H, Ortiz, & Jaramillo, 2011) se afirma que

“las estrategias de evolución es una técnica bio-inspirada, eficiente y robusta para resolver

problemas de optimización donde el espacio de soluciones es no restringido. Sin embargo, esta

suposición es irreal en muchos casos porque el espacio de soluciones es limitado por fronteras

complejas en la forma de restricciones tanto lineales como no lineales”.

[50]

10.3.2 REQUISITOS PARA EL PROGRAMA

Para este ítem, es indispensable mirar que parámetros se requieren implementar para poder

diseñar el programa de manera efectiva y precisa. En primera instancia, es indispensable definir

la BD que se va a almacenar en el software a programar “MATLAB”; para este caso se van a

realizar de manera simultánea las UPZ Bolivia y Granjas de techo con sus respectivas variables

(Ver tabla 6). Ya teniendo definida la BD a trabajar se requiere de un computador lo bastante

potente para poder realizar las determinadas iteraciones a la hora de capturar las especies o

individuos resultantes de un selecto grupo de estas que compiten entre sí para que solo las

mejores puedan reproducirse y guardarse como “superindividuos” para así obtener los mejores

resultados en el momento de obtener la regresión deseada.

Por otro lado, se necesita disponer de un tiempo estimado entre 40- 60 minutos para que los

procesos que se deben efectuar (Generación de población, Evolución y Ajuste de Betas) sean

satisfactorios y en caso de obtener un resultado erróneo, volver a iterar el programa.

Tabla 7: Requisitos físicos del software AG

REQUISITOS DEL SOFTWARE CONSECUENCIAS DE LOS REQUISITOS

Es indiscutible manejar el software en

Matlab.

Se requiere tener un procesador lo

suficientemente fuerte para poder iterar

la población hasta encontrar a los

Superindividuos que van a concebir

optimizar la regresión a desear.

Para poder migrar los datos es

necesario mantener la BD intacta a la

hora de hacer generar la población.

Debido a que las funciones trigonométricas

e hiperbólicas que maneja el programa

tienden a extenderse a lo largo de la

regresión, los procesos internos suelen

demorarse bastante por lo que Matlab es un

programa con bastantes herramientas

aritméticas.

Son bastantes datos que se manejan para

calcular avalúos y también por los grandes

dígitos monetarios que se manejan en cada

UPZ, se termina evidenciando de que son

procesos extensos.

La BD en lo posible manejarla en Excel

debido a que el software solo puede leer

como hoja de cálculo “xlsread” esta y debe

contener 7 columnas incluyendo el ID de

cada predio.

[51]

10.3.3 VISTA LOGICA DEL PROGRAMA

A continuación, se visualizara el diagrama lógico de los componentes principales del software;

desde la migración de la BD, Hasta la obtención de la regresión con sus respectivos errores:

Ilustración 15: Base de datos de la UAECD con sus respectivas variables dependientes (clases) e independientes (atributos)

Ilustración 16: Flujograma del programa explicando paso a paso cada proceso con sus respectivas funciones

[52]

10.3.4 PARAMETROS DEL PROGRAMA

Como se pudo evidenciar en el anterior ítem, el modelo lógico ejercido dentro del programa nos

ayuda a visualizar mejor que pasos fueron necesarios para poder implementar en código y así

poder ilustrar mejor una regresión que me permite obtener una ecuación para solucionar varias

incógnitas.

A partir de ahora, se construirá y describirá los prerrequisitos y clasificaciones importantes que

tienen que tener en cuenta para poder entender mejor lo que se hizo dentro del programa para

estimar avalúos:

10.3.4.1 GENERACIÓN DE INDIVIDUOS

Inicialmente se exportara la BD de la UAECD con sus respectivas variables de cada UPZ al

programa en Matlab dependiendo de la tabla a tratar (Vm2T, Vm2C, VtT, VtC) ya modificado en

Excel según su clasificación:

Código de Sector

Código de Uso

ZHF

Después de la conversión de la tabla .xls a .mat, se comenzara a correr el programa por medio de

interfaz.fig. En el botón de Generar Población inicial internamente el programa esta

almacenando las funciones, operaciones y exponenciales internamente según el arreglo de

ubicación de cada variable a acompañar por otro lado está generando la mejor especie de

individuos los cuales nos ayudan a obtener las soluciones afines para lograr hallar la regresión

indicada para el conjunto de datos según la clasificación dada anteriormente.

Para la generación de individuos se establece una cantidad experimental necesaria en la cual, se

ira recombinando esta especie con los genes de sus antecesores; en otras palabras como un

cromosoma de tal modo que seguirá reestructurando su ADN hasta lograr mejorar la población

establecida creando así a los superindividuos capaces de encontrar soluciones más factibles a las

que pudieron dar sus precedentes. La combinación de las variables independientes; con las

funciones, operaciones y exponenciales se deben lograr de manera simultánea; las operaciones se

les conocen como suma, resta, multiplicación y división y se almacenara en una variable que a

la hora de combinar ocupe un espacio que vaya entre cada variable dependiente conmutada con

su respectiva función y exponentes. Las funciones que se llevaran a cabo en la solución de la

regresión no son más que el conjunto de elementos conocidos como (Trigonométricas,

Trigonométricas Inversas, Hiperbólicas, Hiperbólicas Inversas, Funciones Exponenciales,

Logarítmicas, etc.) que comprenden el universo de números enteros positivos y que a su vez

[53]

acompañaran a las variables independientes uno a uno a mejorar su corrección de la regresión a

obtener. Por ultimo las exponenciales en la regresión se clasificaran de dos maneras:

Exponenciales de las variables independientes:

Exponenciales de las variables tratadas:

Al final de este proceso, se calcularan los errores según las variables a procesar. Según la

clasificación que se nombró anteriormente; los errores son hallados a partir de la regresión dada

y se calculan a partir del error relativo como se describirá en la siguiente ecuación:

𝐸𝐴 =|𝐸𝑟 − 𝐸𝑇|

𝐸𝑇

Ecuación 4: Error Absoluto hallada en la regresión obtenida

𝐸𝐴 = 𝐸𝑟𝑟𝑜𝑟 𝐴𝑏𝑠𝑜𝑙𝑢𝑡𝑜

𝐸𝑟 = 𝐸𝑟𝑟𝑜𝑟 𝑟𝑒𝑎𝑙

𝐸𝑟 = 𝐸𝑟𝑟𝑜𝑟 𝑡𝑒𝑜𝑟𝑖𝑐𝑜

Calculando así el error global mínimo de todos los predios según su categorización y el que

menor error tenga, es la regresión más apropiada para todo el conjunto de predios clasificados;

otra forma de ver mejor la Ecuación 1 para entender mejor la operación, es mediante esta

Ecuación sintetizada:

𝐸𝐴 =|𝑌𝑅 − 𝑌𝑟|

𝑌𝑅

Ecuación 5: Error Absoluto en función de la solución del AG sintetizado

𝐸𝐴 = 𝐸𝑟𝑟𝑜𝑟 𝐴𝑏𝑠𝑜𝑙𝑢𝑡𝑜

𝑌𝑅 = 𝑉𝑎𝑙𝑜𝑟 𝑟𝑒𝑎𝑙

𝑌𝑟 = 𝑉𝑎𝑙𝑜𝑟 ℎ𝑎𝑙𝑙𝑎𝑑𝑜 𝑒𝑛 𝑙𝑎 𝑟𝑒𝑔𝑟𝑒𝑠𝑖𝑜𝑛

Nota:

“Para estos errores sean para calcular (Vm2T-Vm2C-VtT-VtC) se utiliza la misma idea de error

Absoluto”

10.3.4.2 SELECCIÓN

Este paso va dentro del ítem anterior (Generación de individuos); consiste en elegir las

operaciones, exponenciales y funciones de manera aleatoria de tal modo que se acomoden entre

[54]

si junto con las variables independientes para lograr conseguir la regresión correcta. Una vez

seleccionada la combinación adecuada a la regresión a estimar mediante la función fitness se

analizara los errores más próximos a tratar de la siguiente manera:

𝐹𝑓,𝑖 =𝑓

𝑠𝑢𝑚(𝑓)

Ecuación 6: Función fitness para el conjunto de errores hallados en la regresión obtenida

𝐹𝑓,𝑖 = 𝐹𝑢𝑛𝑐𝑖𝑜𝑛 𝑓𝑖𝑡𝑛𝑒𝑠𝑠

𝑓 = 1𝑒𝑟𝑟𝑜𝑟𝑒𝑠⁄

𝑠𝑢𝑚 (𝑓) = 𝑠𝑢𝑚𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑒𝑟𝑟𝑜𝑟𝑒𝑠

Esta selección se hace posible para encontrar en cuanto a los errores la mejor representación

viable de una regresión que demuestre satisfacer la clasificación sugerida con minimizar estos.

La función fitness es la que nos sugiere coger esa regresión y de algún modo implementarla en

toda la clasificación sea (Cod_Sector; Cod_Uso; ZHF).

10.3.4.3 CRUCE

Como su nombre lo indica el cruce es nada más ni nada menos que la recombinación que hay o

puede existir entre dos regresiones obtenidas y enlazarlas entre sí para observar y verificar si es

correcto o no esa modificación que se le haga y llegar a mejorar el modelo obtenido de la

selección. La idea es una vez seleccionada las dos partes de las regresiones en función de las

probabilidades de cruce, pasaran a formar parte de una nueva regresión o simplemente

compartirán atributos a valorar mejor la regresión que nombraremos como regresión hibrida.

𝑌 = {(𝑆𝑒𝑛(𝑥12))

5+ (𝐴𝑠𝑒𝑛(𝑥2

6))3

/(𝐿𝑛(𝑥39))

1∗ (𝑆𝑞𝑟𝑡(𝑥4

7))8

+. . }

Ecuación 7: Regresión obtenida mediante el proceso de selección

𝑌 = {(𝐶𝑜𝑡(𝑥18))

0− (𝑆𝑒𝑛ℎ(𝑥2

0))2

/(𝐴𝑡𝑎𝑛ℎ(𝑥35))

8+ (𝐿𝑜𝑔10(𝑥4

1))7

+. . }

Ecuación 8: Regresión opcional generada arbitrariamente

Cruzamiento:

𝑌 = {(𝑆𝑒𝑛(𝑥12))

5+ (𝐴𝑠𝑒𝑛(𝑥2

6))3

/(𝐿𝑛(𝑥39))

1+ (𝐿𝑜𝑔10(𝑥4

1))7

+. . }

Ecuación 9: Regresión hibrida o regresión mejorada a partir de la recombinación de ambas partes

En pocas palabras se denomina operador de cruce a la forma de calcular el genoma del nuevo

individuo en función del genoma del padre y de la madre. El operador de cruce es fuertemente

[55]

responsable de las propiedades del algoritmo genético, y determinará en gran medida la

evolución de la población (Cerrolaza & Annicchiarico, 1996). Como se puede observar, en la

ecuación 3 Se obtuvo la primera regresión obtenida mediante el proceso de selección como

regresión original; luego se almacena una regresión aleatoria por si se puede optar por mirar

algunas particularidades y atributos simples como aparece en ecuación 4. Pero a la hora de

recombinar estas dos regresiones podemos observar que parte de sus atributos de la ecuación

aleatoria pasan a enlazar junto a la ecuación original dando así a una regresión mejorada o

regresión hibrida mirando obviamente si los errores mejoran o no. Eso con el objetivo de que nos

ayude a mirar arreglo por arreglo (variable por variable) mirando así variables extremadamente

volátiles para poder recombinar con otro conjunto de operaciones, exponenciales y funciones

mezcladas en las variables independientes perfeccionando de alguna manera la regresión y

disminuyendo en si los errores encontrados en la regresión original.

10.3.4.4 MUTACIÓN

La mutación o como se conoce en este contexto “Evolución” es la última fase de la creación de

un algoritmo genético; más específicamente, el paso final de la regresión decisiva. En general es

considerado un operador secundario “Mutación”, de menor importancia que Selección y

Crossover o “cruce”, dado que se aplica a un bajo porcentaje de la población y su efecto no es

demasiado notable en la mayoría de los casos. Sin embargo existen Algoritmos Evolutivos (no

Genéticos) cuyo principal operador de búsqueda es la mutación (Will, 2012).

La idea detrás de los operadores de Mutación, es reproducir las mutaciones genéticas producidas

en cada generación (provenientes de errores de copia o transferencia en el ADN, etc.), como una

de las principales herramientas de la Evolución Natura. En los AG, el operador de Mutación

tiene varios objetivos: preservar la diversidad genética de la población evitando la convergencia

prematura, explorar áreas posiblemente no abordadas del espacio de búsqueda (y cercanas a una

buena solución), sacar al AG de un máximo local si se produjo convergencia prematura, etc.

Debido a esto las variables manejadas en el entorno del programa, serán mutadas de manera

detallada al sesgo de error que se encuentre solucionando las variables dependientes resultantes

(dicho de otro modo las variables tratadas por los operadores, funciones y exponenciales);

Notándose el mínimo cambio posible que se pueda generar en esta. A continuación, se mostrara

un ejemplo más claro de lo que significa este operador:

𝑌 = {(𝑆𝑞𝑟𝑡(𝑥14))

7+ (𝐴𝑡𝑎𝑛(𝑥2

2))0

/(𝐶𝑠𝑐ℎ(𝑥31))

1∗ (𝑆𝑒𝑐(𝑥4

7))8

+. . }

𝑌 = {(1000,42) + (8,05)/(1,01 ) ∗ (70) + ⋯ . }

Ecuación 10: Regresión hibrida con operadores de selección y cruzamiento

[56]

𝒀 = {(𝑺𝒒𝒓𝒕(𝒙𝟏𝟒))

𝟕

+ (𝑨𝒕𝒂𝒏(𝒙𝟐𝟐))

𝟎

/ (𝑪𝒔𝒄𝒉(𝒙𝟑𝟓))

𝟏

∗ (𝑺𝒆𝒄(𝒙𝟒𝟕))

𝟖

+. . }

𝑌 = {(1000,42) + (8,05)/(30,15 ) ∗ (70) + ⋯ . }

Ecuación 11: Regresión Mutada Final

Como se puede observar, la regresión hibrida tuvo una sola modificación que cambia

drásticamente la solución de la variable independiente X3 por lo que a esto se denomina como

variable mutada. Si y solo si esta variable muestra alguna mejora en la regresión; esta quedara

guardada en la regresión final para optimizar el Y Estimado para al fin, disminuir los errores

posibles. De ser así mirar todos los X3 de los demás predios y analizar la mejor solución.

10.3.4.5 AJUSTE DE BETAS

Para describir más acerca de un ajuste de betas o estimadores, primero toca definir que es uno.

En muchos libros y algunos artículos econométricos, en algunos aspectos es un estadístico (es

decir, es una función de la muestra) usado para estimar un parámetro desconocido de la

población. Por ejemplo, si se desea conocer el precio medio de un artículo (el parámetro

desconocido) se recogerán observaciones del precio de dicho artículo en diversos

establecimientos (la muestra) y la media aritmética de las observaciones puede utilizarse como

estimador del precio medio. Para cada parámetro pueden existir varios estimadores diferentes. En

general, escogeremos el estimador que posea mejores propiedades que los restantes, como

insesgadez, eficiencia, convergencia y robustez “Consistencia” (Biomatemática, 2012).

Inmediatamente, usaremos los estimadores para promediar los pesos que se presentan en las

variables independientes resueltas; no siendo más buscaremos mejorar las variables tratadas por

medio de estimadores. Llamarlos constantes o Betas que como existen valores volátiles nos

validara de que todas las variables sea (area_construccion/area_terreno, area_uso, puntaje,

vetustez, x(coord) e y(coord)). Tendrían un alto sesgo aun teniendo la regresión sin un estimador

fijo. Por lo que en el software ponderara algunos betas acompañados de cada variable

independiente tratada al ser multiplicada y obtener un resultado más razonable.

𝑌 = {(𝑆𝑞𝑟𝑡(𝑥14))

7+ (𝐴𝑡𝑎𝑛(𝑥2

2))0

/(𝐶𝑠𝑐ℎ(𝑥31))

1∗ (𝑆𝑒𝑐(𝑥4

7))8

+. . }

Ecuación 12: Regresión final mediante Algoritmos Genéticos (AG’s)

𝑌 = {𝛽0(𝑆𝑞𝑟𝑡(𝑥14))

7+ 𝛽1(𝐴𝑡𝑎𝑛(𝑥2

2))0

/𝛽2(𝐶𝑠𝑐ℎ(𝑥31))

1∗ 𝛽3(𝑆𝑒𝑐(𝑥4

7))8

+. . }

Ecuación 13: Regresión final con estimadores

[57]

Para este caso; se utilizara valores entre 0 y 1 debido a que los pesos para las variables deben de

ser mínimos y consecuentes con el ejercicio. Manejando aun así un criterio de validez en la

regresión resultante.

10.4 BITACORA EXPERIMENTAL

La bitácora experimental trata de mostrar los pasos que se deben de llevar a cabo en cuanto al

manejo del software. Viendo así todo el procedimiento y requisitos que necesita este para tener

una solución aceptable en la consistencia de la regresión. Antes de comenzar, se debe mirar muy

bien cómo se diseñara la hoja de cálculo o BD de Excel (.xls)

Ilustración 17: Base de datos en Excel donde se guardara en Matlab VCONS

Como ejemplo, la Ilustración 10 se puede ver una hoja de cálculo cualquiera donde aparecen

columnas con nombres como ID, Y, X1, X2, X3,…, X6. Esa fila son denominadas las filas de

tanto la variable dependiente que vamos a calcular (Y Estimado) como la variable identificadora

(ID), y sus variables independientes (X1, X2, X3, X4, X5 y X6). Lo único que se compilara con el

programa es guardarlo en una base de datos mediante la opción xlsread.

Como se puede mostrar en la Ilustración 11, aparece en la imagen izquierda donde se almacena

la BD tanto de Excel (.xls) como la nueva BD de Matlab (.mat) que se llamara basededatos2.mat

convirtiendo a partir de la tercera fina hacia abajo todos los números tipo grandes, decimales, o

enteros (double, float, o int). Esto con el objetivo de que toda la base de datos se maneje dentro

de un mismo formato; primero exportamos la BD de Excel por medio de la interfaz del programa

como se muestra en la imagen de la derecha dando clic a la pestaña Excel, luego al hacer esta

operación saldrá una ventana que dirá Base de datos actualizada y finalmente al abrir

basededatos2.mat en Matlab aparecerá la misma BD de Excel pero montada en una hoja de

cálculo perteneciente a Matlab.

[58]

Ilustración 18: BD .mat almacenada y exportada desde el software conocido como interfaz

Luego, comenzamos con la Generación de Población Inicial como se muestra en la misma Ilustración

17. En el diagrama de interfaz podemos observar que aparece dicha opción pero esta solo función si se ha

cargado instantáneamente la BD.mat en consola; damos clic y debe aparecer una pestaña flotante como

se observa en la Ilustración 18.

Ilustración 19: Ventana flotante recopilando las mejores regresiones para la clasificación deseada

La imagen de por si no hace sino capturar las regresiones; pero dentro del programa se están

reordenando todas las opciones con las cuales van a acompañar las variables independientes que

entre si resolverán Y Estimado. Como en este medio se procede a operar simultáneamente las

operaciones de un AG’s como Selección y Cruzamiento “Crossover” Terminando este ítem se

obtendrá las regresiones y errores respectivos dentro de la carpeta origen siguiendo así con la

siguiente opción de algoritmo Evolucionar conocido también como Mutación. Este consiste en

mirar variable por variable y analizar que variable es la que presenta más incertidumbre en la

regresión; Teniendo en cuenta que se observa toda la columna en que se estudia la regresión y no

solo el dato que estudia la misma. Por consiguiente aparecerá una ventana flotante en la que se

ejecutara el proceso de evolución y hasta que llene la barra de la ventana flotante, no se

interrumpirá el proceso evolutivo.

[59]

Ya dado este paso, podemos observar tanto la regresión como los resultados de esta y los

respectivos errores que se obtuvieron a partir del software; en la opción ver regresión que

aparece al lado derecho de la opción Evolucionar. Como se ve en la Ilustración 19, observamos

que en la ventana flotante aparece una tabla mostrando tres columnas; Y Estimado (Real), Y Calculado

(Regresión) y Errores; ya que la regresión calculada se encontrara en el command Window de

Matlab de la siguiente manera:

Ilustración 20: Tabla final con los errores de cada regresión, la solución de la regresión y el parámetro fijado

Ilustración 21: Regresión obtenida del programa guardado en consola “Command Window”

Ya por último, nos queda no más la opción Ajustar betas como se muestra en la Ilustración 17

donde solo queda por colocar los estimadores para ponderar con los mismos pesos todas las

variables a describir nuestra regresión. Para finalizar, solo queda la misma tabla con los errores

modificados y la regresión estimada final.

[60]

@(𝑋)(0.99721 ∗ ((𝑎𝑡𝑎𝑛(𝑋(1)^1))^5)) ∗ (0.9997 ∗ ((𝑡𝑎𝑛(𝑋(2)^3))^6)) + (0.99707 ∗

((𝑎𝑐𝑜𝑠(𝑋(3)^9))^2)) ∗ (0.74912 ∗ ((𝑎𝑡𝑎𝑛(𝑋(4)^8))^8)) + (0.89765 ∗ ((𝑎𝑠𝑒𝑐(𝑋(5)^1))^5)) ∗ (0.99998 ∗

((𝑙𝑜𝑔10(𝑋(6)^9))^4))

Ecuación 14: Regresión final con ajuste de betas

Si todo el ejercicio quedo bien se observara que los errores han disminuido con respecto a los

errores hallados en la regresión sin estimadores; sino toca volver a realizar la generación de

individuos hasta que esta sea competente con la teoría dada en el marco teórico.

“Una de las razones por la cual es de vital interés tener en cuenta los AG es que estos son un

método global y robusto de búsqueda de las soluciones de problemas cuya principal ventaja de

esta inteligencia es el equilibrio alcanzado entre la eficiencia y eficacia para resolver diferentes

y muy complejos problemas de grandes dimensiones” (Holland, 1989).

10.5 RESULTADOS

Los resultados obtenidos en este trabajo se acuerdan a los diversos escenarios (experimentos) por

el cual se tuvo que someter los datos; se presentaron diferentes comprobaciones como:

Clasificación al 100% de los datos crudos mediante escalamiento.

Clasificación al 100% de los datos mediante [Código_Sector] según UPZ.

Clasificación al 100% de los datos mediante [Código_Uso] según UPZ.

Clasificación al 100% de los datos mediante [ZHF] según UPZ.

Clasificación entre 66% de los datos mediante el programa creado (entrenamiento) y el

33% restante transcribiendo la regresión a cada variable dependiente mediante Excel.

Clasificación entre 66% de los datos mediante el programa creado (entrenamiento) y el

33% restante transcribiendo la regresión a cada variable dependiente mediante Excel

comprobando estos dos porcentajes y comparándolos mediante MRL (Modelo de

Regresión Lineal).

Asimismo, analizando de que los mejores resultados sean puestos dentro del objetivo a resolver y

diagnosticando los pro y contra de cada clasificación que tuvo el software a lo largo del proceso.

A continuación, se mostrara cada ejemplo de clasificación planteada mediante una tabla resumen

en donde se ven involucrados tanto las (4) variables independientes a calcular, como sus

respectivos errores y su respectiva explicación:

Nota:

“Para la primera clasificación (Clasificación al 100% de los datos crudos mediante

escalamiento) no se pudo obtener un cuadro resumen debido a que esta nunca se obtuvieron

resultados porque el programa no alcanzo a compilar todos los datos (excesivos) para ambas

UPZ”.

[61]

CLASIFICACIÓN SEGÚN CÓDIGO DE SECTOR UPZ BOLIVIA

Tabla 8: Cuadro resumen según Código de Sector UPZ Bolivia

Fuente: Excel 2010

Como se puede observar, tenemos una tabla con errores tanto mínimos, máximos y promedios que determinan que tan cerca o que tan

lejos esta la solución de la regresión frente al valor real determinando en las 4 variables independientes (Vm2C -Vm2T -VtC -VtT).

[62]

CLASIFICACIÓN SEGÚN CÓDIGO DE SECTOR UPZ GRANJAS DE TECHO

Tabla 9: Cuadro resumen según Código de Sector UPZ Granjas de Techo

Fuente: Excel 2010

Se visualiza la tabla donde vemos el mismo formato al anterior pero con diferentes valores y UPZ. Los errores máximos de Vm2C y

VtT, se entiende que padece un valor totalmente desorientado con la realidad (938%-238%) pero aun así, su valor promedio esta en los

estándares más conocidos como normales “porcentaje de dos dígitos”. Esto se debe a que existen diferentes valores los cuales tienen a

ser atípicos a la muestra promedio; por decirlo de otro modo se tienen valores extremadamente altos y/o bajos que hacen que los

errores aumenten considerablemente y afectan a la muestra de datos totales conocidos o clasificados como Codigo_Sector.

[63]

CLASIFICACIÓN SEGÚN CÓDIGO DE USO UPZ BOLIVIA

Tabla 10: Tabla 11: Cuadro resumen según Código de Uso UPZ Bolivia

Fuente: Excel 2010

Ahora, se clasifico mediante el código Uso que se refiere a que uso tiene la UPZ; este uso es de tipo residencial y al parecer según el

número de datos parece ser que esta tipología pertenece a residencial PH. Acontecen los mismos resultados que en las clasificaciones

pasadas, solo que en este caso los errores promedios se mantienen por debajo del 60% pero los errores máximos aumentaron debido a

que el terreno para algunos usos se ve afectado por una diferenciación de valor monetario bastante enorme.

[64]

CLASIFICACIÓN SEGÚN CÓDIGO DE USO UPZ GRANJAS DE TECHO

Tabla 12: Cuadro resumen según Código de Uso UPZ Granjas de Techo

Fuente: Excel 2010

Para esta UPZ, se verifica que existe un gran error tanto de porcentajes como de valores monetarios; esto se debe a que los usos de

esta UPZ son bastante disparejos. Como se puede visualizar, los errores máximos tienden a tener una ilógica bastante irracional dando

como resultados en variables (Vm2C-Vm2T-VtC) porcentajes hasta de 7 dígitos y hablando específicamente del error promedio

resaltando sus valores sumamente irracionales tendiendo a cifras de miles cuando el tope máximo al que se debe permitir un error

matemático hablando en términos de cifras es hasta 2 cifras como máximo o hasta llegar al error total denominado 100%.

[65]

CLASIFICACIÓN SEGÚN ZHF UPZ BOLIVIA

Tabla 13: Cuadro resumen según ZHF UPZ Bolivia

Fuente: Excel 2010

Como hasta ahora se observa, los errores han venido disminuyendo considerablemente con esta

clasificación; los errores oscilan entre 0% hasta 51% por lo que se entiende que mejoro esta

clasificación respecto a Codigo_Sector y Codigo_Uso. Las ZHF nos da a entender que a partir de

la generación de un código único constituido por 13 dígitos ubicado en la tabla en la parte

superior izquierda que me explica detenidamente todas sus características explicadas en la

página 61, vienen siendo una nomenclatura más favorable a la hora de calcular valores

monetarios; por lo que no oscilan entre un conjunto de muestras o si existe alguna evidencia de

lo contrario debe de ser por una característica particular. Detengámonos por un momento en ver

las nuevas casillas denominadas Avaluó. Esta nueva variable se estableció debido a que se debe

comparar las variables independientes que comportamiento tienen hacia está logrando así que

estas misma me expliquen la variable nueva. Para nosotros nos interesa saber que tan

aproximado debe de ser las variables independientes para estimar la variable dependiente. Que

en este caso parece ser bastante precisa teniendo en cuenta el número de datos a estimar en toda

la ZHF “200 datos” y que tan exacto debe de ser estos valores si sumando tanto Suma Regresión

(VtC+VtT) ≈ Suma Regresión (Avaluó) como normalmente se calcula un avaluó “Remitirse al

Marco teórico conceptual-Avalúos”.

[66]

CLASIFICACIÓN SEGÚN ZHF UPZ GRANJAS DE TECHO

Tabla 14: Cuadro resumen según ZHF UPZ Granjas de Techo

Fuente: Excel 2010

También sucede en esta UPZ; Granjas de techo como se ha mencionado antes y se ha

evidenciado en el marco teórico es una zona donde realmente la mayoría de su uso es de tipo

industrial; pero también existen lugares donde hay usos residenciales y presencialmente en

normatividad de PH. Para este caso no es la excepción; teniendo un total de 200 predios en esta

ZHF, los errores se comportan de una manera idónea y precisa; de la misma forma a como se

comporta en la anterior UPZ, solo que en este caso el error máximo aumento un 3% en las

variables (Vm2C-Vm2T) suele ocurrir esta diferencia debido a las áreas por las cuales ha sido

sometida la muestra; que tienden a variarse como hoy sucede en la actualidad; el área de

construcción la destinan en un apartamento a medida de que el número de piso sea mas alto.

Posiblemente sea una de las razones por las que cambia esta cifra pero si se fija mejor en las

otras dos variables, se analizara que los valores tienden a ser pequeños. Lo más importante como

se resaltó antes, es que estos resultados cumplan con aproximarse mucho a la casilla de Avaluó.

Tanto la suma de regresión de las variables (VtC+VtT) sea aproximadamente igual a la suma de

regresión de la columna avaluó. Si es así es porque las ecuaciones debajo de estas tablas son

correctas y por consiguiente la fila Regresión Resultante Avaluó Catastral también es válida.

[67]

Es evidente que las mejores clasificaciones (clústeres) que se han venido acoplando a nuestro

propósito ideal ha sido clasificar los datos mediante ZHF por definir la mejoría de errores y

precisión a la hora de conseguir nuestros resultados reales mediantes las regresiones calculadas.

Viéndose de este modo si se ha llegado a mejorar este tipo de incógnitas mediante los AG´s para

encontrar una fórmula que me ayude a resolver un montón de datos aleatorios con una única

solución a nivel masivo.

Algo importante que se ha de recalcar es que este tipo de experimentaciones se llegan a realizar

para verificar que tan precisa puede ser la situación por la cual se quiera resolver el problema;

dicho de otro modo, no todos los experimentos funcionan siempre para diagnosticar un

paradigma. Pensándolo así pueda que haya sido solo la clasificación ZHF la más específica y

más rigurosa clasificación posible para limitar mejor tanto uso como condición física posible de

un grupo de barrios y predios atados a una UPZ heterogénea.

Ilustración 22: Componentes de una ZHF Urbana (COLOMBIA, 2011)

Ahora bien, se ha comprendido de que esta herramienta nos ayuda a evidenciar que las

regresiones mediante AG´s si han sido eficientes pero a la hora de comprobar estas situaciones

no tenemos alguna idea de que realmente si sean certeras por lo que ahora lo que nos toca

empezar a construir son algunos intentos o conocimientos claves de los cuales vamos a

reemplazar este tipo de regresión en algunos datos aleatorios para poder verificar mejor si este

modelo es útil o no. “este tipo de experimento, solo se comprobara con la clasificación ZHF”.

FLUJOGRAMA PARA DETERMINACION DE ZONAS

HOMOGENEAS FISICAS CON VIGENCIA DEL 2005

Según la Ley 14 de 1983 y la Resolución 2555 de 1988 del IGAC, la cual

reglamenta los procesos de formación, actualización de la formación y

conservación catastral, definen ZHF como aquellos espacios geográficos dentro

del perímetro urbano con características similares que permitan diferenciar

estas áreas de las adyacentes. En la ciudad de Bogotá, hay como características

físicas relevantes y que permiten a su vez determinar el valor por m2 de terreno

las siguientes:

DESTINACION

ECONOMICA

Clase de suelo Área de

actividad Tratamiento

ADECUACIÓN AL

USO URBANO

Topografía. Vías. Servicios

USO DE LOS INMUEBLES

Actividad económica del inmueble.

Tipo según actividad del inmueble.

[68]

ENTRENAMIENTO Y PRONOSTICO UPZ BOLIVIA MEDIANTE ZHF

Tabla 15: Cuadro resumen según ZHF E-P UPZ Bolivia

Fuente: Excel 2010

Para esta tabla, se observa que existen dos columnas debajo de las variables a encontrar conocidas como Entrenamiento-pronostico,

la cual su función es dividir la ZHF en dos muestras (66%-33%) teniendo en recuadro Numero de datos (132+68) se agrupo los datos

totales de la ZHF y se proporcionó en los porcentajes mencionados; de tal modo que en la columna de entrenamiento están los datos

que se procesaron en el programa Matlab y el restante se reemplazó en la regresión obtenida obteniendo así el 100%. Esto se realizó

debido a que se necesita saber que tan confiable fue el AG’s con la primera regresión obtenida y revelar que es la mejor.

[69]

ENTRENAMIENTO Y PRONOSTICO UPZ GRANJAS DE TECHO MEDIANTE ZHF

Tabla 16: Cuadro resumen según ZHF E-P UPZ Granjas de Techo

Fuente: Excel 2010

Lo mismo pasa en esta UPZ; la intención es elegir un restante aleatorio y colocar esta regresión para verificar si sirve o no a la hora de

estimar avalúos de una misma ZHF. Se analiza mejor el cuadro y se puede entender que la diferencia entre los datos de entrenamiento

y pronóstico suelen ser bastante flexibles; teniendo en cuenta que los errores de pronóstico suelen tener mucha mejor precisión que los

de entrenamiento. Pueda que sea por sus datos a la hora de enlazarlos; o su equivalencia en el software Excel que aproxime mejor los

resultados; este fue un problema bastante comprensible porque Excel no maneja algunas funciones trigonométricas como (Cot-Sec-

Csc) sus inversas, hiperbólicas y obviamente hiperbólicas inversas por lo que tienen que encontrarse identidades trigonométricas.

[70]

Ya por último, para nombrar la sexta clasificación “Clasificación entre 66% de los datos

mediante el programa creado (entrenamiento) y el 33% restante transcribiendo la regresión a

cada variable dependiente mediante Excel comprobando estos dos porcentajes y comparándolos

mediante MRL”, se observó de que las ZHF ayudan a puntualizar los datos de una manera más

cómoda para diferenciarlos de otros por medio de sus “espacios geográficos con características

similares en cuanto a vías, topografía, servicios públicos, uso actual del suelo, norma de uso del

suelo, tipificación de las construcciones y/o edificaciones, áreas homogéneas de tierra,

disponibilidad de aguas superficiales permanentes u otras variables que permitan diferenciar

estas áreas de las adyacentes” (COLOMBIA, 2011).

Para esta clasificación se tuvo que elaborar una Regresión Lineal mediante la herramienta de

Excel para verificar que tan viable puede ser están herramienta frente a modelos de regresión

tradicionalmente utilizados como se viene haciendo durante toda la investigación. El MRL o

modelo de regresión lineal es el más utilizado a la hora de predecir los valores de una variable

cuantitativa a partir de los valores de otra variable explicativa también cuantitativa regresión

lineal simple). Una generalización de este modelo, el de regresión lineal múltiple, permite

considerar más de una variable explicativa cuantitativa. Por otra parte, tal como se verá en un

tema posterior, es también posible incluir variables explicativas categóricas en un modelo de

regresión lineal si se sigue una determinada estrategia en la codificación de los datos conocida

como codificación ficticia (Molina & Rodrigo, 2009).

Consiste en tener la solución de los datos experimentados (66%) de la ZHF respectiva y generar

tanto los errores del AG´s del software, como los errores producidos del MRL generados por

Excel. De tal modo que los podamos comparar y a esos resultados también los logremos

reemplazar en los datos desconocidos “pronostico” para mirar que tan efectivos son estos dos

modelos que pueden representar de una manera óptima los datos en interés.

El MRL lo que nos va a retornar son unos coeficientes (Estimadores) que ayudan a encaminar a

las variables independientes a calcular de manera lineal nuestra variable dependiente o Y referencia.

En cuanto a nuestro algoritmo o llamarlo como MRNL (Modelo de Regresión No Lineal) nos

arrojara una ecuación como su nombre lo dice no lineal cuyo propósito en el problema es ayudar

a satisfacer por medio de datos desconocidos una pronta solución a la variable a calcular Y

referencia.

Ahora bien, en la siguiente página, se encontrara (1) ZHF de cada UZP (2) y se determinara cuál

de los dos modelos de regresión resulta ser el más efectivo aplicando tanto para los datos de

entrenamiento, como para los datos de pronóstico. Siendo así el último con más peso de

importancia debido a que los modelos después de que se entrenen se enfrentaran a los datos

restantes de la ZHF y por el cual no se tiene conocimiento alguno de que esos modelos se

aplicaran o no para este tipo de datos (selección de datos de manera random-aleatorio).

[71]

ENTRENAMIENTO Y PRONOSTICO UPZ BOLIVIA MEDIANTE ZHF-MRL

Tabla 17: Cuadro resumen de la UPZ Bolivia ZHF_MRL

Fuente: Excel 2010

Es evidente que para esta clasificación, debe tener en cuenta un ítem novedoso denominado como MRL (Error, Promedio y Suma);

como se explicó en los párrafos anteriores, la intención de este es verificar y comparar la regresión múltiple obtenida durante todo el

trabajo de investigación referente a este modelo de regresión tradicional validando que tan confiable puede ser este método para en

algún momento estimar mejor avalúos masivos. Aclarando aquí que para esta ZHF los datos de entrenamiento se comportan de mejor

manera con el MRL respecto a MRNL; pero a la hora de examinar los datos de pronostico parece comportarse mejor el MRNL que el

MRL simplemente porque al reemplazar los coeficientes del ya mencionado son bastantes sesgados los resultados de estos.

[72]

ENTRENAMIENTO Y PRONOSTICO UPZ GRANJAS DE TECHO MEDIANTE ZHF-MRL

Tabla 18: Cuadro resumen de la UPZ Granjas de techo ZHF_MRL

Fuente: Excel 2010

Ya para finalizar, se observa detenidamente como los cambios que se dan tanto para los datos de entrenamiento de MRL como de

pronóstico del ya mencionado son sumamente diferenciados frente a los datos entrenamiento-pronóstico del MRNL. Los errores

promedio de MRNL y MRL son bastante notorios en pronostico cayendo así el MRL como insuficiente frente a los errores de

pronostico en MRNL; no digo que del todo sea malo sino que cuando se entrena unos datos parece que es mejor el MRL; pero cuando

RL con los estimadores resultantes de entrenamiento unos datos aleatorios tienen una mejor estimación el MRNL que el MRL.

[73]

10.6 ANÁLISIS DE RESULTADOS

Entendiendo mejor lo construido hasta este instante y según los resultados mostrados en el tema

anterior, podemos decidir que para estos datos el modelo de regresión que más ha sido útil a la

hora de evaluar un conjunto de información tanto homogénea como heterogénea es el Modelo de

Regresión Múltiple resulto mediante Algoritmos Genéticos. Indudablemente, para encontrar este

tipo de hipótesis certera se expuso esta herramienta mediante diferentes experimentos y

clasificaciones y que así mismo ayudaron a establecer una solución real que compromete tanto

nuestros objetivos afines como investigaciones a continuar.

Ahora bien, para cada UPZ se escogerá dos (2) ZHF en las cuales una (1) tendrá el uso de

Residencial PH y la otra tendrá también por consiguiente el uso Residencial con diferente norma

NPH. Se analizara estos datos en especial los errores promedio mediante Gráficos de dispersión

y de comparación con tres variables entendiendo mejor el comportamiento de los datos; también

se comenzara por entender los diferentes errores por los cuales son sometidos los resultados para

entender mejor la situación existente.

RAE (Relative Absolute Error)

La RAE o en términos comprensibles (Error Absoluto Relativo), es el promedio de los valores

reales por lo tanto, el error cuadrático relativa toma el error cuadrático total y normaliza

dividiendo por el error cuadrático total de la sencilla predictor.

𝑅𝐴𝐸 =∑ |𝑃(𝑖𝑗) − 𝑇𝑗|𝑛

𝑗=1

∑ |𝑇𝑗 − �̅�|𝑛𝑗=1

Ecuación 15: Formula implícita de RAE

Dónde:

𝑃(𝑖𝑗) = 𝐷𝑎𝑡𝑜 𝑖𝑛𝑐𝑖𝑐𝑖𝑎𝑙 (𝑖) 𝑟𝑒𝑐𝑜𝑟𝑟𝑖𝑒𝑛𝑑𝑜 (𝑗) 𝐷𝑎𝑡𝑜𝑠 𝑚𝑎𝑥𝑖𝑚𝑜𝑠

𝑇𝑗 = 𝐸𝑟𝑟𝑜𝑟 𝑑𝑒𝑠𝑒𝑎𝑑𝑜

�̅� = 𝐸𝑟𝑟𝑜𝑟 𝑑𝑒𝑠𝑒𝑎𝑑𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜

MAE (Mean Absolute Error)

MAE (Error Absoluto Medio), es una medición de incertidumbre que tiende a calcularse con la

misma unidad que los datos originales, y sólo se puede comparar entre los modelos cuyos errores

se miden en las mismas unidades. Por lo general es similar en magnitud al RMSE, pero

ligeramente más pequeño.

[74]

𝑀𝐴𝐸 =∑ |𝑃(𝑖𝑗) − 𝑇𝑗|𝑛

𝑗=1

𝑛

Ecuación 16: Formula implícita de MAE

Dónde:



𝑛 = 𝑁𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠

RRSE (Root Relative Squared Error)

RRSE (Raíz Cuadrada del Error Relativo), Viene siendo la raíz cuadrada que se obtiene a partir

de la normalización del pronóstico de incertidumbre en RAE. Se utiliza para precisar un error

parsimonioso en cuanto a las unidades que maneje.

𝑅𝑅𝑆𝐸 = √∑ (𝑃(𝑖𝑗) − 𝑇𝑗)

2𝑛𝑗=1

∑ (𝑇𝑗 − �̅�)2𝑛

𝑗=1

Ecuación 17: Formula implícita de RRSE

Dónde:



�̅� = 𝐸𝑟𝑟𝑜𝑟 𝑑𝑒𝑠𝑒𝑎𝑑𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜

RMSE (Root Mean Squared Error)

El RMSE (Raíz de Error Medio Cuadrático), Es la raíz del promedio de los cuadrados del error

de cada artículo o periodo y también se utiliza para comparar y seleccionar la precisión de

diferentes métodos de pronóstico. La diferencia es que el resultado está en las unidades

originales.

𝑅𝑀𝑆𝐸 = √1

𝑛∑(𝑃(𝑖𝑗) − 𝑇𝑗)

2𝑛

𝑗=1

Ecuación 18: Formula implícita de RMSE

[75]

Dónde:




MAPE (Mean Absolute Percentage Error)

MAPE (Error Porcentual Absoluto Medio), es la media de los errores porcentuales en valor

absoluto, no considera el signo del error sólo la magnitud. Es una de las medidas más utilizadas a

nivel mundial y casi siempre se es nombrada como la mejor.

𝑀𝐴𝑃𝐸 =

∑𝑃(𝑖𝑗) − 𝑇𝑗

𝑃(𝑖𝑗)

𝑛𝑗=1

𝑛

Ecuación 19: Formula implícita de MAPE

Dónde:




Este tipo de errores son mencionados a consecuencia de que todos ellos dicen que los resultados

más alejados entre sí son sus valores más aproximados del valor real (𝑇𝑗) como muestra de una

particularidad se dice que entre el RMSE y MAE es menor, es mucho mejor el modelo

replanteado (mayor precisión); mientras que los errores RRSE y RAE, Difieren con los datos

medios dependiendo que tan cerca o lejos se encuentra del punto medio (Mean) y el error

MAPE; viene siendo el mejor error posible que podamos obtener a partir de los pesos

porcentuales que tienen cada error absoluto resultante del algoritmo genético “para nuestro caso

es equivalente al error absoluto que posee cada predio” (García Jimémez & Álvarez Sierra,

2003).

En cuanto a estos valores, fueron analizados y resueltos mediante WEKA aplicando una

clasificación en función de una regresión lineal; para usar el criterio akaike (AIC) que me ayuda

a definir el mejor error posible, adquiriendo así la mejor predicción de errores. Ahora bien, se

destinara un cuadro resumen en el que se observara los errores ya mencionados respecto al tema

anterior y se confrontara del mismo modo los resultados obtenidos en el MRNL.

[76]

ANALISIS DE ERRORES ZHF UPZ BOLIVIA

Tabla 19: Errores estimados de la UPZ Bolivia

Fuente: Excel 2010

Estos cuadros nos ayudan a visualizar mejor una mayor probabilidad de precisión a la hora de

encontrar errores; como ya se entiende de las anteriores definiciones, los errores RAE y RRSE

entre más alto tenga sus porcentajes más correlacionados están los valores entre sí. Por decirlo de

otro modo están más cercanos a ser exactos (parecidos) unos de otros; por otro lado, los errores

RMSE y MAE nos ayuda a evidenciar que tan aproximados son los resultados del cero absoluto

en el que llegando a esta valor significa que los valores son los más adecuados en la ecuación.

Las ecuaciones de cada uno de esta simbología de errores es completamente diferente y esto a su

vez tiene diferente interpretación por lo que se recomienda leer detenidamente que significa cada

uno de estas. Esto solo nos dice estadísticamente que tan cercano y lejano se comporta los datos

del ideal.

[77]

ANALISIS DE ERRORES ZHF UPZ GRANJAS DE TECHO

Tabla 20: Errores estimados de la UPZ Granjas de Techo

Fuente: Excel 2010

Para esta ZHF pasa lo mismo pero con la diferencia que la simbología de errores tanto RAE

como RMSE aumentaron considerablemente frente a la otra UPZ Bolivia; se tiene la misma

interpretación que las dos mencionadas ahorita tienen a aproximarse más a cero y por lo que nos

dice que estos errores son consistentes con los que hemos encontrado durante todo el proceso y

lo mismo para con la simbología RAE y RRSE que en otras tienden a tomar valores altos en sus

porcentajes para mirar la correlación en estos. Este tipo de errores fueron encontrados y

diagnosticados mediante el software WEKA cuya función principal es mirar mediante teoría de

errores que tan familiarizados están estos errores mediante a un modelo lineal cuya muestra no es

más que un común de datos divididos en dos muestras (entrenamiento y pronostico) como se

examinó en los anteriores cuadros y que nos ayudan a encontrar un común error para establecer

[78]

este tipo de interpretaciones “dicho esto en los enunciados anteriormente mencionados en los

cuadros.

A continuación, se entenderá que los errores para la UPZ Bolivia, alcanzan un porcentaje entre

(1% - 12%) para los factores MAE – RMSE; como se describió antes, estos valores tienen que ser

bastantes pequeños frente al error óptimo que se tiene en interés. Por otro lado, se observa los

factores RAE – RRSE que de por sí, son valores cuyos porcentajes son bastante altos y esto se

debe debido a que alcanzan el máximo índice que puede tener una variable respecto al valor

medio de este; aunque para esta UPZ al ver estos indicativos notamos de que sus valores no son

tan grandes como se debería expresar. Esto sucede al verificar de que los datos poseen un patrón

homogéneo y estático, esto ocurre que los datos sean rígidos a la hora de evaluarlos.

Ahora bien, se entiende mejor el concepto de exactitud de acuerdo a las aclaraciones que se han

mencionado en los párrafos anteriores; de como determinar qué tan cercano o lejano estamos de

poder encontrar nuestra solución óptima y que limitantes se han presentado en el transcurso de la

investigación. Que no solo basta con obtener la ecuación anhelada para responder con nuestro

espécimen en cuestión sino que para colmo, se tiene que patentizar y certificar de que esta

solución sea la más recomendable a la hora de esquematizar otra teoría diferente a la que se ha

venido utilizando en el catastro convencional.

Para ilustrar de mejor manera lo que se ha simulado como AG’s, se creara un ítem adicional el

cual se expresara de manera visual, la mejora que se ha tenido al implementar esta herramienta

respecto a la creación de modelos lineales vistos conmensuradamente para aplicar avalúos

masivos dentro de un régimen estrictamente econométrico. No lo digo porque la econometría sea

un factor bastante rígido para explicar de manera teórica la explicación de cada supuesto sino

que viendo más allá de esta disciplina, podemos abordar de manera sencilla, todo este tipo de

conocimientos a través de una herramienta practica como lo es el rompimiento total del

paradigma de programación.

10.6.1 GRAFICO DE TENDENCIA LINEAL

En este inciso se va a visualizar mejor la tendencia que tienen los datos tanto (Valor Real, Valor

Regresión y Valor Lineal tanto de Entrenamiento y Pronostico) haciendo ilustración tanto para

las variables dependientes a calcular (Vm2T, Vm2C, VtT, VtC) y por último el avalúo obtenido

según la UAECD y como variable independiente “Resuelto en los AG’s” verificando asi el

comportamiento de cada uno de estas trazando una recta con la cantidad de datos según arrojados

en la etapa de pronóstico.

En este caso se realizara estos gráficos de acuerdo con la Tabla 18 del inciso de resultados en el

cual la mayoría de los datos poseen un error pequeño del MRNL en cuanto al pronóstico de los

datos frente al MRL cuyos valores son bastantes extravagantes al valor ideal que se debe

comparar “Valor Real”.

[79]

UPZ GRANJAS DE TECHO ZHF 6222115153113

Entrenamiento

Pronostico

Ilustración 23: Tendencia Lineal Entrenamiento-Pronostico del Vm2C Fuente: Excel 2010

En estos diagramas de tendencia lineal, como también encontraran para cada variable a calcular, tenemos tres (3) representaciones

lineales que son el resultado de confrontar los tres valores a comparar (Valor real “línea roja”, Valor de regresión “línea verde” y

Modelo de Regresión Lineal “línea azul”). Se observa que en ambos gráficos aparecen estas tres líneas pero en la gráfica pronostico

aunque no se note, la línea roja y verde son casi la misma debido a que su diferencia de valores es casi nula mientras que la línea azul,

tiende a ser más baja que las ya mencionadas. El grafico de entrenamiento se analiza que el valor más aceptado en aproximación al

valor real es el ML siendo este mucho mejor al MRNL.

Para entender mejor los resultados proyectados por los gráficos los puedes comprobar en la Tabla 21 sobre los cuales están tanto los

valores mínimos, máximos y promedios de cada uno de las variables tanto para los diagramas de Entrenamiento como los diagramas

de Pronóstico. Detállese también que los valores de entrenamiento oscilan entre $ 750.000 y $ 751.000 hasta el dato 180 que tiende a

incrementarse hasta $ 753.000; pero en el grafico pronóstico, el ML padece tener un decaimiento de $ 100.000 por debajo del común.

748000

749000

750000

751000

752000

753000

7540001

19

37

55

73

91

10

9

12

7

14

5

16

3

18

1

19

9

21

7

23

5

Vm2C

REAL

REGRESION

ML

0

100000

200000

300000

400000

500000

600000

700000

800000

11

01

92

83

74

65

56

47

38

29

11

00

10

91

18

Vm2C

REAL

REGRESION

ML

[80]


Entrenamiento

Pronostico

Ilustración 24: Tendencia Lineal Entrenamiento-Pronostico del VtC Fuente: Excel 2010

Para este escenario “VtC”, los gráficos padecen no tener una Línea Roja representando el Valor Real y esto se debe a que se acoplan

bastante los valores entre las líneas de Regresión y de Modelo Lineal. Explicando de una mejor manera, el diagrama entrenamiento

posee dos líneas las cuales el modelo de Regresión tiende a parecerse bastante al Modelo Lineal pero lo que no se percibe a simple

vista es que el Valor Real está casi pegado al Modelo Lineal; por lo que este modelo tiende a presentar mejores resultados en el

Modelo Lineal que en la Regresión; ahora determinemos mejor el grafico de pronóstico, aunque no se puede ver a primera intención,

el Valor Real y el modelo de Regresión son exactamente lo mismo con la única diferencia de que en el contraste de los colores, el

verde tiende a tener una tonalidad más fuerte; tendiendo a valores cercanos a $ 40’000.000, en cambio el Modelo Lineal suele oscilar

entre valores de $ 50’000.000 y $ 60’000.000 siendo un dato bastante lejano al ideal. Esto ocurre como se ha mencionado

anteriormente en las clasificaciones de los datos en los resultados obtenidos que los datos pronósticos tienen a mejorar el Modelo de

Regresión debido a que los estimadores del ML son bastantes sesgados respecto a la ecuación obtenida del AG’s.

38200000

38250000

38300000

38350000

38400000

38450000

38500000

385500001

20

39

58

77

96

11

5

13

4

15

3

17

2

19

1

21

0

22

9

VtC

REAL

REGRESION

ML

0

10000000

20000000

30000000

40000000

50000000

60000000

1

11

21

31

41

51

61

71

81

91

10

1

11

1

12

1

VtC

REAL

REGRESION

ML

[81]


Entrenamiento

Pronostico

Ilustración 25: Tendencia Lineal Entrenamiento-Pronostico del Vm2T Fuente: Excel 2010

Hablando de otras variables importantes en la investigación, nos topamos con un gráfico en entrenamiento bastante peculiar; para

determinar “Vm2T” fue bastante impredecible calcular este tipo de soluciones con el AG’s del modelo Regresión; viéndose así en el

diagrama, se debe a que los datos resultantes tuvieron bastantes fluctuaciones inicialmente entre valores de $ 995.000 y $ 1’000.000

hasta el dato 180 que por lo que se considera como un aumento de esta cifra dando así valores oscilantes entre $ 1’005.000 y $

1’010.000. Mientras que los valores tanto para el Modelo Real y Modelo Lineal un valor exacto de $ 1’000.000 manteniendo la teoría

de que los datos de entrenamiento son mejores el Modelo Lineal que el Modelo de Regresión.

Pero no todo es preciso con este argumento; debido a que en el diagrama pronóstico se visualiza más a fondo los trazos de la Línea

Roja y Verde siendo más exactos con un valor aproximado de $ 1’000.000; mientras que la Línea Azul, decayó deliberadamente

retornando un valor exacto de $ 0 dando así que el comportamiento más adecuado de los resultados esperados se lo lleva el Modelo de

Regresión.

985000

990000

995000

1000000

1005000

1010000

10150001

20

39

58

77

96

11

5

13

4

15

3

17

2

19

1

21

0

22

9

Vm2T

REAL

REGRESION

ML

0

200000

400000

600000

800000

1000000

1200000

1

11

21

31

41

51

61

71

81

91

10

1

11

1

12

1

Vm2T

REAL

REGRESION

ML

[82]


Entrenamiento

Pronostico

Ilustración 26: Tendencia Lineal Entrenamiento-Pronostico del VtT Fuente: Excel 2010

En este punto, notamos la imparcialidad que existe en el diagrama de entrenamiento y especialmente con los datos del Modelo de

Regresión. Seguimos observando este tipo de oscilaciones que nos resultan bastante confusas a la hora de interpretar y que por si fuera

poco alisan a los valores Reales y Lineales; suele verse que los resultados de la Regresión poseen en mismo comportamiento que la

variable “Vm2T” porque son dependiente una de la otra. Analizando los valores de cada recta, la Línea Roja (solución ideal) tiende a

tener valores entre $ 41’800.000 y $ 41’880.000; luego trazando la Línea Azul se puede proyectar a valores entre $ 41’850.000 hasta el

dato 191 cuyo valor se ve incrementado en $ 41’900.000 y por último la Línea Verde mostrando valores imprecisos entre $

41’513.000 y $ 42’222.000 siendo este la solución más dispersa posible. Sin embargo, el grafico de pronóstico, nos muestra lo

contrario. Dando así a la mejor respuesta del Modelo de Regresión y no del Modelo Lineal.

Observe solamente las líneas Roja y Verde que se mezclan entre si dando un valor de $ 42’000.000 entre ambas y que la Línea Azul

sigue sin dar vista a un valor parcial (Valor nulo) dando así mayor efectividad al Modelo de Regresión y no al Modelo Lineal.

41000000

41200000

41400000

41600000

41800000

42000000

42200000

424000001

20

39

58

77

96

11

5

13

4

15

3

17

2

19

1

21

0

22

9

VtT

REAL

REGRESION

ML

0

5000000

10000000

15000000

20000000

25000000

30000000

35000000

40000000

45000000

1

11

21

31

41

51

61

71

81

91

10

1

11

1

12

1

VtT

REAL

REGRESION

ML

[83]


Entrenamiento

Pronostico

Ilustración 27: Tendencia Lineal Entrenamiento-Pronostico del Avaluó Fuente: Excel 2010

Para finalizar esta interpretación, tenemos la variable posiblemente más importante de todas “Avalúo” es nuestra variable dependiente

final y la que nos determina si el algoritmo es válido o no; acordémonos que la variable Avalúo no es más que las sumas de predios

parciales tanto del valor total del terreno, como el valor total de la construcción sumándose entre sí para llegar a este valor.

Ilustrándose mejor nos damos cuenta que el diagrama entrenamiento, percibe que los valores del Modelo Lineal tienden a fusionarse

con el Valor Real y por consiguiente el valor más atípico seria el Modelo de Regresión. Observen que los valores de estas dos rectas

suelen a resultar valores entre $ 80’175.000 y $ 80’195.000 dando esta variación en el dato 181; sucede lo mismo con la Línea Verde

solo que para este ejercicio los valores están desde $ 78’331.000 y aumentan en el mismo dato hasta $ 80’742.000 obteniendo así

como el resultado más próximo el Modelo Lineal. Pero en vista del grafico pronostico, los papeles se alteran dando así razón al

Modelo de Regresión; mientras que la Línea Roja y Verde comparten el mismo dato en $ 80’000.000, mientras la Línea Azul proyecta

un valor muy abajo a $ 19’000.000 reafirmando las anteriores teorías.

77000000

77500000

78000000

78500000

79000000

79500000

80000000

80500000

810000001

21

41

61

81

10

11

21

14

11

61

18

12

01

22

12

41

AVALÚO

REAL

REGRESION

ML

0

10000000

20000000

30000000

40000000

50000000

60000000

70000000

80000000

90000000

1

10

19

28

37

46

55

64

73

82

91

10

0

10

9

AVALÚO

REAL

REGRESION

ML

[84]

10.6.2 TABLA RESUMEN UPZ GRANJAS DE TECHO ZHF 6222115153113

Tabla 21: Valores Mínimo-Máximo-Promedio UPZ Granjas de Techo ZHF 6222115153113

Vm

2C

VALOR MÍNIMO VALOR MÁXIMO VALOR PROMEDIO

ENTRENAMIENTO PRONOSTICO ENTRENAMIENTO PRONOSTICO ENTRENAMIENTO PRONOSTICO

REAL $ 749.950 $ 752.057 $ 753.080 $ 753.075 $ 751.037 $ 752.122

REGRESIÓN $ 750.590 $ 753.257 $ 753.260 $ 753.257 $ 751.241 $ 753.257

ML $ 750.339 $ 113.439 $ 753.113 $ 113.518 $ 751.036 $ 113.481

Vm

2T



REAL $ 1.000.000 $ 1.000.000 $ 1.000.000 $ 1.000.000 $ 1.000.000 $ 1.000.000

REGRESIÓN $ 996.040 $ 1.006.963 $ 1.011.000 $ 1.012.833 $ 1.001.572 $ 1.010.620

ML $ 1.000.000 $ 0 $ 1.000.000 $ 0 $ 1.000.000 $ 0

VtC



REAL $ 38.315.000 $ 38.422.614 $ 38.475.000 $ 38.474.611 $ 38.370.610 $ 38.425.915

REGRESIÓN $ 38.312.000 $ 38.393.197 $ 38.493.000 $ 38.410.875 $ 38.364.504 $ 38.395.369

ML $ 38.315.078 $ 53.463.763 $ 38.474.611 $ 53.536.115 $ 38.370.420 $ 53.468.356

VtT



REAL $ 41.800.000 $ 41.900.000 $ 41.900.000 $ 41.970.000 $ 41.862.764 $ 41.965.556

REGRESIÓN $ 41.513.000 $ 41.436.040 $ 42.222.000 $ 42.217.313 $ 41.861.337 $ 41.793.657

ML $ 41.847.909 $ 2.286.920 $ 41.902.530 $ 2.292.377 $ 41.862.764 $ 2.289.444

AV

AL

ÚO



REAL $ 80.175.000 $ 80.374.611 $ 80.392.614 $ 80.392.614 $ 80.241.948 $ 80.391.340

REGRESIÓN $ 78.331.000 $ 80.649.970 $ 80.742.000 $ 80.661.370 $ 79.022.023 $ 80.656.095

ML $ 80.174.519 $ 18.267.141 $ 80.392.604 $ 18.285.132 $ 80.241.769 $ 18.283.858

Fuente: Excel 2010

[85]

Los errores suelen ser bastante demostrativos en cualquier tema de aproximaciones; me refiero a

que pueden ser útiles para verificar la confiabilidad que existe entre un modelo diseñado

específicamente para solucionar un problema específico, como un conjunto de información de

manera circunstancial para poder verificar que tan veraz es este modelo implementado a una BD.

Estas palabras introductorias, nos dará a entender mejor que se necesita comprobar lo que se ha

propuesto y que mejor forma de visualizarlo que con la Tabla 21.

Antes que nada, se observa que la Tabla 21 posee los resultados de los gráficos mostrados

anteriormente; los cuales se muestra los valores tanto mínimos máximos y promedios que

resultaron tanto del valor de referencia Valor Real como los las soluciones de los modelos

aplicados a estos datos MRL y MRNL. Para las 5 variables procesadas Vm2C-Vm2T-VtC-VtT-

Avalúo Catastral se observa que aparte de tener las celdas de los temas ya mencionados,

visualizamos las columnas Entrenamiento y Pronostico; solo que para este caso, se entenderá

mucho mejor los gráficos mediante valores numéricos.

Examinemos detenidamente las variable Vm2C y Vm2T; si notamos el valor mínimo, máximo y

promedio tanto de la fila Real como de la fila ML en las columna Entrenamiento, forjamos que

estos dos casos son prácticamente similares en cambio, con la fila de Regresión, no ocurre de

igual manera. Este tipo de error aunque no es muy grande a simple vista nos infiere decir que el

modelo con el cual se proyecta mejor los resultados seria el ML por lo que no habría necesidad

de crear un modelo alternativo para solucionar este tipo de paradigma; pero como para este

supuesto no solo se tomó el total de los datos sino los subdividimos en dos “reiterando

Entrenamiento-Pronostico” se evalúa este tipo de modelos con los datos sobrantes a esta clase

de clasificación (Teniendo en cuenta que los datos se escogieron aleatoriamente) con la columna

pronostico; en esta situación cambia drásticamente las soluciones dándonos a entender que los

valores que más se asimilan a la solución anhelada vendría siendo la fila Regresión y no ML.

Así sucede con las demás variables; para no alargar más el tema nótese que los valores de

Entrenamiento para todos las columnas Valor Mínimo, Valor Máximo y Valor Promedio; las filas

Real y ML son casi idénticas, inclusive hasta para las variables VtC-VtT-Avalúo Catastral

manejando cifras por encima de los 7 dígitos poseen un error de diferencia bastante pequeño;

pero para la fila Regresión es todo lo contrario. Ahora para la última mencionada, obtenemos

errores fáciles de detectar inclusive la variable Avalúo Catastral, hay una desigualdad de

aproximadamente $ 1’200.000 entre la fila Real y la fila Regresión. Ahora para determina que el

MRNL es más efectivo que el ML, nos fijaremos en la columna Pronostico y para que den mejor

percepción de esta idea verifiquemos la variable final “Avalúo Catastral” la cual si fijamos bien

entre la fila Real y la fila ML existe una gran diferencia entre ellas de aproximadamente $

62’000.000 superando por encima al erro trazado entre Real-Regresión que se había calculado

antes.

[86]

10.6.3 CUADRO DE ERRORES E-P DEL MRNL Y ML

Tabla 22: Cuadro resumen de errores MAPE UPZ Bolivia

UPZ PH/NPH ZHF TIPO ERROR MAPE

ENTRENAMIENTO

ERROR MAPE

PRONOSTICO

ERROR MAPE ENTRENAMIENTO

ML

ERROR MAPE PRONOSTICO

ML

BOLIVIA

PH 5727710152152

AVALÚO 0,00205 0,70651 0,00101 1,0514

Vm2T 0,03713 0,14389 0 0,8475

Vm2C 0,06906 0,21400 0,00487 3,6031

VtT 0,09816 0,30007 0,00445 4,2830

VtC 0,01760 0,27980 0,00017 12,9481

PH 5727715153103

AVALÚO 0,01835 0,23518 0,00224 1,1139

Vm2T 0,05920 0,18012 0 1,1588

Vm2C 0,08476 0,00671 0,06656 3,7117

VtT 0,06771 0,09810 0,00939 0,2139

VtC 0,12573 0,10958 0,03704 51,8002

PH 6030315153214

AVALÚO 0,02510 0,16413 0,01374 3,3156

Vm2T 0,06829 0,24378 0 1

Vm2C 0,10060 0,08635 0,00821 0,8791

VtT 0,24842 0,03865 0,00203 0,2631

VtC 0,10185 0,11290 0,00466 1,5295

NPH 6212115152113

AVALÚO 0,05977 0,16512 0,08569 0,2714

Vm2T 0,03196 0,38977 0,00214 0,9636

Vm2C 0,20418 0,45409 0,00002 0,8765

VtT 0,38598 0,06732 0,12919 16,7340

VtC 0,14201 0,08485 0,00001 1,7471

NPH 6212115152121

AVALÚO 0,10294 0,15302 0,07220 1,1115

Vm2T 0,20712 0,22911 0,01924 0,6450

Vm2C 0,12373 0,85656 0,00371 1,6872

VtT 0,12985 0,69124 0,14018 0,8345

VtC 0,29678 0,48465 0,00001 2,3268

NPH 6222115152121

AVALÚO 0,15662 0,29737 0,10636 0,7953

Vm2T 0,17191 0,17333 0,01721 1,1692

Vm2C 0,15865 0,13011 0,00997 3,7417

VtT 0,25565 0,20251 0,23458 5,6850

VtC 0,24523 0,54753 0,01166 8,1497

Fuente: Excel 2010

[87]

Tabla 23: Cuadro resumen de errores MAPE UPZ Granjas de Techo

UPZ PH/NPH ZHF TIPO ERROR MAPE

ENTRENAMIENTO

ERROR MAPE

PRONOSTICO

ERROR MAPE ENTRENAMIENTO

ML

ERROR MAPE PRONOSTICO

ML

GRANJAS DE TECHO

PH 6222115153113

AVALÚO 0,01776 0,0033 0 0,7726

Vm2T 0,00319 0,0092 0 1

Vm2C 0,00066 0,0015 0,00055 0,8491

VtT 0,00420 0,0007 0,00068 0,9454

VtC 0,00040 0,0003 0 0,3915

PH 6621110110001

AVALÚO 0,14365 0,2475 0,00226 6,5709

Vm2T 0,01055 0,0112 0 1

Vm2C 0,01087 0,0205 0,00502 0,8071

VtT 0,04835 0,2053 0,00420 2,6072

VtC 0,03357 0,1114 0,00013 0,6258

PH 6621115153114

AVALÚO 0,12602 0,3206 0,00886 0,5695

Vm2T 0,06166 0,2134 0 1

Vm2C 0,02758 0,0908 0,01050 2,1065

VtT 0,11475 0,2837 0,00391 0,6084

VtC 0,12510 0,1610 0,02227 0,1877

NPH 5727710110003

AVALÚO 0,23063 0,2628 0 0,5250

Vm2T 0,26950 0,1317 0 119,8351

Vm2C 0,24531 0,3409 0 342,7780

VtT 0,26671 0,2999 0 0,5694

VtC 0,22789 0,1962 0 530,6751

NPH 6712415141113

AVALÚO 0,16246 0,2429 0,07156 0,5235

Vm2T 0,20130 0,3578 0,03674 2,2635

Vm2C 0,23327 0,3127 0,00001 3,1026

VtT 0,06946 0,6763 0 0,8633

VtC 0,24180 0,5201 0,00918 12,5938

NPH 6712415153433

AVALÚO 0,29064 0,2447 0,01014 0,8630

Vm2T 0,19150 0,4087 0,00701 0,5549

Vm2C 0,20397 0,2411 0 1,6231

VtT 0,37202 0,7435 0,08527 2,0118

VtC 0,22339 0,2344 0,00001 1,7983

Fuente: Excel 2010

[88]

Teniendo en cuenta la Tabla 22 del cuadro de errores, se escogió 6 ZHF de los cuales 3 se

constituyen como propiedades en PH y las restantes como NPH. En esta UPZ conocida como

Bolivia, se seleccionó estas ZHF con la facilidad de encontrar errores MAPE explicados

anteriormente entre usos residenciales. Como nos dimos cuenta en el Marco Teórico Conceptual

cerca del 68% de los predios ubicados en esta UPZ pertenecen al uso residencial por lo que la

comparación entre estas solo se limita al precio de diferencia entre casa y apartamento también

como la cantidad de datos que conforman la ZHF y el área (Terreno y construcción) que

comparten la existencia entre estos mismos.

Si se presta atención a las celdas coloreadas de color gris se entiende que esos valores son los

más pequeños posibles entre su uso; por decirlo de otra forma cada variable diferenciándose

entre PH y NPH comparte solo una cosilla por el cual se encuentra de color diferente a las demás

por ejemplo notemos que la ZHF 5727710152152 de la UPZ Bolivia se encuentran 10 casillas

entre 15 con totalidad de gris y si nos damos cuenta la ZHF 5727715153103 de la misma solo

hay 4 casillas coloreadas; pero lo que no damos por entendido es que están coloreadas de forma

diferente debido a que están clasificando que tan pequeños son los valores de error unos entre

otros y si miran más detenidamente, la ubicación de la coloración gris aparecen en diferente

posición por lo que el MRLN o ML resulto mejor en algunas variables de unas ZHF más

favorables que en otras.

Para la UPZ Bolivia en PH se escogió fácilmente la ZHF 5727710152152 por su mayoría de

errores alcanzados que las otras ZHF del mismo uso, aunque no se cumplió con el objetivo en

las columnas ERROR MAPE PRONOSTICO y ERROR MAPE PRONOSTICO ML.

Aun así, esta ZHF presento mejor sus resultados de errores en el MRNL. Acordemos que los

errores pronóstico en el ML son bastante exagerados y que solo se colocaron por hacer una

comparación de demostrar que el MRNL es mejor. Asimismo para los predios legalizados de

tipo residencial NPH se escogió de la mismo UPZ la ZHF 6212115152113 por tener mayor

número de casillas coloreadas 12/20.

Ahora Examinaremos la Tabla 23 examinando una UPZ muy diferente a la anterior mencionada

conocida como Granjas de Techo. Esta UPZ contiene aproximadamente un porcentaje de uso

tipo residencial de tan solo el 15% y que su mayor denominación prosee un uso tipo industrial

por lo que fue muy difícil encontrar ZHF con este tipo de uso; aun así se encontraron predios

legalizados como PH de tipo residencial. Para esta UPZ, el mejor resultado en PH residencial se

lo lleva la ZHF 6222115153113 con un total de 14/20 casillas coloreadas resaltando como la

UPZ que mejores resultados tuvo en la muestra. En cambio, para la nomenclatura residencial

NPH solo existió una ZHF en particular debido a la escasez de casas de uso residencial que se

presentan allí; la ZHF en NPH de tipo residencial es la 6712415141113 pero la mejor ZHF en

cuanto a los mejores errores fue la 5727710110003 solo que para este caso, el uso es de tipo

comercial-residencial ya que se complementan de uso mixto.

[89]

11. CONCLUSIONES

La estimación de avalúos masivos mediante algoritmos genéticos ha sido de gran ayuda frente a

las diversas herramientas económicas que se han utilizado tradicionalmente; a través de la BD

obtenida por la entidad de la UAECD se ha comprobado que la cantidad de datos suministrados

de esta ha sido bastante exagerada y que para la implementación de esta investigación se ha

tenido que recurrir a diferentes clasificaciones y experimentos para poder llevar a cabo con éxito

nuestro objetivo.

Por otro lado, los modelos tradicionalmente utilizados para estimar avalúos masivos han sido de

gran progreso no solo para garantizar la efectividad con la que tienen al estimar el valor real del

inmueble por zona sino que también nos proporciona efectividad respecto a tiempos y

estimaciones matemáticas de manera remota. Pero a partir de la validación de estos modelos son

difícilmente cuestionados por lo que aplicando inteligencia artificial sea cual sea la índole

Algoritmos Genéticos no solo se tiene una nueva herramienta que promueve el desempeño de la

herramienta sino que nos ayuda a optimizar de manera precisa el resultado deseado en

comparación con los estudios proverbialmente usados en un tiempo anterior. Estos experimentos

se llevaron a cabo gracias a la teoría de algoritmos genéticos que se tiene como herramienta para

facilitar la optimización de resultados de forma probabilística mediante la función óptima

“fitness”. Pautas como Población, Selección, Cruzamiento, Mutación y Estimación (Ajuste de

Betas), ayudan a lograr una mejor exactitud de resultados que a su vez minimiza los máximos

locales que pueda poseer dicho proceso.

Agradeciendo de antemano el software matemático MATLAB al cual no solo se le concede la

facilidad de interactuar y evaluar codificaciones lógicas para la construcción y estructuración del

algoritmo sino que también gracias a su fácil interfaz gráfica, se pudo crear satisfactoriamente

clases u objetos para manejar de mejor forma las pautas que se llevan a cabo en la elaboración

del AG’s; recordando también de que esta consola de programación nos ayudó en cuestiones de

declaraciones de funciones tanto matemáticas como operacionales y que de alguna se facilitó el

hecho de compilarlas como opciones y no directamente como funciones declaradas para el arduo

trabajo de procesarlas junto a las variables de interés.

Finalmente, se pudo comprobar que cuando tomamos muestras de una misma clasificación y la

subdividimos tanto en “Experimentación (66%) y pronostico (33%)” se comprueba de que si

utilizamos la teoría de MRL los datos pueden que al principio sean los mejores estimadores que

pueden desarrollar el problema pero que a la hora de verificar con el restante de la muestra, nos

damos cuenta de que el MRNL fue bastante satisfactorio en desenvolver la incertidumbre que

provoca resolver el problema mediante los modelos de regresión tradicionalmente utilizados y

que nos ayuda a desencriptar ese paradigma con la cual como investigadores estamos

acostumbrados a tratar en nuestro diario vivir.

[90]

12. RECOMENDACIONES FUTURAS

Antes que nada, para este tipo de ejercicios tienes que analizar qué tan viable puede ser tu

proyecto para implementar AG’s ya que esta herramienta no siempre puede ser útil a la hora de

aplicar. Por ejemplo si tu problema tiene en el contexto lógico, un lenguaje que deba utilizar una

toleración hacia los cambios aleatorios; que no lleguen a producir resultados sin sentido o errores

fatales. Una solución posible será definir a los individuos por listas de números donde cada uno

de estos números representa algún aspecto de la solución que se tenga. Para este caso, nuestros

individuos cumple con una función única e independiente de las otras, que ayudara a obtener los

mejores individuos y generaciones posibles y que a la hora de mutar sea de la mejor manera la

mejor validación que se pueda obtener a la hora de calcular un avaluó, esta herramienta puede

aplicarse también a nuestro entorno en cuando a la interpretación de sondeos geoeléctricos en

corriente continua para interpretar curvas de resistencia para sistemas de puestas a tierras

(Wenner, 2007).

Otra de las aplicaciones que podemos encaminar esta herramienta a nuestra carrera es en la parte

de geomatica; usado en la universidad nacional en maestría en geomatica para el “Diseño de

Redes de Muestreo Óptimas para el Monitoreo del Carbono Orgánico del Suelo en el C.I. La

Libertad mediante la Aplicación de Algoritmos Genéticos” diseñado por la M.Sc Alí Marcel

Santacruz Delgado que consiste principalmente en encontrar por medio de muestreo aleatorio

elaborado por algoritmos genéticos; presencia de carbono orgánico utilizando muestras

consistentes por medio de la variabilidad, coberturas vegetales y propiedades del suelo para así

eliminar incertidumbres sesgadas de la misma muestra y centrar mejor por medio de un mapa

geoestadístico la mejor conglomeración de carbono que hay en el Municipio de Villavicencio en

el Centro de Investigación La Libertad (Santacruz Delgado, 2010).

[91]

13. BIBLIOGRAFÍA

Acuña Lozano, M., & Vergara Azabache, V. (2013). DESARROLLO DE UN SISTEMA INTELIGENTE BASADO

EN ALGORITMOS GENETICOS PARA INCREMENTAR LA UTILIDAD PROYECTADA DE LA INVERSION

DE UN USUARIO EN LA BOLSA DE VALORES DE LIMA. Lima: UNIVERSIDAD NACIONAL DE

TRUJILLO.

Arranz de la Peña, J., & Parra Truyol, A. (2014). ALGORIMOS GENÉTICOS. ELCVIA: Electronic letters on

computer vision and image analysis, 8.

Benítez, R., Escudero, G., & Kanaan, S. (2003). Inteligencia Artificial Avanzada. Barcelona: Universitat

Orbeta de Catalunya.

Beyer, H. G., & Schwefel, H. P. (2002). Evolution strategies – A comprehensive introduction. Natural

Computing, 3-52.

Biomatemática, D. d. (Marzo de 2012). Introducción Bioestadistica. Valencia, España.

Bogotá, A. m. (2004). Decreto 326 del 2004. Por medio del cual se reglamenta la Unidad de

Planeamiento Zonal (UPZ) N° 110, Ciudad Salitre Occidental, ubicada en la localidad de

FONTIBON, y se incorpora un sector al tratamiento de Renovación Urbana. Bogotá, Colombia.

Bogotá, A. M. (2012). DINÁMICA DE LA CONSTRUCCIÓN POR USOS LOCALIDAD FONTIBÓN. Recuperado

el 2002, de

http://www.catastrobogota.gov.co/sites/default/files/files/Dinamica_de_la_construccion_por_

usos_Fontibon.pdf

Bogotá, A. M. (2012). DINÁMICA DE LAS CONSTRUCCIÓN POR USOS LOCALIDAD ENGATIVÁ. Recuperado

el 2002, de

http://www.catastrobogota.gov.co/sites/default/files/files/Dinamica_de_la_construccion_por_

usos_Engativa.pdf

Cerrolaza, M., & Annicchiarico, W. (1996). Algoritmos de optimización estructural basados en simulación

genetica. Caracas, Venezuela: Universidad Central de Venezuela.

COLOMBIA, C. D. (4 de Febrero de 2011). Resolucion 70. Por la cual se reglamenta técnicamente la

formación catastral, la actualización de la formación catastral y la conservación catastral.

Bogotá, Cundinamarca, Colombia: Secretaría General de la Alcaldía Mayor de Bogotá D.C. .

Engelbrecht, A. (2007). Computational Intelligence (Segunda ed.). (J. W. LTDA, Ed.) Pretoria, Sudafrica:

Wiley.

[92]

F, A. P. (2004). Modelos de algoritmos geneticos y redes neuronales en la prediccion del signo de

variacion del IPSA. Revista estudios de administracion (Chile), 26.

Fayyad, U. M. (1996). Data Mining KDD. En G. P.-S. U. M. Fayyad, Advances in Knowledge Discovery and

Data Mining (pág. 611). Menlo Park - Carolina: American Association for Artificial Intelligence.

Fogel, D. (2005). Evolutionary Computation. Toward a New Philosophy of Machine. New York: IEEE Press

Series on Coputational Intelligence.

García Jimémez, M., & Álvarez Sierra, A. (2003). Análisis de Datos en WEKA – Pruebas de Selectividad.

España: Universidad Carlos III.

Gómez Morales, A., & Hernández , G. (14 de Septiembre de 2009). Utilización de las máquinas con

vectores de soporte para regresión: m2 de construcción en bogotá. (U. Nacional, Ed.) Avances

en Sistemas e Informática, 6(2), 21-28.

Holland, J. (1989). Classifier Systems and Genetic Algorithms. Míchigan, Estados Unidos.

Lawrence, D. (1985). Applying adaptive algorithms to epistatic domains. Artificial Intelligence IJCAI. 85,

págs. 162-164. New York: IJCAI.

Malpica Velasco, J. A. (2005). Inteligencia Artificial y conciencia. Alcalá: Departamento de Matemáticas

de la UAH.

Marczyk, A. (2004). the geek. Obtenido de http://the-geek.org/docs/algen/

Mitchell, T. M. (1997). Genetic Algorithms. En M. H. Science, Machine Learning (págs. 249-270).

Washington: McGraw Hill Science.

Molina, G., & Rodrigo, M. F. (2009). Modelo de Regresion Lineal Universidad de Valencia. Valencia,

España.

Moscovitz, L. J. (s.f.). Un Modelo Conceptual para el Desarrollo de Árboles de Decisión con Programación

Genética. Fundación Universitaria Konrad Lorenz.

Planeación, S. D. (15 de Marzo de 2014). UPZ 72 Bolivia. Bogotá, Cundinamarca, Colombia.

Puppio, R. P. (1989). Métodos estadísticos aplicados a la valuación de bienes inmuebles. Caracas,

Venezuela.

Rechenberg, I., Zurada, J., & Marks, R. (1994). Computational Intelligence. Colorado : Imitating Life.

Santacruz Delgado, A. M. (2010). Diseño de Redes de Muestreo Óptimas para el Monitoreo del. (I. G.

Codazzi, Ed.) Bogota, Cundinamarca, Colombia: Universidad Nacional de Colombia.

Schaffer, J. D., A. Caruana, R., J. Eshelman, L., & Das, R. (1989). A study of control parameters affecting

online performance of genetic algorithms for function optimization. Proceedings of the third

[93]

international conference on Genetic algorithms (págs. 51-60). San Francisco: Morgan Kaufmann

Publishers Inc.

UNAM. (2006). Apuntes de Inteligencia Artificial. Ciudad de México: Universidad Nacional Autónoma de

México.

Vallejos, S. J. (2006). Minería de Datos. Buenos Aires: Universidad Nacional del Nordeste.

Velasquez H, J. D., Ortiz, D. M., & Jaramillo, P. (11 de Junio de 2011). ESTRATEGIAS EVOLUTIVAS COMO

UNA OPCIÓN PARA LA OPTIMIZACIÓN DE FUNCIONES NO LINEALES CON RESTRICCIONES.

Revista Ingenierías Universidad de Medellín, 10, 9.

Wenner, F. (2007). Interpretacion de Sondeos Geoelectricos en Corriente Continua. Geologia

Universidad salamanca españa, 30-42.

Will, D. (2 de 10 de 2012). Algoritmos Genéticos y Optimización Heurística. Obtenido de

http://www.herrera.unt.edu.ar/gapia/Curso_AG/Curso_AG_08_Clase_5.pdf

Yu, A. (2004 de Diciembre de 8). Computational Intelligence and Knowledge. Computational Intelligence.

Vancouver, Canada: University of British Columbia.

[94]

ANEXOS A: CUADROS RESUMENES DE LAS UPZ BOLIVIA Y GRANJAS DE

TECHO SEGÚN CODIGO DE SECTOR

[99]

ANEXOS B: CUADROS RESUMENES DE LAS UPZ BOLIVIA Y GRANJAS DE

TECHO SEGÚN CODIGO DE USO

[104]

ANEXOS C: CUADROS RESUMENES DE LAS UPZ BOLIVIA Y GRANJAS DE

TECHO SEGÚN ZHF

[105]

ANEXOS D: CUADROS RESUMENES DE LAS UPZ BOLIVIA Y GRANJAS DE

TECHO SEGÚN ZHF-AVALÚOS

[114]

ANEXOS E: GRAFICOS UPZ BOLIVIA Y GRANJAS DE TECHO SEGÚN ZHF-USOS

[115]

UPZ BOLIVIA

NPH

6212115152113

ENTRENAMIENTO

0

2000000000

4000000000

6000000000

8000000000

1

28

55

82

10

9

Vm2C

REAL

REGRESION

ML

0

500000

1000000

1500000

2000000

1

23

45

67

89

11

1

Vm2T

REAL

REGRESION

ML

0

200000000000

400000000000

600000000000

800000000000

1

34

67

10

0

VtC

REAL

REGRESION

ML

0

50000000

100000000

150000000

1

28

55

82

10

9

VtT

REAL

REGRESION

ML

0

500000000

1000000000

1500000000

1

29

57

85

11

3

AVALÚO

REAL

REGRESION

ML

[116]

UPZ BOLIVIA

NPH

6212115152113

PRONOSTICO

-2.000.000

-1.500.000

-1.000.000

-500.000

000

500.000

1.000.000

1.500.000

1 112131415161

Vm2C

REAL

REGRESION

ML

0

500000

1000000

1500000

1 10192837465564

Vm2T

REAL

REGRESION

ML

-1E+08

0

100000000

200000000

300000000

400000000

500000000

600000000

1 112131415161

VtC

REAL

REGRESION

ML

0

200000000

400000000

600000000

800000000

1E+09

1,2E+09

1 112131415161

VtT

REAL

REGRESION

ML

0

50000000

100000000

150000000

200000000

1 101928374655

AVALÚO

REAL

REGRESION

ML

[117]

UPZ BOLIVIA

PH

5727710152152

ENTRENAMIENTO

0

200000

400000

600000

800000

1000000

1200000

1

23

45

67

89

11

1

Vm2C

REAL

REGRESION

ML

850000

900000

950000

1000000

1050000

1100000

1

23

45

67

89

11

1

Vm2T

REAL

REGRESION

ML

0

20000000

40000000

60000000

80000000

1

23

45

67

89

11

1

VtC

REAL

REGRESION

ML

0

20000000

40000000

60000000

1

23

45

67

89

11

1

VtT

REAL

REGRESION

ML0

100000000

200000000

300000000

400000000

1

29

57

85

11

3

AVALÚO

ML

REGRESION

REAL

[118]

UPZ BOLIVIA

PH

5727710152152

PRONOSTICO

0

200000

400000

600000

800000

1000000

1 10192837465564

Vm2C

REAL

REGRESION

ML

0

200000

400000

600000

800000

1000000

1200000

1 10192837465564

Vm2T

REAL

REGRESION

ML

-30000000

-25000000

-20000000

-15000000

-10000000

-5000000

0

5000000

1 112131415161

VtC

REAL

REGRESION

ML

-30000000

-20000000

-10000000

0

10000000

20000000

1 112131415161

VtT

REAL

REGRESION

ML

-50000000

0

50000000

100000000

150000000

200000000

250000000

1 101928374655

AVALÚO

ML

REGRESION

REAL

[119]

UPZ GRANJAS DE TECHO

NPH

5727710110003

ENTRENAMIENTO

0

5000000000

10000000000

15000000000

20000000000

25000000000

1 2 3 4 5 6 7

Vm2C

ML

REGRESION

REAL

0

5000000000

10000000000

15000000000

1 2 3 4 5 6 7

Vm2T

ML

REGRESION

REAL

0

20000000000000

40000000000000

60000000000000

80000000000000

1 2 3 4 5 6 7

VtC

ML

REGRESION

REAL

0

5000000000000

10000000000000

15000000000000

20000000000000

25000000000000

30000000000000

1 2 3 4 5 6 7

VtT

ML

REGRESION

REAL

0

5000000000

10000000000

15000000000

20000000000

1 2 3 4 5 6 7

AVALÚO

ML

REGRESION

REAL

[120]


NPH

5727710110003

PRONOSTICO

-50000000

0

50000000

100000000

150000000

1 2 3

Vm2C

ML

REGRESION

REAL

-150000000

-100000000

-50000000

0

50000000

1 2 3

Vm2T

ML

REGRESION

REAL

-40000000000

-30000000000

-20000000000

-10000000000

0

10000000000

1 2 3

VtC

ML

REGRESION

REAL

0

20000000000

40000000000

60000000000

80000000000

100000000000

120000000000

1 2 3

VtT

ML

REGRESION

REAL

0

20000000000

40000000000

60000000000

80000000000

100000000000

120000000000

1 2 3

AVALÚO

ML

REGRESION

REAL

[121]


PH

6222115153113

ENTRENAMIENTO

748000

749000

750000

751000

752000

753000

754000

1

37

73

10

9

14

5

18

1

21

7

Vm2C

REAL

REGRESION

ML

985000

990000

995000

1000000

1005000

1010000

1015000

1

42

83

12

4

16

5

20

6

Vm2T

REAL

REGRESION

ML

38200000

38250000

38300000

38350000

38400000

38450000

38500000

38550000

1

42

83

12

4

16

5

20

6

VtC

REAL

REGRESION

ML

0

50000000

100000000

150000000

1

51

10

1

15

1

20

1

VtT

ML

REGRESION

REAL

77000000

78000000

79000000

80000000

81000000

1

45

89

13

3

17

7

22

1

AVALÚO

REAL

REGRESION

ML

[122]


PH

6222115153113

PRONOSTICO

0

200000

400000

600000

800000

1

19

37

55

73

91

10

9

Vm2C

REAL

REGRESION

ML

0

200000

400000

600000

800000

1000000

1200000

1

22

43

64

85

10

6

Vm2T

REAL

REGRESION

ML

0

10000000

20000000

30000000

40000000

50000000

60000000

1

22

43

64

85

10

6

VtC

REAL

REGRESION

ML

0

10000000

20000000

30000000

40000000

50000000

1

22

43

64

85

10

6

VtT

REAL

REGRESION

ML

0

20000000

40000000

60000000

80000000

100000000

1

24

47

70

93

AVALÚO

REAL

REGRESION

ML

estimaciÓn de avaluos masivos mediante...

Documents