estimaciÓn de avaluos masivos mediante...
TRANSCRIPT
ESTIMACIÓN DE AVALUOS MASIVOS MEDIANTE INTELIGENCIA ARTIFICIAL
APLICANDO LAS HERRAMIENTAS DE ALGORITMOS GENETICOS EN LAS UPZ
BOLIVIA Y GRANJAS DE TECHO CON VIGENCIA EN EL AÑO 2015
JUAN SEBASTIAN NIETO ARANGUREN
CODIGO: 20092025055
UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS
FACULTAD DE INGENIERÍA
INGENIERÍA CATASTRAL Y GEODESIA
BOGOTÁ D.C.
2016
ESTIMACIÓN DE AVALUOS MASIVOS MEDIANTE INTELIGENCIA ARTIFICIAL
APLICANDO LAS HERRAMIENTAS DE ALGORITMOS GENETICOS EN LAS UPZ
BOLIVIA Y GRANJAS DE TECHO CON VIGENCIA EN EL AÑO 2015
JUAN SEBASTAN NIETO ARANGUREN
20092025055
Trabajo de grado mediante la modalidad de monografía
EDWIN ROBERT PEREZ CARVAJAL
UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS
FACULTAD DE INGENIERÍA
INGENIERÍA CATASTRAL Y GEODESIA
BOGOTÁ D.C.
2016
[3]
NOTA DE ACEPTACIÓN Y OBSERVACIÓN
____________________________________________________________________________
____________________________________________________________________________
____________________________________________________________________________
_________________________________________________________________________
____________________________________________________________________________
____________________________________________________________________________
____________________________________________________________________________
_________________________________________________________________________
PRESIDENTE O DIRECTOR
_____________________________________
REVISOR O JURADO
_____________________________________
ESTUDIANTE O AUTOR
_____________________________________
[4]
DEDICATORIA
Esta tesis se la dedico a mi Dios quién supo guiarme por el buen camino, darme fuerzas para
seguir adelante y no desmayar en los problemas que se presentaban, enseñándome a encarar las
adversidades sin perder nunca la dignidad ni desfallecer en el intento.
A mi familia quienes por ellos soy lo que soy. Para mis padres por su apoyo, consejos,
comprensión, amor, ayuda en los momentos difíciles, y por ayudarme con los recursos
necesarios para estudiar. Me han dado todo lo que soy como persona, mis valores, mis
principios, mi carácter, mi empeño, mi perseverancia, mi coraje para conseguir mis objetivos.
A mi hermana y tía por estar siempre presentes, acompañándome para poderme realizar tanto
en los momentos duros como los momentos felices. A mis compañeros y profesores tanto tutores
como participes en mi formación profesional que siempre me he encomendado mi conocimiento
en sus manos.
[5]
CONTENIDO
INDICE DE ILUSTRACIONES .................................................................................................................. 7
ÍNDICE DE TABLAS .................................................................................................................................. 8
ÍNDICE DE ECUACIONES ........................................................................................................................ 9
1. INTRODUCCIÓN .............................................................................................................................. 10
2. ANTECEDENTES .............................................................................................................................. 11
3. OBJETIVOS ....................................................................................................................................... 12
3.1 OBJETIVO GENERAL ...................................................................................................................... 12
3.2 OBJETIVOS ESPECÍFICOS .............................................................................................................. 12
4. PLANTEAMIENTO DEL PROBLEMA ............................................................................................ 12
5. JUSTIFICACIÓN ............................................................................................................................... 13
6. MARCO TEÓRICO CONCEPTUAL ................................................................................................ 14
6.1 INTRODUCCIÓN ACERCA DE LA INTELIGENCIA ARTIFICIAL ............................................. 14
6.1.1. ALGORITMOS GENETICOS ........................................................................................... 16
6.1.2 PROGAMACIÓN GENÉTICA .......................................................................................... 21
6.1.3 ESTRATEGIAS EVOLUTIVAS ....................................................................................... 23
6.1.4 PARADIGMAS DE LA COMPUTACIÓN EVOLUTIVA ............................................... 24
6.1.5 VENTAJAS DE LAS TÉCNICAS ..................................................................................... 25
6.2 AVALÚOS .......................................................................................................................................... 26
7. MARCO ESPACIAL .......................................................................................................................... 29
7.1 UPZ 72 BOLIVIA ............................................................................................................................... 30
7.2 UPZ 112 GRANJAS DE TECHO ....................................................................................................... 34
8. MARCO TEMPORAL ........................................................................................................................ 38
9. METODOLOGIA ............................................................................................................................... 38
9.1 FASES: ................................................................................................................................................ 40
9.2 INFORMACION ................................................................................................................................. 43
9.3 ANÁLISIS EXPLORATORIO DE DATOS ...................................................................................... 43
9.4 SOFTWARE ....................................................................................................................................... 43
10. DESARROLLO DE LA PROPUESTA .............................................................................................. 44
10.1 DATOS ............................................................................................................................................. 44
10.2 VARIABLES .................................................................................................................................... 44
[6]
10.3 ARQUITECTURA DEL PROGRAMA ............................................................................................. 48
10.3.1 DESCRIPCIÓN DEL PROGRAMA .................................................................................. 48
10.3.2 REQUISITOS PARA EL PROGRAMA ............................................................................ 50
10.3.3 VISTA LOGICA DEL PROGRAMA ..................................................................................... 51
10.3.4 PARAMETROS DEL PROGRAMA ...................................................................................... 52
10.4 BITACORA EXPERIMENTAL ................................................................................................. 57
10.5 RESULTADOS ........................................................................................................................... 60
10.6 ANÁLISIS DE RESULTADOS ................................................................................................. 73
10.6.1 GRAFICO DE TENDENCIA LINEAL.............................................................................. 78
10.6.2 TABLA RESUMEN UPZ GRANJAS DE TECHO ZHF 6222115153113 ........................ 84
10.6.3 CUADRO DE ERRORES E-P DEL MRNL Y ML ............................................................ 86
11. CONCLUSIONES .............................................................................................................................. 89
12. RECOMENDACIONES FUTURAS .................................................................................................. 90
13. BIBLIOGRAFÍA ................................................................................................................................ 91
ANEXOS A: CUADROS RESUMENES DE LAS UPZ BOLIVIA Y GRANJAS DE TECHO SEGÚN
CODIGO DE SECTOR .............................................................................................................................. 94
ANEXOS B: CUADROS RESUMENES DE LAS UPZ BOLIVIA Y GRANJAS DE TECHO SEGÚN
CODIGO DE USO ...................................................................................................................................... 99
ANEXOS C: CUADROS RESUMENES DE LAS UPZ BOLIVIA Y GRANJAS DE TECHO SEGÚN
ZHF 104
ANEXOS D: CUADROS RESUMENES DE LAS UPZ BOLIVIA Y GRANJAS DE TECHO SEGÚN
ZHF-AVALÚOS....................................................................................................................................... 105
ANEXOS E: GRAFICOS UPZ BOLIVIA Y GRANJAS DE TECHO SEGÚN ZHF-USOS ................. 114
[7]
INDICE DE ILUSTRACIONES
Ilustración 1: Pseudocódigo Algoritmo Genético Simple 21
Ilustración 2: Diagrama de árbol representación matemática 23
Ilustración 3: Diagrama de pastel con sus respectivos porcentajes de uso del suelo en la UPZ Bolivia 31
Ilustración 4: Imagen UPZ 72 Bolivia 33
Ilustración 5: Diagrama de pastel con sus respectivos porcentajes de uso del suelo en la UPZ Granjas de Techo 35
Ilustración 6: Imagen UPZ 112 Granjas de Techo 37
Ilustración 7: Diagrama general básico de algoritmo genético 38
Ilustración 8: Flujograma de algoritmos genéticos para hallar el óptimo valor de un avaluó con vigencia actual 39
Ilustración 9: Diagrama de flujo con los posibles pasos del algoritmo genético canónico y sus fases 40
Ilustración 10: Diagrama de flujo con los posibles pasos de programación genética y sus fases 41
Ilustración 11: Diagrama de flujo con los posibles pasos de estrategias evolutivas y sus fases 42
Ilustración 12: Ejemplo de recombinación de parámetros para la etapa de curce 42
Ilustración 14: Cuadro comparativo de todos las variables posibles en la regresión 47
Ilustración 15: Variables tomadas de la BD de Catastro con significancia nula en la regresión 48
Ilustración 16: Base de datos de la UAECD con sus variables dependientes (clases) e independientes (atributos) 51
Ilustración 17: Flujograma del programa explicando paso a paso cada proceso con sus respectivas funciones 51
Ilustración 18: Base de datos en Excel donde se guardara en Matlab VCONS 57
Ilustración 19: BD .mat almacenada y exportada desde el software conocido como interfaz 58
Ilustración 20: Ventana flotante recopilando las mejores regresiones para la clasificación deseada 58
Ilustración 21: Tabla final con los errores de cada regresión, la solución de la regresión y el parámetro fijado 59
Ilustración 22: Regresión obtenida del programa guardado en consola “Command Window” 59
Ilustración 23: Componentes de una ZHF Urbana (COLOMBIA, 2011) 67
Ilustración 24: Tendencia Lineal Entrenamiento-Pronostico del Vm2C 79
Ilustración 25: Tendencia Lineal Entrenamiento-Pronostico del VtC 80
Ilustración 26: Tendencia Lineal Entrenamiento-Pronostico del Vm2T 81
Ilustración 27: Tendencia Lineal Entrenamiento-Pronostico del VtT 82
Ilustración 28: Tendencia Lineal Entrenamiento-Pronostico del Avaluó 83
[8]
ÍNDICE DE TABLAS
Tabla 1: Barrios por localidad Engativá 30
Tabla 2: Normas Urbanísticas de la UPZ 72 Bolivia 32
Tabla 3: Barrios por localidad Fontibón 34
Tabla 4: Normas Urbanísticas de la UPZ 112 Granjas de Techo 36
Tabla 5: Descripción de las variables independientes para la solución a las regresiones 45
Tabla 6: Descripción de las variables dependientes o resultados de las regresiones 46
Tabla 7: Requisitos físicos del software AG 50
Tabla 8: Cuadro resumen según Código de Sector UPZ Bolivia 61
Tabla 9: Cuadro resumen según Código de Sector UPZ Granjas de Techo 62
Tabla 10: Tabla 11: Cuadro resumen según Código de Uso UPZ Bolivia 63
Tabla 12: Cuadro resumen según Código de Uso UPZ Granjas de Techo 64
Tabla 13: Cuadro resumen según ZHF UPZ Bolivia 65
Tabla 14: Cuadro resumen según ZHF UPZ Granjas de Techo 66
Tabla 15: Cuadro resumen según ZHF E-P UPZ Bolivia 68
Tabla 16: Cuadro resumen según ZHF E-P UPZ Granjas de Techo 69
Tabla 17: Cuadro resumen de la UPZ Bolivia ZHF_MRL 71
Tabla 18: Cuadro resumen de la UPZ Granjas de techo ZHF_MRL 72
Tabla 19: Errores estimados de la UPZ Bolivia 76
Tabla 20: Errores estimados de la UPZ Granjas de Techo 77
Tabla 21: Valores Mínimo-Máximo-Promedio UPZ Granjas de Techo ZHF 6222115153113 84
Tabla 22: Cuadro resumen de errores MAPE UPZ Bolivia 86
Tabla 23: Cuadro resumen de errores MAPE UPZ Granjas de Techo 87
[9]
ÍNDICE DE ECUACIONES
Ecuación 1: Modelo para calcular el avalúo por método de costo de reposición 28
Ecuación 2: Calculo del avalúo catastral 29
Ecuación 3: Calculo del avalúo Catastral con componentes finales 29
Ecuación 4: Error Absoluto hallada en la regresión obtenida 53
Ecuación 5: Error Absoluto en función de la solución del AG sintetizado 53
Ecuación 6: Función fitness para el conjunto de errores hallados en la regresión obtenida 54
Ecuación 7: Regresión obtenida mediante el proceso de selección 54
Ecuación 8: Regresión opcional generada arbitrariamente 54
Ecuación 9: Regresión hibrida o regresión mejorada a partir de la recombinación de ambas partes 54
Ecuación 10: Regresión hibrida con operadores de selección y cruzamiento 55
Ecuación 11: Regresión Mutada Final 56
Ecuación 12: Regresión final mediante Algoritmos Genéticos (AG’s) 56
Ecuación 13: Regresión final con estimadores 56
Ecuación 14: Regresión final con ajuste de betas 60
Ecuación 15: Formula implícita de RAE 73
Ecuación 16: Formula implícita de MAE 74
Ecuación 17: Formula implícita de RRSE 74
Ecuación 18: Formula implícita de RMSE 74
Ecuación 19: Formula implícita de MAPE 75
[10]
1. INTRODUCCIÓN
Actualmente en Bogotá, se ha dado bastante importancia acerca de un factor sumamente
relevante que ha venido incrementando considerablemente y es el precio del suelo. Ya que para
la sociedad es una gran necesidad poder participar en el uso del suelo sea para vivienda,
comercio, industrial, educacional, entre otros tipos de actividades del uso del suelo; es vital saber
cómo se origina este tipo de variable y como se valúa monetariamente frente a otros suelos
pertenecientes a estas.
Se establece como punto de referencia geográfica una UPZ la cual limitara el estudio sobre el
valor del suelo, principalmente se escogerá una UPZ debido a que contiene una cantidad
considerable de predios a avaluar y que nos facilita el trabajo al momento de sugerir
información. A partir de la información suministrada de la UPZ se procederá a calcular el valor
comercial que contiene cada uno de los predios para así estimar un avaluó en general de todos
los inmuebles.
El principal motivo de esta investigación es comparar avalúos obtenidos de la entidad UAECD
frente a avalúos resultantes por medio de algoritmos genéticos. La idea es crear una serie de
procedimientos matemáticos que ayuden a optimizar datos para aproximarnos más al resultado
deseado queriendo hacer métodos alternativos a los ya impuestos por dicha entidad.
Pero como se entiende que para estimar un avaluó masivo se necesita tener dos tipos de
informaciones tanto física como económica “ZHF y ZHGE” para esta investigación se basara
únicamente en las ZHGE ya que con los datos numéricos de los avalúos independientes, se sabrá
la estimación que este tendrá sobre la aglomeración de precios del suelo.
Es de vital importancia señalar que este tipo de procedimiento requiere cierto conocimiento
lógico; por ende se pretende adquirir un estudio sobre las pautas generales en las cuales un
algoritmo genético debe de pasar. Se detallara más adelante cada instrucción de manera ordenada
como debe de comportarse los datos frente a los procedimientos como Selección, Cruce y
Mutación que son los pilares más importantes a la hora de implementar un algoritmo genérico.
[11]
2. ANTECEDENTES
Se ha evidenciado bastante trabajo con respecto a inteligencia artificial y con mayor precisión en
cuanto a redes neuronales. Según un estudio que se elaboró en Estados Unidos en el estado de
Carolina del Norte; para lograr un avaluó inmobiliario como allá se denomina, se propuso una
estimación diferente al modelo de regresión múltiple para determinar el avaluó de 191 viviendas
resueltas por medio del método de comparación de mercado tradicional (Puppio, 1989). Como
conclusión al que llego este profesor fue que es mucho más factible solucionar un conjunto de
avalúos por método de RNA Redes Neuronales Artificiales que por estimación de regresión
múltiple. Aun así, se tiene que tener en cuenta algunas variables como Edad, Área, Vetustez,
para analizar alguna significancia mediante estadística inferencial.
Por otro lado, se han establecido para cualquier tipo de aplicación algoritmos genéticos de los
cuales en la mayoría de los casos ha tenido resultados esperados y los cuales, han evolucionado
la manera de resolver cualquier tipo de problemas cotidianos. En la universidad de Chile,
analizan el comportamiento mediante redes neuronales artificiales RNA y algoritmos genéticos
AG’s y crean modelos multivariados dinámicos para determinar la variación de signo en la IPSA
Índice de Precio de Selección de Acciones (F, 2004). Dando así como resultado una comparación
de ambas técnicas como óptimas en el desarrollo de este artículo; Mientras las redes neuronales
facilitaron las cosas con respectos a la variación de los datos en un determinado tiempo, los
algoritmos genéticos toman como mejor resultado a que la variación del signo depende
esencialmente de variables como la inversión y capacidad de rentabilidad.
También, se ha indagado mucho con el tema del valor del metro cuadrado que posee un predio
en Bogotá; ya que estiman una mejor exactitud y precisión de los datos resultantes usando
método de kernels y RNA que manejando este tipo de situaciones mediante modelos
econométricos (Gómez Morales & Hernández , 2009). Aunque mostraría una alta capacidad
explicativa no ofrecía la precisión de estimación deseada, mientras que con RNA si se obtuvo
una precisión adecuada en el valor del metro cuadrado de construcción. Para complementar el
resultado de las RNA, se estableció como ya se había mencionado el método de kernels mediante
maquinas con vectores de soporte que vendrían siendo técnicas de clasificación en las que los
datos de entrada son transformados implícitamente a un espacio nuevo. Al final se analizó y
comparo mediante una correlación los resultados obtenidos de metro cuadrado por RNA y esta
misma variable por el método de kernels al cual se concluyó que ambos modelos eran factibles
para solucionar el problema planteado.
Para finalizar este ítem, se creó una tesis en lima de la universidad nacional de Trujillo trata
sobre la aplicación de dos algoritmos de búsqueda a la selección de individuos óptimos en la
población inicial de un algoritmo genético, y la consiguiente comparación entre ambos. El
primero de ellos es el algoritmo meta-heurístico grasp, y el segundo es el algoritmo cuántico de
crover. El algoritmo cuántico de crover forma parte de una nueva generación en la ciencia de la
[12]
computación: La computación cuántica. Por tanto hace uso de conceptos matemáticos y físicos
completamente distintos a los usados en la programación clásica (Acuña Lozano & Vergara
Azabache, 2013).
3. OBJETIVOS
3.1 OBJETIVO GENERAL
Verificar la validez del uso de herramientas de algoritmos genéticos para estimar avalúos
masivos en las UPZ de Bolivia y Granjas de Techo en la ciudad de Bogotá durante la
vigencia 2015.
3.2 OBJETIVOS ESPECÍFICOS
Confrontar los resultados de los algoritmos genéticos con los modelos de regresión
tradicionalmente utilizados.
Generar un código en Matlab que permita la implementación de algoritmos genéticos en
valuación masiva.
Implementar el modelo propuesto en las UPZ 72 Bolivia y 112 Granjas de Techo.
4. PLANTEAMIENTO DEL PROBLEMA
Preguntas surgen como ¿no habrá otro procedimiento para poder mirar el comportamiento de
esta abundancia de precios diferente a una regresión lineal que cumple con dar un resultado pero
al mismo tiempo no es el más adecuado para solucionar este tipo de aplicaciones? ¿Existirá
diferentes pautas para poder llegar con exactitud al resultado deseado? ¿Qué otras herramientas
básicas podemos identificar para poder alcanzar el propósito de algún inconveniente diario? Aquí
es donde uno comienza a examinar que el paradigma al que uno se enfrenta en la vida no es más
que un modelamiento de ideas de simple solución. En algunos casos el problema yace de ciertas
dificultades debido a su complejidad de incógnitas pero que al mismo tiempo la lógica humana
es tan grandiosa que ante cualquier adversidad puede solucionarse de manera efectiva. He aquí
donde se empezara a mirar un problema al que una población está enfrentando de manera
rutinaria y que hoy por hoy es de suma importancia para la necesidad humana y es el precio del
suelo.
[13]
Recientemente, la gente se ha puesto a pensar cómo se obtiene realmente el precio del suelo al
cual estamos destinados a interactuar desde que nacemos y que es de gran importancia para el
desarrollo del territorio. Objetivamente se ha indagado sobre esos factores que hacen que el suelo
cada vez más este aumentando de valor y también la razón primordial a que cada persona tiende
a acaparar este bien a desear.
Pero el desconocimiento que hay sobre estos estudios cada vez obliga más a investigar por medio
del avance tecnológico a facilitarnos cada día el asunto del avaluó; existen muchos métodos de
hallar un avaluó las que son confiables por expertos profesionales pero la dificultad fundamental
yace del que cuando se tiene una muestra a gran escala, no sabemos organizar muy bien todos
esos datos y lo que realmente se logra es linealizar estos datos de tal manera que solo se recurre a
este proceso para lograr solucionar un estudio masivo.
5. JUSTIFICACIÓN
En una ciudad como Bogotá que ha estado creciendo exponencialmente durante los últimos años,
ha venido a sufrir diferentes cambios en cuanto a la concepción territorial. Cada vez el terreno,
suelo, tierra es más apetecida debió a la gran carencia que tiene este fenómeno con relación a
beneficios económicos a los que estamos acostumbrados a vivir en el presente. Una de las
razones más importantes para darle importancia a este impacto es porque podemos mejorar el
proceso mediante el cual se evalúa un predio y se puede comparar frente a una inteligencia
básica capaz de resolver problemas de cotidianidad en este caso el precio del suelo.
La ignorancia de estas herramientas como inteligencia artificial y todos los tipos de
conocimientos basados en la lógica en este caso aritmética nos pueden ayudar a optimizar este
tipo de situaciones; la intención de estos instrumentos de conocimiento es empezar a utilizarlas
para satisfacer sesgos que se tienen sobre el cálculo masivo de una UPZ de una manera más
subjetiva y de un mejor entendimiento para así crear un estudio diferente al que se ha venido
manejando como linealizar los datos. Cabe recalcar que la finalidad de este ideal es estructurar
un método diferente al de parametrizar de manera lineal los datos para así poder obtener
información extrapolarizada de forma efectiva.
Para finalizar, la mejor manera de verificar si la investigación va de manera correcta con el
propósito a fin que es comparar los resultados arrojados de la solución del problema junto con
los datos obtenidos por la UAECD y analizar qué tan relevantes se comportan cada uno; de ahí
optaremos por elegir el mejor modelo para dar como fin a la investigación planteada.
[14]
6. MARCO TEÓRICO CONCEPTUAL
6.1 INTRODUCCIÓN ACERCA DE LA INTELIGENCIA ARTIFICIAL
La Inteligencia Artificial (IA) es la rama de las Ciencias de la Computación que estudia el
software y hardware necesarios para simular el comportamiento y comprensión humanos. El
objetivo último de la IA es simular la inteligencia humana en una máquina creando robots que
sean conscientes y con sentimientos reales, similares a los humanos. Uno de los problemas más
difíciles es la simulación de la conciencia, cualidad humana que hace que nos demos cuenta de
nuestra propia existencia (Malpica Velasco, 2005).
Con el transcurrir de los tiempos, la tecnología se ha desarrollado de tal modo de que ayuda al
ser humano con tareas de optimización de datos; un gran número de información a veces es útil
para resolver necesidades importantes como también puede ser bastante innecesario recolectar
toda la información obtenida.
Una máquina que llegue a ejecutar una serie de programas, algoritmos, series numéricas, etc. Ya
es en sí un milagro para el desarrollo tecnológico; pero para llegar a ello se necesitó de muchos
años de intentos fallidos, accidentes y bastante tiempo en comenzar con una nueva era. En si
todo este tipo de avance solo puede significar una cosa y es Inteligencia Artificial. Se denomina
este término o como algunos autores lo llaman inteligencia computacional es una ciencia la cual
de manera multidisciplinaria (ciencias naturales básicas) ayudan a solucionar paradigmas
cotidianos que posee la humanidad (Yu, 8).
Por otro lado, en el origen y desarrollo de la IA Inteligencia Artificial confluyeron dos puntos de
vista: el científico, que intenta simular con el computador la verificación de teorías sobre los
mecanismos de la inteligencia; y el de ingeniería, que intenta dar a los computadores capacidades
lo más cercanas posibles a las intelectuales. Para ello los usuarios de AI se han debido enfrentar a
cuestiones nuevas y muy variadas, y al pretender resolverlas ha desarrollado un enorme conjunto
de innovadoras técnicas: representación y modelización del conocimiento, búsqueda heurística,
aprendizaje automático, y técnicas de razonamiento aproximado entre muchas otras. (Moscovitz)
El nacimiento de la Inteligencia Artificial se sitúa en una reunión celebrada en el Dartmouth
College (Hanover, EE.UU) en 1956, en la que se planteó la posibilidad de construir maquinas
inteligentes. Llama la atención que en esa fecha la informática apenas se había desarrollado y ya
se planteaba la posibilidad de diseñar mecanismos inteligentes.
En aquella reunión se encontraban entre otros Claude Shannon, padre de la Teoría de la
Información; Marvin Minsky, que más tarde demostraría las limitaciones de ciertos modelos de
redes neuronales; Herbert Simon, premio Nobel de Economía quienes además desarrollo el
primer programa de Inteligencia Artificial.
[15]
Reconocido en general como los primeros trabajos en IA son tres por Warren McCulloch y
Walter Pitts (1943) aplicados al conocimiento de la filosofía básica y funcionamiento de las
neuronas en el cerebro, el análisis formal de la lógica proposicional de Russell y Whitehead y la
teoría de la computación de Turing (UNAM, 2006).
Se dice que para solucionar un problema del vivir se tienen que recurrir a 5 paradigmas de la IA
Inteligencia Artificial, pero solo se pueden aplicar sabiendo bien el problema a plantear y
mirando una solución objetiva es la manera correcta de utilizar este tipo de paradigmas. Cabe
aclarar que depende de la magnitud del problema se pueden usar de 1 hasta 3 paradigmas para
ejecutar bien la misión de las ya mencionadas y que no son necesarias usarlas todas a la vez
(Engelbrecht, 2007).
Artificial Neural Networks “Redes Neuronales Artificiales”(NN)
Evolutionary Computation “Computación Evolutiva” (EC)
Swarm Intelligence “Inteligencia de Enjambre” (SI)
Artificial Immune Systems “Sistema Inmune Artificial” (AIS)
Fuzzy Systems “Sistemas Difusos” (FS)
Las aplicaciones más frecuentes de la inteligencia artificial incluyen campos como la robótica, el
análisis de imágenes o el tratamiento automático de textos. En robótica, uno de los campos de
investigación actual con mayor proyección es del aprendizaje adaptativo, en el que un sistema
robotizado explora diferentes configuraciones con el objetivo de realizar un movimiento
complejo (caminar, agarrar un objeto, realizar una trayectoria, etc.). El objetivo podría ser, por
ejemplo, que un robot cuadrúpedo se levante y ande de forma autónoma, de forma que siga un
proceso de exploración y aprendizaje similar al que realiza un recién nacido durante los primeros
meses de vida. Un sistema de IA en este caso se encargaría de explorar diferentes movimientos
de forma aleatoria, midiendo las variables de cada articulación y comprobando en cada momento
el grado de éxito alcanzado por cada secuencia de acciones (altura del centro de masas,
desplazamiento horizontal, fluctuaciones en la posición vertical, etc.). El sistema de IA
modularía la ejecución de las diferentes acciones, incrementando la probabilidad de aquellas que
presenten un mejor rendimiento y restringiendo las que no comporten una mejora de la función
objetivo. Un área afín a la robó- tica es la de las interfaces cerebro-computadora (BCI, Brain-
computer Interfaces), sistemas artificiales que interactúan con el sistema nervioso mediante
señales neurofisiológicas con el objetivo asistir a personas discapacitadas durante la ejecución de
determinadas tareas motoras (Benítez, Escudero, & Kanaan, 2003).
Todas estas herramientas son utilizadas para crear modelos híbridos a través de modelos ya
postulados por diferentes creadores. En nuestro caso, vamos a fijarnos más en modelos
econométricos de los cuales hay cierto sesgamiento en cuanto a estimar un valor y especialmente
su utilizara la herramienta (EC) Evolutionary Computation también conocida como algoritmos
genéticos para precisar mucho mejor el valor de las respectivas Unidades de Planeamiento Zonal.
[16]
6.1.1. ALGORITMOS GENETICOS
Explícitamente, un algoritmo genético conocido como AG es un método que nace de la
programación que consiste principalmente en acoplar la evolución biológica de manera
codificada o computarizada para resolver posibles problemas del vivir común. Dado un problema
específico a resolver, la entrada del AG es un conjunto de soluciones potenciales a ese problema,
codificadas de alguna manera, y una métrica llamada función óptima “Función Fitness” que
permite evaluar cuantitativamente a cada candidata. Estas candidatas suelen ser soluciones que
con certeza se saben que funcionan, con el único propósito de que los AG las mejore, Pero estas
se pueden dar aleatoriamente (Marczyk, 2004).
El problema de los AG consiste en encontrar la mejor pronóstico o hipótesis como los menciona
algunos autores dentro de un numero sin fin de posibles predicciones hacia la solución correcta.
Esta hipótesis es la que optimizara alfanuméricamente un problema en cuestión Función Fitness.
Un ejemplo claro es si la tarea de aprendizaje es el problema de aproximar Una función dada
desconocidos ejemplos de entrenamiento de su entrada y salida, luego la palabra optima podría
definirse como la exactitud de la hipótesis sobre estos datos de entrenamiento. Por otro lado, Si
la tarea es aprender una estrategia para jugar al ajedrez, fitness podría definirse como el número
de juegos ganados por el individuo cuando se juega contra otros individuos en la población
actual (Mitchell, 1997).
A estos algoritmos se deben tener en cuenta probabilísticamente las operaciones con las cuales
ingresan estas hipótesis; “El algoritmo opera iterativamente la actualización de un conjunto de
hipótesis, llamada la población. En cada iteración, todos miembros de la población se evalúan de
acuerdo con la función óptima. Una nuevo población se genera seleccionando
probabilísticamente los individuos más aptos de la población actual. Algunos de estos individuos
seleccionados se llevan adelante en la población próxima generación intacto. Otros se utilizan
como base para la creación de nuevos individuos descendencia mediante la aplicación de las
operaciones genéticas como el cruce y mutación.” (Mitchell, 1997).
Como se mencionó en el párrafo anterior, se mencionan algunas de las etapas o parámetros por
las cuales tiene que pasar un algoritmo genético para llegar a la solución más óptima:
Tamaño de la población o muestra
Probabilidad de Selección (Función Fitness)
Probabilidad de Cruce (Crossover)
Probabilidad de Mutación
A continuación, hablaremos de cada uno de los parámetros mencionados que debe de llevar un
AG.
[17]
TAMAÑO DE LA POBLACION
Este parámetro indica la cantidad o número de muestra o población que tenemos para resolver el
problema. En caso de que esta medida sea insuficiente, el algoritmo genético tiene pocas
posibilidades de realizar reproducciones con lo que se realizaría una búsqueda de soluciones
escasa y poco óptima. Por otro lado si la población es excesiva, el algoritmo genético será
excesivamente lento. Se ha investigado y has hecho deducciones de que hay un límite a partir
del cual es indiferente elevar o reducir el tamaño de la muestra; por lo que también a esta
muestra se tendrá en cuenta cierta velocidad por la cual se van a procesar los datos.
PROBABILIDAD DE SELECCIÓN O FUNCION FITNESS
Un algoritmo genético puede utilizar muchas técnicas diferentes para seleccionar a los individuos
que deben copiarse hacia la siguiente generación, pero abajo se listan algunos de los más
comunes. Algunos de estos métodos son mutuamente exclusivos, pero otros pueden utilizarse en
combinación, algo que se hace a menudo.
Algunos de estos métodos en el proceso de selección serian según Adam Marczyk:
Selección elitista:
Se garantiza la selección de los miembros más aptos de cada generación. (La mayoría de
los AG no utiliza elitismo puro, sino que usan una forma modificada por la que el
individuo mejor, o algunos de los mejores, son copiados hacia la siguiente generación en
caso de que no surja nada mejor).
Selección proporcional a la optimización:
Los individuos más aptos tienen más probabilidad de ser seleccionados, pero no la
certeza.
Selección por rueda de ruleta:
Una forma de selección proporcional a lo óptimo en la que la probabilidad de que un
individuo sea seleccionado es proporcional a la diferencia entre su aptitud y la de sus
competidores. (Conceptualmente, esto puede representarse como un juego de ruleta -cada
individuo obtiene una sección de la ruleta, pero los más aptos obtienen secciones mayores
que las de los menos aptos. Luego la ruleta se hace girar, y en cada vez se elige al
individuo que ``posea'' la sección en la que se pare la ruleta).
Selección escalada:
Al incrementarse la optimización media de la población, la fuerza de la presión selectiva
también aumenta y la función óptima se hace más discriminadora. Este método puede ser
[18]
útil para seleccionar más tarde, cuando todos los individuos tengan una aptitud
relativamente alta y sólo les distingan pequeñas diferencias en la aptitud.
Selección por torneo:
Se eligen subgrupos de individuos de la población, y los miembros de cada subgrupo
compiten entre ellos. Sólo se elige a un individuo de cada subgrupo para la reproducción.
Selección por rango:
A cada individuo de la población se le asigna un rango numérico basado en su aptitud, y
la selección se basa en este ranking, en lugar de las diferencias absolutas en aptitud. La
ventaja de este método es que puede evitar que individuos muy aptos ganen dominancia
al principio a expensas de los menos aptos, lo que reduciría la diversidad genética de la
población y podría obstaculizar la búsqueda de una solución aceptable.
Selección generacional:
La descendencia de los individuos seleccionados en cada generación se convierte en toda
la siguiente generación. No se conservan individuos entre las generaciones.
Selección por estado estacionario:
La descendencia de los individuos seleccionados en cada generación vuelve al acervo
genético preexistente, reemplazando a algunos de los miembros menos aptos de la
siguiente generación. Se conservan algunos individuos entre generaciones.
Selección jerárquica:
Los individuos atraviesan múltiples rondas de selección en cada generación. Las
evaluaciones de los primeros niveles son más rápidas y menos discriminatorias, mientras
que los que sobreviven hasta niveles más altos son evaluados más rigurosamente. La
ventaja de este método es que reduce el tiempo total de cálculo al utilizar una evaluación
más rápida y menos selectiva para eliminar a la mayoría de los individuos que se
muestran pocos o nada prometedores, y sometiendo a una evaluación de optimidad más
rigurosa y computacionalmente más costosa sólo a los que sobreviven a esta prueba
inicial.
PROBABILIDAD DE CRUCE CROSSOVER
Si lo viéramos por la parte genética esta indicaría la frecuencia con la cual se producen cruces
entre atributos que posee el padre es decir, que haya probabilidad de reproducción entre ellos.
En caso de que no exista probabilidad de reproducción, los hijos serán copias exactas se los
padres. En caso de haberla, los hijos tendrán partes de los atributos de los padres. Si la
[19]
probabilidad de cruce es del 100% el hijo se crea totalmente por cruce, no por partes (Arranz de
la Peña & Parra Truyol, 2014).
Como en el caso de la selección o función fitness, también existen diferentes métodos para el
proceso de cruce según Arranz y Parra:
Crossover un punto:
Los 2 datos más relevantes (Datos Padres) se dividen por un punto. Se copia la
información genética de uno de los datos padres desde el inicio hasta el punto de cruce y
lo faltante se copia del otro dato relevante.
Crossover dos puntos:
Es muy similar al caso anterior pero para esta situación, los padres se cortan por dos
puntos. Se copiará al descendiente los genes de un atributo progenitor desde el principio
hasta el primer punto de cruce, los genes del otro progenitor desde el primer punto de
cruce hasta el segundo y del segundo punto de cruce hasta el final se copiará del otro
progenitor.
Crossover Uniforme:
Cada gen del descendiente se obtiene de cualquiera de los padres de forma aleatoria. Una
opción es generar un número aleatorio. Si este número supera un cierto umbral se elegirá
un padre determinado y si no lo supera se elige al otro.
Otra opción es seleccionar una máscara. En caso de que el bit correspondiente a la
máscara esté a 1, se copia el gen de un progenitor y en caso de que esté a 0 se copia el
gen del otro progenitor.
Crossover Aritmético:
Los progenitores se recombinan según algún operador aritmético para generar su
descendiente.
PROBABILIDAD DE MUTACIÓN
La mutación se considera un operador básico, que proporciona un pequeño elemento de
aleatoriedad en la vecindad (entorno) de los individuos de la población. Si bien se admite que el
operador de cruce es el responsable de efectuar la búsqueda a lo largo del espacio de posibles
soluciones, también parece desprenderse de los experimentos efectuados por varios
investigadores que el operador de mutación va ganando en importancia a medida que la
población de individuos va convergiendo (Lawrence, 1985).
[20]
El principal objetivo que tiene la mutación es el de introducir un nuevo material genético en un
individuo creado; es decir, para añadir diversidad a las características genéticas de la población.
Para (Schaffer, A. Caruana, J. Eshelman, & Das, 1989), encuentran que el efecto del cruce en la
búsqueda es inferior al que previamente se esperaba. Utilizan la denominada evolución primitiva,
en la cual, el proceso evolutivo consta tan solo de selección y mutación. Encuentran que dicha
evolución primitiva supera con creces a una evolución basada exclusivamente en la selección y
el cruce. Otra conclusión de su trabajo es que la determinación del valor óptimo de la
probabilidad de mutación es mucho más crucial que el relativo a la probabilidad de cruce.
Adicionalmente a lo que se refirió en el anterior ítem con respecto a las partes de un algoritmo
genético, se hablara también de los diferentes tipos de algoritmos genéricos. Esto con base a que
se utilizara dentro de nuestra investigación tres diferentes algoritmos que nos ayudara a resolver
y optimizar la solución del problema a estudiar:
ALGORITMO GENETICO SIMPLE O CANONICO
Un algoritmo genético simple es en realidad en cuanto a complejidad es el algoritmo más
elemental que se puede tratar en toda la investigación. Ya que sus componentes principales de us
pseudocódigo se derivan de por lo menos un tamaño de población, una selección, un cruce y una
mutación. Es por lo general con el que las personas empiezan a tratar debido a que no es tan
riguroso como lo son otros algoritmos que veremos a continuación.
BEGIN /* Algoritmo Genético Simple */
Generar una población inicial.
Computar la función de evaluación de cada individuo.
WHILE NOT Terminado DO
BEGIN /* Producir nueva generación */
FOR Tamaño población/2 DO
BEGIN /*Ciclo Reproductivo */
Seleccionar dos individuos de la anterior generación,
Para el cruce (probabilidad de selección proporcional
A la función de evaluación del individuo).
Cruzar con cierta probabilidad los dos
Individuos obteniendo dos descendientes.
Mutar los dos descendientes con cierta probabilidad.
Computar la función de evaluación de los dos
Descendientes mutados.
Insertar los dos descendientes mutados en la nueva generación.
END
[21]
IF la población ha convergido THEN
Terminado:= TRUE
END
END Ilustración 1: Pseudocódigo Algoritmo Genético Simple. Fuente: Diseño de un controlador PI óptimo usando Algoritmos
Genéticos
Este código es muy ilustrativo en todos los autores relacionados con algoritmos genéticos ya que
muestra cada paso que tiene que llevar un algoritmo genético.
Según (Acuña Lozano & Vergara Azabache, 2013)
Al crear un algoritmo genético simple es necesario de una codificación o representación del
problema, que resulte preparada al mismo. Además se requiere una función de ajuste o
adaptación al problema, la cual asigna un número real a cada posible solución codificada.
Durante la ejecución del algoritmo, los padres deben ser seleccionados para la reproducción, a
continuación dichos padres seleccionados se cruzarán generando dos hijos, sobre cada uno de los
cuales actuará un operador de mutación. El resultado de la combinación de las anteriores
funciones será un conjunto de individuos (posibles soluciones al problema), los cuales en la
evolución del Algoritmo Genético formarán parte de la siguiente población.
6.1.2 PROGAMACIÓN GENÉTICA
La programación genética GP Genetic Programming se centra principalmente en la evolución de
los genotipos. Su representación es muy similar a un diagrama de árbol o grafico de decisiones
pero con la condición de que este pase por todos los procesos que se llevan en un algoritmo
genético (Tamaño, Selección, Cruce, Mutación); aunque se le da mucha más relevancia a los
operadores de Cruzamiento y mutación. Para cada generación, cada programa evolucionado
(individual) se ejecuta para medir su desempeño dentro del dominio del problema. El resultado
obtenido a partir del programa de ordenador evolucionado se utiliza entonces para cuantificar la
aptitud de dicho programa. El principal investigador en establecer estos tipos de algoritmos es
conocido como Nils Aall Barricelli, quien empezó a describir sus estudios en la simbiogénesis y
algoritmos evolutivos.
Por otro lado, La Programación Genética PG, es un retoño de los Algoritmos Genéticos, en la
cual los cromosomas que sufren la adaptación son en sí mismos programas de computador. Se
usan operadores genéticos especializados que generalizan la recombinación sexual y la mutación,
para los programas de computador estructurados en árbol que están bajo adaptación. La PG trata
de resolver uno de las cuestiones más excitantes e interesantes de las ciencias de la computación:
¿cómo pueden aprender los computadores a solucionar problemas sin que se les programe
explícitamente? En otras palabras, la cuestión es cómo podemos hacer para que los
computadores hagan lo que tienen que hacer, sin necesidad de la intervención humana que les
diga exactamente como lo deben hacer.
[22]
El espacio de búsqueda de la PG es el espacio de todos los posibles programas de computador
compuestos de funciones y elementos terminales apropiados al dominio del problema. Las
funciones pueden ser operaciones aritméticas, operaciones de programación, funciones
matemáticas, funciones lógicas, y funciones específicas del dominio del problema.
El diagrama de árbol se ha conocido dentro de la programación básica como aquella herramienta
que sirve para organizar, ejecutar y solucionar cualquier tipo de paradigma de manera efectiva.
Muchos programadores recurren a este tipo de técnica debido a que a partir de la toma de
decisiones es mucho más claro pensar como un diagrama paso a paso a pensar de manera teórica
sin ningún orden el resultado a obtener.
Es muy importante tener en cuenta estos dos aspectos:
Individuos adaptables:
Este tipo de aspecto es completamente diferente al de un AG donde el tamaño de la población se
fija. En cuanto a la programación genética, la población se halla de acuerdo a su tamaño, forma y
complejidad ya que no todos tienden a adaptarse a un mismo comportamiento. En cuanto a la
forma y complejidad se pueden fijar a diferentes operadores de reproducción; mientras que el
tamaño se refiere al número de ramificaciones o nodos que posee el diagrama.
Gramática especifica del dominio:
Manejar una gramática fácilmente definida en el cual refleje con precisión el problema a tratar.
Para adquirir buenos resultados frente a la GP, se debe de entender aparte de tener reglas y
funciones ya definidas, operadores cuya misión es como cualquier otra de la programación
básica.
Tipo de dato (numero, texto, decimales, booleanos, etc)
Operadores aritméticos (suma, resta, multiplicación, división)
Operadores lógicos (Verdadero, Falso, mayor que, menor que, igual)
Operador de bucles (If-Else, for, switch, While, Do-While)
Entre otros, y estos operadores se ubicaran como podrán observar en la Ilustración 2. En cada
ramificación que posee el diagrama de árbol.
[23]
Ilustración 2: Diagrama de árbol representación matemática. Fuente: Computational Intelligence Introduction
Cabe aclarar que entre más limitaciones y reglas posea la construcción de GP, más efectivo será
el planteamiento del paradigma y más preciso será el resultado esperado. Este tipo de
programación tuvo un desarrollo muy frecuente; en especial para aquellos problemas que surgen
con muchos obstáculos y restricciones de principio.
6.1.3 ESTRATEGIAS EVOLUTIVAS
Las estrategias evolutivas ES viene siendo un proceso computacional el cual trabaja con una
población de individuos que pertenecen a un dominio. Este tipo de método pertenece
esencialmente a los AG pero con la diferencia de que la ES principalmente busca tanto la
evolución genotípica como fenotípica; importante saber que esta representación se hace de forma
vectorial.
Cada individuo es representado por sus bloques de construcción genética y un conjunto de
parámetros de la estrategia que modela el comportamiento de esa persona en su entorno.
Evolución consiste entonces de evolucionar tanto las características genéticas y los parámetros
de la estrategia, en la evolución de las características genéticas son controlados por los
parámetros de la estrategia (Rechenberg, Zurada, & Marks, 1994).
En las estrategias evolutivas, la representación se utiliza es un vector de valores reales de
longitud fija. Al igual que con el bit de cuerdas de algoritmos genéticos, cada posición en el
[24]
vector corresponde a una característica del individuo. Sin embargo, las características son
consideradas como de comportamiento en lugar de estructural.
Según Schwefel interpreto como: "En consecuencia, se espera que las interacciones no lineales
arbitrarias entre características durante la evaluación que obliga a un enfoque más holístico a la
evolución de las soluciones" (Beyer & Schwefel, 2002).
Las estrategias evolutivas manejan ciertas propiedades que los AG; principalmente se maneja
tanto la selección, como la mutación y sus operaciones son para búsqueda óptima de la posible
solución. Estos operadores funcionan en bucles de manera que iteración del bucle se llama una
generación. La secuencia de las generaciones se continúa hasta que se cumpla un criterio de
terminación.
Beyer y Schwefel citan que “En lo que se refiere a espacios de búsqueda con valores reales, la
mutación se realiza normalmente mediante la adición de una distribución normal valor aleatorio
a cada componente del vector. El tamaño del paso o la fuerza de mutación (es decir, la
desviación estándar de la distribución normal) a menudo se rigen por la auto-adaptación.
Tamaños de paso individuales para cada coordenada o correlaciones entre las coordenadas o bien
se rigen por la auto-adaptación o por la matriz de covarianza de adaptación (CMA-ES).”
Por otro lado la selección según Marks dice que como las estrategias de evolución son
determinísticas, es mejor optar por elegir a la población por medio de los rankings de
optimización y no por los valores de fitness reales. Al final, el mejor gen (el más apto que tiene
atributos de su progenitor) es operado matricialmente frente a su competencia (genes hermanos)
hasta así lograr un mejor resultado reemplazando al padre que viene siendo el máximo local
(mejor resultado).
6.1.4 PARADIGMAS DE LA COMPUTACIÓN EVOLUTIVA
El término “computación evolutiva” o “algoritmos evolutivos” engloba una serie de técnicas
inspiradas en los principios de la teoría Neo-Darwiniana de la evolución natural. En términos
generales, para simular el proceso evolutivo en una computadora se requiere:
Codificar las estructuras que se replicarán (o sea, una estructura de datos que se utilice
para almacenar a un “individuo”).
Operaciones que afecten a los “individuos” (típicamente, se usa cruce y mutación).
Una función de aptitud que nos indique qué tan buena es una solución con respecto a las
demás.
Un mecanismo de selección que implemente el principio de “supervivencia del más apto”
de la teoría de Darwin.
[25]
Aunque hoy en día es cada vez más difícil distinguir las diferencias entre los distintos tipos de
algoritmos evolutivos existentes, por razones sobre todo históricas, suele hablarse de tres
paradigmas principales:
Programación Evolutiva
Estrategias Evolutivas
Algoritmos Genéticos
Cada uno de estos paradigmas se originó de manera independiente y con motivaciones muy
distintas, por lo que procederemos a describir brevemente a cada uno de ellos de forma
totalmente independiente
6.1.5 VENTAJAS DE LAS TÉCNICAS
Es importante destacar las diversas ventajas que presenta el uso de técnicas evolutivas para
resolver problemas de búsqueda y optimización (Fogel, 2005):
Simplicidad Conceptual.
Amplia aplicabilidad.
Superiores a las técnicas tradicionales en muchos problemas del mundo real.
Tienen el potencial para incorporar conocimiento sobre el dominio y para hibridarse con
otras técnicas de búsqueda/optimización.
Pueden explotar fácilmente las arquitecturas en paralelo.
Son robustas a los cambios dinámicos.
Para finalizar, es importante mencionar que la computación evolutiva, como disciplina de
estudio, ha atraído la atención de un número cada vez mayor de investigadores de todo el mundo.
Esta popularidad se debe, en gran medida, al enorme éxito que han tenido los algoritmos
evolutivos en la solución de problemas del mundo real de gran complejidad. De tal forma, es de
esperarse que en los años siguientes el uso de este tipo de técnicas prolifere aún más. Nótese, sin
embargo, que es importante tener en mente que los algoritmos evolutivos son técnicas
heurísticas. Por tanto, no garantizan que convergerán al óptimo de un problema dado, aunque en
la práctica suelen aproximar razonablemente bien el óptimo de un problema en un tiempo
promedio considerablemente menor que los algoritmos deterministas. Esta distinción es
importante, pues el papel de las técnicas heurísticas es el de servir normalmente como último
recurso para resolver un problema en el que los algoritmos convencionales (típicamente
deterministas) no funcionan o tienen un costo computacional prohibitivo. Esto implica que antes
de decidir recurrir a los algoritmos evolutivos, debe analizarse la factibilidad de utilizar otro tipo
de técnicas. Este paso, que pudiese parecer obvio para muchos, en la práctica suele omitirse en
muchos casos y de ahí que exista bastante escepticismo por parte de aquellos que acostumbran a
trabajar únicamente con algoritmos deterministas. El uso apropiado y pertinente de los
[26]
algoritmos evolutivos será sin duda la base de su futuro como alternativa para la solución de
problemas complejos y de ahí que se enfatice su importancia.
6.2 AVALÚOS
Con respecto a los avalúos se definirá de forma sencilla como la estimación del valor de un
inmueble reflejado en cifras monetarias por medio de un dictamen técnico imparcial, a través de
sus características físicas, de uso, de investigación y el análisis de mercado, tomando en cuenta
las condiciones físicas y urbanas del inmueble. Un avalúo, nos da una base sobre la cual
comenzar una negociación.
Existen diferentes tipos de avalúos pero para nuestro trabajo de investigación nos centraremos en
indagar sobre dos avalúos específicos:
Avalúo Catastral
Avalúo Comercial
Los avalúos catastrales según el (COLOMBIA, 2011) consisten “en la determinación del valor
de los predios, obtenido mediante investigación y análisis estadístico del mercado inmobiliario.
El avalúo catastral de cada predio se determinará por la adición de los avalúos parciales
practicados independientemente para los terrenos y para las edificaciones en él comprendidos”.
Es necesario también tener en cuenta que este tipo de avalúos solamente tienen acceso a
realizarlo las autoridades catastrales de dicha ciudad o dicho municipio; ya que son los
encargados de realizar el estudio de las áreas Geoeconómicas las cuales determinarán los valores
unitarios para edificaciones y para terrenos.
Mientras que los avalúos comerciales determinar el valor real de una propiedad en un momento
determinado, de acuerdo con sus características físicas y topográficas, además de las variables de
entorno que afectan positiva o negativamente el precio de transacción del predio. Para este tipo
de avalúos debe de ser supervisado por un perito que es contratado por una persona, empresa o
banco los cuales aparte de encargarse de realizar el estudio valuatorios y aspectos físicos del
respectivo inmueble.
Como se pudo notar se habló principalmente de que es un avalúo, pero exactamente un avalúo no
es más que el estudio Fisico-Economico que puede tener un inmueble en un tiempo determinado.
Pero realmente los que acabamos de decir es solo la definición de un avaluó puntual (individual)
cuando realmente lo que se quiere investigar es un avaluó a nivel masivo
Un avaluó masivo es el estudio preliminar de varios avalúos puntuales en los cuales se manejan
principalmente dos variables importantes:
[27]
ZHF (Zonas Homogéneas Físicas)
ZHGE (Zonas Homogéneas GeoEconómicas)
Las ZHF según (COLOMBIA, 2011) “Son espacios geográficos con características similares en
cuanto a vías, topografía, servicios públicos, uso actual del suelo, norma de uso del suelo,
tipificación de las construcciones y/o edificaciones, áreas homogéneas de tierra, disponibilidad
de aguas superficiales permanentes u otras variables que permitan diferenciar estas áreas de las
adyacentes” mientras las ZHGE “Son los espacios geográficos determinados a partir de Zonas
Homogéneas Físicas con valores unitarios similares en cuanto a su precio, según las condiciones
del mercado inmobiliario”.
Según la RESOLUCIÓN NÚMERO 620 del 23 Septiembre 2008, el INSTITUTO
GEOGRÁFICO “AGUSTÍN CODAZZI” establece los procedimientos para los avalúos
ordenados dentro del marco de la Ley 388 de 1997, estos son los métodos usados para realizar
avalúos urbanos o rurales en Colombia.
Los métodos se encuentran en los artículos 1 al 4 de la resolución.
Artículo 1º: MÉTODO DE COMPARACIÓN O DE MERCADO. Es la técnica valuatoria que
busca establecer el valor comercial del bien, a partir del estudio de las ofertas o transacciones
recientes, de bienes semejantes y comparables al del objeto de avalúo. Tales ofertas o
transacciones deberán ser clasificadas, analizadas e interpretadas para llegar a la estimación del
valor comercial.
Artículo 2º: MÉTODO DE CAPITALIZACIÓN DE RENTAS O INGRESOS. Es la técnica
valuatoria que busca establecer el valor comercial de un bien, a partir de las rentas o ingresos que
se puedan obtener del mismo bien, o inmuebles semejantes y comparables por sus características
físicas, de uso y ubicación, trayendo a valor presente la suma de los probables ingresos o rentas
generadas en la vida remanente del bien objeto de avalúo, con una tasa de capitalización o
interés.
Parágrafo: Se entiende por vida remanente la diferencia entre la vida útil del bien y la edad que
efectivamente posea el bien. Para inmuebles cuyo sistema constructivo sea muros de carga, la
vida útil será de 70 años; y para los que tengan estructura en concreto, metálica o mampostería
estructural, la vida útil será de 100 años.
Artículo 3º: MÉTODO DE COSTO DE REPOSICIÓN. Es el que busca establecer el valor
comercial del bien objeto de avalúo a partir de estimar el costo total de la construcción a precios
de hoy, un bien semejante al del objeto de avalúo, y restarle la depreciación acumulada. Al valor
así obtenido se le debe adicionar el valor correspondiente al terreno. Para ello se utilizará la
siguiente fórmula:
[28]
𝑉𝑐 = {𝐶𝑡 − 𝐷} + 𝑉𝑡
Ecuación 1: Modelo para calcular el avalúo por método de costo de reposición
En donde:
𝑉𝑐 = 𝑉𝑎𝑙𝑜𝑟 𝑐𝑜𝑚𝑒𝑟𝑐𝑖𝑎𝑙
𝐶𝑡 = 𝐶𝑜𝑠𝑡𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑙𝑎 𝑐𝑜𝑛𝑠𝑡𝑟𝑢𝑐𝑐𝑖ó𝑛
𝐷 = 𝐷𝑒𝑝𝑟𝑒𝑐𝑖𝑎𝑐𝑖ó𝑛
𝑉𝑡 = 𝑉𝑎𝑙𝑜𝑟 𝑡𝑒𝑟𝑟𝑒𝑛𝑜
Parágrafo: Depreciación. Es la porción de la vida útil que en términos económicos se debe
descontar al inmueble por el tiempo de uso, toda vez que se debe avaluar la vida remanente del
bien.
Existen varios sistemas para estimar la depreciación, siendo el más conocido el Lineal, el cual se
aplicará en el caso de las maquinarias adheridas al inmueble. Para la depreciación de las
construcciones se deben emplear modelos continuos y no los discontinuos o en escalera. Deberá
adoptarse un sistema que tenga en cuenta la edad y el estado de conservación, tal como lo
establece Fitto y Corvini, para lo cual se presentan las ecuaciones resultantes del ajuste para los
estados 1, 2, 3 y 4. (Ver capítulo VII De las Fórmulas Estadísticas).
Artículo 4º: MÉTODO (TÉCNICA) RESIDUAL. Es el que busca establecer el valor comercial
del bien, normalmente para el terreno, a partir de estimar el monto total de las ventas de un
proyecto de construcción, acorde con la reglamentación urbanística vigente y de conformidad
con el mercado del bien final vendible, en el terreno objeto de avalúo.
Para encontrar el valor total del terreno se debe descontar al monto total de las ventas
proyectadas, los costos totales y la utilidad esperada del proyecto constructivo. Es indispensable
que además de la factibilidad técnica y jurídica se evalúe la factibilidad comercial del proyecto,
es decir la real posibilidad de vender lo proyectado.
Parágrafo: Este método (técnica) debe desarrollarse bajo el principio de mayor y mejor uso,
según el cual el valor de un inmueble susceptible de ser dedicado a diferentes usos será el que
resulte de destinarlo, dentro de las posibilidades legales y físicas, al económicamente más
rentable, o si es susceptible de ser construido con distintas intensidades edificatorias, será el que
resulte de construirlo, dentro de las posibilidades legales y físicas, con la combinación de
intensidades que permita obtener la mayor rentabilidad, según las condiciones de mercado.
Según la UAECD para ellos establecer el avaluó catastral se tienen que tener en cuenta la
formula encontrada en la siguiente ecuación:
[29]
𝐴𝑣𝑎𝑙ú𝑜 𝐶𝑎𝑡𝑎𝑠𝑡𝑟𝑎𝑙 = [{𝐴𝑇 × 𝑉𝑚2𝑇} + {𝐴𝐶 × 𝑉𝑚2𝐶}]
Ecuación 2: Calculo del avalúo catastral
Dónde:
𝐴𝑇 = Á𝑟𝑒𝑎 𝑡𝑒𝑟𝑟𝑒𝑛𝑜
𝑉𝑚2𝑇 = 𝑉𝑎𝑙𝑜𝑟 𝑚𝑒𝑡𝑟𝑜 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑑𝑒𝑙 𝑡𝑒𝑟𝑟𝑒𝑛𝑜
𝐴𝐶 = Á𝑟𝑒𝑎 𝑐𝑜𝑛𝑡𝑟𝑢𝑐𝑐𝑖ó𝑛
𝑉𝑚2𝐶 = 𝑉𝑎𝑙𝑜𝑟 𝑚𝑒𝑡𝑟𝑜 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑑𝑒 𝑐𝑜𝑛𝑠𝑡𝑟𝑢𝑐𝑐𝑖ó𝑛
Otra forma de ver esta ecuación más fácil es componiendo sus variables endógenas y fusionando
de tal modo que queden en términos entendibles como:
𝐴𝑣𝑎𝑙ú𝑜 𝐶𝑎𝑡𝑎𝑠𝑡𝑟𝑎𝑙 = 𝐴𝑣𝑎𝑙ú𝑜 𝑇𝑒𝑟𝑟𝑒𝑛𝑜 + 𝐴𝑣𝑎𝑙ú𝑜 𝐶𝑜𝑛𝑠𝑡𝑟𝑢𝑐𝑐𝑖ó𝑛
Ecuación 3: Calculo del avalúo Catastral con componentes finales
Dónde:
𝐴𝑣𝑎𝑙ú𝑜 𝑇𝑒𝑟𝑟𝑒𝑛𝑜 = 𝐴𝑇 × 𝑉𝑚2𝑇
𝐴𝑣𝑎𝑙ú𝑜 𝐶𝑜𝑛𝑠𝑡𝑟𝑢𝑐𝑐𝑖ó𝑛 = 𝐴𝐶 × 𝑉𝑚2𝐶
Algo muy importante que imponer en este punto es que a partir de estas fórmulas, se mostrara los
avalúos elaborados por los AG’s tanto de la UPZ Bolivia, como la UPZ Granjas de techo como
la Ecuación 2. Para que el lector tenga conocimiento alguno en el tema de variables endógenas
que los avalúos tan solo se tienen en cuenta así.
7. MARCO ESPACIAL
Nuestra área de interés se basa fundamentalmente en la ciudad de Bogotá dentro del casco
urbano debido a que la zona de estudio se encuentra estructurada por medio de UPZ; los lugares
que hacen parte de nuestros parámetros son:
UPZ 72 Bolivia
UPZ 112 Granjas de techo
[30]
Estos vienen siendo nuestras zonas de estudio ya que son zonas en las cuales se tiene una
cartografía actualmente vigente.
7.1 UPZ 72 BOLIVIA
La UPZ 72 Bolivia se localiza en la zona noroccidental de la localidad de Engativá, tiene una
extensión de 474,5 hectáreas, que equivalen al 13,2% del total de área de las UPZ de esta
localidad. Esta UPZ limita, al norte, con la UPZ Tibabuyes de la localidad de Suba; al oriente,
con las UPZ Minuto de Dios; al sur, con las UPZ Garcés Navas; y al occidente, con el municipio
de Cota. En cuanto a vías y ríos esta UPZ limita al norte con el rio juan Amarillo; al sur con la
calle 80 (Avenida Medellín); al oriente con la futura Avenida Longitudinal de Occidente ALO y
por ultimo al occidente con el rio Bogotá (Planeación, 2014).
En cuanto a Vías, se pueden establecer que la UPZ domina las siguientes calzadas:
Avenida Medellín ( Cl 80 )
Avenida Longitudinal de Occidente (ALO)
Avenida Morisca ( Cl 91 )
Avenida Bolivia ( Kr 104)
Avenida del Cortijo
Con respecto a los barrios se distribuyen en diferentes zonas de la UPZ:
Tabla 1: Barrios por localidad Engativá
UPZ Barrios
72. Bolivia
Bochica II
Bolivia
Ciudadela Colsubsidio
El Cortijo
El Dorado Fuente: Alcaldía de Bogotá
En cuanto a la centralidades Son espacios que concentran una gran actividad económica o de
servicios a la comunidad, por ejemplo comercio, oficinas o equipamientos. Ellas facilitan o
mejoran la integración internacional, nacional, con la región, o entre diferentes sectores de la
ciudad. Para dicha UPZ existe una centralidad vital que es la que aporta gran parte de actividad
socioeconómica aparte del sistema de transporte masivo Transmilenio (Desde la estación minuto
de Dios hasta el Portal 80):
[31]
Centro Comercial Unicentro del Occidente:
El 26 de octubre de 2004, fue inaugurado dicho centro comercial, comprende un área de
5,5 Ha, dotado de 153 locales y 644 parqueaderos. Esta localizado dentro del barrio
ciudadela Colsubsidio.
En cuanto al uso del suelo; Bolivia maneja exclusivamente 3 usos de los cuales implica un gran
porcentaje en cuanto a tipo residencial debido a que como la UPZ tiene una extensión total de
aproximadamente 474,50 Ha, el 68% comprende un uso de tipo residencial, el 25% de uso de
estructura ecológica principal y tan solo el 7% corresponde a un uso de tipo dotacional como se
puede describir en la Ilustración 3 y su reglamentación en la Ilustración 4.
Ilustración 3: Diagrama de pastel con sus respectivos porcentajes de uso del suelo en la UPZ Bolivia. Fuente: Excel 2010
Estructura
ecológica
principal
25%
Dotacional
7%
Residencial
68%
Uso del suelo UPZ 72 Bolivia
[32]
Tabla 2: Normas Urbanísticas de la UPZ 72 Bolivia
Fuente: Alcaldía de Bogotá decreto 309 septiembre 27 del 2004
En cuanto a la destinación que tiene el uso residencial se podría clasificar de dos maneras tanto
PH (Propiedad Horizontal) y NPH (No propiedad Horizontal). Existen 27682 unidades bajo el
reglamento de PH y para NPH una predominancia de 1580 unidades sumando un total de 29262
unidades residenciales para toda la UPZ. En la UPZ Bolivia se ubican grandes urbanizaciones
residenciales como son la ciudadela Colsubsidio, agrupación de vivienda Bolivia, agrupación el
Cortijo, entre otras (Bogotá A. M., DINÁMICA DE LAS CONSTRUCCIÓN POR USOS
LOCALIDAD ENGATIVÁ, 2012).
Ya para finalizar mostraremos de manera detallada la cartografía general que posee la UPZ
Bolivia con sus respectivas calles, Usos y sitios de interés:
[33]
Ilustración 4: Imagen UPZ 72 Bolivia. Fuente: ArcGIS 10.3; Basemap: World_Imagery
[34]
7.2 UPZ 112 GRANJAS DE TECHO
La UPZ 112 Granjas de Techo es de clasificación predominantemente industrial y se localiza al
suroriente de la localidad de Fontibón, tiene una extensión de 477,6 hectáreas, equivalentes al
14,35% del total del área de las UPZ de la localidad. Del total de hectáreas, 24 corresponden a
suelo protegido. Esta UPZ limita, por el norte, con las UPZ Modelia y Ciudad Salitre Occidental
y en la mitad de estas se encuentra la avenida del Ferrocarril de Occidente; por el oriente, con las
localidades de Teusaquillo y Puente Aranda, separada por la avenida carrera 68; por el sur, con la
localidad de Kennedy, serradas por el rio Fucha y la calle 13 o avenida Centenario. Por el
occidente, con la UPZ Fontibón estando de por medio la avenida Longitudinal de Occidente.
(ALO) (Bogotá A. M., DINÁMICA DE LA CONSTRUCCIÓN POR USOS LOCALIDAD
FONTIBÓN, 2012).
En cuanto a Vías, se pueden establecer que la UPZ domina las siguientes calzadas:
Avenida Ciudad de Cali (Carrera 84)
Avenida Agoberto Mejía (Carrera 80)
Avenida Ferrocarril del Occidente (Calle 22)
Avenida Centenario (Calle 13)
Avenida Boyacá (Carrera 72)
Con respecto a los barrios se distribuyen en diferentes zonas de la UPZ:
Tabla 3: Barrios por localidad Fontibón
UPZ Barrios
112. Granjas de Techo
El Tintal II
El Tintal Central
Ferrocaja
Vereda el Tintal II
El Tintal A.S.D.
El Vergel
Interindustrial
Villa Alsacia
Franco
Montevideo
Granjas de Techo Fuente: Alcaldía de Bogotá
Entre las diferentes centralidades que se manejan es esta UPZ se encuentran:
Supermercado MAXI (easy)
[35]
Anteriormente conocido como centro comercial ACATADAO fue fundado hacia finales
del 2013 con el único propósito de competir a nivel mayorista frente a los demás
supermercados de cadena como Carrefour “actualmente Jumbo” y Exito en cuanto a
variedad de productos no solo comestibles sino también en cuanto a electrodomésticos y
accesorios para el hogar. Posee un área de construcción de aproximadamente 1,7 Ha;
donde hoy en día fue modificado por herramientas para el hogar y la construcción.
Centro Comercial Hayuelos
Hayuelos Centro Comercial y Empresarial, abrió sus puertas en el mes de abril del 2008 y
hace parte de la denominada zona H de Bogotá. Este proyecto ganador se realizó con el
esfuerzo de diferentes personas que se comprometieron con el desarrollo urbanístico de la
ciudad. Fue diseñado con un concepto vanguardista que integra amplias zonas, tres tipos
de locales, oficinas, espacios públicos llenos de luz y lugares para eventos que son ideales
para la diversión y entretenimiento de todos los visitantes. Cuenta con 5,6 Ha en los
cuales: 292 locales, 101 oficinas, 4 salones de conferencias y eventos, zona de cafés y
1996 parqueaderos.
Con respecto a la UPZ Granjas de Techo, posee 3 usos de suelos en los cuales se designan de
manera simultánea. En primer lugar y es en la UPZ lo que más predomina tenemos el uso
industrial que abarca el 53% de toda la zona; luego con un 32% se encuentra el uso del suelo
cuya referencia es de Área Urbana Integral y por ultimo con un restante del 15% es contenido
por el uso Residencial. A continuación mostraremos tanto en la Ilustración 5 el diagrama de
pastel respecto a los diferentes usos del suelo y en la Tabla 4 la normatividad del suelo para
dicha UPZ
Ilustración 5: Diagrama de pastel con sus respectivos porcentajes de uso del suelo en la UPZ Granjas de Techo. Fuente: Excel 2010
Residencial
15%
Industrial
53%
Area urbana
integral
32%
Uso del suelo UPZ 112 Granjas de
techo
[36]
Tabla 4: Normas Urbanísticas de la UPZ 112 Granjas de Techo
Fuente: Alcaldía de Bogotá decreto 622 diciembre 29 del 2006
A diferencia de la anterior UPZ Bolivia, Esta se caracteriza por tener una gran extensión de uso
Industrial, en este uso se encuentra aproximadamente 616 unidades pero destinado a solo
bodegas. Lo que nos deja con que construcciones para solo industrialización existen 246
unidades en actual uso y dejando por último el uso residencial en los cuales de PH existen 12836
unidades y en NPH 139 unidades. La vivienda en PH se ubica hacia el costado occidental de la
UPZ en el polígono conformado por la avenida Boyacá y la avenida Longitudinal de Occidente
(ALO) entre avenida Ferrocarril del Occidente y avenida Centenario; mientras que la vivienda
reglamentadas en NPH se encuentran descentralizadas y dispersas en todo el perímetro que
conlleva dicha UPZ .
Por último, se mostrara de manera detallada la cartografía general que posee la UPZ Bolivia con
sus respectivas calles, Usos y sitios de interés:
[37]
Ilustración 6: Imagen UPZ 112 Granjas de Techo. Fuente: ArcGIS 10.3; Basemap: World_Imagery
[38]
8. MARCO TEMPORAL
Como se pudo entender en el titulo se busca información de avalúos con vigencia del 2015 ya
que se va a representar estos insumos de manera actual; ya que la UAECD facilitara los datos
almacenados dentro de sus bases de datos respectivos para realizar un mejor resultado mediante
los algoritmos genéticos. Una vez comprobados estos y resueltos, se corroborara frente a los
resultados obtenidos de catastro por medio de la econometría estimando los valores linealmente.
Se espera una aproximación de un mes máximo dos para poder establecer los parámetros
necesarios en la investigación de un mejor modelo de estimación en avalúos masivos es una idea
innovadora y predispuesta a poner en práctica en las diferentes entidades privadas o públicas
para mejorar dicho calculo.
9. METODOLOGIA
Para poder garantizar el éxitos de dicha experimentación se debe realizar a partir de unos datos
suministrados por la UAECD de las UPZ 72 Bolivia y 112 Granjas de Techo con vigencia 2015
se efectuara un análisis exploratorio de los datos con el ánimo de generar una estratificación para
utilizarlos en un algoritmo basado en algoritmos genéticos que nos permita minimizar los
errores y la estimación de los avalúos masivos comparados con los avalúos vigentes de dicha
entidad.
Para contextualizar el tema de los avalúos, no se sabe cómo se calculan exactamente estos avaluó
por la entidad de la UAECD; por lo tanto, abarcaremos toda posibilidad de generar este cálculo
mediante los diferentes procesos con los se ejecuta un avaluó comercial. Recordaremos algunos
tipos de cálculo de avalúos que existen en vigencia actual en el capítulo de análisis y resultados.
A continuación se mostrara en la Ilustración 8 el flujograma general de los diferentes procesos
por el cual pasara los datos tomados por la UAECD con vigencia del 2015:
Ilustración 7: Diagrama general básico de algoritmo genético. Fuente: Educagratis_Algoritmos Genéticos Online
[39]
Ilustración 8: Flujograma de algoritmos genéticos para hallar el óptimo valor de un avaluó con vigencia actual. Fuente: SmartDraw
[40]
9.1 FASES:
Sea Algoritmos Genéticos Simples, Programación Genética o Estrategias Evolutivas; existen
procesos similares para poder llegar al resultado requerido; se hablara de cada algoritmo y sus
posibles características metodológicas:
Algoritmo Genético Canónico
Ilustración 9: Diagrama de flujo con los posibles pasos del algoritmo genético canónico y sus fases
Un algoritmo genético canónico se diferencia de los otros debido a que para todas las
operaciones como la selección, cruce y mutación son más simples de elaborar y que todas se
deben cumplir a diferencia de la programación genética o estrategias evolutivas que lo que
buscan es operar la mutación y cruzamiento de manera compleja y exacta.
[41]
Programación Genética
Ilustración 10: Diagrama de flujo con los posibles pasos de programación genética y sus fases
Se busca en esta clase de algoritmo crear programas óptimos a partir de programas básicos. Lo
que se pretende es crear programas estándares en la selección, cruce y mutación que a la hora de
llamar a las funciones, se ejecuta el programa principal y que las posibles soluciones sean mucho
mejores que las soluciones iniciales en otras palabras que los posibles resultados vayan
evolucionando hasta que la última generación sea mucho mejor que la primera generación de
resultados.
Así mismo terminar la sucesión cuando el programa sea lo bastante bueno para acotejar los
resultados entre algoritmos genético simple, programación genética y estrategias evolutivas con
los resultados de la UAECD. Mostrando sus ventajas, desventajas y proximidades de cada uno de
los esquemas a realizar.
[42]
Estrategias Evolutivas
Ilustración 11: Diagrama de flujo con los posibles pasos de estrategias evolutivas y sus fases
A diferencia de los algoritmos explicados en las dos fases anteriores, las estrategias evolutivas
miran principalmente los genotipos y fenotipos. Para este algoritmo se utilizara de manera
vectorial, todas las variables sean dependientes o independientes cada dato en una posición y se
empezara a operar de manera individual.
Ilustración 12: Ejemplo de recombinación de parámetros para la etapa de curce
[43]
9.2 INFORMACION
Como se utilizaran datos realizados por la UAECD, se tendrán en cuenta que los avalúos
realizados por esta entidad son completamente validos predio a predio; pero ya lo que
necesitamos saber es el avaluó masivo de nuestras zonas de intereses, es bueno replantear las
posibles soluciones que nos dan en nuestro ejercicio de optimizar mejor el resultado. Sería bueno
acotejar o ponderar los resultados esperados tanto para nuestra solución a tratar como la solución
de la entidad pública.
9.3 ANÁLISIS EXPLORATORIO DE DATOS
Los datos obtenidos por la entidad son calculados mediante regresiones lineales estimando
variables como área de terreno, área de construcción, fachada entre otras variables como
estimadores para encontrar la solución probabilísticamente más precisa que puede calcularse.
Para establecer un mejor resultado como se han obtenido en los avalúos puntuales, se necesitara
hacer su respectiva teoría de errores y sus diferentes técnicas como:
RAE
MAE
RMSE
RRSE
MAPE
Mínimos y Máximos tanto de Errores como de Valores Reales y Valores Calculados
Para las diferentes variables que se maneja normalmente en un avaluó puntual y se explicara
dada una de estas siglas en el desarrollo del proyecto.
9.4 SOFTWARE
Los algoritmos genéticos se programaran mediante software conocido como Matlab en cuanto al
código fuente, diagrama de árbol mediante programa de flujograma a partir del programa en
código y resultados finales Excel o cualquier programa para estadística descriptiva y graficas
mostrando los resultados estadísticos.
[44]
10. DESARROLLO DE LA PROPUESTA
10.1 DATOS
Antes de poder hablar acerca de la interpretación del programa, se debe enfocar cuales fueron los
datos a tratar durante el desarrollo de la propuesta de investigación. Como eje principal se
enfatizará en que los datos fueron suministrados por la UAECD. Los cuales se acceden
fácilmente a la base de datos respectivos a las zonas encomendadas por dicha entidad para
extraer la información relevante para poder evaluar y descifrar los avalúos catastrales referidos
de las UPZ Bolivia y Granjas de Techo. Esta información está conformada por dos archivos
importantes; el primero consta de una base de datos elaborada por el programa Excel, en el que
se describe la información alfanumérica referentemente de las UPZ a estudiar y el segundo
archivo consiste en la identificación geométrica y visual de los predios encontrados dentro de
dichas UPZ en un formato tipo shape visualizado dentro de una Geodatabase (ArcGIS 10.3)
cuyo software permite la previa interpretación de los SIG (Sistemas de Información Geográfica).
Entre ellos, la base de datos contiene la información de 65133 datos entre las dos UPZ para las
cuales, 34657 datos pertenecen a la UPZ Bolivia y 28702 a la PZ Granjas de techo; ya que los
datos restantes (1774 datos), nos ofrecieron la suficiente información para corroborar con la
regresión a estudiar. Por otro lado en la Geodatabase encontramos información geográfica de las
UPZ con sus respectivos atributos alfanuméricos dando un total de 3179 datos que por
consiguiente llevan a una inconsistencia bastante elevada de los datos suministrados en la BD de
Excel; Por lo tanto solo se enfocara en estudiar la BD proporcionada por Excel sin descartar de
que la información geográfica va a ser de gran importancia para delimitar nuestra zona de
interés.
10.2 VARIABLES
Como se había enunciado anteriormente, existe una BD elaborada en Excel de la UAECD en las
cuales tanto para la UPZ Bolivia como para la UPZ Granjas de techo posee la misma cantidad de
variables, este también fue un parámetro de criterio que resulta eliminar los 1774 datos que se
había mencionado en el titulo anterior y por no contener ninguna de las variables totales que
mencionaremos a continuación:
[45]
CODIGO_BARRIO
CODIGO_MANZANA
CODIGO_PREDIO
CODIGO_CONSTRUCCION
CODIGO_RESTO
CEDULA_CATASTRAL
CHIP
TIPO_PROPIEDAD
CODIGO_DESTINO
AREA_TERRENO
VALOR_M2_TERRENO
VALOR_AVALUO
AVALUO_ANO
CLASE_PREDIO
DIRECCION_REAL
CODIGO_ESTRATO
AREA_CONSTRUIDA
VALOR_M2_CONSTRUCCION
LOTSECT_ID
LOTMANZA_ID
LOTPRED_ID
LOTMANZ_ID
LOTLOTE_ID
LOTZHF_ID
LOTZHG_ID
LOTUNIDAPH
LOTDISTRIT
LOTTIPO
LOTLSIMBOL
LOTDISPERS
ESCALA
SHAPE_AREA
SHAPE_LEN
CODIGO_BARRIO1
CODIGO_MANZANA1
CODIGO_PREDIO1
CODIGO_CONSTRUCCION1
CODIGO_RESTO1
CODIGO_USO
UNIDAD_CALIFICADA
AREA_USO
PUNTAJE
PISOS
AVANCE_CONSTRUCCION
VALOR_UNIT_CONSTRUCCION
VETUSTEZ
Asumiendo así que cada una de estas variables explicaría características esenciales que posee un
predio dentro de cada UPZ. Por otro lado, de todo este conjunto de variables, solo se tomara las
variables más significativas que se estudiara para describir la regresión (variables independientes).
A continuación, se nombrara las variables dependientes a tratar para acoplar a la regresión:
Tabla 5: Descripción de las variables independientes para la solución a las regresiones
VARIABLES
INDEPENDIENTES
DESCRIPCIÓN
AREA_CONSTRUCCION
O AREA_TERRENO (X1)
Área construcción o área terreno dependiendo a la regresión que se
vaya a establecer (Terreno-Construcción)
AREA_USO (X2) Cuanta Área se va a tratar para los diferentes usos que sufre el predio
PUNTAJE (X3) Clasificación del predio según su actualización catastral
PISOS (X4) El número de niveles de construcción en altura que padece el predio
VETUSTEZ (X5) Duración que posee el predio a partir de que su respectiva
identificación
[46]
Cada una de estas variables estará asociada a las incógnitas o expresiones conocidas en la
econometría como variables independientes denominadas como (X1, X2, X3, X4, X5, X6 y X7).
Siendo así, se comprenderá las variables dependientes que resolverán las regresiones y que hacen
parte del cálculo del avaluó de cada UPZ conocidas como variables dependientes; entre esas se
encuentra:
Tabla 6: Descripción de las variables dependientes o resultados de las regresiones
VARIABLES
DEPENDIENTES (Y)
DESCRIPCIÓN
VALOR_M2_TERRENO
(YVT)
Valor monetario por m2
que posee el terreno del predio tratado.
AV TERR_CAT15 (YAT) Valor monetario total que conserva el terreno del predio a analizar.
VALOR_M2_CONST
(YAC)
Valor monetario por m2
que posee la construcción en cuanto a
Materiales y soportes del cual se va a afectar el predio.
VCONS (YVT) Valor monetario total que posee el predio de construcciones.
Estas variables se tuvieron en consideración y se tomaron como parte de la regresión mediante
el estudio de minería de datos “Data Mining” que en otras palabras viene siendo un proceso no
trivial de identificación válida, novedosa, potencialmente útil y entendible de patrones
comprensibles que se encuentran ocultos en los datos (Fayyad, 1996).
El data mining es una tecnología compuesta por etapas que integra varias áreas y que no se debe
confundir con un gran software. Durante el desarrollo de un proyecto de este tipo se usan
diferentes aplicaciones software en cada etapa que pueden ser estadísticas, de visualización de
datos o de inteligencia artificial, principalmente. Actualmente existen aplicaciones o
herramientas comerciales de data mining muy poderosas que contienen un sinfín de utilerías que
facilitan el desarrollo de un proyecto. Sin embargo, casi siempre acaban complementándose con
otra herramienta. (Vallejos, 2006)
Ahora, se mostrara por medio del software WEKA, algunas graficas por la cuales se obtuvo una
mejor perspectiva acerca de las variables independientes que se deben incluir a la hora de
encontrar nuestra regresión de interés; Este software es importante tener en cuenta, ya que no
solo miramos a través de diagramas de dispersión el mejor comportamiento de las variables, sino
que también tiene en cuenta las variables que no presenta alguna significancia exacta dentro de la
regresión lineal.
X(coord) (X6) Latitud en coordenadas cartesianas del predio a identificar
Y(coord) (X7) Longitud en coordenadas cartesianas del predio a identificar
[47]
Ilustración 13: Cuadro comparativo de todos las variables posibles en la regresión Fuente: Software WEKA
Como pueden observar en todos los escenarios, tenemos la clasificación de LOTZHF_ID con la
cual se va a analizar todas las variables dependientes. Teniendo en cuanta el cuadro comparativo
de la Ilustración 14, prestamos atención a que los datos tienen un comportamiento bastante
complejo pero que aun así la cantidad de datos es bastante rigurosa y completa. Por lo que
podemos utilizar estas variables para describir mejor la regresión deseada.
Nota:
“Teniendo en cuenta ítems importantes para calcular une avalúo como Puntaje, Áreas (Terreno
y construcción), Vetustez y precio o valor de Mt2 (Terreno y construcción) son las otras
variables lo que ayudan a mejorar el estudio del avaluó puntual.”
[48]
Ilustración 14: Variables tomadas de la BD de Catastro con significancia nula en la regresión Fuente: Software WEKA
Luego, tenemos en la Ilustración 15 otras variables que para catastro vienen siendo importante
en sus informes colocar para proyectar un completo avaluó pero que al final no tiene mucha
significancia matemática analizar estas incógnitas inmobiliarias debido a que no posee un valor
adecuado para proyectar y concatenar en la regresión a calcular. También como se dan cuenta, en
los cuadros de comparación, estos datos son muy pocos y bastantes pequeños como para
simularlos en el software y obtener una solución apta al estudio de los predios en particular.
10.3 ARQUITECTURA DEL PROGRAMA
10.3.1 DESCRIPCIÓN DEL PROGRAMA
Recapitulando los títulos anteriores, el software a codificar nos ayudara a establecer y mejorar la
teoría que se ha venido estableciendo para calcular avalúos masivos por medio de la inteligencia
[49]
artificial. Como se había dicho anteriormente, en Colombia para estos tiempos se ha venido
manejando la econometría como un modelo matemático que nos permite establecer y calcular
una cantidad de datos y variables experimentadas en la vida real para mejorar el rendimiento de
algún fenómeno bastante engorroso; por lo que para nosotros los avalúos masivos se determinan
a partir de una cierta cantidad de datos y variables que requieren ser calculados para aproximar a
un valor monetario de un terreno que en este estudio se adaptara para una UPZ.
La econometría nos ayuda a evaluar por medio de estimadores fenómenos económicos como los
avalúos masivos que intenta describir una patología natural mediante modelos que permitan
examinar los factores por la cual se establece el valor de un predio o en nuestro caso el valor de
una UPZ. La variables tanto dependientes (variables a resolver) como variables independientes
(que nos ayudaran a resolver las variables dependientes), hacen parte de la econometría junto con
unos estimadores que ayudan a mejorar el resultado esperado por medio de la estadística.
Pero para ser más precisos en estas afirmaciones y aun para estos tiempos la econometría no nos
ayuda a establecer mejores resultados para nuestro estudio del valor de una UPZ; la econometría
a pesar de que nos demuestra de manera aproximada los valores a los que se quieren recurrir, no
posee la precisión exacta para demostrar los cambios drásticos que posee las variables a la hora
de ser tratadas y que por consiguiente lo que en algunos indicios hace es que estima valores
bastante elevados no uniformes respecto a la muestra a evaluar o simplemente elimina variables
debido a que no corrobora a su nivel de significancia para resolver este fenómeno. Por lo que se
introduce algo de inteligencia artificial para reforzar estos vacíos que posiblemente puedan
mejorar tanto rendimiento como precisión de los datos a procesar dejándonos así, una solución
más óptima y razonable a la que se puede calcular simplemente con la econometría. No digo que
la econometría en estos casos sea obsoleta; sino que para algunos fenómenos como lo es el
cálculo del valor de un avaluó masivo, se necesita más de una ciencia que acompañe a mejorar
los resultados debido a su nivel de incertidumbre y complejidad que maneja al momento de
proponer alguna solución efectiva.
Ya para finalizar este ítem, la idea de utilizar algoritmos genéticos es para evolucionar la muestra
de manera de que cuando yo tenga una solución, esta será temporal frente a otros resultados que
puedan ser mejor establecidos y no depreciando el resultado más aproximado y eliminarlo por
completo frente a otro resultado que quizás no tenga una relevancia fuerte para ser utilizado en la
solución a un fenómeno complejo, según (Velasquez H, Ortiz, & Jaramillo, 2011) se afirma que
“las estrategias de evolución es una técnica bio-inspirada, eficiente y robusta para resolver
problemas de optimización donde el espacio de soluciones es no restringido. Sin embargo, esta
suposición es irreal en muchos casos porque el espacio de soluciones es limitado por fronteras
complejas en la forma de restricciones tanto lineales como no lineales”.
[50]
10.3.2 REQUISITOS PARA EL PROGRAMA
Para este ítem, es indispensable mirar que parámetros se requieren implementar para poder
diseñar el programa de manera efectiva y precisa. En primera instancia, es indispensable definir
la BD que se va a almacenar en el software a programar “MATLAB”; para este caso se van a
realizar de manera simultánea las UPZ Bolivia y Granjas de techo con sus respectivas variables
(Ver tabla 6). Ya teniendo definida la BD a trabajar se requiere de un computador lo bastante
potente para poder realizar las determinadas iteraciones a la hora de capturar las especies o
individuos resultantes de un selecto grupo de estas que compiten entre sí para que solo las
mejores puedan reproducirse y guardarse como “superindividuos” para así obtener los mejores
resultados en el momento de obtener la regresión deseada.
Por otro lado, se necesita disponer de un tiempo estimado entre 40- 60 minutos para que los
procesos que se deben efectuar (Generación de población, Evolución y Ajuste de Betas) sean
satisfactorios y en caso de obtener un resultado erróneo, volver a iterar el programa.
Tabla 7: Requisitos físicos del software AG
REQUISITOS DEL SOFTWARE CONSECUENCIAS DE LOS REQUISITOS
Es indiscutible manejar el software en
Matlab.
Se requiere tener un procesador lo
suficientemente fuerte para poder iterar
la población hasta encontrar a los
Superindividuos que van a concebir
optimizar la regresión a desear.
Para poder migrar los datos es
necesario mantener la BD intacta a la
hora de hacer generar la población.
Debido a que las funciones trigonométricas
e hiperbólicas que maneja el programa
tienden a extenderse a lo largo de la
regresión, los procesos internos suelen
demorarse bastante por lo que Matlab es un
programa con bastantes herramientas
aritméticas.
Son bastantes datos que se manejan para
calcular avalúos y también por los grandes
dígitos monetarios que se manejan en cada
UPZ, se termina evidenciando de que son
procesos extensos.
La BD en lo posible manejarla en Excel
debido a que el software solo puede leer
como hoja de cálculo “xlsread” esta y debe
contener 7 columnas incluyendo el ID de
cada predio.
[51]
10.3.3 VISTA LOGICA DEL PROGRAMA
A continuación, se visualizara el diagrama lógico de los componentes principales del software;
desde la migración de la BD, Hasta la obtención de la regresión con sus respectivos errores:
Ilustración 15: Base de datos de la UAECD con sus respectivas variables dependientes (clases) e independientes (atributos)
Ilustración 16: Flujograma del programa explicando paso a paso cada proceso con sus respectivas funciones
[52]
10.3.4 PARAMETROS DEL PROGRAMA
Como se pudo evidenciar en el anterior ítem, el modelo lógico ejercido dentro del programa nos
ayuda a visualizar mejor que pasos fueron necesarios para poder implementar en código y así
poder ilustrar mejor una regresión que me permite obtener una ecuación para solucionar varias
incógnitas.
A partir de ahora, se construirá y describirá los prerrequisitos y clasificaciones importantes que
tienen que tener en cuenta para poder entender mejor lo que se hizo dentro del programa para
estimar avalúos:
10.3.4.1 GENERACIÓN DE INDIVIDUOS
Inicialmente se exportara la BD de la UAECD con sus respectivas variables de cada UPZ al
programa en Matlab dependiendo de la tabla a tratar (Vm2T, Vm2C, VtT, VtC) ya modificado en
Excel según su clasificación:
Código de Sector
Código de Uso
ZHF
Después de la conversión de la tabla .xls a .mat, se comenzara a correr el programa por medio de
interfaz.fig. En el botón de Generar Población inicial internamente el programa esta
almacenando las funciones, operaciones y exponenciales internamente según el arreglo de
ubicación de cada variable a acompañar por otro lado está generando la mejor especie de
individuos los cuales nos ayudan a obtener las soluciones afines para lograr hallar la regresión
indicada para el conjunto de datos según la clasificación dada anteriormente.
Para la generación de individuos se establece una cantidad experimental necesaria en la cual, se
ira recombinando esta especie con los genes de sus antecesores; en otras palabras como un
cromosoma de tal modo que seguirá reestructurando su ADN hasta lograr mejorar la población
establecida creando así a los superindividuos capaces de encontrar soluciones más factibles a las
que pudieron dar sus precedentes. La combinación de las variables independientes; con las
funciones, operaciones y exponenciales se deben lograr de manera simultánea; las operaciones se
les conocen como suma, resta, multiplicación y división y se almacenara en una variable que a
la hora de combinar ocupe un espacio que vaya entre cada variable dependiente conmutada con
su respectiva función y exponentes. Las funciones que se llevaran a cabo en la solución de la
regresión no son más que el conjunto de elementos conocidos como (Trigonométricas,
Trigonométricas Inversas, Hiperbólicas, Hiperbólicas Inversas, Funciones Exponenciales,
Logarítmicas, etc.) que comprenden el universo de números enteros positivos y que a su vez
[53]
acompañaran a las variables independientes uno a uno a mejorar su corrección de la regresión a
obtener. Por ultimo las exponenciales en la regresión se clasificaran de dos maneras:
Exponenciales de las variables independientes:
Exponenciales de las variables tratadas:
Al final de este proceso, se calcularan los errores según las variables a procesar. Según la
clasificación que se nombró anteriormente; los errores son hallados a partir de la regresión dada
y se calculan a partir del error relativo como se describirá en la siguiente ecuación:
𝐸𝐴 =|𝐸𝑟 − 𝐸𝑇|
𝐸𝑇
Ecuación 4: Error Absoluto hallada en la regresión obtenida
𝐸𝐴 = 𝐸𝑟𝑟𝑜𝑟 𝐴𝑏𝑠𝑜𝑙𝑢𝑡𝑜
𝐸𝑟 = 𝐸𝑟𝑟𝑜𝑟 𝑟𝑒𝑎𝑙
𝐸𝑟 = 𝐸𝑟𝑟𝑜𝑟 𝑡𝑒𝑜𝑟𝑖𝑐𝑜
Calculando así el error global mínimo de todos los predios según su categorización y el que
menor error tenga, es la regresión más apropiada para todo el conjunto de predios clasificados;
otra forma de ver mejor la Ecuación 1 para entender mejor la operación, es mediante esta
Ecuación sintetizada:
𝐸𝐴 =|𝑌𝑅 − 𝑌𝑟|
𝑌𝑅
Ecuación 5: Error Absoluto en función de la solución del AG sintetizado
𝐸𝐴 = 𝐸𝑟𝑟𝑜𝑟 𝐴𝑏𝑠𝑜𝑙𝑢𝑡𝑜
𝑌𝑅 = 𝑉𝑎𝑙𝑜𝑟 𝑟𝑒𝑎𝑙
𝑌𝑟 = 𝑉𝑎𝑙𝑜𝑟 ℎ𝑎𝑙𝑙𝑎𝑑𝑜 𝑒𝑛 𝑙𝑎 𝑟𝑒𝑔𝑟𝑒𝑠𝑖𝑜𝑛
Nota:
“Para estos errores sean para calcular (Vm2T-Vm2C-VtT-VtC) se utiliza la misma idea de error
Absoluto”
10.3.4.2 SELECCIÓN
Este paso va dentro del ítem anterior (Generación de individuos); consiste en elegir las
operaciones, exponenciales y funciones de manera aleatoria de tal modo que se acomoden entre
[54]
si junto con las variables independientes para lograr conseguir la regresión correcta. Una vez
seleccionada la combinación adecuada a la regresión a estimar mediante la función fitness se
analizara los errores más próximos a tratar de la siguiente manera:
𝐹𝑓,𝑖 =𝑓
𝑠𝑢𝑚(𝑓)
Ecuación 6: Función fitness para el conjunto de errores hallados en la regresión obtenida
𝐹𝑓,𝑖 = 𝐹𝑢𝑛𝑐𝑖𝑜𝑛 𝑓𝑖𝑡𝑛𝑒𝑠𝑠
𝑓 = 1𝑒𝑟𝑟𝑜𝑟𝑒𝑠⁄
𝑠𝑢𝑚 (𝑓) = 𝑠𝑢𝑚𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑒𝑟𝑟𝑜𝑟𝑒𝑠
Esta selección se hace posible para encontrar en cuanto a los errores la mejor representación
viable de una regresión que demuestre satisfacer la clasificación sugerida con minimizar estos.
La función fitness es la que nos sugiere coger esa regresión y de algún modo implementarla en
toda la clasificación sea (Cod_Sector; Cod_Uso; ZHF).
10.3.4.3 CRUCE
Como su nombre lo indica el cruce es nada más ni nada menos que la recombinación que hay o
puede existir entre dos regresiones obtenidas y enlazarlas entre sí para observar y verificar si es
correcto o no esa modificación que se le haga y llegar a mejorar el modelo obtenido de la
selección. La idea es una vez seleccionada las dos partes de las regresiones en función de las
probabilidades de cruce, pasaran a formar parte de una nueva regresión o simplemente
compartirán atributos a valorar mejor la regresión que nombraremos como regresión hibrida.
𝑌 = {(𝑆𝑒𝑛(𝑥12))
5+ (𝐴𝑠𝑒𝑛(𝑥2
6))3
/(𝐿𝑛(𝑥39))
1∗ (𝑆𝑞𝑟𝑡(𝑥4
7))8
+. . }
Ecuación 7: Regresión obtenida mediante el proceso de selección
𝑌 = {(𝐶𝑜𝑡(𝑥18))
0− (𝑆𝑒𝑛ℎ(𝑥2
0))2
/(𝐴𝑡𝑎𝑛ℎ(𝑥35))
8+ (𝐿𝑜𝑔10(𝑥4
1))7
+. . }
Ecuación 8: Regresión opcional generada arbitrariamente
Cruzamiento:
𝑌 = {(𝑆𝑒𝑛(𝑥12))
5+ (𝐴𝑠𝑒𝑛(𝑥2
6))3
/(𝐿𝑛(𝑥39))
1+ (𝐿𝑜𝑔10(𝑥4
1))7
+. . }
Ecuación 9: Regresión hibrida o regresión mejorada a partir de la recombinación de ambas partes
En pocas palabras se denomina operador de cruce a la forma de calcular el genoma del nuevo
individuo en función del genoma del padre y de la madre. El operador de cruce es fuertemente
[55]
responsable de las propiedades del algoritmo genético, y determinará en gran medida la
evolución de la población (Cerrolaza & Annicchiarico, 1996). Como se puede observar, en la
ecuación 3 Se obtuvo la primera regresión obtenida mediante el proceso de selección como
regresión original; luego se almacena una regresión aleatoria por si se puede optar por mirar
algunas particularidades y atributos simples como aparece en ecuación 4. Pero a la hora de
recombinar estas dos regresiones podemos observar que parte de sus atributos de la ecuación
aleatoria pasan a enlazar junto a la ecuación original dando así a una regresión mejorada o
regresión hibrida mirando obviamente si los errores mejoran o no. Eso con el objetivo de que nos
ayude a mirar arreglo por arreglo (variable por variable) mirando así variables extremadamente
volátiles para poder recombinar con otro conjunto de operaciones, exponenciales y funciones
mezcladas en las variables independientes perfeccionando de alguna manera la regresión y
disminuyendo en si los errores encontrados en la regresión original.
10.3.4.4 MUTACIÓN
La mutación o como se conoce en este contexto “Evolución” es la última fase de la creación de
un algoritmo genético; más específicamente, el paso final de la regresión decisiva. En general es
considerado un operador secundario “Mutación”, de menor importancia que Selección y
Crossover o “cruce”, dado que se aplica a un bajo porcentaje de la población y su efecto no es
demasiado notable en la mayoría de los casos. Sin embargo existen Algoritmos Evolutivos (no
Genéticos) cuyo principal operador de búsqueda es la mutación (Will, 2012).
La idea detrás de los operadores de Mutación, es reproducir las mutaciones genéticas producidas
en cada generación (provenientes de errores de copia o transferencia en el ADN, etc.), como una
de las principales herramientas de la Evolución Natura. En los AG, el operador de Mutación
tiene varios objetivos: preservar la diversidad genética de la población evitando la convergencia
prematura, explorar áreas posiblemente no abordadas del espacio de búsqueda (y cercanas a una
buena solución), sacar al AG de un máximo local si se produjo convergencia prematura, etc.
Debido a esto las variables manejadas en el entorno del programa, serán mutadas de manera
detallada al sesgo de error que se encuentre solucionando las variables dependientes resultantes
(dicho de otro modo las variables tratadas por los operadores, funciones y exponenciales);
Notándose el mínimo cambio posible que se pueda generar en esta. A continuación, se mostrara
un ejemplo más claro de lo que significa este operador:
𝑌 = {(𝑆𝑞𝑟𝑡(𝑥14))
7+ (𝐴𝑡𝑎𝑛(𝑥2
2))0
/(𝐶𝑠𝑐ℎ(𝑥31))
1∗ (𝑆𝑒𝑐(𝑥4
7))8
+. . }
𝑌 = {(1000,42) + (8,05)/(1,01 ) ∗ (70) + ⋯ . }
Ecuación 10: Regresión hibrida con operadores de selección y cruzamiento
[56]
𝒀 = {(𝑺𝒒𝒓𝒕(𝒙𝟏𝟒))
𝟕
+ (𝑨𝒕𝒂𝒏(𝒙𝟐𝟐))
𝟎
/ (𝑪𝒔𝒄𝒉(𝒙𝟑𝟓))
𝟏
∗ (𝑺𝒆𝒄(𝒙𝟒𝟕))
𝟖
+. . }
𝑌 = {(1000,42) + (8,05)/(30,15 ) ∗ (70) + ⋯ . }
Ecuación 11: Regresión Mutada Final
Como se puede observar, la regresión hibrida tuvo una sola modificación que cambia
drásticamente la solución de la variable independiente X3 por lo que a esto se denomina como
variable mutada. Si y solo si esta variable muestra alguna mejora en la regresión; esta quedara
guardada en la regresión final para optimizar el Y Estimado para al fin, disminuir los errores
posibles. De ser así mirar todos los X3 de los demás predios y analizar la mejor solución.
10.3.4.5 AJUSTE DE BETAS
Para describir más acerca de un ajuste de betas o estimadores, primero toca definir que es uno.
En muchos libros y algunos artículos econométricos, en algunos aspectos es un estadístico (es
decir, es una función de la muestra) usado para estimar un parámetro desconocido de la
población. Por ejemplo, si se desea conocer el precio medio de un artículo (el parámetro
desconocido) se recogerán observaciones del precio de dicho artículo en diversos
establecimientos (la muestra) y la media aritmética de las observaciones puede utilizarse como
estimador del precio medio. Para cada parámetro pueden existir varios estimadores diferentes. En
general, escogeremos el estimador que posea mejores propiedades que los restantes, como
insesgadez, eficiencia, convergencia y robustez “Consistencia” (Biomatemática, 2012).
Inmediatamente, usaremos los estimadores para promediar los pesos que se presentan en las
variables independientes resueltas; no siendo más buscaremos mejorar las variables tratadas por
medio de estimadores. Llamarlos constantes o Betas que como existen valores volátiles nos
validara de que todas las variables sea (area_construccion/area_terreno, area_uso, puntaje,
vetustez, x(coord) e y(coord)). Tendrían un alto sesgo aun teniendo la regresión sin un estimador
fijo. Por lo que en el software ponderara algunos betas acompañados de cada variable
independiente tratada al ser multiplicada y obtener un resultado más razonable.
𝑌 = {(𝑆𝑞𝑟𝑡(𝑥14))
7+ (𝐴𝑡𝑎𝑛(𝑥2
2))0
/(𝐶𝑠𝑐ℎ(𝑥31))
1∗ (𝑆𝑒𝑐(𝑥4
7))8
+. . }
Ecuación 12: Regresión final mediante Algoritmos Genéticos (AG’s)
𝑌 = {𝛽0(𝑆𝑞𝑟𝑡(𝑥14))
7+ 𝛽1(𝐴𝑡𝑎𝑛(𝑥2
2))0
/𝛽2(𝐶𝑠𝑐ℎ(𝑥31))
1∗ 𝛽3(𝑆𝑒𝑐(𝑥4
7))8
+. . }
Ecuación 13: Regresión final con estimadores
[57]
Para este caso; se utilizara valores entre 0 y 1 debido a que los pesos para las variables deben de
ser mínimos y consecuentes con el ejercicio. Manejando aun así un criterio de validez en la
regresión resultante.
10.4 BITACORA EXPERIMENTAL
La bitácora experimental trata de mostrar los pasos que se deben de llevar a cabo en cuanto al
manejo del software. Viendo así todo el procedimiento y requisitos que necesita este para tener
una solución aceptable en la consistencia de la regresión. Antes de comenzar, se debe mirar muy
bien cómo se diseñara la hoja de cálculo o BD de Excel (.xls)
Ilustración 17: Base de datos en Excel donde se guardara en Matlab VCONS
Como ejemplo, la Ilustración 10 se puede ver una hoja de cálculo cualquiera donde aparecen
columnas con nombres como ID, Y, X1, X2, X3,…, X6. Esa fila son denominadas las filas de
tanto la variable dependiente que vamos a calcular (Y Estimado) como la variable identificadora
(ID), y sus variables independientes (X1, X2, X3, X4, X5 y X6). Lo único que se compilara con el
programa es guardarlo en una base de datos mediante la opción xlsread.
Como se puede mostrar en la Ilustración 11, aparece en la imagen izquierda donde se almacena
la BD tanto de Excel (.xls) como la nueva BD de Matlab (.mat) que se llamara basededatos2.mat
convirtiendo a partir de la tercera fina hacia abajo todos los números tipo grandes, decimales, o
enteros (double, float, o int). Esto con el objetivo de que toda la base de datos se maneje dentro
de un mismo formato; primero exportamos la BD de Excel por medio de la interfaz del programa
como se muestra en la imagen de la derecha dando clic a la pestaña Excel, luego al hacer esta
operación saldrá una ventana que dirá Base de datos actualizada y finalmente al abrir
basededatos2.mat en Matlab aparecerá la misma BD de Excel pero montada en una hoja de
cálculo perteneciente a Matlab.
[58]
Ilustración 18: BD .mat almacenada y exportada desde el software conocido como interfaz
Luego, comenzamos con la Generación de Población Inicial como se muestra en la misma Ilustración
17. En el diagrama de interfaz podemos observar que aparece dicha opción pero esta solo función si se ha
cargado instantáneamente la BD.mat en consola; damos clic y debe aparecer una pestaña flotante como
se observa en la Ilustración 18.
Ilustración 19: Ventana flotante recopilando las mejores regresiones para la clasificación deseada
La imagen de por si no hace sino capturar las regresiones; pero dentro del programa se están
reordenando todas las opciones con las cuales van a acompañar las variables independientes que
entre si resolverán Y Estimado. Como en este medio se procede a operar simultáneamente las
operaciones de un AG’s como Selección y Cruzamiento “Crossover” Terminando este ítem se
obtendrá las regresiones y errores respectivos dentro de la carpeta origen siguiendo así con la
siguiente opción de algoritmo Evolucionar conocido también como Mutación. Este consiste en
mirar variable por variable y analizar que variable es la que presenta más incertidumbre en la
regresión; Teniendo en cuenta que se observa toda la columna en que se estudia la regresión y no
solo el dato que estudia la misma. Por consiguiente aparecerá una ventana flotante en la que se
ejecutara el proceso de evolución y hasta que llene la barra de la ventana flotante, no se
interrumpirá el proceso evolutivo.
[59]
Ya dado este paso, podemos observar tanto la regresión como los resultados de esta y los
respectivos errores que se obtuvieron a partir del software; en la opción ver regresión que
aparece al lado derecho de la opción Evolucionar. Como se ve en la Ilustración 19, observamos
que en la ventana flotante aparece una tabla mostrando tres columnas; Y Estimado (Real), Y Calculado
(Regresión) y Errores; ya que la regresión calculada se encontrara en el command Window de
Matlab de la siguiente manera:
Ilustración 20: Tabla final con los errores de cada regresión, la solución de la regresión y el parámetro fijado
Ilustración 21: Regresión obtenida del programa guardado en consola “Command Window”
Ya por último, nos queda no más la opción Ajustar betas como se muestra en la Ilustración 17
donde solo queda por colocar los estimadores para ponderar con los mismos pesos todas las
variables a describir nuestra regresión. Para finalizar, solo queda la misma tabla con los errores
modificados y la regresión estimada final.
[60]
@(𝑋)(0.99721 ∗ ((𝑎𝑡𝑎𝑛(𝑋(1)^1))^5)) ∗ (0.9997 ∗ ((𝑡𝑎𝑛(𝑋(2)^3))^6)) + (0.99707 ∗
((𝑎𝑐𝑜𝑠(𝑋(3)^9))^2)) ∗ (0.74912 ∗ ((𝑎𝑡𝑎𝑛(𝑋(4)^8))^8)) + (0.89765 ∗ ((𝑎𝑠𝑒𝑐(𝑋(5)^1))^5)) ∗ (0.99998 ∗
((𝑙𝑜𝑔10(𝑋(6)^9))^4))
Ecuación 14: Regresión final con ajuste de betas
Si todo el ejercicio quedo bien se observara que los errores han disminuido con respecto a los
errores hallados en la regresión sin estimadores; sino toca volver a realizar la generación de
individuos hasta que esta sea competente con la teoría dada en el marco teórico.
“Una de las razones por la cual es de vital interés tener en cuenta los AG es que estos son un
método global y robusto de búsqueda de las soluciones de problemas cuya principal ventaja de
esta inteligencia es el equilibrio alcanzado entre la eficiencia y eficacia para resolver diferentes
y muy complejos problemas de grandes dimensiones” (Holland, 1989).
10.5 RESULTADOS
Los resultados obtenidos en este trabajo se acuerdan a los diversos escenarios (experimentos) por
el cual se tuvo que someter los datos; se presentaron diferentes comprobaciones como:
Clasificación al 100% de los datos crudos mediante escalamiento.
Clasificación al 100% de los datos mediante [Código_Sector] según UPZ.
Clasificación al 100% de los datos mediante [Código_Uso] según UPZ.
Clasificación al 100% de los datos mediante [ZHF] según UPZ.
Clasificación entre 66% de los datos mediante el programa creado (entrenamiento) y el
33% restante transcribiendo la regresión a cada variable dependiente mediante Excel.
Clasificación entre 66% de los datos mediante el programa creado (entrenamiento) y el
33% restante transcribiendo la regresión a cada variable dependiente mediante Excel
comprobando estos dos porcentajes y comparándolos mediante MRL (Modelo de
Regresión Lineal).
Asimismo, analizando de que los mejores resultados sean puestos dentro del objetivo a resolver y
diagnosticando los pro y contra de cada clasificación que tuvo el software a lo largo del proceso.
A continuación, se mostrara cada ejemplo de clasificación planteada mediante una tabla resumen
en donde se ven involucrados tanto las (4) variables independientes a calcular, como sus
respectivos errores y su respectiva explicación:
Nota:
“Para la primera clasificación (Clasificación al 100% de los datos crudos mediante
escalamiento) no se pudo obtener un cuadro resumen debido a que esta nunca se obtuvieron
resultados porque el programa no alcanzo a compilar todos los datos (excesivos) para ambas
UPZ”.
[61]
CLASIFICACIÓN SEGÚN CÓDIGO DE SECTOR UPZ BOLIVIA
Tabla 8: Cuadro resumen según Código de Sector UPZ Bolivia
Fuente: Excel 2010
Como se puede observar, tenemos una tabla con errores tanto mínimos, máximos y promedios que determinan que tan cerca o que tan
lejos esta la solución de la regresión frente al valor real determinando en las 4 variables independientes (Vm2C -Vm2T -VtC -VtT).
[62]
CLASIFICACIÓN SEGÚN CÓDIGO DE SECTOR UPZ GRANJAS DE TECHO
Tabla 9: Cuadro resumen según Código de Sector UPZ Granjas de Techo
Fuente: Excel 2010
Se visualiza la tabla donde vemos el mismo formato al anterior pero con diferentes valores y UPZ. Los errores máximos de Vm2C y
VtT, se entiende que padece un valor totalmente desorientado con la realidad (938%-238%) pero aun así, su valor promedio esta en los
estándares más conocidos como normales “porcentaje de dos dígitos”. Esto se debe a que existen diferentes valores los cuales tienen a
ser atípicos a la muestra promedio; por decirlo de otro modo se tienen valores extremadamente altos y/o bajos que hacen que los
errores aumenten considerablemente y afectan a la muestra de datos totales conocidos o clasificados como Codigo_Sector.
[63]
CLASIFICACIÓN SEGÚN CÓDIGO DE USO UPZ BOLIVIA
Tabla 10: Tabla 11: Cuadro resumen según Código de Uso UPZ Bolivia
Fuente: Excel 2010
Ahora, se clasifico mediante el código Uso que se refiere a que uso tiene la UPZ; este uso es de tipo residencial y al parecer según el
número de datos parece ser que esta tipología pertenece a residencial PH. Acontecen los mismos resultados que en las clasificaciones
pasadas, solo que en este caso los errores promedios se mantienen por debajo del 60% pero los errores máximos aumentaron debido a
que el terreno para algunos usos se ve afectado por una diferenciación de valor monetario bastante enorme.
[64]
CLASIFICACIÓN SEGÚN CÓDIGO DE USO UPZ GRANJAS DE TECHO
Tabla 12: Cuadro resumen según Código de Uso UPZ Granjas de Techo
Fuente: Excel 2010
Para esta UPZ, se verifica que existe un gran error tanto de porcentajes como de valores monetarios; esto se debe a que los usos de
esta UPZ son bastante disparejos. Como se puede visualizar, los errores máximos tienden a tener una ilógica bastante irracional dando
como resultados en variables (Vm2C-Vm2T-VtC) porcentajes hasta de 7 dígitos y hablando específicamente del error promedio
resaltando sus valores sumamente irracionales tendiendo a cifras de miles cuando el tope máximo al que se debe permitir un error
matemático hablando en términos de cifras es hasta 2 cifras como máximo o hasta llegar al error total denominado 100%.
[65]
CLASIFICACIÓN SEGÚN ZHF UPZ BOLIVIA
Tabla 13: Cuadro resumen según ZHF UPZ Bolivia
Fuente: Excel 2010
Como hasta ahora se observa, los errores han venido disminuyendo considerablemente con esta
clasificación; los errores oscilan entre 0% hasta 51% por lo que se entiende que mejoro esta
clasificación respecto a Codigo_Sector y Codigo_Uso. Las ZHF nos da a entender que a partir de
la generación de un código único constituido por 13 dígitos ubicado en la tabla en la parte
superior izquierda que me explica detenidamente todas sus características explicadas en la
página 61, vienen siendo una nomenclatura más favorable a la hora de calcular valores
monetarios; por lo que no oscilan entre un conjunto de muestras o si existe alguna evidencia de
lo contrario debe de ser por una característica particular. Detengámonos por un momento en ver
las nuevas casillas denominadas Avaluó. Esta nueva variable se estableció debido a que se debe
comparar las variables independientes que comportamiento tienen hacia está logrando así que
estas misma me expliquen la variable nueva. Para nosotros nos interesa saber que tan
aproximado debe de ser las variables independientes para estimar la variable dependiente. Que
en este caso parece ser bastante precisa teniendo en cuenta el número de datos a estimar en toda
la ZHF “200 datos” y que tan exacto debe de ser estos valores si sumando tanto Suma Regresión
(VtC+VtT) ≈ Suma Regresión (Avaluó) como normalmente se calcula un avaluó “Remitirse al
Marco teórico conceptual-Avalúos”.
[66]
CLASIFICACIÓN SEGÚN ZHF UPZ GRANJAS DE TECHO
Tabla 14: Cuadro resumen según ZHF UPZ Granjas de Techo
Fuente: Excel 2010
También sucede en esta UPZ; Granjas de techo como se ha mencionado antes y se ha
evidenciado en el marco teórico es una zona donde realmente la mayoría de su uso es de tipo
industrial; pero también existen lugares donde hay usos residenciales y presencialmente en
normatividad de PH. Para este caso no es la excepción; teniendo un total de 200 predios en esta
ZHF, los errores se comportan de una manera idónea y precisa; de la misma forma a como se
comporta en la anterior UPZ, solo que en este caso el error máximo aumento un 3% en las
variables (Vm2C-Vm2T) suele ocurrir esta diferencia debido a las áreas por las cuales ha sido
sometida la muestra; que tienden a variarse como hoy sucede en la actualidad; el área de
construcción la destinan en un apartamento a medida de que el número de piso sea mas alto.
Posiblemente sea una de las razones por las que cambia esta cifra pero si se fija mejor en las
otras dos variables, se analizara que los valores tienden a ser pequeños. Lo más importante como
se resaltó antes, es que estos resultados cumplan con aproximarse mucho a la casilla de Avaluó.
Tanto la suma de regresión de las variables (VtC+VtT) sea aproximadamente igual a la suma de
regresión de la columna avaluó. Si es así es porque las ecuaciones debajo de estas tablas son
correctas y por consiguiente la fila Regresión Resultante Avaluó Catastral también es válida.
[67]
Es evidente que las mejores clasificaciones (clústeres) que se han venido acoplando a nuestro
propósito ideal ha sido clasificar los datos mediante ZHF por definir la mejoría de errores y
precisión a la hora de conseguir nuestros resultados reales mediantes las regresiones calculadas.
Viéndose de este modo si se ha llegado a mejorar este tipo de incógnitas mediante los AG´s para
encontrar una fórmula que me ayude a resolver un montón de datos aleatorios con una única
solución a nivel masivo.
Algo importante que se ha de recalcar es que este tipo de experimentaciones se llegan a realizar
para verificar que tan precisa puede ser la situación por la cual se quiera resolver el problema;
dicho de otro modo, no todos los experimentos funcionan siempre para diagnosticar un
paradigma. Pensándolo así pueda que haya sido solo la clasificación ZHF la más específica y
más rigurosa clasificación posible para limitar mejor tanto uso como condición física posible de
un grupo de barrios y predios atados a una UPZ heterogénea.
Ilustración 22: Componentes de una ZHF Urbana (COLOMBIA, 2011)
Ahora bien, se ha comprendido de que esta herramienta nos ayuda a evidenciar que las
regresiones mediante AG´s si han sido eficientes pero a la hora de comprobar estas situaciones
no tenemos alguna idea de que realmente si sean certeras por lo que ahora lo que nos toca
empezar a construir son algunos intentos o conocimientos claves de los cuales vamos a
reemplazar este tipo de regresión en algunos datos aleatorios para poder verificar mejor si este
modelo es útil o no. “este tipo de experimento, solo se comprobara con la clasificación ZHF”.
FLUJOGRAMA PARA DETERMINACION DE ZONAS
HOMOGENEAS FISICAS CON VIGENCIA DEL 2005
Según la Ley 14 de 1983 y la Resolución 2555 de 1988 del IGAC, la cual
reglamenta los procesos de formación, actualización de la formación y
conservación catastral, definen ZHF como aquellos espacios geográficos dentro
del perímetro urbano con características similares que permitan diferenciar
estas áreas de las adyacentes. En la ciudad de Bogotá, hay como características
físicas relevantes y que permiten a su vez determinar el valor por m2 de terreno
las siguientes:
DESTINACION
ECONOMICA
Clase de suelo Área de
actividad Tratamiento
ADECUACIÓN AL
USO URBANO
Topografía. Vías. Servicios
USO DE LOS INMUEBLES
Actividad económica del inmueble.
Tipo según actividad del inmueble.
[68]
ENTRENAMIENTO Y PRONOSTICO UPZ BOLIVIA MEDIANTE ZHF
Tabla 15: Cuadro resumen según ZHF E-P UPZ Bolivia
Fuente: Excel 2010
Para esta tabla, se observa que existen dos columnas debajo de las variables a encontrar conocidas como Entrenamiento-pronostico,
la cual su función es dividir la ZHF en dos muestras (66%-33%) teniendo en recuadro Numero de datos (132+68) se agrupo los datos
totales de la ZHF y se proporcionó en los porcentajes mencionados; de tal modo que en la columna de entrenamiento están los datos
que se procesaron en el programa Matlab y el restante se reemplazó en la regresión obtenida obteniendo así el 100%. Esto se realizó
debido a que se necesita saber que tan confiable fue el AG’s con la primera regresión obtenida y revelar que es la mejor.
[69]
ENTRENAMIENTO Y PRONOSTICO UPZ GRANJAS DE TECHO MEDIANTE ZHF
Tabla 16: Cuadro resumen según ZHF E-P UPZ Granjas de Techo
Fuente: Excel 2010
Lo mismo pasa en esta UPZ; la intención es elegir un restante aleatorio y colocar esta regresión para verificar si sirve o no a la hora de
estimar avalúos de una misma ZHF. Se analiza mejor el cuadro y se puede entender que la diferencia entre los datos de entrenamiento
y pronóstico suelen ser bastante flexibles; teniendo en cuenta que los errores de pronóstico suelen tener mucha mejor precisión que los
de entrenamiento. Pueda que sea por sus datos a la hora de enlazarlos; o su equivalencia en el software Excel que aproxime mejor los
resultados; este fue un problema bastante comprensible porque Excel no maneja algunas funciones trigonométricas como (Cot-Sec-
Csc) sus inversas, hiperbólicas y obviamente hiperbólicas inversas por lo que tienen que encontrarse identidades trigonométricas.
[70]
Ya por último, para nombrar la sexta clasificación “Clasificación entre 66% de los datos
mediante el programa creado (entrenamiento) y el 33% restante transcribiendo la regresión a
cada variable dependiente mediante Excel comprobando estos dos porcentajes y comparándolos
mediante MRL”, se observó de que las ZHF ayudan a puntualizar los datos de una manera más
cómoda para diferenciarlos de otros por medio de sus “espacios geográficos con características
similares en cuanto a vías, topografía, servicios públicos, uso actual del suelo, norma de uso del
suelo, tipificación de las construcciones y/o edificaciones, áreas homogéneas de tierra,
disponibilidad de aguas superficiales permanentes u otras variables que permitan diferenciar
estas áreas de las adyacentes” (COLOMBIA, 2011).
Para esta clasificación se tuvo que elaborar una Regresión Lineal mediante la herramienta de
Excel para verificar que tan viable puede ser están herramienta frente a modelos de regresión
tradicionalmente utilizados como se viene haciendo durante toda la investigación. El MRL o
modelo de regresión lineal es el más utilizado a la hora de predecir los valores de una variable
cuantitativa a partir de los valores de otra variable explicativa también cuantitativa regresión
lineal simple). Una generalización de este modelo, el de regresión lineal múltiple, permite
considerar más de una variable explicativa cuantitativa. Por otra parte, tal como se verá en un
tema posterior, es también posible incluir variables explicativas categóricas en un modelo de
regresión lineal si se sigue una determinada estrategia en la codificación de los datos conocida
como codificación ficticia (Molina & Rodrigo, 2009).
Consiste en tener la solución de los datos experimentados (66%) de la ZHF respectiva y generar
tanto los errores del AG´s del software, como los errores producidos del MRL generados por
Excel. De tal modo que los podamos comparar y a esos resultados también los logremos
reemplazar en los datos desconocidos “pronostico” para mirar que tan efectivos son estos dos
modelos que pueden representar de una manera óptima los datos en interés.
El MRL lo que nos va a retornar son unos coeficientes (Estimadores) que ayudan a encaminar a
las variables independientes a calcular de manera lineal nuestra variable dependiente o Y referencia.
En cuanto a nuestro algoritmo o llamarlo como MRNL (Modelo de Regresión No Lineal) nos
arrojara una ecuación como su nombre lo dice no lineal cuyo propósito en el problema es ayudar
a satisfacer por medio de datos desconocidos una pronta solución a la variable a calcular Y
referencia.
Ahora bien, en la siguiente página, se encontrara (1) ZHF de cada UZP (2) y se determinara cuál
de los dos modelos de regresión resulta ser el más efectivo aplicando tanto para los datos de
entrenamiento, como para los datos de pronóstico. Siendo así el último con más peso de
importancia debido a que los modelos después de que se entrenen se enfrentaran a los datos
restantes de la ZHF y por el cual no se tiene conocimiento alguno de que esos modelos se
aplicaran o no para este tipo de datos (selección de datos de manera random-aleatorio).
[71]
ENTRENAMIENTO Y PRONOSTICO UPZ BOLIVIA MEDIANTE ZHF-MRL
Tabla 17: Cuadro resumen de la UPZ Bolivia ZHF_MRL
Fuente: Excel 2010
Es evidente que para esta clasificación, debe tener en cuenta un ítem novedoso denominado como MRL (Error, Promedio y Suma);
como se explicó en los párrafos anteriores, la intención de este es verificar y comparar la regresión múltiple obtenida durante todo el
trabajo de investigación referente a este modelo de regresión tradicional validando que tan confiable puede ser este método para en
algún momento estimar mejor avalúos masivos. Aclarando aquí que para esta ZHF los datos de entrenamiento se comportan de mejor
manera con el MRL respecto a MRNL; pero a la hora de examinar los datos de pronostico parece comportarse mejor el MRNL que el
MRL simplemente porque al reemplazar los coeficientes del ya mencionado son bastantes sesgados los resultados de estos.
[72]
ENTRENAMIENTO Y PRONOSTICO UPZ GRANJAS DE TECHO MEDIANTE ZHF-MRL
Tabla 18: Cuadro resumen de la UPZ Granjas de techo ZHF_MRL
Fuente: Excel 2010
Ya para finalizar, se observa detenidamente como los cambios que se dan tanto para los datos de entrenamiento de MRL como de
pronóstico del ya mencionado son sumamente diferenciados frente a los datos entrenamiento-pronóstico del MRNL. Los errores
promedio de MRNL y MRL son bastante notorios en pronostico cayendo así el MRL como insuficiente frente a los errores de
pronostico en MRNL; no digo que del todo sea malo sino que cuando se entrena unos datos parece que es mejor el MRL; pero cuando
RL con los estimadores resultantes de entrenamiento unos datos aleatorios tienen una mejor estimación el MRNL que el MRL.
[73]
10.6 ANÁLISIS DE RESULTADOS
Entendiendo mejor lo construido hasta este instante y según los resultados mostrados en el tema
anterior, podemos decidir que para estos datos el modelo de regresión que más ha sido útil a la
hora de evaluar un conjunto de información tanto homogénea como heterogénea es el Modelo de
Regresión Múltiple resulto mediante Algoritmos Genéticos. Indudablemente, para encontrar este
tipo de hipótesis certera se expuso esta herramienta mediante diferentes experimentos y
clasificaciones y que así mismo ayudaron a establecer una solución real que compromete tanto
nuestros objetivos afines como investigaciones a continuar.
Ahora bien, para cada UPZ se escogerá dos (2) ZHF en las cuales una (1) tendrá el uso de
Residencial PH y la otra tendrá también por consiguiente el uso Residencial con diferente norma
NPH. Se analizara estos datos en especial los errores promedio mediante Gráficos de dispersión
y de comparación con tres variables entendiendo mejor el comportamiento de los datos; también
se comenzara por entender los diferentes errores por los cuales son sometidos los resultados para
entender mejor la situación existente.
RAE (Relative Absolute Error)
La RAE o en términos comprensibles (Error Absoluto Relativo), es el promedio de los valores
reales por lo tanto, el error cuadrático relativa toma el error cuadrático total y normaliza
dividiendo por el error cuadrático total de la sencilla predictor.
𝑅𝐴𝐸 =∑ |𝑃(𝑖𝑗) − 𝑇𝑗|𝑛
𝑗=1
∑ |𝑇𝑗 − �̅�|𝑛𝑗=1
Ecuación 15: Formula implícita de RAE
Dónde:
𝑃(𝑖𝑗) = 𝐷𝑎𝑡𝑜 𝑖𝑛𝑐𝑖𝑐𝑖𝑎𝑙 (𝑖) 𝑟𝑒𝑐𝑜𝑟𝑟𝑖𝑒𝑛𝑑𝑜 (𝑗) 𝐷𝑎𝑡𝑜𝑠 𝑚𝑎𝑥𝑖𝑚𝑜𝑠
𝑇𝑗 = 𝐸𝑟𝑟𝑜𝑟 𝑑𝑒𝑠𝑒𝑎𝑑𝑜
�̅� = 𝐸𝑟𝑟𝑜𝑟 𝑑𝑒𝑠𝑒𝑎𝑑𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜
MAE (Mean Absolute Error)
MAE (Error Absoluto Medio), es una medición de incertidumbre que tiende a calcularse con la
misma unidad que los datos originales, y sólo se puede comparar entre los modelos cuyos errores
se miden en las mismas unidades. Por lo general es similar en magnitud al RMSE, pero
ligeramente más pequeño.
[74]
𝑀𝐴𝐸 =∑ |𝑃(𝑖𝑗) − 𝑇𝑗|𝑛
𝑗=1
𝑛
Ecuación 16: Formula implícita de MAE
Dónde:
𝑃(𝑖𝑗) = 𝐷𝑎𝑡𝑜 𝑖𝑛𝑐𝑖𝑐𝑖𝑎𝑙 (𝑖) 𝑟𝑒𝑐𝑜𝑟𝑟𝑖𝑒𝑛𝑑𝑜 (𝑗) 𝐷𝑎𝑡𝑜𝑠 𝑚𝑎𝑥𝑖𝑚𝑜𝑠
𝑇𝑗 = 𝐸𝑟𝑟𝑜𝑟 𝑑𝑒𝑠𝑒𝑎𝑑𝑜
𝑛 = 𝑁𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠
RRSE (Root Relative Squared Error)
RRSE (Raíz Cuadrada del Error Relativo), Viene siendo la raíz cuadrada que se obtiene a partir
de la normalización del pronóstico de incertidumbre en RAE. Se utiliza para precisar un error
parsimonioso en cuanto a las unidades que maneje.
𝑅𝑅𝑆𝐸 = √∑ (𝑃(𝑖𝑗) − 𝑇𝑗)
2𝑛𝑗=1
∑ (𝑇𝑗 − �̅�)2𝑛
𝑗=1
Ecuación 17: Formula implícita de RRSE
Dónde:
𝑃(𝑖𝑗) = 𝐷𝑎𝑡𝑜 𝑖𝑛𝑐𝑖𝑐𝑖𝑎𝑙 (𝑖) 𝑟𝑒𝑐𝑜𝑟𝑟𝑖𝑒𝑛𝑑𝑜 (𝑗) 𝐷𝑎𝑡𝑜𝑠 𝑚𝑎𝑥𝑖𝑚𝑜𝑠
𝑇𝑗 = 𝐸𝑟𝑟𝑜𝑟 𝑑𝑒𝑠𝑒𝑎𝑑𝑜
�̅� = 𝐸𝑟𝑟𝑜𝑟 𝑑𝑒𝑠𝑒𝑎𝑑𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜
RMSE (Root Mean Squared Error)
El RMSE (Raíz de Error Medio Cuadrático), Es la raíz del promedio de los cuadrados del error
de cada artículo o periodo y también se utiliza para comparar y seleccionar la precisión de
diferentes métodos de pronóstico. La diferencia es que el resultado está en las unidades
originales.
𝑅𝑀𝑆𝐸 = √1
𝑛∑(𝑃(𝑖𝑗) − 𝑇𝑗)
2𝑛
𝑗=1
Ecuación 18: Formula implícita de RMSE
[75]
Dónde:
𝑃(𝑖𝑗) = 𝐷𝑎𝑡𝑜 𝑖𝑛𝑐𝑖𝑐𝑖𝑎𝑙 (𝑖) 𝑟𝑒𝑐𝑜𝑟𝑟𝑖𝑒𝑛𝑑𝑜 (𝑗) 𝐷𝑎𝑡𝑜𝑠 𝑚𝑎𝑥𝑖𝑚𝑜𝑠
𝑇𝑗 = 𝐸𝑟𝑟𝑜𝑟 𝑑𝑒𝑠𝑒𝑎𝑑𝑜
𝑛 = 𝑁𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠
MAPE (Mean Absolute Percentage Error)
MAPE (Error Porcentual Absoluto Medio), es la media de los errores porcentuales en valor
absoluto, no considera el signo del error sólo la magnitud. Es una de las medidas más utilizadas a
nivel mundial y casi siempre se es nombrada como la mejor.
𝑀𝐴𝑃𝐸 =
∑𝑃(𝑖𝑗) − 𝑇𝑗
𝑃(𝑖𝑗)
𝑛𝑗=1
𝑛
Ecuación 19: Formula implícita de MAPE
Dónde:
𝑃(𝑖𝑗) = 𝐷𝑎𝑡𝑜 𝑖𝑛𝑐𝑖𝑐𝑖𝑎𝑙 (𝑖) 𝑟𝑒𝑐𝑜𝑟𝑟𝑖𝑒𝑛𝑑𝑜 (𝑗) 𝐷𝑎𝑡𝑜𝑠 𝑚𝑎𝑥𝑖𝑚𝑜𝑠
𝑇𝑗 = 𝐸𝑟𝑟𝑜𝑟 𝑑𝑒𝑠𝑒𝑎𝑑𝑜
𝑛 = 𝑁𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠
Este tipo de errores son mencionados a consecuencia de que todos ellos dicen que los resultados
más alejados entre sí son sus valores más aproximados del valor real (𝑇𝑗) como muestra de una
particularidad se dice que entre el RMSE y MAE es menor, es mucho mejor el modelo
replanteado (mayor precisión); mientras que los errores RRSE y RAE, Difieren con los datos
medios dependiendo que tan cerca o lejos se encuentra del punto medio (Mean) y el error
MAPE; viene siendo el mejor error posible que podamos obtener a partir de los pesos
porcentuales que tienen cada error absoluto resultante del algoritmo genético “para nuestro caso
es equivalente al error absoluto que posee cada predio” (García Jimémez & Álvarez Sierra,
2003).
En cuanto a estos valores, fueron analizados y resueltos mediante WEKA aplicando una
clasificación en función de una regresión lineal; para usar el criterio akaike (AIC) que me ayuda
a definir el mejor error posible, adquiriendo así la mejor predicción de errores. Ahora bien, se
destinara un cuadro resumen en el que se observara los errores ya mencionados respecto al tema
anterior y se confrontara del mismo modo los resultados obtenidos en el MRNL.
[76]
ANALISIS DE ERRORES ZHF UPZ BOLIVIA
Tabla 19: Errores estimados de la UPZ Bolivia
Fuente: Excel 2010
Estos cuadros nos ayudan a visualizar mejor una mayor probabilidad de precisión a la hora de
encontrar errores; como ya se entiende de las anteriores definiciones, los errores RAE y RRSE
entre más alto tenga sus porcentajes más correlacionados están los valores entre sí. Por decirlo de
otro modo están más cercanos a ser exactos (parecidos) unos de otros; por otro lado, los errores
RMSE y MAE nos ayuda a evidenciar que tan aproximados son los resultados del cero absoluto
en el que llegando a esta valor significa que los valores son los más adecuados en la ecuación.
Las ecuaciones de cada uno de esta simbología de errores es completamente diferente y esto a su
vez tiene diferente interpretación por lo que se recomienda leer detenidamente que significa cada
uno de estas. Esto solo nos dice estadísticamente que tan cercano y lejano se comporta los datos
del ideal.
[77]
ANALISIS DE ERRORES ZHF UPZ GRANJAS DE TECHO
Tabla 20: Errores estimados de la UPZ Granjas de Techo
Fuente: Excel 2010
Para esta ZHF pasa lo mismo pero con la diferencia que la simbología de errores tanto RAE
como RMSE aumentaron considerablemente frente a la otra UPZ Bolivia; se tiene la misma
interpretación que las dos mencionadas ahorita tienen a aproximarse más a cero y por lo que nos
dice que estos errores son consistentes con los que hemos encontrado durante todo el proceso y
lo mismo para con la simbología RAE y RRSE que en otras tienden a tomar valores altos en sus
porcentajes para mirar la correlación en estos. Este tipo de errores fueron encontrados y
diagnosticados mediante el software WEKA cuya función principal es mirar mediante teoría de
errores que tan familiarizados están estos errores mediante a un modelo lineal cuya muestra no es
más que un común de datos divididos en dos muestras (entrenamiento y pronostico) como se
examinó en los anteriores cuadros y que nos ayudan a encontrar un común error para establecer
[78]
este tipo de interpretaciones “dicho esto en los enunciados anteriormente mencionados en los
cuadros.
A continuación, se entenderá que los errores para la UPZ Bolivia, alcanzan un porcentaje entre
(1% - 12%) para los factores MAE – RMSE; como se describió antes, estos valores tienen que ser
bastantes pequeños frente al error óptimo que se tiene en interés. Por otro lado, se observa los
factores RAE – RRSE que de por sí, son valores cuyos porcentajes son bastante altos y esto se
debe debido a que alcanzan el máximo índice que puede tener una variable respecto al valor
medio de este; aunque para esta UPZ al ver estos indicativos notamos de que sus valores no son
tan grandes como se debería expresar. Esto sucede al verificar de que los datos poseen un patrón
homogéneo y estático, esto ocurre que los datos sean rígidos a la hora de evaluarlos.
Ahora bien, se entiende mejor el concepto de exactitud de acuerdo a las aclaraciones que se han
mencionado en los párrafos anteriores; de como determinar qué tan cercano o lejano estamos de
poder encontrar nuestra solución óptima y que limitantes se han presentado en el transcurso de la
investigación. Que no solo basta con obtener la ecuación anhelada para responder con nuestro
espécimen en cuestión sino que para colmo, se tiene que patentizar y certificar de que esta
solución sea la más recomendable a la hora de esquematizar otra teoría diferente a la que se ha
venido utilizando en el catastro convencional.
Para ilustrar de mejor manera lo que se ha simulado como AG’s, se creara un ítem adicional el
cual se expresara de manera visual, la mejora que se ha tenido al implementar esta herramienta
respecto a la creación de modelos lineales vistos conmensuradamente para aplicar avalúos
masivos dentro de un régimen estrictamente econométrico. No lo digo porque la econometría sea
un factor bastante rígido para explicar de manera teórica la explicación de cada supuesto sino
que viendo más allá de esta disciplina, podemos abordar de manera sencilla, todo este tipo de
conocimientos a través de una herramienta practica como lo es el rompimiento total del
paradigma de programación.
10.6.1 GRAFICO DE TENDENCIA LINEAL
En este inciso se va a visualizar mejor la tendencia que tienen los datos tanto (Valor Real, Valor
Regresión y Valor Lineal tanto de Entrenamiento y Pronostico) haciendo ilustración tanto para
las variables dependientes a calcular (Vm2T, Vm2C, VtT, VtC) y por último el avalúo obtenido
según la UAECD y como variable independiente “Resuelto en los AG’s” verificando asi el
comportamiento de cada uno de estas trazando una recta con la cantidad de datos según arrojados
en la etapa de pronóstico.
En este caso se realizara estos gráficos de acuerdo con la Tabla 18 del inciso de resultados en el
cual la mayoría de los datos poseen un error pequeño del MRNL en cuanto al pronóstico de los
datos frente al MRL cuyos valores son bastantes extravagantes al valor ideal que se debe
comparar “Valor Real”.
[79]
UPZ GRANJAS DE TECHO ZHF 6222115153113
Entrenamiento
Pronostico
Ilustración 23: Tendencia Lineal Entrenamiento-Pronostico del Vm2C Fuente: Excel 2010
En estos diagramas de tendencia lineal, como también encontraran para cada variable a calcular, tenemos tres (3) representaciones
lineales que son el resultado de confrontar los tres valores a comparar (Valor real “línea roja”, Valor de regresión “línea verde” y
Modelo de Regresión Lineal “línea azul”). Se observa que en ambos gráficos aparecen estas tres líneas pero en la gráfica pronostico
aunque no se note, la línea roja y verde son casi la misma debido a que su diferencia de valores es casi nula mientras que la línea azul,
tiende a ser más baja que las ya mencionadas. El grafico de entrenamiento se analiza que el valor más aceptado en aproximación al
valor real es el ML siendo este mucho mejor al MRNL.
Para entender mejor los resultados proyectados por los gráficos los puedes comprobar en la Tabla 21 sobre los cuales están tanto los
valores mínimos, máximos y promedios de cada uno de las variables tanto para los diagramas de Entrenamiento como los diagramas
de Pronóstico. Detállese también que los valores de entrenamiento oscilan entre $ 750.000 y $ 751.000 hasta el dato 180 que tiende a
incrementarse hasta $ 753.000; pero en el grafico pronóstico, el ML padece tener un decaimiento de $ 100.000 por debajo del común.
748000
749000
750000
751000
752000
753000
7540001
19
37
55
73
91
10
9
12
7
14
5
16
3
18
1
19
9
21
7
23
5
Vm2C
REAL
REGRESION
ML
0
100000
200000
300000
400000
500000
600000
700000
800000
11
01
92
83
74
65
56
47
38
29
11
00
10
91
18
Vm2C
REAL
REGRESION
ML
[80]
UPZ GRANJAS DE TECHO ZHF 6222115153113
Entrenamiento
Pronostico
Ilustración 24: Tendencia Lineal Entrenamiento-Pronostico del VtC Fuente: Excel 2010
Para este escenario “VtC”, los gráficos padecen no tener una Línea Roja representando el Valor Real y esto se debe a que se acoplan
bastante los valores entre las líneas de Regresión y de Modelo Lineal. Explicando de una mejor manera, el diagrama entrenamiento
posee dos líneas las cuales el modelo de Regresión tiende a parecerse bastante al Modelo Lineal pero lo que no se percibe a simple
vista es que el Valor Real está casi pegado al Modelo Lineal; por lo que este modelo tiende a presentar mejores resultados en el
Modelo Lineal que en la Regresión; ahora determinemos mejor el grafico de pronóstico, aunque no se puede ver a primera intención,
el Valor Real y el modelo de Regresión son exactamente lo mismo con la única diferencia de que en el contraste de los colores, el
verde tiende a tener una tonalidad más fuerte; tendiendo a valores cercanos a $ 40’000.000, en cambio el Modelo Lineal suele oscilar
entre valores de $ 50’000.000 y $ 60’000.000 siendo un dato bastante lejano al ideal. Esto ocurre como se ha mencionado
anteriormente en las clasificaciones de los datos en los resultados obtenidos que los datos pronósticos tienen a mejorar el Modelo de
Regresión debido a que los estimadores del ML son bastantes sesgados respecto a la ecuación obtenida del AG’s.
38200000
38250000
38300000
38350000
38400000
38450000
38500000
385500001
20
39
58
77
96
11
5
13
4
15
3
17
2
19
1
21
0
22
9
VtC
REAL
REGRESION
ML
0
10000000
20000000
30000000
40000000
50000000
60000000
1
11
21
31
41
51
61
71
81
91
10
1
11
1
12
1
VtC
REAL
REGRESION
ML
[81]
UPZ GRANJAS DE TECHO ZHF 6222115153113
Entrenamiento
Pronostico
Ilustración 25: Tendencia Lineal Entrenamiento-Pronostico del Vm2T Fuente: Excel 2010
Hablando de otras variables importantes en la investigación, nos topamos con un gráfico en entrenamiento bastante peculiar; para
determinar “Vm2T” fue bastante impredecible calcular este tipo de soluciones con el AG’s del modelo Regresión; viéndose así en el
diagrama, se debe a que los datos resultantes tuvieron bastantes fluctuaciones inicialmente entre valores de $ 995.000 y $ 1’000.000
hasta el dato 180 que por lo que se considera como un aumento de esta cifra dando así valores oscilantes entre $ 1’005.000 y $
1’010.000. Mientras que los valores tanto para el Modelo Real y Modelo Lineal un valor exacto de $ 1’000.000 manteniendo la teoría
de que los datos de entrenamiento son mejores el Modelo Lineal que el Modelo de Regresión.
Pero no todo es preciso con este argumento; debido a que en el diagrama pronóstico se visualiza más a fondo los trazos de la Línea
Roja y Verde siendo más exactos con un valor aproximado de $ 1’000.000; mientras que la Línea Azul, decayó deliberadamente
retornando un valor exacto de $ 0 dando así que el comportamiento más adecuado de los resultados esperados se lo lleva el Modelo de
Regresión.
985000
990000
995000
1000000
1005000
1010000
10150001
20
39
58
77
96
11
5
13
4
15
3
17
2
19
1
21
0
22
9
Vm2T
REAL
REGRESION
ML
0
200000
400000
600000
800000
1000000
1200000
1
11
21
31
41
51
61
71
81
91
10
1
11
1
12
1
Vm2T
REAL
REGRESION
ML
[82]
UPZ GRANJAS DE TECHO ZHF 6222115153113
Entrenamiento
Pronostico
Ilustración 26: Tendencia Lineal Entrenamiento-Pronostico del VtT Fuente: Excel 2010
En este punto, notamos la imparcialidad que existe en el diagrama de entrenamiento y especialmente con los datos del Modelo de
Regresión. Seguimos observando este tipo de oscilaciones que nos resultan bastante confusas a la hora de interpretar y que por si fuera
poco alisan a los valores Reales y Lineales; suele verse que los resultados de la Regresión poseen en mismo comportamiento que la
variable “Vm2T” porque son dependiente una de la otra. Analizando los valores de cada recta, la Línea Roja (solución ideal) tiende a
tener valores entre $ 41’800.000 y $ 41’880.000; luego trazando la Línea Azul se puede proyectar a valores entre $ 41’850.000 hasta el
dato 191 cuyo valor se ve incrementado en $ 41’900.000 y por último la Línea Verde mostrando valores imprecisos entre $
41’513.000 y $ 42’222.000 siendo este la solución más dispersa posible. Sin embargo, el grafico de pronóstico, nos muestra lo
contrario. Dando así a la mejor respuesta del Modelo de Regresión y no del Modelo Lineal.
Observe solamente las líneas Roja y Verde que se mezclan entre si dando un valor de $ 42’000.000 entre ambas y que la Línea Azul
sigue sin dar vista a un valor parcial (Valor nulo) dando así mayor efectividad al Modelo de Regresión y no al Modelo Lineal.
41000000
41200000
41400000
41600000
41800000
42000000
42200000
424000001
20
39
58
77
96
11
5
13
4
15
3
17
2
19
1
21
0
22
9
VtT
REAL
REGRESION
ML
0
5000000
10000000
15000000
20000000
25000000
30000000
35000000
40000000
45000000
1
11
21
31
41
51
61
71
81
91
10
1
11
1
12
1
VtT
REAL
REGRESION
ML
[83]
UPZ GRANJAS DE TECHO ZHF 6222115153113
Entrenamiento
Pronostico
Ilustración 27: Tendencia Lineal Entrenamiento-Pronostico del Avaluó Fuente: Excel 2010
Para finalizar esta interpretación, tenemos la variable posiblemente más importante de todas “Avalúo” es nuestra variable dependiente
final y la que nos determina si el algoritmo es válido o no; acordémonos que la variable Avalúo no es más que las sumas de predios
parciales tanto del valor total del terreno, como el valor total de la construcción sumándose entre sí para llegar a este valor.
Ilustrándose mejor nos damos cuenta que el diagrama entrenamiento, percibe que los valores del Modelo Lineal tienden a fusionarse
con el Valor Real y por consiguiente el valor más atípico seria el Modelo de Regresión. Observen que los valores de estas dos rectas
suelen a resultar valores entre $ 80’175.000 y $ 80’195.000 dando esta variación en el dato 181; sucede lo mismo con la Línea Verde
solo que para este ejercicio los valores están desde $ 78’331.000 y aumentan en el mismo dato hasta $ 80’742.000 obteniendo así
como el resultado más próximo el Modelo Lineal. Pero en vista del grafico pronostico, los papeles se alteran dando así razón al
Modelo de Regresión; mientras que la Línea Roja y Verde comparten el mismo dato en $ 80’000.000, mientras la Línea Azul proyecta
un valor muy abajo a $ 19’000.000 reafirmando las anteriores teorías.
77000000
77500000
78000000
78500000
79000000
79500000
80000000
80500000
810000001
21
41
61
81
10
11
21
14
11
61
18
12
01
22
12
41
AVALÚO
REAL
REGRESION
ML
0
10000000
20000000
30000000
40000000
50000000
60000000
70000000
80000000
90000000
1
10
19
28
37
46
55
64
73
82
91
10
0
10
9
AVALÚO
REAL
REGRESION
ML
[84]
10.6.2 TABLA RESUMEN UPZ GRANJAS DE TECHO ZHF 6222115153113
Tabla 21: Valores Mínimo-Máximo-Promedio UPZ Granjas de Techo ZHF 6222115153113
Vm
2C
VALOR MÍNIMO VALOR MÁXIMO VALOR PROMEDIO
ENTRENAMIENTO PRONOSTICO ENTRENAMIENTO PRONOSTICO ENTRENAMIENTO PRONOSTICO
REAL $ 749.950 $ 752.057 $ 753.080 $ 753.075 $ 751.037 $ 752.122
REGRESIÓN $ 750.590 $ 753.257 $ 753.260 $ 753.257 $ 751.241 $ 753.257
ML $ 750.339 $ 113.439 $ 753.113 $ 113.518 $ 751.036 $ 113.481
Vm
2T
VALOR MÍNIMO VALOR MÁXIMO VALOR PROMEDIO
ENTRENAMIENTO PRONOSTICO ENTRENAMIENTO PRONOSTICO ENTRENAMIENTO PRONOSTICO
REAL $ 1.000.000 $ 1.000.000 $ 1.000.000 $ 1.000.000 $ 1.000.000 $ 1.000.000
REGRESIÓN $ 996.040 $ 1.006.963 $ 1.011.000 $ 1.012.833 $ 1.001.572 $ 1.010.620
ML $ 1.000.000 $ 0 $ 1.000.000 $ 0 $ 1.000.000 $ 0
VtC
VALOR MÍNIMO VALOR MÁXIMO VALOR PROMEDIO
ENTRENAMIENTO PRONOSTICO ENTRENAMIENTO PRONOSTICO ENTRENAMIENTO PRONOSTICO
REAL $ 38.315.000 $ 38.422.614 $ 38.475.000 $ 38.474.611 $ 38.370.610 $ 38.425.915
REGRESIÓN $ 38.312.000 $ 38.393.197 $ 38.493.000 $ 38.410.875 $ 38.364.504 $ 38.395.369
ML $ 38.315.078 $ 53.463.763 $ 38.474.611 $ 53.536.115 $ 38.370.420 $ 53.468.356
VtT
VALOR MÍNIMO VALOR MÁXIMO VALOR PROMEDIO
ENTRENAMIENTO PRONOSTICO ENTRENAMIENTO PRONOSTICO ENTRENAMIENTO PRONOSTICO
REAL $ 41.800.000 $ 41.900.000 $ 41.900.000 $ 41.970.000 $ 41.862.764 $ 41.965.556
REGRESIÓN $ 41.513.000 $ 41.436.040 $ 42.222.000 $ 42.217.313 $ 41.861.337 $ 41.793.657
ML $ 41.847.909 $ 2.286.920 $ 41.902.530 $ 2.292.377 $ 41.862.764 $ 2.289.444
AV
AL
ÚO
VALOR MÍNIMO VALOR MÁXIMO VALOR PROMEDIO
ENTRENAMIENTO PRONOSTICO ENTRENAMIENTO PRONOSTICO ENTRENAMIENTO PRONOSTICO
REAL $ 80.175.000 $ 80.374.611 $ 80.392.614 $ 80.392.614 $ 80.241.948 $ 80.391.340
REGRESIÓN $ 78.331.000 $ 80.649.970 $ 80.742.000 $ 80.661.370 $ 79.022.023 $ 80.656.095
ML $ 80.174.519 $ 18.267.141 $ 80.392.604 $ 18.285.132 $ 80.241.769 $ 18.283.858
Fuente: Excel 2010
[85]
Los errores suelen ser bastante demostrativos en cualquier tema de aproximaciones; me refiero a
que pueden ser útiles para verificar la confiabilidad que existe entre un modelo diseñado
específicamente para solucionar un problema específico, como un conjunto de información de
manera circunstancial para poder verificar que tan veraz es este modelo implementado a una BD.
Estas palabras introductorias, nos dará a entender mejor que se necesita comprobar lo que se ha
propuesto y que mejor forma de visualizarlo que con la Tabla 21.
Antes que nada, se observa que la Tabla 21 posee los resultados de los gráficos mostrados
anteriormente; los cuales se muestra los valores tanto mínimos máximos y promedios que
resultaron tanto del valor de referencia Valor Real como los las soluciones de los modelos
aplicados a estos datos MRL y MRNL. Para las 5 variables procesadas Vm2C-Vm2T-VtC-VtT-
Avalúo Catastral se observa que aparte de tener las celdas de los temas ya mencionados,
visualizamos las columnas Entrenamiento y Pronostico; solo que para este caso, se entenderá
mucho mejor los gráficos mediante valores numéricos.
Examinemos detenidamente las variable Vm2C y Vm2T; si notamos el valor mínimo, máximo y
promedio tanto de la fila Real como de la fila ML en las columna Entrenamiento, forjamos que
estos dos casos son prácticamente similares en cambio, con la fila de Regresión, no ocurre de
igual manera. Este tipo de error aunque no es muy grande a simple vista nos infiere decir que el
modelo con el cual se proyecta mejor los resultados seria el ML por lo que no habría necesidad
de crear un modelo alternativo para solucionar este tipo de paradigma; pero como para este
supuesto no solo se tomó el total de los datos sino los subdividimos en dos “reiterando
Entrenamiento-Pronostico” se evalúa este tipo de modelos con los datos sobrantes a esta clase
de clasificación (Teniendo en cuenta que los datos se escogieron aleatoriamente) con la columna
pronostico; en esta situación cambia drásticamente las soluciones dándonos a entender que los
valores que más se asimilan a la solución anhelada vendría siendo la fila Regresión y no ML.
Así sucede con las demás variables; para no alargar más el tema nótese que los valores de
Entrenamiento para todos las columnas Valor Mínimo, Valor Máximo y Valor Promedio; las filas
Real y ML son casi idénticas, inclusive hasta para las variables VtC-VtT-Avalúo Catastral
manejando cifras por encima de los 7 dígitos poseen un error de diferencia bastante pequeño;
pero para la fila Regresión es todo lo contrario. Ahora para la última mencionada, obtenemos
errores fáciles de detectar inclusive la variable Avalúo Catastral, hay una desigualdad de
aproximadamente $ 1’200.000 entre la fila Real y la fila Regresión. Ahora para determina que el
MRNL es más efectivo que el ML, nos fijaremos en la columna Pronostico y para que den mejor
percepción de esta idea verifiquemos la variable final “Avalúo Catastral” la cual si fijamos bien
entre la fila Real y la fila ML existe una gran diferencia entre ellas de aproximadamente $
62’000.000 superando por encima al erro trazado entre Real-Regresión que se había calculado
antes.
[86]
10.6.3 CUADRO DE ERRORES E-P DEL MRNL Y ML
Tabla 22: Cuadro resumen de errores MAPE UPZ Bolivia
UPZ PH/NPH ZHF TIPO ERROR MAPE
ENTRENAMIENTO
ERROR MAPE
PRONOSTICO
ERROR MAPE ENTRENAMIENTO
ML
ERROR MAPE PRONOSTICO
ML
BOLIVIA
PH 5727710152152
AVALÚO 0,00205 0,70651 0,00101 1,0514
Vm2T 0,03713 0,14389 0 0,8475
Vm2C 0,06906 0,21400 0,00487 3,6031
VtT 0,09816 0,30007 0,00445 4,2830
VtC 0,01760 0,27980 0,00017 12,9481
PH 5727715153103
AVALÚO 0,01835 0,23518 0,00224 1,1139
Vm2T 0,05920 0,18012 0 1,1588
Vm2C 0,08476 0,00671 0,06656 3,7117
VtT 0,06771 0,09810 0,00939 0,2139
VtC 0,12573 0,10958 0,03704 51,8002
PH 6030315153214
AVALÚO 0,02510 0,16413 0,01374 3,3156
Vm2T 0,06829 0,24378 0 1
Vm2C 0,10060 0,08635 0,00821 0,8791
VtT 0,24842 0,03865 0,00203 0,2631
VtC 0,10185 0,11290 0,00466 1,5295
NPH 6212115152113
AVALÚO 0,05977 0,16512 0,08569 0,2714
Vm2T 0,03196 0,38977 0,00214 0,9636
Vm2C 0,20418 0,45409 0,00002 0,8765
VtT 0,38598 0,06732 0,12919 16,7340
VtC 0,14201 0,08485 0,00001 1,7471
NPH 6212115152121
AVALÚO 0,10294 0,15302 0,07220 1,1115
Vm2T 0,20712 0,22911 0,01924 0,6450
Vm2C 0,12373 0,85656 0,00371 1,6872
VtT 0,12985 0,69124 0,14018 0,8345
VtC 0,29678 0,48465 0,00001 2,3268
NPH 6222115152121
AVALÚO 0,15662 0,29737 0,10636 0,7953
Vm2T 0,17191 0,17333 0,01721 1,1692
Vm2C 0,15865 0,13011 0,00997 3,7417
VtT 0,25565 0,20251 0,23458 5,6850
VtC 0,24523 0,54753 0,01166 8,1497
Fuente: Excel 2010
[87]
Tabla 23: Cuadro resumen de errores MAPE UPZ Granjas de Techo
UPZ PH/NPH ZHF TIPO ERROR MAPE
ENTRENAMIENTO
ERROR MAPE
PRONOSTICO
ERROR MAPE ENTRENAMIENTO
ML
ERROR MAPE PRONOSTICO
ML
GRANJAS DE TECHO
PH 6222115153113
AVALÚO 0,01776 0,0033 0 0,7726
Vm2T 0,00319 0,0092 0 1
Vm2C 0,00066 0,0015 0,00055 0,8491
VtT 0,00420 0,0007 0,00068 0,9454
VtC 0,00040 0,0003 0 0,3915
PH 6621110110001
AVALÚO 0,14365 0,2475 0,00226 6,5709
Vm2T 0,01055 0,0112 0 1
Vm2C 0,01087 0,0205 0,00502 0,8071
VtT 0,04835 0,2053 0,00420 2,6072
VtC 0,03357 0,1114 0,00013 0,6258
PH 6621115153114
AVALÚO 0,12602 0,3206 0,00886 0,5695
Vm2T 0,06166 0,2134 0 1
Vm2C 0,02758 0,0908 0,01050 2,1065
VtT 0,11475 0,2837 0,00391 0,6084
VtC 0,12510 0,1610 0,02227 0,1877
NPH 5727710110003
AVALÚO 0,23063 0,2628 0 0,5250
Vm2T 0,26950 0,1317 0 119,8351
Vm2C 0,24531 0,3409 0 342,7780
VtT 0,26671 0,2999 0 0,5694
VtC 0,22789 0,1962 0 530,6751
NPH 6712415141113
AVALÚO 0,16246 0,2429 0,07156 0,5235
Vm2T 0,20130 0,3578 0,03674 2,2635
Vm2C 0,23327 0,3127 0,00001 3,1026
VtT 0,06946 0,6763 0 0,8633
VtC 0,24180 0,5201 0,00918 12,5938
NPH 6712415153433
AVALÚO 0,29064 0,2447 0,01014 0,8630
Vm2T 0,19150 0,4087 0,00701 0,5549
Vm2C 0,20397 0,2411 0 1,6231
VtT 0,37202 0,7435 0,08527 2,0118
VtC 0,22339 0,2344 0,00001 1,7983
Fuente: Excel 2010
[88]
Teniendo en cuenta la Tabla 22 del cuadro de errores, se escogió 6 ZHF de los cuales 3 se
constituyen como propiedades en PH y las restantes como NPH. En esta UPZ conocida como
Bolivia, se seleccionó estas ZHF con la facilidad de encontrar errores MAPE explicados
anteriormente entre usos residenciales. Como nos dimos cuenta en el Marco Teórico Conceptual
cerca del 68% de los predios ubicados en esta UPZ pertenecen al uso residencial por lo que la
comparación entre estas solo se limita al precio de diferencia entre casa y apartamento también
como la cantidad de datos que conforman la ZHF y el área (Terreno y construcción) que
comparten la existencia entre estos mismos.
Si se presta atención a las celdas coloreadas de color gris se entiende que esos valores son los
más pequeños posibles entre su uso; por decirlo de otra forma cada variable diferenciándose
entre PH y NPH comparte solo una cosilla por el cual se encuentra de color diferente a las demás
por ejemplo notemos que la ZHF 5727710152152 de la UPZ Bolivia se encuentran 10 casillas
entre 15 con totalidad de gris y si nos damos cuenta la ZHF 5727715153103 de la misma solo
hay 4 casillas coloreadas; pero lo que no damos por entendido es que están coloreadas de forma
diferente debido a que están clasificando que tan pequeños son los valores de error unos entre
otros y si miran más detenidamente, la ubicación de la coloración gris aparecen en diferente
posición por lo que el MRLN o ML resulto mejor en algunas variables de unas ZHF más
favorables que en otras.
Para la UPZ Bolivia en PH se escogió fácilmente la ZHF 5727710152152 por su mayoría de
errores alcanzados que las otras ZHF del mismo uso, aunque no se cumplió con el objetivo en
las columnas ERROR MAPE PRONOSTICO y ERROR MAPE PRONOSTICO ML.
Aun así, esta ZHF presento mejor sus resultados de errores en el MRNL. Acordemos que los
errores pronóstico en el ML son bastante exagerados y que solo se colocaron por hacer una
comparación de demostrar que el MRNL es mejor. Asimismo para los predios legalizados de
tipo residencial NPH se escogió de la mismo UPZ la ZHF 6212115152113 por tener mayor
número de casillas coloreadas 12/20.
Ahora Examinaremos la Tabla 23 examinando una UPZ muy diferente a la anterior mencionada
conocida como Granjas de Techo. Esta UPZ contiene aproximadamente un porcentaje de uso
tipo residencial de tan solo el 15% y que su mayor denominación prosee un uso tipo industrial
por lo que fue muy difícil encontrar ZHF con este tipo de uso; aun así se encontraron predios
legalizados como PH de tipo residencial. Para esta UPZ, el mejor resultado en PH residencial se
lo lleva la ZHF 6222115153113 con un total de 14/20 casillas coloreadas resaltando como la
UPZ que mejores resultados tuvo en la muestra. En cambio, para la nomenclatura residencial
NPH solo existió una ZHF en particular debido a la escasez de casas de uso residencial que se
presentan allí; la ZHF en NPH de tipo residencial es la 6712415141113 pero la mejor ZHF en
cuanto a los mejores errores fue la 5727710110003 solo que para este caso, el uso es de tipo
comercial-residencial ya que se complementan de uso mixto.
[89]
11. CONCLUSIONES
La estimación de avalúos masivos mediante algoritmos genéticos ha sido de gran ayuda frente a
las diversas herramientas económicas que se han utilizado tradicionalmente; a través de la BD
obtenida por la entidad de la UAECD se ha comprobado que la cantidad de datos suministrados
de esta ha sido bastante exagerada y que para la implementación de esta investigación se ha
tenido que recurrir a diferentes clasificaciones y experimentos para poder llevar a cabo con éxito
nuestro objetivo.
Por otro lado, los modelos tradicionalmente utilizados para estimar avalúos masivos han sido de
gran progreso no solo para garantizar la efectividad con la que tienen al estimar el valor real del
inmueble por zona sino que también nos proporciona efectividad respecto a tiempos y
estimaciones matemáticas de manera remota. Pero a partir de la validación de estos modelos son
difícilmente cuestionados por lo que aplicando inteligencia artificial sea cual sea la índole
Algoritmos Genéticos no solo se tiene una nueva herramienta que promueve el desempeño de la
herramienta sino que nos ayuda a optimizar de manera precisa el resultado deseado en
comparación con los estudios proverbialmente usados en un tiempo anterior. Estos experimentos
se llevaron a cabo gracias a la teoría de algoritmos genéticos que se tiene como herramienta para
facilitar la optimización de resultados de forma probabilística mediante la función óptima
“fitness”. Pautas como Población, Selección, Cruzamiento, Mutación y Estimación (Ajuste de
Betas), ayudan a lograr una mejor exactitud de resultados que a su vez minimiza los máximos
locales que pueda poseer dicho proceso.
Agradeciendo de antemano el software matemático MATLAB al cual no solo se le concede la
facilidad de interactuar y evaluar codificaciones lógicas para la construcción y estructuración del
algoritmo sino que también gracias a su fácil interfaz gráfica, se pudo crear satisfactoriamente
clases u objetos para manejar de mejor forma las pautas que se llevan a cabo en la elaboración
del AG’s; recordando también de que esta consola de programación nos ayudó en cuestiones de
declaraciones de funciones tanto matemáticas como operacionales y que de alguna se facilitó el
hecho de compilarlas como opciones y no directamente como funciones declaradas para el arduo
trabajo de procesarlas junto a las variables de interés.
Finalmente, se pudo comprobar que cuando tomamos muestras de una misma clasificación y la
subdividimos tanto en “Experimentación (66%) y pronostico (33%)” se comprueba de que si
utilizamos la teoría de MRL los datos pueden que al principio sean los mejores estimadores que
pueden desarrollar el problema pero que a la hora de verificar con el restante de la muestra, nos
damos cuenta de que el MRNL fue bastante satisfactorio en desenvolver la incertidumbre que
provoca resolver el problema mediante los modelos de regresión tradicionalmente utilizados y
que nos ayuda a desencriptar ese paradigma con la cual como investigadores estamos
acostumbrados a tratar en nuestro diario vivir.
[90]
12. RECOMENDACIONES FUTURAS
Antes que nada, para este tipo de ejercicios tienes que analizar qué tan viable puede ser tu
proyecto para implementar AG’s ya que esta herramienta no siempre puede ser útil a la hora de
aplicar. Por ejemplo si tu problema tiene en el contexto lógico, un lenguaje que deba utilizar una
toleración hacia los cambios aleatorios; que no lleguen a producir resultados sin sentido o errores
fatales. Una solución posible será definir a los individuos por listas de números donde cada uno
de estos números representa algún aspecto de la solución que se tenga. Para este caso, nuestros
individuos cumple con una función única e independiente de las otras, que ayudara a obtener los
mejores individuos y generaciones posibles y que a la hora de mutar sea de la mejor manera la
mejor validación que se pueda obtener a la hora de calcular un avaluó, esta herramienta puede
aplicarse también a nuestro entorno en cuando a la interpretación de sondeos geoeléctricos en
corriente continua para interpretar curvas de resistencia para sistemas de puestas a tierras
(Wenner, 2007).
Otra de las aplicaciones que podemos encaminar esta herramienta a nuestra carrera es en la parte
de geomatica; usado en la universidad nacional en maestría en geomatica para el “Diseño de
Redes de Muestreo Óptimas para el Monitoreo del Carbono Orgánico del Suelo en el C.I. La
Libertad mediante la Aplicación de Algoritmos Genéticos” diseñado por la M.Sc Alí Marcel
Santacruz Delgado que consiste principalmente en encontrar por medio de muestreo aleatorio
elaborado por algoritmos genéticos; presencia de carbono orgánico utilizando muestras
consistentes por medio de la variabilidad, coberturas vegetales y propiedades del suelo para así
eliminar incertidumbres sesgadas de la misma muestra y centrar mejor por medio de un mapa
geoestadístico la mejor conglomeración de carbono que hay en el Municipio de Villavicencio en
el Centro de Investigación La Libertad (Santacruz Delgado, 2010).
[91]
13. BIBLIOGRAFÍA
Acuña Lozano, M., & Vergara Azabache, V. (2013). DESARROLLO DE UN SISTEMA INTELIGENTE BASADO
EN ALGORITMOS GENETICOS PARA INCREMENTAR LA UTILIDAD PROYECTADA DE LA INVERSION
DE UN USUARIO EN LA BOLSA DE VALORES DE LIMA. Lima: UNIVERSIDAD NACIONAL DE
TRUJILLO.
Arranz de la Peña, J., & Parra Truyol, A. (2014). ALGORIMOS GENÉTICOS. ELCVIA: Electronic letters on
computer vision and image analysis, 8.
Benítez, R., Escudero, G., & Kanaan, S. (2003). Inteligencia Artificial Avanzada. Barcelona: Universitat
Orbeta de Catalunya.
Beyer, H. G., & Schwefel, H. P. (2002). Evolution strategies – A comprehensive introduction. Natural
Computing, 3-52.
Biomatemática, D. d. (Marzo de 2012). Introducción Bioestadistica. Valencia, España.
Bogotá, A. m. (2004). Decreto 326 del 2004. Por medio del cual se reglamenta la Unidad de
Planeamiento Zonal (UPZ) N° 110, Ciudad Salitre Occidental, ubicada en la localidad de
FONTIBON, y se incorpora un sector al tratamiento de Renovación Urbana. Bogotá, Colombia.
Bogotá, A. M. (2012). DINÁMICA DE LA CONSTRUCCIÓN POR USOS LOCALIDAD FONTIBÓN. Recuperado
el 2002, de
http://www.catastrobogota.gov.co/sites/default/files/files/Dinamica_de_la_construccion_por_
usos_Fontibon.pdf
Bogotá, A. M. (2012). DINÁMICA DE LAS CONSTRUCCIÓN POR USOS LOCALIDAD ENGATIVÁ. Recuperado
el 2002, de
http://www.catastrobogota.gov.co/sites/default/files/files/Dinamica_de_la_construccion_por_
usos_Engativa.pdf
Cerrolaza, M., & Annicchiarico, W. (1996). Algoritmos de optimización estructural basados en simulación
genetica. Caracas, Venezuela: Universidad Central de Venezuela.
COLOMBIA, C. D. (4 de Febrero de 2011). Resolucion 70. Por la cual se reglamenta técnicamente la
formación catastral, la actualización de la formación catastral y la conservación catastral.
Bogotá, Cundinamarca, Colombia: Secretaría General de la Alcaldía Mayor de Bogotá D.C. .
Engelbrecht, A. (2007). Computational Intelligence (Segunda ed.). (J. W. LTDA, Ed.) Pretoria, Sudafrica:
Wiley.
[92]
F, A. P. (2004). Modelos de algoritmos geneticos y redes neuronales en la prediccion del signo de
variacion del IPSA. Revista estudios de administracion (Chile), 26.
Fayyad, U. M. (1996). Data Mining KDD. En G. P.-S. U. M. Fayyad, Advances in Knowledge Discovery and
Data Mining (pág. 611). Menlo Park - Carolina: American Association for Artificial Intelligence.
Fogel, D. (2005). Evolutionary Computation. Toward a New Philosophy of Machine. New York: IEEE Press
Series on Coputational Intelligence.
García Jimémez, M., & Álvarez Sierra, A. (2003). Análisis de Datos en WEKA – Pruebas de Selectividad.
España: Universidad Carlos III.
Gómez Morales, A., & Hernández , G. (14 de Septiembre de 2009). Utilización de las máquinas con
vectores de soporte para regresión: m2 de construcción en bogotá. (U. Nacional, Ed.) Avances
en Sistemas e Informática, 6(2), 21-28.
Holland, J. (1989). Classifier Systems and Genetic Algorithms. Míchigan, Estados Unidos.
Lawrence, D. (1985). Applying adaptive algorithms to epistatic domains. Artificial Intelligence IJCAI. 85,
págs. 162-164. New York: IJCAI.
Malpica Velasco, J. A. (2005). Inteligencia Artificial y conciencia. Alcalá: Departamento de Matemáticas
de la UAH.
Marczyk, A. (2004). the geek. Obtenido de http://the-geek.org/docs/algen/
Mitchell, T. M. (1997). Genetic Algorithms. En M. H. Science, Machine Learning (págs. 249-270).
Washington: McGraw Hill Science.
Molina, G., & Rodrigo, M. F. (2009). Modelo de Regresion Lineal Universidad de Valencia. Valencia,
España.
Moscovitz, L. J. (s.f.). Un Modelo Conceptual para el Desarrollo de Árboles de Decisión con Programación
Genética. Fundación Universitaria Konrad Lorenz.
Planeación, S. D. (15 de Marzo de 2014). UPZ 72 Bolivia. Bogotá, Cundinamarca, Colombia.
Puppio, R. P. (1989). Métodos estadísticos aplicados a la valuación de bienes inmuebles. Caracas,
Venezuela.
Rechenberg, I., Zurada, J., & Marks, R. (1994). Computational Intelligence. Colorado : Imitating Life.
Santacruz Delgado, A. M. (2010). Diseño de Redes de Muestreo Óptimas para el Monitoreo del. (I. G.
Codazzi, Ed.) Bogota, Cundinamarca, Colombia: Universidad Nacional de Colombia.
Schaffer, J. D., A. Caruana, R., J. Eshelman, L., & Das, R. (1989). A study of control parameters affecting
online performance of genetic algorithms for function optimization. Proceedings of the third
[93]
international conference on Genetic algorithms (págs. 51-60). San Francisco: Morgan Kaufmann
Publishers Inc.
UNAM. (2006). Apuntes de Inteligencia Artificial. Ciudad de México: Universidad Nacional Autónoma de
México.
Vallejos, S. J. (2006). Minería de Datos. Buenos Aires: Universidad Nacional del Nordeste.
Velasquez H, J. D., Ortiz, D. M., & Jaramillo, P. (11 de Junio de 2011). ESTRATEGIAS EVOLUTIVAS COMO
UNA OPCIÓN PARA LA OPTIMIZACIÓN DE FUNCIONES NO LINEALES CON RESTRICCIONES.
Revista Ingenierías Universidad de Medellín, 10, 9.
Wenner, F. (2007). Interpretacion de Sondeos Geoelectricos en Corriente Continua. Geologia
Universidad salamanca españa, 30-42.
Will, D. (2 de 10 de 2012). Algoritmos Genéticos y Optimización Heurística. Obtenido de
http://www.herrera.unt.edu.ar/gapia/Curso_AG/Curso_AG_08_Clase_5.pdf
Yu, A. (2004 de Diciembre de 8). Computational Intelligence and Knowledge. Computational Intelligence.
Vancouver, Canada: University of British Columbia.
[94]
ANEXOS A: CUADROS RESUMENES DE LAS UPZ BOLIVIA Y GRANJAS DE
TECHO SEGÚN CODIGO DE SECTOR
[95]
[96]
[97]
[98]
[99]
ANEXOS B: CUADROS RESUMENES DE LAS UPZ BOLIVIA Y GRANJAS DE
TECHO SEGÚN CODIGO DE USO
[100]
[101]
[102]
[103]
[104]
ANEXOS C: CUADROS RESUMENES DE LAS UPZ BOLIVIA Y GRANJAS DE
TECHO SEGÚN ZHF
[105]
ANEXOS D: CUADROS RESUMENES DE LAS UPZ BOLIVIA Y GRANJAS DE
TECHO SEGÚN ZHF-AVALÚOS
[106]
[107]
[108]
[109]
[110]
[111]
[112]
[113]
[114]
ANEXOS E: GRAFICOS UPZ BOLIVIA Y GRANJAS DE TECHO SEGÚN ZHF-USOS
[115]
UPZ BOLIVIA
NPH
6212115152113
ENTRENAMIENTO
0
2000000000
4000000000
6000000000
8000000000
1
28
55
82
10
9
Vm2C
REAL
REGRESION
ML
0
500000
1000000
1500000
2000000
1
23
45
67
89
11
1
Vm2T
REAL
REGRESION
ML
0
200000000000
400000000000
600000000000
800000000000
1
34
67
10
0
VtC
REAL
REGRESION
ML
0
50000000
100000000
150000000
1
28
55
82
10
9
VtT
REAL
REGRESION
ML
0
500000000
1000000000
1500000000
1
29
57
85
11
3
AVALÚO
REAL
REGRESION
ML
[116]
UPZ BOLIVIA
NPH
6212115152113
PRONOSTICO
-2.000.000
-1.500.000
-1.000.000
-500.000
000
500.000
1.000.000
1.500.000
1 112131415161
Vm2C
REAL
REGRESION
ML
0
500000
1000000
1500000
1 10192837465564
Vm2T
REAL
REGRESION
ML
-1E+08
0
100000000
200000000
300000000
400000000
500000000
600000000
1 112131415161
VtC
REAL
REGRESION
ML
0
200000000
400000000
600000000
800000000
1E+09
1,2E+09
1 112131415161
VtT
REAL
REGRESION
ML
0
50000000
100000000
150000000
200000000
1 101928374655
AVALÚO
REAL
REGRESION
ML
[117]
UPZ BOLIVIA
PH
5727710152152
ENTRENAMIENTO
0
200000
400000
600000
800000
1000000
1200000
1
23
45
67
89
11
1
Vm2C
REAL
REGRESION
ML
850000
900000
950000
1000000
1050000
1100000
1
23
45
67
89
11
1
Vm2T
REAL
REGRESION
ML
0
20000000
40000000
60000000
80000000
1
23
45
67
89
11
1
VtC
REAL
REGRESION
ML
0
20000000
40000000
60000000
1
23
45
67
89
11
1
VtT
REAL
REGRESION
ML0
100000000
200000000
300000000
400000000
1
29
57
85
11
3
AVALÚO
ML
REGRESION
REAL
[118]
UPZ BOLIVIA
PH
5727710152152
PRONOSTICO
0
200000
400000
600000
800000
1000000
1 10192837465564
Vm2C
REAL
REGRESION
ML
0
200000
400000
600000
800000
1000000
1200000
1 10192837465564
Vm2T
REAL
REGRESION
ML
-30000000
-25000000
-20000000
-15000000
-10000000
-5000000
0
5000000
1 112131415161
VtC
REAL
REGRESION
ML
-30000000
-20000000
-10000000
0
10000000
20000000
1 112131415161
VtT
REAL
REGRESION
ML
-50000000
0
50000000
100000000
150000000
200000000
250000000
1 101928374655
AVALÚO
ML
REGRESION
REAL
[119]
UPZ GRANJAS DE TECHO
NPH
5727710110003
ENTRENAMIENTO
0
5000000000
10000000000
15000000000
20000000000
25000000000
1 2 3 4 5 6 7
Vm2C
ML
REGRESION
REAL
0
5000000000
10000000000
15000000000
1 2 3 4 5 6 7
Vm2T
ML
REGRESION
REAL
0
20000000000000
40000000000000
60000000000000
80000000000000
1 2 3 4 5 6 7
VtC
ML
REGRESION
REAL
0
5000000000000
10000000000000
15000000000000
20000000000000
25000000000000
30000000000000
1 2 3 4 5 6 7
VtT
ML
REGRESION
REAL
0
5000000000
10000000000
15000000000
20000000000
1 2 3 4 5 6 7
AVALÚO
ML
REGRESION
REAL
[120]
UPZ GRANJAS DE TECHO
NPH
5727710110003
PRONOSTICO
-50000000
0
50000000
100000000
150000000
1 2 3
Vm2C
ML
REGRESION
REAL
-150000000
-100000000
-50000000
0
50000000
1 2 3
Vm2T
ML
REGRESION
REAL
-40000000000
-30000000000
-20000000000
-10000000000
0
10000000000
1 2 3
VtC
ML
REGRESION
REAL
0
20000000000
40000000000
60000000000
80000000000
100000000000
120000000000
1 2 3
VtT
ML
REGRESION
REAL
0
20000000000
40000000000
60000000000
80000000000
100000000000
120000000000
1 2 3
AVALÚO
ML
REGRESION
REAL
[121]
UPZ GRANJAS DE TECHO
PH
6222115153113
ENTRENAMIENTO
748000
749000
750000
751000
752000
753000
754000
1
37
73
10
9
14
5
18
1
21
7
Vm2C
REAL
REGRESION
ML
985000
990000
995000
1000000
1005000
1010000
1015000
1
42
83
12
4
16
5
20
6
Vm2T
REAL
REGRESION
ML
38200000
38250000
38300000
38350000
38400000
38450000
38500000
38550000
1
42
83
12
4
16
5
20
6
VtC
REAL
REGRESION
ML
0
50000000
100000000
150000000
1
51
10
1
15
1
20
1
VtT
ML
REGRESION
REAL
77000000
78000000
79000000
80000000
81000000
1
45
89
13
3
17
7
22
1
AVALÚO
REAL
REGRESION
ML
[122]
UPZ GRANJAS DE TECHO
PH
6222115153113
PRONOSTICO
0
200000
400000
600000
800000
1
19
37
55
73
91
10
9
Vm2C
REAL
REGRESION
ML
0
200000
400000
600000
800000
1000000
1200000
1
22
43
64
85
10
6
Vm2T
REAL
REGRESION
ML
0
10000000
20000000
30000000
40000000
50000000
60000000
1
22
43
64
85
10
6
VtC
REAL
REGRESION
ML
0
10000000
20000000
30000000
40000000
50000000
1
22
43
64
85
10
6
VtT
REAL
REGRESION
ML
0
20000000
40000000
60000000
80000000
100000000
1
24
47
70
93
AVALÚO
REAL
REGRESION
ML