estimación de la temperatura del suelo mediante técnicas
Post on 09-Jul-2022
33 Views
Preview:
TRANSCRIPT
PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE
FACULTAD DE AGRONOMIA E INGENIERIA FORESTAL
DIRECCION DE INVESTIGACION Y POSGRADO
MAGISTER EN RECURSOS NATURALES
Estimación de la temperatura del suelo mediante técnicas de
aprendizaje profundo.
Tesis presentada como requisito para optar al grado de
Magíster en Recursos Naturales
por:
Diego Moraga Méndez
Comité de Tesis
Profesor Guía: Francisco Meza
Profesores Informantes:
Eduardo Arellano
Francisco Suárez
Marzo 2021
Santiago-Chile
Agradecimientos
Deseo expresar mi agradecimiento a las personas que hicieron posible que este trabajo
terminara con éxito y, en especial a:
A la Facultad de Agronomía e Ingeniería Forestal y a los proyectos FONDECYT N°1170429
y FONDEQUIP EQM170024 por financiar este trabajo.
Además, al profesor Francisco Javier Meza Dabancens, por su contribución en la revisión
del manuscrito y sugerencias de avances. Además, de disponer de las condiciones físicas
y materiales para el desarrollo de la investigación, entre ellas, un puesto de trabajo en el
laboratorio de biometeorología, instrumental de monitoreo y disposición de datos.
También a los profesores Francisco Suárez y Eduardo Arellano, por sus comentarios y
recomendaciones de avances.
Le dedico este trabajo a mi familia, Alicia y mis amigos, que
me entregaron apoyo y motivación para concluir
mi tesis en contexto de Pandemia.
ÍNDICE
Abstract ............................................................................................................................ 1
Introducción ..................................................................................................................... 2
Materiales y métodos ...................................................................................................... 5
Área de estudio e instrumentación ................................................................................. 5
Modelo analítico ............................................................................................................. 8
Modelos de redes neuronales profundas. ....................................................................... 9
Modelo estocástico ARIMA. ......................................................................................... 12
Evaluación de precisión de los modelos ....................................................................... 13
Resultados ..................................................................................................................... 14
Discusión ....................................................................................................................... 19
Conclusión ..................................................................................................................... 20
Resumen ........................................................................................................................ 22
Referencias .................................................................................................................... 22
ÍNDICE DE FIGURAS
Figura 1. Área de estudio .............................................................................................. 6
Figura 2. Diagrama de referencia del diseño estructural del modelo MLP. .................. 10
Figura 3. Diagrama de referencia del diseño de la estructura del modelo RNN. .......... 11
Figura 4. Diagramas de dispersión para los modelos analítico, MLP y MLP que incluye el
potencial mátrico (ψ) respectivamente, para estimar cada temperatura del suelo a los 10,
30, 50, 75 y 140 cm de profundidad. La línea de color rojo representa la línea de la
regresión. ..................................................................................................................... 15
Figura 5. Comparación entre la Ts del suelo medida y pronosticada para las series de
tiempo de los modelos de RNN y ARIMA a 10, 30, 50, 75 y 140 cm de profundidad. ... 18
ÍNDICE DE CUADROS
Cuadro 1. Principales estadígrafos para la temperatura de suelo (Ts) y variables
micrometeorológicas utilizadas para entrenar y validar los modelos desarrollados en este
trabajo. ........................................................................................................................... 7
Cuadro 2. Textura del suelo en la unidad experimental para cada profundidad
monitoreada por el lisímetro. .......................................................................................... 8
Cuadro 3. Principales estadígrafos de las variables calculadas para la ecuación de van
Wijk, obtenidos a traves de la extrapolación de la temperatura del suelo (Tm, A(0) y D).
..................................................................................................................................... 14
Cuadro 4. Rendimiento estadístico de los modelos analitico, MLP y MLP que incluye el
potencial matrico (ψ) para la estimación de la temperatura horaria del suelo a diferentes
profundidades. ............................................................................................................. 16
Cuadro 5. Rendimiento estadístico de los modelos ARIMA y RNN para la estimación
futura de la temperatura horaria del suelo a diferentes profundidades. ........................ 16
Cuadro 6. Rendimiento estadístico estacional del modelo ARIMA para la estimación
futura de la temperatura horaria del suelo a diferentes profundidades. ........................ 17
1
Estimación de la temperatura del suelo mediante técnicas de aprendizaje profundo.
Diego Moraga1, Eduardo Arellano1, Francisco Suárez2, Francisco Meza1.
1. Departamento de Ecosistemas y Medio Ambiente, Facultad de Agronomía e
Ingeniería Forestal, Pontificia Universidad Católica, Santiago, Chile.
2. Departamento de Ingeniería Hidráulica y Ambiental, Pontificia Universidad Católica
de Chile, Avda, Vicuña Mackenna, 4860, Macul, Santiago, Chile.
*Correspondencia: Francisco Meza, fmeza@uc.cl. (+56 2) 2354 7911.
Abstract
Diego Moraga Mendez. Estimation of soil temperature through Deep Learning
Techniques. Tesis, Magister en Recursos Naturales, Facultad de Agronomía e Ingeniería
Forestal, Pontificia Universidad Católica de Chile. Santiago, Chile. 26pp. Soil temperature
plays a fundamental role for several microbiological processes and influences soil
hydrology. However, the absence of widespread monitoring systems and low availability of
online data make difficult to incorporate this variable as a routine observation for decision
making. Some studies have developed models to estimate soil temperature (Ts) at different
depths, where neural network models have shown interesting results. Using the latest
advances in deep learning techniques, this study estimates hourly soil temperature at five
depths (10, 30, 50, 75 and 140 cm) of a bare soil under a Mediterranean climate in Chile,
through a multilayer perceptron (MLP) model. This model was compared with an analytical
model by van Wijk in 1959. Results show that the MLP model provides a better fit than the
analytical method. Furthermore, considering the soil matric potential as an explanatory
variable, the average RMSE and MAE of the five depths was reduced by 56%. In addition,
we evaluated a recurrent neural network (RNN) model to predict temperature for 48 hours
and compare it with and an autoregressive integrated moving average (ARIMA) model.
Results show that, for the majority of the soil depths studied, the ARIMA model performs
better than RNN for temperature prediction, but it must be considered that it is not a unique
model like the RNN model, and the parameters must be reprogrammed for each time series,
becoming a limitation for its application.
Key words: Soil temperature, Deep learning, Feed-forward network, recurrent neural
network, ARIMA model.
2
Introducción
La temperatura del suelo (Ts) es producto del balance de energía superficial. La radiación
neta es absorbida por la superficie del suelo para luego ser transmitida por conducción a
los estratos inferiores, viéndose atenuada a mayores profundidades. La interacción
generada en la superficie del suelo con el aire permite la regulación térmica y el intercambio
de temperatura entre la tierra y la atmósfera (Pregitzer y King, 2005; Hanks, 2012).
La Ts depende de una serie de propiedades fisicoquímicas y características
espaciotemporales de los suelos. Dentro de las variables que la determinan se encuentra
el ángulo de incidencia solar, propiedades térmicas del suelo, porosidad, contenido de
agua, el nivel de actividad microbiana, tasas de mineralización, tipo de cubierta vegetal y
profundidad del suelo. Al mismo tiempo, la Ts es influenciada por variables meteorológicas
como el déficit de presión de vapor, presión atmosférica, temperatura del aire, precipitación,
velocidad del viento, entre otras (Paul, et al., 2004; Snyder, et al., 2010; Ozturk, et al., 2011;
Stolpe y Undurraga, 2016; Zeynoddin, et al., 2019). Además, la textura y estructura del
suelo está vinculada directamente con los procesos de transferencia de calor o flujos de
energía, a pesar de su importancia suele medirse por la complejidad que implica determinar
la conductividad térmica o el flujo de energía en los diferentes estratos del suelo (Kang, et
al., 2000).
En los ecosistemas terrestres, la Ts controla procesos claves como la actividad de
microorganismos del suelo, tasas de reacciones bioquímicas, procesos metabólicos y
reproductivos (Hay y Wilson, 1982; Campbell y Norman, 1998; Pregitzer y King, 2005;
Samadianfard, et al., 2018). En las plantas, en los primeros 10 cm de profundidad, la Ts
controla la tasa de germinación de semillas y otras actividades vitales para el desarrollo de
plantas como por ejemplo la expresión génica para el crecimiento y desarrollo en plantas,
respiración, tasa de extensión de las hojas, entre otras (Hay y Wilson, 1982; Chinnusamy,
et al., 2007; Curiel, et al., 2007; Miles y Brown, 2017). Dentro de los siguientes estratos se
encuentra la mayor producción de biomasa o enraizamiento de las plantas, donde la Ts se
relaciona con los mecanismos de absorción de nutrientes y flujos de agua a través de las
raíces (Jackson, et al., 1996). Sin embargo, la profundidad de enraizamiento puede variar
dependiendo de los mecanismos y propiedades hidrológicas del suelo como, por ejemplo,
la profundidad de infiltración, textura, agregación y porosidad. Por esta razón, los suelos
3
con buen drenaje pueden alcanzar mayores profundidades de enraizamiento, mientras que
en suelos anegados las raíces permanecen poco profundas (Mooney, et al., 1980; Crombie,
et al., 1988; Canadell, et al., 1996; Fan, et al., 2017). Por ende, la Ts se destaca por ser un
factor ambiental fundamental en los componentes bióticos del ecosistema terrestre, pero
también, se encuentra relacionada con el componente abiótico del suelo, es decir, forma
parte de procesos como la ventilación del suelo, evaporación y transpiración de las plantas
(Campbell y Norman, 1998; Zeynoddin, et al., 2019). Estas características han ubicado a Ts
como una variable cuya comprensión facultarían mejorar la gestión sobre el recurso suelo
(Toy, et al., 1978; Pregitzer, et al., 2000; Stolpe y Undurraga, 2016; Sanikhani, et al., 2018).
En Chile, el sector agrícola requiere lograr grandes desafíos durante esta década en la zona
central, dado a que se proyecta un aumento de las temperaturas, déficit de precipitaciones
y aumento en las demandas de riego para la agricultura, generando déficit en los regímenes
hidrológicos (Meza, et al., 2012). Por otra parte, la Ts rara vez es monitoreada a mayores
profundidades en Chile por el alto costo de inversión que significaría abarcar la extensión
completa del país, y tanto su estimación como predicción se dificulta por la baja
disponibilidad de datos en línea (Stolpe y Undurraga, 2016).
A nivel internacional, se han desarrollado modelos analíticos, numéricos y estadísticos, con
el fin de estimar y predecir la Ts a nivel anual, mensual, diario y horario en función de la
profundidad, variables meteorológicas y propiedades del suelo (West, 1952; Wierenga et
al., 1969; Toy, et al., 1978; Langholz, 1989; Zheng et al., 1993; Yang et al., 1997;
Mihalakakou, 2002; Paul et al., 2004; Tabari, et al., 2010; Bilgili, 2011; Ozturk, et al., 2011;
Kisi, et al., 2014; Kim y Singh, 2014; Tabari, et al., 2015; Nahvi, et al., 2016; Sanikhani, et
al., 2018; Samadianfard, et al., 2018; Zeynoddin, et al., 2019; Feng, et al., 2019;
Mehdizadeh, et al., 2020; Alizamir, et al., 2020). Dentro de ellos, se destacan los modelos
de redes neuronales (NN, sigla en inglés), dado a que ofrecen una alternativa factible para
comprender el comportamiento de la temperatura del suelo utilizando variables
meteorológicas (Tabari, et al., 2010; Bilgili, 2011; Ozturk, et al., 2011). En países como
Turquía, Irán, China, Estados Unidos y Canadá se han desarrollados modelos NN para
estimar la Ts a nivel diario y mensual. Para su validación se han utilizado y comparado
diferentes técnicas de programación como, por ejemplo, sistemas de inferencia neuro-
difuso adaptativo, regresiones lineales múltiples, programación de expresión génica,
bosques aleatorios, regresión del proceso gaussiano e híbridos. Entre ellos, Feng, et al.,
2019 realizo estimaciones cada 30 minutos a 2, 5, 10 y 20 cm, donde concuerda en conjunto
4
con otros autores la factibilidad del uso de modelos de NN a través de la técnica de máquina
de aprendizaje extremo (ELM, sigla en inglés), donde obtuvieron mejores rendimientos y
velocidades de cálculos (Tabari, et al., 2010; Bilgili, 2011; Ozturk, et al., 2011; Kisi, et al.,
2014; Kim y Singh, 2014; Nahvi, et al., 2016; Sanikhani, et al., 2018; Mehdizadeh, et al.,
2020). Por otro lado, los modelos de series de tiempo han recibido menos atención en
relación con los modelos de aprendizaje automático o de redes neuronales para la
predicción de la Ts (Tabari, et al., 2015; Samadianfard, et al., 2018; Zeynoddin, et al., 2019;
Alizamir, et al., 2020). Las principales desventajas de algunos modelos de NN están
relacionadas con la optimización del modelo, para que permitan minimizar o maximizar
ciertas funciones objetivas, con el fin de mejorar los tiempos de programación, rendimiento
y eficiencia del modelo. Además, los modelos de NN se necesitan entrenar con los valores
reales para que la programación matemática sea óptima (Villarrubia, et al., 2019), por ende,
los modelos solo pueden ser aplicados en suelos que presenten las mismas características
que el suelo estudiado, esto genera que el entrenamiento sea característico para el suelo
programado y no para todos. Por otro parte, sus ventajas permiten que el modelo predictivo
pueda tratarse como una “caja negra”, donde no se hacen suposiciones de
diferenciabilidad, no linealidad o discontinuidad de dominio y puedan ser un medio eficiente
y preciso para determinar las relaciones entre las entradas y las salidas, destacándose su
buena capacidad predictora a través de una gran cantidad de datos (Benke, et al., 2018).
Actualmente, nuevas técnicas como los modelos de aprendizaje profundo (“Deep learning”)
han experimentado un resurgimiento de popularidad durante los últimos años, dado al
mejoramiento de su entrenamiento que limitaba la profundidad o cantidad de neuronas del
modelo, permitiendo generar predicciones más complejas (Eldan y Shamir, 2016;
Goodfellow, et al., 2016).
En este estudio se propone estimar y predecir la temperatura del suelo a nivel horario a
diferentes profundidades en un suelo desnudo representativo de una zona de clima
Mediterráneo en la Región Metropolitana. En primer lugar, se utilizó un modelo determinista
analítico basado en la temperatura superficial y propiedades físicas del suelo (Campbell y
Norman, 1998), el cual fue comparado con un modelo de red neuronal prealimentada de
aprendizaje profundo (Deep feed-forward network) que utiliza información meteorológica
como entrada al modelo. En segundo lugar, se realizaron modelos de series de tiempo, por
un lado, un modelo autorregresivo integrado de media móvil (ARIMA) a nivel estacional,
que utiliza la Ts histórica para realizar la predicción y, por otro lado, un modelo de redes
neuronales recurrentes (RNN) que además de utilizar la información histórica de Ts como
5
variable de entrada, incorpora las variables meteorológicas del pasado. Finalmente, se
examinó la influencia del potencial mátrico (ψ) como variable de entrada a los modelos de
redes neuronales profundas (RNN y Deep feed-forward network), dado a que puede
proporcionar información cuantitativa sobre la dependencia de las condiciones de humedad
del suelo sobre la Ts.
Materiales y métodos
Área de estudio e instrumentación
El área de estudio se localiza en la comuna de Pirque, Provincia Cordillera en la Región
Metropolitana de Santiago (33° 40.428'S, 70° 35.154'E; Figura 1). Esta zona se emplaza en
la depresión geológica entre la Cordillera de los Andes y de la Costa. Sus suelos se
caracterizan por ser de origen aluvial, mineralizados y de acuerdo con el sistema de
clasificación taxonómica, corresponde a un orden Molisol (Bonilla y Johnson, 2012).
Presenta un clima templado cálido con lluvias invernales (clima Csb según la clasificación
de Köppen), a una altitud de 665 msnm con regímenes de precipitaciones anuales de 440
mm y temperaturas medias anuales del aire de 14°C según lo registrado por la estación
meteorológica de “Pirque” perteneciente a la Dirección General de Aguas (DGA) sobre la
base de 40 años (Centro de Ciencia del Clima y la Resiliencia [(CR)2], s.f.; Shuttle Radar
Topography Mission [SRTM], s.f).
6
Figura 1. Área de estudio. Ubicación y disposición de los lisímetros en la unidad de
monitoreo en el campus experimental de Pirque - Fundación AGRO UC.
La unidad experimental se representa en la figura 1. Esta consta con dos lisímetros de
pesada “Science-Lysimeter” de diseño dúplex (Wagna) de la empresa “Meter Environment”
que permiten la medición de múltiples variables y parámetros para fines científicos o
investigación de suelos. Estos lisímetros comprenden una superficie de 2 m2 con una
profundidad de 2 m de la columna de suelo, un diámetro externo de 1.6 m y una resolución
del flujo de agua de 0.01 mm (10 g) medida a cada minuto. Cada lisímetro está equipado
con un sistema de pesaje de precisión, dos tensiómetros para la regulación y supervisión,
ocho sondas de humedad de suelo, 6 unidades de potencial matricial (MPS-6), 1 pc
controlador de vacío (VS-pro), entre otros. Adicionalmente, se instalaron instrumentos
aledaños al lisímetro para monitorear las variables meteorológicas como: La temperatura
del aire (Ta), Déficit de Presión de Vapor (VDP), Presión de vapor (Pv) y radiación solar
incidente (Rs). Cabe mencionar que tanto el lisímetro como los sensores instalados
7
adyacentes a la unidad de muestreo fueron operadas por el laboratorio biometeorología y
climatología aplicada de la Facultad de Agronomía e Ingeniería Forestal de la Pontificia
Universidad Católica de Chile.
Cuadro 1. Principales estadígrafos para la temperatura de suelo (Ts) y variables
micrometeorológicas utilizadas para entrenar y validar los modelos desarrollados en este
trabajo.
Variables Media Desviación
estándar Mínimo Máximo
Ts (10 cm) [°C] 17.6 7.5 6.5 34.1
Ts (30 cm) [°C] 18.0 7.1 8.4 30.9
Ts (50 cm) [°C] 18.2 6.8 9.3 29.5
Ts (75 cm) [°C] 18.2 6.6 9.8 28.4
Ts (140 cm) [°C] 17.8 5.9 10.2 25.9
Potencial mátrico (10 cm) [hPa]
-468 271 -853 4
Presión de vapor [kPa]
0.9 0.3 0.3 1.7
Déficit de presión de vapor [kPa]
0.8 0.9 0.0 4.6
Radiación solar [W/m2]
171 260 0 1003
Temperatura del aire (2.5 m) [°C]
13.1 8.3 -3.7 33.8
El suelo en los lisímetros de la unidad experimental, corresponden al suelo aledaño descrito
para la zona. El suelo se encontraba en condición seca de forma natural, el cual se sometió
a dos riegos por goteo programados, uno el 28 de enero y otro el 14 de febrero del año
2020. Estos registraron dos horas de riego, con un volumen de 52 litros de agua
aproximadamente para cada riego. Se identifico la textura del suelo a las 5 profundidades
monitoreadas por el lisímetro y sus distribuciones del contenido de arcilla, limo y arena se
presentan en la Cuadro 1. El contenido de arcilla en general se encontró entre un 28% y un
18% entre los primeros 75 cm, en cambio a los 140 cm presentó un 2%. Además,
presentaron contenidos entre un 44% y un 40% de limo y entre un 38% y un 24% de arena
para los primeros 75 cm de profundidad. Sin embargo, a los 140 cm presentó mayores
diferencias en relación con las otras profundidades, con un 14% de limo y un 84% de arena.
8
Cuadro 2. Textura del suelo en la unidad experimental para cada profundidad
monitoreada por el lisímetro.
Propiedades físicas
Unidad de
medida
Profundidad del suelo
10 cm 30 cm 50 cm 75 cm 140 cm
Arcilla % 26 28 18 22 2
Limo % 42 44 44 40 14
Arena % 32 28 38 38 84
Textura - Franca Franco arcillosa
Franca Franca Areno
francosa
Modelo analítico
Se utilizó la ecuación teórica propuesta por van Wijk (1959) basada en la teoría del flujo de
calor para estimar la Ts a las cinco profundidades estudiadas (Ecuación 1.1):
𝑇(𝑧, 𝑡) = 𝑇𝑚 + 𝐴(0) ∗ exp (−𝑧
𝐷) 𝑠𝑒𝑛 (𝜔(𝑡 − 𝑡0) −
𝑧
𝐷) (1.1)
donde T(z,t) (°C) corresponde a la Ts a la profundidad “z” (m) en el tiempo “t” (hora); Tm
(°C) es la temperatura media diaria de la superficie del suelo durante un tiempo de interés;
A(0) (°C) es la amplitud de onda en la superficie;. t0 (hora) es el ajuste de la fase tiempo; y
D (m) es el “Damping Depth”, que es un parámetro que describe la atenuación de la
fluctuación de la temperatura en relación con la profundidad desde la superficie del suelo.
En este estudio, D se calculó utilizando la relación propuesta por Wierenga, et al., (1969)
(Ecuación 1.2):
𝐷 = 𝑧1 − 𝑧2
ln(𝐴2) − ln (𝐴1) (1.2)
donde z1 y z2 (m) son las profundidades a las que se registran mediciones. A1 y A2 son las
diferencias del valor máximo y mínimo de la temperatura del suelo diaria a una determinada
profundidad “𝑖” obteniéndose de la siguiente forma (Ecuación 1.3):
𝐴𝑖 =𝑇𝑆 (max) − 𝑇𝑆 (min)
2 (1.3)
Finalmente, para estimar la A(0) y Tm construyeron perfiles de temperatura de suelo para
cada día donde ocurren los valores máximos y mínimos de temperatura de suelo. Los
perfiles de temperatura se ajustaron a funciones polinómicas de grado 3, dado que
presentaron mejores ajustes en comparación a funciones logarítmicas, exponenciales,
9
potenciales, lineales y de medias móviles. Una vez obtenida la función para cada perfil se
extrapolaron los valores máximos y mínimos de la temperatura superficial. Luego, utilizando
las ecuaciones (1.1), (1.2) y (1.3) se estimó la temperatura del suelo a las cinco
profundidades propuestas. Luego, se calculó la raíz del error cuadrático medio (RMSE, sigla
en inglés), error medio absoluto (MAE, sigla en inglés) y el coeficiente de determinación sin
considerar los valores máximos y mínimos de temperatura del suelo diario utilizados para
calcular las variables faltantes.
Modelos de redes neuronales profundas.
Se diseñaron dos modelos de redes neuronales profundas, “deep feed-forward network o
multilayer perceptrón (MLP)” y “deep recurrent neural network (RNN)” para estimar y
predecir la temperatura del suelo a cinco profundidades (10, 30, 50, 75 y 140 cm)
(Goodfellow, et al., 2016; Mou, et al., 2017). Para ambos modelos se normalizaron las
variables y se dividió la base de datos dejando un 70% de ella para el entrenamiento y un
30% para la validación, además, se utilizó el gradiente por descenso estocástico (SGD, por
su sigla en inglés) para la estimación de parámetros del modelo (Goodfellow, et al., 2016).
El modelo Deep Feed-forward Network corresponde a una red neuronal de prealimentación
profunda, también conocido como perceptrones de multicapa (MLP, por su sigla en inglés),
destacándose por ser un método rápido y eficiente para el procesamiento de “Big data”
debido a las mejoras de las técnicas de computación (Goodfellow, et al., 2016). Su objetivo
consiste en estimar una o más variables de interés 𝑦 (en este caso, la Ts a las cinco
profundidades), a través de la aproximación de una función, f, dadas las entradas x. Esta
optimiza los valores de los parámetros 𝜃 traduciéndose en la mejor aproximación de la
función (Goodfellow, et al., 2016) (ecuación 2.1):
𝑦 = 𝑓(𝑥, 𝜃) (2.1)
El modelo permite que la información fluya a través de la función evaluada desde x, por
medio de cálculos intermedios para definir 𝑓 y obtener las salidas 𝑦, sin incluir conexiones
de retroalimentación al modelo, dado a que su aprendizaje rige en un solo sentido. Por lo
general, se representan componiendo muchas funciones juntas, es decir, se pueden formar
estructuras de cadenas (por ejemplo: 𝑓(1), 𝑓(2), 𝑓(3). . . 𝑓(𝑛)), donde las funciones se
10
encuentran conectadas en una cadena representada en la ecuación 2.2 (Goodfellow, et al.,
2016):
𝑓(𝑥) = 𝑓(𝑛) (𝑓(𝑛−1) … (𝑓(2)(𝑓(1)(𝑥))) … ) (2.2)
donde 𝑓(1) es la capa de entrada, 𝑓(2) hasta 𝑓(𝑛−1) son las capas ocultas y la capa final 𝑓(𝑛)
se le denota a la capa de salida.
En este contexto, la información avanza desde la capa de entrada, a través de las capas
ocultas y hasta la capa de salida (Gulcehre, et al., 2014; Figura 2), utilizando un algoritmo
de aprendizaje basado en gradientes (SGD), que minimiza el error cuadrático medio (MSE)
en relación con los datos reales de la temperatura del suelo a las diferentes profundidades.
La dimensionalidad de las capas ocultas determina el ancho del modelo, es decir, la
cantidad de capas ocultas utilizadas para realizar la estimación. Para este estudio se
experimentó con diferentes estructuras y dimensiones para determinar el mejor modelo en
base a tiempo de programación y menor RMSE. Finamente, se diseñaron dos modelos, uno
que incluye la retención del contenido de agua o potencial mátrico (ψ) y otro que no la
incluye como variable de entrada al modelo. De esta forma, se puede evaluar el aporte del
potencial mátrico (ψ) en la estimación de la temperatura del suelo.
Figura 2. Diagrama de referencia del diseño estructural del modelo MLP. El potencial
mátrico se denoto de color rojo para representan la inclusión o no de la variable en el
modelo. Fuente: Imagen de Woodie, A. (2017), adaptada para este trabajo.
Los modelos Deep recurrent neural network o redes neuronales recurrentes (RNN)
corresponden a una familia de redes neuronales de alimentación directa, con bucles en las
11
conexiones para procesar datos secuenciales. Por ejemplo, una secuencia de valores, tal
como se presenta en la Figura 3. A diferencia del modelo Deep feed-forward network, RNN
es capaz de procesar entradas de manera secuencial mucho más largas, al tener un estado
recurrente cuya activación depende de las observaciones del paso anterior (secuencia de
datos histórica) (Gulcehre, et al., 2014; Mou, et al., 2017). Este tipo de neuronas permite
que la red comparta parámetros a lo largo del tiempo, por ende, cada salida de la red
neuronal es en función de los miembros anteriores a través de una secuencia de vectores
𝑥(𝑡), cuyo valor t es el tiempo y se define mediante la siguiente ecuación (Gulcehre, et al.,
2014; Ecuación 3.1):
ℎ(𝑡) = 𝑓(ℎ(𝑡−1), 𝑥(𝑡); 𝜃) (3.1)
donde ℎ representa un estado típico de las RNN, la cual agrega características
arquitectónicas adicionales a la capa de salida para hacer las predicciones futuras (Figura
3). Por ende, la red aprende a utilizar ℎ(𝑡)para la secuencia pasada de entradas hasta t,
definiendo la longitud de la secuencia. Este paso activa de unidades ocultas recurrentes del
paso anterior, lo que es utilizado para modelar una distribución de probabilidad sobre el
siguiente elemento de la secuencia dado a su estado actual 𝑥(𝑡), que toma la secuencia
pasada completa (𝑥(𝑡), 𝑥(𝑡−1), … , 𝑥(2), 𝑥(1)) como entrada al modelo.
Figura 3. Diagrama de referencia del diseño de la estructura del modelo RNN. La
secuencia de observaciones corresponde a 120 valores horarios continuos de la
temperatura del suelo y la secuencia de salida corresponde a las 48 horas siguientes.
Fuente: Imagen de Venkatachalam (2019), adaptada para la figura 3.
12
Las neuronas que permiten este análisis son memorias a largo plazo (LSTM), que son un
tipo de unidades ocultas especiales capaces de aprender dependencias a largo plazo. Se
utilizó el algoritmo SGD para el entrenamiento, que permite estimar los parámetros (𝜃) a
través de la función de perdida MSE. La dimensionalidad de las capas LSTM se determinó
en base a diferentes estructuras con el objetivo de encontrar el mejor modelo en base a
tiempo de programación y menor RMSE. Su estructura y diseño consideró 3 capas LSTM
de 16, 32 y 16 neuronas. Su entrada considera 120 valores horarios de temperatura del
suelo continuos a la profundidad que se desea estimar, para pronosticar las 48 horas futuras
siguientes.
Modelo estocástico ARIMA.
Es un método estadísticamente popular y ampliamente utilizado para analizar series de
tiempo para predecir valores futuros basados en datos históricos. Estos modelos capturan
un conjunto de diferentes estructuras temporales estándar mediante una secuencia
ordenada de los valores en el tiempo y, dependiendo de la estructura de los datos, pueden
realizarse para un proceso estacionario o no estacionario (SARIMA o ARIMA), que permite
describir y explicar la estructura inherente de la serie a través de tres componentes: un
autorregresivo (AR), un proceso integrado mixto (I) y un promedio móvil (MA), cuya
denotación sería ARIMA (p,d,q) donde los valores enteros de los parámetros indican el tipo
de modelo ARIMA utilizado (Zeynoddin, et al., 2019; Karim, et al., 2020).
Primero, se realizó un procesamiento previo convirtiendo Ts en la función logarítmica para
cada una de las profundidades, reducir la heterocedasticidad (Rodríguez, 2017). Luego se
modelaron las series de tiempo utilizando ARIMA o SARIMA dependiendo del
comportamiento estacionario o no estacionario de la Ts en las diferentes profundidades. La
denotación del modelo ARIMA para el comportamiento no estacionario se representa
mediante la siguiente ecuación (4.1):
𝑇𝑠 (𝑡) = 𝛼1𝑇𝑠 (𝑡−1) + 𝛼2𝑇𝑠 (𝑡−2) + ⋯ + 𝛼𝑝𝑇𝑠 (𝑡−𝑝) + 𝜀𝑡 + 𝛽1𝜀 (𝑡−1) + ⋯ + 𝛽𝑞𝜀 (𝑡−𝑞) (4.1)
donde, Ts (t) es la serie de tiempo deseada, 𝜀𝑡 es la serie de tiempo residual, 𝛼 es el
parámetro AR no estacional y p es el orden de la AR, 𝛽 es la media móvil (MA) y q es el
orden del parámetro MA para datos no estacionarios.
Para el modelo SARIMA, se denota mediante la siguiente ecuación (4.2) (Karim, et al.,
2020):
13
𝛷𝑃(𝐵𝑠) 𝜑(𝐵)𝛻𝑠𝐷𝛻𝑑 𝑇𝑠 (𝑡) = 𝛼 + 𝛩𝑄(𝐵𝑠)𝜃(𝐵)𝜀𝑡 (4.2)
donde 𝜀𝑡 es la serie de tiempo residual, 𝜑(𝐵) y 𝜃(𝐵) son los vectores autorregresivos (AR)
y promedio móvil (MA) de orden p y q, respectivamente. 𝛷𝑃(𝐵𝑠) y 𝛩𝑄(𝐵𝑠) corresponden a
los operadores estacionales autorregresivos (AR) y promedio móvil (MA) de orden P y Q
respectivamente, con un periodo estacional s.
Para este estudio se utilizó el paquete ‘pmdarima’ de Python, que genera los valores
óptimos de p, d y q más convenientes para el conjunto de datos que proporciona la mejor
predicción. Las series de tiempo utilizadas son de 120 datos horarios continuos,
considerados como la “secuencia histórica” para predecir las 48 horas futuras. Se tomaron
46 series de tiempo para cada profundidad y se evaluó la estacionariedad de las series a
través de la prueba de ‘Dickey-Fuller’ para cada una de ellas (Fuller, 1976). Luego, se utilizó
un modelo ARIMA o SARIMA según corresponda y se programó para obtener los
parámetros y realizar el pronóstico para cada serie de tiempo. Finalmente, se evaluó el
RMSE, MAE y R2 para cada serie y fue promediado para cada profundidad.
Evaluación de precisión de los modelos
Para todos los modelos (Analítico, MLP, RNN y ARIMA estacional) se evaluó y comparó la
precisión de predicción a través del RMSE (5.1), MAE (5.2) y R2 (5.3):
𝑅𝑀𝑆𝐸 = √(∑ (𝑆𝑇𝑖𝑚 − 𝑆𝑇𝑖𝑒)2)𝑁
𝑖=1
𝑁 (5.1)
𝑀𝐴𝐸 =∑ |𝑆𝑇𝑖𝑚 − 𝑆𝑇𝑖𝑒|𝑁
𝑖=1
𝑁 (5.2)
𝑅2 =∑(𝑆𝑇𝑖𝑚 − 𝑆𝑇𝑖𝑒)2
∑(𝑆𝑇𝑖𝑚 − 𝑆𝑇𝑀)2 (5.3)
donde, N es la cantidad de datos, 𝑆𝑇𝑖𝑚 es la temperatura del suelo real, 𝑆𝑇𝑖𝑒 es la
temperatura estimada o predicha por el modelo y 𝑆𝑇𝑀 es la media de los valores de
temperatura observados para cada profundidad.
14
Resultados
En este estudio se comparó la precisión de las técnicas de Deep learning y metodologías
convencionales para estimar y pronosticar la Ts. Primero, se presentan los resultados entre
los modelos analítico, MLP y MLP que incluye el potencial mátrico como variable de entrada
para estimar la temperatura horaria del suelo a cinco profundidades. En segundo lugar, se
presentan los resultados de los modelos de series de tiempo (RNN y ARIMA), para el
pronóstico de 48 horas de la temperatura del suelo en cinco profundidades.
Las variables calculadas para el modelo analítico Tm, A(0) y D presentaron valores
promedios de 17,35 ± 7.6 °C, 3,00 ± 1,14 °C y 0,17 ± 0,09 m, respectivamente, resumidos
en la Cuadro 3. Las temperaturas del suelo obtenidas a través de la ecuación de van Wijk
(1959) muestran que el mejor ajuste de precisión fue a los 10 cm, donde el RMSE, MAE y
R2 presentan valores de 1,09 °C, 0,90 °C y 0,98, respectivamente. En general, el ajuste del
modelo disminuyó su precisión a mayores profundidades (Figura 4), de tal forma que el
menor ajuste del modelo correspondía a la profundidad de 140 cm (RMSE = 2,93 °C, MAE
= 2,49 °C y r2 =0,88). En la Cuadro 4 se presentan las métricas de evaluación de precisión
del modelo analítico, que en promedio presentó un RMSE = 1,95 ± 0,72 °C y MAE = 1,63 ±
0,63 °C ponderado en el perfil de suelo estudiado.
Cuadro 3. Principales estadígrafos de las variables calculadas para la ecuación de van
Wijk, obtenidos a traves de la extrapolación de la temperatura del suelo (Tm, A(0) y D).
Parámetros Tm (°C) Ta (°C) D (m) Media 17,35 3,00 0,17
Desviación estándar
7,60 1,14 0,09
Máximo 32,07 4,80 1,05 Mínimo 6,45 0,47 0,11
Se examinó la exactitud del modelo MLP y se evaluó aporte del potencial mátrico (ψ) como
variable de entrada. Se seleccionó para los modelos MLPs una función sigmoidea de tres
capas ocultas con 128, 256 y 128 neuronas respectivamente, elegida en base a su tiempo
de programación y reducción del RMSE. Sus resultados señalan que los modelos MLPs
redujeron los errores y mejoraron el ajuste del R2 a mayores profundidades (Cuadro 4). Los
peores ajustes se obtuvieron a la profundidad de 10 cm (MLP: RMSE = 1,1°C y MAE =
0,8°C; [MLP + ψ]: RMSE = 0,6°C y MAE = 0,4°C) y en cambio, el mejor ajuste fue a los 140
cm de profundidad, tanto para el modelo que incluyo el potencial mátrico como el que no
(MLP, RMSE = 0,7°C y MAE = 0,5°C; [MLP + ψ], RMSE = 0,2°C y MAE = 0,2°C; Figuras
15
4). El aporte del potencial mátrico mejora el desempeño del modelo. Se observó una
disminución de 56,3% para el RMSE y un 56,7% para el MAE en promedio de todas las
profundidades. A pesar de que la inclusión del potencial mátrico (ψ) es a los 10 cm, la mayor
reducción del error fue a la profundidad de 140 cm, con un 65,2% para el RMSE y 64,1%
en el MAE en comparación al modelo analítico. Por ende, se observa que el modelo MLP
demostró un desempeño superior en comparación con el método analítico y obtuvo mejores
resultados al incluir el potencial mátrico en las variables de entrada al modelo.
15
RMSE = 1,09 MAE = 0,90R² = 0,98
0
10
20
30
40
0 10 20 30 40
Ts
(10 c
m)
estim
ada [°C
]
RMSE = 1,46MAE = 1,19R² = 0,97
0
10
20
30
40
0 10 20 30 40
Ts
(30 c
m)
estim
ada [°C
]
RMSE = 1,93MAE = 1,61 R² = 0,95
0
10
20
30
40
0 10 20 30 40
Ts
(50 c
m)
estim
ada [°C
]
RMSE = 2,32MAE = 1,95R² = 0,93
0
10
20
30
40
0 10 20 30
Ts
(75 c
m)
estim
ada [°C
]
RMSE = 2,93MAE = 2,49 R² = 0,88
0
10
20
30
40
0 10 20 30
Ts
(140 c
m)
estim
ada [°C
]
Ts real [°C]
RMSE = 1,05MSE = 0,81R² = 0,98
0
10
20
30
40
0 10 20 30 40
RMSE = 0,98MAE = 0,75R² = 0,98
0
10
20
30
40
0 10 20 30 40
RMSE = 0,89MAE = 0,67R² = 0,99
0
10
20
30
40
0 10 20 30 40
RMSE = 0,82MAE = 0,60R² = 0,99
0
10
20
30
0 10 20 30
RMSE = 0,70MAE = 0,50R² = 0,99
0
10
20
30
0 10 20 30
Ts real [°C]
RMSE = 0,58 MAE = 0,43R² = 0,99
0
10
20
30
40
0 10 20 30 40
RMSE = 0,48MAE = 0,35R² = 1,00
0
10
20
30
40
0 10 20 30 40
RMSE = 0,37MAE = 0,27R² = 1,00
0
10
20
30
40
0 10 20 30 40
RMSE = 0,31MAE = 0,23R² = 1,00
0
10
20
30
40
0 10 20 30 40
RMSE = 0,24MAE = 0,18R² = 1,00
0
10
20
30
0 10 20 30
Ts real [°C]
Modelo Analítico Modelo MLP Modelo MLP + ψ
Figura 4. Diagramas de dispersión para los modelos analítico, MLP y MLP que incluye el potencial mátrico (ψ) respectivamente,
para estimar cada temperatura del suelo a los 10, 30, 50, 75 y 140 cm de profundidad. La línea de color rojo representa la línea
de la regresión.
16
Cuadro 4. Rendimiento estadístico de los modelos analitico, MLP y MLP que incluye el potencial matrico (ψ) para la estimación de la
temperatura horaria del suelo a diferentes profundidades.
Cuadro 5. Rendimiento estadístico de los modelos ARIMA y RNN para la estimación futura de la temperatura horaria del suelo a
diferentes profundidades.
MODELO
10 cm 30 cm 50 cm 75 cm 140 cm Promedio
RMSE (°C)
Promedio MAE (°C)
RMSE (°C)
MAE (°C)
R2 RMSE (°C)
MAE (°C)
R2 RMSE (°C)
MAE (°C)
R2 RMSE (°C)
MAE (°C)
R2 RMSE (°C)
MAE (°C)
R2
ARIMA o SARIMA
1,543 1,046 0,947 0,898 0,470 0,981 0,487 0,155 0,996 0,188 0,104 0,999 0,072 0,049 1,000 0,638 0,365
RNN 1,251 1,031 0,861 0,945 0,784 0,909 0,560 0,473 0,954 0,543 0,463 0,956 0,511 0,429 0,921 0,762 0,636
MODELO
10 cm 30 cm 50 cm 75 cm 140 cm Promedio RMSE (°C)
Promedio MAE (°C) RMSE
(°C) MAE (°C)
R2 RMSE (°C)
MAE (°C)
R2 RMSE (°C)
MAE (°C)
R2 RMSE (°C)
MAE (°C)
R2 RMSE (°C)
MAE (°C)
R2
Analítico 1,093 0,904 0,981 1,464 1,186 0,971 1,934 1,612 0,952 2,317 1,954 0,929 2,933 2,488 0,879 1,948 1,629
MLP 1,052 0,806 0,983 0,983 0,753 0,984 0,886 0,667 0,986 0,818 0,604 0,988 0,696 0,500 0,989 0,887 0,666
MLP + ψ 0,581 0,434 0,994 0,478 0,353 0,996 0,369 0,273 0,997 0,310 0,232 0,998 0,242 0,179 0,999 0,396 0,294
17
Los modelos de series de tiempo utilizaron secuencias de entrada de 120 valores horarios
(5 días) como registro “históricos" para predecir los siguientes 48 valores (2 días). Sin
embargo, se diferencian en que los modelos RNN generan un único modelo a diferencia de
los modelos ARIMA que se deben ajustar nuevamente para cada serie de tiempo. La
exactitud de los modelos RNN y ARIMA mostraron un mejor desempeño a mayores
profundidades, dadas las características de la variable temperatura del suelo. La
comparación entre el modelo RNN y ARIMA, mostró que a los 10 cm RNN tiene una
exactitud mayor que el modelo ARIMA en relación con los errores evaluados (RNN: RMSE
= 1,25°C y MAE= 1,03°C; ARIMA: RMSE = 1,54°C y MAE = 1,05°C; (Figura 5). Sin embargo,
a mayores profundidades la exactitud de los modelos ARIMA fueron superiores a los
modelos de RNN con un error promedio RMSE = 0,76°C - MAE = 0,64°C y RMSE = 0,64°C
– MAE = 0,37°C, respectivamente (Cuadro 5). La principal ventaja de ARIMA es que puede
incluir parámetros estacionales y no estacionales. Además, para el modelo ARIMA se
incluyó el error dada estacionalidad del año y sus valores promedios muestran que el mejor
desempeño de los modelos se obtuvo durante la estación de verano (RMSE = 0,40°C y
MAE = 0,26°C) y el peor ajuste del modelo fue durante la época de invierno (RMSE = 0,85°C
y MAE =0,55°C; Cuadro 6).
Cuadro 6. Rendimiento estadístico estacional del modelo ARIMA para la estimación
futura de la temperatura horaria del suelo a diferentes profundidades.
Estación del año
10 cm 30 cm 50 cm 75 cm 140 Promedio
RMSE (°C)
Promedio MAE (°C)
RMSE (°C)
MAE (°C)
RMSE (°C)
MAE (°C)
RMSE (°C)
MAE (°C)
RMSE (°C)
MAE (°C)
RMSE (°C)
MAE (°C)
Verano 0,996 0,634 0,444 0,295 0,354 0,241 0,129 0,084 0,054 0,040 0,395 0,259
Otoño 1,477 0,916 0,749 0,412 0,288 0,175 0,141 0,088 0,078 0,051 0,547 0,329
Invierno 2,156 1,588 1,288 0,702 0,494 0,297 0,247 0,131 0,075 0,051 0,852 0,554
18
0
10
20
30
40
1 501 1001 1501
Ts
a 1
0 c
m
[°C
]Ts estimada [°C] Ts real [°C]
0
10
20
30
40
1 501 1001 1501
Ts
a 3
0 c
m
[°C
]
0
10
20
30
1 501 1001 1501
Ts
a 5
0 c
m
[°C
]
0
10
20
30
1 501 1001 1501
Ts
a 7
5 c
m
[°
C]
0
10
20
30
40
1 501 1001 1501 2001
Ts estimada [°C] Ts real [°C]
0
10
20
30
40
1 501 1001 1501 2001
0
10
20
30
1 501 1001 1501 2001
RMSE = 0,60
MAE = 0,52
RMSE = 0,42
MAE = 0,33
RMSE = 0,95
MAE = 0,78
RMSE = 1,25
MAE = 1,03
0
10
20
30
1 501 1001 1501Ts
a 1
40 c
m
[°C
]
Tiempo [horas]
RMSE = 0,51
MAE = 0,43
0
10
20
30
1 501 1001 1501 2001
0
10
20
30
1 501 1001 1501 2001
Tiempo [horas]
Figura 5. Comparación entre la Ts del suelo medida y pronosticada para las series de tiempo de los modelos de RNN y ARIMA a
10, 30, 50, 75 y 140 cm de profundidad.
Modelo RNN Modelo ARIMA
RMSE = 1,54
MAE = 1,05
RMSE = 0,90
MAE = 0,47
RMSE = 0,49
MAE = 0,16
RMSE = 0,19
MAE = 0,10
RMSE = 0,07
MAE = 0,05
19
Discusión
En este estudio se compararon las estimaciones y simulaciones de la temperatura horaria
de un suelo desnudo de clima mediterráneo a las profundidades de 10, 30, 50, 75 y 140
cm, entre los modelos Analítico – MLP y ARIMA – RNN.
Las estimaciones de la Ts horaria de los modelos MLP tuvieron un mayor ajuste en
comparación al modelo analítico que utiliza la ecuación de van Wijk (1959). Además, en
comparación con otros trabajos de redes neuronales, por ejemplo, el propuesto por Feng,
et al., 2019, el modelo MLP mostró ajustes superiores en relación con la máquina de
aprendizaje extremo (ELM), cuya comparación a los 10 cm señala que tiene mejores
ajustes, como también un mejor desempeño a mayores profundidades. Esta reducción del
error a mayores profundidades puede estar dado a los umbrales de variabilidad entre los
diferentes estratos medidos y además, a una menor influencia de factores externos (Tabari,
et al., 2010; Bilgili, 2011; Ozturk, et al., 2011; Kisi, et al., 2014; Kim y Singh, 2014; Nahvi, et
al., 2016; Sanikhani, et al., 2018; Feng, et al., 2019; Alzamir, et al., 2020; Mehdizadeh, et
al., 2020). El desempeño mostrado por el modelo MLP se debe a la drástica mejoría de los
modelos de aprendizaje profundo de los últimos años. Los cuales han permitido
composiciones estructurales complejas aumentando la cantidad de nodos ocultos para
mejorar el aprendizaje, precisión y reduciendo sesgos en el procesamiento de datos
(LeCun, et al., 2015 Eldan y Shamir, 2016; Goodfellow, et al., 2016, Khosravi, et al., 2018).
Por otra parte, en los modelos MLP se obtuvo que el aporte de la retención de agua en
suelo o potencial matrico (ψ) como variable de entrada al modelo, permitió la reducción de
los errores en las cinco profundidades, promediando en total una disminución desde
0,887°C a 0,396°C para el RMSE (-55,4%) y desde 0,666°C a 0,294°C (-55.9%). Esta
disminución está relacionada a la influencia del contenido de agua sobre la temperatura del
suelo y su relación con la conductividad térmica entre los diferentes estratos. Sin embargo,
de la incertidumbre en la relación entre las variables puede estar limitada por no
linealidades, pero dada la complejidad de los modelos MLP permite mejorar su aprendizaje
(Davidson, et al., 2002; Riveros, et al., 2007; Goodfellow, et al., 2016)
En general, los modelos de series de tiempo para predecir valores futuros de la temperatura
del suelo suelen ser más escasos (Zeynoddin, et al., 2019, Li, et al., 2020). Nuestros
resultados sugieren que el modelo ARIMA tiene mejores predicciones futuras que el modelo
RNN, pero, ARIMA tiene la capacidad de incluir o no parámetros estacionales. Además, se
debe programar para cada serie de tiempo un nuevo modelo, a diferencia del modelo RNN
20
que genera un modelo único para predecir la temperatura del suelo. RNN no incluye
parámetros estacionales dado a que sus conexiones recurrentes, pero se encontraron
problemas de rendimiento a los 30 cm de profundidad, dado a que no tiene un
comportamiento estacional (Figura 5). Esto se puede deber a que no se utilizaron
suficientes datos históricos para comprender el comportamiento de las “subsecuencias” en
el tiempo y se puede mejorar incluyendo un mayor número de datos para el entrenamiento
de la temperatura (Goodfellow, et al., 2016)
Finalmente, la estimación de la temperatura tiene un rol fundamental en la gestión
sostenible de los ecosistemas en Chile, dado a que en el país no se registra en línea de
manera continua la Ts en diferentes profundidades, volviendo los modelos MLP, RNN y
ARIMA una alternativa factible para su estimación (Stolpe y Undurraga, 2016). Además, los
modelos MLP, RNN y ARIMA podrían alimentar bases de datos inexistentes o incompletas
y realizar tendencias futuras, mejorar modelos o entender procesos como: flujo de calor del
suelo, evaporación del suelo, evapotranspiración, respiración del suelo, comportamientos
microbianos, flujos de CO2, entre otros (Davidson, et al., 2002; Sanikhani, et al., 2018).
Conclusión
La temperatura del suelo forma parte de diferentes procesos y reacciones fisicoquímicas
del suelo, por ende, forma parte esencial en los sistemas de apoyo para la toma de
decisiones relacionados con la caracterización del suelo, utilizados para mejorar sus
rendimientos. En este trabajo se propuso estimar y predecir la temperatura horaria del suelo
a cinco profundidades a través de técnicas de redes neuronales, un modelo analítico y de
series de tiempo.
Se obtuvo que los modelos que presentaron un mejor desempeño fueron los MLPs para la
estimación de la Ts horaria del suelo, tanto por los tiempos de programación como por su
capacidad de predicción. En comparación con otros trabajos de redes neuronales, se
observa que el mejoramiento del entrenamiento en los modelos de aprendizaje profundo
(MLP) es una alternativa factible para generar predicciones complejas. Además, el aporte
de incluir la variable de retención de agua en el suelo (ψ), mejoró las estimaciones de la Ts
a todas las profundidades estudiadas. Esta variable (ψ) no se había probado en los modelos
de redes neuronales, a pesar de que sea una variable directamente proporcional a la
conductividad térmica, la cual influye directamente con el comportamiento de la temperatura
21
del suelo. Por lo tanto, MLP es altamente recomendado para estimar Ts a diferentes
profundidades.
Por otro lado, hay pocos estudios que predigan la Ts futura. El modelo RNN demostró ser
una alternativa factible a los 10 cm de profundidad en comparación al modelo ARIMA
estacional. Pero a los siguientes estratos, ARIMA mostro tener un mejor desempeño. Sin
embargo, su desventaja recae en que debe ser reprogramado para cada serie de tiempo y
no es un modelo único como RNN. Eventualmente el modelo RNN puede mejorar su
capacidad de predicción, si aumentamos la cantidad de series de datos.
Finalmente, mejorar la comprensión de la variable (Ts) permitiría elaborar estrategias de
gestión agronómica, como por ejemplo para el riego, absorción de nutrientes y agua,
captación o liberación de CO2, regulación de pesticidas, prevención de heladas, entre otras.
Facilitando sistemas de apoyo para la toma de decisiones en diferentes directrices.
22
Resumen
La temperatura del suelo cumple un rol fundamental en el funcionamiento de
microorganismos, tasas de descomposición de residuos y en el ciclo hidrológico. Sin
embargo, la ausencia de monitoreo y la baja disponibilidad de datos en línea dificultan sus
estimaciones. Ante esta situación algunos estudios han desarrollado modelos para estimar
la temperatura del suelo (Ts) a distintas profundidades, donde los modelos de redes
neuronales han mostrado los mejores resultados. Utilizando los últimos avances del
aprendizaje profundo, en este estudio se estima la temperatura horaria del suelo a cinco
profundidades (10, 30, 50, 75 y 140 cm) para un suelo desnudo de clima mediterráneo en
Chile, a través de un modelo de perceptrones de multicapas (MLP). Este modelo se
comparó con un modelo analítico propuesto por van Wijk en 1959. Sus resultados indican
que el modelo MLP proporciona mejores ajustes que el método analítico. Además, al incluir
el potencial mátrico como variable explicativa, se redujo el RMSE y MAE promedio de las
cinco profundidades en alrededor de un 56%. Por otra parte, se predice la temperatura para
48 horas mediante un modelo de redes neuronales recurrentes (RNN) y un modelo
autorregresivo integrado de media móvil (ARIMA). Los resultados muestran que, para la
mayoría de las profundidades estudiadas, el modelo ARIMA tiene mejor desempeño que
RNN para la predicción, pero se debe considerar que no es un modelo único como el
modelo RNN y hay que reprogramar los parámetros para cada serie de tiempo.
Palabras clave: Temperatura del suelo, Aprendizaje profundo, Perceptrones de
multicapas, redes neuronales recurrentes, modelos ARIMA.
Referencias
Benke, K. K., Norng, S., Robinson, N. J., Benke, L. R., & Peterson, T. J. (2018). Error
propagation in computer models: analytic approaches, advantages, disadvantages
and constraints. Stochastic Environmental Research and Risk Assessment, 32(10),
2971-2985.
Bilgili, M. (2011). The use of artificial neural networks for forecasting the monthly mean soil
Temperatura in Adana, Turkey. Turkish Journal of Agriculture and Forestry, 35(1),
83-93.
23
Bonilla, CA y Johnson, OI (2012). Mapeo de erosionabilidad del suelo y su correlación con
las propiedades del suelo en Chile Central. Geoderma, 189, 116-123.
Campbell, G. S., y Norman, J. M. (1998). Radiation fluxes in natural environments. An
Introduction to Environmental Biophysics (pp. 167-184). Springer, New York, NY.
Canadell, J., Jackson, R. B., Ehleringer, J. B., Mooney, H. A., Sala, O. E., y Schulze, E. D.
(1996). Maximum rooting depth of vegetation types at the global scale. Oecologia,
108(4), 583-595.
Centro de Ciencia del Clima y la Resiliencia (CR)2. Explorador climático. (s.f).
http://explorador.cr2.cl/
Chinnusamy, V., Zhu, J., & Zhu, J. K. (2007). Cold stress regulation of gene expression in
plants. Trends in plant science, 12(10), 444-451.
Crombie, D. S., Tippett, J. T., y Hill, T. C. (1988). Dawn water potential and root depth of
trees and understorey species in southwestern Australia. Australian Journal of
Botany, 36(6), 621-631.
Curiel Yuste, J., Baldocchi, D. D., Gershenson, A., Goldstein, A., Misson, L., & Wong, S.
(2007). Microbial soil respiration and its dependency on carbon inputs, soil
temperature and moisture. Global Change Biology, 13(9), 2018-2035.
Davidson, E. A., Belk, E., y Boone, R. D. (1998). Soil water content and temperature as
independent or confounded factors controlling soil respiration in a temperate mixed
hardwood forest. Global change biology, 4(2), 217-227.
Eldan, R., y Shamir, O. (2016). The power of depth for feedforward neural networks. In
Conference on learning theory (pp. 907-940).
Fan, Y., Miguez-Macho, G., Jobbágy, E. G., Jackson, R. B., y Otero-Casal, C. (2017).
Hydrologic regulation of plant rooting depth. Proceedings of the National Academy
of Sciences, 114(40), 10572-10577.
Fuller, W. A. (1976). Introduction to Statistical Time Series, New York: JohnWiley.
FullerIntroduction to Statistical Time Series1976.
Goodfellow, I., Bengio, Y., y Courville, A. (2016). Deep learning book. MIT Press, 521(7553),
800.
24
Hanks, R. J. (2012). Applied soil physics: soil water and temperature applications (Vol. 8).
Springer Science y Business Media.
Hay, R. K. M., y Wilson, G. T. (1982). Leaf appearance and extension in field-grown winter
wheat plants: the importance of soil temperature during vegetative growth. The
Journal of Agricultural Science, 99(2), 403-410.
Jackson, R. B., Canadell, J., Ehleringer, J. R., Mooney, H. A., Sala, O. E., y Schulze, E. D.
(1996). A global analysis of root distributions for terrestrial biomes. Oecologia,
108(3), 389-411.
Karim, A., Kube, A. O., y Saeed, B. I. I. (2020). Modeling of Monthly Meteorological Time
Series. Journal of Statistical and Econometric Methods, 9(4), 117-136.
Langholz, H. (1989). A simple model for predicting daily mean soil temperatures. Journal of
Agronomy and Crop Science, 163(5), 312-318.
LeCun, Y., Bengio, Y., y Hinton, G. (2015). Deep learning. nature, 521(7553), 436-444.
Li, C., Zhang, Y., y Ren, X. (2020). Modeling Hourly Soil Temperature Using Deep BiLSTM
Neural Network. Algorithms, 13(7), 173.
Meza, F. J., Wilks, D. S., Gurovich, L., y Bambach, N. (2012). Impacts of climate change on
irrigated agriculture in the Maipo Basin, Chile: reliability of water rights and changes
in the demand for irrigation. Journal of water resources planning and management,
138(5), 421-430.
Mihalakakou, G. (2002). On estimating soil surface temperature profiles. Energy and
Buildings, 34(3), 251-259.
Mooney, H. A., Gulmon, S. L., Rundel, P. W., y Ehleringer, J. (1980). Further observations
on the water relations of Prosopis tamarugo of the northern Atacama desert.
Oecologia, 44(2), 177-180.
Ozturk, M., Salman, O., y Koc, M. (2011). Artificial neural network model for estimating the
soil temperature. Canadian journal of soil science, 91(4), 551-562.
Pregitzer, K. S., King, J. S., Burton, A. J., y Brown, S. E. (2000). Responses of tree fine roots
to temperature. New Phytologist, 147(1), 105-115.
25
Pregitzer, K. S., y King, J. S. (2005). Effects of soil temperature on nutrient uptake. In
Nutrient acquisition by plants (pp. 277-310). Springer, Berlin, Heidelberg.
Paul, K. I., Polglase, P. J., Smethurst, P. J., O’Connell, A. M., Carlyle, C. J., y Khanna, P. K.
(2004). Soil temperature under forests: a simple model for predicting soil temperature
under a range of forest types. Agricultural and Forest Meteorology, 121(3-4), 167-
182.
Riveros‐Iregui, D. A., Emanuel, R. E., Muth, D. J., McGlynn, B. L., Epstein, H. E., Welsch,
D. L., ... y Wraith, J. M. (2007). Diurnal hysteresis between soil CO2 and soil
temperature is controlled by soil water content. Geophysical Research Letters,
34(17).
Rodríguez, G. (2017). Selección de modelos de heterocedasticidad autorregresiva
condicional: Una aplicación a la volatilidad de los retornos bursátiles en Perú.
Revista de análisis económico, 32(1), 69-94.
Samadianfard, S., Ghorbani, M. A., y Mohammadi, B. (2018). Forecasting soil temperature
at multiple-depth with a hybrid artificial neural network model coupled-hybrid firefly
optimizer algorithm. Information Processing in Agriculture, 5(4), 465-476.
Sanikhani, H., Deo, R. C., Yaseen, Z. M., Eray, O., y Kisi, O. (2018). Non-tuned data
intelligent model for soil temperature estimation: A new approach. Geoderma, 330,
52-64.
Shuttle Radar Topography Mission [SRTM]. (s.f). Spatial Information.
https://srtm.csi.cgiar.org/srtmdata/.
Snyder, R. L., Melo-Abreu, J. P., y VILLAR MIR, J. M. (2010). Protección contra las heladas:
fundamentos, práctica y economía. Serie FAO sobre el Medioambiente y la Gestión
de los Recursos Naturales, 1(10).
Stolpe, N., y Undurraga, P. (2016). Long term climatic trends in Chile and effects on soil
moisture and temperature regimes. Chilean journal of agricultural research, 76(4),
487-496.
Tabari, H., Hosseinzadeh Talaee, P., y Willems, P. (2015). Short‐term forecasting of soil
temperature using artificial neural network. Meteorological Applications, 22(3), 576-
585.
26
Toy, T. J., Kuhaida Jr, A. J., y Munson, B. E. (1978). The prediction of mean monthly soil
temperature from mean monthly air temperature. Soil Science, 126(3), 181-189.
van Wijk, W. R., Larson, W. E., y Burrows, W. C. (1959). Soil temperature and the early
growth of corn from mulched and unmulched soil. Soil Science Society of America
Journal, 23(6), 428-434.
Venkatachalam, M. (2019). A Recurrent Neural Network, with a hidden state that is meant
to carry pertinent information from one input item in the series to others [imagen].
https://towardsdatascience.com/recurrent-neural-networks-d4642c9bc7ce.
Consultado el 01 de marzo del 2021.
Villarrubia, G., De Paz, J. F., Chamoso, P., & De la Prieta, F. (2018). Artificial neural
networks used in optimization problems. Neurocomputing, 272, 10-16.
West, E. S. (1952). A study of the annual soil temperature wave. Australian Journal of
Chemistry, 5(2), 303-314.
Wierenga, P. J., Nielsen, D. R., y Hagan, R. M. (1969). Thermal properties of a soil based
upon field and laboratory measurements. Soil science society of America Journal,
33(3), 354-360.
Woodie, A. (2017). Machine Learning, Deep Learning, and AI: What’s the Difference?
[imagen]. https://www.datanami.com/2017/05/10/machine-learning-deep-learning-
ai-whats-difference/. Consultado el 01 de marzo del 2021
Yang, C. C., Prasher, S. O., y Mehuys, G. R. (1997). An artificial neural network to estimate
soil temperature. Canadian Journal of Soil Science, 77(3), 421-429.
Zeynoddin, M., Bonakdari, H., Ebtehaj, I., Esmaeilbeiki, F., Gharabaghi, B., y Haghi, D. Z.
(2019). A reliable linear stochastic daily soil temperature forecast model. Soil and
Tillage Research, 189, 73-87.
Zheng, D., Hunt Jr, E. R., y Running, S. W. (1993). A daily soil temperature model based on
air temperature and precipitation for continental applications. Climate Research,
2(3), 183-191.
top related