Revista Científica de Ingeniería, Industria y Arquitectura
Vol.7, Núm.14 (jul-dic 2024) ISSN: 2737-6451
Cita sugerida: Rogel, A., Hidalgo, A., Castro, F., Morales, F., Moya, D., &
Paredes, B. (2024). Aplicación de Redes Neuronales Artificiales para la
Estimación de Precipitaciones: Caso de Estudio de la Cuenca del Río Pastaza,
Ecuador. Revista Científica FINIBUS Ingeniería, Industria y Arquitectura.
7(14) 131-146 https://doi.org/10.56124/finibus.v7i14.013
DOI: https://doi.org/10.56124/finibus.v7i14.013
Recibido: 12-junio-2023 Revisado: 28-junio-2024
Aceptado: 01-julio-2024 Publicado: 31-julio-2024
Artículo
Aplicación de Redes Neuronales Artificiales para la
Estimación de Precipitaciones: Caso de Estudio de la
Cuenca del Río Pastaza, Ecuador
Alexander Rogel
[1]
Andrés Hidalgo
[1]
Fidel Castro
[1]
Dilon Moya
[1]
Bolívar Paredes
[1]
[1] Universidad Técnica de Ambato, Facultad de Ingeniería Civil y Mecánica, Carrera de Ingeniería Civil, Ambato 180206, Ecuador
Autor para correspondencia: be.paredes@uta.edu.ec
Resumen
La cuenca del Río Pastaza en Ecuador, crucial por su biodiversidad y gestión hídrica, enfrenta desafíos significativos debido al
cambio climático. Este estudio presenta la aplicación de redes neuronales artificiales (RNA) para abordar las deficiencias en
los datos pluviométricos de esta cuenca. Implementando un modelo optimizado con 5000 iteraciones, se logró una fiabilidad
del 95% en la estimación de datos pluviométricos. Se analizaron datos de múltiples estaciones meteorológicas, ajustando el
modelo según las distancias entre estaciones, y se demostró una mejora en precisión y coherencia en comparación con métodos
tradicionales. Los resultados destacan la capacidad de las RNA para adaptarse a variaciones significativas en los datos,
mejorando la planificación hídrica y mitigando los efectos de eventos climáticos extremos mediante una mejor predicción
pluviométrica. La capacidad de las RNA para procesar grandes volúmenes de datos con complejas interacciones es
particularmente relevante en el campo hidrometeorológico, donde la variabilidad espacial y temporal de los datos es sustancial.
Este avance evidencia la aplicabilidad de las RNA en hidrología y climatología, contribuyendo al entendimiento de la
variabilidad climática de la región. La integración de técnicas avanzadas de inteligencia artificial en la estimación y
homogeneización de datos hidrológicos proporciona una base sólida para desarrollar estrategias de adaptación y mitigación
más efectivas frente al cambio climático. A medida que la tecnología evoluciona, se abren nuevas perspectivas para aplicar
técnicas similares en otras cuencas hidrográficas de la región, mejorando la gestión de los recursos hídricos en Ecuador.
Palabras Clave: redes neuronales artificiales; estimación de precipitaciones; gestión hídrica; cuenca del río Pastaza
Application of Artificial Neural Networks for Rainfall Estimation: Case Study in the Pastaza
River Basin, Ecuador
Abstract
The Pastaza River basin in Ecuador, crucial for its biodiversity and water management, faces significant challenges due to
climate change. This study presents the application of artificial neural networks (ANN) to address deficiencies in pluviometric
data for this basin. By implementing an optimised model with 5000 iterations, a 95% reliability in precipitation data estimation
was achieved. Data from multiple meteorological stations were analysed, adjusting the model based on the distances between
stations, demonstrating improved accuracy and coherence compared to traditional methods. The results highlight the ANN's
capability to adapt to significant data variations, enhancing water management planning and mitigating the effects of extreme
weather events through better precipitation prediction. The ability of ANN to process large volumes of data with complex
interactions is particularly relevant in the hydrometeorological field, where spatial and temporal data variability is substantial.
This advancement demonstrates the applicability of ANN in hydrology and climatology, contributing to the understanding of
regional climate variability. The integration of advanced artificial intelligence techniques in the estimation and homogenization
of hydrological data provides a solid foundation for developing more effective adaptation and mitigation strategies in response
to climate change. As technology evolves, new perspectives emerge for applying similar techniques in other river basins in the
region, improving the management of water resources in Ecuador.
Keywords: artificial neural networks; rainfall estimation; water management; pastaza river basin
132
Vol.7, Núm.14 (jul-dic 2024) ISSN: 2737-6451
Rogel et al. (2024) https://doi.org/10.56124/finibus.v7i14.013
1. Introducción
En un contexto global cada vez más influenciado por el
cambio climático, la precisión en la recopilación de datos
meteorológicos es fundamental para una gestión eficaz de los
recursos hídricos. Las transformaciones climáticas se
manifiestan intensamente en regiones sensibles como la
cuenca del Río Pastaza, rica en biodiversidad y vital para el
equilibrio ecológico del Ecuador. Este entorno requiere una
monitorización detallada para enfrentar los desafíos
climáticos y asegurar un manejo sostenible y justo de sus
recursos hídricos (Flores Llampazo et al., 2022; López &
Sierra, 2010). Además, es crucial entender no solo la
dinámica actual de los recursos hídricos, sino también
anticipar futuros escenarios. En regiones como la cuenca del
Río Pastaza, la variabilidad temporal de los fenómenos
meteorológicos podría aumentar, lo que exige estrategias
proactivas basadas en datos precisos para fortalecer las
tácticas de gestión hídrica frente a la variabilidad climática
(Serrano-Vincenti et al., 2022).
La cuenca del Río Pastaza, situada entre la región
Interandina y la Amazonía de Ecuador, desempeña un papel
crucial en la geografía y ecología del país, siendo uno de los
principales sistemas fluviales que sustentan tanto a grandes
comunidades humanas como a ecosistemas clave a nivel
regional (Cruzatty et al., 2021). La interacción entre
dinámicas naturales y antropogénicas ha fortalecido la
importancia socioeconómica y ambiental de la cuenca. Su
extenso recorrido por diversas regiones geográficas le
confiere una biodiversidad única, estableciéndola como un
recurso hídrico esencial para actividades agrícolas,
industriales y domésticas. La cuenca se caracteriza por una
diversidad climática que abarca zonas subtropicales,
templadas y altoandinas, lo cual contribuye a una rica
biodiversidad de flora y fauna, destacándola como un área de
significativa importancia ecológica y económica. Además,
es responsable del 45% de la producción nacional de
hortalizas, subrayando su papel vital en la economía y
sustento alimenticio del país. Su confluencia en el río
Marañón, principal afluente del Amazonas, refuerza su
importancia como una de las arterias hídricas más críticas a
nivel global (López & Sierra, 2010; Siren, 2014). Sin
embargo, a pesar de su potencial como una de las mayores
reservas de agua dulce del mundo y su capacidad para la
generación de energía, la cuenca enfrenta desafíos
significativos que comprometen su gestión y conservación
(Abril-Saltos et al., 2021; Herrmann, 2002; López & Sierra,
2010). Estos desafíos se deben a factores como la alteración
del uso del suelo, la variabilidad meteorológica y el cambio
climático, que se manifiestan en alteraciones de los patrones
de precipitación y eventos extremos, comprometiendo la
capacidad del ecosistema para seguir funcionando como
fuente primordial de agua para la región (Carrera-Villacrés
et al., 2016; Cruzatty et al., 2021; Serrano-Vincenti et al.,
2022).
Las redes neuronales artificiales (RNA), inspiradas en la
estructura y función de las neuronas biológicas, se han
consolidado como herramientas poderosas en diversos
ámbitos, incluyendo la predicción de series temporales y el
reconocimiento de patrones (Goos et al., 2012; Lee & Kang,
2015). Estos modelos computacionales aprenden y
generalizan a partir de los datos, adaptándose y mejorando
su desempeño con cada nueva información. Gracias a su
capacidad para modelar relaciones no lineales y procesar
grandes volúmenes de datos, las RNA se han convertido en
una alternativa prometedora a los métodos tradicionales en
las ciencias atmosféricas e hidrológicas, permitiendo
capturar complejas interacciones sin necesidad de un
conocimiento exhaustivo de los procesos físicos subyacentes
(Gómez Guerrero & Aguayo Arias, 2019; Najarchi et al.,
2020). En el ámbito hidrometeorológico, las RNA podrían
ofrecer soluciones innovadoras para la modelización y
predicción de variables clave, desempeñando un rol crucial
en un mundo donde el cambio climático presenta desafíos
sin precedentes para la gestión de los recursos hídricos. En
Ecuador, un desafío notable en la gestión hídrica es la calidad
y precisión de los datos meteorológicos recolectados, que a
menudo presentan deficiencias debido a factores como
mediciones incorrectas, falta de presupuestos adecuados,
variabilidad de equipos de medición o cambios inesperados
en el entorno. Estas inconsistencias representan un riesgo
para la toma de decisiones y la planificación hídrica basadas
en esta información. Por ello, es crucial someter cualquier
serie de datos pluviométricos a un proceso de
homogeneización riguroso, asegurando que los datos se
ajusten a estándares que permitan su uso efectivo en
Investigación, toma de decisiones y otras aplicaciones
prácticas. Mientras que los métodos tradicionales, como la
regresión lineal y el cálculo de razones de distancia, han sido
la norma, el surgimiento del aprendizaje automático
(Machine Learning) ofrece nuevas posibilidades. En
particular, las redes neuronales artificiales modulares
(RNAM) han mostrado ventajas significativas sobre
métodos convencionales en la simulación y corrección de
datos hidrometeorológicos, indicando un camino
prometedor para superar las limitaciones presentes en
diversas cuencas hídricas (Gómez Guerrero & Aguayo
Arias, 2019; Kalauzi et al., 2009; Matovelle et al., 2022;
Millán et al., 2008, 2010).
Numerosos estudios han abordado los desafíos hídricos en
regiones críticas, incluida la cuenca del Río Pastaza. Sin
embargo, la acelerada dinámica del cambio climático y su
impacto en este sistema fluvial exigen soluciones más
avanzadas y precisas. En este contexto, las cnicas
contemporáneas, como las RNA, se perfilan como
herramientas valiosas, mostrando resultados alentadores en
estudios hidrometeorológicos a nivel global. La
implementación de estas metodologías en la cuenca del Río
Pastaza podría representar un avance significativo en la
predicción y gestión de sus recursos hídricos, dada la
133
Vol.7, Núm.14 (jul-dic 2024) ISSN: 2737-6451
Aplicación de Redes Neuronales Artificiales para la Estimación de Precipitaciones: Caso de Estudio
de la Cuenca del Río Pastaza, Ecuador
complejidad de los factores que definen su dinámica. Este
estudio tiene como objetivo evaluar la efectividad de las
RNA en la estimación de datos pluviométricos faltantes en
la cuenca del Río Pastaza, proporcionando una base más
confiable para la gestión de recursos hídricos. La innovación
de este trabajo radica en la aplicación específica y detallada
de un modelo optimizado, que a través de 5000 iteraciones,
ha logrado una fiabilidad del 95% en la estimación de datos
pluviométricos. Esta metodología combina la precisión de
las RNA con técnicas de validación cruzada, proporcionando
una comparación detallada con métodos tradicionales y
estableciendo un estándar de referencia para futuras
investigaciones. Motivado por la necesidad de proteger y
conservar uno de los recursos hídricos más cruciales de
Ecuador, este estudio busca contribuir al avance científico y
ofrecer soluciones prácticas y efectivas a corto y medio
plazo. Con este trabajo, esperamos aportar a la construcción
de un futuro más sostenible y resiliente para la cuenca del
Río Pastaza y, por extensión, para las comunidades y
ecosistemas que dependen de ella.
2. Material y métodos
2.1. Área de estudio
El área de estudio es la cuenca del Río Pastaza (Figura 1),
ubicada entre la región oriental de los Andes y la llanura
amazónica en Ecuador, extendiéndose sobre un área total de
32,128 km². La información geográfica detallada, provista
por el Ministerio de Agricultura y Ganadería del Ecuador
(MAGAP), revela una diversidad en el uso del suelo dentro
de la cuenca: 9.5% de áreas de cultivo, 7.4% de pastizales,
66.8% de tierras forestales, 0.2% de tierras urbanas, 2.0% de
zonas acuáticas y 14.1% de otras categorías. Esta
variabilidad en el uso del suelo refleja una compleja
interacción entre los sistemas naturales y las actividades
humanas, ofreciendo una plataforma única para estudiar las
dinámicas hídricas y terrestres en un entorno diverso y
ecológicamente rico. Los patrones agrícolas, según el III
Censo Nacional Agropecuario del año 2000, destacan una
diversidad significativa en los tipos de cultivo de la cuenca.
Los cultivos permanentes y transitorios abarcan vastas áreas,
reflejando una estructura agrícola diversificada influenciada
por la geografía de la cuenca, desde las regiones andinas
hasta las llanuras amazónicas (Herrmann, 2002; López &
Sierra, 2010). Asimismo, la infraestructura hidráulica de la
cuenca, que incluye embalses y zonas tecnificadas de riego,
juega un papel crucial en la gestión del agua, con
instalaciones hidroeléctricas destacadas como las presas de
Agoyán y Pisayambo, que satisfacen gran parte de los
requerimientos eléctricos de la región central del Ecuador, y
las presas de Mulacorral y Chiquihurco, que proveen
servicios invaluables para el abastecimiento de agua potable
y riego agrícola, especialmente en la provincia de
Tungurahua (Kalauzi et al., 2009; López & Sierra, 2010).
Figura 1: Ubicación de la Cuenca del Río Pastaza, Ecuador.
134
Vol.7, Núm.14 (jul-dic 2024) ISSN: 2737-6451
Rogel et al. (2024) https://doi.org/10.56124/finibus.v7i14.013
2.2. Metodología
Este estudio se centró en el empleo de RNA para la
estimación y homogeneización de datos pluviométricos
faltantes. La metodología implementada comenzó con la
recolección meticulosa de datos históricos pluviométricos
desde enero de 1995 hasta diciembre de 2013, cubriendo un
total de 29 estaciones hidrológicas en la cuenca, obtenidos
de anuarios del Instituto Nacional de Meteorología e
Hidrología (INHAMI, 2024). Tras la recolección, se llevó a
cabo un detallado proceso de preparación de datos que
incluyó limpieza, normalización y análisis preliminar para
identificar patrones y anomalías. Los datos fueron
introducidos en un modelo de RNA configurado para
reconocer y aprender de las complejidades de los patrones de
precipitación a través de un proceso iterativo y adaptativo.
Esta fase de preparación y análisis se apoyó en software
avanzado y librerías de Python (Van Rossum, 1995)
especializadas en aprendizaje automático como Scikit-learn
(Pedregosa et al., 2011), TensorFlow (Abadi et al., 2016) y
Keras (Chollet, 2015), garantizando un tratamiento eficaz y
riguroso de los datos. La estructura del modelo de RNA se
diseñó siguiendo el esquema de un perceptrón multicapa,
adecuado para manejar información no lineal característica
en datos hidrometeorológicos. El entrenamiento del modelo
se realizó mediante múltiples iteraciones, ajustando los
parámetros y afinando la precisión hasta alcanzar una
convergencia óptima, evidenciada por la significativa mejora
en la estimación de los datos pluviométricos. La validación
del modelo incluyó comparaciones exhaustivas con datos
reales, lo que permitió calibrar y confirmar la fiabilidad y
precisión del modelo. Además, se implementó un proceso de
retroalimentación y optimización continua para adaptar el
modelo a cambios o nueva información.
La metodología completa, desde la recolección de datos
hasta la aplicación final del modelo, se resume en la Figura
2. Esta figura ilustra un diagrama de flujo detallado que
encapsula el proceso integral de aplicación de las RNA en la
estimación y homogeneización de datos pluviométricos. La
representación visual destaca la secuencia lógica y las
interconexiones entre las diversas fases de nuestra
metodología, desde la recopilación inicial de datos hasta la
aplicación práctica y evaluación del modelo. Cada etapa es
delineada para reflejar el rigor y la precisión con la que los
datos fueron tratados, asegurando la robustez y fiabilidad del
modelo resultante. Además, proporciona una referencia clara
para replicar nuestra metodología y afirma la cohesión y
consistencia de nuestro enfoque científico. La recolección de
datos inició con una revisión exhaustiva de fuentes
bibliográficas centradas en la homogenización de datos y el
uso de redes neuronales para el análisis de datos
meteorológicos, con el fin de comprender en detalle los
procesos de precipitación de la cuenca de estudio, así como
los desafíos asociados con la medición y la heterogeneidad
en los registros meteorológicos.
Homogeneización y estimación de datos mediante RNA
Las RNA son modelos computacionales que emulan la
estructura neuronal del cerebro humano, compuestas por
unidades de procesamiento interconectadas o "neuronas". Su
habilidad para adaptarse a patrones complejos las convierte
en herramientas ideales para tareas como el reconocimiento
de patrones, la predicción y el modelado de sistemas
complejos (Goos et al., 2012; Houari et al., 2014; Lee &
Kang, 2015; Matovelle et al., 2022). En este estudio, se
seleccionó una RNA tipo perceptrón multicapa debido a su
eficacia demostrada en la modelización y predicción de datos
meteorológicos. Este modelo fue entrenado para predecir
datos pluviométricos ausentes, optimizando el manejo de no
linealidades en los datos hidrológicos y mejorando la
precisión en series históricas. La configuración de la RNA se
diseñó meticulosamente, ajustando los parámetros según la
necesidad de mejorar los resultados en iteraciones sucesivas.
La calidad de las predicciones se verificó utilizando
funciones de validación y documentando los resultados en
formatos accesibles para análisis y revisión posterior.
La RNA, adecuadamente entrenada, fue responsable de
identificar y corregir las inconsistencias y vacíos de
información de precipitación mensual, resultando en un
conjunto de datos coherente y homogéneo. En total, se
seleccionaron 231 estaciones del país, con 29 situadas
específicamente en la cuenca del Río Pastaza y las restantes
distribuidas en otras cuencas del Ecuador que cumplían con
los criterios específicos para asegurar la confiabilidad del
entrenamiento de la RNA. Este enfoque garantizó que las
predicciones de la RNA fueran comparables y basadas en
datos verificables de las cuencas externas, mientras que la
cuenca del Río Pastaza sirvió como estudio de caso
independiente para validar los resultados del modelo.
Posteriormente, se realizó un riguroso proceso de calibración
y validación, utilizando datos reales como comparación para
evaluar la precisión del modelo. Se establecieron parámetros
de exclusión para estaciones con datos incompletos y se
aplicó un método de razones de distancia en la cuenca del
Río Pastaza para corroborar la coherencia geográfica y
climatológica de las estimaciones. Este enfoque integral
permitió ajustar el modelo de RNA de manera precisa,
mejorando continuamente su capacidad para prever y
homogeneizar datos pluviométricos en contextos complejos
y variados.
La RNA fue configurada con un número de iteraciones
ajustable, de 100 a 5000, para optimizar la precisión del
modelo en función de los datos proporcionados y los
resultados obtenidos. La iteración óptima se estableció en
5000 tras una evaluación rigurosa, asegurando una alta
fidelidad en la correspondencia entre los valores predichos y
los reales. La arquitectura del software incluye varias fases