Diseño de un Modelo Integral para Evaluar el Índice de Calidad del Agua con Machine Learning y Deep Learning en la Red Hídrica del Área Metropolitana de Bucaramanga, Colombia

Producción científica: Otra contribuciónFormación del recurso humanorevisión exhaustiva

Resumen

El estudio desarrolló un modelo integral para evaluar el Índice de Calidad del Agua (WQI, Water Quality Index) en la red hídrica del Área Metropolitana de Bucaramanga, implementando técnicas de Machine Learning y Deep Learning. Se caracterizaron 38 puntos de monitoreo con 9 parámetros (8 fisicoquímicos y 1 microbiológico), identificándose que variables como Oxígeno Disuelto (DO), Demanda Bioquímica de Oxígeno (BOD5) y Sólidos Totales (TS) presentaron variabilidad, con coeficientes de variación superiores al 30%. El análisis exploratorio permitió identificar correlaciones significativas, destacando relaciones negativas entre DO y la Temperatura del Agua (WT) (-0,48) y positivas entre Nitrógeno Total (TN) y BOD5 (0,72). La aplicación de Clustering jerárquico segmentó los puntos de monitoreo en tres grupos: el Grupo 1 con mejores condiciones, el Grupo 2 con calidad intermedia y el Grupo 3 con mayor contaminación. Modelos supervisados como Árboles de Decisión (DT, Decision Trees), Bosque Aleatorio (RF, Random Forest) y Maquinas de Soporte Vectorial (SVM, Support Vector Machines), clasificaron las categorías del WQI, obteniendo el mejor desempeño con Random Forest y precisión global del 95.22% utilizando las variables originales. DO y BOD5 fueron las variables más influyentes en el Grupo 1, mientras que FC y TBD destacaron en el Grupo 2, y FC y BOD5 en el Grupo 3. Para la predicción continua del WQI, Redes Neuronales Convolucionales (CNN, Convolutional Neural Networks), y Redes Neuronales Autorregresivas (RNN, Recurrent Neural Networks), fueron aplicadas en los tres grupos. CNN obtuvo mejores resultados, con un R² de 0,92 y un MSE de 7.3758 en el Grupo 1, mientras que RNN logró un R² de 0,9214 y un MSE de 7.7559. En los Grupos 2 y 3, CNN superó a RNN, destacando en precisión. Los resultados confirman que estas técnicas optimizan costos y tiempos de monitoreo, recomendándose incorporar datos en tiempo real y variables meteorológicas para fortalecer la gestión hídrica.
Idioma originalEspañol (Colombia)
EstadoPublicada - 26 feb. 2025

Tipos de Productos Minciencias

  • Dirección de Trabajo de grado de maestría

Citar esto