Pronóstico de Demanda de Electricidad con Redes Neuronales Artificiales para Salta, Argentina

 

Franco Zanek

Universidad Nacional de Salta

zanekfranco@gmail.com

Salta, Argentina

 

Resumen

 

Los pronósticos de demanda de electricidad son extremadamente importantes para los proveedores de energía y otros participantes en la generación, transmisión, distribución y mercados de energía eléctrica. Estos pronósticos son esenciales para la operación y planificación del sistema eléctrico, ya que permiten a los proveedores optimizar sus operaciones y tomar decisiones informadas sobre inversiones futuras en infraestructura de generación y transmisión. Además, estos pronósticos también permiten a los proveedores anticipar posibles desequilibrios entre la oferta y la demanda de energía, lo que les ayuda a evitar apagones y mantener la estabilidad del sistema eléctrico. En este artículo se presentan modelos basados en redes neuronales artificiales (ANN) para permitir una predicción asertiva de la demanda eléctrica horaria, a lo largo de un año. Dada la alta estacionalidad de la demanda eléctrica en general, se propone en la metodología el desarrollo de un modelo por cada mes del año. Este estudio se lleva a cabo a partir de los datos recabados de diferentes fuentes, para la región de Salta Capital, en la provincia de Salta, Argentina. A partir de los resultados obtenidos podemos decir que la metodología planteada mejora en un 3% el error cuadrático medio respecto a trabajos anteriores. Estos resultados son de particular importancia para los proveedores de energía y otros participantes en los mercados eléctricos, ya que les brindan una herramienta más precisa y confiable para la toma de decisiones en la operación y planificación del sistema eléctrico.

 

Palabras clave: Red Neuronal Artificial, Curva de Carga Eléctrica, Predicción Horaria


 

 

Electricity Demand Forecasting Model with Artificial Neural Networks for the City of Salta

 

ABSTRACT

 

Demand forecasts for electricity demand are extremely important for energy providers and other participants in the generation, transmission, distribution, and electricity markets. These forecasts are essential for the operation and planning of the electrical system, as they allow providers to optimize their operations and make informed decisions about future investments in generation and transmission infrastructure. Additionally, these forecasts also enable providers to anticipate potential imbalances between energy supply and demand, helping them avoid blackouts and maintain the stability of the electrical system. This article presents models based on Artificial Neural Networks (ANNs) to enable assertive prediction of hourly electricity demand over the course of a year. Given the high seasonality of electricity demand in general, the methodology proposes the development of a model for each month of the year. This study is carried out using data collected from different sources for the Salta Capital region in the province of Salta, Argentina. Based on the results obtained, we can say that the proposed methodology improves the mean squared error by 3% compared to previous works. These results are of particular importance for energy providers and other participants in electricity markets as they provide them with a more precise and reliable tool for decision-making in the operation and planning of the electrical system.

 

Keywords: Artificial Neural Network, Electric Load Curve, Hourly Prediction

 

 

1.   Introducción

Desde principios de la década de 1990, el proceso de desregulación y la introducción de mercados competitivos han estado remodelando el panorama de los sectores de energía tradicionalmente monopólicos y controlados por el gobierno. En muchos países del mundo, la electricidad se comercializa ahora según las reglas del mercado mediante contratos al contado y de derivados. Sin embargo, la electricidad es un bien muy especial, ya que es económicamente no almacenable y la estabilidad del sistema eléctrico requiere un equilibrio constante entre la producción y el consumo. Al mismo tiempo, la demanda de electricidad depende de variables climáticas (temperatura, velocidad del viento, precipitación, entre otros factores) y de la intensidad de las actividades comerciales y cotidianas (en horas pico frente a horas no pico, días laborables frente a fines de semana, días festivos y proximidad de días festivos, entre otros). Por un lado, estas características únicas y específicas conducen a dinámicas de consumo no observadas en ningún otro mercado, exhibiendo estacionalidad en los niveles diario, semanal y anual, y picos de consumos abruptos, de corta duración y generalmente imprevistos. Por otro lado, han animado a los investigadores a intensificar sus esfuerzos en el desarrollo de mejores técnicas de predicción.

A nivel empresarial, las previsiones de carga de la electricidad se han convertido en un insumo fundamental para los mecanismos de toma de decisiones de las empresas de energía. Se han probado una variedad de métodos e ideas para la previsión de la demanda de la electricidad, con diversos grados de éxito. Han sido utilizados para ello diversos modelos basados en análisis de tendencias o en inteligencia artificial, entre los grupos más grandes que se puede mencionar.

Dentro del primer grupo de técnicas se puede mencionar los artículos (Gasparin et. al., 2022; Elsaraiti et. al., 2021; Divina et. al., 2019; Lee et. al., 2018), en los cuales se plantean diversos modelos basados en series de tiempo para estimar el consumo eléctrico anual. En todos estos trabajos se utilizan como variables de entrada el Consumo Eléctrico Histórico y la Variación del producto bruto interno (PBI) a lo largo de los años de estudio. Por otro lado, los autores (Mahia et. al., 2019; Nepal et.al., 2020; Al-Musaylh et. al., 2018; Ozturk et. al., 2018) plantean estudios basados en modelos ARIMA, con sus diferentes variantes, para poder determinar la demanda eléctrica en diferentes partes del mundo.

Por último, podemos destacar los trabajos (Dhaval et.al., 2020; Ciulla et. al., 2019; Shine et. al., 2018), en los que se muestra el uso de variables como datos climáticos y consumos históricos de energía eléctrica. Los autores proponen modelos de regresión lineal y multilineal, con el objetivo de lograr un modelo matemático eficiente para pronosticar el consumo eléctrico en diversos países del mundo.

A partir de la literatura vigente y con el avance de la tecnología, existe otro grupo de técnicas que se están utilizando y explotando para pronosticar el consumo eléctrico mediante el uso de la Inteligencia Artificial. En los trabajos (Shao et. al., 2020; Fan et. al., 2021; Sun et. al.,2021; Barman et. al., 2020) los autores desarrollan diversos modelos de Soporte de Regresión Vectorial, destacándose como variables de entrada los datos climáticos, consumo histórico de energía eléctrica y producto bruto interno. Además, una de las técnicas más utilizadas en la comunidad científica es el modelado basado en redes neuronales. Por ejemplo, en  (El-Hendawi et. al., 2020; Zanjani et. al.,2022; Wang et. al., 2022; Peng et. al., 2021; Fan et. al., 2023) se desarrollan diversos modelos de predicción de la demanda eléctrica para el corto plazo, para diversas localizaciones del mundo. En estos modelos, se tuvieron en cuenta como variables de entrada los datos climáticos de las regiones involucradas, como así también los datos históricos del consumo eléctrico. Además, del análisis de estos trabajos, se puede concluir que en promedio, el valor de error cuadrático medio ronda el 4%. Los autores (Oreshkin et. al., 2021; Lai et. al., 2020; Gul et. al., 2021; Shirzadi et. al., 2021; Sharma et. al., 2023) también desarrollan modelos basados en redes neuronales, en este caso para la predicción en el mediano plazo, y utilizando variables de entrada similares. Sin embargo, para estos modelos el valor del Error Cuadrático Medio ronda el 7%. En (Aribowo et. al., 2020; Son et. al., 2020) se desarrollan modelos para la predicción a largo plazo. En estos casos, además se tuvieron en cuenta variables como tamaño de la población y producto bruto interno. Para estos casos el error cuadrático medio ronda el 4.6%.

En el caso específico de la provincia de Salta, existe una necesidad particular de desarrollar un modelo preciso y confiable para el pronóstico de demanda en la ciudad capital. Este artículo tiene como objetivo plantear un modelo basado en redes neuronales artificiales, para predecir el consumo eléctrico horario de la Ciudad de Salta. Para brindar un contexto de la situación eléctrica del país, en la sección 2 se presenta una breve descripción también en la misma se provee una introducción conceptual a las redes neuronales artificiales. Luego en la sección 3 se describe la metodología de trabajo. En la sección 4 se muestran los resultados obtenidos, y por último en la sección 5 se explican las conclusiones.

2.   Mercado Eléctrico Argentino y Redes Neuronales

En esta sección se presentan las características del mercado eléctrico argentino actual. Se utilizan los reportes realizados por Ministerio de Minería y Energía de la nación y Compañía Administradora del Mercado Mayorista Eléctrico (CAMMESA), del año 2023.

Argentina ha registrado en los últimos años un incremento de situaciones de estrés y exigencia de los sistemas de distribución de energía eléctrica, afectando así el funcionamiento y configuración del sistema eléctrico en su conjunto. Se observa un aumento de la estacionalidad de la demanda con picos de energía y potencia que se desarrollan típicamente en verano y en invierno. Con el paso de los años se puede apreciar el crecimiento tendencial de la demanda. Esto se puede deber al aumento de equipos de acondicionadores de aire y de calefacción eléctrica, dada la ausencia de mecanismos de incentivos por tarifas y políticas de eficiencia energéticas adecuadas. Estos picos provocan un alto costo de mantenimiento del sistema por la necesidad de mayor potencia y de las líneas de transporte y distribución que deben estar disponibles para ser utilizadas en esos periodos, lo cual implica mayores inversiones con un bajo factor de utilización.

El mercado eléctrico es administrado por CAMMESA. La demanda total puede dividirse en dos grandes grupos: residencial y no residenciales. Dentro de la demanda no residencial a su vez se encuentran 5 subcategorías dependiendo de la metodología de facturación y del volumen de demanda de energía y potencia: comerciales y Grandes Usuarios de Distribuidoras (GUDIs), Grandes Usuarios Particulares (GUPAs), Grandes Usuarios Menores (GUMEs) y Grandes Usuarios Mayores (GUMAs). Dentro de las 5 subcategorías no residenciales, sólo los GUMA’s tienen relación directa con CAMMESA comprando energía en el Mercado Mayorista. Los grupos restantes compran la energía (y algunos contratan potencia) a través de las distribuidoras. En las figuras 1-4 se realiza una comparación del consumo eléctrico mensual de las diferentes regiones del país.

 

 

 

 

 

 

 

 

 

 

 

 

Figura 1. Distribución del consumo eléctrico mensual, para cada región. Para el período enero-diciembre 2023

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Figura 2. Distribución del consumo eléctrico mensual, para cada región. Para el período enero-diciembre 2022

 

 

 

 

 

 

 

 

Figura. 3. Distribución del consumo eléctrico mensual, para cada región. Para el período enero-diciembre 2021

 

Figura 4. Distribución del consumo eléctrico mensual, para cada región. Para el período enero-diciembre 2020

 

 

Podemos observar que la región que mayor demanda eléctrica posee es la del Gran Buenos Aires. Esto se debe, por una parte, a la mayor densidad demográfica que posee la región en relación con las otras regiones del país, y por otro, a las tarifas eléctricas, que durante el período de estudio fueron las más baratas del país. Esto incentivó a los ciudadanos a comprar más artefactos eléctricos, produciendo una mayor demanda. Además, puede notarse que las regiones Comahue y Patagónica, son las regiones que menor demanda eléctrica poseen, lo cual se debe a los motivos opuestos al caso anterior: son las zonas geográficas donde se encuentra la menor densidad demográfica del país y donde las tarifas eléctricas son las más caras, por lo que el uso de la electricidad es menor. Además estas regiones no cuentan con un gran desarrollo comercial e industrial por motivos diversos, destacándose entre ellos la geografía del lugar, las largas distancias entre las distintas localidades, la poca inversión por parte de los gobiernos para el desarrollo y la explotación de dichos lugares, entre otros factores similares.

2.1    Redes Neuronales Artificiales

 

Las redes neuronales artificiales (ANN) son técnicas computacionales inspiradas en los procesos de aprendizaje del sistema cognitivo humano y las funciones neurológicas del cerebro. Recientemente,  el interés  por trabajar con estás técnicas ha aumentado considerablemente para resolver una amplia gama de problemas de diferentes campos. Las redes neuronales son sistemas de procesamiento de información distribuidos, compuestos por muchos elementos computacionales simples que interactúan a través de conexiones ponderadas. Inspiradas en la arquitectura del cerebro humano, las redes neuronales exhiben ciertas características, como la capacidad de aprender patrones complejos de información y generalizar la información aprendida. Las redes neuronales son simplemente funciones no lineales parametrizadas que se pueden ajustar a los datos con fines de predicción.

Las ANN se pueden clasificar en varias categorías basadas en los métodos de aprendizaje supervisados ​​y no supervisados, ​​y arquitecturas de retroalimentación y retropropagación. Una red neuronal de retropropagación (BPNN) utiliza un método de aprendizaje supervisado y una arquitectura de retroalimentación. Un BPNN es una de las técnicas de redes neuronales más utilizadas para la clasificación y predicción.

El principal atractivo de las redes neuronales es su flexibilidad para aproximar una amplia gama de relaciones funcionales entre entradas y salidas. Una de las propiedades más interesantes de las redes neuronales es su capacidad para trabajar y pronosticar incluso sobre la base de datos incompletos, ruidosos y confusos. Además, no requieren hipótesis a priori y no imponen ninguna forma funcional entre entradas y salidas. Por esta razón, las redes neuronales son bastante prácticas en los casos en que se carece de conocimiento de la forma funcional que relaciona entradas y salidas, o cuando se debe evitar una suposición previa sobre dicha relación.

 

3.   Metodología de Trabajo

 

Como una primera aproximación al estudio del consumo eléctrico, se propuso un modelo estocástico, dinámico y discreto para simular el consumo eléctrico de las viviendas residenciales en la ciudad de Salta. La codificación de las viviendas y el encendido y/o apagado de artefactos se establecen como variables aleatorias, según las distribuciones de probabilidad para cada caso. Al adoptar la generación aleatoria de viviendas, se requiere la implementación de un procedimiento adicional que se encarga de validar las casas dentro de cada categoría según el cuadro tarifario vigente. Si bien los resultados arrojados por este modelo son estadísticamente válidos y permiten reflejar los hábitos de consumo de la ciudad de Salta, la ejecución del modelo consume mucho tiempo en la generación de las viviendas. Esto se debe a que, al generar cada vivienda al azar, el software requiere varias iteraciones para ajustarla a la categoría correspondiente. Por otro lado, la simulación del encendido y apagado para determinar el consumo mensual es relativamente rápida en términos de tiempo computacional, en comparación con los tiempos de generación.

A la luz de los resultados obtenidos y considerando la importancia de abarcar todos los sectores que conforman la Ciudad de Salta, y no solo el sector residencial, se hace evidente la necesidad de implementar un modelo más robusto, eficiente en términos computacionales y estadísticamente válidos. Este modelo permitirá pronosticar el consumo eléctrico de toda la ciudad de Salta de manera más precisa y completa. A partir de la revisión de la literatura, se propone modelar la realidad del consumo eléctrico de la Ciudad de Salta mediante Redes Neuronales Artificiales Feed Foward con Backpropagation como política de aprendizaje supervisado. Es por esto que, para poder definir el modelo, primero es necesario determinar las variables involucradas y posteriormente definir la estructura de red que mejor se aplique a esta situación. Es necesario también contar con una gran cantidad de datos para evitar que el modelo propuesto no caiga en un sub-entrenamiento o super-entrenamiento, situaciones que producen que los resultados arrojados en las posteriores simulaciones no sean válidos desde el punto de vista estadístico. Es por esto que, a partir de los datos recolectados, se definió plantear un modelo que permita estimar el consumo eléctrico horario discriminado por mes, y de esta manera abarcar todo el año calendario.

 

3.1    Variables involucradas y datos utilizados

 

Uno de los aspectos fundamentales en la predicción mediante redes neuronales es la determinación clara de las variables de entrada y los conjuntos de datos que se utilizarán en cada una de las etapas del proceso. Esto permite un funcionamiento óptimo de la red y resultados estadísticamente válidos. En esta sección se detallan estos aspectos.

Para el modelo bajo estudio, las variables fundamentales que permiten definir el consumo eléctrico de la ciudad son:

 

·      Datos climáticos (temperatura y humedad).

·      Hora del día que se está estudiando.

·      Día del año que se está estudiando. Para este caso y para simplificar el trabajo, se consideran los días expresados en tiempo juliano. 

 

El uso de estas variables para plantear el desarrollo del modelo, se justifica en el hecho de que para el consumo horario existe una fuerte correlación entre la hora y el día que nosotros estemos estudiando. Esta relación se evidencia, por ejemplo, en el hecho de que las personas se encuentren despiertas o no, o en los días laborales o no laborales, cuando las personas están o no en su casa. La utilización de variables climáticas también tiene una fuerte correlación con el consumo eléctrico. 

Por otro lado, variables como el valor de la tarifa eléctrica, o el tamaño de la población, no tienen una influencia en el modelado del consumo eléctrico horario, ya que son variables que se mantienen constantes de una hora a la otra. Por esta razón se consideran que se van a mantener constantes a lo largo de las ejecuciones, produciendo un aprendizaje incorrecto para el algoritmo y por ende predicciones que carezcan de validez estadística. Por estas razones, las entradas al modelo son cuatro y se corresponden con los datos climáticos (temperatura y humedad), datos relacionados al día y a la hora a pronosticar. Teniendo las variables definidas, es necesario contar con los datos que van a permitir el posterior entrenamiento y validación de los modelos. Para ello se fija como período de trabajo los años 2018 a 2023 y las fuentes de los datos son las siguientes:

·      Datos de Consumo histórico: Compañía Administradora del Mercado Mayorista Eléctrico (CAMMESA).

·      Datos Climáticos: Instituto Nacional de Tecnologías Agropecuarias (INTA)

Antes de comenzar a trabajar con la obtención del modelo que se ajusta al problema, es necesario realizar un tratamiento de los datos para lograr una regularización de los mismos. Para ello, analizamos el conjunto de datos obtenidos, y podemos observar que los recorridos de cada una de las variables involucradas son los siguientes:

 

·      Variable Día (0-365), cada uno de los 365 días del año.

·      Variable Hora (0-24), cada una de las horas del día.

·      Variable Temperatura (-10 – 50) temperaturas horarias de la ciudad.

·      Humedad (0-100) valores de humedad de la ciudad.

 

A partir de este análisis, podemos concluir que es necesario un proceso de estandarización y normalización de los datos, ya que de esta manera todas las variables tendrán un peso similar a la hora de trabajar en la red. De esta forma evitamos que algunas variables como el día (que posee valores más altos) tengan mayor relevancia frente a las otras variables. 

Para poder determinar qué proceso debemos seguir, necesitamos determinar qué distribución sigue cada uno de los datos. Mediante las técnicas de validación estadísticas (chi-cuadrado), podemos observar que las variables se distribuyen en cada mes de la siguiente manera:

 

Tabla 1. Distribución de las variables aleatorias

Mes

Día

Hora

Temperatura

Humedad

Consumo 

Eléctrico

Enero

U(1,31)

U(0,23)

N(23,4)

N(71,17)

N(139,25)

Febrero

U(32,59)

U(0,23)

N(22,4)

N(82,13)

N(134,26)

Marzo

U(60,90)

U(0,23)

N(20,4)

N(82,13)

N(132,25)

Abril

U(91,120)

U(0,23)

N(17,4)

N(82,12)

N(124,22)

Mayo

U(121,151)

U(0,23)

N(14,4)

N(83,11)

N(133,27)

Junio

U(152,181)

U(0,23)

N(12,5)

N(76,16)

N(142,27)

Julio

U(182,212)

U(0,23)

N(12,5)

N(72,18)

N(133,25)

Agosto

U(213,243)

U(0,23)

N(15,6)

N(64,21)

N(127,223)

Septiembre

U(244,273)

U(0,23)

N(17,5)

N(60,18)

N(125,22)

Octubre

U(274,304)

U(0,23)

N(18,6)

N(61,20)

N(128,25)

Noviembre

U(305,334)

U(0,23)

N(20,5)

N(67,19)

N(128,26)

Diciembre

U(335,365)

U(0,23)

N(22,5)

N(72,17)

N(131,26)

 

De donde podemos observar que las distribuciones que predominan son:

 

·      La distribución Uniforme (U), con los valores de los parámetros a y b para cada variable aleatoria definida para cada mes. Esta distribución se observa para las variables Día y Hora.

·      La distribución Normal (N), con los valores de los parámetros media y desvío definidos para cada uno de las variables aleatorias de cada mes. Esta distribución se observa para las variables Temperatura, Humedad y Consumo Eléctrico.

 

En base a las distribuciones detectadas, se procede a determinar el proceso de estandarización correspondiente a cada una:

 

·      Para las variables normales se utiliza el proceso de estandarización de dicha distribución.

·      Para las variables uniformes se utilizó la técnica de estandarización de mínimo y máximo.

 

3.2    Definición del Modelo obtenido

 

Uno de los aspectos fundamentales a los que se enfrenta un investigador a la hora de plantear un modelo de red neuronal artificial es la selección de las neuronas ocultas y cómo se van a distribuir. Esto es muy importante ya que debemos evitar problemas de generalización y puede que, de esta manera, la red neuronal no responda correctamente al problema para el cual fue diseñada.

Las neuronas ocultas pueden influir en el error de los nodos a los que está conectada su salida. La estabilidad de la red neuronal se estima por error, y este error refleja la estabilidad del modelo. El exceso o defecto de neuronas ocultas provocará un ajuste excesivo, es decir, las redes neuronales habrán sobreestimado la complejidad del problema objetivo, degradando enormemente la capacidad de generalización de las predicciones.

En este sentido, determinar el número adecuado de neuronas ocultas para evitar el ajuste excesivo es fundamental para el problema. Uno de los principales desafíos en el diseño de redes neuronales es la determinación de neuronas ocultas con un error mínimo y la mayor precisión. Es probable que el conjunto de entrenamiento y el error de generalización sean altos antes de que comience el aprendizaje. Sin embargo, durante el entrenamiento, la red se adapta para disminuir el error en los patrones de entrenamiento. De esta manera, la precisión del entrenamiento está determinada por los parámetros bajo consideración.

Dado que lo que se pretende estudiar es el consumo eléctrico horario, discriminado por mes, el estudio del número de capas y neuronas ocultas se realiza para cada uno de los meses del año. Por lo tanto, se obtienen doce sub-modelos de redes neuronales que conforman el modelo de red neuronal para solucionar el problema bajo estudio.

En la tabla 2, se presentan los modelos adoptados para cada uno de los meses del año. En la segunda columna, se detalla la arquitectura adoptada para el mes, teniendo en cuenta solo las capas ocultas, ya que para todos los meses la capa de entrada y de salida son exactamente las mismas. La capa de entrada cuenta con 4 neuronas que representan las variables descritas anteriormente, mientras que la capa de salida cuenta con una sola neurona que representa la estimación del consumo eléctrico.

 

Tabla 2. Modelos obtenidos para cada mes

Mes

Arquitectura

Enero

5

Febrero

8

Marzo

5

Abril

8

Mayo

8

Junio

5

Julio

17

Agosto

8

Septiembre

8

Octubre

5

Noviembre

17

Diciembre

5

 

Los modelos obtenidos en la tabla 2, surgieron de la comparación de los errores obtenidos en las etapas de validación de diferentes estructuras de red. Dicha comparación se puede observar en la tabla 3, donde se muestran los tres modelos con menor error para cada mes, teniendo en cuenta solo las capas ocultas, ya que las capas de entrada y salida para todas las redes eran las mismas.

Los resultados observados en las tablas 2 y 3 fueron generados a partir de iteraciones de dos algoritmos que se basan en la utilización de la metaheurística de Algoritmo genético y Colonia de Abejas, ambos desarrollados por el autor. El objetivo de estos algoritmos era encontrar las estructuras de red óptima de cada mes y de allí obtener la mejor. Se muestra además en la tabla 3, el error cuadrático medio de cada modelo.

 

 

 

 

 

 

 

 

 

 

 

Tabla 3. Comparación de errores para diferentes modelos y estructuras

Mes

Estructura

RSME Validación

Mes

Estructura

RSME Validación

Enero

5

1.5

Marzo

5

1.75

Enero

2

2.22

Marzo

8

2.03

Enero

2-5-4

3.4

Marzo

3-6

2.00

Febrero

8

1.7

Abril

8

0.89

Febrero

17

2.2

Abril

3

3.68

Febrero

4-2-1

1.96

Abril

10-5

4.00

Mayo

8

0.99

Septiembre

8

0.89

Mayo

2

1.7

Septiembre

2-1

1.3

Mayo

4-5-1-3

1.3

Septiembre

5

1.5

Junio

5

1.53

Octubre

5

1.4

Junio

8

1.54

Octubre

17

2.2

Junio

3-4

2.00

Octubre

2-5-2

2.23

Julio

17

1.13

Noviembre

17

1.12

Julio

8

7.02

Noviembre

2

1.51

Julio

3-1-6

2.4

Noviembre

3-4

1.6

Agosto

8

1.02

Diciembre

5

1.36

Agosto

17

1.11

Diciembre

3

1.38

Agosto

5

1.32

Diciembre

3-7-1

1.6

 

4.   Análisis de Resultados

 

Se han aplicado rigurosas estrategias de validación para asegurar la fiabilidad de los modelos obtenidos, que abarcan desde la validación del proceso de entrenamiento hasta la evaluación con datos reales para medir la capacidad de generalización. En este proceso, se utilizó el 20% de los datos totales obtenidos, que ascendieron a 18000 por mes, considerando los años bajo estudio. Este 20% se empleó para obtener los modelos óptimos mensuales y posteriormente se utilizó en la etapa de validación. El resto de los datos se utilizaron en la etapa de entrenamiento. La cuidadosa división de los datos en conjuntos de entrenamiento y validación considera diversos patrones climáticos y sociales para garantizar la representatividad de los escenarios evaluados.

Para la etapa de validación, se optó por no utilizar la estrategia de cross-validation, ya que lo que se pretendía demostrar era la capacidad de generalización de las redes obtenidas. Esta elección se basó en la necesidad de evaluar cómo las redes neuronales manejan datos no vistos durante el entrenamiento y cómo se desempeñan en escenarios reales de predicción de consumo eléctrico mensual. Los resultados indican un RMSE promedio de 1.0807 para entrenamiento y 1.295 para validación, con tiempos promedio de 38.64 y 20.34 segundos, respectivamente, como se detalla en la tabla 4.

 

Tabla 4: Comparación de tiempos y RMSE para los modelos mensuales

Mes

RMSE etapa Entrenamiento

Tiempo ejecución entrenamiento (seg)

RMSE etapa Validación

Tiempo de ejecución validación (seg)

Enero

1.33453

38.56

1.50327

20.63

Febrero

1.36198

49.12

1.70324

15.75

Marzo

1.44738

29.63

1.75

19.58

Abril

0.82974

35.45

0.89

22.56

Mayo

0.99979

40.23

1.24

18.63

Junio

1.4448

42.36

1.53

24.86

Julio

0.70346

29.23

1.13

22.63

Agosto

0.9304

32.56

1.02327

24.01

Septiembre

0.7921

42.23

0.89

17.63

Octubre

1.22677

36.56

1.4

14.96

Noviembre

0.71934

42.12

1.12

16.45

Diciembre

1.17847

45.63

1.36

26.48

 

Los parámetros utilizados fueron los siguientes:

 

·      Función de Pérdida: Error cuadrático medio.

·      Optimizador: Técnica SGD con tasa de aprendizaje de 0.1.

·      Epochs: 1000.

 

5.   Conclusiones y Trabajo futuro

 

La precisión en la predicción de la demanda juega un papel fundamental tanto en la optimización económica como en la seguridad operativa de los sistemas de energía eléctrica. No solo guía el desarrollo futuro de instalaciones de generación, transmisión y distribución, sino que también influye en la toma de decisiones sobre la capacidad de suministro y la satisfacción de las necesidades de los clientes. Bajo la nueva estructura del mercado energético, cualquier discrepancia significativa en las estimaciones puede resultar en la sobreinversión en infraestructura o en una falta de adecuación para atender la demanda real.

Las técnicas de pronóstico tradicionales pueden no ser suficientes para los servicios públicos que operan en entornos dinámicos y en rápido crecimiento. Las variaciones en el crecimiento, las condiciones socioeconómicas, eventos especiales, condiciones climáticas extremas y la competencia en la generación de energía, derivadas de la desregulación del sector eléctrico y cambios en las estructuras tarifarias, complican aún más las predicciones a largo plazo. Por lo tanto, es imperativo explorar enfoques alternativos para abordar este desafío de manera efectiva.

El modelo basado en redes neuronales artificiales desarrollado para prever el consumo eléctrico por hora en la Ciudad de Salta ha demostrado ser una herramienta excepcional en la predicción de la demanda. Su capacidad para desglosar los datos por mes permite una comprensión detallada de los patrones de consumo a lo largo del año, lo cual es crucial para la planificación y la toma de decisiones estratégicas en el sector energético.

La robustez del modelo se ha puesto a prueba mediante rigurosas pruebas estadísticas, que han validado su fiabilidad y precisión. Los resultados revelan que los errores del modelo se mantienen dentro de márgenes aceptables, lo que significa que las predicciones son consistentes y confiables en diversas condiciones y escenarios.

Este nivel de precisión es fundamental para optimizar la eficiencia económica y la seguridad operativa de los sistemas de energía eléctrica. Al proporcionar estimaciones confiables del consumo futuro, el modelo permite a las autoridades y empresas energéticas planificar de manera más efectiva la infraestructura necesaria, evitar la sobreinversión o la falta de adecuación, y garantizar un suministro eléctrico confiable y sostenible para los consumidores.

Además, en un entorno dinámico y en rápido crecimiento como el del sector energético, contar con un modelo adaptable y sensible a las variaciones en el crecimiento, las condiciones socioeconómicas, los eventos especiales y las condiciones climáticas extremas es crucial. El enfoque basado en redes neuronales artificiales ofrece la flexibilidad necesaria para capturar y responder a estos cambios, lo que lo convierte en una herramienta invaluable para enfrentar los desafíos futuros del mercado energético.

Sin embargo, a pesar de los avances y la precisión alcanzada mediante el uso de redes neuronales artificiales, existen algunas limitaciones inherentes a este enfoque que deben ser consideradas. En primer lugar, las redes neuronales requieren una cantidad significativa de datos históricos para entrenarse de manera efectiva. Esto puede ser un desafío en regiones con registros limitados o en situaciones donde los datos históricos no están disponibles en la calidad o cantidad necesarias.

Además, la complejidad de estos modelos puede hacer que su interpretación y transparencia sean más difíciles en comparación con métodos más simples como la regresión lineal. Los modelos de redes neuronales son a menudo considerados "cajas negras" debido a la dificultad de entender cómo se toman las decisiones dentro del modelo. Esto puede ser problemático en entornos donde la trazabilidad y la explicabilidad son cruciales para la toma de decisiones.

Otra limitación importante es la sensibilidad de los modelos de redes neuronales a las variaciones en los datos de entrada. Las fluctuaciones inesperadas en el consumo eléctrico debido a factores imprevistos, como eventos climáticos extremos o cambios repentinos en la economía, pueden afectar significativamente la precisión del modelo. Estos modelos también requieren ajustes continuos y re calibraciones para mantener su precisión a lo largo del tiempo, lo que puede resultar en una carga adicional de trabajo y recursos.

Por último, los modelos de redes neuronales pueden ser computacionalmente intensivos, lo que puede requerir hardware especializado y tiempo significativo para el entrenamiento del modelo. Este requerimiento puede limitar su implementación en entornos con recursos computacionales restringidos. En el contexto del problema bajo estudio esta limitación no es muy apreciable dada la simplicidad de los modelos logrados, pero en situaciones donde el número de capas ocultas como así también el número de neuronas por capa sean más grandes, los tiempos de entrenamiento tienden a crecer exponencialmente.

En términos de futuras líneas de investigación, sería beneficioso explorar la integración de otros factores externos, como indicadores económicos, patrones de movilidad y datos de redes sociales, que podrían influir en el consumo eléctrico. Además, la implementación de enfoques híbridos que combinen redes neuronales con otros métodos predictivos, como los modelos de aprendizaje automático supervisado y no supervisado, podría mejorar aún más la precisión y la robustez de los modelos de predicción. La investigación en la aplicación de algoritmos de aprendizaje automático más avanzados, como los modelos de aprendizaje profundo y las redes neuronales recurrentes, también podría ofrecer nuevas perspectivas y mejoras significativas en la predicción de la demanda energética.

Además, desarrollar metodologías para la interpretación y explicación de los resultados obtenidos por redes neuronales contribuiría a una mayor aceptación y confianza en estos modelos dentro del sector energético. Esto podría incluir técnicas de visualización de datos y métodos de explicación basados en modelos que permitan a los usuarios entender mejor las predicciones y las decisiones tomadas por el modelo.

 

6.   Referencias

 

Al-Musaylh M. S., Deo R. C., Adamowski J. F., Li Y. (2018). Short-term electricity demand forecasting with MARS, SVR and ARIMA models using aggregated demand data in Queensland, Australia. Advanced Engineering Informatics, 35, 1-16.

Aribowo W., Muslim S., Basuki I. (2020). Generalized regression neural network for long-term electricity load forecasting. In 2020 International conference on smart technology and applications (ICoSTA) (pp. 1-5).

Barman M., Choudhury N. B. D. (2020). A similarity based hybrid GWO-SVM method of power system load forecasting for regional special event days in anomalous load situations in Assam, India. Sustainable Cities and Society, 61, 102311.

Ciulla G.,  D'Amico A. (2019). Building energy performance forecasting: A multiple linear regression approach. Applied Energy, 253, 113500.

Compañía Administradora del Mercado Mayorista Eléctrico (CAMMESA). Informe Mensual: Principales Variables.

Dhaval B., Deshpande A. (2020). Short-term load forecasting with using multiple linear regression. International Journal of Electrical and Computer Engineering, 10(4), 3911-3917, 2020.

Divina F., Garcia Torres M., Gomez Vela  F. A., Vazquez Noguera, J. L. (2019). A comparative study of time series forecasting methods for short term electric energy consumption prediction in smart buildings. Energies, 12(10), 1934, 2019.

El-Hendawi M., Wang Z. (2020). An ensemble method of full wavelet packet transform and neural network for short term electrical load forecasting. Electric Power Systems Research, 182, 106265.

Elsaraiti M., Ali G., Musbah H., Merabet A., Little T. (2021). Time series analysis of electricity consumption forecasting using ARIMA model. In 2021 IEEE Green technologies conference (GreenTech) (pp. 259-262). IEEE.

Fan G. F., Yu M., Dong S. Q., Yeh Y. H., Hong W. C. (2021). Forecasting short-term electricity load using hybrid support vector regression with grey catastrophe and random forest modeling. Utilities Policy, 73, 101294, 2021.

Fan G. F., Li Y., Zhang X. Y., Yeh Y. H., Hong W. C. (2023). Short‐term load forecasting based on a generalized regression neural network optimized by an improved sparrow search algorithm using the empirical wavelet decomposition method. Energy Science & Engineering, 11(7), 2444-2468.

Gasparin A., Lukovic S., Alippi C. (2022). Deep learning for time series forecasting: The electric load case. CAAI Transactions on Intelligence Technology, 7(1), 1-25.

Gul M. J., Urfa G. M., Paul A., Moon J., Rho S., Hwang E. (2021). Mid-term electricity load prediction using CNN and Bi-LSTM. The Journal of Supercomputing, 77, 10942-10958.

Lai C. S., Yang Y., Pan K., Zhang J., Yuan H., Ng W. W., Lai L. L.(2020).  Multi-view neural network ensemble for short and mid-term load forecasting. IEEE Transactions on Power Systems, 36(4), 2992-3003.

Lee Y. W., Tay K. G., Choy Y.Y. (2018). Forecasting electricity consumption using time series model. International Journal of Engineering & Technology, 7(4.30), 218-223.Al-Shobaki, S., & Mohsen, M. (2008). Modeling and forecasting of electrical power demands for capacity planning. Energy Conversion and Management, 49(11), 3367–3375.

Mahia F., Dey A. R.,  Masud M. A., Mahmud, M. S. (2019). Forecasting electricity consumption using ARIMA model. In 2019 International Conference on Sustainable Technologies for Industry 4.0 (STI) (pp. 1-6). IEEE.

Nepal B., Yamaha M., Yokoe A., Yamaji T. (2020). Electricity load forecasting using clustering and ARIMA model for energy management in buildings. Japan Architectural Review, 3(1), 62-76.

Oreshkin B. N., Dudek G., Pełka P., Turkina E. (2021). N-BEATS neural network for mid-term electricity load forecasting. Applied Energy, 293, 116918.

Ozturk S., Ozturk F. (2018). Forecasting energy consumption of Turkey by Arima model. Journal of Asian Scientific Research, 8(2), 52.

Peng L. L., Fan G. F., Yu M., Chang Y. C., Hong W. C. (2021). Electric load forecasting based on wavelet transform and random forest. Advanced Theory and Simulations, 4(12), 2100334.

Shao M., Wang X., Bu Z., Chen X., Wang Y. (2020). Prediction of energy consumption in hotel buildings via support vector machines. Sustainable Cities and Society, 57, 102128.

Sharma A., Jain S. K. (2023). A Novel Two-Stage Framework for Mid-Term Electric Load Forecasting. IEEE Transactions on Industrial Informatics.

Shine P., Scully T., Upton J., Murphy M. D. (2018). Multiple linear regression modelling of on-farm direct water and electricity consumption on pasture based dairy farms. Computers and electronics in agriculture, 148, 337-346.

Shirzadi N., Nizami A., Khazen M., Nik-Bakht M. (2021). Medium-term regional electricity load forecasting through machine learning and deep learning. Designs, 5(2), 27.

Son N., Yang S., Na J. (2020). Deep neural network and long short-term memory for electric power load forecasting. Applied Sciences, 10(18), 6489.

Sun Y., Ding S., Zhang Z., Jia W. (2021). An improved grid search algorithm to optimize SVR for prediction. Soft Computing, 25, 5633-5644.

Wang Y., Guo P., Ma N., Liu G. (2022). Robust wavelet transform neural-network-based short-term load forecasting for power distribution networks. Sustainability, 15(1), 296.

Zanjani S. M., Shahinzadeh H., Moradi J.,  Fayaz-dastgerdi M. H., Yaïci W., Benbouzid M. (2022). Short-term Load Forecasting using the Combined Method of Wavelet Transform and Neural Networks Tuned by the Gray Wolf Optimization Algorithm. In 2022 Global Energy Conference (GEC) (pp. 294-299).