Research Article

Split Viewer

Korean J. Remote Sens. 2024; 40(6): 1149-1162

Published online: December 31, 2024

https://doi.org/10.7780/kjrs.2024.40.6.1.22

© Korean Society of Remote Sensing

순환신경망 및 트랜스포머 구조의 다변량 시계열모델을 이용한 농업용 저수지의 저수율 예측

박재성1, 이양원2*

1국립부경대학교 지구환경시스템과학부 위성정보융합공학전공 학부과정생
2국립부경대학교 지구환경시스템과학부 위성정보융합공학전공 교수

Received: November 22, 2024; Revised: December 6, 2024; Accepted: December 10, 2024

Prediction of Water Storage Rate for Agricultural Reservoirs Using Recurrent Neural Network and Transformer Time Series Models

Jaeseong Park1, Yangwon Lee2*

1Undergraduate Student, Major of Geomatics Engineering, Division of Earth and Environmental System Science, Pukyong National University, Busan, Republic of Korea
2Professor, Major of Geomatics Engineering, Division of Earth Environmental System Science, Pukyong National University, Busan, Republic of Korea

Correspondence to : Yangwon Lee
E-mail: modconfi@pknu.ac.kr

Received: November 22, 2024; Revised: December 6, 2024; Accepted: December 10, 2024

This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (https://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

In Korea, there are 17,100 agricultural reservoirs that play the role of agricultural water supply and flood prevention, but more than 13,700 of them are not equipped with hydrological measurement facilities, making it difficult to operate properly. On the other hand, research on detecting reservoir water volume using satellite imagery and converting it into water yield is actively underway, and if the water yield prediction model can predict the water yield of agricultural reservoirs with high accuracy, it can enable effective operation of measured and unmeasured reservoirs. In this study, we compared and analyzed the ability of recurrent neural network structure and transformer structure time series models to predict water yield for the top 48 agricultural reservoirs by water volume. The 11 years of water yield data from 2013 to 2023 were constructed, and the 2013-2021 data were separated into training data, 2022 data were used as validation data, and 2023 data were used as test data, and the mean absolute error (MAE), root mean square error (RMSE), and correlation coefficient evaluation metrics were used to quantitatively evaluate the water yield prediction ability. Instead of univariate time series forecasting using only historical water storage rate as an input variable, multivariate time series forecasting reflecting meteorological and seasonal effects as input variables was used, The RMSE averages of 48 reservoirs for 20-day forecasts of temporal fusion transformer (TFT), a time series model with a transformer structure, and gated recurrent unit (GRU), a time series model with a recurrent neural network structure, were 7.115% and 17.428%, respectively, showing that the TFT model has a better ability to predict water storage in the medium term than the GRU model.

Keywords Agricultural reservoir, Water storage, Time series forecasting, Artificial intelligence

우리나라와 같이 1년간 강우패턴이 불규칙한 지역에서는 안정적인 농작물 생산과 여름철 홍수 피해를 예방하기 위한 농업용 저수지의 운용이 중요하며(Lee, 2014), 기상적 영향과 계절적 영향을 반영한 인공지능 기반의 저수율 예측 기술을 이용한다면 가뭄시기의 농업수 공급 문제와 여름철 홍수피해에 대한 효과적대응을 통해 불규칙한 기상 조건 속에서도 적절한 농업용 저수지 운용이 가능하다. Ahn et al. (2004)은 autoregressive integratedmoving averagemodel (ARIMA) 모형을 이용한 저수량 예측과 자기회귀오차모형을 이용한 농업용 저수지의 저수량 예측 및 저수량에 영향을 주는 변수인 저수량, 평균 온도, 최고온도, 관개면적, 풍속, 습도 간의 관계를 분석하였다. Kim et al. (2018)은 형태학적 특성이 같은 저수지를 군집화 후 각 군집 특성을 반영한 회귀식을 개발 및 가뭄지수의 영향을 고려한 전망 저수율을 생산하였다. Kim et al. (2022)은 서포트벡터머신(support vector machine, SVM), 랜덤 포레스트(Random Forest, RF), 인공신경망 모형(artificial neural network, ANN) 등을 활용하여 1개월에서 3개월 최저 평균 저수율을 예측하였다.

Joh and Lee (2023)는 이동저수지를 대상으로 과거 저수율만을 입력변수로 사용한 단변량 long short-termmemory (LSTM) (Hochreiter and Schmidhuber, 1997; Olah, 2015) 및 강수 등의 기상 변수와 계절 변수를 추가한 다변량 LSTM을 사용하여 1일 후부터 5일 후까지의 저수율을 예측했으며 단변량 LSTM은 1일, 3일, 5일 후 저수율을 RMSE 1.04%, 2.52%, 4.18% 오차로 예측을 수행했고 다변량 LSTM은 저수율을 RMSE 0.98%, 1.95%, 2.76% 오차로 예측하여 다변량 시계열모델의 유용성을 입증하였으며, Park et al. (2024)은 전라북도 400여 개 저수지를 대상으로 기본 순방향 신경망을 이용하여 저수지의 복잡한 수문학·기후학적 환경요인을 반영한 저수율 예측 모델을 학습 및 검증하였으며 예측 모델의 각 입력 특성이 전체 성능에 끼치는 영향을 분석하였다. 현재 우리나라의 17,100여 개 농업용 저수지 중(Korea Rural Community Corporation, 2024) 13,700 여 곳의(80.1%) 소형 저수지 대상으로는 체계적인 계측이 이루어지지 않고 있으나, 원격탐사는 미계측되는 소형 저수지에 대한 좋은 방법론이 될 수 있다. Sentinel-1 합성개구레이더 영상과 딥러닝 모델을 이용하여 국내 농업용 저수지의 수표 면적을 탐지한 연구(Choi et al., 2023)와 Sentinel-1 합성개구레이더 영상을 이용한 댐 및 저수지의 수표 면적 모니터링 및 회귀 방정식을 사용하여 수체면적을 저장량으로 추정한 연구(Kim et al., 2024)결과에 저수율 예측기술을 접목한다면 미계측저수지에 대한 효과적 운영이 가능할 것으로 보인다.

그러나 앞선 연구에서의 순환신경망 구조 시계열모델과 순방향 신경망을 이용한 저수율예측은 1일 후의 예측치를 다시 다음 1일 후 예측에 재귀적으로 사용하므로 중기예측에서의 정확도가 감소하게 되는데, 트랜스포머 구조의 시계열예측 모델인 temporal fusion transformer (TFT) (Lim et al., 2021; Kang, 2024)는 강수량, 기온과 같이 관측해야만 알 수 있는 관측 변수와 date of year (DOY)와 같은 시점과 관계없이 알 수 있는 변수를 구분하고 이를 학습에 반영하여 기존 모델보다 정확도 높은 중·장기 예측 정확도를 가지며 재귀적 방식이 아닌 트랜스포머 기반의 multi-head attention 기법을 사용하여 순환신경망 구조의 시계열예측 모델이 가지는 한계점을 개선할 수 있다. 이에 본 연구는 과거 저수율, 기상 변수, 계절 변수를 입력변수로 한 다변량 순환신경망 및 트랜스포머 시계열모델을 이용하여 전국의 주요 농업용 저수지의 저수율을 단기 및 중기간 예측하며, 검증통계량을 사용한 모델 간 결과에 대한 비교 분석과 중기간 저수율 예측에서 트랜스포머 모델의 사용 가능성을 검토하는 것을 목적으로 한다.

2.1. 학습 데이터셋 구성

2.1.1. 연구 대상 저수지

본 연구는 우리나라의 농업용 저수지 중 유효저수량 기준 상위 48개(Table 1)를 대상으로 하며 전체 경지면적 중 논의 비율이 높은 충청도, 전라도에 집중적으로 분포해 있다(Fig. 1). 저수율데이터는 농촌용수종합정보시스템(Rural AgriculturalWater Resource Information System, RAWRIS)을 통해 제공받았으며 2013년부터 2023년까지의 11년 일일 단위 저수율데이터를 추출하여 연구에 사용하였고 결측치의 경우 선형보간을 적용하여 연구에 사용하였다.

Fig. 1. Representative 48 agricultural reservoirs in South Korea.

Table 1 List of top 48 agricultural reservoirs by effective water storage in South Korea

ReservoirEffective water storage (m3)LatitudeLongitudeReservoirEffective water storage (m3)LatitudeLongitude
Najuho107,000,00034.964126.852Geumgwang12,047,00036.996127.326
Jangseongho99,707,20035.359126.814Suyang11,834,10035.228126.686
Damyangho76,669,60035.382127.001Giheung11,630,00037.225127.111
Daea57,688,00035.982127.301Dongsang11,241,00035.982127.301
Yedang46,070,20036.653126.805Yongrim11,188,00035.616127.559
Tapjeong34,940,00036.17127.151Gui10,878,00035.744127.119
Donghwa31,348,00035.544127.539Dongbu10,733,80036.106126.777
Hadong30,336,90035.156127.8Heungdeok9,946,00035.556126.714
Seongju28,150,00035.903128.154Bomun9,834,00035.834129.253
Gyeongcheon (Gyeongsangbuk-do)27,200,00036.691128.311Wonnam8,690,20036.864127.564
Baekgok26,372,00036.86127.417Dalchang8,649,00035.645128.462
Gyeongcheon (Jeonrabuk-do)25,346,00036.028127.227Myogok8,441,00036.526129.346
Deokdong22,537,10035.823129.285Otae8,291,00036.504128.123
Idong20,906,00037.111127.201Gung8,222,00036.521127.647
Cheongcheon20,753,10036.365126.61Biryong8,163,00036.482127.809
Cheongho18,045,00035.734126.697Seobu7,989,00036.117126.699
Togyo17,412,00038.263127.277Gabuk7,979,00035.785128.001
Gosam15,217,00037.076127.281Jangnam7,920,80035.552127.486
Bulgap15,200,00035.229126.506Gopung7,821,80036.78126.61
Gwangjuho15,198,00035.204126.985Daegok7,712,00035.684127.622
Obong14,329,10037.71128.819Daedong7,502,10035.118126.507
Maengdong13,910,00036.892127.57Neung7,315,60035.854126.836
Chopyeong13,853,20036.817127.514Geumbong7,259,20036.352128.853
Okgu12,826,10035.906126.666Sucheong7,001,00035.553126.93


2.1.2. 강수량 데이터셋 구성

다변량 시계열모델의 입력자료로 사용된 일 강수 자료는 우리나라 기상청의 국지예보모델(Local Data Assimilation and Prediction System, LDAPS) 실황장의 강수량 데이터를 사용하였다. LDAPS는 영국 통합모델(UnifiedModel, UM)로부터 3시간 간격으로 경계장을 제공받아서 일 4회 48시간 예측을 수행하는 수치예보 시스템이며, UM은 기상관측소, 라디오존데, 위성정보 등의 소스에서 획득한 데이터를 바탕으로 예보를 수행한다(Korea Meteorological Administration, 2024). 본 연구에서는 3시간 단위의 LDAPS 자료로부터 강수량 레이어를 추출한 뒤 일 강수로 합성하여 모델 입력변수로 사용하였다.

2.2. 시계열 인공지능 모델링

2.2.1. 순환신경망 구조의 시계열 모델

본 연구에서는 순환신경망 구조의 시계열 모델로 LSTM과 gated reccurrent unit (GRU) (Cho et al., 2014)을 사용하였다(Fig. 2). 초기 시계열예측에는 Vanilla recurrent neural network (RNN)가 주로 사용되어 왔지만 기울기 소실 문제 및 역전파 과정의 비효율성 문제가 있었고 이후 Vanilla RNN 방식의 단점을 보완하기 위한 LSTM과 내부구조를 간소화한 GRU가 제안되었다. LSTM은 입력게이트, 출력게이트, 망각게이트, 셀의 내부구조를 통해 장기 종속성을 강화하여 과거 데이터 중 중요한 정보를 예측에 활용하며, GRU는 LSTM의 입력게이트, 출력게이트, 망각게이트를 축소하여 업데이트게이트와 리셋게이트로 구성함으로써 더 적은 파라미터를 학습에 사용하여 훈련 시간을 단축할 수 있다는 장점이 있다. LSTM과 GRU의 내부 게이트 구조 차이로 인해 어떤 Task를 대상으로 예측을 수행하는지에 따라 높은 정확도를 가지는 모델이 다르며, 내부구조가 더 복잡한 LSTM의 경우 일반적으로 더 복잡한 문제에 대한 예측 능력이 더 우수하며 GRU의 경우 LSTM에 비해 더 간단한 문제에 대한 예측 능력이 우수하다.

Fig. 2. Structure of recurrent neural network time series forecasting model for water storage rate used in this study: (a) LSTM and (b) GRU.

2.2.2. 트랜스포머 구조의 시계열 모델

본 연구에서 사용한 트랜스포머 구조의 시계열모델인 TFT는 기존 순환신경망 구조의 모델들이 가지는 한계인 먼 미래에 대한 예측의 불확실성을 해결하였다. TFT는 관측해야만 알 수 있는 관측 변수(Observed Inputs)와 시점과 관계없이 알 수 있는 변수인 알고있는 변수(Known Inputs)를 구분하며 학습 및 예측단계에서 알고있는 변수를 LSTMDecoder, GRN 계층에 통과시켜 직접적으로 사용하여 중·장기에 대해서도 높은 정확도로 예측을 수행한다. 또한 1일 후 예측을 다음날 예측의 입력변수로 사용하는 재귀적 방식의 메커니즘 대신 트랜스포머 기반의 multi-head attention 메커니즘을 사용하여 Abhay, Alberto 순환신경망 구조의 시계열모델에 비해 중·장기 예측에서 강점을 가진다(Fig. 3).

Fig. 3. Structure of temporal fusion transformer time series forecasting model for water storage rate used in this study (Srivastava and Cano, 2022).

2.2.3. 다변량 시계열 인공지능 학습조건

시계열 예측모델의 타깃변수는 일일 저수율이며 이를 예측하기 위한 설명변수로 LSTM, GRU 모델은 과거 저수율, 일 강수, DOY를 사용하였고(Table 2) 파이썬(Python)의 Keras 라이브러리를 사용하여 구현하였다(Keras, 2024). TFT 모델은 관측 변수로는 과거저수율과 강수량, 알고있는 변수로는DOY, week of year (WOY), month of year (MOY)를 사용하였으며(Table 2), 파이썬의 PyTorch Forecasting 라이브러리를 사용하여 구현하였다(PyTorch Forecasting, 2024).

Table 2 Input variables for each multivariate time forecasting model

ModelInput variables
LSTMDaily water storage rate, Daily precipitation, DOY
GRUDaily water storage rate, Daily precipitation, DOY
TFTDaily water storage rate, Daily precipitation, DOY, WOY, MOY

LSTM: long short term memory, GRU: gated recurrent unit, TFT: temporal fusion transformer, DOY: date of year, WOY: week of year, MOY: month of year.



훈련데이터 셋의 기간은 2013년부터 2021년, 검증용 데이터셋의 기간은 2022년 평가용 데이터셋의 기간은 2023년으로 설정하였으며 시계열 모델링에서 중요한 하이퍼파라미터(hyperparameter)인 과거 며칠의 데이터를 사용하여 미래를 예측할 것인가는 과거저수율, 일 강수, DOY를 입력변수로 하여 모델 훈련을 진행하는 상황에서의 반복 실험을 통해 설정한 과거 20일로 설정하였고 반복 학습을 통해 여러 하이퍼파라미터의 최적화를 수행하였다(Table 3).

Table 3 Hyperparameter setting for each multivariate time forecasting model

ModelLSTMGRUModelTFT
Number of epoch100100Number of epoch100
Number of steps2020Number of steps20
Number of layer100120Number of layers160
Learning rate0.00010.0001Learning rate0.0001
Batch size3232Batch size64
Activation functionReLUReLUAttention head size8

LSTM: long short term memory, GRU: gated recurrent unit, TFT: temporal fusion.


3.1. 저수율 데이터 분석

농업용 저수지의 1년간 저수율 패턴을 살펴보면, 5월 이전 비농업시기에 100%의 저수율에 가깝게 물을 저장하고 있다가 농업 시기가 오면 하류 농경지의 관개수 공급을 목적으로 농업수를 방류한다(Song et al., 2022). 그 후 강우량이 많아지는 장마철에는 증가한 물 유입량과 줄어든 농업수의 수요로 인하여 저수율이 급격하게 상승하게 된다. 이때 시설 피해를 막기 위해 저장과 방류를 반복하는 홍수 통제 기간을 가지고 이후 수확이 끝나면 다음 해 농업시기를 대비하여 물을 저장하는 패턴을 확인할 수 있다(Fig. 4).

Fig. 4. Trends in yearly water storage for agricultural reservoirs reflecting agricultural water supply and flood control periods.

대상 저수지들이 일반적인 농업용 저수지의 패턴을 따라가는지를 확인하기 위하여 48개 저수지의 월별 저수율평균, 표준편차, 평균 일간절대편차(mean of absolute daily difference, MADD)를 산출하였다(Table 4). 저수율의 월별 통계를 살펴보면, 비농업시기인 1월부터 4월 그리고 11월과 12월의 저수율은 농업시기인 5월에서 10월의 저수율에 비해 높은 것을 알 수 있다. 또한 장마철에 해당하는 7월과 8월의 경우 저장과 방류를 반복하는 홍수조절 기간의 영향으로 인해 평균일간절대편차가 다른 달에 비해 큰 값을 가지는 것을 확인할 수 있다. 계절적 특성이 뚜렷하게 나타나는 농업용 저수지의 저수율을 대상으로 한 시계열 모델링에서 계절 변수의 입력변수 반영은 모델 학습에 있어서 중요하다.

Table 4 Monthly average statistics of water storage rate from 2013 to 2023

MonthAverage (%p)SDMADD
176.07619.8560.679
277.62419.7340.705
380.30418.6310.678
483.64016.2020.679
575.38816.1811.478
654.93816.7181.389
761.77020.4941.799
862.63420.3471.630
965.91421.2851.321
1069.26421.1930.933
1171.08120.8560.848
1274.40720.1520.753

SD: standard deviation, MADD: mean of daily difference of water storage rate change.



3.2. 모델 간 저수율 예측능력 비교

3.2.1. 단기예측 비교

본 연구에서는 3일 후까지의 예측 기간을 단기 예측으로 정의하였고 4일부터 20일 후 까지를 중기 예측으로 정의하여 순환신경망 구조 및 트랜스포머 구조 시계열모델의 저수율 예측 능력을 비교하였다(Table 5). 1일 후 예측에서는 저수지마다 차이가 있지만 GRU와 TFT의 예측 능력이 가장 우수하였고 2일 후, 3일 후 예측에서는 TFT의 저수율 예측 통계량이 LSTM과 GRU의 저수율 예측 통계량보다 우수하였다.

Table 5 Monthly average statistics of water storage rate from 2013 to 2023

After dayReservoirLSTMGRUTFT
MAEd)RMSECCMAERMSECCMAERMSECC
1Najuho1.0591.7670.9920.8651.4030.9951.3471.7720.994
Jangseongho1.3081.7900.9961.0471.8050.9961.1991.7880.996
Damyangho4.0885.4400.9950.9251.4440.9981.8612.2790.998
Daea1.5473.0080.9211.3872.9680.9210.9732.7410.929
Yedang2.7264.2780.9742.4183.9680.9782.5053.8990.978
Tapjeong1.7813.4800.9471.7213.5570.9442.0223.6990.941
Donghwa1.9182.8140.9750.9881.5540.9911.2541.8500.988
Hadong1.0861.6320.9641.0111.5480.9681.4512.2430.936
Seongju1.5153.0990.9151.3722.9440.9251.9433.4950.889
Gyeongcheon1.1532.1380.9821.2042.2150.9811.8073.2860.961
Baekgok1.0622.1250.9881.0281.8280.9911.3872.1920.990
Gyeongcheon1.7923.2670.9481.6663.1000.9522.0103.8610.923
Deokdong1.1251.8070.9760.9771.6430.9800.8691.8220.975
Idong1.8842.8280.9891.7122.6660.9892.1883.6960.983
Cheongcheon1.4792.2630.9851.3152.2550.9851.5592.6640.979
Cheongho0.7531.1330.9840.7451.1630.9840.9721.3380.979
Togyo0.9051.1900.9900.9201.2160.9901.0481.4400.990
Gosam1.2352.5210.9901.0592.3400.9921.5143.1040.990
Bulgap3.8875.1640.9761.6072.4220.9912.9914.0830.984
Gwangjuho1.5283.1750.9341.3112.9010.9461.7773.3440.920
Obong1.9732.8400.9891.3081.9040.9952.1563.1080.989
Maengdong2.7393.6360.9751.5422.0880.9921.9532.4330.990
Chopyeong1.2012.5920.9691.2452.7050.9661.5193.1610.956
Okgu1.5052.1390.9801.1961.7660.9871.3281.9650.983
Geumgwang1.5142.6710.9861.6332.8400.9865.0906.3560.958
Suyang4.2735.6990.9752.4654.2890.9782.5674.1420.977
Giheung2.1422.9620.9791.7412.6110.9803.0985.2250.967
Dongsang2.1713.5350.9781.8813.5260.9781.9443.5650.978
Yongrim6.5389.5930.9694.2946.0120.9892.0832.6380.996
Gui1.7453.5420.9391.5463.1140.9532.3804.6500.899
Dongbu1.4872.7790.9571.4932.9790.9512.0643.5230.927
Heungdeok2.7145.1750.8462.5935.1910.8532.8566.1300.779
Bomun1.2552.1780.9881.3812.2810.9882.2433.7510.972
Wonnam1.1972.4580.9751.1422.1650.9841.4273.0580.969
Dalchang1.5372.6420.9391.7552.7860.9381.8003.1320.912
Myogok1.1422.4190.9791.0802.2900.9811.7563.1890.964
Otae1.4892.4490.9871.2332.1340.9911.2702.0470.991
Gung1.2861.8920.9810.9131.5090.9831.2161.7240.977
Biryong7.1399.8340.8574.1566.4420.9283.4055.8920.935
Seobu1.9123.2210.9521.8753.2400.9541.8033.1460.949
Gabuk1.3722.3600.9451.2602.3100.9461.4742.8730.925
Jangnam1.5372.7450.9251.5412.3160.9481.5353.0770.899
Gopung1.6882.8380.9831.1712.1530.9902.0273.5310.973
Daegok1.1301.8950.9741.3062.0120.9701.6312.6670.945
Daedong2.1733.8440.9762.2433.7220.9772.1443.7590.977
Neung0.7851.3570.9410.6201.1360.9580.8701.4800.928
Geumbong1.4342.4820.9931.6562.6910.9921.8783.5960.986
Sucheong3.3255.3560.9452.8844.7060.9613.7945.4570.946
2Najuho1.5782.6940.9811.2062.1030.9881.2041.7230.994
Jangseongho1.8402.4410.9931.3562.2630.9941.3771.9560.995
Damyangho4.7656.2670.9931.1161.7170.9971.7432.1760.998
Daea2.1603.4980.8941.7703.3230.9020.9792.6030.936
Yedang3.9665.7910.9523.5255.2000.9652.5693.9510.978
Tapjeong2.5064.2040.9272.7184.7660.8982.0323.7700.939
Donghwa2.9994.0450.9431.6422.5160.9771.1521.7350.988
Hadong1.4582.0490.9441.5412.0940.9441.4132.1770.938
Seongju2.4604.0950.8572.1813.7750.8791.9163.3930.893
Gyeongcheon1.6822.8740.9671.6672.8550.9701.7943.2640.961
Baekgok1.7253.2320.9731.5302.9350.9761.3482.1080.990
Gyeongcheon2.4483.8280.9282.1673.5120.9391.9523.7830.925
Deokdong1.8282.5960.9571.2801.9050.9730.9111.8450.975
Idong2.6573.7750.9822.3063.4040.9842.2253.8040.984
Cheongcheon2.5053.6010.9641.8772.7560.9781.5232.6610.979
Cheongho1.1801.6980.9651.1941.8570.9631.0171.3830.978
Togyo1.4021.8420.9761.2731.6500.9821.1571.5390.990
Gosam1.8333.2090.9851.6022.9210.9891.6623.3110.990
Bulgap5.4977.1030.9472.2653.2160.9842.8893.9790.984
Gwangjuho2.5273.9700.9022.1253.6640.9181.7023.2590.924
Obong2.4163.3610.9861.9442.5210.9922.4603.6090.987
Maengdong3.3834.4330.9642.1922.8720.9863.0143.7080.978
Chopyeong1.8433.3750.9491.8673.6470.9371.5283.4570.947
Okgu2.8403.7080.9412.3673.4470.9511.2451.8510.985
Geumgwang2.3183.6550.9762.6124.0020.9775.0396.3700.957
Suyang6.4037.7260.9533.2955.0940.9692.8374.3160.975
Giheung3.9054.9030.9532.8933.9880.9533.2735.3050.964
Dongsang4.0185.9090.9393.9786.6710.9181.9653.6380.977
Yongrim9.16013.0830.9345.3097.2040.9822.5533.0930.995
Gui3.0225.1650.8772.2133.6650.9362.3714.7360.895
Dongbu1.9013.3020.9431.8013.3620.9392.0023.4160.932
Heungdeok3.7906.2310.7783.7786.9850.7512.8436.0510.785
Bomun2.1673.4020.9721.6902.6930.9852.2333.7210.972
Wonnam1.7063.4590.9511.7463.1430.9751.3072.9130.972
Dalchang1.9953.1710.9112.4173.6390.9011.7463.1250.912
Myogok1.6563.0160.9671.3862.5400.9771.6803.1690.964
Otae2.5934.1110.9632.2173.7920.9681.4112.2630.990
Gung1.6882.3640.9691.2161.8540.9761.1651.7070.978
Biryong10.30414.0790.7166.0018.8620.8723.2675.8460.935
Seobu2.8404.4760.9242.8604.6370.9341.7653.0670.951
Gabuk2.0573.0370.9181.8842.9550.9181.4802.8350.926
Jangnam1.7943.2160.9002.0523.1510.9191.5663.0830.898
Gopung2.5154.1830.9631.7072.8200.9832.0123.3770.975
Daegok1.5062.3260.9621.6202.4050.9571.6172.6410.946
Daedong3.2755.0200.9613.4504.9300.9602.1393.7300.977
Neung1.1421.8680.8950.7071.1720.9550.8751.4650.930
Geumbong1.8562.8170.9911.7822.8070.9911.8493.5470.987
Sucheong5.5378.5150.8673.8305.3130.9573.9515.5070.946
3Najuho1.9993.3280.9701.4422.4990.9831.3322.0310.990
Jangseongho2.3443.1410.9881.5852.5720.9921.6752.3870.993
Damyangho5.4657.1470.9891.2591.9080.9961.9692.4000.997
Daea2.7594.0640.8612.0583.5970.8891.0192.5350.940
Yedang4.9237.1080.9284.3066.0650.9522.7044.1140.976
Tapjeong3.3605.2380.8993.6486.1150.8392.1463.9670.932
Donghwa3.9615.1790.9042.2683.3980.9611.1811.7690.988
Hadong1.9302.6940.9122.0882.8260.9131.4302.1790.937
Seongju3.3665.1820.7882.9434.7530.8131.9213.4470.887
Gyeongcheon2.2013.5970.9492.1073.5770.9571.8253.2960.961
Baekgok2.3584.1030.9581.9983.8740.9611.4342.2170.988
Gyeongcheon3.1484.6190.8942.6004.0360.9221.9873.8290.924
Deokdong2.5763.4970.9371.4962.0860.9690.9541.8850.973
Idong3.3464.7330.9742.8044.1530.9772.3393.9120.984
Cheongcheon3.7045.4850.9262.4383.3600.9681.5452.6930.979
Cheongho1.6662.5250.9281.6982.7580.9221.0801.4510.976
Togyo2.0092.7140.9471.6422.1710.9721.2261.6060.989
Gosam2.3623.9560.9782.2493.8360.9831.7713.4000.990
Bulgap6.7938.6460.9122.8053.9080.9763.0344.1250.983
Gwangjuho3.6495.2120.8412.9144.5350.8791.7413.2200.926
Obong3.1214.3050.9792.5443.1540.9892.8524.1500.983
Maengdong3.9275.0550.9552.5933.3210.9823.3373.9440.973
Chopyeong2.5704.4380.9192.4954.6860.8971.6403.8080.935
Okgu4.2055.3140.8823.8375.5440.8781.3001.9140.984
Geumgwang3.1074.8920.9623.5705.3750.9655.0276.3430.956
Suyang8.3789.7830.9163.9755.7380.9603.1194.5840.972
Giheung5.7727.1160.9124.2235.8810.9003.4355.4250.961
Dongsang6.3329.3630.8486.88010.8390.7802.3083.9170.973
Yongrim10.75015.0010.9056.0448.0260.9763.1183.7340.992
Gui4.6107.4780.7753.0594.7020.9012.4424.8210.891
Dongbu2.4164.2010.9152.0593.7510.9271.9593.3640.934
Heungdeok5.0857.6070.6885.1359.1600.6182.9316.1330.778
Bomun3.1034.7770.9461.9482.9800.9832.3063.7670.971
Wonnam2.1164.2780.9262.3944.4210.9651.2412.8460.973
Dalchang2.4623.6480.8823.0044.5920.8551.7523.1850.908
Myogok2.2643.9880.9441.6342.8960.9721.7033.2070.963
Otae3.6375.5460.9313.1235.2490.9371.7122.7550.984
Gung2.1703.0220.9511.5332.3010.9661.1941.7510.977
Biryong12.60317.6130.5796.97810.1690.8283.2555.8360.934
Seobu3.8366.2030.8803.9436.5660.9041.7433.0530.951
Gabuk2.8813.9800.8832.6283.9540.8731.5292.8690.923
Jangnam2.0443.6750.8762.5054.1000.8931.6083.1190.894
Gopung3.3385.7870.9342.2683.8090.9702.0643.3980.974
Daegok1.9442.8440.9461.8502.7240.9451.6132.6390.946
Daedong4.6206.8870.9334.7386.8470.9272.3003.8000.976
Neung1.5572.6230.8150.7701.2230.9520.8841.4720.930
Geumbong2.2653.3280.9871.8342.8740.9911.9293.6620.986
Sucheong7.89211.9340.7564.9816.3040.9504.1635.6810.942

LSTM: long short term memory, GRU: gated recurrent unit, TFT: temporal fusion transformer, MAE: mean absolute error, RMSE: root mean squared error, CC: correlation



1일 후에서 3일 후 예측에 대한 48개 저수지의 통계량 평균(Table 6)을 살펴보면 1일 후 예측에서는 GRU 저수율 예측값의 MAE, RMSE, 상관계수가 각각 1.551, 2.664, 0.971로 가장 우수하였으나 2일 후 예측에서는 TFT 저수율 예측값의MAE, RMSE, 상관계수가 각각 1.942, 3.238, 0.958로 가장 우수하였으며, 3일 후 예측에서 또한 TFT 저수율 예측값의MAE, RMSE, 상관계수가 각각 2.047, 3.357, 0.956으로 가장 우수하였다.

Table 6 Monthly average statistics of water storage rate from 2013 to 2023

AfterdayLSTMGRUTFT
MAERMSECCMAERMSECCMAERMSECC
11.9633.1680.9651.5512.6640.9711.9053.1930.958
22.8884.3070.9392.2323.5130.9521.9423.2380.958
33.8115.5590.9022.8944.4420.9272.0473.3570.956

LSTM: long short term memory, GRU: gated recurrent unit, TFT: temporal fusion transformer, MAE: mean absolute error, RMSE: root mean squared error, CC: correlation coefficient.



3.2.2. 중기예측 비교

순환신경망 구조 및 트랜스포머 구조 시계열모델을 사용하여 4일 후부터 20일 후까지의 농업용 저수지 저수율을 예측하였고 모델 간 48개 저수지의 평균 통계량을 비교해 보았다(Table 7).

Table 7 Monthly average statistics of water storage rate from 2013 to 2023

AfterdayLSTMGRUTFT
MAERMSECCMAERMSECCMAERMSECC
44.7046.8210.8613.5485.3910.8992.1953.5390.952
55.5598.0590.8194.1866.3180.8722.3723.7610.948
66.3899.2750.7774.8087.2090.8462.5593.9980.942
77.20210.4780.7375.4068.0650.8242.7534.2460.936
87.98511.6400.7015.9898.8900.8042.9504.5080.928
98.71412.7160.6706.5649.6940.7863.1454.7680.920
109.39213.6950.6437.12010.4730.7703.3335.0230.912
1110.03014.5930.6197.66011.2330.7553.5135.2660.903
1210.63415.4300.5978.19711.9840.7413.6915.5010.894
1311.20716.2180.5778.72812.7210.7263.8605.7240.886
1411.75816.9720.5599.25813.4490.7124.0255.9400.876
1512.29717.7040.5419.78914.1680.6974.1866.1510.867
1612.82318.4140.52510.30814.8600.6834.3456.3530.858
1713.33319.0980.51010.81515.5370.6684.5006.5560.849
1813.82819.7530.49611.30316.1890.6554.6476.7480.839
1914.31220.3830.48211.77516.8150.6424.7896.9360.829
2014.78120.9900.46912.23017.4180.6304.9247.1150.819

LSTM: long short term memory, GRU: gated recurrent unit, TFT: temporal fusion transformer, MAE: mean absolute error, RMSE: root mean squared error, CC: correlation



다음날 예측값을 그 다음 날 예측의 입력으로 활용하는 재귀적 방식의 LSTM과 GRU 모델의 경우 먼 일수를 예측할수록 TFT 모델보다 통계량이 더욱 저하되는 것을 확인할 수 있다. GRU 모델을 이용한 저수율예측에 대하여 4일 후 와 20일 후 예측값에 대한 통계량 차이를 살펴보면MAE, RMSE, 상관계수가 각각 8.682%, 12.027%, 0.269 저하됐지만 TFT 모델을 이용한 4일 후와 20일 후 예측값에 대한 통계량 차이를 살펴보면 MAE, RMSE, 상관계수 각각 2.729%, 3.576%, 0.133으로 먼 미래 일수를 예측할 때 GRU 모델의 통계량 저하 폭이 큰 것을 알 수 있다. 또한 GRU와 TFT 모델의 20일 후 저수율 예측 통계량의 차이를 살펴보면 MAE, RMSE, 상관계수 각각 7.306%, 10.303%, 0.189로 중기 예측에 있어서 트랜스포머 구조 시계열예측모델이 순환신경망 구조 시계열예측 모델보다 우수한 것을 알 수 있다. 정성적 평가를 위해 청호저수지를 대상으로 2023년 1년의 모델별 1, 5, 10, 15, 20일 후 예측값을 실측값과 비교해 보았고 TFT 모델을 사용한 저수율 예측값과 실측값의 관계를 나타내는 산점도를 확인하였다(Fig. 6).


1일 후 예측에서는 LSTM, GRU, TFT 모델 모두 실측값과 유사하게 예측값이 산출되었다. 또한 농업용 저수지를 대상으로 한 저수율 예측에 있어서 완만한 값보다는 급격히 상승하는 저수율 값을 높은 정확도로 예측하는 것이 중요한데, 강우량이 많은 7월과 8월의 급격한 저수율 상승 값과 홍수조절기간 동안에 대해서도 모델별 저수율 예측값이 실측값에 가까운 모습을 확인 할 수 있다. 5일 후 예측에서는 TFT를 사용한 저수율 예측값의 경우 7월과 8월에 대해서도 실측값에 가깝게 예측하는 모습을 확인할 수 있으나 LSTM과 GRU를 사용한 저수율 예측값은 7월과 8월을 제외하면 비교적 실측값에 가깝지만, 강우량이 많은 7월과 8월에 대해서는 1일 후 예측에 비해 실측값과의 차이가 큰 것을 확인할 수 있다. 10일 후 예측 및 그 이후 일 수에 대한 저수율 예측에서는 LSTM과 GRU를 사용한 저수율 예측값과 실측값의 차이가 5일 후 예측의 경우보다 더 커지며, TFT 모델을 사용한 저수율 예측값의 경우 7월과 8월에 대한 예측값이 실측값의 경향은 따라가지만, 1일 후 및 5일 후와 비교했을 때는 실측값과의 차이가 큰 것을 알 수 있다. 또한 예측하는 일수가 늘어남에 따라 TFT 모델을 사용한 저수율 예측값의MAE, RMSE, 상관계수 통계량이 점진적으로 저하되는 모습을 확인할 수 있다. 추가로 다변량 시계열모델의 입력변수 중요도(Deotte, 2021)를 살펴보았으며(Table 8), LSTM과 GRU의 경우 과거 저수율이 각각 89.7%, 89.2%로 가장 중요한 변수임을 알 수 있었고 일 강수량의 변수중요도는 각각 5.1%와 5.3%로 나타나, 그 다음으로 중요한 변수임을 알 수 있었다.

Table 8 Feature importance for the multivariate LSTM and GRU models to predict daily water

RankVariablePercentageCategory
LSTMGRU
1Daily water storage89.7%89.2%Water source
2DOY5.2%5.5%Period
3Daily Precipitation5.1%5.3%Weather

DOY: date of year.



관측변수와 알고있는 변수를 구분하여 학습하는 TFT의 변수중요도를 살펴보면 과거저수율이 82.5% 일 강수량이 4.1%의 변수중요도를 보여주었고 계절 변수인 DOY, MOY, WOY의 변수중요도가 각각 5.4%, 4.2%, 3.8%로 나타났다(Table 9). TFT의 DOY 변수중요도는 5.6%로 LSTM, GRU모델의DOY 변수중요도인 5.2%, 5.5%보다 조금 더 높았고 알고있는 변수에 해당하는 DOY, MOY, WOY의 변수중요도 합은 13.6%로 TFT모델이 학습 과정에서 알고있는 변수에 해당하는 계절 변수에 큰 가중치를 두어 중기 예측에서 LSTM과 GRU에 비해 저수율을 안정적으로 예측했다.

Table 9 Decoder Feature importance for the multivariate TFT model to predict daily water storage rate

RankVariablePercentageCategory
1Daily water storage82.5%Water source
2DOY5.6%Period
3MOY4.2%Period
4Daily Precipitation3.9%Weather
5WOY3.8%Period

DOY: date of year, MOY: month of year, WOY: week of year.


우리나라의 저수량 기준 상위 48개 농업용 저수지를 대상으로 순환신경망 구조 및 트랜스포머 구조 시계열모델을 사용하여 기상 영향과 계절 영향을 입력변수로 반영한 저수율예측을 수행하였다. 1일 후 예측에서는 저수지 별 차이는 존재하였으나 GRU와 TFT 모델을 사용한 저수율 통계량이 가장 우수하였고 48개 저수지의 통계량 평균을 살펴보았을 때 GRU 모델을 사용한 저수율 예측값의 통계량이 가장 우수하였다. 그러나 2일 후와 3일 후 그리고 중기 예측에서는 TFT 모델을 이용한 저수율 예측값의 통계량이 가장 우수하였으며 20일 후 예측에서의GRU와 TFT 모델에 대한 통계량 차이는MAE, RMSE, 상관계수 7.306%, 10.303%, 0.189로 중기 예측에서 트랜스포머 구조 시계열모델의 우수성을 확인하였다. LSTM, GRU, TFT 모두 과거저수율을 가장 중요한 변수로 학습하였으며 특히 TFT는 알고있는 변수에 해당하는 계절 변수에 더 큰 가중치를 두어 학습하여 중기 예측에 있어서 LSTM과 GRU에 비해 안정적으로 저수율을 예측했다. 본 연구의 결과와 더불어 수표 면적 탐지연구 및 저수지의 수표면적을 저수율로 변환하는 등의 원격탐사 방법론과 함께 전국의 미계측저수지를 대상으로 단기 및 중기간 저수율을 예측함으로써, 농업 및 방재 분야에 유용한 정보를 제공할 수 있을 것으로 기대된다.

본 연구는 국토교통부/국토교통과학기술진흥원의 지원으로 수행되었음(과제번호 RS-2022-00155763).

No potential conflict of interest relevant to this article was reported.

  1. Ahn, T., Lee, H., Lee, J. Y., Yi, J. E., and Yun, Y. N., 2004. A reservoir operation plan coupled with storage forecasting models in existing agricultural reservoir. Journal of Korea Water Resources Association, 37(1), 77-86. https://doi.org/10.3741/JKWRA.2004.37.1.077
  2. Cho, K., Van Merriënboer, B., Gulcehre, C., Bahdanau, D., Bougares, F., Schwenk, H., and Bengio, Y., 2014. Learning phrase representations using RNN encoder-decoder for statistical machine translation. arXiv preprint arXiv:1406.1078. https://doi.org/10.48550/arXiv.1406.1078
  3. Choi, S., Youn, Y., Kang, J., Kim, S., Jung, Y., and Im, Y., et al, 2023. Waterbody detection for the reservoirs in South Korea using Swin Transformer and Sentinel-1 images. Korean Journal of Remote Sensing, 39(5-3), 949-965. https://doi.org/10.7780/kjrs.2023.39.5.3.6
  4. Deotte, C., 2021. LSTM feature importance. Available online: https://www.kaggle.com/code/cdeotte/lstm-feature-importance (accessed on Nov. 20, 2024)
  5. Hochreiter, S., and Schmidhuber, J., 1997. Long short-term memory. Neural Computation, 9(8), 1735-1780. https://doi.org/10.1162/neco.1997.9.8.1735
  6. Joh, S., and Lee, Y., 2023. Prediction of water storage rate for agricultural reservoirs using univariate and multivariate LSTM models. Korean Journal of Remote Sensing, 39(5-4), 1125-1134. https://doi.org/10.7780/kjrs.2023.39.5.4.6
  7. Kang, T., 2024. Developing a transformer model for time series data forecasting. Available online: https://daddynkidsmakers.blogspot.com/2024/04/blog-post.html (accessed on Nov. 20, 2024)
  8. Keras, 2024. Keras - Simple. Flexible. Powerful. Available online: https://keras.io (accessed on Nov. 20, 2024)
  9. Kim, J. U., Jung, C. G., Lee, J. W., and Kim, S. J., 2018. Development of Naïve-Bayes classification and multiple linear regression model to predict agricultural reservoir storage rate based on weather forecast data. Journal of Korea Water Resources Association, 51(10), 839-852. https://doi.org/10.3741/JKWRA.2018.51.10.839
  10. Kim, S., Bae, S., Lee, S., and Jang, M., 2022. Monthly agricultural reservoir storage forecasting using machine learning. Atmosphere, 13(11), 1887. https://doi.org/10.3390/atmos13111887
  11. Kim, W., Lee, S., and Choi, M., 2024. A comparative study of remotely sensed reservoir monitoring across multiple land cover types. Science of The Total Environment, 948, 174678. https://doi.org/10.1016/j.scitotenv.2024.174678
  12. Korea Meteorological Administration, 2024. Local data assimilation and prediction system (LDAPS) - File set. Available online: https://data.kma.go.kr/data/rmt/rmtList.do?code=340&pgmNo=65 (accessed on Nov. 20, 2024)
  13. Korea Rural Community Corporation, 2024. RAWRIS: Rural Agricultural Water Resource Information System. Available online: https://rawris.ekr.or.kr/%20main.do (accessed on Nov. 20, 2024)
  14. Lee, C., 2014. Current status and issues with the agricultural reservoir checklist and condition assessment. Magazine of the Korean Society of Agricultural Engineers, 56(3), 32-37.
  15. Lim, B., Arık, S. Ö., Loeff, N., and Pfister, T., 2021. Temporal fusion transformers for interpretable multi-horizon time series forecasting. International Journal of Forecasting, 37(4), 1748-1764. https://doi.org/10.1016/j.ijforecast.2021.03.012
  16. Olah, C., 2015. Understanding LSTM networks. Available online: https://colah.github.io/posts/2015-08-Understanding-LSTMs (accessed on Nov. 20, 2024)
  17. Park, H., Yoon, J., Lee, H., and Yang, H., 2024. Analyzing the impact of multivariate inputs on deep learning-based reservoir level prediction and approaches for mid to long-term forecasting. The Transactions of the Korea Information Processing Society, 13(4), 199-207. https://doi.org/10.3745/TKIPS.2024.13.4.199
  18. PyTorch Forecasting, 2024. PyTorch Forecasting Documentation. Available online: https://pytorch-forecasting.readthedocs.io/en/stable (accessed on Nov. 20, 2024)
  19. Song, J., Her, Y., and Kang, M., 2022. Estimating reservoir inflow and outflow from water level observations using expert knowledge: Dealing with an ill-posed water balance equation in reservoir management. Water Resources Research, 58(4), e2020WR028183. https://doi.org/10.1029/2020WR028183
  20. Srivastava, A., and Cano, A., 2022. Analysis and forecasting of rivers pH level using deep learning. Progress in Artificial Intelligence, 11, 181-191. https://doi.org/10.1007/s13748-021-00270-2

Research Article

Korean J. Remote Sens. 2024; 40(6): 1149-1162

Published online December 31, 2024 https://doi.org/10.7780/kjrs.2024.40.6.1.22

Copyright © Korean Society of Remote Sensing.

순환신경망 및 트랜스포머 구조의 다변량 시계열모델을 이용한 농업용 저수지의 저수율 예측

박재성1, 이양원2*

1국립부경대학교 지구환경시스템과학부 위성정보융합공학전공 학부과정생
2국립부경대학교 지구환경시스템과학부 위성정보융합공학전공 교수

Received: November 22, 2024; Revised: December 6, 2024; Accepted: December 10, 2024

Prediction of Water Storage Rate for Agricultural Reservoirs Using Recurrent Neural Network and Transformer Time Series Models

Jaeseong Park1, Yangwon Lee2*

1Undergraduate Student, Major of Geomatics Engineering, Division of Earth and Environmental System Science, Pukyong National University, Busan, Republic of Korea
2Professor, Major of Geomatics Engineering, Division of Earth Environmental System Science, Pukyong National University, Busan, Republic of Korea

Correspondence to:Yangwon Lee
E-mail: modconfi@pknu.ac.kr

Received: November 22, 2024; Revised: December 6, 2024; Accepted: December 10, 2024

This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (https://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

Abstract

In Korea, there are 17,100 agricultural reservoirs that play the role of agricultural water supply and flood prevention, but more than 13,700 of them are not equipped with hydrological measurement facilities, making it difficult to operate properly. On the other hand, research on detecting reservoir water volume using satellite imagery and converting it into water yield is actively underway, and if the water yield prediction model can predict the water yield of agricultural reservoirs with high accuracy, it can enable effective operation of measured and unmeasured reservoirs. In this study, we compared and analyzed the ability of recurrent neural network structure and transformer structure time series models to predict water yield for the top 48 agricultural reservoirs by water volume. The 11 years of water yield data from 2013 to 2023 were constructed, and the 2013-2021 data were separated into training data, 2022 data were used as validation data, and 2023 data were used as test data, and the mean absolute error (MAE), root mean square error (RMSE), and correlation coefficient evaluation metrics were used to quantitatively evaluate the water yield prediction ability. Instead of univariate time series forecasting using only historical water storage rate as an input variable, multivariate time series forecasting reflecting meteorological and seasonal effects as input variables was used, The RMSE averages of 48 reservoirs for 20-day forecasts of temporal fusion transformer (TFT), a time series model with a transformer structure, and gated recurrent unit (GRU), a time series model with a recurrent neural network structure, were 7.115% and 17.428%, respectively, showing that the TFT model has a better ability to predict water storage in the medium term than the GRU model.

Keywords: Agricultural reservoir, Water storage, Time series forecasting, Artificial intelligence

1. 서론

우리나라와 같이 1년간 강우패턴이 불규칙한 지역에서는 안정적인 농작물 생산과 여름철 홍수 피해를 예방하기 위한 농업용 저수지의 운용이 중요하며(Lee, 2014), 기상적 영향과 계절적 영향을 반영한 인공지능 기반의 저수율 예측 기술을 이용한다면 가뭄시기의 농업수 공급 문제와 여름철 홍수피해에 대한 효과적대응을 통해 불규칙한 기상 조건 속에서도 적절한 농업용 저수지 운용이 가능하다. Ahn et al. (2004)은 autoregressive integratedmoving averagemodel (ARIMA) 모형을 이용한 저수량 예측과 자기회귀오차모형을 이용한 농업용 저수지의 저수량 예측 및 저수량에 영향을 주는 변수인 저수량, 평균 온도, 최고온도, 관개면적, 풍속, 습도 간의 관계를 분석하였다. Kim et al. (2018)은 형태학적 특성이 같은 저수지를 군집화 후 각 군집 특성을 반영한 회귀식을 개발 및 가뭄지수의 영향을 고려한 전망 저수율을 생산하였다. Kim et al. (2022)은 서포트벡터머신(support vector machine, SVM), 랜덤 포레스트(Random Forest, RF), 인공신경망 모형(artificial neural network, ANN) 등을 활용하여 1개월에서 3개월 최저 평균 저수율을 예측하였다.

Joh and Lee (2023)는 이동저수지를 대상으로 과거 저수율만을 입력변수로 사용한 단변량 long short-termmemory (LSTM) (Hochreiter and Schmidhuber, 1997; Olah, 2015) 및 강수 등의 기상 변수와 계절 변수를 추가한 다변량 LSTM을 사용하여 1일 후부터 5일 후까지의 저수율을 예측했으며 단변량 LSTM은 1일, 3일, 5일 후 저수율을 RMSE 1.04%, 2.52%, 4.18% 오차로 예측을 수행했고 다변량 LSTM은 저수율을 RMSE 0.98%, 1.95%, 2.76% 오차로 예측하여 다변량 시계열모델의 유용성을 입증하였으며, Park et al. (2024)은 전라북도 400여 개 저수지를 대상으로 기본 순방향 신경망을 이용하여 저수지의 복잡한 수문학·기후학적 환경요인을 반영한 저수율 예측 모델을 학습 및 검증하였으며 예측 모델의 각 입력 특성이 전체 성능에 끼치는 영향을 분석하였다. 현재 우리나라의 17,100여 개 농업용 저수지 중(Korea Rural Community Corporation, 2024) 13,700 여 곳의(80.1%) 소형 저수지 대상으로는 체계적인 계측이 이루어지지 않고 있으나, 원격탐사는 미계측되는 소형 저수지에 대한 좋은 방법론이 될 수 있다. Sentinel-1 합성개구레이더 영상과 딥러닝 모델을 이용하여 국내 농업용 저수지의 수표 면적을 탐지한 연구(Choi et al., 2023)와 Sentinel-1 합성개구레이더 영상을 이용한 댐 및 저수지의 수표 면적 모니터링 및 회귀 방정식을 사용하여 수체면적을 저장량으로 추정한 연구(Kim et al., 2024)결과에 저수율 예측기술을 접목한다면 미계측저수지에 대한 효과적 운영이 가능할 것으로 보인다.

그러나 앞선 연구에서의 순환신경망 구조 시계열모델과 순방향 신경망을 이용한 저수율예측은 1일 후의 예측치를 다시 다음 1일 후 예측에 재귀적으로 사용하므로 중기예측에서의 정확도가 감소하게 되는데, 트랜스포머 구조의 시계열예측 모델인 temporal fusion transformer (TFT) (Lim et al., 2021; Kang, 2024)는 강수량, 기온과 같이 관측해야만 알 수 있는 관측 변수와 date of year (DOY)와 같은 시점과 관계없이 알 수 있는 변수를 구분하고 이를 학습에 반영하여 기존 모델보다 정확도 높은 중·장기 예측 정확도를 가지며 재귀적 방식이 아닌 트랜스포머 기반의 multi-head attention 기법을 사용하여 순환신경망 구조의 시계열예측 모델이 가지는 한계점을 개선할 수 있다. 이에 본 연구는 과거 저수율, 기상 변수, 계절 변수를 입력변수로 한 다변량 순환신경망 및 트랜스포머 시계열모델을 이용하여 전국의 주요 농업용 저수지의 저수율을 단기 및 중기간 예측하며, 검증통계량을 사용한 모델 간 결과에 대한 비교 분석과 중기간 저수율 예측에서 트랜스포머 모델의 사용 가능성을 검토하는 것을 목적으로 한다.

2. 연구 자료 및 방법

2.1. 학습 데이터셋 구성

2.1.1. 연구 대상 저수지

본 연구는 우리나라의 농업용 저수지 중 유효저수량 기준 상위 48개(Table 1)를 대상으로 하며 전체 경지면적 중 논의 비율이 높은 충청도, 전라도에 집중적으로 분포해 있다(Fig. 1). 저수율데이터는 농촌용수종합정보시스템(Rural AgriculturalWater Resource Information System, RAWRIS)을 통해 제공받았으며 2013년부터 2023년까지의 11년 일일 단위 저수율데이터를 추출하여 연구에 사용하였고 결측치의 경우 선형보간을 적용하여 연구에 사용하였다.

Figure 1. Representative 48 agricultural reservoirs in South Korea.

Table 1 . List of top 48 agricultural reservoirs by effective water storage in South Korea.

ReservoirEffective water storage (m3)LatitudeLongitudeReservoirEffective water storage (m3)LatitudeLongitude
Najuho107,000,00034.964126.852Geumgwang12,047,00036.996127.326
Jangseongho99,707,20035.359126.814Suyang11,834,10035.228126.686
Damyangho76,669,60035.382127.001Giheung11,630,00037.225127.111
Daea57,688,00035.982127.301Dongsang11,241,00035.982127.301
Yedang46,070,20036.653126.805Yongrim11,188,00035.616127.559
Tapjeong34,940,00036.17127.151Gui10,878,00035.744127.119
Donghwa31,348,00035.544127.539Dongbu10,733,80036.106126.777
Hadong30,336,90035.156127.8Heungdeok9,946,00035.556126.714
Seongju28,150,00035.903128.154Bomun9,834,00035.834129.253
Gyeongcheon (Gyeongsangbuk-do)27,200,00036.691128.311Wonnam8,690,20036.864127.564
Baekgok26,372,00036.86127.417Dalchang8,649,00035.645128.462
Gyeongcheon (Jeonrabuk-do)25,346,00036.028127.227Myogok8,441,00036.526129.346
Deokdong22,537,10035.823129.285Otae8,291,00036.504128.123
Idong20,906,00037.111127.201Gung8,222,00036.521127.647
Cheongcheon20,753,10036.365126.61Biryong8,163,00036.482127.809
Cheongho18,045,00035.734126.697Seobu7,989,00036.117126.699
Togyo17,412,00038.263127.277Gabuk7,979,00035.785128.001
Gosam15,217,00037.076127.281Jangnam7,920,80035.552127.486
Bulgap15,200,00035.229126.506Gopung7,821,80036.78126.61
Gwangjuho15,198,00035.204126.985Daegok7,712,00035.684127.622
Obong14,329,10037.71128.819Daedong7,502,10035.118126.507
Maengdong13,910,00036.892127.57Neung7,315,60035.854126.836
Chopyeong13,853,20036.817127.514Geumbong7,259,20036.352128.853
Okgu12,826,10035.906126.666Sucheong7,001,00035.553126.93


2.1.2. 강수량 데이터셋 구성

다변량 시계열모델의 입력자료로 사용된 일 강수 자료는 우리나라 기상청의 국지예보모델(Local Data Assimilation and Prediction System, LDAPS) 실황장의 강수량 데이터를 사용하였다. LDAPS는 영국 통합모델(UnifiedModel, UM)로부터 3시간 간격으로 경계장을 제공받아서 일 4회 48시간 예측을 수행하는 수치예보 시스템이며, UM은 기상관측소, 라디오존데, 위성정보 등의 소스에서 획득한 데이터를 바탕으로 예보를 수행한다(Korea Meteorological Administration, 2024). 본 연구에서는 3시간 단위의 LDAPS 자료로부터 강수량 레이어를 추출한 뒤 일 강수로 합성하여 모델 입력변수로 사용하였다.

2.2. 시계열 인공지능 모델링

2.2.1. 순환신경망 구조의 시계열 모델

본 연구에서는 순환신경망 구조의 시계열 모델로 LSTM과 gated reccurrent unit (GRU) (Cho et al., 2014)을 사용하였다(Fig. 2). 초기 시계열예측에는 Vanilla recurrent neural network (RNN)가 주로 사용되어 왔지만 기울기 소실 문제 및 역전파 과정의 비효율성 문제가 있었고 이후 Vanilla RNN 방식의 단점을 보완하기 위한 LSTM과 내부구조를 간소화한 GRU가 제안되었다. LSTM은 입력게이트, 출력게이트, 망각게이트, 셀의 내부구조를 통해 장기 종속성을 강화하여 과거 데이터 중 중요한 정보를 예측에 활용하며, GRU는 LSTM의 입력게이트, 출력게이트, 망각게이트를 축소하여 업데이트게이트와 리셋게이트로 구성함으로써 더 적은 파라미터를 학습에 사용하여 훈련 시간을 단축할 수 있다는 장점이 있다. LSTM과 GRU의 내부 게이트 구조 차이로 인해 어떤 Task를 대상으로 예측을 수행하는지에 따라 높은 정확도를 가지는 모델이 다르며, 내부구조가 더 복잡한 LSTM의 경우 일반적으로 더 복잡한 문제에 대한 예측 능력이 더 우수하며 GRU의 경우 LSTM에 비해 더 간단한 문제에 대한 예측 능력이 우수하다.

Figure 2. Structure of recurrent neural network time series forecasting model for water storage rate used in this study: (a) LSTM and (b) GRU.

2.2.2. 트랜스포머 구조의 시계열 모델

본 연구에서 사용한 트랜스포머 구조의 시계열모델인 TFT는 기존 순환신경망 구조의 모델들이 가지는 한계인 먼 미래에 대한 예측의 불확실성을 해결하였다. TFT는 관측해야만 알 수 있는 관측 변수(Observed Inputs)와 시점과 관계없이 알 수 있는 변수인 알고있는 변수(Known Inputs)를 구분하며 학습 및 예측단계에서 알고있는 변수를 LSTMDecoder, GRN 계층에 통과시켜 직접적으로 사용하여 중·장기에 대해서도 높은 정확도로 예측을 수행한다. 또한 1일 후 예측을 다음날 예측의 입력변수로 사용하는 재귀적 방식의 메커니즘 대신 트랜스포머 기반의 multi-head attention 메커니즘을 사용하여 Abhay, Alberto 순환신경망 구조의 시계열모델에 비해 중·장기 예측에서 강점을 가진다(Fig. 3).

Figure 3. Structure of temporal fusion transformer time series forecasting model for water storage rate used in this study (Srivastava and Cano, 2022).

2.2.3. 다변량 시계열 인공지능 학습조건

시계열 예측모델의 타깃변수는 일일 저수율이며 이를 예측하기 위한 설명변수로 LSTM, GRU 모델은 과거 저수율, 일 강수, DOY를 사용하였고(Table 2) 파이썬(Python)의 Keras 라이브러리를 사용하여 구현하였다(Keras, 2024). TFT 모델은 관측 변수로는 과거저수율과 강수량, 알고있는 변수로는DOY, week of year (WOY), month of year (MOY)를 사용하였으며(Table 2), 파이썬의 PyTorch Forecasting 라이브러리를 사용하여 구현하였다(PyTorch Forecasting, 2024).

Table 2 . Input variables for each multivariate time forecasting model.

ModelInput variables
LSTMDaily water storage rate, Daily precipitation, DOY
GRUDaily water storage rate, Daily precipitation, DOY
TFTDaily water storage rate, Daily precipitation, DOY, WOY, MOY

LSTM: long short term memory, GRU: gated recurrent unit, TFT: temporal fusion transformer, DOY: date of year, WOY: week of year, MOY: month of year..



훈련데이터 셋의 기간은 2013년부터 2021년, 검증용 데이터셋의 기간은 2022년 평가용 데이터셋의 기간은 2023년으로 설정하였으며 시계열 모델링에서 중요한 하이퍼파라미터(hyperparameter)인 과거 며칠의 데이터를 사용하여 미래를 예측할 것인가는 과거저수율, 일 강수, DOY를 입력변수로 하여 모델 훈련을 진행하는 상황에서의 반복 실험을 통해 설정한 과거 20일로 설정하였고 반복 학습을 통해 여러 하이퍼파라미터의 최적화를 수행하였다(Table 3).

Table 3 . Hyperparameter setting for each multivariate time forecasting model.

ModelLSTMGRUModelTFT
Number of epoch100100Number of epoch100
Number of steps2020Number of steps20
Number of layer100120Number of layers160
Learning rate0.00010.0001Learning rate0.0001
Batch size3232Batch size64
Activation functionReLUReLUAttention head size8

LSTM: long short term memory, GRU: gated recurrent unit, TFT: temporal fusion..


3. 연구 결과 및 토의

3.1. 저수율 데이터 분석

농업용 저수지의 1년간 저수율 패턴을 살펴보면, 5월 이전 비농업시기에 100%의 저수율에 가깝게 물을 저장하고 있다가 농업 시기가 오면 하류 농경지의 관개수 공급을 목적으로 농업수를 방류한다(Song et al., 2022). 그 후 강우량이 많아지는 장마철에는 증가한 물 유입량과 줄어든 농업수의 수요로 인하여 저수율이 급격하게 상승하게 된다. 이때 시설 피해를 막기 위해 저장과 방류를 반복하는 홍수 통제 기간을 가지고 이후 수확이 끝나면 다음 해 농업시기를 대비하여 물을 저장하는 패턴을 확인할 수 있다(Fig. 4).

Figure 4. Trends in yearly water storage for agricultural reservoirs reflecting agricultural water supply and flood control periods.

대상 저수지들이 일반적인 농업용 저수지의 패턴을 따라가는지를 확인하기 위하여 48개 저수지의 월별 저수율평균, 표준편차, 평균 일간절대편차(mean of absolute daily difference, MADD)를 산출하였다(Table 4). 저수율의 월별 통계를 살펴보면, 비농업시기인 1월부터 4월 그리고 11월과 12월의 저수율은 농업시기인 5월에서 10월의 저수율에 비해 높은 것을 알 수 있다. 또한 장마철에 해당하는 7월과 8월의 경우 저장과 방류를 반복하는 홍수조절 기간의 영향으로 인해 평균일간절대편차가 다른 달에 비해 큰 값을 가지는 것을 확인할 수 있다. 계절적 특성이 뚜렷하게 나타나는 농업용 저수지의 저수율을 대상으로 한 시계열 모델링에서 계절 변수의 입력변수 반영은 모델 학습에 있어서 중요하다.

Table 4 . Monthly average statistics of water storage rate from 2013 to 2023.

MonthAverage (%p)SDMADD
176.07619.8560.679
277.62419.7340.705
380.30418.6310.678
483.64016.2020.679
575.38816.1811.478
654.93816.7181.389
761.77020.4941.799
862.63420.3471.630
965.91421.2851.321
1069.26421.1930.933
1171.08120.8560.848
1274.40720.1520.753

SD: standard deviation, MADD: mean of daily difference of water storage rate change..



3.2. 모델 간 저수율 예측능력 비교

3.2.1. 단기예측 비교

본 연구에서는 3일 후까지의 예측 기간을 단기 예측으로 정의하였고 4일부터 20일 후 까지를 중기 예측으로 정의하여 순환신경망 구조 및 트랜스포머 구조 시계열모델의 저수율 예측 능력을 비교하였다(Table 5). 1일 후 예측에서는 저수지마다 차이가 있지만 GRU와 TFT의 예측 능력이 가장 우수하였고 2일 후, 3일 후 예측에서는 TFT의 저수율 예측 통계량이 LSTM과 GRU의 저수율 예측 통계량보다 우수하였다.

Table 5 . Monthly average statistics of water storage rate from 2013 to 2023.

After dayReservoirLSTMGRUTFT
MAEd)RMSECCMAERMSECCMAERMSECC
1Najuho1.0591.7670.9920.8651.4030.9951.3471.7720.994
Jangseongho1.3081.7900.9961.0471.8050.9961.1991.7880.996
Damyangho4.0885.4400.9950.9251.4440.9981.8612.2790.998
Daea1.5473.0080.9211.3872.9680.9210.9732.7410.929
Yedang2.7264.2780.9742.4183.9680.9782.5053.8990.978
Tapjeong1.7813.4800.9471.7213.5570.9442.0223.6990.941
Donghwa1.9182.8140.9750.9881.5540.9911.2541.8500.988
Hadong1.0861.6320.9641.0111.5480.9681.4512.2430.936
Seongju1.5153.0990.9151.3722.9440.9251.9433.4950.889
Gyeongcheon1.1532.1380.9821.2042.2150.9811.8073.2860.961
Baekgok1.0622.1250.9881.0281.8280.9911.3872.1920.990
Gyeongcheon1.7923.2670.9481.6663.1000.9522.0103.8610.923
Deokdong1.1251.8070.9760.9771.6430.9800.8691.8220.975
Idong1.8842.8280.9891.7122.6660.9892.1883.6960.983
Cheongcheon1.4792.2630.9851.3152.2550.9851.5592.6640.979
Cheongho0.7531.1330.9840.7451.1630.9840.9721.3380.979
Togyo0.9051.1900.9900.9201.2160.9901.0481.4400.990
Gosam1.2352.5210.9901.0592.3400.9921.5143.1040.990
Bulgap3.8875.1640.9761.6072.4220.9912.9914.0830.984
Gwangjuho1.5283.1750.9341.3112.9010.9461.7773.3440.920
Obong1.9732.8400.9891.3081.9040.9952.1563.1080.989
Maengdong2.7393.6360.9751.5422.0880.9921.9532.4330.990
Chopyeong1.2012.5920.9691.2452.7050.9661.5193.1610.956
Okgu1.5052.1390.9801.1961.7660.9871.3281.9650.983
Geumgwang1.5142.6710.9861.6332.8400.9865.0906.3560.958
Suyang4.2735.6990.9752.4654.2890.9782.5674.1420.977
Giheung2.1422.9620.9791.7412.6110.9803.0985.2250.967
Dongsang2.1713.5350.9781.8813.5260.9781.9443.5650.978
Yongrim6.5389.5930.9694.2946.0120.9892.0832.6380.996
Gui1.7453.5420.9391.5463.1140.9532.3804.6500.899
Dongbu1.4872.7790.9571.4932.9790.9512.0643.5230.927
Heungdeok2.7145.1750.8462.5935.1910.8532.8566.1300.779
Bomun1.2552.1780.9881.3812.2810.9882.2433.7510.972
Wonnam1.1972.4580.9751.1422.1650.9841.4273.0580.969
Dalchang1.5372.6420.9391.7552.7860.9381.8003.1320.912
Myogok1.1422.4190.9791.0802.2900.9811.7563.1890.964
Otae1.4892.4490.9871.2332.1340.9911.2702.0470.991
Gung1.2861.8920.9810.9131.5090.9831.2161.7240.977
Biryong7.1399.8340.8574.1566.4420.9283.4055.8920.935
Seobu1.9123.2210.9521.8753.2400.9541.8033.1460.949
Gabuk1.3722.3600.9451.2602.3100.9461.4742.8730.925
Jangnam1.5372.7450.9251.5412.3160.9481.5353.0770.899
Gopung1.6882.8380.9831.1712.1530.9902.0273.5310.973
Daegok1.1301.8950.9741.3062.0120.9701.6312.6670.945
Daedong2.1733.8440.9762.2433.7220.9772.1443.7590.977
Neung0.7851.3570.9410.6201.1360.9580.8701.4800.928
Geumbong1.4342.4820.9931.6562.6910.9921.8783.5960.986
Sucheong3.3255.3560.9452.8844.7060.9613.7945.4570.946
2Najuho1.5782.6940.9811.2062.1030.9881.2041.7230.994
Jangseongho1.8402.4410.9931.3562.2630.9941.3771.9560.995
Damyangho4.7656.2670.9931.1161.7170.9971.7432.1760.998
Daea2.1603.4980.8941.7703.3230.9020.9792.6030.936
Yedang3.9665.7910.9523.5255.2000.9652.5693.9510.978
Tapjeong2.5064.2040.9272.7184.7660.8982.0323.7700.939
Donghwa2.9994.0450.9431.6422.5160.9771.1521.7350.988
Hadong1.4582.0490.9441.5412.0940.9441.4132.1770.938
Seongju2.4604.0950.8572.1813.7750.8791.9163.3930.893
Gyeongcheon1.6822.8740.9671.6672.8550.9701.7943.2640.961
Baekgok1.7253.2320.9731.5302.9350.9761.3482.1080.990
Gyeongcheon2.4483.8280.9282.1673.5120.9391.9523.7830.925
Deokdong1.8282.5960.9571.2801.9050.9730.9111.8450.975
Idong2.6573.7750.9822.3063.4040.9842.2253.8040.984
Cheongcheon2.5053.6010.9641.8772.7560.9781.5232.6610.979
Cheongho1.1801.6980.9651.1941.8570.9631.0171.3830.978
Togyo1.4021.8420.9761.2731.6500.9821.1571.5390.990
Gosam1.8333.2090.9851.6022.9210.9891.6623.3110.990
Bulgap5.4977.1030.9472.2653.2160.9842.8893.9790.984
Gwangjuho2.5273.9700.9022.1253.6640.9181.7023.2590.924
Obong2.4163.3610.9861.9442.5210.9922.4603.6090.987
Maengdong3.3834.4330.9642.1922.8720.9863.0143.7080.978
Chopyeong1.8433.3750.9491.8673.6470.9371.5283.4570.947
Okgu2.8403.7080.9412.3673.4470.9511.2451.8510.985
Geumgwang2.3183.6550.9762.6124.0020.9775.0396.3700.957
Suyang6.4037.7260.9533.2955.0940.9692.8374.3160.975
Giheung3.9054.9030.9532.8933.9880.9533.2735.3050.964
Dongsang4.0185.9090.9393.9786.6710.9181.9653.6380.977
Yongrim9.16013.0830.9345.3097.2040.9822.5533.0930.995
Gui3.0225.1650.8772.2133.6650.9362.3714.7360.895
Dongbu1.9013.3020.9431.8013.3620.9392.0023.4160.932
Heungdeok3.7906.2310.7783.7786.9850.7512.8436.0510.785
Bomun2.1673.4020.9721.6902.6930.9852.2333.7210.972
Wonnam1.7063.4590.9511.7463.1430.9751.3072.9130.972
Dalchang1.9953.1710.9112.4173.6390.9011.7463.1250.912
Myogok1.6563.0160.9671.3862.5400.9771.6803.1690.964
Otae2.5934.1110.9632.2173.7920.9681.4112.2630.990
Gung1.6882.3640.9691.2161.8540.9761.1651.7070.978
Biryong10.30414.0790.7166.0018.8620.8723.2675.8460.935
Seobu2.8404.4760.9242.8604.6370.9341.7653.0670.951
Gabuk2.0573.0370.9181.8842.9550.9181.4802.8350.926
Jangnam1.7943.2160.9002.0523.1510.9191.5663.0830.898
Gopung2.5154.1830.9631.7072.8200.9832.0123.3770.975
Daegok1.5062.3260.9621.6202.4050.9571.6172.6410.946
Daedong3.2755.0200.9613.4504.9300.9602.1393.7300.977
Neung1.1421.8680.8950.7071.1720.9550.8751.4650.930
Geumbong1.8562.8170.9911.7822.8070.9911.8493.5470.987
Sucheong5.5378.5150.8673.8305.3130.9573.9515.5070.946
3Najuho1.9993.3280.9701.4422.4990.9831.3322.0310.990
Jangseongho2.3443.1410.9881.5852.5720.9921.6752.3870.993
Damyangho5.4657.1470.9891.2591.9080.9961.9692.4000.997
Daea2.7594.0640.8612.0583.5970.8891.0192.5350.940
Yedang4.9237.1080.9284.3066.0650.9522.7044.1140.976
Tapjeong3.3605.2380.8993.6486.1150.8392.1463.9670.932
Donghwa3.9615.1790.9042.2683.3980.9611.1811.7690.988
Hadong1.9302.6940.9122.0882.8260.9131.4302.1790.937
Seongju3.3665.1820.7882.9434.7530.8131.9213.4470.887
Gyeongcheon2.2013.5970.9492.1073.5770.9571.8253.2960.961
Baekgok2.3584.1030.9581.9983.8740.9611.4342.2170.988
Gyeongcheon3.1484.6190.8942.6004.0360.9221.9873.8290.924
Deokdong2.5763.4970.9371.4962.0860.9690.9541.8850.973
Idong3.3464.7330.9742.8044.1530.9772.3393.9120.984
Cheongcheon3.7045.4850.9262.4383.3600.9681.5452.6930.979
Cheongho1.6662.5250.9281.6982.7580.9221.0801.4510.976
Togyo2.0092.7140.9471.6422.1710.9721.2261.6060.989
Gosam2.3623.9560.9782.2493.8360.9831.7713.4000.990
Bulgap6.7938.6460.9122.8053.9080.9763.0344.1250.983
Gwangjuho3.6495.2120.8412.9144.5350.8791.7413.2200.926
Obong3.1214.3050.9792.5443.1540.9892.8524.1500.983
Maengdong3.9275.0550.9552.5933.3210.9823.3373.9440.973
Chopyeong2.5704.4380.9192.4954.6860.8971.6403.8080.935
Okgu4.2055.3140.8823.8375.5440.8781.3001.9140.984
Geumgwang3.1074.8920.9623.5705.3750.9655.0276.3430.956
Suyang8.3789.7830.9163.9755.7380.9603.1194.5840.972
Giheung5.7727.1160.9124.2235.8810.9003.4355.4250.961
Dongsang6.3329.3630.8486.88010.8390.7802.3083.9170.973
Yongrim10.75015.0010.9056.0448.0260.9763.1183.7340.992
Gui4.6107.4780.7753.0594.7020.9012.4424.8210.891
Dongbu2.4164.2010.9152.0593.7510.9271.9593.3640.934
Heungdeok5.0857.6070.6885.1359.1600.6182.9316.1330.778
Bomun3.1034.7770.9461.9482.9800.9832.3063.7670.971
Wonnam2.1164.2780.9262.3944.4210.9651.2412.8460.973
Dalchang2.4623.6480.8823.0044.5920.8551.7523.1850.908
Myogok2.2643.9880.9441.6342.8960.9721.7033.2070.963
Otae3.6375.5460.9313.1235.2490.9371.7122.7550.984
Gung2.1703.0220.9511.5332.3010.9661.1941.7510.977
Biryong12.60317.6130.5796.97810.1690.8283.2555.8360.934
Seobu3.8366.2030.8803.9436.5660.9041.7433.0530.951
Gabuk2.8813.9800.8832.6283.9540.8731.5292.8690.923
Jangnam2.0443.6750.8762.5054.1000.8931.6083.1190.894
Gopung3.3385.7870.9342.2683.8090.9702.0643.3980.974
Daegok1.9442.8440.9461.8502.7240.9451.6132.6390.946
Daedong4.6206.8870.9334.7386.8470.9272.3003.8000.976
Neung1.5572.6230.8150.7701.2230.9520.8841.4720.930
Geumbong2.2653.3280.9871.8342.8740.9911.9293.6620.986
Sucheong7.89211.9340.7564.9816.3040.9504.1635.6810.942

LSTM: long short term memory, GRU: gated recurrent unit, TFT: temporal fusion transformer, MAE: mean absolute error, RMSE: root mean squared error, CC: correlation.



1일 후에서 3일 후 예측에 대한 48개 저수지의 통계량 평균(Table 6)을 살펴보면 1일 후 예측에서는 GRU 저수율 예측값의 MAE, RMSE, 상관계수가 각각 1.551, 2.664, 0.971로 가장 우수하였으나 2일 후 예측에서는 TFT 저수율 예측값의MAE, RMSE, 상관계수가 각각 1.942, 3.238, 0.958로 가장 우수하였으며, 3일 후 예측에서 또한 TFT 저수율 예측값의MAE, RMSE, 상관계수가 각각 2.047, 3.357, 0.956으로 가장 우수하였다.

Table 6 . Monthly average statistics of water storage rate from 2013 to 2023.

AfterdayLSTMGRUTFT
MAERMSECCMAERMSECCMAERMSECC
11.9633.1680.9651.5512.6640.9711.9053.1930.958
22.8884.3070.9392.2323.5130.9521.9423.2380.958
33.8115.5590.9022.8944.4420.9272.0473.3570.956

LSTM: long short term memory, GRU: gated recurrent unit, TFT: temporal fusion transformer, MAE: mean absolute error, RMSE: root mean squared error, CC: correlation coefficient..



3.2.2. 중기예측 비교

순환신경망 구조 및 트랜스포머 구조 시계열모델을 사용하여 4일 후부터 20일 후까지의 농업용 저수지 저수율을 예측하였고 모델 간 48개 저수지의 평균 통계량을 비교해 보았다(Table 7).

Table 7 . Monthly average statistics of water storage rate from 2013 to 2023.

AfterdayLSTMGRUTFT
MAERMSECCMAERMSECCMAERMSECC
44.7046.8210.8613.5485.3910.8992.1953.5390.952
55.5598.0590.8194.1866.3180.8722.3723.7610.948
66.3899.2750.7774.8087.2090.8462.5593.9980.942
77.20210.4780.7375.4068.0650.8242.7534.2460.936
87.98511.6400.7015.9898.8900.8042.9504.5080.928
98.71412.7160.6706.5649.6940.7863.1454.7680.920
109.39213.6950.6437.12010.4730.7703.3335.0230.912
1110.03014.5930.6197.66011.2330.7553.5135.2660.903
1210.63415.4300.5978.19711.9840.7413.6915.5010.894
1311.20716.2180.5778.72812.7210.7263.8605.7240.886
1411.75816.9720.5599.25813.4490.7124.0255.9400.876
1512.29717.7040.5419.78914.1680.6974.1866.1510.867
1612.82318.4140.52510.30814.8600.6834.3456.3530.858
1713.33319.0980.51010.81515.5370.6684.5006.5560.849
1813.82819.7530.49611.30316.1890.6554.6476.7480.839
1914.31220.3830.48211.77516.8150.6424.7896.9360.829
2014.78120.9900.46912.23017.4180.6304.9247.1150.819

LSTM: long short term memory, GRU: gated recurrent unit, TFT: temporal fusion transformer, MAE: mean absolute error, RMSE: root mean squared error, CC: correlation.



다음날 예측값을 그 다음 날 예측의 입력으로 활용하는 재귀적 방식의 LSTM과 GRU 모델의 경우 먼 일수를 예측할수록 TFT 모델보다 통계량이 더욱 저하되는 것을 확인할 수 있다. GRU 모델을 이용한 저수율예측에 대하여 4일 후 와 20일 후 예측값에 대한 통계량 차이를 살펴보면MAE, RMSE, 상관계수가 각각 8.682%, 12.027%, 0.269 저하됐지만 TFT 모델을 이용한 4일 후와 20일 후 예측값에 대한 통계량 차이를 살펴보면 MAE, RMSE, 상관계수 각각 2.729%, 3.576%, 0.133으로 먼 미래 일수를 예측할 때 GRU 모델의 통계량 저하 폭이 큰 것을 알 수 있다. 또한 GRU와 TFT 모델의 20일 후 저수율 예측 통계량의 차이를 살펴보면 MAE, RMSE, 상관계수 각각 7.306%, 10.303%, 0.189로 중기 예측에 있어서 트랜스포머 구조 시계열예측모델이 순환신경망 구조 시계열예측 모델보다 우수한 것을 알 수 있다. 정성적 평가를 위해 청호저수지를 대상으로 2023년 1년의 모델별 1, 5, 10, 15, 20일 후 예측값을 실측값과 비교해 보았고 TFT 모델을 사용한 저수율 예측값과 실측값의 관계를 나타내는 산점도를 확인하였다(Fig. 6).


1일 후 예측에서는 LSTM, GRU, TFT 모델 모두 실측값과 유사하게 예측값이 산출되었다. 또한 농업용 저수지를 대상으로 한 저수율 예측에 있어서 완만한 값보다는 급격히 상승하는 저수율 값을 높은 정확도로 예측하는 것이 중요한데, 강우량이 많은 7월과 8월의 급격한 저수율 상승 값과 홍수조절기간 동안에 대해서도 모델별 저수율 예측값이 실측값에 가까운 모습을 확인 할 수 있다. 5일 후 예측에서는 TFT를 사용한 저수율 예측값의 경우 7월과 8월에 대해서도 실측값에 가깝게 예측하는 모습을 확인할 수 있으나 LSTM과 GRU를 사용한 저수율 예측값은 7월과 8월을 제외하면 비교적 실측값에 가깝지만, 강우량이 많은 7월과 8월에 대해서는 1일 후 예측에 비해 실측값과의 차이가 큰 것을 확인할 수 있다. 10일 후 예측 및 그 이후 일 수에 대한 저수율 예측에서는 LSTM과 GRU를 사용한 저수율 예측값과 실측값의 차이가 5일 후 예측의 경우보다 더 커지며, TFT 모델을 사용한 저수율 예측값의 경우 7월과 8월에 대한 예측값이 실측값의 경향은 따라가지만, 1일 후 및 5일 후와 비교했을 때는 실측값과의 차이가 큰 것을 알 수 있다. 또한 예측하는 일수가 늘어남에 따라 TFT 모델을 사용한 저수율 예측값의MAE, RMSE, 상관계수 통계량이 점진적으로 저하되는 모습을 확인할 수 있다. 추가로 다변량 시계열모델의 입력변수 중요도(Deotte, 2021)를 살펴보았으며(Table 8), LSTM과 GRU의 경우 과거 저수율이 각각 89.7%, 89.2%로 가장 중요한 변수임을 알 수 있었고 일 강수량의 변수중요도는 각각 5.1%와 5.3%로 나타나, 그 다음으로 중요한 변수임을 알 수 있었다.

Table 8 . Feature importance for the multivariate LSTM and GRU models to predict daily water.

RankVariablePercentageCategory
LSTMGRU
1Daily water storage89.7%89.2%Water source
2DOY5.2%5.5%Period
3Daily Precipitation5.1%5.3%Weather

DOY: date of year..



관측변수와 알고있는 변수를 구분하여 학습하는 TFT의 변수중요도를 살펴보면 과거저수율이 82.5% 일 강수량이 4.1%의 변수중요도를 보여주었고 계절 변수인 DOY, MOY, WOY의 변수중요도가 각각 5.4%, 4.2%, 3.8%로 나타났다(Table 9). TFT의 DOY 변수중요도는 5.6%로 LSTM, GRU모델의DOY 변수중요도인 5.2%, 5.5%보다 조금 더 높았고 알고있는 변수에 해당하는 DOY, MOY, WOY의 변수중요도 합은 13.6%로 TFT모델이 학습 과정에서 알고있는 변수에 해당하는 계절 변수에 큰 가중치를 두어 중기 예측에서 LSTM과 GRU에 비해 저수율을 안정적으로 예측했다.

Table 9 . Decoder Feature importance for the multivariate TFT model to predict daily water storage rate.

RankVariablePercentageCategory
1Daily water storage82.5%Water source
2DOY5.6%Period
3MOY4.2%Period
4Daily Precipitation3.9%Weather
5WOY3.8%Period

DOY: date of year, MOY: month of year, WOY: week of year..


4. 결론

우리나라의 저수량 기준 상위 48개 농업용 저수지를 대상으로 순환신경망 구조 및 트랜스포머 구조 시계열모델을 사용하여 기상 영향과 계절 영향을 입력변수로 반영한 저수율예측을 수행하였다. 1일 후 예측에서는 저수지 별 차이는 존재하였으나 GRU와 TFT 모델을 사용한 저수율 통계량이 가장 우수하였고 48개 저수지의 통계량 평균을 살펴보았을 때 GRU 모델을 사용한 저수율 예측값의 통계량이 가장 우수하였다. 그러나 2일 후와 3일 후 그리고 중기 예측에서는 TFT 모델을 이용한 저수율 예측값의 통계량이 가장 우수하였으며 20일 후 예측에서의GRU와 TFT 모델에 대한 통계량 차이는MAE, RMSE, 상관계수 7.306%, 10.303%, 0.189로 중기 예측에서 트랜스포머 구조 시계열모델의 우수성을 확인하였다. LSTM, GRU, TFT 모두 과거저수율을 가장 중요한 변수로 학습하였으며 특히 TFT는 알고있는 변수에 해당하는 계절 변수에 더 큰 가중치를 두어 학습하여 중기 예측에 있어서 LSTM과 GRU에 비해 안정적으로 저수율을 예측했다. 본 연구의 결과와 더불어 수표 면적 탐지연구 및 저수지의 수표면적을 저수율로 변환하는 등의 원격탐사 방법론과 함께 전국의 미계측저수지를 대상으로 단기 및 중기간 저수율을 예측함으로써, 농업 및 방재 분야에 유용한 정보를 제공할 수 있을 것으로 기대된다.

사사

본 연구는 국토교통부/국토교통과학기술진흥원의 지원으로 수행되었음(과제번호 RS-2022-00155763).

Conflict of Interest

No potential conflict of interest relevant to this article was reported.

Fig 1.

Figure 1.Representative 48 agricultural reservoirs in South Korea.
Korean Journal of Remote Sensing 2024; 40: 1149-1162https://doi.org/10.7780/kjrs.2024.40.6.1.22

Fig 2.

Figure 2.Structure of recurrent neural network time series forecasting model for water storage rate used in this study: (a) LSTM and (b) GRU.
Korean Journal of Remote Sensing 2024; 40: 1149-1162https://doi.org/10.7780/kjrs.2024.40.6.1.22

Fig 3.

Figure 3.Structure of temporal fusion transformer time series forecasting model for water storage rate used in this study (Srivastava and Cano, 2022).
Korean Journal of Remote Sensing 2024; 40: 1149-1162https://doi.org/10.7780/kjrs.2024.40.6.1.22

Fig 4.

Figure 4.Trends in yearly water storage for agricultural reservoirs reflecting agricultural water supply and flood control periods.
Korean Journal of Remote Sensing 2024; 40: 1149-1162https://doi.org/10.7780/kjrs.2024.40.6.1.22

Fig 5.

Figure 5.Result of time forecasting models to predict the daily water storage rate of Cheongho Reservoir in 2023. (a) Each model’s time series of 1, 5, 10, 15, and 20 daily predictions. (b) Scatterplot of 1, 5, 10, 15, and 20 daily prediction.
Korean Journal of Remote Sensing 2024; 40: 1149-1162https://doi.org/10.7780/kjrs.2024.40.6.1.22

Table 1 . List of top 48 agricultural reservoirs by effective water storage in South Korea.

ReservoirEffective water storage (m3)LatitudeLongitudeReservoirEffective water storage (m3)LatitudeLongitude
Najuho107,000,00034.964126.852Geumgwang12,047,00036.996127.326
Jangseongho99,707,20035.359126.814Suyang11,834,10035.228126.686
Damyangho76,669,60035.382127.001Giheung11,630,00037.225127.111
Daea57,688,00035.982127.301Dongsang11,241,00035.982127.301
Yedang46,070,20036.653126.805Yongrim11,188,00035.616127.559
Tapjeong34,940,00036.17127.151Gui10,878,00035.744127.119
Donghwa31,348,00035.544127.539Dongbu10,733,80036.106126.777
Hadong30,336,90035.156127.8Heungdeok9,946,00035.556126.714
Seongju28,150,00035.903128.154Bomun9,834,00035.834129.253
Gyeongcheon (Gyeongsangbuk-do)27,200,00036.691128.311Wonnam8,690,20036.864127.564
Baekgok26,372,00036.86127.417Dalchang8,649,00035.645128.462
Gyeongcheon (Jeonrabuk-do)25,346,00036.028127.227Myogok8,441,00036.526129.346
Deokdong22,537,10035.823129.285Otae8,291,00036.504128.123
Idong20,906,00037.111127.201Gung8,222,00036.521127.647
Cheongcheon20,753,10036.365126.61Biryong8,163,00036.482127.809
Cheongho18,045,00035.734126.697Seobu7,989,00036.117126.699
Togyo17,412,00038.263127.277Gabuk7,979,00035.785128.001
Gosam15,217,00037.076127.281Jangnam7,920,80035.552127.486
Bulgap15,200,00035.229126.506Gopung7,821,80036.78126.61
Gwangjuho15,198,00035.204126.985Daegok7,712,00035.684127.622
Obong14,329,10037.71128.819Daedong7,502,10035.118126.507
Maengdong13,910,00036.892127.57Neung7,315,60035.854126.836
Chopyeong13,853,20036.817127.514Geumbong7,259,20036.352128.853
Okgu12,826,10035.906126.666Sucheong7,001,00035.553126.93

Table 2 . Input variables for each multivariate time forecasting model.

ModelInput variables
LSTMDaily water storage rate, Daily precipitation, DOY
GRUDaily water storage rate, Daily precipitation, DOY
TFTDaily water storage rate, Daily precipitation, DOY, WOY, MOY

LSTM: long short term memory, GRU: gated recurrent unit, TFT: temporal fusion transformer, DOY: date of year, WOY: week of year, MOY: month of year..


Table 3 . Hyperparameter setting for each multivariate time forecasting model.

ModelLSTMGRUModelTFT
Number of epoch100100Number of epoch100
Number of steps2020Number of steps20
Number of layer100120Number of layers160
Learning rate0.00010.0001Learning rate0.0001
Batch size3232Batch size64
Activation functionReLUReLUAttention head size8

LSTM: long short term memory, GRU: gated recurrent unit, TFT: temporal fusion..


Table 4 . Monthly average statistics of water storage rate from 2013 to 2023.

MonthAverage (%p)SDMADD
176.07619.8560.679
277.62419.7340.705
380.30418.6310.678
483.64016.2020.679
575.38816.1811.478
654.93816.7181.389
761.77020.4941.799
862.63420.3471.630
965.91421.2851.321
1069.26421.1930.933
1171.08120.8560.848
1274.40720.1520.753

SD: standard deviation, MADD: mean of daily difference of water storage rate change..


Table 5 . Monthly average statistics of water storage rate from 2013 to 2023.

After dayReservoirLSTMGRUTFT
MAEd)RMSECCMAERMSECCMAERMSECC
1Najuho1.0591.7670.9920.8651.4030.9951.3471.7720.994
Jangseongho1.3081.7900.9961.0471.8050.9961.1991.7880.996
Damyangho4.0885.4400.9950.9251.4440.9981.8612.2790.998
Daea1.5473.0080.9211.3872.9680.9210.9732.7410.929
Yedang2.7264.2780.9742.4183.9680.9782.5053.8990.978
Tapjeong1.7813.4800.9471.7213.5570.9442.0223.6990.941
Donghwa1.9182.8140.9750.9881.5540.9911.2541.8500.988
Hadong1.0861.6320.9641.0111.5480.9681.4512.2430.936
Seongju1.5153.0990.9151.3722.9440.9251.9433.4950.889
Gyeongcheon1.1532.1380.9821.2042.2150.9811.8073.2860.961
Baekgok1.0622.1250.9881.0281.8280.9911.3872.1920.990
Gyeongcheon1.7923.2670.9481.6663.1000.9522.0103.8610.923
Deokdong1.1251.8070.9760.9771.6430.9800.8691.8220.975
Idong1.8842.8280.9891.7122.6660.9892.1883.6960.983
Cheongcheon1.4792.2630.9851.3152.2550.9851.5592.6640.979
Cheongho0.7531.1330.9840.7451.1630.9840.9721.3380.979
Togyo0.9051.1900.9900.9201.2160.9901.0481.4400.990
Gosam1.2352.5210.9901.0592.3400.9921.5143.1040.990
Bulgap3.8875.1640.9761.6072.4220.9912.9914.0830.984
Gwangjuho1.5283.1750.9341.3112.9010.9461.7773.3440.920
Obong1.9732.8400.9891.3081.9040.9952.1563.1080.989
Maengdong2.7393.6360.9751.5422.0880.9921.9532.4330.990
Chopyeong1.2012.5920.9691.2452.7050.9661.5193.1610.956
Okgu1.5052.1390.9801.1961.7660.9871.3281.9650.983
Geumgwang1.5142.6710.9861.6332.8400.9865.0906.3560.958
Suyang4.2735.6990.9752.4654.2890.9782.5674.1420.977
Giheung2.1422.9620.9791.7412.6110.9803.0985.2250.967
Dongsang2.1713.5350.9781.8813.5260.9781.9443.5650.978
Yongrim6.5389.5930.9694.2946.0120.9892.0832.6380.996
Gui1.7453.5420.9391.5463.1140.9532.3804.6500.899
Dongbu1.4872.7790.9571.4932.9790.9512.0643.5230.927
Heungdeok2.7145.1750.8462.5935.1910.8532.8566.1300.779
Bomun1.2552.1780.9881.3812.2810.9882.2433.7510.972
Wonnam1.1972.4580.9751.1422.1650.9841.4273.0580.969
Dalchang1.5372.6420.9391.7552.7860.9381.8003.1320.912
Myogok1.1422.4190.9791.0802.2900.9811.7563.1890.964
Otae1.4892.4490.9871.2332.1340.9911.2702.0470.991
Gung1.2861.8920.9810.9131.5090.9831.2161.7240.977
Biryong7.1399.8340.8574.1566.4420.9283.4055.8920.935
Seobu1.9123.2210.9521.8753.2400.9541.8033.1460.949
Gabuk1.3722.3600.9451.2602.3100.9461.4742.8730.925
Jangnam1.5372.7450.9251.5412.3160.9481.5353.0770.899
Gopung1.6882.8380.9831.1712.1530.9902.0273.5310.973
Daegok1.1301.8950.9741.3062.0120.9701.6312.6670.945
Daedong2.1733.8440.9762.2433.7220.9772.1443.7590.977
Neung0.7851.3570.9410.6201.1360.9580.8701.4800.928
Geumbong1.4342.4820.9931.6562.6910.9921.8783.5960.986
Sucheong3.3255.3560.9452.8844.7060.9613.7945.4570.946
2Najuho1.5782.6940.9811.2062.1030.9881.2041.7230.994
Jangseongho1.8402.4410.9931.3562.2630.9941.3771.9560.995
Damyangho4.7656.2670.9931.1161.7170.9971.7432.1760.998
Daea2.1603.4980.8941.7703.3230.9020.9792.6030.936
Yedang3.9665.7910.9523.5255.2000.9652.5693.9510.978
Tapjeong2.5064.2040.9272.7184.7660.8982.0323.7700.939
Donghwa2.9994.0450.9431.6422.5160.9771.1521.7350.988
Hadong1.4582.0490.9441.5412.0940.9441.4132.1770.938
Seongju2.4604.0950.8572.1813.7750.8791.9163.3930.893
Gyeongcheon1.6822.8740.9671.6672.8550.9701.7943.2640.961
Baekgok1.7253.2320.9731.5302.9350.9761.3482.1080.990
Gyeongcheon2.4483.8280.9282.1673.5120.9391.9523.7830.925
Deokdong1.8282.5960.9571.2801.9050.9730.9111.8450.975
Idong2.6573.7750.9822.3063.4040.9842.2253.8040.984
Cheongcheon2.5053.6010.9641.8772.7560.9781.5232.6610.979
Cheongho1.1801.6980.9651.1941.8570.9631.0171.3830.978
Togyo1.4021.8420.9761.2731.6500.9821.1571.5390.990
Gosam1.8333.2090.9851.6022.9210.9891.6623.3110.990
Bulgap5.4977.1030.9472.2653.2160.9842.8893.9790.984
Gwangjuho2.5273.9700.9022.1253.6640.9181.7023.2590.924
Obong2.4163.3610.9861.9442.5210.9922.4603.6090.987
Maengdong3.3834.4330.9642.1922.8720.9863.0143.7080.978
Chopyeong1.8433.3750.9491.8673.6470.9371.5283.4570.947
Okgu2.8403.7080.9412.3673.4470.9511.2451.8510.985
Geumgwang2.3183.6550.9762.6124.0020.9775.0396.3700.957
Suyang6.4037.7260.9533.2955.0940.9692.8374.3160.975
Giheung3.9054.9030.9532.8933.9880.9533.2735.3050.964
Dongsang4.0185.9090.9393.9786.6710.9181.9653.6380.977
Yongrim9.16013.0830.9345.3097.2040.9822.5533.0930.995
Gui3.0225.1650.8772.2133.6650.9362.3714.7360.895
Dongbu1.9013.3020.9431.8013.3620.9392.0023.4160.932
Heungdeok3.7906.2310.7783.7786.9850.7512.8436.0510.785
Bomun2.1673.4020.9721.6902.6930.9852.2333.7210.972
Wonnam1.7063.4590.9511.7463.1430.9751.3072.9130.972
Dalchang1.9953.1710.9112.4173.6390.9011.7463.1250.912
Myogok1.6563.0160.9671.3862.5400.9771.6803.1690.964
Otae2.5934.1110.9632.2173.7920.9681.4112.2630.990
Gung1.6882.3640.9691.2161.8540.9761.1651.7070.978
Biryong10.30414.0790.7166.0018.8620.8723.2675.8460.935
Seobu2.8404.4760.9242.8604.6370.9341.7653.0670.951
Gabuk2.0573.0370.9181.8842.9550.9181.4802.8350.926
Jangnam1.7943.2160.9002.0523.1510.9191.5663.0830.898
Gopung2.5154.1830.9631.7072.8200.9832.0123.3770.975
Daegok1.5062.3260.9621.6202.4050.9571.6172.6410.946
Daedong3.2755.0200.9613.4504.9300.9602.1393.7300.977
Neung1.1421.8680.8950.7071.1720.9550.8751.4650.930
Geumbong1.8562.8170.9911.7822.8070.9911.8493.5470.987
Sucheong5.5378.5150.8673.8305.3130.9573.9515.5070.946
3Najuho1.9993.3280.9701.4422.4990.9831.3322.0310.990
Jangseongho2.3443.1410.9881.5852.5720.9921.6752.3870.993
Damyangho5.4657.1470.9891.2591.9080.9961.9692.4000.997
Daea2.7594.0640.8612.0583.5970.8891.0192.5350.940
Yedang4.9237.1080.9284.3066.0650.9522.7044.1140.976
Tapjeong3.3605.2380.8993.6486.1150.8392.1463.9670.932
Donghwa3.9615.1790.9042.2683.3980.9611.1811.7690.988
Hadong1.9302.6940.9122.0882.8260.9131.4302.1790.937
Seongju3.3665.1820.7882.9434.7530.8131.9213.4470.887
Gyeongcheon2.2013.5970.9492.1073.5770.9571.8253.2960.961
Baekgok2.3584.1030.9581.9983.8740.9611.4342.2170.988
Gyeongcheon3.1484.6190.8942.6004.0360.9221.9873.8290.924
Deokdong2.5763.4970.9371.4962.0860.9690.9541.8850.973
Idong3.3464.7330.9742.8044.1530.9772.3393.9120.984
Cheongcheon3.7045.4850.9262.4383.3600.9681.5452.6930.979
Cheongho1.6662.5250.9281.6982.7580.9221.0801.4510.976
Togyo2.0092.7140.9471.6422.1710.9721.2261.6060.989
Gosam2.3623.9560.9782.2493.8360.9831.7713.4000.990
Bulgap6.7938.6460.9122.8053.9080.9763.0344.1250.983
Gwangjuho3.6495.2120.8412.9144.5350.8791.7413.2200.926
Obong3.1214.3050.9792.5443.1540.9892.8524.1500.983
Maengdong3.9275.0550.9552.5933.3210.9823.3373.9440.973
Chopyeong2.5704.4380.9192.4954.6860.8971.6403.8080.935
Okgu4.2055.3140.8823.8375.5440.8781.3001.9140.984
Geumgwang3.1074.8920.9623.5705.3750.9655.0276.3430.956
Suyang8.3789.7830.9163.9755.7380.9603.1194.5840.972
Giheung5.7727.1160.9124.2235.8810.9003.4355.4250.961
Dongsang6.3329.3630.8486.88010.8390.7802.3083.9170.973
Yongrim10.75015.0010.9056.0448.0260.9763.1183.7340.992
Gui4.6107.4780.7753.0594.7020.9012.4424.8210.891
Dongbu2.4164.2010.9152.0593.7510.9271.9593.3640.934
Heungdeok5.0857.6070.6885.1359.1600.6182.9316.1330.778
Bomun3.1034.7770.9461.9482.9800.9832.3063.7670.971
Wonnam2.1164.2780.9262.3944.4210.9651.2412.8460.973
Dalchang2.4623.6480.8823.0044.5920.8551.7523.1850.908
Myogok2.2643.9880.9441.6342.8960.9721.7033.2070.963
Otae3.6375.5460.9313.1235.2490.9371.7122.7550.984
Gung2.1703.0220.9511.5332.3010.9661.1941.7510.977
Biryong12.60317.6130.5796.97810.1690.8283.2555.8360.934
Seobu3.8366.2030.8803.9436.5660.9041.7433.0530.951
Gabuk2.8813.9800.8832.6283.9540.8731.5292.8690.923
Jangnam2.0443.6750.8762.5054.1000.8931.6083.1190.894
Gopung3.3385.7870.9342.2683.8090.9702.0643.3980.974
Daegok1.9442.8440.9461.8502.7240.9451.6132.6390.946
Daedong4.6206.8870.9334.7386.8470.9272.3003.8000.976
Neung1.5572.6230.8150.7701.2230.9520.8841.4720.930
Geumbong2.2653.3280.9871.8342.8740.9911.9293.6620.986
Sucheong7.89211.9340.7564.9816.3040.9504.1635.6810.942

LSTM: long short term memory, GRU: gated recurrent unit, TFT: temporal fusion transformer, MAE: mean absolute error, RMSE: root mean squared error, CC: correlation.


Table 6 . Monthly average statistics of water storage rate from 2013 to 2023.

AfterdayLSTMGRUTFT
MAERMSECCMAERMSECCMAERMSECC
11.9633.1680.9651.5512.6640.9711.9053.1930.958
22.8884.3070.9392.2323.5130.9521.9423.2380.958
33.8115.5590.9022.8944.4420.9272.0473.3570.956

LSTM: long short term memory, GRU: gated recurrent unit, TFT: temporal fusion transformer, MAE: mean absolute error, RMSE: root mean squared error, CC: correlation coefficient..


Table 7 . Monthly average statistics of water storage rate from 2013 to 2023.

AfterdayLSTMGRUTFT
MAERMSECCMAERMSECCMAERMSECC
44.7046.8210.8613.5485.3910.8992.1953.5390.952
55.5598.0590.8194.1866.3180.8722.3723.7610.948
66.3899.2750.7774.8087.2090.8462.5593.9980.942
77.20210.4780.7375.4068.0650.8242.7534.2460.936
87.98511.6400.7015.9898.8900.8042.9504.5080.928
98.71412.7160.6706.5649.6940.7863.1454.7680.920
109.39213.6950.6437.12010.4730.7703.3335.0230.912
1110.03014.5930.6197.66011.2330.7553.5135.2660.903
1210.63415.4300.5978.19711.9840.7413.6915.5010.894
1311.20716.2180.5778.72812.7210.7263.8605.7240.886
1411.75816.9720.5599.25813.4490.7124.0255.9400.876
1512.29717.7040.5419.78914.1680.6974.1866.1510.867
1612.82318.4140.52510.30814.8600.6834.3456.3530.858
1713.33319.0980.51010.81515.5370.6684.5006.5560.849
1813.82819.7530.49611.30316.1890.6554.6476.7480.839
1914.31220.3830.48211.77516.8150.6424.7896.9360.829
2014.78120.9900.46912.23017.4180.6304.9247.1150.819

LSTM: long short term memory, GRU: gated recurrent unit, TFT: temporal fusion transformer, MAE: mean absolute error, RMSE: root mean squared error, CC: correlation.


Table 8 . Feature importance for the multivariate LSTM and GRU models to predict daily water.

RankVariablePercentageCategory
LSTMGRU
1Daily water storage89.7%89.2%Water source
2DOY5.2%5.5%Period
3Daily Precipitation5.1%5.3%Weather

DOY: date of year..


Table 9 . Decoder Feature importance for the multivariate TFT model to predict daily water storage rate.

RankVariablePercentageCategory
1Daily water storage82.5%Water source
2DOY5.6%Period
3MOY4.2%Period
4Daily Precipitation3.9%Weather
5WOY3.8%Period

DOY: date of year, MOY: month of year, WOY: week of year..


References

  1. Ahn, T., Lee, H., Lee, J. Y., Yi, J. E., and Yun, Y. N., 2004. A reservoir operation plan coupled with storage forecasting models in existing agricultural reservoir. Journal of Korea Water Resources Association, 37(1), 77-86. https://doi.org/10.3741/JKWRA.2004.37.1.077
  2. Cho, K., Van Merriënboer, B., Gulcehre, C., Bahdanau, D., Bougares, F., Schwenk, H., and Bengio, Y., 2014. Learning phrase representations using RNN encoder-decoder for statistical machine translation. arXiv preprint arXiv:1406.1078. https://doi.org/10.48550/arXiv.1406.1078
  3. Choi, S., Youn, Y., Kang, J., Kim, S., Jung, Y., and Im, Y., et al, 2023. Waterbody detection for the reservoirs in South Korea using Swin Transformer and Sentinel-1 images. Korean Journal of Remote Sensing, 39(5-3), 949-965. https://doi.org/10.7780/kjrs.2023.39.5.3.6
  4. Deotte, C., 2021. LSTM feature importance. Available online: https://www.kaggle.com/code/cdeotte/lstm-feature-importance (accessed on Nov. 20, 2024)
  5. Hochreiter, S., and Schmidhuber, J., 1997. Long short-term memory. Neural Computation, 9(8), 1735-1780. https://doi.org/10.1162/neco.1997.9.8.1735
  6. Joh, S., and Lee, Y., 2023. Prediction of water storage rate for agricultural reservoirs using univariate and multivariate LSTM models. Korean Journal of Remote Sensing, 39(5-4), 1125-1134. https://doi.org/10.7780/kjrs.2023.39.5.4.6
  7. Kang, T., 2024. Developing a transformer model for time series data forecasting. Available online: https://daddynkidsmakers.blogspot.com/2024/04/blog-post.html (accessed on Nov. 20, 2024)
  8. Keras, 2024. Keras - Simple. Flexible. Powerful. Available online: https://keras.io (accessed on Nov. 20, 2024)
  9. Kim, J. U., Jung, C. G., Lee, J. W., and Kim, S. J., 2018. Development of Naïve-Bayes classification and multiple linear regression model to predict agricultural reservoir storage rate based on weather forecast data. Journal of Korea Water Resources Association, 51(10), 839-852. https://doi.org/10.3741/JKWRA.2018.51.10.839
  10. Kim, S., Bae, S., Lee, S., and Jang, M., 2022. Monthly agricultural reservoir storage forecasting using machine learning. Atmosphere, 13(11), 1887. https://doi.org/10.3390/atmos13111887
  11. Kim, W., Lee, S., and Choi, M., 2024. A comparative study of remotely sensed reservoir monitoring across multiple land cover types. Science of The Total Environment, 948, 174678. https://doi.org/10.1016/j.scitotenv.2024.174678
  12. Korea Meteorological Administration, 2024. Local data assimilation and prediction system (LDAPS) - File set. Available online: https://data.kma.go.kr/data/rmt/rmtList.do?code=340&pgmNo=65 (accessed on Nov. 20, 2024)
  13. Korea Rural Community Corporation, 2024. RAWRIS: Rural Agricultural Water Resource Information System. Available online: https://rawris.ekr.or.kr/%20main.do (accessed on Nov. 20, 2024)
  14. Lee, C., 2014. Current status and issues with the agricultural reservoir checklist and condition assessment. Magazine of the Korean Society of Agricultural Engineers, 56(3), 32-37.
  15. Lim, B., Arık, S. Ö., Loeff, N., and Pfister, T., 2021. Temporal fusion transformers for interpretable multi-horizon time series forecasting. International Journal of Forecasting, 37(4), 1748-1764. https://doi.org/10.1016/j.ijforecast.2021.03.012
  16. Olah, C., 2015. Understanding LSTM networks. Available online: https://colah.github.io/posts/2015-08-Understanding-LSTMs (accessed on Nov. 20, 2024)
  17. Park, H., Yoon, J., Lee, H., and Yang, H., 2024. Analyzing the impact of multivariate inputs on deep learning-based reservoir level prediction and approaches for mid to long-term forecasting. The Transactions of the Korea Information Processing Society, 13(4), 199-207. https://doi.org/10.3745/TKIPS.2024.13.4.199
  18. PyTorch Forecasting, 2024. PyTorch Forecasting Documentation. Available online: https://pytorch-forecasting.readthedocs.io/en/stable (accessed on Nov. 20, 2024)
  19. Song, J., Her, Y., and Kang, M., 2022. Estimating reservoir inflow and outflow from water level observations using expert knowledge: Dealing with an ill-posed water balance equation in reservoir management. Water Resources Research, 58(4), e2020WR028183. https://doi.org/10.1029/2020WR028183
  20. Srivastava, A., and Cano, A., 2022. Analysis and forecasting of rivers pH level using deep learning. Progress in Artificial Intelligence, 11, 181-191. https://doi.org/10.1007/s13748-021-00270-2
KSRS
December 2024 Vol. 40, No.6, pp. 1005-989

Metrics

Share

  • line

Related Articles

Korean Journal of Remote Sensing