Original Article

Journal of Korean Society of Disaster and Security. 31 December 2020. 75-92
https://doi.org/10.21729/ksds.2020.13.4.75

ABSTRACT


MAIN

  • 1. Introduction

  • 2. Methodology

  •   2.1 Support Vector Regression Model

  •   2.2 Long Short-Term Memory Model

  •   2.3 Gated Recurrent Units Model

  •   2.4 Model Evaluation Criteria

  •   2.5 Autocorrelation, Extended Autocorrelation and Partial Autocorrelation

  • 3. Study Area and Data Collection

  •   3.1 Study Area

  •   3.2 Input Data

  •   3.3 t-test(p-value) and pearson correlation analysis

  • 4. Model Setup

  •   4.1 Sensitivity Analysis

  •   4.2 Model Cases

  • 5. Results and Analysis

  • 6. Conclusions

1. Introduction

최근 기후변화로 인해 국내에서는 가뭄 및 홍수피해가 빈번히 발생하고 있고, 가뭄빈도의 경우 여름철은 감소한 반면, 겨울과 봄철에는 가뭄이 오히려 심화되는 추세를 보이는 등 강수량이 시간적·지역적으로 편중되는 경향으로 변화하고 있다(KMA, 2020). 최근에는 가뭄·갈수로 인해 심화되고 있는 용수부족 현상에 대한 대비가 필요하며 종합적인 하천수 사용관리 및 물이용 계획 수립이 필요한 실정이다. 이에 국내에서는 수자원장기종합계획을 통해 물수지 분석을 실시하여 물의 과부족 또는 가용한 물을 정량적으로 평가한다(Lee et al., 2005). 물수지 분석은 하천의 불규칙한 과거 자연유량과 장래 용수 수요의 시기별 분포를 비교, 검토하여 물 부족 여부를 판단하는 계산 과정으로 물수지 분석 시 공급은 자연유량과 댐에서의 용수공급량, 그리고 용수공급 후의 회귀수량으로 이루어지며, 물의 수요는 생활, 공업, 농업, 그리고 하천유지 용수량으로 구성된다(MOLIT, 2016). 여기서, 회귀수량은 물 수요를 충족시킨 후 다시 하천으로 유입되는 물의 양으로 일반적으로 생활·공업용수의 회귀율은 65%, 농업용수의 회귀율은 35%로 하천수 사용관리 측면에서 회귀수량의 정확한 예측은 중요하다(MOLIT, 2016). 그러나 일반적인 회귀수량은 용수별 일률적인 회귀율을 적용하여 산정하는 문제점이 있다(Choi et al., 2018; Oh et al., 2019). 따라서 본 연구에서는 회귀수량 중 하수종말처리장의 방류량에 대하여 정확한 예측을 수행하기 위하여 인공신경망 등의 기계학습 모형을 적용하였다.

기계학습 모형은 국내·외 다양한 분야에서 적용되고 있으며, 수자원 분야에서는 시계열 특성을 갖는 수위, 취수량, 유입량 등의 예측에 사용되고 있다(Yoo et al., 2020; Choi et al., 2019; Lee et al., 2020; Lee et al., 2018; Yoo et al., 2019). 시계열 특성을 갖는 자료 예측에 사용되는 기계학습 모형에는 다양한 모형이 있으며, 국내의 경우, Yeo et al.(2010)은 ANN (Artificial Neural Network) 모형을 이용하여 수위예측을 수행하였고, Tran and Song(2017)은 미국 미국 텍사스 트리니티 강의 수위예측을 수행하기 위하여 RNN(Recurrent Neural Network), RNN-BPTT(Backpropagation Through Time), LSTM(Long Short-Term Memory) 모형을 사용하였으며, 이 중 LSTM 모형이 좋은 성능을 나타냈다고 하였다. Choi et al.(2019)는 SVM(Support Vector Machine)모형을 적용하여 취수량 예측을 하였으며, 1~2달에 대해 중·단기 예측을 수행하였을 경우 예측 정확도가 증가하는 것을 확인하였다. 국외의 경우, Chen et al.(2012)은 하천에서 ANN 기반의 예측 모형을 구축하여 하천의 수위예측을 수행하고 예측정확도를 검토하였다. Zhang et al.(2018)은 LSTM 모형을 적용하여 장기간에 걸친 수위 예측 시, 기존의 FFNN(Feed-Forward Neural Network)모형 보다 예측성능이 뛰어나다는 것을 확인하였다. Zhang et al.(2018)은 하수도 수위 예측을 위하여 순환신경망의 하나인 LSTM 과 GRU(Gated Recurrent Unit) 모형을 적용하였고 GRU 모형의 성능이 우수함을 확인하였다. 선행연구 조사를 통하여 시계열 자료예측에 사용되는 인공신경망의 경향이 ANN 및 RNN 모형에서 최근에는 LSTM, SVM, GRU 모형을 많이 사용하는 것으로 판단되었다. 그러나 LSTM 모형 및 GRU 모형은 극값에서 과소 또는 과대추정되는 경향이 있고(Hochreiter, 1998; Pascanu et al., 2012; Agarap, 2018; Yoo et al., 2020) SVM 모형은 학습에 사용된 자료의 수에 대한 의존도가 높아 예측기간이 증가할수록 예측 정확도가 떨어진다(Choi et al., 2019)는 한계점이 있어 예측하고자 하는 변수의 특성에 따라 적합한 모형 선정이 필요하다.

따라서 본 연구에서는 하수종말처리장의 방류량 예측에 적합한 모형을 선정하기 위하여 최근에 많이 사용되는 LSTM, SVM, GRU 모형을 적용하였다. 청평댐 유역에 있는 하수종말처리장의 2012~2018년의 방류량자료 및 수문자료를 활용하였고, 오차 분석을 통하여 방류량 예측의 적합한 모형을 선정하였다.

2. Methodology

2.1 Support Vector Regression Model

Vapnik(1995)에 의해 제안된 서포트 벡터 머신(Support Vector Machine, SVM)은 결정 경계(decision boundary)를 통하여 자료를 분류하는 지도 학습(supervised learning) 모형이다. SVM 모형은 선형 분류와 비선형 분류에서 사용되고, 비선형 분류를 수행하기 위해서 주어진 데이터에 Kernel 함수를 이용하여 데이터의 오분류를 최소화 하는 최적의 결정경계를 선정한다. SVM에 주로 사용되는 Kernel 함수의 종류로는 linear, polynomial, rbf(radial basis function), sigmoid 등이 있으며, 각 데이터 분포 특성에 따라 적합한 Kernel 함수 적용을 통해 비선형 분류를 수행 할 수 있다.

SVR(Support Vector Regression)은 SVM 모형을 회귀 문제에 적용한 방법으로, 주어진 데이터를 Kernel 함수를 통해 결정경계를 구하고 이를 통해 예측하는 기법이다. SVR 모형을 학습하기 위한 기본 식은 아래 Eq. (1)(2)와 같다.

(1)
f(x)=wTx+b
(2)
Min.12|w|2+Ci=1n(ξi+ξi*),s.t.yi-wxi-b<ε+ξi

여기서, x는 입력, y는 출력, f(x)는 모든 입력 x에 대해 출력 y를 가장 적합하게 예측하는 함수를 의미하며, ξ,ξ*는 여유 변수, C는 계수, ε은 실제 값과 예측 값의 허용 오차를 의미한다.

2.2 Long Short-Term Memory Model

LSTM(Long Short-Term Memory) 모형은 Hochreiter와 Schmidhuber에 의하여 제안되었다. Recurrent Neural Network (RNN) 모형에서 발생하는 최적화 오류(optimization hurdle) 및 오차경사의 기울기 소실(vanishing gradient)문제를 해결하고 장기적인 시간에 따른 종속성을 파악하는데 효과적이여서 시계열 자료 예측에 사용되고 있고 다양한 분야에서 연구되고 있다(Hochreiter and Schmidhuber, 1998; Olah, 2018).

LSTM 모형은 RNN 모형과 달리 핵심요소는 시간에 따라 상태(state)를 유지할 수 있는 메모리이동 셀(cell)과 셀 안과 밖으로 데이터의 이동을 조절하는 세 개의 게이트이다(Greff et al., 2016). LSTM 모형은 특정 시간의 상태(ht)를 갱신하기 위해 셀(cell)의 개념을 도입하여 입력과 현재까지의 상태를 이용하여 내부에 가지고 있는 정보의 갱신여부를 판단한다. 그리고 이 셀의 데이터 이동을 조절하기 위한 게이트의 종류로는 입력게이트(input gate, it), 망각게이트(forget gate, ft) 그리고 출력게이트(output gate, ot)로 구성되어 있다. 망각 게이트 ft는 아래의 Eq. (3)으로 나타낼 수 있으며, 이전 cell의 출력인 ht-1과 현재의 입력인 xt를 시그모이드 함수(sigmoid function)에 적용해 0과 1사이의 값을 얻어 이 값을 현재 상태와 요소끼리 곱하게 되며, 그 과정에서 입력정보의 유지여부를 선택한다.

(3)
ft=σ(Wf·[ht-1,xt]+bf)

여기서, σ는 시그모이드 활성화함수를 나타내며, Wf는 망각게이트의 가중치, bf는 망각게이트의 편향(bias)을 나타낸다.

입력게이트 itEq. (4)와 같이 표현하며, 어떤 입력정보를 셀에 저장할 것인지를 결정하게 되며 시그모이드 함수를 이용하여 어떤 정보를 업데이트할지 결정하고 쌍곡탄젠트 함수(hyperbolic tangent function)를 이용하여 새로운 셀 상태를 업데이트 시 사용되는 후보 셀(Nt)을 아래의 Eq. (5)를 통하여 생성하게 된다.

(4)
it=σ(Wi·[ht-1,xt]+bi)
(5)
Nt=tanh(Wn·[ht-1,xt]+bn)

여기서, Wi,Wn는 각각 입력게이트와 후보 셀의 가중치, bi,bn는 입력게이트와 후보 셀의 편향을 나타낸다.

다음으로 과거의 셀 상태(Ct-1)와 후보 셀(Nt)을 아래 Eq. (6)과 같이 조합하여 현재의 셀 상태(Ct)를 업데이트 하게 된다.

(6)
Ct=ft·Ct-1+it·Nt

최종적으로 출력게이트 ot는 아래의 Eqs. (7)(8)과 같이 시그모이드 함수를 이용해서 셀 상태의 어느 부분을 출력하고자 하는지 결정한다. 최종적으로는 쌍곡탄젠트 함수를 이용하여 활성화된 셀 상태(Ct)와의 곱을 통해 특정 시점의 상태(ht)를 업데이트 한다.

(7)
ot=σ(Wo·[ht-1,xt]+bo)
(8)
ht=ot·tanh(Ct)

여기서, Wo는 출력게이트의 가중치, bo는 출력게이트의 편향을 나타낸다.

2.3 Gated Recurrent Units Model

GRU(Gated Recurrent Units)모형은 Cho et al.(2014)에 의하여 소개되었으며, LSTM 모형과 같이 게이트 개념을 적용한 순환 신경망의 한 종류이나 게이트의 제어 방식에서 LSTM 모형과 차이가 있다(Cho et al., 2014). GRU 모형은 두 개의 게이트를 이용하여 입력을 연산하며 각각의 게이트는 갱신게이트(update gate, ut)와 초기화게이트(reset gate, rt)로 구성되어 있다. 갱신게이트는 과거의 셀 상태와 현재의 셀 상태 중 어느 값에 더 가중치를 주는가를 결정해 주며 Eq. (9)로 나타낼 수 있다.

(9)
ut=σ(Wu·[Ct-1,xt]+bu)

여기서, σ는 시그모이드 활성함수, Wu는 갱신게이트의 가중치, Ct-1은 과거 시점의 셀 상태, xt는 현재 시점의 입력 값, bu는 갱신게이트의 편향을 의미한다.

이 후 초기화게이트를 통하여 과거 시점의 셀 상태를 새로운 현재 시점의 출력 후보 셀에 얼마나 포함시킬 것인지 결정한다. 초기화게이트는 Eq. (10)(11)로 나타낼 수 있다.

(10)
Nt=tanh(Wc·[rtCt-1,xt]+bc)
(11)
rt=σ(Wr·[Ct-1,xt]+br)

여기서, Nt는 현재 시점의 출력 후보 셀 상태, Wcbc는 가중치 및 편향을 나타내고, rt는 초기화게이트 값, 는 행렬의 성분 곱 연산을 의미한다. Wrbr은 초기화 게이트의 가중치 및 편향을 의미한다.

최종적으로 연산한 결과를 토대로 현재시점의 출력 셀 상태를 결정하며 Eq. (12)로 나타낸다.

(12)
Ct=utNt+(1-ut)Ct-1

갱신게이트 값 ut가 현재 시점의 출력 후보 셀 상태와 과거 시점의 출력 셀 상태의 반영 비율을 결정하는 것을 확인할 수 있으며, ut값은 시그모이드 함수의 출력 값이기 때문에 범위가 0 ~ 1 사이임을 확인 할 수 있다.

2.4 Model Evaluation Criteria

본 연구에서는 구축된 입력자료를 개발된 방류량예측모형을 통하여 학습시킨 후 예측 결과 자료에 대한 통계분석을 수행하여 모형의 정확도를 비교하고자 한다. 모형의 정확도 판단 지표로는 평균제곱근오차(Root Mean Square Error, RMSE)와 Nash-Sutcliffe 계수(NSE)를 사용하여 비교하였다. 각각의 오차 및 계수 산정식은 Eqs. (13)(14)와 같다.

(13)
RMSE=i=1n(Oi-Pi)2n
(14)
NSE=(1-i=1n(Oi-Pi)2i=1n(Oi-Oi¯)2)×100

여기서 OiPi는 각각 시간 t에 대하여 관측방류량과 예측방류량을 나타내며, O¯i는 관측 방류량의 평균 값, n은 총 관측 자료의 수를 의미한다.

RMSE의 경우 값이 0에 가까워질수록 예측 값과 관측 값이 잘 일치한다고 판단할 수 있으며, NSE의 경우 값이 1에 가까워질수록 예측 값과 관측 값이 비교적 잘 맞는 것을 확인할 수 있다.

2.5 Autocorrelation, Extended Autocorrelation and Partial Autocorrelation

시계열 자료의 경우, 연속적인 일련의 관측 값들이 서로 상관되어 있을 수 있으며, 시계열의 시차 값(lagged values) 사이의 선형 관계를 측정하는 지표에는 자기상관계수, 편자기상관계수 및 확장자기상관계수가 있다. 자기상관계수는(ak) 임의 시간 t에서 특정 시차 k를 두고 두 관측치, ytyt-k가 얼마나 관련 있는 지를 나타내는 척도로 Eq. (15)와 같다.

(15)
ak=t=k+1n(yt-y¯)(yt-k-y¯)t=1n(yt-y¯)2

여기서, t는 임의 시간, k는 자기상관함수의 시차, n은 관측 값의 수, y¯는 관측 값의 평균값을 의미한다.

편자기상관계수(ϕkk)는 특정 시차 k 이외의 모든 시차를 갖는 관측치 들로부터의 영향력을 배제한 가운데 특정한 두 관측치, ytyt-k가 얼마나 관련이 있는 지를 나타내는 척도로 Eq. (16)과 같다.

(16)
ϕkk=ak-j=1k-1ϕk-1,jak-j1-j=1k-1ϕk-1,jaj

여기서, j는 임의 시간, k는 자기상관함수의 시차, ϕk,j=ϕ(k-1),j-θkkϕ(k-1),(k-j)를, θkk=cor(e^t,e^t-k), e^t,e^t-k는 시차 k에 대해서 yt-1,,yt-(k-1)ytyt-k를 회귀분석 한 잔차(residual)를 의미한다.

확장자기상관계수(eat,k,j)는 ARMA 모형 적용 시 ARMA 모형의 가역성(reversibility) 문제를 회피하기 위한 방법으로 Eq. (17)(18)과 같다.

(17)
eat,k,j=yt-ξ~1yt-1--ξ~kyt-k
(18)
eat,k,j=e^t-i=1jλie^t-i

여기서, t는 임의 시간, k,j는 시차, yt,yt-k는 임의 시간 t 및 특정 시차 k의 관측 값, ξ~k,λi는 회귀분석을 통한 추정회귀계수, e^t,e^t-k는 시차 k에 대해서 yt-1,,yt-(k-1)ytyt-k를 회귀분석 한 잔차(residual)를 의미한다.

일반적으로 자기상관계수가 값이 지속적으로 큰 값을 유지할 경우, 해당 시계열 자료는 시간에 따라 값이 일정한 정상성(stationary)의 특징을 갖는다고 간주할 수 있다. 따라서 자기상관 및 편자기상관의 경우 95% 신뢰구간 내에서는 유의수준 5%에서 자기상관계수 및 편자기상관계수가 0이라고 가정을 하는 신뢰구간 개념을 사용하며, 95% 신뢰구간은 Eq. (19)과 같다.

(19)
95%CI=±1.961n

여기서, CI는 신뢰구간으로 p-value 기준으로 –1.96에서 +1.96 사이를 의미한다.

자기상관계수는 신뢰구간 내 값이 분포하면 해당되는 시차 k 전까지의 관측 값이 임의시간 관측 값 yt와 상관이 있음을 의미며, 편자기상관계수의 경우, 신뢰구간 내 값이 분포 하면 해당되는 시차 k전까지의 관측 값이 임의시간 관측 값 yt에 강한 상관관계 보이는 것을 의미한다. 확장자기상관계수는 결과가 표로 제시되며, AR(Autocorrelation) 및 MA(Moving Average)의 정확한 차수(order)를 확인할 수 있다. 일반적으로 각각의 계수들은 통계학, 경제학과 컴퓨터 I/O 패턴 분석, 수질 예측(수온 및 용존 산소 농도), 전력 공급 및 수요 예측 등 ARIMA(Autoregressive Integrated Moving Average) 모형을 이용한 시계열 분석에 널리 사용되고 있다.

3. Study Area and Data Collection

3.1 Study Area

본 연구 대상지인 청평댐유역은 북위 37도32분 ~ 37도52분, 동경 127도15분 ~ 127도26분에 걸쳐 한반도 중앙부에 위치하고 있으며, 유역면적은 760.61 km2이고, 유로연장은 36.69 km로 청평댐 하류부에는 3개의 주요 하수종말처리장이 건설되어 있다(Fig. 1 참조).

https://cdn.apub.kr/journalsite/sites/ksds/2020-013-04/N0240130407/images/ksds_13_04_07_F1.jpg
Fig. 1

Study Area

3.2 Input Data

본 연구는 시계열 특성을 가지고 있는 하수종말처리장의 방류량 예측을 위한 최적의 기계학습 모형을 선정하기 위하여 시계열 자료 예측에 사용되는 주요 기계학습 모형(SVR, LSTM, GRU) 별 예측정확도(accuracy of forecasting)를 평가하는 것에 초점을 두었다. 또한 방류량 예측 시 사용하게 될 입력자료의 종류, 입력자료의 양, 입력자료 간의 상관관계를 고려하였다. 방류량 예측 시 사용된 입력자료는 강수량, 신청평대교 수위, 하수종말처리장의 유입량, 방류량이며, 각각 기상청, 한강홍수통제소 및 국립환경과학원에서 일 단위로 2012년부터 2018년까지 7년간 측정된 자료를 이용하였다. 본 연구에서 수집된 자료의 관측소 위치 및 자료 보유 기간 등에 대해서 Table 1에 제시하였으며, 측정된 강수량의 단위는 (mm), 하수종말처리장 유입량 및 방류량은 (m3/day), 수위는 (m)이다.

Table 1.

Information about hydrological stations and sewage treatment plants (STP)

No Stations Items* Latitude Longitude Period
1 SinCheongpyeongdaegyo
(Way Bridge)
P 37° 42´ 127° 23´ 7 years
(2012-2018)
2 SinCheongpyeongdaegyo
(Way Bridge)
W 37° 42´ 127° 23´
3 Hwado, Seojong, Sambong STP I 37° 37´
37° 35´
37° 34´
127° 20´
127° 20´
127° 18´
4 Hwado, Seojong, Sambong STP O 37° 37´
37° 35´
37° 34´
127° 20´
127° 20´
127° 18´

* P = Precipitation; W = Water Surface Elevation; I = Inflow; O = Outflow

3.3 t-test(p-value) and pearson correlation analysis

수집된 자료가 방류량 예측 시 필요한 주요한 인자인지 판단하기 위하여, 구축한 입력자료 별 t-test 분석 및 p-value를 도출하였다. t-test 분석은 두 집단 간의 평균의 차이가 통계적으로 유의한지를 파악할 때 필요한 통계적 기법으로 t-test 분석 시 다음의 가정 사항을 만족해야한다.

① 자료는 모두 동일 간격을 가진 연속형 수치여야 한다(identical interval and continuity).

② 두 집단은 서로 독립적 이어야 한다(independence).

③ 자료의 수치는 정규성을 가져야 한다(normality).

또한 예측인자인 방류량과 입력자료 간의 선형적 관계를 분석하기 위하여 상관성 분석을 수행하였다. 입력 자료인 강수량, 신청평대교 수위 및 하수종말처리장의 유입량 및 방류량에 대하여 t-test 분석 및 p-value, 피어슨 상관계수(Pearson correlation coefficient)를 도출한 결과는 Table 2와 같다.

Table 2.

t-test analysis and correlation analysis for input data

Input Data* t-score p-value effect size PCC** Significant Factor***
P 438.24 ~0.00 12.25 0.23
W 438.26 ~0.00 12.25 0.28
I 9.30 ~0.00 0.26 0.96
O 9.80 ~0.00 0.27 0.91

* P = Precipitation; W = Water Surface Elevation; I = Inflow; O = Outflow

** PCC = Pearson Correlation Coefficient

*** Weight : ○ = 1.0, ◎ = 2.0

일반적으로 p-value의 값이 0.05 이하의 값을 가지면 그 인자는 유의미한 인자로 판단할 수 있으나, 두 집단의 평균 차이를 표현하는 효과크기(effect size)는 p-value의 값에 영향을 크게 미치기 때문에 효과크기의 값을 고려하여 유의미한 인자를 판단해야 한다(Ruxton, 2006). t-test 분석 및 p-value 도출 결과 강수량 및 수위는 하수종말처리장의 유입량 및 방류량에 비해 효과크기 값이 크기 때문에 p-value 값이 작게 산정되었다고 판단되어 방류량 예측 시 유입량, 방류량 자료에 비하여 가중치를 작게 설정하였다.

4. Model Setup

본 연구에서는 기계학습 모형의 실행을 위해 오픈소스 라이브러리를 이용하였다. 컴퓨터 언어는 Python(version 3.7, Anaconda)을 사용하였고, Python 내부에 있는 Numpy(version 1.14.2), Pandas(version 0.22.0) 라이브러리를 이용하여 모델을 실행하기 위한 자료 관리를 수행하였다. 또한 Google에서 오픈소스 라이브러리로 제공하는 TensorFlow(version 1.13.1)를 이용하여 SVR, LSTM, GRU 알고리즘을 활용한 방류량예측 모형을 구축하였다. TensorFlow는 data flow graph구조로 구성되어 있으며, 기계학습(machine learning) 및 딥 러닝(deep learning)의 다양한 연구 분야에서 활용되어 본 연구에서도 활용이 가능할 것이라고 판단되었다. 또한 방류량예측은 Inter Core i5-6600 CPU(Central Processing Unit), 8.00 GB of RAM(Random Access Memory), 256 GB of SSD(Solid State Drive) 제원을 갖은 컴퓨터에서 수행되었다.

4.1 Sensitivity Analysis

본 연구에서는 다양한 방류량 예측모형의 성능을 평가하기에 앞서 SVR 모형, LSTM 및 GRU 모형 내에 있는 여러 인자에 대하여 민감도 분석을 수행하였다. 각 모형 내에서 설정 가능한 인자는 총 4가지로 각 인자별 민감도 분석을 수행할 Case를 Table 3에 정리하였다. 입력 자료는 1년간의 수문자료 및 하수종말처리장의 유입량 방류량을 사용하였으며, 예측 데이터는 향후 실시간 방류량을 예측하기 위하여 1일 후의 방류량으로 설정하였다. 각 인자별로 30번의 반복과정을 통하여 인자별 불확실성을 표준편차로 나타내었고, CPU Time을 평균 내어 검토하였다.

Table 3.

Sensitivity analysis for LSTM, GRU & SVR for forecasting outflow (*: reference value)

Parameter Model Value Evaluation
Hidden Layer LSTM GRU 1*,3,5,10,20 Standard deviation (Uncertainty)
and CPU Time 
Learning Rate 0.005,0.01*,0.02,0.05,0.1
Sequence Length 1*,2,3,5,10
Iterations 10,100*,1000,5000,10,000
C SVR 1, 3*, 5, 10, 100
epsilon 0.01,0.05,0.1*,0.5,1.0
kernel linear, poly, rbf*, sigmoid
tolerance 0.0000001,0.00001,0.001*,0.1

각 인자별로 최적의 설정 값을 도출하기 위하여 표준편차 값과 CPU Time을 고려하였다. 각 인자별 표준편차 및 CPU Time에 대하여 Fig. 2에 나타내었고, 결과를 Table 4에 요약하여 정리하였다.

https://cdn.apub.kr/journalsite/sites/ksds/2020-013-04/N0240130407/images/ksds_13_04_07_F2.jpg
Fig. 2

Results of Sensitivity Analysis (A: Hidden Layer, B: Learning Rate, C: Sequence Length, D: Iterations, E: Coefficient, F: Epsilon, G: Kernel, H: Tolerance)

Table 4.

Summary of Sensitivity Analysis Results (LSTM and GRU)

Parameter Value Uncertainty (m3/day) CPU Time (s)
LSTM GRU LSTM GRU
Hidden Layer 1 1858.29 1842.39 2.2 1.9
3 1539.92 1368.80 2.2 2.0
5 1444.92 1405.67 2.3 2.0
10* 1385.71 1362.85 2.3 2.1
20** 1424.09 1357.50 2.4 2.2
Learning Rate 0.005 1956.74 2195.74 2.2 1.9
0.01 1858.29 1842.39 2.2 1.9
0.02 1507.38 1714.72 2.2 1.9
0.05* 1348.23 1366.06 2.2 1.9
0.10** 1622.78 1350.09 2.2 2.0
Sequence Length 1 1858.29 1842.39 2.2 1.9
2*,** 1503.39 1509.37 2.2 2.0
3 1520.32 1641.64 2.2 2.1
5 1785.88 1857.33 2.4 2.1
10 1880.99 1915.30 2.7 2.5
Iterations 10 2274.08 2280.95 0.3 0.2
100 1858.29 1842.39 2.2 1.9
1000*,** 1297.30 1293.21 20.1 19.7
5000 1311.20 1315.21 102.9 101.6
10000 1301.32 1303.72 204.5 199.9

*: Optimal value for outflow forecasting model (LSTM)

**: Optimal value for outflow forecasting model (GRU)

민감도 분석 결과 본 연구에서 예측 모형별 선정한 인자별 최적의 값은 LSTM 모형의 경우, Hidden Layer 개수 10개, Learning Rate 0.05, 반복계산 횟수 1000번, 시퀀스 길이는 2일이며, GRU 모형의 경우, Hidden Layer 개수 20개, Learning Rate 0.10, 반복계산 횟수 1000번, 시퀀스 길이는 2일, SVR 모형의 경우, Coefficient 1.0, Epsilon 0.10, Kernel은 radial basis function, Tolerance 0.001 이다.

4.2 Model Cases

앞서 민감도 분석을 통하여 각 예측 모형별 도출한 매개변수의 최적 값을 적용하였다. 본 연구는 각각의 기계학습 모형별 하수종말처리장의 방류량 예측 정확도를 비교하여 최적의 모형을 선정하기 위하여 모의 Case를 설정하였고 Table 6에 정리하였다. 모의에 사용한 입력 자료는 앞서 언급하였던 강수량, 신청평대교 수위, 각 하수종말처리장 유입량 및 방류량이며 각각 총 7년간의 자료를 연구대상지에 있는 관측소에서 확보하였다.

Table 5.

Summary of Sensitivity Analysis Results (SVR)

Parameter Value Uncertainty (m3/day) CPU Time (s)
Coefficient 1* 1283.56 0.3**
(Each parameters did not affect
CPU Time in SVR model)
3 1286.85
5 1303.10
10 1345.39
100 1681.27
Epsilon 0.01 1342.43
0.05 1322.31
0.10* 1286.85
0.50 2279.90
1.00 2279.90
Kernel linear 1287.85
polynomial 1526.09
rbf* 1286.85
sigmoid 2399.2
Tolerance 0.0000001 1287.75
0.00001 1287.74
0.001* 1286.85
0.1 1402.75

*: Optimal value for outflow forecasting model (SVR)

Table 6.

Cases for application of forecasting model

Case STP Model
Ⅰ-(1) Hawdo SVR
Ⅰ-(2) LSTM
Ⅰ-(3) GRU
Ⅱ-(1) Sambong SVR
Ⅱ-(2) LSTM
Ⅱ-(3) GRU
Ⅲ-(1) Seojong SVR
Ⅲ-(2) LSTM
Ⅲ-(3) GRU

시나리오에 따라 모의를 수행하기 위하여 총 7년간의 입력자료 중 6년간의 자료(2009년 ~ 2017년)를 학습 데이터(training data set)로 사용하였으며, 1년간의 자료(2018년)를 평가 데이터(test data set)로 설정하였다. 방류량예측 모형의 정확도 및 학습속도의 향상을 위하여 입력 자료의 정규화(normalization)를 수행하였다. 정규화 방법은 MinMax 정규화를 사용하였으며 이를 통하여 입력자료의 rescaling(0~1)을 수행하였고 본 모의에 적용하였다.

5. Results and Analysis

본 연구에서 개발한 모형에 대하여 학습 데이터와 평가 데이터는 독립적으로 적용되었다. 학습 데이터를 통하여 학습 후 평가데이터 적용을 통해 모형의 예측결과와 관측결과를 비교하여 Case 별 방류량 예측모형의 성능평가를 RMSE 및 NSE로 비교하여 Table 7에 결과를 정리하였다. 또한 모형별 예측결과와 관측결과를 비교하여 Fig. 3Fig. 4에 제시하였다.

Table 7.

Summary of the results according to network models

Case RMSE (m3/day) NSE
Ⅰ-(1) 1,425 0.61
Ⅰ-(2) 830 0.87
Ⅰ-(3) 804 0.88
Ⅱ-(1) 89 0.54
Ⅱ-(2) 39 0.91
Ⅱ-(3) 37 0.92
Ⅲ-(1) 158 0.41
Ⅲ-(2) 93 0.80
Ⅲ-(3) 80 0.85

https://cdn.apub.kr/journalsite/sites/ksds/2020-013-04/N0240130407/images/ksds_13_04_07_F3.jpg
Fig. 3

Results of the outflow forecasting according to network models

https://cdn.apub.kr/journalsite/sites/ksds/2020-013-04/N0240130407/images/ksds_13_04_07_F4.jpg
Fig. 4

Scatter plot according to network models

SVR, LSTM, GRU 모형의 성능을 평가하기 위하여 예측방류량 결과에 대하여 평가지표(RMSE 및 NSE)를 검토하였으며, SVR 모형은 화도, 삼봉, 서종 하수처리장의 방류량에 대한 RMSE가 각각 1,425, 89, 158 m3/day, NSE가 0.61, 0.54, 0.41로 나타났고, LSTM 모형은 RMSE가 각각 830, 39, 93 m3/day, NSE가 0.87, 0.91, 0.80로 나타났다. GRU 모형의 경우, RMSE가 각각 804, 37, 80 m3/day, NSE가 0.88, 0.92, 0.85로 방류량 예측 정확도 측면에서 가장 우수한 것으로 확인하였다. LSTM과 GRU 모형의 오차가 SVR 모형에 비하여 작은 원인으로는 방류량의 자기상관성 분석 시 2일 전까지의 방류량이 유의한 상관이 있는 것으로 분석되었으며(Fig. 5 참고) 이후의 선행시간을 고려할 경우, 예측 정확도가 떨어질 것으로 판단되는데 LSTM 과 GRU 모형의 경우, 각각 게이트(LSTM의 경우 input, forget, output, GRU의 경우, reset, update)를 통하여 시퀀스를 효율적으로 기억해줄 수 있기 때문에 모형의 성능이 뛰어난 것으로 판단된다. 반면, SVR 모형의 경우 LSTM, GRU 모형처럼 과거자료의 비중이 적용되지 않고 학습에 사용된 전체 자료를 통해 최적의 예측모형을 구현하기 때문에 오차가 크게 발생하는 것으로 판단된다.

https://cdn.apub.kr/journalsite/sites/ksds/2020-013-04/N0240130407/images/ksds_13_04_07_F5.jpg
Fig. 5

a) Autocorrelation, b) Partial Autocorrelation, c) Extended Autocorrelation, d) Pearson Correlation of outflow at sewage treatment plant

GRU 모형이 LSTM 모형 보다 예측정확도가 높은 원인으로는 LSTM 모형의 경우 출력게이트(output gate)를 통하여 현재 예측이 다음 예측에 얼마나 영향을 줄 건지 정하게 되고, 학습에서 발생된 오차가 중첩되어 예측 값의 오차가 커질 수 있기 때문이다(Fig. 4 참고). 반면, GRU 모형은 출력게이트가 존재하지 않기 때문에 과거의 예측 값에만 영향을 받게 되고 또한 본 연구에서 구축된 입력 자료의 수가 적기 때문에 적은 입력자료 수에서도 학습이 가능한 GRU 모형의 예측정확도가 LSTM 모형보다 우수하다고 판단된다(Chung et al., 2014; Jozefowicz et al., 2015).

그러나 본 연구에서 적용된 모든 예측 모형은 극값 주변에서 과소 및 과대 산정되는 결과를 확인하였다. 이는 현재 구축되어진 LSTM 및 GRU 모형의 일반적인 기울기 손실(vanishing gradient)로 인한 문제이며, 이에 대한 문제를 해결하기 위해서는 극한사상(event)에 대한 입력 자료의 수가 많이 구축되어야 하며, 현재 구축된 자료의 최소 시간 단위를 일 단위에서 시 단위 또는 분 단위로 축소시켜야 될 것으로 판단된다. 또한 본 연구 대상지의 경우, 국가수자원관리종합정보시스템(WAMIS)에서 제공하는 용수이용량을 검토 시, 생활용수 및 농업용수의 사용량이 전체 용수이용량의 94.7%(농업용수 – 53.7%, 생활용수 – 41.0%)에 해당되기 때문에 계절적 영향을 반영할 수 있는 인자를 추가적으로 고려하게 된다면 방류량 예측 정확도를 향상 시킬 수 있을 것으로 판단된다.

6. Conclusions

본 연구에서는 하천수의 합리적 사용을 위한 관리체계 개선의 일환으로 하천 회귀수 중 하·폐수에 초점을 맞추어 하수종말처리장의 정확한 방류량 예측을 위한 최적의 기계학습 모형 선정을 목적으로 하고 있으며, 이를 위해 청평댐 유역에 존재하는 하수종말처리장을 대상으로 딥러닝 오픈소스 소프트웨어 라이브러리인 TensorFlow를 활용하여 방류량예측 모형을 개발하였다.

기계학습 모형은 시계열 자료의 예측에 주로 사용되는 LSTM, GRU 및 SVR 모형을 사용하였고 2012년부터 2018년까지의 1일 단위의 강수량, 신청평대교 수위, 화도, 삼봉, 서종 하수종말처리장의 유입량과 방류량 자료를 이용하였다. LSTM, GRU 및 SVR 모형의 매개변수는 민감도분석을 통하여 LSTM 모형의 경우, 은닉층의 개수는 10개, 학습속도는 0.05, 학습회수는 1,000번, 시퀀스 길이는 2일, GRU 모형의 경우, 은닉층의 개수는 20개, 학습속도는 1.0, 학습회수는 1,000번, 시퀀스 길이는 2일, SVR 모형의 경우, 계수(C)는 1.0, 예측허용 오차는 0.1, Kernel 함수는 radial basis function, 공차는 0.001로 결정하여 모의를 수행하였다. 최종적으로 각 하수종말처리장에 대해 기계학습 모형에 따른 방류량 예측 정확도를 평가하기 위해 관측 방류량과 예측 방류량을 비교·분석을 수행한 후 다음과 같은 결과를 도출하였다.

첫째, 방류량의 자기상관성 분석을 통하여 2일 전까지의 방류량이 현재 방류량을 예측하는데 유의하다고 판단하여 과거의 2일 전까지의 방류량을 기억하도록 시퀀스를 설정하였다. 그 결과 GRU 모형 적용 시 화도, 삼봉, 서종 방류량에 대한 예측정확도는 RMSE가 각각 804, 37, 80 m3/day, NSE가 0.88, 0.92, 0.85로 SVR 모형과 비교하여 RMSE는 각각 621, 52, 78 m3/day 감소하였으며, NSE는 0.27, 0.38, 0.44 향상하였고 LSTM 모형과 비교하여 RMSE는 각각 26, 2, 13 m3/day 감소하였으며, NSE는 각각 0.01, 0.01, 0.05 정확도 향상 효과를 확인하여 하수처리장의 방류량 예측 시에는 GRU 모형이 적합하다고 판단하였다. 이는 SVR 모형의 경우, 학습의 사용된 전체 입력 자료를 통해 최적의 예측모형을 구현하기 때문에 오차가 크게 발생한 것이고, LSTM 모형의 경우 모형 구조 상 출력 게이트의 가중치에 따라 발생 오차가 중첩될 수 있기 때문에 오차가 GRU 모형에 비해 크게 발생한 것으로 판단된다.

둘째, GRU 모형 및 LSTM 모형은 일반적인 기울기 손실 문제로 인하여 극값 주변에서 과소 및 과대 산정되는 결과를 확인하였으며 이는 모형의 특성 상 극한사상(event)에 대한 입력 자료의 수가 많이 구축하고, 구축된 자료의 최소시간 단위를 축소시키면 해결될 것으로 판단된다.

기존의 물수지 분석 시 용수별 회귀율을 통하여 일률적으로 회귀수량을 산정하는 방법과 비교하여 기계학습을 통하여 본 연구에서 구축한 방류량 예측 모형을 적용할 경우 상대적으로 정확한 방류량 예측을 통하여 합리적인 하천수 관리체계 구축이 가능할 것으로 판단된다. 향후에는 예측하고자 하는 대상지의 용수이용량 검토 및 계절적 영향을 반영할 수 있는 인자를 추가적으로 고려하고 자료의 최소시간 단위를 축소시켜 본 연구에서 제안한 모형의 예측 결과를 이용하면, 기후변동성에 대비하여 실시간 가용수량을 보다 정확히 확인할 수 있으며, 최종적으로 종합적인 하천수 사용관리 및 물이용 계획 수립을 위한 기초자료로 활용될 수 있을 것으로 기대된다. 이외에도 SNS 등을 통하여 국민들에게 신속하게 정보를 전달한다면 향후 물 부족에 따른 문제점을 완화시킬 수 있을 것으로 판단된다.

Acknowledgements

본 연구는 국토교통부/국토교통과학기술진흥원의 지원으로 수행되었음(과제번호 20AWMP-C140010-03).

References

1
Agarap, A. F. (2018). Deep Learning using Rectified Linear Units (RELU). arXiv preprint arXiv:1803.08375.
2
Chen, W. B., Liu, W. C., and Hsu, M. H. (2012). Comparison of ANN Approach with 2D and 3D Hydrodynamic Models for Simulating Estuary Water Stage. Advances in Engineering Software. 45(1): 69-79. 10.1016/j.advengsoft.2011.09.018
3
Cho, K., Van Merriënboer, B., Gulcehre, C., Bahdanau, D., Bougares, F., Schwenk, H., and Bengio, Y. (2014). Learning Phrase Representations using RNN Encoder-decoder for Statistical Machine Translation. arXiv Preprint arXiv: 1406.1078. 10.3115/v1/D14-1179
4
Choi, S., Kang, S., Lee, D., and Kim, J. (2018). A Study on Water Supply and Demand Prospects for Water Resources Planning. Journal of the Korean Society of Hazard Mitigation. 18(7): 589-596. 10.9798/KOSHAM.2018.18.7.589
5
Choi, S. H., Kwon, H. H., and Park, M. (2019). Prediction on the Amount of River Water use using Support Vector Machine with Time Series Decomposition. Journal of Korea Water Resources Association. 52(12): 1075-1086.
6
Chung, J., Gulcehre, C., Cho, K., and Bengio, Y. (2014). Empirical Evaluation of Gated Recurrent Neural Networks on Sequence Modeling. arXiv preprint arXiv: 1412.3555.
7
Greff, K., Srivastava, R. K., Koutník, J., Steunebrink, B. R., and Schmidhuber, J. (2016). LSTM: A Search Space Odyssey. IEEE Transactions on Neural Networks and Learning Systems. 28(10): 2222-2232. 10.1109/TNNLS.2016.258292427411231
8
Hochreiter, S. (1998). The Vanishing Gradient Problem During Learning Recurrent Neural Nets and Problem Solutions. International Journal of Uncertainty. Fuzziness and Knowledge-Based Systems. 6(02): 107-116. 10.1142/S0218488598000094
9
Jozefowicz, R., Zaremba, W., and Sutskever, I. (2015, June). An Empirical Exploration of Recurrent Network Architectures. In International Conference on Machine Learning (pp. 2342-2350).
10
Korea Meteorological Administration (KMA). (2020). Korea Climate Change Assessment Report 2020. Seoul: KMA.
11
Lee, G., Jung, S., and Lee, D. (2018). Comparison of Physics-based and Data-driven Models for Streamflow Simulation of the Mekong River. Journal of Korea Water Resources Association. 51(6): 503-514.
12
Lee, J. Y., Kim, H. I., and Han, K. Y. (2020). Linkage of Hydrological Model and Machine Learning for Real-time Prediction of River Flood. Journal of The Korean Society of Civil Engineers. 40(3): 303-314.
13
Lee, S. W., Kim, Y. O., and Lee, D. R. (2005). Quantifying Uncertainty for the Water Balance Analysis. Journal of Korea Water Resources Association. 38(4): 281-292. 10.3741/JKWRA.2005.38.4.281
14
Ministry of Land Infrastructure and Transport (MOLIT). (2016). National Water Resources Plan (2011~2020) (3rd revision). Sejong: MOLIT.
15
Oh, J. H., Ryu, K. S., Bok, J. S., Jang, Y. S., Bae, Y. D., and Lee, B. G. (2019). Water Supply-and-Demand Analysis Considering the Actual Water-Use System in the East Basin of Han River. Journal of the Korean Society of Hazard Mitigation. 19(7): 529-543. 10.9798/KOSHAM.2019.19.7.529
16
Olah, C. (2018). Understanding Lstm Networks, August 2015. URL https://colah.github.io/posts/2015-08-Understanding-LSTMs.
17
Pascanu, R., Mikolov, T., and Bengio, Y. (2012). Understanding the Exploding Gradient Problem. CoRR, abs/1211.5063, 2, 417.
18
Ruxton, G. D. (2006). The Unequal Variance t-test is an Underused Alternative to Student's t-test and the Mann-Whitney U test. Behavioral Ecology. 17(4): 688-690. 10.1093/beheco/ark016
19
Tran, Q. K. and Song, S. K. (2017). Water Level Forecasting based on Deep Learning: A use Case of Trinity River-Texas-The United States. Journal of KIISE. 44(6): 607-612. 10.5626/JOK.2017.44.6.607
20
Vapnik, V., Guyon, I., and Hastie, T. (1995). Support Vector Machines. Mach. Learn. 20(3): 273-297. 10.1007/BF00994018
21
Yeo, W. K., Seo, Y. M., Lee, S. Y., and Jee, H. K. (2010). Study on Water Stage Prediction using Hybrid Model of Artificial Neural Network and Genetic Algorithm. Journal of Korea Water Resources Association. 43(8): 721-731. 10.3741/JKWRA.2010.43.8.721
22
Yoo, H. J., Kim, D. H., Kwon, H. H., and Lee, S. O. (2020). Data Driven Water Surface Elevation Forecasting Model with Hybrid Activation Function-A Case Study for Hangang River, South Korea. Applied Sciences. 10(4): 1424. 10.3390/app10041424
23
Yoo, H. J., Lee, S. O., Choi, S., and Park, M. (2019). A Study on the Data Driven Neural Network Model for the Prediction of Time Series Data: Application of Water Surface Elevation Forecasting in Hangang River Bridge. Journal of Korean Society of Disaster and Security. 12(2): 73-82.
24
Zhang, J., Zhu, Y., Zhang, X., Ye, M., and Yang, J. (2018). Developing a Long Short-Term Memory (LSTM) based Model for Predicting Water Table Depth in Agricultural Areas. Journal of Hydrology. 561: 918-929. 10.1016/j.jhydrol.2018.04.065
25
Zhang, D., Lindholm, G., and Ratnaweera, H. (2018). Use Long Short-term Memory to Enhance Internet of Things for Combined Sewer Overflow Monitoring. Journal of Hydrology. 556: 409-418. 10.1016/j.jhydrol.2017.11.018

Korean References Translated from the English

1
국토교통부 (2016). 수자원장기종합계획(2001~2020) 제3차 수정계획. 세종: 국토교통부.
2
기상청 (2020). 한국 기후변화 평가보고서 2020-기후변화 과학적 근거-. 서울: 기상청.
3
여운기, 서영민, 이승윤, 지홍기 (2010). 인공신경망과 유전자알고리즘의 결합모형을 이용한 수위예측에 관한 연구. 한국수자원학회논문집. 43(8): 721-731. 10.3741/JKWRA.2010.43.8.721
4
오지환, 류경식, 복정수, 장연석, 배영대, 이봉국 (2019). 실제 물이용 체계를 고려한 한강 동해 권역 물수급 평가. 한국방재학회논문집. 19(7): 529-543.
5
유형주, 이승오, 최서혜, 박문형 (2019). 시계열 자료의 예측을 위한 자료 기반 신경망 모델에 관한 연구: 한강대교 수위예측 적용. 한국방재안전학회논문집. 12(2): 73-82.
6
이기하, 정성호, 이대업 (2018). 메콩강 유출모의를 위한 물리적 및 데이터 기반 모형의 비교·분석. 한국수자원학회논문집. 51(6): 503-514.
7
이승욱, 김영오, 이동률 (2005). 물수지 분석을 위한 불확실성 정량화. 한국수자원학회논문집. 38(4): 281-292. 10.3741/JKWRA.2005.38.4.281
8
이재영, 김현일, 한건영 (2020). 수문모형과 기계학습을 연계한 실시간 하천홍수 예측. 대한토목학회논문집. 40(3): 303-314.
9
최서혜, 권현한, 박문형 (2019). TDSVM을 이용한 하천수 취수량 예측. 한국수자원학회논문집. 52(12): 1075-1086.
10
최시중, 강성규, 이동률, 김중훈 (2018). 수자원 계획 수립을 위한 물 수급 전망 개선 방안 연구. 방재학회논문집. 18(7): 589-596.
11
트란 광 카이, 송사광 (2017). 딥러닝 기반 침수 수위 예측: 미국 텍사스 트리니티강 사례연구. 정보과학회 논문지. 44(6): 607-612. 10.5626/JOK.2017.44.6.607
페이지 상단으로 이동하기