Korean J. Remote Sens. 2024; 40(6): 1337-1345
Published online: December 31, 2024
https://doi.org/10.7780/kjrs.2024.40.6.2.5
© Korean Society of Remote Sensing
나건하1, 이승재2*, 김진만3
1국립재난안전연구원 재난안전실험센터 책임연구원
2국립재난안전연구원 재난안전실험센터 연구원
3부산대학교 사회기반시스템공학과 교수
Correspondence to : Seungjae Lee
E-mail: seungje1215@korea.kr
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (https://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
In South Korea, earthquakes of magnitude 4.0 and above continue to occur, yet there remains a lack of awareness regarding liquefaction caused by these seismic events. In this context, evaluating liquefaction during seismic events, using geotechnical information from the National Ground Information Portal System consumes considerable human and temporal resources to derive the Liquefaction Potential Index (LPI). Additionally, there are issues concerning the accuracy of the input data. This study designed an LPI prediction model to address these challenges by comparing the calculated LPI with a reference map indicating liquefaction susceptibility. The results showed that while the LPI prediction model requires some improvement in accuracy compared to the actual LPI, it demonstrated high effectiveness in rapidly selecting ground investigation locations during national disaster situations.
Keywords Liquefaction, Deep running, DNN, Prediction of LPI, Map expression
최근 환태평양 지진대를 중심으로 지속적인 강진이 발생하고 있다. 과거 우리나라의 경우 유라시아판 내부에 위치하여 지진에 대체로 안전하다는 인식이 있었으나, 1978년 계기 지진 관측 이래 2016년 경주지진, 2017년 포항지진을 포함하여 규모(magnitude, M) 4.0 이상의 유감 지진이 계속해서 발생하고 있는 추세이다. 최근 발생한 주요 지진으로는 2023년 전북 장수(M 3.5), 충남 공주(M 3.4), 경북 경주(M 4.0), 2024년 전북 부안(M 4.8) 등M5.0 규모에 육박하는 지진이 발생되고 있는 실정으로(Korea Meteorological Administration, 2024), 향후 지진 현상뿐만 아니라 액상화에 대한 위험성 평가 및 지진방재종합대책이 중요한 과제가 될 것으로 판단된다. 액상화 현상과 관련해서 대표적으로 2017년 포항지진으로 인해 산지를 제외한 포항 일부 지역에서 모래 분사(Sand boiling) 및 지반 침하(안벽 침하 등)가 발생하였으며, 이는 국내에서 최초로 관측된 액상화 현상으로 보고 있다. 이러한 현상은 안전 사회에 대한 불안감을 확산시켰고, 지진과 액상화 현상에 대한 연구분야가 급부상하는 계기가 되었다.
현재까지 액상화와 관련된 문제를 해결하기 위해 지진방재종합대책과 연계한 한국형 액상화 평가 및 관리 기술 개발은 행정안전부, 국토교통부, 산학연 등 각 유관기관에서 연구개발을 수행 중에 있으며, National Disaster Management Research Institute (2023a)에서는 “5년간 지역특성을 고려한 액상화 위험 지도 표준모델 및 대응 매뉴얼” 관련 연구결과에 기초하여 지반 액상화 가능성 지도 작성 절차서가 발간된 바 있다. 이 절차서는 KDS 17 10 00 내진설계 일반(Ministry of Land, Infrastructure and Transports, 2024)의 단계별로 기술적 지침을 기반으로 하고 있으며, 액상화 가능성 예비평가, 지반정보 수집·분석, 액상화 가능성 평가, 액상화 가능성 지도 도식 방법을 포함하고 있다. 그럼에도 불구하고 기존의 지반 물성데이터를 액상화 가능성 지도 입력 시 복잡한 절차 및 시간 소요로 인한 한계성을 가지고 있다. 또한, 활용데이터의 누락 또는 잘못된 정보로 이어질 수 있는 데이터의 접근방식은 결정된 데이터의 적용과 관련된 결과의 신뢰성 측면에서도 많은 개선을 필요로 한다. 이와 같은 문제를 해결하기 위한 유사 연구분야에서는 데이터의 오류와 인적·시간적 자원 소모를 줄이는 방식으로 딥러닝과 공간보간기법을 사용한 사례가 증가하고 있다(Park et al., 2021; 2022; Jang et al., 2022). 이에 본 연구에서는 액상화 가능성 지도 시범 제작 사례에서 계산식으로 도출한 액상화 가능성 지수(Liquefaction Potential Index, LPI)와 LPI 예측 모델 설계를 통해 실제 LPI 지도와 예측 LPI 지도를 비교함으로써 LPI 예측 모델에 대한 유효성을 검증하고자 한다.
액상화 가능성 평가는 각 지진시나리오를 바탕으로 지반 정보가 존재하는 각 지점에 대해 수행되어야 하며, 구체적인 평가 절차는 KDS 17 10 00 내진설계 일반(Ministry of Land, Infrastructure and Transports, 2024)을 따른다. 액상화 발생 여부는 대상 지점에서 지반이 액상화에 저항하는 능력을 나타내는 반복저항응력비(Cyclic Resistance Ratio, CRR)와 지진에 의해 발생되는 반복전단응력비(Cyclic Stress Ratio, CSR)의 비율로서 정의되는 안전율로 평가한다. 반복전단응력비는 지반응답해석을 수행하여 결정하고, 반복저항응력비는 현장 시험 결과(N값, qc값, Vs값 등)를 이용하여 결정한다. 액상화에 대한 안전율은 1.0을 적용한다. 안전율이 1.0 이하인 경우 액상화 지역 및 주변 지역에서의 기초 및 지반 구조물의 피해 가능성을 평가하고, 1.0 초과인 경우에는 액상화에 대해 안전한 것으로 판정한다. 전 세계적으로 액상화 평가 방법은 Seed and Idriss (1971)를 기초로 정립되어 있다.
액상화 평가에 활용되는 지진파는 실계측 지진파를 수집하여 가속도 표준설계응답스펙트럼에 매칭하여야 하며, 지역에 따른 설계지진의 세기는 지진 구역에 따른 지진구역계수(Z) 및 재현주기별 위험도계수(I)를 바탕으로 산정하여야 한다. 이 때 설계지진세기는 유효수평지반가속도(S)로 각 행정구역을 기준으로 제시된 암반에서의 수평 지반 운동 수준을 나타낸다. 설계지반운동의 특성은 ‘암반지반설계지반운동의 가속도 표준설계응답스펙트럼’을 따른다(KDS 17 10 00 내진설계 일반; Ministry of Land, Infrastructure and Transports, 2024).
각 지층의 전단파속도는 현장시험으로부터 직접 얻지 못하는 경우, 표준관입시험 또는 콘관입시험에서 구하는 물성치로부터 전단파속도를 계산하는 변환식 중에서 최소 2개 이상을 활용하여 평균값으로 산정한다. 그리고 반복전단응력비 산정을 위하여 지반응답해석을 실시하며 지진파에 대한 기반암 상부의 지반 응답(가속도, 속도, 변위) 등을 평가하는 것이다.
LPI 값을 산출하기 위해서는 액상화 안전율(Fs)을 산정하여야 하며, 산정 방식은 식(1)과 같다. 이는 지반의 CRR에 대한 지진력으로 유발되는 CSR의 비로 나타낸다. 이 때 안전율이 1.0 이하면 액상화가 발생한다고 평가하고, 1.0 초과일 때 액상화에 대해 안전한 것으로 판정한다.
Iwasaki et al. (1978)은 액상화 안전율에 심도에 따른 가중치를 곱하고 이를 적분하여 얻어지는 LPI를 제안하였고 전 세계적으로 널리 활용되고 있다. LPI 값이란 0~20 m 깊이 지반의 액상화 피해를 평가하는 지수로 다음의 식(2)에 따라 산출된다. 여기서 주의해야 할 점은 각 심도의 안전율이 1 이상일 경우 F(z)=0, 1 이하일 경우 F(z)=1–Fs(z)이며, W(z)=10–0.5z이다.
인공신경망(Artificial Neural Network, ANN)은 사람의 신경망 원리와 구조를 모방하여 만든 기계학습으로 신호 및 자극(입력 데이터)에 대해 임계값(가중치)을 넘어서면 신호를 전달(출력 데이터)하는 구조이다. 인공신경망은 임계값을 추정하는 은닉층이 1~2개로 간단한 비선형 자료구조 및 패턴에 대해 활용된다. 최근에는 데이터 수집 및 보관 기술이 발전함에 따라 복잡한 비선형 자료 구조 및 패턴에 대해 인공신경망에 대한 활용도가 증가하는 추세이지만 인공신경망 알고리즘 구조상 다양한 한계가 존재한다(Minsky and Papert, 1969). 이를 해결하기 위하여 심층신경망(DeepNeuralNetwork, DNN)이 개발되었다(McCulloch and Pitts, 1943). 심층신경망은 데이터의 경향을 분석하여 이를 회귀분석을 통해 향후 데이터의 거동을 예측하는 방법으로 상대적으로 간편하며, 빠른 학습 속도를 가지고 있어 많은 분야에 다양하게 활용되는 실정이다.
심층신경망의 구조는 Fig. 1(a)와 같이 입력층, 3개 이상의 은닉층 그리고 출력층으로 구성되어 있으며, 각각의 층에는 입력 데이터, 가상의 뉴런(노드, node), 출력 데이터가 존재한다. 출력 데이터는 Fig. 1(b)와 같이 각 노드의 가중치(weight)와 편향(bias)을 통해 임계값을 추정하며, 비선형 함수를 통해 획득이 가능하다. 은닉층이 깊어질수록 최종 출력층에 도달하는 경우의 수가 증가하기 때문에 더욱 좋은 예측 결과를 얻을 수 있지만, 너무 깊은 심층신경망은 gradient vanishing 문제가 발생하여 과적합이 발생할 수 있다. 따라서 적정한 은닉층을 구성해야 한다.
Iwasaki et al. (1978)은 액상화 안전율에 심도에 따른 가중치를 곱해 이를 적분하여 얻어지는 LPI를 제안하였으며, 전 세계적으로 널리 활용되고 있다. LPI는 지표면으로부터 0~20 m까지 4단계로 구분하여 액상화 피해를 평가하는 지수이다. 4단계 범위는 매우 낮음(LPI=0), 낮음(0 구체적인 평가 절차는 KDS 17 10 00 내진설계 일반(Ministry of Land, Infrastructure and Transports, 2024)에 제시된 지침과 지반 액상화 가능성 지도 작성 절차서(National DisasterManagement Research Institute, 2023b)를 따라 수행하였다. Table 1은 A지역과 B지역의 시추공에 대한 빈도별 액상화 가능성 지수를 도출한 결과이다. Fig. 2는 LPI 도출을 위하여 위 지침과 절차서를 따라 작성한 액상화 평가시트 예시이다. Table 1 Liquefaction potential index by frequency
Frequency Outlier data LPI=0 LPI≤5 5 15 500y 133 2,084 146 106 57 1,000y 2,051 131 124 87 2,400y 1,985 127 151 130
학습 데이터는 국토지반정보통합DB센터에서 보유한 2,393공(A지역: 1,336공, B지역: 1,057공)을 기준으로 지층 정보와 흙의 종류(액상화는 모래지반에서 발생)를 구분하기 위하여 1공당 1m 단위로 나누어 최종적으로 활용할 학습 데이터 수는 A지역 20,026개, B지역 12,162개이다. Fig. 3은 LPI 예측모델 설계 프로세스를 나타낸다.
입력 데이터 인자는 토층 깊이(Depth), 표준관입시험(Standard Penetration Test, SPT) N값(N-value), 흙의 종류(Soil), 흙의 단위중량(Unit weight), 세립분 함유량(Fine Content, FC), 전응력(Total stress), 유효응력(Effective stress), 구속압 보정 N값(N1) 그리고 전단파속도(Vs)의 9개 인자를 입력 데이터로 적용하였다. 데이터 정규화를 실시하여 데이터 간의 유형을 인수로 통일시켰다. 그 과정에서 Soil은 문자열 형태이므로 인수 형태로 통일시키기 위하여 One-hot encoding 기법을 적용하였다. One-hot encoding 기법은 문자열 데이터를 1 또는 0으로 표현하며, Soil열의 8개 흙의 종류 중 하나의 인자가 포함되면 (1,0,0,0,0,0,0,0)과 같이 나타낼 수 있다. 이러한 과정을 거쳐 모든 데이터 인자들이 인수 형태로 변경된 후 각각의 데이터에 대해 정규화를 실시하였다. 정규화 방법은Min-max scaling 기법을 통해 0과 1 사이의 값으로 환산하였다. 환산 수식은 식(3)과 같다.
여기서 Xnorm은 정규화 된 인자이며, Xmax와 Xmin는 각각 인자들의 최대값과 최소값을 의미한다.
500년, 1000년, 2400년 빈도에 해당되는 LPI 값을 추정하기 위해 회귀 분석에 활용도가 높은 딥러닝 알고리즘 중 DNN을 활용하였다. LPI 예측 모델의 구조는 Fig. 4와 같이 입력층과 은닉층 그리고 출력층으로 구분되어 있으며, 총 9개의 입력 데이터를 통해 1개의 출력 데이터인 LPI 값을 예측하는 모델을 개발했다. 은닉층은 4개의 층으로 구성되어 있으며, 각 층의 노드는 각각 64개, 32개, 16개, 8개이다. 그리고 활성화 함수는 Rectified LinearUnit (ReLU)를 활용했으며, 초기 가중치 설정은 ReLU 함수에 적합한 He Initialization 기법을 사용하였다(He et al., 2015).
또한 모델의 성능 및 속도를 향상시키기 위해서 최적화 방법인 Adaptive Moment Estimation (Adam) 기법을 활용하였다. 여기서 Adam 기법은 Momentum과 RMSProp의 장점을 결합하여 개발된 최적화 기법으로 학습 속도를 높이고 안정적인 가중치(weight)의 업데이트가 가능한 알고리즘이다(Kingma and Ba, 2014). Adam 기법의 단점으로 학습률이 너무 커지거나 작아지는 경우 즉, 과적합 현상의 발생율이 높다. 이러한 현상을 방지하기 위해 본 연구에서는 다음의 2가지 방법이 활용되었다. 첫째, 은닉층 구성인 노드에서 일부분만 사용하여 전체적인 학습량 및 가중치 업데이트 횟수를 줄이는 drop out 기법을 적용하여 은닉층의 각 층별 노드 중 전체 노드 80%만 사용하였다. 두 번째 방법으로는 조기종영기법이다. 학습 수에 따라 오차율이 갱신되는 DNN구조에 따라 최소 오차율이 적용된 모델을 구축해야 된다. 조기종영기법은 최소 오차율이 적용되었을 때 강제로 학습을 종료시키는 기법이다.
학습 데이터의 정규화 이후 딥러닝 예측 모델을 검증하기 위해 Hold-out validation 기법을 활용했다(Steinbach and Kumar, 2007). 해당 기법은 데이터 셋을 training data와 test data로 구분하여 모델의 성능을 평가하는 기법으로 본 연구에서는 전체 데이터 길이(20,026개, 12,162개) 중 80% (16,020개, 9,729개)는 모델이 학습하는 용도로 활용하였고, 20% (4,006개, 2,433개)는 계산 값과 비교 검증하는 용도로 활용되었다. 또한, 계산 값과 비교한 20%에 대해 정량적인 오차율을 계산하기 위하여 Root Mean Squared Error (RMSE), Mean Absolute Error (MAE), R-squared (R2)를 활용하였다.
LPI 예측모델을 통해 500년 빈도 LPI, 1000년 빈도 LPI, 2400년 빈도 LPI의 예측 데이터를 수집하였으며, 이를 계산 값과 검증하였다. 검증 결과는 Fig. 5와 같으며, Fig. 5(a)와 5(b)는 각각 A지역과 B지역의 500년 빈도 LPI, Fig. 5(c)와 5(d)는A지역과 B지역의 1000년 빈도 LPI, 마지막으로 Fig. 5(e)와 5(f)는A지역과 B지역의 2400년 빈도 LPI이다. LPI 예측모델에서 조기종영 기법을 활용한 결과는 Fig. 5(a)~(f) 순으로 학습 수(Epoch)는 각각 19회, 22회, 13회, 18회, 22회, 24회이다. 9개의 입력 데이터를 가지고 DNN을 활용한 LPI 예측모델에서는 계산 값과 예측 값에 대한 오차율은 크게 산출되었으며, 특히 이상치 데이터가 넓게 분포되어 있었다. 오차율은 RMSE (범위: 0.18~0.39), MAE (범위: 0.02~0.22), R-squared (범위: 0.64~0.85)로 산출한 결과에 기초하여 Fig. 6에 도시하였다. 그 결과, 데이터 수가 상대적으로 많은 A지역이 B지역보다 오차율이 더 낮게 산정되었다. 빈도에 따른 결과에서 RMSE와MAE는 A지역과 B지역이 동일하게 500년 빈도 LPI, 1000년 빈도 LPI, 2400년 빈도 순으로 LPI의 오차율이 낮아졌으나, 상이하게 R-squared은 2400년 빈도 LPI, 1000년 빈도 LPI, 500년 빈도 LPI 순으로 높게 산출되었다. 그 원인은 RMSE와 MAE가 실제 데이터 스케일에 영향을 받는 오차율로 산정하는 방식이므로 2400년 빈도 LPI의 값이 가장 크기 때문에 오차율도 높게 산정된 것으로 판단된다. 따라서 RMSE와MAE는 동일한 빈도에 대한 검증으로만 활용 하고 R-squared는 전제적인 오차율에 대한 검증으로 활용하였다. 그 결과 LPI 예측 모델에서 가장 성능이 좋은 학습 데이터는 A지역이며, LPI 2400년 빈도를 예측하는 조건이다.
LPI 예측 모델의 성능 향상을 위해 학습 데이터를 재구축하였다. 학습 데이터는 기존 9개의 입력 데이터에서 500년 빈도 LPI 그리고 1000년 빈도 LPI를 추가하였다. 출력 데이터 1000년 빈도 LPI 예측에서는 500년 빈도 LPI가 추가되었으며, 2400년 빈도 LPI 예측에서는 500년 빈도 LPI와 1000년 빈도 LPI가 추가되었다. 따라서, 출력 데이터 1000년 빈도 LPI와 2400년 빈도 LPI의 입력 데이터 수는 각각 10개와 11개이다. 입력 데이터를 확장시켜 LPI 예측 모델을 구현한 결과는 Fig. 7에 도시하였다. 9개의 입력 데이터만 활용한 결과와 비교하였을 때 정량적인 오차율의 범위는 RMSE (범위: 0.07~0.12), MAE (범위: 0.01~0.05) 그리고 R-squared (범위: 0.98~0.99)로 나타나 이상치 데이터가 큰 폭으로 감소한 것을 알 수 있다. 입력 데이터의 확장으로 인해 오차율은 RMSE 157%~225%, MAE 100%~340% 감소되었으며, 이에 따라 R-squared는 16%~53% 증가하여 예측 모델의 성능이 향상된 것을 알 수 있다(Fig. 8).
11개 입력 데이터를 활용한 LPI 예측모델을 계산식에 의해 산출된 LPI 단계와 LPI 예측모델을 통해 환산된 LPI 단계를 Fig. 9과 같이 도시하였다. Fig. 9(a)와 9(c)는 각각 A지역 및 B지역의 실제 LPI 단계이며, Fig. 9(b)와 9(d)는 LPI 예측 모델을 활용한 예측 단계이다. 분석 결과, Table 2와 같이 계산 값으로 산출한 A지역의 LPI 단계는 매우 낮음 단계 9개(50.0%), 낮음 단계 3개(16.7%), 높음 단계 3개(16.7%) 그리고 매우 높음 단계 3개(16.7%)로 나타났다. 평가 기준은 액상화의 가능성 측면에서 낮음 단계의 비율(0 Table 2 LPI level 4 number 예측 LPI는 5개(27.8%), 7개(38.9%), 4개(22.2%) 그리고 2개(11.1%)로 실제 LPI 조건과 비교 시 낮음 단계의 비율(0 또한, 실제 B지역의 LPI 단계는 매우 낮음 단계 5개(20.0%), 낮음 단계 1개(4.0%), 높음 단계 17개(68.0%) 그리고 매우 높음 단계 2개(8.0%)로 A지역에 비해 높음 단계 및 매우 높음 단계가 전체 76%로 A지역에 비해 B지역이 액상화 가능성이 매우 높으며, 이를 예측한 결과는 매우 낮음 단계 1개(4.0%), 낮음 단계 5개(20.0%), 높음 단계 17개(68.0%) 그리고 매우 높음 단계 2개(8.0%)이다. A지역과 동일하게 낮음 단계의 비율(0
LPI step Very low (LPI=0) Low (0 High (5 Very high (15 Area A Calculated LPI step 9 (50.0%) 3 (16.7%) 3 (16.7%) 3 (16.7%) Predicted LPI step 5 (27.8%) 7 (38.9%) 4 (22.2%) 2 (11.1%) Area B Calculated LPI step 5 (20.0%) 1 (4.0%) 17 (68.0%) 2 (8.0%) Predicted LPI step 1 (4.0%) 5 (20.0%) 17 (68.0%) 2 (8.0%)
본 연구에서는 딥러닝 기법을 활용하여 산출한 LPI 예측 모델과 계산식으로 도출한 LPI 모델의 비교를 통해 LPI 예측 모델에 대한 유효성을 검증하였다. 연구 결과는 다음과 같다.
1) DNN을 활용한 LPI 예측 모델에서 500년, 1000년, 2400년 빈도 LPI의 예측 데이터를 수집하여 계산 값과 비교한 결과, 예측 값과 실제 값 간의 오차율이 크게 산출되었으며, 이상치 데이터가 넓게 분포하는 경향을 보였다. 정량적인 오차율은 RMSE (범위: 0.18~0.39), MAE (범위: 0.02~0.22), R-squared (범위: 0.64~0.85)로 나타났고, RMSE와 MAE는 빈도에 따라 감소하였으나 Rsquared는 빈도가 증가함에 따라 높아지는 경향이 있었다. 그 이유는 RMSE와 MAE가 실제 데이터 스케일에 영향을 받는 오차율로 산정하는 방식이므로 2400년 빈도 LPI의 값이 가장 크게 나타남에 따라 오차율도 높게 산정된 것으로 판단된다.
2) LPI 예측 모델의 성능을 향상시키기 위해 기존 9개의 입력 데이터에 500년 빈도 LPI 및 1000년 빈도 LPI를 추가하여 학습 데이터를 재구축한 결과, 정량적인 오차율은 RMSE (범위: 0.07~0.12), MAE (범위: 0.01~0.05) 그리고 R-squared (범위: 0.98~0.99)로 나타나 이상치 데이터가 큰 폭으로 감소한 것을 확인하였다. 입력 데이터의 확장으로 인해 RMSE는 157~225%, MAE는 100~340% 감소하였으며, R-squared는 16~53% 증가하여 예측 모델의 성능이 향상됨을 확인하였다.
3) LPI가 낮은 경우(LPI≤5)에는 예측의 한계가 있지만 LPI가 높은 경우(5
이 논문은 2024년 국립재난안전연구원의 “재난안전관리업무지원기술개발(R&D)-실증실험 기반 토사재해 취약성 평가기술 개발(NDMI-2024-07-01)”의 지원으로 수행되었습니다.
No potential conflict of interest relevant to this article was reported.
Korean J. Remote Sens. 2024; 40(6): 1337-1345
Published online December 31, 2024 https://doi.org/10.7780/kjrs.2024.40.6.2.5
Copyright © Korean Society of Remote Sensing.
나건하1, 이승재2*, 김진만3
1국립재난안전연구원 재난안전실험센터 책임연구원
2국립재난안전연구원 재난안전실험센터 연구원
3부산대학교 사회기반시스템공학과 교수
Geonha Na1, Seungjae Lee2* , Jinman Kim3
1Principal Researcher, Disaster Safety Experiment Center, National Disaster Management Research Institute, Ulsan, Republic of Korea
2Researcher, Disaster Safety Experiment Center, National Disaster Management Research Institute, Ulsan, Republic of Korea
3Professor, Department of Civil Engineering, Pusan National University, Busan, Republic of Korea
Correspondence to:Seungjae Lee
E-mail: seungje1215@korea.kr
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (https://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
In South Korea, earthquakes of magnitude 4.0 and above continue to occur, yet there remains a lack of awareness regarding liquefaction caused by these seismic events. In this context, evaluating liquefaction during seismic events, using geotechnical information from the National Ground Information Portal System consumes considerable human and temporal resources to derive the Liquefaction Potential Index (LPI). Additionally, there are issues concerning the accuracy of the input data. This study designed an LPI prediction model to address these challenges by comparing the calculated LPI with a reference map indicating liquefaction susceptibility. The results showed that while the LPI prediction model requires some improvement in accuracy compared to the actual LPI, it demonstrated high effectiveness in rapidly selecting ground investigation locations during national disaster situations.
Keywords: Liquefaction, Deep running, DNN, Prediction of LPI, Map expression
최근 환태평양 지진대를 중심으로 지속적인 강진이 발생하고 있다. 과거 우리나라의 경우 유라시아판 내부에 위치하여 지진에 대체로 안전하다는 인식이 있었으나, 1978년 계기 지진 관측 이래 2016년 경주지진, 2017년 포항지진을 포함하여 규모(magnitude, M) 4.0 이상의 유감 지진이 계속해서 발생하고 있는 추세이다. 최근 발생한 주요 지진으로는 2023년 전북 장수(M 3.5), 충남 공주(M 3.4), 경북 경주(M 4.0), 2024년 전북 부안(M 4.8) 등M5.0 규모에 육박하는 지진이 발생되고 있는 실정으로(Korea Meteorological Administration, 2024), 향후 지진 현상뿐만 아니라 액상화에 대한 위험성 평가 및 지진방재종합대책이 중요한 과제가 될 것으로 판단된다. 액상화 현상과 관련해서 대표적으로 2017년 포항지진으로 인해 산지를 제외한 포항 일부 지역에서 모래 분사(Sand boiling) 및 지반 침하(안벽 침하 등)가 발생하였으며, 이는 국내에서 최초로 관측된 액상화 현상으로 보고 있다. 이러한 현상은 안전 사회에 대한 불안감을 확산시켰고, 지진과 액상화 현상에 대한 연구분야가 급부상하는 계기가 되었다.
현재까지 액상화와 관련된 문제를 해결하기 위해 지진방재종합대책과 연계한 한국형 액상화 평가 및 관리 기술 개발은 행정안전부, 국토교통부, 산학연 등 각 유관기관에서 연구개발을 수행 중에 있으며, National Disaster Management Research Institute (2023a)에서는 “5년간 지역특성을 고려한 액상화 위험 지도 표준모델 및 대응 매뉴얼” 관련 연구결과에 기초하여 지반 액상화 가능성 지도 작성 절차서가 발간된 바 있다. 이 절차서는 KDS 17 10 00 내진설계 일반(Ministry of Land, Infrastructure and Transports, 2024)의 단계별로 기술적 지침을 기반으로 하고 있으며, 액상화 가능성 예비평가, 지반정보 수집·분석, 액상화 가능성 평가, 액상화 가능성 지도 도식 방법을 포함하고 있다. 그럼에도 불구하고 기존의 지반 물성데이터를 액상화 가능성 지도 입력 시 복잡한 절차 및 시간 소요로 인한 한계성을 가지고 있다. 또한, 활용데이터의 누락 또는 잘못된 정보로 이어질 수 있는 데이터의 접근방식은 결정된 데이터의 적용과 관련된 결과의 신뢰성 측면에서도 많은 개선을 필요로 한다. 이와 같은 문제를 해결하기 위한 유사 연구분야에서는 데이터의 오류와 인적·시간적 자원 소모를 줄이는 방식으로 딥러닝과 공간보간기법을 사용한 사례가 증가하고 있다(Park et al., 2021; 2022; Jang et al., 2022). 이에 본 연구에서는 액상화 가능성 지도 시범 제작 사례에서 계산식으로 도출한 액상화 가능성 지수(Liquefaction Potential Index, LPI)와 LPI 예측 모델 설계를 통해 실제 LPI 지도와 예측 LPI 지도를 비교함으로써 LPI 예측 모델에 대한 유효성을 검증하고자 한다.
액상화 가능성 평가는 각 지진시나리오를 바탕으로 지반 정보가 존재하는 각 지점에 대해 수행되어야 하며, 구체적인 평가 절차는 KDS 17 10 00 내진설계 일반(Ministry of Land, Infrastructure and Transports, 2024)을 따른다. 액상화 발생 여부는 대상 지점에서 지반이 액상화에 저항하는 능력을 나타내는 반복저항응력비(Cyclic Resistance Ratio, CRR)와 지진에 의해 발생되는 반복전단응력비(Cyclic Stress Ratio, CSR)의 비율로서 정의되는 안전율로 평가한다. 반복전단응력비는 지반응답해석을 수행하여 결정하고, 반복저항응력비는 현장 시험 결과(N값, qc값, Vs값 등)를 이용하여 결정한다. 액상화에 대한 안전율은 1.0을 적용한다. 안전율이 1.0 이하인 경우 액상화 지역 및 주변 지역에서의 기초 및 지반 구조물의 피해 가능성을 평가하고, 1.0 초과인 경우에는 액상화에 대해 안전한 것으로 판정한다. 전 세계적으로 액상화 평가 방법은 Seed and Idriss (1971)를 기초로 정립되어 있다.
액상화 평가에 활용되는 지진파는 실계측 지진파를 수집하여 가속도 표준설계응답스펙트럼에 매칭하여야 하며, 지역에 따른 설계지진의 세기는 지진 구역에 따른 지진구역계수(Z) 및 재현주기별 위험도계수(I)를 바탕으로 산정하여야 한다. 이 때 설계지진세기는 유효수평지반가속도(S)로 각 행정구역을 기준으로 제시된 암반에서의 수평 지반 운동 수준을 나타낸다. 설계지반운동의 특성은 ‘암반지반설계지반운동의 가속도 표준설계응답스펙트럼’을 따른다(KDS 17 10 00 내진설계 일반; Ministry of Land, Infrastructure and Transports, 2024).
각 지층의 전단파속도는 현장시험으로부터 직접 얻지 못하는 경우, 표준관입시험 또는 콘관입시험에서 구하는 물성치로부터 전단파속도를 계산하는 변환식 중에서 최소 2개 이상을 활용하여 평균값으로 산정한다. 그리고 반복전단응력비 산정을 위하여 지반응답해석을 실시하며 지진파에 대한 기반암 상부의 지반 응답(가속도, 속도, 변위) 등을 평가하는 것이다.
LPI 값을 산출하기 위해서는 액상화 안전율(Fs)을 산정하여야 하며, 산정 방식은 식(1)과 같다. 이는 지반의 CRR에 대한 지진력으로 유발되는 CSR의 비로 나타낸다. 이 때 안전율이 1.0 이하면 액상화가 발생한다고 평가하고, 1.0 초과일 때 액상화에 대해 안전한 것으로 판정한다.
Iwasaki et al. (1978)은 액상화 안전율에 심도에 따른 가중치를 곱하고 이를 적분하여 얻어지는 LPI를 제안하였고 전 세계적으로 널리 활용되고 있다. LPI 값이란 0~20 m 깊이 지반의 액상화 피해를 평가하는 지수로 다음의 식(2)에 따라 산출된다. 여기서 주의해야 할 점은 각 심도의 안전율이 1 이상일 경우 F(z)=0, 1 이하일 경우 F(z)=1–Fs(z)이며, W(z)=10–0.5z이다.
인공신경망(Artificial Neural Network, ANN)은 사람의 신경망 원리와 구조를 모방하여 만든 기계학습으로 신호 및 자극(입력 데이터)에 대해 임계값(가중치)을 넘어서면 신호를 전달(출력 데이터)하는 구조이다. 인공신경망은 임계값을 추정하는 은닉층이 1~2개로 간단한 비선형 자료구조 및 패턴에 대해 활용된다. 최근에는 데이터 수집 및 보관 기술이 발전함에 따라 복잡한 비선형 자료 구조 및 패턴에 대해 인공신경망에 대한 활용도가 증가하는 추세이지만 인공신경망 알고리즘 구조상 다양한 한계가 존재한다(Minsky and Papert, 1969). 이를 해결하기 위하여 심층신경망(DeepNeuralNetwork, DNN)이 개발되었다(McCulloch and Pitts, 1943). 심층신경망은 데이터의 경향을 분석하여 이를 회귀분석을 통해 향후 데이터의 거동을 예측하는 방법으로 상대적으로 간편하며, 빠른 학습 속도를 가지고 있어 많은 분야에 다양하게 활용되는 실정이다.
심층신경망의 구조는 Fig. 1(a)와 같이 입력층, 3개 이상의 은닉층 그리고 출력층으로 구성되어 있으며, 각각의 층에는 입력 데이터, 가상의 뉴런(노드, node), 출력 데이터가 존재한다. 출력 데이터는 Fig. 1(b)와 같이 각 노드의 가중치(weight)와 편향(bias)을 통해 임계값을 추정하며, 비선형 함수를 통해 획득이 가능하다. 은닉층이 깊어질수록 최종 출력층에 도달하는 경우의 수가 증가하기 때문에 더욱 좋은 예측 결과를 얻을 수 있지만, 너무 깊은 심층신경망은 gradient vanishing 문제가 발생하여 과적합이 발생할 수 있다. 따라서 적정한 은닉층을 구성해야 한다.
Iwasaki et al. (1978)은 액상화 안전율에 심도에 따른 가중치를 곱해 이를 적분하여 얻어지는 LPI를 제안하였으며, 전 세계적으로 널리 활용되고 있다. LPI는 지표면으로부터 0~20 m까지 4단계로 구분하여 액상화 피해를 평가하는 지수이다. 4단계 범위는 매우 낮음(LPI=0), 낮음(0 구체적인 평가 절차는 KDS 17 10 00 내진설계 일반(Ministry of Land, Infrastructure and Transports, 2024)에 제시된 지침과 지반 액상화 가능성 지도 작성 절차서(National DisasterManagement Research Institute, 2023b)를 따라 수행하였다. Table 1은 A지역과 B지역의 시추공에 대한 빈도별 액상화 가능성 지수를 도출한 결과이다. Fig. 2는 LPI 도출을 위하여 위 지침과 절차서를 따라 작성한 액상화 평가시트 예시이다. Table 1 . Liquefaction potential index by frequency.
Frequency Outlier data LPI=0 LPI≤5 5 15 500y 133 2,084 146 106 57 1,000y 2,051 131 124 87 2,400y 1,985 127 151 130
학습 데이터는 국토지반정보통합DB센터에서 보유한 2,393공(A지역: 1,336공, B지역: 1,057공)을 기준으로 지층 정보와 흙의 종류(액상화는 모래지반에서 발생)를 구분하기 위하여 1공당 1m 단위로 나누어 최종적으로 활용할 학습 데이터 수는 A지역 20,026개, B지역 12,162개이다. Fig. 3은 LPI 예측모델 설계 프로세스를 나타낸다.
입력 데이터 인자는 토층 깊이(Depth), 표준관입시험(Standard Penetration Test, SPT) N값(N-value), 흙의 종류(Soil), 흙의 단위중량(Unit weight), 세립분 함유량(Fine Content, FC), 전응력(Total stress), 유효응력(Effective stress), 구속압 보정 N값(N1) 그리고 전단파속도(Vs)의 9개 인자를 입력 데이터로 적용하였다. 데이터 정규화를 실시하여 데이터 간의 유형을 인수로 통일시켰다. 그 과정에서 Soil은 문자열 형태이므로 인수 형태로 통일시키기 위하여 One-hot encoding 기법을 적용하였다. One-hot encoding 기법은 문자열 데이터를 1 또는 0으로 표현하며, Soil열의 8개 흙의 종류 중 하나의 인자가 포함되면 (1,0,0,0,0,0,0,0)과 같이 나타낼 수 있다. 이러한 과정을 거쳐 모든 데이터 인자들이 인수 형태로 변경된 후 각각의 데이터에 대해 정규화를 실시하였다. 정규화 방법은Min-max scaling 기법을 통해 0과 1 사이의 값으로 환산하였다. 환산 수식은 식(3)과 같다.
여기서 Xnorm은 정규화 된 인자이며, Xmax와 Xmin는 각각 인자들의 최대값과 최소값을 의미한다.
500년, 1000년, 2400년 빈도에 해당되는 LPI 값을 추정하기 위해 회귀 분석에 활용도가 높은 딥러닝 알고리즘 중 DNN을 활용하였다. LPI 예측 모델의 구조는 Fig. 4와 같이 입력층과 은닉층 그리고 출력층으로 구분되어 있으며, 총 9개의 입력 데이터를 통해 1개의 출력 데이터인 LPI 값을 예측하는 모델을 개발했다. 은닉층은 4개의 층으로 구성되어 있으며, 각 층의 노드는 각각 64개, 32개, 16개, 8개이다. 그리고 활성화 함수는 Rectified LinearUnit (ReLU)를 활용했으며, 초기 가중치 설정은 ReLU 함수에 적합한 He Initialization 기법을 사용하였다(He et al., 2015).
또한 모델의 성능 및 속도를 향상시키기 위해서 최적화 방법인 Adaptive Moment Estimation (Adam) 기법을 활용하였다. 여기서 Adam 기법은 Momentum과 RMSProp의 장점을 결합하여 개발된 최적화 기법으로 학습 속도를 높이고 안정적인 가중치(weight)의 업데이트가 가능한 알고리즘이다(Kingma and Ba, 2014). Adam 기법의 단점으로 학습률이 너무 커지거나 작아지는 경우 즉, 과적합 현상의 발생율이 높다. 이러한 현상을 방지하기 위해 본 연구에서는 다음의 2가지 방법이 활용되었다. 첫째, 은닉층 구성인 노드에서 일부분만 사용하여 전체적인 학습량 및 가중치 업데이트 횟수를 줄이는 drop out 기법을 적용하여 은닉층의 각 층별 노드 중 전체 노드 80%만 사용하였다. 두 번째 방법으로는 조기종영기법이다. 학습 수에 따라 오차율이 갱신되는 DNN구조에 따라 최소 오차율이 적용된 모델을 구축해야 된다. 조기종영기법은 최소 오차율이 적용되었을 때 강제로 학습을 종료시키는 기법이다.
학습 데이터의 정규화 이후 딥러닝 예측 모델을 검증하기 위해 Hold-out validation 기법을 활용했다(Steinbach and Kumar, 2007). 해당 기법은 데이터 셋을 training data와 test data로 구분하여 모델의 성능을 평가하는 기법으로 본 연구에서는 전체 데이터 길이(20,026개, 12,162개) 중 80% (16,020개, 9,729개)는 모델이 학습하는 용도로 활용하였고, 20% (4,006개, 2,433개)는 계산 값과 비교 검증하는 용도로 활용되었다. 또한, 계산 값과 비교한 20%에 대해 정량적인 오차율을 계산하기 위하여 Root Mean Squared Error (RMSE), Mean Absolute Error (MAE), R-squared (R2)를 활용하였다.
LPI 예측모델을 통해 500년 빈도 LPI, 1000년 빈도 LPI, 2400년 빈도 LPI의 예측 데이터를 수집하였으며, 이를 계산 값과 검증하였다. 검증 결과는 Fig. 5와 같으며, Fig. 5(a)와 5(b)는 각각 A지역과 B지역의 500년 빈도 LPI, Fig. 5(c)와 5(d)는A지역과 B지역의 1000년 빈도 LPI, 마지막으로 Fig. 5(e)와 5(f)는A지역과 B지역의 2400년 빈도 LPI이다. LPI 예측모델에서 조기종영 기법을 활용한 결과는 Fig. 5(a)~(f) 순으로 학습 수(Epoch)는 각각 19회, 22회, 13회, 18회, 22회, 24회이다. 9개의 입력 데이터를 가지고 DNN을 활용한 LPI 예측모델에서는 계산 값과 예측 값에 대한 오차율은 크게 산출되었으며, 특히 이상치 데이터가 넓게 분포되어 있었다. 오차율은 RMSE (범위: 0.18~0.39), MAE (범위: 0.02~0.22), R-squared (범위: 0.64~0.85)로 산출한 결과에 기초하여 Fig. 6에 도시하였다. 그 결과, 데이터 수가 상대적으로 많은 A지역이 B지역보다 오차율이 더 낮게 산정되었다. 빈도에 따른 결과에서 RMSE와MAE는 A지역과 B지역이 동일하게 500년 빈도 LPI, 1000년 빈도 LPI, 2400년 빈도 순으로 LPI의 오차율이 낮아졌으나, 상이하게 R-squared은 2400년 빈도 LPI, 1000년 빈도 LPI, 500년 빈도 LPI 순으로 높게 산출되었다. 그 원인은 RMSE와 MAE가 실제 데이터 스케일에 영향을 받는 오차율로 산정하는 방식이므로 2400년 빈도 LPI의 값이 가장 크기 때문에 오차율도 높게 산정된 것으로 판단된다. 따라서 RMSE와MAE는 동일한 빈도에 대한 검증으로만 활용 하고 R-squared는 전제적인 오차율에 대한 검증으로 활용하였다. 그 결과 LPI 예측 모델에서 가장 성능이 좋은 학습 데이터는 A지역이며, LPI 2400년 빈도를 예측하는 조건이다.
LPI 예측 모델의 성능 향상을 위해 학습 데이터를 재구축하였다. 학습 데이터는 기존 9개의 입력 데이터에서 500년 빈도 LPI 그리고 1000년 빈도 LPI를 추가하였다. 출력 데이터 1000년 빈도 LPI 예측에서는 500년 빈도 LPI가 추가되었으며, 2400년 빈도 LPI 예측에서는 500년 빈도 LPI와 1000년 빈도 LPI가 추가되었다. 따라서, 출력 데이터 1000년 빈도 LPI와 2400년 빈도 LPI의 입력 데이터 수는 각각 10개와 11개이다. 입력 데이터를 확장시켜 LPI 예측 모델을 구현한 결과는 Fig. 7에 도시하였다. 9개의 입력 데이터만 활용한 결과와 비교하였을 때 정량적인 오차율의 범위는 RMSE (범위: 0.07~0.12), MAE (범위: 0.01~0.05) 그리고 R-squared (범위: 0.98~0.99)로 나타나 이상치 데이터가 큰 폭으로 감소한 것을 알 수 있다. 입력 데이터의 확장으로 인해 오차율은 RMSE 157%~225%, MAE 100%~340% 감소되었으며, 이에 따라 R-squared는 16%~53% 증가하여 예측 모델의 성능이 향상된 것을 알 수 있다(Fig. 8).
11개 입력 데이터를 활용한 LPI 예측모델을 계산식에 의해 산출된 LPI 단계와 LPI 예측모델을 통해 환산된 LPI 단계를 Fig. 9과 같이 도시하였다. Fig. 9(a)와 9(c)는 각각 A지역 및 B지역의 실제 LPI 단계이며, Fig. 9(b)와 9(d)는 LPI 예측 모델을 활용한 예측 단계이다. 분석 결과, Table 2와 같이 계산 값으로 산출한 A지역의 LPI 단계는 매우 낮음 단계 9개(50.0%), 낮음 단계 3개(16.7%), 높음 단계 3개(16.7%) 그리고 매우 높음 단계 3개(16.7%)로 나타났다. 평가 기준은 액상화의 가능성 측면에서 낮음 단계의 비율(0 Table 2 . LPI level 4 number. 예측 LPI는 5개(27.8%), 7개(38.9%), 4개(22.2%) 그리고 2개(11.1%)로 실제 LPI 조건과 비교 시 낮음 단계의 비율(0 또한, 실제 B지역의 LPI 단계는 매우 낮음 단계 5개(20.0%), 낮음 단계 1개(4.0%), 높음 단계 17개(68.0%) 그리고 매우 높음 단계 2개(8.0%)로 A지역에 비해 높음 단계 및 매우 높음 단계가 전체 76%로 A지역에 비해 B지역이 액상화 가능성이 매우 높으며, 이를 예측한 결과는 매우 낮음 단계 1개(4.0%), 낮음 단계 5개(20.0%), 높음 단계 17개(68.0%) 그리고 매우 높음 단계 2개(8.0%)이다. A지역과 동일하게 낮음 단계의 비율(0
LPI step Very low (LPI=0) Low (0 High (5 Very high (15 Area A Calculated LPI step 9 (50.0%) 3 (16.7%) 3 (16.7%) 3 (16.7%) Predicted LPI step 5 (27.8%) 7 (38.9%) 4 (22.2%) 2 (11.1%) Area B Calculated LPI step 5 (20.0%) 1 (4.0%) 17 (68.0%) 2 (8.0%) Predicted LPI step 1 (4.0%) 5 (20.0%) 17 (68.0%) 2 (8.0%)
본 연구에서는 딥러닝 기법을 활용하여 산출한 LPI 예측 모델과 계산식으로 도출한 LPI 모델의 비교를 통해 LPI 예측 모델에 대한 유효성을 검증하였다. 연구 결과는 다음과 같다.
1) DNN을 활용한 LPI 예측 모델에서 500년, 1000년, 2400년 빈도 LPI의 예측 데이터를 수집하여 계산 값과 비교한 결과, 예측 값과 실제 값 간의 오차율이 크게 산출되었으며, 이상치 데이터가 넓게 분포하는 경향을 보였다. 정량적인 오차율은 RMSE (범위: 0.18~0.39), MAE (범위: 0.02~0.22), R-squared (범위: 0.64~0.85)로 나타났고, RMSE와 MAE는 빈도에 따라 감소하였으나 Rsquared는 빈도가 증가함에 따라 높아지는 경향이 있었다. 그 이유는 RMSE와 MAE가 실제 데이터 스케일에 영향을 받는 오차율로 산정하는 방식이므로 2400년 빈도 LPI의 값이 가장 크게 나타남에 따라 오차율도 높게 산정된 것으로 판단된다.
2) LPI 예측 모델의 성능을 향상시키기 위해 기존 9개의 입력 데이터에 500년 빈도 LPI 및 1000년 빈도 LPI를 추가하여 학습 데이터를 재구축한 결과, 정량적인 오차율은 RMSE (범위: 0.07~0.12), MAE (범위: 0.01~0.05) 그리고 R-squared (범위: 0.98~0.99)로 나타나 이상치 데이터가 큰 폭으로 감소한 것을 확인하였다. 입력 데이터의 확장으로 인해 RMSE는 157~225%, MAE는 100~340% 감소하였으며, R-squared는 16~53% 증가하여 예측 모델의 성능이 향상됨을 확인하였다.
3) LPI가 낮은 경우(LPI≤5)에는 예측의 한계가 있지만 LPI가 높은 경우(5
이 논문은 2024년 국립재난안전연구원의 “재난안전관리업무지원기술개발(R&D)-실증실험 기반 토사재해 취약성 평가기술 개발(NDMI-2024-07-01)”의 지원으로 수행되었습니다.
No potential conflict of interest relevant to this article was reported.
Table 1 . Liquefaction potential index by frequency.
Frequency | Outlier data | LPI=0 LPI≤5 | 515 | | |
---|---|---|---|---|---|
500y | 133 | 2,084 | 146 | 106 | 57 |
1,000y | 2,051 | 131 | 124 | 87 | |
2,400y | 1,985 | 127 | 151 | 130 |
Table 2 . LPI level 4 number.
LPI step | Very low (LPI=0) | Low (0High (5 | Very high (15 | | |
---|---|---|---|---|---|
Area A | Calculated LPI step | 9 (50.0%) | 3 (16.7%) | 3 (16.7%) | 3 (16.7%) |
Predicted LPI step | 5 (27.8%) | 7 (38.9%) | 4 (22.2%) | 2 (11.1%) | |
Area B | Calculated LPI step | 5 (20.0%) | 1 (4.0%) | 17 (68.0%) | 2 (8.0%) |
Predicted LPI step | 1 (4.0%) | 5 (20.0%) | 17 (68.0%) | 2 (8.0%) |