Original Article

Journal of Korean Society of Disaster and Security. 31 March 2026. 1-10
https://doi.org/10.21729/ksds.2026.19.1.1

ABSTRACT


MAIN

  • 1. 서 론

  • 2. 연구대상지 및 데이터

  •   2.1 연구대상지 개요

  •   2.2 위성영상 개요 및 자료

  •   2.3 산사태 및 정상지 표본 데이터 구축

  •   2.4 데이터 통합 및 정리

  • 3. 연구 방법론

  •   3.1 연구 개요

  •   3.2 변수 선정 및 중요도 분석

  •   3.3 모델링 및 학습절차

  •   3.4 분류 임계값(Threshold) 선정 절차

  • 4. 결과 및 분석

  •   4.1 프로그램 학습 결과

  •   4.2 기존 활용 지표 대비 검출된 수식의 적절성

  • 5. 결 론

1. 서 론

기후변화와 국지성 강우의 증가로 인해 산림 지역의 산사태 발생 빈도와 규모가 점차 증가하고 있으며(Yun et al., 2022; Lee et al., 2021), 더욱이 산사태는 발생 시 대규모로 피해를 유발할 수 있는 자연재해로, 발생 여부를 조기에 탐지하고 복구를 진행하는 것이 생명과 재산을 보호하기 위한 핵심적인 과제이다(Lee et al., 2018). 특히, 산악지형은 인력으로 접근해서 모든 지역을 확인하기 쉽지 않기 때문에 광역적이고 정량적인 원격탐사 기법의 활용이 필수적이다(Woo et al., 2014). 이에 따라, 최근에는 넓은 지역을 신속하게 확인할 수 있는 위성영상 사진을 산사태 위험분석에 사용하고 있다. 유럽우주국의 Sentinel-2 위성영상은 고해상도 다중 스펙트럼 데이터를 주기적으로 제공하여, 식생, 토양, 수분 등의 지표를 해석하는 데 유용하게 사용되고 있다. 그에 따라 최근에는 산사태 연구에도 위성 영상의 밴드 데이터를 활용한 연구가 활발히 진행되고 있다. Sentinel-2 영상의 밴드 데이터의 RGB 조합 기반 색상 변화를 통해 산사태 지역을 자동으로 추출하는 기법을 연구하였으며(Coluzzi et al., 2025), 우리나라 지역 산사태 탐지 및 위험지도 작성을 위한 적정 위성영상 식생지수 선정에 관한 연구(Lee et al., 2024) 및 InSAR Coherence 영상을 이용한 산사태 탐측 등의 연구에서 위성영상을 활용하여 분석하였다(Jung et al., 2008). 그러나 기존의 대부분 연구는 기존 지수의 활용도나 랜덤포레스트, 서포트벡터머신(SVM) 등 해석이 어려운 블랙박스 모델에 의존하는 경향이 있어 이는 예측 결과에 대한 원인을 파악하거나 실제 응용(예: 위험도 지도 생성, 정책 제안 등) 에 한계를 발생시킨다. 본 연구는 이러한 문제점을 극복하고자, Sentinel-2 밴드 데이터를 기반으로 해석 가능한 수식형 산사태 탐지 모델을 개발하는 것을 목적으로 한다. 구체적으로는, 유전 프로그래밍 기반 수식 탐색 기법인 gplearn을 활용하여 밴드 간 비율과 차이로 구성된 수학적 모델을 자동 생성하고, 그 결과를 QGIS 상에 적용 가능한 구조로 도출하였다.

본 연구는 다음과 같은 점에서 기존 연구와 차별화된다. 첫째, 수식 자체가 해석 가능하므로 산사태 발생 조건을 물리적으로 설명할 수 있다. 둘째, QGIS 등 실제 공간 분석 환경에 수식을 직접 적용할 수 있어 현장 활용도가 높다. 셋째, 모델 성능 평가에서 재현율, 정밀도, 변수 중요도를 종합적으로 비교하여 실제 재난 대응에서의 실용성을 검토하였다.

이러한 과정을 통해, 본 연구는 산사태 탐지 수식의 해석력과 예측력 간 균형을 확보하고, 실무 및 학술 양면에서 기여할 수 있는 방법론을 제시하고자 한다.

2. 연구대상지 및 데이터

2.1 연구대상지 개요

본 연구는 강원도 인제군, 속초시, 양양군, 고성군에 걸쳐 위치한 설악산국립공원 일대를 주요 연구대상지로 선정하였다(Fig. 1). 설악산은 험준한 산세와 다양한 암석 지형을 포함하고 있으며, 연평균 강수량이 1,200 mm 이상으로 풍부한 강우가 집중되는 지역이다. 특히 여름철 태풍 및 집중호우 시 산사태 발생 가능성이 높고, 그간 국립공원공단에서 보유하고 있는 국립공원 내 발생한 산사태지 현황을 비교하여도 국립공원 내 산사태 발생지 568개소 중 설악산국립공원은 357개소 약 63%나 차지하는 등 산사태 발생비율이 높게 나타나고 있다(KNPS, 2024). 설악산 일대는 평균 고도가 높고, 계곡과 사면 경사가 급한 지형이 다수 분포하고 있어, 산사태 발생 시 광범위한 지역에 피해를 유발할 수 있다. 또한, 국립공원, 천연 자연 보호구역 등 토지 이용에 제한적이기 때문에 위성영상 기반 자연변화 탐지에 적합한 공간적 특성을 보인다.

https://cdn.apub.kr/journalsite/sites/ksds/2026-019-01/N0240190101/images/ksds_2026_191_1_F1.jpg
Fig. 1.

Study area

2.2 위성영상 개요 및 자료

본 연구에서는 유럽우주국(ESA)의 Sentinel-2 위성영상을 활용하였다. Sentinel-2는 13개의 분광 밴드를 제공하며, 가시광선, 근적외선, 단파적외선 등 다양한 파장대를 포함한 영상을 촬영하고 있으며, 해당 위성영상 사진은 유럽 우주청에서 제공하고 있으며, 수자원, 재난관리, 도시개발 등 다양한 분야에서 활용되고 있다. 해당 위성은 태양동기궤도에 약 786 km 고도로 움직이면서 전 세계를 5일 주기로 관측할 수 있어 동일 지역을 주기적으로 촬영함으로써 시간적 일관성을 확보할 수 있다. Sentinel-2의 다중스텍트럼 센서는 총 13개의 스펙트럼 밴드에서 데이터를 수집하고 있으며, 본 연구에서는 산사태 탐지와 연관성이 높은 6개의 밴드를 활용하였으며, 그 내용은 Table 1과 같다.

Table 1.

Specification of Sentinel-2 spectral bands used in this study

Band Name Central Wavelength (nm) Description
B2 Blue 490 Surface reflection, Shadow detection
B3 Green 560 Vegetation vitality, Chlorophyll reflection
B4 Red 665 Vegetation absorption, NDVI calculation
B8 NIR 842 Vegetation structure, Moisture analysis
B11 SWIR1 1,610 Soil/Vegetation moisture detection
B12 SWIR2 2,190 Dryness, Wildfire damage detection

이 중 NIR은 근적외선 파장으로 식물 생육 상태 파악을 위한 밴드이며, SWIR은 단파적외선 파장으로 수분 함량을 파악하는 데 활용됨에 따라 이 2개의 밴드는 산림 식생의 상태 및 수분 분포를 민감하게 반영하는 특징을 갖고 있어, 산사태 예측에 중요한 요소로 작용한다. 추가적으로 본 연구에서는 Sentinel 영상에 포함된 SCL(Scene Classification Layer) 정보를 활용하였다. SCL정보는 각 픽셀을 토지 피복유형 또는 상태로 자동 분류하여 제공하는데 해당 내용은 Table 2와 같으며, 본 연구에 사용된 위성영상은 Fig. 2와 같다.

Table 2.

Sentinel-2 Scene Classification Layer (SCL) codes

Code Classification
0 No Data
1 Saturated / Defective
2 Dark Area Pixels
3 Cloud Shadow
4 Vegetation
5 Bare Soils
6 Water
7 Unclassfied
8 Cloud Medium Probability
9 Cloud High Probability
10 Thin Cirrus
11 Snow or Ice

https://cdn.apub.kr/journalsite/sites/ksds/2026-019-01/N0240190101/images/ksds_2026_191_1_F2.jpg
Fig. 2.

Representative examples of Sentinel-2 spectral bands and the Scene Classification Layer (SCL)

본 연구에서는 식생에 해당하는 코드값 4번을 활용하여 산사태가 발생하지 않은 샘플 지역을 선정할 때 식생지역만 분류하여 사용하였다. 또한, 구름으로 인한 데이터 왜곡을 막기위해 구름 피복률이 3% 이하인 영상을 취득하여 분석하였다.

2.3 산사태 및 정상지 표본 데이터 구축

2.3.1 산사태 발생지 구축

본 연구에서 활용한 설악산국립공원 내 산사태 발생지는 국립공원공단에서 매년 모니터링 중인 산사태 발생지에 대한 지리정보 자료를 활용하여 구축하였다. 국립공원공단에서 보유 중인 설악산국립공원 산사태 발생지 데이터는 1995년부터 발생한 산사태지 357개소에 대한 발생 연도, 발생 면적 등의 값을 포함하고 있는 폴리곤 데이터로, 산사태 발생지에 대한 위성영상 밴드값을 추출하기 위하여 각 산사태 발생지 폴리곤의 중심점 포인트를 추출하여 총 357개의 발생지 포인트를 구축하였다(Fig. 3). 각 포인트들은 Sentinel-2 위성영상의 2,3,4,8,11,12 6개 밴드의 값을 포함하도록 데이터를 구축하였다.

https://cdn.apub.kr/journalsite/sites/ksds/2026-019-01/N0240190101/images/ksds_2026_191_1_F3.jpg
Fig. 3.

Center points of landslide sites in Seoraksan National Park

2.3.2 정상지(비산사태지) 데이터 구축

산사태 발생여부 파악을 위한 수식 산정을 위해서 산사태발생지와 비교하기 위한 정상지(비산사태지) 데이터를 구축하였으며, 정상지 데이터는 설악산국립공원구역안에서 위성영상에서 제공하는 SCL=4(산림지역과)과 기존 산사태 발생지를 제외한 구간에서 모델이 산사태지를 보편적인 기준으로 학습하고, 비정상지를 과대평가하는 위험 해소 및 분석의 정확도를 향상하기 위해 발생지보다 포인트 수를 증가하여 500개의 포인트를 무작위로 생성하였으며, 이후 산사태지는 label=1, 정상지는 label=0으로 클래스를 정의하여 두 개의 포인트를 구분하였다(Fig. 4).

https://cdn.apub.kr/journalsite/sites/ksds/2026-019-01/N0240190101/images/ksds_2026_191_1_F4.jpg
Fig. 4.

Sampling of non-landslide points

2.4 데이터 통합 및 정리

각 밴드 값을 샘플링하여 최종 학습용 csv을 Table 3과 같이 구성하였다.

Table 3.

Spectral band values of landslide and non-landslide points

Item Description
b2, b3, b4, b8, b11, b12 6 Sentinel-2 Spectral Bands
label Landslide Status (1: Landslide, 0: Non-landslide)

결과적으로 총 857개의 포인트를 구성하였으며, 이 데이터를 기반으로 수식 생성, 머신러닝 분석을 진행하였다.

3. 연구 방법론

3.1 연구 개요

본 연구는 Sentinel-2 위성영상의 분광 밴드값을 활용하여 산사태 발생지와 비발생지를 판별할 수 있는 수식을 도출하는 것을 목적으로 한다. 이를 위해 유전 프로그래밍(Genetic Programming, GP) 기반의 Symbolic Classification 기법을 적용하였다. 유전프로그래밍(Genetic Programming, GP)은 생물의 진화 매커니즘을 모방하여 최적의 컴퓨터 프로그램을 자동으로 생성하는 머신러닝 기법이다. 수식의 구성요소들을 트리 구조로 결합하여 개체를 생성하고, 이후 세대로 거듭될수록 적합도가 높은 개체를 선택하여 최적의 수식으로 진화시킨다. 본 연구에서는 산사태 발생지(양성)와 비발생지(음성)를 모두 중요하게 판단해야 하는 특성을 고려하여, 민감도(Recall+)와 특이도(Recall−)을 동시에 최적화하는 이중 재현율(Dual Recall) 개념을 도입하였다. 민감도는 실제 산사태지 중 모델이 올바르게 탐지한 비율이며, 특이도는 실제 정상지 중 모델이 올바르게 비탐지한 비율로, 재난 안전 분야에서는 한쪽 재현율이 높더라도 다른 쪽이 낮을 경우 심각한 문제를 초래할 수 있으므로, 두 지표의 균형 확보가 필수적이다.

이중 재현율 최적화는 여러 방식으로 구현될 수 있으나, 본 연구에서는 두 재현율 중 낮은 값을 최대화하는 최소 재현율 최대화(min-recall) 방식을 1차 목표로 설정하였다. 이는 양·음성 중 취약한 쪽의 성능을 끌어올려 한쪽으로 치우친 예측을 방지한다. 보조 지표로는 두 재현율의 기하평균(G-mean)과 균형 정확도(Balanced Accuracy)를 활용하여 모델의 전반적인 균형성과 안정성을 검증하였다. G-mean은 민감도와 특이도의 곱의 제곱근으로 계산되며, 두 값이 모두 높고 균형을 이룰 때 높은 점수를 나타낸다. 한쪽 재현율이 낮아질 경우 값이 급격히 감소하므로, 클래스 간 성능 불균형에 매우 민감하게 반응한다. 반면 균형정확도는 두 재현율의 산술평균으로, 직관적으로 모델이 양·음성 클래스를 평균적으로 얼마나 잘 판별하는지를 보여준다. 최적화 절차는 다음과 같다. 먼저 전체 자료에 대해 5-fold 교차검증을 적용하여 각 Fold마다 독립적인 학습-평가 환경을 구성하였다. 각 Fold의 학습용 데이터는 다시 내부적으로 학습·검증 세트로 분할하고, 산사태 357개소와 정상지 500개소로 구성된 본 연구에서 산사태 발생지를 놓치지 않도록 산사태 클래스에 대한 양성 클래스 가중치(Positive Class Weight) 후보군(2.0–5.0 범위)을 설정하여 GP 모형을 반복 학습하였다. 양성 클래스 가중치는 정상지 판별 성능이 저하되거나, 과도한 산사태지로 판별하는 것을 막기위해 2.0–5.0으로 선정하였다. 각 후보 가중치에 대해 검증 세트에서 이중 재현율을 계산하고, 이중재현율이 가장 높은 가중치를 해당 Fold의 최적값으로 선택했다. 이와 병행하여, 예측 확률에 대한 분류 임계값(Thresholds)은 0.2–0.8범위를 적용 후 탐색을 통해 결정하였다. 실험 결과, 이러한 설정을 통해 5개 Fold 전반에서 이중재현율과 균형정확도가 일정 수준 이상으로 유지되면 Fold간 편차도 감소하는 등, GP 기반 수식의 성능과 안정성이 향상되는 것을 확인하였다. 최종적으로는 각 Fold에서 도출된 수식 중 이중재현율이 높고 구조가 단순하고 해석이 가능한 수식을 후보 지수로 선정하여 산사태 발생지 평가에 직접 활용 가능한 방안을 제시하였다.

3.2 변수 선정 및 중요도 분석

본 연구에서는 초기 단계에서 Sentinel-2 위성영상의 6개 밴드(B2, B3, B4, B8, B11, B12)를 후보 변수로 설정하였다. 이후 밴드 조합을 활용하여 산사태 발생지역과 비 발생지역에 대해 지표별로 분석의 효과성을 평가하여 산사태 탐지에 상대적으로 높은 기여도를 보이는 4개 밴드(B3, B8, B11, B12)를 최종 변수로 선정하였다. B3(Green)는 식생 상태와 토양 노출 정도를 구분하는 데 효과적이며, B8(NIR)은 식생 활력 및 산사태 후 식생 훼손 감지에 유용하다. B11(SWIR1)은 토양 및 암석의 습윤도 분석에 강점을 가지며, B12(SWIR2)는 광물 및 토양 반사율 차이를 통해 노출 암반과 훼손지를 식별하는 데 기여한다. 반면, B2(Blue)는 대기 산란 영향이 크고 산사태 경계 구분 기여도가 낮았으며, B4(Red)는 NIR과의 정보 중복성이 높아 독립 변수로서의 중요도가 상대적으로 낮게 나타났다.

따라서 B3, B8, B11, B12를 사용함으로써 불필요한 노이즈를 줄이고, 수식의 단순성과 해석 가능성을 동시에 확보할 수 있었다. 또한, GP기반 수식 탐색 단계에서는 이들 4개 기본 밴드뿐만 아니라, 기존에 활용중인 파생지표를 함께 입력 변수로 사용하였다. 구체적으로 식생과 토양의 수분함량을 나타내는 NDMI(B8-B11B8+B11), 토양 및 암석의 반사율이 높은 SWIR2대역과 식생 반사율이 높은 GREEN 대역의 대조를 통해 산사태 발생지를 강조하기 위해 SWIR2-GREEN 비율 지수(B12B3) 및 SWIR2-GREEN 차이 지수(B12-B3)를 사용하고, 산사태로 인한 식생 소실 및 지표면 노출 탐지에 유효한 NBR(B8-B12B8+B12)의 지표 등 단일 밴드뿐만 아니라 식생 및 수분 상태를 복합적으로 반영하기 위해 기존의 원격탐사 지수도 활용하였다.

3.3 모델링 및 학습절차

본 연구에서는 Sentinel-2 위성영상의 밴드 조합을 통해 산사태지를 자동으로 탐지할 수 있는 최적의 수식을 도출하기 위해 유전 프로그래밍(Symbolic Genetic Programming) 기법을 적용하였다. 유전 프로그래밍은 생물의 진화 원리를 모방하여 최적의 해를 탐색하는 알고리즘으로 본 연구에서는 Python의 유전프로그램인 gplearn 라이브러리를 활용하였다. 본 연구 모델의 연산자는 덧셈, 곱셈, 나눗셈(보호 연산자 적용), 제곱근으로 구성하여 해석 가능한 형태의 수식이 도출되도록 설계하였으며, 목적 함수 설정 시 예측 성능뿐만 아니라 수식의 단순성(Parsimony)을 동시에 고려하였다. 특히 본 연구는 산사태 탐지를 이진분류 문제로 정의하고, 모델의 적합도 평가를 위해 오차행렬(Confusion Matrix)을 도입하였다. 오차행렬은 모델의 예측이 실제값과 얼마나 일치하는지를 보여주는 지표로, 실제 산사태 발생지를 산사태로 정확히 예측한 경우(True Positive, TP), 정상지를 정상지로 올바르게 분류한 경우(True Negative, TN), 실제로는 정상지이나 산사태로 잘못 예측한 경우(False Positive, FP), 그리고 실제 산사태지를 놓친 경우(False Negative, FN)로 구분된다. 이를 바탕으로 본 연구에서는 실제 산사태지를 맞춘 비율인 민감도(Sensitivity, TPTP+FN)와 실제 정상지를 정상으로 판별한 비율인 특이도(Specificity, TNTN+FP)를 주요 지표로 산출하였다. 산사태를 놓치지 않는 것(민감도)과 정상지 판별(특이도) 중 낮은 값을 최대로 하는 ‘이중 재현율(Dual Recall)’을 도입하여 클래스 간 균형 잡힌 분류를 유도하였으며, Parsimony coefficient(0.002)를 적용해 수식 구조가 과도하게 복잡해지는 것을 억제하고 실제 분석 환경에서 해석이 가능하도록 단순한 수식이 도출되도록 설계하였다. 학습의 안정성과 탐색 효율성을 확보하기 위해 개체군 크기(Population size)는 2,000, 세대 수(Generations)는 40으로 설정하였으며, 난수 시드는 고정하여 결과의 재현성을 보장하였다. 모델의 일반화 성능 검증을 위해 층화 5-겹 교차검증(Stratified 5-Fold Cross Validation)을 수행하였으며, 각 Fold 내 테스트 세트는 완전히 분리된 상태에서 유지되었으며, 각 세트별 70개 내외의 산사태 발생지를 테스트 데이터로 사용하고 나머지 산사태 발쟁지를 학습에 활용하였다. 더불어 양성 클래스 가중치(Positive Class Weight) 및 분류 임계값은 해당 Fold의 학습 데이터 내부에서만 결정하였다. 이를 통해 교차검증의 기본 원칙을 충족하도록 구성하였다. 각 가중치별로 학습된 모델은 검증 세트에서 분류 임계값(Thresholds)을 0.2–0.8 범위로 가변 적용하며 이중 재현율이 최대가 되는 최적의 조합(가중치 및 임계값)을 선정하는 과정을 거쳤다. 최종적인 모델 평가는 정확도(Accuracy), 정밀도(Precision), F1-score 외에도 G-mean, 균형 정확도(Balanced Accuracy), ROC-AUC 등 클래스 불균형을 고려한 다양한 지표를 활용하였다. 특히 본 연구는 특정 클래스에 편향되지 않는 탐지 성능을 확보하기 위해 Dual Recall과 G-mean을 핵심 지표로 활용하였다. 도출된 최적 수식과 임계값은 별도의 외부 보조 자료 없이 위성영상만으로 산사태 위험지역을 정량적으로 판별할 수 있으며, 복잡한 블랙박스 모델과 달리 수식의 구조를 통해 밴드 간의 상호작용을 직관적으로 이해할 수 있다는 장점을 가진다. 본 연구의 학습절차는 Fig. 5에 도식화 하였다.

https://cdn.apub.kr/journalsite/sites/ksds/2026-019-01/N0240190101/images/ksds_2026_191_1_F5.jpg
Fig. 5.

Landslide analysis capabilities by index

3.4 분류 임계값(Threshold) 선정 절차

산사태 위험지를 Sentinel-2 위성영상에서 식별하기 위해, GP가 산출한 수식으로부터 계산된 예측 값을 어느 수준 이상일 때 산사태로 볼 것인지에 대한 임계값 설정이 필요하다. 본 연구에서는 각 Fold의 검증 세트에서 예측 확률에 대한 분류 임계값을 0.2–0.8 범위에서 단계적으로 변화시키면서 계산하였다. 0.2–0.8 구간을 일정 간격으로 나누고 각 임계값마다 양성재현율, 음성재현율, 이중재현율 등을 계산하였으며, 이 가운데 이중재현율이 최대가 되는 임계값을 우선 후보로 선정하고, 그 주변 구간의 임계값을 보다 세밀하게 구분하여 동일한 과정을 반복함으로써 최종 임계값을 결정하였다. 이와 같이 각 Fold에서 이중재현율을 최대화하는 최적 임계값을 얻은후, Fold별 최적 임계값의 평균을 실제 적용을 위한 대표 임계값으로 사용하였다. 예를 들어 본 연구에서 도출된 후보 산사태 지수에 대한 검증결과 평균 최적 임계값이 “T”라면, 산사태지수 ≥ T를 만족하는 픽셀을 산사태발생지역으로 자동 분류할 수 있다. 이를 통해 현장 조사 없이도 위성영상만으로 위험 지역을 도출할 수 있으며, 특히 대규모 산지나 접근이 어려운 지역에서 신속한 사전 모니터링 및 예경보 체계 구축에 활용할 수 있다.

4. 결과 및 분석

4.1 프로그램 학습 결과

본 절에서는 3장에서 제시한 방법론을 바탕으로 수행한 5-Fold 교차 검증 결과를 정리하였다. 각 Fold별로 양성 클래스 가중치(Positive Class Weight), 임계값(Threshold), 이중 재현율(Dual Recall) 및 양성재현율 및 정확도를 계산하여 Table 4에 표시하였다.

Table 4.

Validation metrics for each fold in 5-fold cross-validation

Fold Positive Class Weight Threshold Dual Recall Recall Accuracy
1 5.0 0.7321 0.6389 0.6389 0.6471
2 5.0 0.7500 0.6842 0.6944 0.6882
3 3.0 0.6750 0.5526 0.6806 0.6022
4 2.0 0.5643 0.6389 0.6389 0.6774
5 4.0 0.7321 0.6957 0.7183 0.7043

5-Fold 교차검증 결과, 각 Fold별로 도출된 수식의 구조는 상이하였다, 이는 유전 프로그래밍이 진화 과정에서 확률적 탐색을 수행함에 따른 알고리즘적 특성에 기인하다. 그러나 본 연구에서는 각 Fold별 수식 구조가 다르더라도 정확도의 범위가 0.60–0.70, 이중재현율은 0.55–0.69범위내 분포하는 등 일관된 성능을 보였다. 또한 Fold별 최적 분류 임계값은 0.5643–0.7500 범위에 분포하였으며, 평균 값은 약 0.691로 나타났다. 평균 이중재현율은 0.642, 평균 정확도는 0.664수준으로, 산사태지와 비산사태지를 동시에 안정적으로 구분하는 성능을 보이고 있다. 특히 Fold5에서 도출된 수식은 이중재현율 0.6957, 정확도 0.7043으로 가장 우수한 성능을 보여, 본 연구에서는 이 수식을 대표 수식 후보로 선정하였다. 실무 적용시에는 평균 최적 임계값 0.73이상인 픽셀을 산사태 가능지역으로 분류할 수 있다.

4.2 기존 활용 지표 대비 검출된 수식의 적절성

대표적인 위성영상 기반 지표인 NDVI, NBR, NDWI와 비교하여 본 연구에서 제안된 수식의 해석적 특성을 검증하였다. NDVI, NBR 등은 산사태 전용 지수는 아니나, 산림의 식생 및 수분 변화를 탐지하는 가장 보편적인 지표로 주로 활용되고 있다. 그에 따라 본 연구에서 제안된 수식이 산사태 지형을 탐지하는데 기존 지표보다 특화된 성능을 제시하고 있다는 것을 검증하기 위하여 각 지표별로 비교하여 그 결과를 Table 5에 제시하였다. 모델 성능 검증을 위해 사용된 F1-score는 정밀도와 재현율의 평균으로 두 지표가 모두 일정 수준 이상일 때 높은 값을 나타내며, ROC-AUC는 산사태와 비산사태지를 구분하는 전체적인 능력으로 1.0에 가까울수록 우수하다, Balanced Accuracy는 민감도와 특이도의 산술평균으로 산사태지와 비산사태지의 균형 잡힌 탐지 성능을 평가하는 척도로 사용한다.

Table 5.

Comparison of landslide detection performance by index

Index Dual Recall F1-score ROC-AUC Balanced Accuracy
NDVI (B8-B4B8+B4) 0.4861 0.4268 0.4902 0.4952
NBR (B8-B12B8+B12) 0.5877 0.5488 0.6207 0.6064
NDWI (B3-B8B3+B8) 0.5000 0.4458 0.5242 0.5069
SWIR Ratio (B11B8) 0.6316 0.5839 0.6665 0.6422
Proposed (B12B3-NDMI*) * NDMI(B8-B11B8+B11)0.69570.65580.72010.7043

Table 5에서 보듯 제안된 수식은 타 지표 대비 Dual Recall, ROC-AUC 및 Balanced Accuracy 등에서 개선된 성능을 보이고 있는데 NDVI 등 기존 지표의 Dual Recall과 Balanced Accuracy는 대체로 0.49–0.64 수준에 머문 반면, 본 연구에서 제안한 수식은 모두 0.7 수준까지 향상된 값을 보였다. 이러한 결과는 제안한 수식이 건조·노출 증가 및 식생·수분 감소 특성을 동시에 반영하고 있어 균형 잡힌 산사태 발생지 탐지 모델로 평가된다.

5. 결 론

본 연구는 Sentinel-2 다중분광 밴드 자료와 유전 프로그래밍(Symbolic Genetic Programming)을 활용하여 산사태 발생지와 비발생지를 판별할 수 있는 해석 가능한 산사태 탐지 수식을 개발하였다. 설악산국립공원의 357개 산사태 발생지와 500개 정상지를 기반으로 수식을 학습한 결과, 제안된 식은 기존의 NDVI, NBR, NDWI 등 주요 광학 지수보다 Dual Recall, Balanced Accuracy, ROC-AUC에서 우수한 성능을 보였다. 특히 제안 수식은 B12(SWIR2)–B3(Green) 조합과 NDMI 기반의 습윤도·식생 훼손 패턴을 동시에 반영하여, 산사태 지역의 특징인 토양 노출 증가와 수분 감소를 효과적으로 표현하였다. 또한 수식 형태가 단순해 QGIS 등 공간분석 환경에서 직접 적용 가능하다는 점에서 현장 활용성이 높다. 향후 광역 산지 모니터링, 국립공원 사면 관리, 산사태 위험지도 작성에 활용될 수 있다. Sentinel-2 기반의 데이터 접근성과 규칙 기반 모델의 간결성은 실제 현장에서의 적용 가능성을 높여 재난 대응 및 사전예방 체계에 기여할 것으로 기대된다.

Acknowledgements

이 논문은 행정안전부의 재난관리(방재안전분야) 전문인력 양성사업의 지원을 받아 제작되었습니다.

References

1

Coluzzi, R., A. Perrone, C. Samela, V. Imbrenda, S. Manfreda, L. Pace, and M. Lanfredi. (2025). Rapid Landslide Detection from Free Optical Satellite Imagery Using a Robust Change Detection Technique. Scientific Reports. 15: 4697.

10.1038/s41598-025-89542-839922886PMC11807160
2

Jung, Jae Hoon, Hong Kyu Sohn, Jeong Hwan Kim, and Sang Min Kim. (2008). Monitoring of Landslide Using InSAR Coherence Image. Proceedings of the Korean Society for Geospatial Information System Conference. 301-305.

3

Korea National Park Service. (2024). Internal Report on Landslide Status. Wonju: KNPS.

4

Lee, Jun Hee, Sang Wook Lee, Young Jae Yoo, Kyoung Min Kim, and Seong Woo Jeon. (2024). Selecting Appropriate Vegetation Indices for Detection and Prediction Mapping of Landslides in South Korea. Journal of Climate Change Research. 15(4): 477-488.

10.15531/KSCCR.2024.15.4.477
5

Lee, Sang Hee, Won Ok Jeong, Ju Ung Yun, Myeong Jun Kim, Hong Seok Bang, and Youn Tae Lee. (2018). A Study on Risk Evaluation and Management Plans for Trail in Landslide Prone-Areas of Korea National Parks. Journal of National Park Research. 9(1): 27-32.

6

Lee, Youn Tae, Jin Hak Kim, and Ju Ung Yun. (2021). Analysis on Characteristics of Occurrence Time and Region by Mountainous Sediment Disaster in Korea. Journal of Crisis and Emergency Management. 17(8): 13-23.

10.14251/crisisonomy.2021.17.8.13
7

Woo, Choong Shik, Hyun Jung Kwon, Chang Woo Lee, and Kyong Ha Kim. (2014). Landslide Hazard Prediction Map Based on Logistic Regression Model for Applying in the Whole Country of South Korea. Journal of the Korean Society of Hazard Mitigation. 14(6): 117-123.

10.9798/KOSHAM.2014.14.6.117
8

Yun, Ju Ung, Won Ok Jeong, Jun Hyo Park, Toun Tae Lee, Kye Won Jun, and Sang Hee Lee. (2022). Study on Effective Management Plan by Characteristics of Landslide Occurrence Area in Korea National Parks. Journal of Crisis and Emergency Management. 17(7): 55-69.

10.14251/crisisonomy.2021.17.7.55

Korean References Translated from the English

1

국립공원공단 (2024). 산사태 현황 내부 통계 자료. 원주: 국립공원공단.

2

우충식, 권현정, 이창우, 김경하 (2014). 로지스틱 회귀모형을 이용한 전국 산사태 발생위험 예측지도 개발. 한국방재학회논문집. 14(6): 117-123.

10.9798/KOSHAM.2014.14.6.117
3

윤주웅, 정원옥, 박준효, 이윤태, 전계원, 이상희 (2022). 국립공원 내 산사태 발생지역의 특성에 의한 효율적인 관리방안 연구. 위기관리이론과실천. 17(7): 55-69.

10.14251/crisisonomy.2021.17.7.55
4

이상희, 정원옥, 윤주웅, 김명준, 방홍석, 이윤태 (2018). 국립공원 산사태 발생 위험지역 내 탐방로 위험도 평가 및 관리방안. 국립공원연구지. 9(1): 27-32.

5

이윤태, 김진학, 윤주웅 (2021). 국내에서 발생한 산지토사재해의 발생시기 및 발생지역 특성 분석. 위기관리이론과실천. 17(8): 13-23.

10.14251/crisisonomy.2021.17.8.13
6

이준희, 이상옥, 유영재, 김경민, 전성우 (2024). 우리나라 지역 산사태 탐지 및 위험지도 작성을 위한 적정 위성영상 식생지수 선정에 관한 연구. 기후변화연구. 15(4): 477-488.

10.15531/KSCCR.2024.15.4.477
7

정재훈, 손홍규, 김정환, 김상민 (2008). InSAR Coherence 영상을 이용한 산사태 탐측. 한국GIS학회 춘계학술대회. 301-305.

페이지 상단으로 이동하기