Original Article

Journal of Korean Society of Disaster and Security. 31 December 2024. 117-128
https://doi.org/10.21729/ksds.2024.17.4.117

ABSTRACT


MAIN

  • 1. 서 론

  • 2. 본 론

  •   2.1 데이터 오류신호의 검지

  •   2.2 다중선형회귀(MMLR) 학습 오류신호 검지

  •   2.3 합성곱 심경망(CNN) 학습 오류신호 검지

  • 3. 결 론

1. 서 론

산업화를 통해 급속도로 개발된 국내 SCO 시설물의 공용년수가 30년을 초과하여 시설물의 노후화 추세가 뚜렷해짐에 따라 케이블 교량의 노후화 또한 함께 진행되고 있어 구조적 안전사고의 발생 위험성 또한 함께 증가하고 있는 추세이다. 이러한 시설물의 효과적 유지관리를 위해 구조물의 거동을 상시 모니터링하고 상태를 파악하기 위해서는 모니터링 시스템의 구축과 운영이 필수적이다. 교량의 효과적인 유지관리를 위해서는 주기적인 교량 상태점검 뿐 아니라 교량을 대상으로 한 모니터링 시스템을 구축하여 상시적으로 대상 시설물의 이상거동을 감시하고 시스템으로부터 취득되는 정, 동적 데이터를 효과적으로 분석하는 것이 필요하다.

모니터링 시스템을 교량에 적용할 때, 시스템의 설치목적, 설치조건 등에 따라 다양한 전기적 센서를 최적의 위치에 배치하고 이를 통해 시설물의 구조적 거동상태를 반영한 전기적 신호를 수집하여 그 신호특성을 분석하는 방식으로 모니터링을 수행한다. 센서로부터 수집되는 모니터링 데이터의 신호특성은 교량의 실제 거동을 반영하여 변동이 발생하고 이를 통해 대상물의 거동상태를 판정하는 방식으로 모니터링 시스템이 운영된다. 교량의 비정상 거동 등으로 인해 발생하는 데이터는 일반적 상황에서 수집되는 데이터와 상이한 경향 또는 계측 치를 나타내게 되며 이는 전체적인 신호 경향을 벗어나 통계 분석 결과의 일관성에 영향을 주는 비 일상적 이벤트로 작용하게 된다(Kim, 2021). 이러한 데이터 오류신호는 구조물의 이상상태로 인해 발생되는 것이 일반적이나 그 외에도 모니터링 시스템의 오류, 전기적 노이즈, 센서 자체의 기능이상 등 시설물의 거동과 무관한 원인에 따라 변동이 발생될 수 있어 해당 데이터의 오류신호를 판단하고 데이터 이상의 종류, 경향에 따른 이상원인을 구분하여 유의미한 오류신호와 단순 노이즈를 구분, 처리하는 것이 필요하다(Liu et al., 2004).

본 연구에서는 대상 교량으로부터 수집한 데이터를 통해 오류신호를 특정하고 이를 기반으로 교량상태를 평가할 수 있는 검지기법을 분석하였다. 기존의 교량 모니터링에 사용되고 있는 구조적 허용치 기반의 이상검지 기법으로는 구조적 한계내에서 거동하였으나 장기적으로 교량에 심각한 영향을 미칠 수 있는 비일상적, 비정상적인 이상 데이터의 검지가 불가능하다는 단점이 있다. 이러한 문제를 해결하기 위해서 데이터의 오류신호를 검지, 특정할 수 있는 검지기법을 적용하였고 이를 실제 시설물 모니터링 데이터를 활용하여 해당 검지기법의 오류신호 검지성능을 확인하였다.

2. 본 론

2.1 데이터 오류신호의 검지

모니터링 시스템으로부 취득된 데이터의 오류신호를 검지하기 위해서는 데이터 형식에 적합한 오류신호 검지기법을 선택 적용해야 한다. 본 연구에서는 다중선형회귀(MMLR) 기법과 합성곱 신경망(CNN)기법을 적용하여 취득된 데이터 내에 존재하는 오류신호를 검지 할 수 있도록 하였고 이를 실제 시설물 모니터링 데이터에 적용, 오류신호 검지 기법의 성능을 평가하였다.

2.2 다중선형회귀(MMLR) 학습 오류신호 검지

MMLR 학습 기법을 이용한 구조건전성 모니터링 데이터의 결함진단은 Fig. 1의 플로우차트에서 확인할 수 있듯이 Data denoising, One-step ahead forecasting, Fault detection, 그리고 Recovering fault data 4가지 단계로 진행되었다. 해당사례는 집중된 다중센서로부터 취득된 데이터의 오류신호를 판단하기 위해 설계되었는데 세부적으로는 가우시안 필터를 이용하여 실시간 계측데이터를 수집 및 가공한 후, 다중선형회귀(MMLR) 모델을 이용해 one-step ahead 예측을 학습시켜 데이터를 예측하도록 하였다. 그 후에는 각각의 센서에 대한 예측치와 실제 계측치 사이의 편차를 분석하여 경계조건을 초과한 데이터를 결함으로 검지하였다. 경계값 벡터는 각각의 센서에 대한 MMLR 예측 데이터와 실제 계측치 간의 최대 오차를 기반으로 설정하였다.

https://cdn.apub.kr/journalsite/sites/ksds/2024-017-04/N0240170412/images/ksds_2024_174_117_F1.jpg
Fig. 1.

Anomal data detection and recover of real-time monitoring data

여기서,

- Xi+11은 첫 번째 센서의 One-step ahead 예측

- Xi+11은 첫 번째 센서의 One-step ahead 측정

- 𝛿는 결함검지를 위한 경계값 벡터

- n은 센서의 개수

해당사례는 Fig. 2와 같이 여수교에 설치된 가속도센서로부터 취득된 데이터를 기반으로 오류신호를 예측하여 구조물의 건전성 상태를 모니터링 하는 테스트를 진행하였다. 해당사례를 통해 취득된 데이터의 처리 및 이를 이용한 건전성 확인절차까지의 전체적인 데이터 처리순서를 확인할 수 있다.

해당교량에 설치되어 데이터 분석에 사용된 가속도센서는 모두 17개로서 각각 256 Hz의 샘플링레이트를 통해 2시간 동안 계측을 진행하였다. 대상교량의 테스트상황에서 시각적으로 확인된 이상신호는 단 한 건이었다.

https://cdn.apub.kr/journalsite/sites/ksds/2024-017-04/N0240170412/images/ksds_2024_174_117_F2.jpg
Fig. 2.

Acceleration sensor list of Yeo-su bridge

2.2.1 학습-검증 데이터 분리

기계학습 모델을 학습하고 그 결과를 검증하기 위해서는 취득된 원 데이터를 학습하기 전에 미리 Training, Validation, Testing의 용도로 분류하여 작업을 진행해야 하며 이를 학습-검증 데이터 분리라 한다. 본 사례에서는 취득 데이터의 처음 30%(36분)을 Training, 그 다음의 20%(24분)을 Validation, 그리고 마지막 50%(1시간)을 Testing 용도로 분할하여 데이터 학습 및 검증에 사용하였다.

2.2.2 Data denoising

데이터상에 존재하는 노이즈는 회귀 알고리즘을 학습하는데 부정적인 작용을 한다. 그러므로 본 사례에서는 Fig. 3과 같이 가우시안 필터를 사용하여 데이터 필터링 작업을 진행하였다. Fig. 3의 데이터는 acc-103센서에서 1초간 측정된 데이터를 가우시안 필터(𝜎 = 3.0)와 Low-pass 필터(20 Hz)를 적용해 필터링한 결과이다. Low-pass 필터를 그림과 같이 적용한 경우, 20 Hz 미만의 데이터는 모두 유지할 수 있으나 데이터 처리시 시간지연 현상이 발생하여 시간대별 데이터 경향이 일정하게 다음 시간대로 미뤄진다는 단점이 있다.

https://cdn.apub.kr/journalsite/sites/ksds/2024-017-04/N0240170412/images/ksds_2024_174_117_F3.jpg
Fig. 3.

Data filtering using Gaussing, low-pass filter

데이터 필터링 작업에 있어서 중요한 점은 구조물 자체의 거동을 반영하도록 필터링을 조절하는 것이다. 원시데이터의 푸리에 변환과 필터링된 데이터는 위의 Fig. 4에서 확인할 수 있다. 이를 통해 가우시안 필터를 이용해 필터링된 데이터는 구조물의 구조적 건전성 반영한 데이터를 걸러내지 않고 유지하고 있음을 알 수 있다.

https://cdn.apub.kr/journalsite/sites/ksds/2024-017-04/N0240170412/images/ksds_2024_174_117_F4.jpg
Fig. 4.

Frequencty character and filtering result of acc-103 sensor

2.2.3 MMLR(다중선형 회귀) 학습

가우시안 필터링 알고리즘을 통해 가공된 계측데이터를 이용하여 MMLR 학습을 진행하였다. MMLR 기법은 예측기법 중 one-step ahead 방식에 적합하며 한계치 경계값 벡터는 학습이 끝난 후 지정하였다.

2.2.4 결함 주입

학습한 모델의 성능을 평가하기 위해 실험용 데이터 내에 관측이 가능한 3가지 유형의 인공적인 결함을 시험데이터에 주입하였다. 다음의 Table 1Fig. 5에서 주입한 3가지 유형의 결함을 확인할 수 있다.

Table 1.

Fault injection

Fault types Duration Intensity Samples
SHORT - f = {-3, -2, -1, -0.5, 0.5, 1} 600
CONSTANT 0.5 sec, 1 sec f = {-1, 1, 0 (bias)} 600
NOISE 0.5 sec, 1 sec f = {3, 5, 10} 600

https://cdn.apub.kr/journalsite/sites/ksds/2024-017-04/N0240170412/images/ksds_2024_174_117_F5.jpg
Fig. 5.

Types of fault injection and data recovery

2.2.5 결함 주입 방법

(1)
SHORT주입:-SlimSm+fmSlim-Slim-SmSmfSlim-SmSm

- -Slim,°Slim은 센서의 측정한계

- Sm은 센서의 최근 측정값(f는 SHORT 결함을 생성하기 위한 강도 계수)

(2)
CONSTANT주입:W=C,°C=-Slim,Slim,0

- -Slim,°Slim은 센서의 측정한계(0은 편향 상수)

(3)
NOISE주입:W+=N(0,°σ),σ=α1×σ,α2×σ,α3×σ

- 𝜎는 W에 대한 표준편차(α1,α2,α3는 결함데이터의 강도, σ' 값을 토대로 산출)

시험데이터는 전체 데이터의 50%(1시간) 분량으로서 그 중 무작위로 센서를 선정, 해당 센서의 1,800초간 수집된 데이터를 선정하였고 시점상으로 각 결함 유형 간 겹치는 구간이 없도록 조치하였다.

2.2.6 결과

세가지 유형의 결함을 주입하여 오류신호 예측기법을 통한 데이터 분석을 시행한 결과, Fig. 5(a)와 같이 선정한 3가지 유형의 결함 모두 검지되었으며 Fig. 5(b)와 같이 성공적으로 복원되었다.

2.2.7 Model robustness

계측 시스템 중 하나의 센서의 약 10분간 데이터가 누락되었다고 가정하였을 때, 본 연구에서 적용한 오류신호 예측기법을 이용해 데이터 누락을 검지하여 복원한 후, 이 파형을 Fig. 6과 같이 실제 계측데이터와 비교했다. 이를 통해 적용한 기법을 통해 20 Hz 미만의 주파수 영역의 중요 데이터 거동을 정확하게 복원한 것을 확인할 수 있다. 최초 3초간의 복원데이터는 Fig. 7과 같다.

https://cdn.apub.kr/journalsite/sites/ksds/2024-017-04/N0240170412/images/ksds_2024_174_117_F6.jpg
Fig. 6.

Comparison of monitoring data and recovered data

https://cdn.apub.kr/journalsite/sites/ksds/2024-017-04/N0240170412/images/ksds_2024_174_117_F7.jpg
Fig. 7.

The result of missing data recover

해당사례를 이용한 오류신호 예측기법의 구조건전성 모니터링 성능을 분석한 결과, 인위적으로 주입한 모든 SHORT 및 CONSTANT결함들과 75%의 노이즈 결함들을 정확하게 검지하고 복원한 것을 다음의 Table 2와 같이 확인할 수 있었다.

Table 2.

Fault detection result

Fault types SHORT CONSTANT NOISE
Injection 600 600 600
Detection 599 600 449
Result (%) 99.8 100 74.9

2.3 합성곱 심경망(CNN) 학습 오류신호 검지

구조물 계측시스템은 토목시설물의 유지 및 관리를 위해 전세계적으로 널리 사용되고 있다. 구조물 계측시스템은 그 특성상 방대한 양의 데이터를 생성하게 되는데 해당 데이터를 이용한 분석, 데이터 마이닝 및 그 활용에 대한 심도있는 연구는 추가적으로 계속 진행되어야 할 필요성이 있다(Syafrudin et al., 2018). 구조물 계측시스템을 통해 취득한 데이터는 일반적으로 센서이상 또는 시스템 장애로 인한 이상 데이터를 보유하고 있는 경우가 많은데 이런 이상 데이터는 구조적 분석 및 평가를 방해하는 요소로 지적받고 있다(Hong et al., 2018). 구조물 계측시스템에 실질적으로 사용되고 있는 시스템 점검절차에서 아이디어를 얻은 이번 검지기법 적용사례는 구조물 계측시스템을 위해 통계기반 차원 축약방식의 1차원 합성곱 신경망(1D-Convolution Neural Network, 1D-CNN)을 이용한 오류신호 검지기법의 적용을 수행하였다. 수동 데이터 전처리 작업에서는 통계기반이 최대, 최소, 그리고 평균 표준 편차함수는 지정된 시점의 원시데이터에 적용되며 수집된 통계기반 시계열 데이터와 1D-CNN 분류 딥러닝 모델을 기반으로 다음의 Fig. 8과 같이 이상신호 분류에 활용하였다.

https://cdn.apub.kr/journalsite/sites/ksds/2024-017-04/N0240170412/images/ksds_2024_174_117_F8.jpg
Fig. 8.

1D-CNN based anomaly detection method

본 사례적용의 대상은 중국에 위치한 주경간 1,088 m, 측경간 각 300 m이며 주탑 높이 306 m의 초장대 케이블 교량으로서 해당 교량의 구조물 계측시스템은 가속도계, 풍향풍속계, 변형률계, GPS, 온도계 등의 센서로 다양한 물리적 변화를 계측할 수 있도록 구성되어 있다. 해당교량의 가속도계 설치 현황은 다음의 Fig. 9와 같다.

https://cdn.apub.kr/journalsite/sites/ksds/2024-017-04/N0240170412/images/ksds_2024_174_117_F9.jpg
Fig. 9.

Sensor installation for girder and pylon

해당교량의 가속도 계측 시스템은 38채널로 이루어져 있으며 20 Hz의 샘플링 레이트로 744시간 동안 지속적으로 계측을 진행했다. 계측된 데이터는 중복된 데이터 없이 1시간씩 분리시켜 각각의 부분데이터로 분할하였다 각각의 시계열로 분할된 데이터의 종류 및 특징은 다음의 Fig. 10과 같다.

https://cdn.apub.kr/journalsite/sites/ksds/2024-017-04/N0240170412/images/ksds_2024_174_117_F10.jpg
Fig. 10.

The patterns of time series data

머신러닝을 통한 분류작업의 경우, 각각의 패턴에 충분한 학습정보를 제공하기 위해 다양한 패턴의 학습이 가능한 균형잡힌 학습세트가 필요하다(Chandola, 2009; Chandola et al., 2009). 이는 불균형한 데이터세트를 이용한 머신러닝은 편중된 패턴에 대한 과적합 현상을 일으키고 그렇지 못한 패턴에 대한 과소적합 현상을 일으키는 원인이 되기 때문이다 하지만, 실제 구조물 계측 데이터에서 균형잡힌 비정상 데이터를 얻는 것을 불가능하므로 Fig. 11과 같이 균형잡힌 데이터세트를 확보하기 위해 부족한 패턴에 대한 미러링 작업을 수행하였다.

https://cdn.apub.kr/journalsite/sites/ksds/2024-017-04/N0240170412/images/ksds_2024_174_117_F11.jpg
Fig. 11.

Data mirroring

미러링 작업을 완료한 후 학습모델을 위해 각각의 데이터 패턴에 대한 1,000개 예제를 선정하였다. 선정된 학습데이터는 총 7,000개의 시간별 분할 데이터이다.

20 Hz로 계측된 1시간 단위의 각 데이터 패턴은 패턴 당 총 72,000개의 데이터 포인트를 보유하고 있으며 각각이 데이터 패턴들은 Fig. 12와 같이 통계적으로 초당 4개의 요소가 수집된다.

https://cdn.apub.kr/journalsite/sites/ksds/2024-017-04/N0240170412/images/ksds_2024_174_117_F12.jpg
Fig. 12.

Statistical 4 elements (Max, Min, Mean, SD)

통계학적 전처리는 효율적인 데이터 분석을 위해 불필요한 데이터를 정리하고 집약시키기 위해 시행하며 다차원의 데이터를 단차원으로 축약하기 위해 사용된다(Boyd et al., 2013). 본 이상 데이터 검지사례의 경우 계측된 72,000개의 원시 데이터 포인트를 4 × 60(60개 샘플, 4요소)로 전환하여 단순화 시키는 전처리를 거친 후 위의 Fig. 13(a)와 같이 1D-CNN 오류신호 검지에 적용시켰다. 이진 또는 다중분류의 통계학적 분석에서 정밀도 재현율, 그리고 F1scoreFig. 13(a)와 같이 분류결과의 정확도에 따라 좌우되는 척도이며 Fig. 13(b)는 본 사례에 적용한 오류신호 검지 기법의 신뢰도를 추가검증하기 위한 오차행렬이다.

https://cdn.apub.kr/journalsite/sites/ksds/2024-017-04/N0240170412/images/ksds_2024_174_117_F13.jpg
Fig. 13.

Relationship between confusion matrix, precision, recall, score, and accuracy and confusion matrix

“Normal”, “Missing”, “Minor”, “Square” 및 “Trend” 패턴들의 경우, 정밀도와 재현율 모두 높은 값을 유지하는 것을 확인하였다. 그러나 “Outlier”테스트 데이터의 경우 오직 14개만 남았고 그 중 10개만 검지되었다. 또한 일부 “Normal” 데이터 패턴이 “Outlier”로 검지되어 재현율은 낮은 것으로 나타났고 “Drift” 데이터 패턴의 경우 대부분의 패턴이 “Trend” 패턴으로 검지되었다. 이렇 듯 정밀도가 보통인 상황에서 재현율이 낮게 나온 이유는 테스트 데이터를 위한 “Outlier” 및 “Trend”데이터 패턴이 충분하지 않아 발생한 문제로 이는 추가 미러링 작업등의 데이터 확보작업을 통해 개선할 수 있다. 또한 테스트 데이터의 수량부족외에 데이터 패턴을 오검지 하는 다른 이유는 다음의 Fig. 14와 같은 데이터의 다중이상현상 때문이다.

https://cdn.apub.kr/journalsite/sites/ksds/2024-017-04/N0240170412/images/ksds_2024_174_117_F14.jpg
Fig. 14.

Multiple anomaly phenomena data sample

여기서,

(a): 하나의 “Outlier”를 무시한 채 “Normal”로 검지

(b): 하나의 “Outlier”를 무시한 채 “Minor”로 검지

(c): 약한 “Trend” 경향을 보이나 “Minor”로 검지

(d): 초기 “Trend” 경향을 보이나 “Missing”로 검지

(e): 초기 “Normal” 경향을 보이나 “Square”로 검지

3. 결 론

본 연구를 통해 도출된 결론은 다음과 같다.

(1) 오류신호 검지 기법의 성능평가를 위해 구조물 계측데이터 또는 실험데이터를 대상으로 사례분석을 수행하였다. 다중선형회귀(MMLR) 모델을 이용한 One-step ahead 예측기법의 성능평가를 위해 여수교에 설치된 가속도센서 계측데이터를 사용하여 데이터 분석 및 예측데이터 생성 성능평가를 수행하였다. 가속도센서 원시데이터를 이용 MMLR 학습으로 데이터 예측모델을 생성하였다. 그 후, 원시데이터에 인위적으로 결함데이터를 주입한 후 해당 기법으로 데이터의 복원이 가능한지 평가한 결과 20 Hz 이하의 주파수영역에서 주입된 결함구간의 정상데이터를 정확하게 복원하였으며 주입한 결함데이터를 75% 이상 검지함을 확인할 수 있었다.

(2) 실제 초장대 케이블교량의 모니터링 시스템에서 수집한 가속도센서 데이터를 이용하여 1차원 합성곱 신경망(1D-Convolution Neural Network, CNN) 오류신호 검지기법의 성능을 평가했다. 데이터의 충분한 학습을 위해 원시데이터에 존재하는 이상데이터 패턴을 Normal, Missing, Monor, Outlier, Square, Trend 및 Drift의 7가지 종류로 구분하였고 해당패턴 별로 각각 1,000포인트의 데이터 샘플을 준비하여 학습을 진행하였다. 초 7,00개의 데이터 샘플학습은 분석에 과도한 자원이 소모되기 때문에 다차원의 데이터를 단차원으로 축약하기 위한 통계학적 전처리 작업을 통해 데이터를 단순화시켜 데이터 학습을 수행하고 1D-CNN 기법으로 데이터 오류신호 분석을 진행하였다. Normal, Missing, Minor, Square 및 Trend 패턴의 경우 높은 정확도로 오류신호를 검지해 내었으나 Outlier와 Drift 패턴의 경우 Normal과 Trend 패턴으로 오검지 하는 경향을 나타냈는데 이는 샘플데이터 상에 Outlier와 Drift 패턴의 샘플이 충분치 않아 학습이 완전하지 못했기 때문인 것으로 확인하였다.

Acknowledgements

이 연구는 국토교통부의 재원으로 국토교통과학기술진흥원 연구개발사업의 지원을 받아 수행된 연구임(과제번호: RS-2024-00401101).

The research presented in this study was supported by the KAIA Research program on the Development of Marine Bridges Operation using Green Energy, funded by the Ministry of Land, Infrastructure and Transport [Grant number: RS-2024-00401101].

References

1

Boyd, K., K. H. Eng, and C. D. Page. (2013). Area under the Precision-Recall Curve: Point Estimates and Confidence Intervals. In Machine Learning and Knowledge Discovery in Databases: European Conference, ECML PKDD 2013. 451-466.

10.1007/978-3-642-40994-3_29
2

Chandola, V. (2009). Anomaly Detection for Symbolic Sequences and Time Series Data. Doctoral Dissertation. University of Minnesota.

3

Chandola, V., A. Banerjee, and V. Kumar. (2009). Anomaly Detection: A Survey. ACM Computing Surveys (CSUR). 41(3): 15.

10.1145/1541880.1541882
4

Hong, Kyu-Tack, Jeeyeon Heo, Se-Yun Hwang, and Jang-Hyun Lee. (2018). Analysis of Sensor Data for Detecting the Abnormal State of FD FAN. Korean Journal of Computational Design and Engineering. 23(2): 137-143.

10.7315/CDE.2018.137
5

Kim, W. (2021). Detection of Anomalies in Structural Health Monitoring Systems. Master's Thesis. Graduate School of Sejong University.

6

Liu, H., S. Shah, and W. Jiang. (2004). On-Line Outlier Detection and Data Cleaning. Computers & Chemical Engineering. 28(9): 1635-1647.

10.1016/j.compchemeng.2004.01.009
7

Syafrudin, M., G. Alfian, N. L. Fitriyani, J. Rhee (2018). Performance Analysis of IoT-Based Sensor, Big Data Processing, and Machine Learning Model for Real-Time Monitoring System in Automotive Manufacturing. Sensors. 18(9): 2946.

10.3390/s1809294630181525PMC6164307

Korean References Translated from the English

1

김욱 (2021). 구조건전성 모니터링 시스템의 이상징후 검지. 석사학위논문. 세종대학교 대학원.

2

홍규택, 허지연, 황세윤, 이장현 (2018). 플랜트 공정 FD FAN 설비의 이상 상태 예측을 위한 센서 데이터 분석. 한국 CED 학회 논문집. 23(2): 137-143.

10.7315/CDE.2018.137
페이지 상단으로 이동하기