IndexFiguresTables |
Nayeon Kim♦ , Chanjun Chun* and Hong Kook Kim°Acoustic Novelty Detection Using Monte Carlo Dropout and Gaussian Mixture Model in Underwater Acoustic EnvironmentsAbstract: In this paper, we propose a method for detecting novel acoustic signals that deviate from the learned data distribution in underwater acoustic environments. Specifically, we utilize Monte Carlo dropout (MCDO) to quantify the uncertainty in the model's predictions and model the distribution of predictions for normal signals using a Gaussian Mixture Model (GMM). We measure the distance between the estimated GMM and the Gaussian mixture model obtained from the input signal. If this distance exceeds a predefined threshold, the signal is detected as an unlearned novelty signal, indicating that it deviates from the training data distribution. This framework offers a new approach to identifying acoustic anomalies by leveraging model uncertainty and the probabilistic modeling capabilities of GMMs. Keywords: AcousticNovelty Detection , Monte Carlo Dropout , Gaussian Mixture Model 김나연♦, 전찬준*, 김홍국°수중 음향 환경에서 몬테카를로 드롭아웃 및 가우시안 혼합 모델을 활용한 이상 음원 탐지요 약: 본 논문에서는 수중 음향 환경에서 학습된 데이터 분포를 벗어나는 이상 음원 탐지 방법을 제안한다. 구체적으로, 모델의 불확실성 추정을 위해 Monte Carlo dropout(MCDO)을 이용하여 모델의 예측에 대한 불확실성을 정량화하고, Gaussian Mixture Model(GMM)을 이용하여 정상 신호의 예측값 분포 를 가우시안 분포로 모델링한다. 추정된 가우시안 혼 합 모델과 입력 신호로부터 얻은 가우시안 혼합 모델 사이의 거리를 재고, 이 값이 임계값(threshold)보다 높은 경우 학습되지 않은 이상 신호로 탐지하는 프레임워크를 제안한다. 키워드: 이상 음원 탐지, 몬테카를로 드롭아웃, 가우시안 혼합모델 Ⅰ. 서 론수동 소나 시스템은 특정 수심에 하이드로폰을 설치하여 수중 소음을 수집 및 탐지하는 장비로, 수중 음향 환경에서 선박, 잠수함, 어뢰 및 기타 수중 위협 요소를 탐지하는 데에 사용된다. 최근에는 딥러닝 기술 중의 하나인 합성곱 신경망 (Convolutional Neural Network)을 통해 표적에 따른 신호의 패턴을 학습하여, 변화하는 수중 음향 환경에서도 표적 종류를 분류할 수 있는 이상 상황 분류 기법 (Target Recognition)이 연구되고 있다[1,2]. 그러나 잠수함, 어뢰와 같은 군사적으로 위협이 되는 요소는 신호의 특성을 미리 알 수 없어, 미지의 패턴을 탐지하는 이상 탐지(Novelty Detection) 기법이 필요하다. 이를 위해 계층적 LSTM(Long-Short term memory) 네트워크를 사용하여 신호를 모델링하고, 복원 오차를 이용하여 미지의 클래스를 감지하는 방법이 연구된 바있지만, 클래스마다 복원 네트워크를 각각 학습해야 한다는 단점이 있다[3]. 이 단점을 Stacked autoencoder를 이용하여 극복한 이상 탐지 연구도 있었지만, 훈련된 클래스의 분류 성능과 이상 탐지 성능이 임계치에 크게 변화하여, 모델의 목적을 선택하고, 그에 맞게 임계치를 설정해야 한다는 문제가 있었다[2]. 본 논문에서는 위의 한계를 극복하기 위하여 수중 음향 환경에서 불확실성 기반의 이상 음원 탐지 기법을 제안한다. 구체적으로는 MCDO[4]을 이용하여 모델의 불확실성을 측정하고, 이러한 불확실성 정보를 이용하여 클래스별로 GMM을 추정하여 정상 신호의 예측값 분포를 모델링하고, 추론 시 각 신호에 대해 MCDO를 수행하여 얻은 GMM과의 거리를 기반으로 이상 음원을 판별하는 프레임워크를 제안한다. Ⅱ. Monte Carlo Dropout 및 Gaussian Mixture Model 기반의 이상 음원 탐지제안하는 방법은 그림 1의 알려진 라벨에 대한 분류 모델을 학습하는 과정과, GMM을 추정하는 훈련 단계와, 추론 단계로 이루어져 있다. MCDO와 GMM을 활용한 이상 음원 탐지를 위하여 드롭아웃이 적용된 분류 모델을 학습하여 가중치를 고정한다. Attention ResNet(AResNet)을 분류모델로 사용하고, 구성요소 중 CAM(channel attention modules) 모듈과 AConv Block(Attention-based convolutional residual block)에 존재하는 활성화 함수 이후에 드롭아웃 레이어를 적용하여 훈련하였다[5]. 학습된 모델에 가중치를 고정하고, 드롭아웃 레이어를 활성화 한다. 여러 번의 순전파를 수행하여 소프트맥스 출력값을 얻고, 출력값 분포를 바탕으로 각 클래스별 GMM을 추정한다. GMM 추정에는 모델 추론 결과가 정답인 샘플만 사용하여 라벨별로 GMM을 얻는다. 각 샘플별로 GMM 추정을 위해 m번 추론하며, 본 연구에서는 1000으로 고정하였다. 마지막으로 테스트 데이터에 대한 추론 과정은 다음과 같다. m번의 추론을 통해, 추론 샘플에 대한 GMM을 추정한다. 학습 과정에서 추정된 클래스별 GMM과, 추론 샘플의 GMM 간의 KL-divergence를 구한다. 이 거리는 클래스별 정답 분포와의 거리를 나타내는 지표로, 거리가 가까우면 두 분포가 비슷함을 뜻하기 때문에 거리가 가장 가까운 분포를 정답으로 예측할 수 있다. 훈련에 포함되지 않은 새로운 유형의 데이터가 추론 샘플로 들어왔을 때는 어떠한 라벨의 분포와도 가깝지 않기 때문에 가장 가까운 거리일지라도 특정 값 q를 넘어가게 된다. 이를 이용하여 가장 가까운 거리값이 임계치를 넘어가는 경우 이상 음원 (novelty)로 탐지한다. 임계치는 0.1부터 5까지 0.1 간격으로 시험하여 비교하였다. Ⅲ. 실험 결과 및 분석본 논문에서는 4종류로 분류된 265척의 선박 운행시의 소음 데이터를 포함하는 DeepShip 공개 데이터셋을 사용하였다[6]. 학습/검증/테스트를 7/2/1 비율로 나누었으며, Log-mel spectrum, mel-frequency cepstral coefficient(MFCC), contrasts, chroma, Tonnetz, zero-crossing rate(CCTZ) 특징을 융합한 feature fusion을 입력 피쳐로 사용하였다[7]. 모델의 분류 및 이상 탐지 성능지표로 Average Known class detection Rate(AKR)과 Average Unknown class detection Rate(AUR)를 사용하였다[3]. AKR은 학습에 포함된 라벨에 대하여 이상 탐지를 수행했을 때의 평균 정확도이며, AUR은 새로운 유형의 데이터의 검출 여부를 나타내는 이상 탐지 정확도를 나타낸다. 표 1에는 이상 라벨이 Cargo, 드롭아웃은 0.5일 때에 따른 모델의 분류 및 이상 탐지 정확도를 기존의 소프트 맥스 기반 방법과 제안하는 GMM 방법으로 비교하였다. 임계치는 AKR과 AUR의 차이가 가장 작은 [TeX:] $$\theta_{\text {soffmax }}=0.9, \theta_{\mathrm{gmm}}=0.3$$로 선정하여 비교하였다. 표에 나타난 바와 같이, Cargo, Passengership, Tanker 클래스에서 기존의 소프트맥스 방법보다 각각 AKR기준 0.09, 0.11, 0.31, AUR 기준 0.24, 0.28, 0.07 향상되었고, AKR 평균은 0.12, AUR 평균은 0.15 향상되었다. 또한, Tug를 제외한 클래스에서는 이상 라벨에 관계없이 같은 드롭아웃과 임계치에서 AKR대비 AUR 감소폭이 0.02 이내에 있는데, 0.2씩 감소하던 기존의 방법과 비교해 향상되었음을 보인다. 이는 어떤 이상 신호가 들어오더라도 단일 임계치를 사용한 이상 음원 탐지의 가능성을 보여준다. 표(Table) 1. 이상 라벨 별 이상 신호 탐지 성능 비교 (Novelty detection performance)
Ⅳ. 결 론본 연구에서는 MCDO 및 GMM을 이용하여 훈련에 사용되지 않은 이상 음원을 탐지하는 연구를 수행하였다. 그 결과, 이상 클래스에 관계없이 드롭아웃별 단일 임계치를 가지고 비슷한 이상 탐지 성능을 보여주는 것을 확인함으로, 제안하는 MCDO와 GMM을 통한 불확실성의 측정이 어떤 이상 음원이 들어와도 탐지할 수 있는 이상 탐지에 효과적인 것을 보여주었다. 특히, 제안한 방법이 기존 방법 대비 우수한 성능을 제공함을 확인하였다. 또한, AKR와 AUR을 비교하였을 때 AUR의 감소 폭이 크지 않은 결과도 확인할 수 있었는데, 이를 통해 이미 알고 있는 클래스에 대한 분류 성능 저하를 최소화하면서도 이상 음원 탐지를 효과적으로 수행할 수 있음을 확인하였다. 이는 단일 임계치를 사용하여 다양한 이상 신호를 탐지할 수 있는 가능성을 제시하며, 제안한 방법의 실용성을 입증하였다. References
|
StatisticsCite this articleIEEE StyleN. Kim, C. Chun, H. K. Kim, "Acoustic Novelty Detection Using Monte Carlo Dropout and Gaussian Mixture Model in Underwater Acoustic Environments," The Journal of Korean Institute of Communications and Information Sciences, vol. 49, no. 12, pp. 1702-1704, 2024. DOI: 10.7840/kics.2024.49.12.1702.
ACM Style Nayeon Kim, Chanjun Chun, and Hong Kook Kim. 2024. Acoustic Novelty Detection Using Monte Carlo Dropout and Gaussian Mixture Model in Underwater Acoustic Environments. The Journal of Korean Institute of Communications and Information Sciences, 49, 12, (2024), 1702-1704. DOI: 10.7840/kics.2024.49.12.1702.
KICS Style Nayeon Kim, Chanjun Chun, Hong Kook Kim, "Acoustic Novelty Detection Using Monte Carlo Dropout and Gaussian Mixture Model in Underwater Acoustic Environments," The Journal of Korean Institute of Communications and Information Sciences, vol. 49, no. 12, pp. 1702-1704, 12. 2024. (https://doi.org/10.7840/kics.2024.49.12.1702)
|