IndexFiguresTables |
Ji-Uk Kim♦ and Hyun-Suk Lee°A Study on Meta-Learning Based Neural Architecture Search for Crop Disease Diagnosis in IoT EnvironmentsAbstract: In agriculture, accurate and efficient diagnosis of crop diseases is essential to improve agricultural productivityandquality. However,inreal-worldagriculturalenvironments,therearechallenges suchasthelack of high-quality data and the limited memory and computational capacity of IoT devices. Therefore, in order to address crop disease diagnosis with deep learning, a lightweight model with a small size should be able to effectively examine crop disease with a small amount of training data. In this paper, we propose a crop disease diagnosis method that applies a combination of meta learning and neural architecture search to address these issues. The proposed method searches for a meta-model that can be generalized for various crop disease diagnosis tasks with only a small amount of data, in a search space consisting of lightweight models. Through experiments on real-world crop disease dataset, we demonstrate that the model trained with the proposed method achieves an accuracy improvement of more than 15.5% with 98.7% fewer parameters compared to the model in the related work. These results show that the proposed method is feasible for crop disease diagnosis under the limited conditions of real-world agricultural environments. Keywords: Meta-Learning, , Neural Architecture Search , Crop Disease Diagnosis , IoT 김지욱♦, 이현석°IoT 환경에서의 병충해 작물 진단을 위한 메타 러닝 기반 신경망 구조 탐색 활용 연구요 약: 농업 분야에서 병충해 작물의 신속하고 정확한 진단은 생산성과 품질을 높이는 데 매우 중요하다. 그러나 실제농업 환경에서는 양질의 학습 데이터 부족, IoT 기기의 메모리 용량, 연산 용량 제약과 같은 어려움이 있다. 따라서 작물 병충해 진단을 딥러닝으로 해결하기 위해서는 작은 크기를 갖는 경량 모델이 적은 학습 데이터로도 작물병충해 진단을 효과적으로 수행할 수 있어야 한다. 본 연구에서는 이러한 문제를 해결하기 위해 메타 러닝 기법과신경망 구조 탐색 기법을 함께 활용하는 작물 병충해 진단 기법을 제안한다. 제안 기법은 경량 모델로 구성된 탐색 공간에서 다양한 병충해 작물 태스크에 대해 적은 데이터로도 일반화가 가능한 메타 모델을 탐색하여 활용한다. 실제 작물 병충해 데이터로 진행한 실험 결과, 제안된 기법으로 학습된 모델은 기존 연구에서 사용한 모델과비교하여 파라미터 수가 98.7% 적은 모델로 15.5% 이상의 정확도 향상을 기록하였다. 이와 같은 결과는 제안 기법이 실제 농업 환경에서의 제한된 환경에서도 효과적으로 작물 병충해 진단을 수행할 수 있음을 보여준다. 키워드: 메타 러닝, 신경망 구조 탐색, 병충해 작물 진단, IoT Ⅰ. 서 론농업은 식량 공급과 국가 경제에 중대한 역할을 하는 산업이고, 병충해 문제는 농업 분야에서 작물 수확량에 큰 영향을 미치는 주요 문제 중 하나이다[1]. 따라서 병충해로 인한 작물 손실을 최소화하기 위해 작물의 상태를 실시간으로 모니터링하고 신속히 대응하는 것이 필수적이다. 작물의 상태를 모니터링할 때 중요한 것 중 하나는 작물 잎의 상태를 시각적으로 확인하여 질병을 조기에 확인하는 것이다. 작물의 병충해 진단은 전통적으로 숙련된 전문가가 작물을 직접 육안으로 검사하여 분석하여 진행하였다. 하지만 이 방법은 병충해 전문가가 수많은 작물 잎의 상태를 직접 확인해야 하므로 시간이 많이 걸려 높은 비용과 낮은 효율성을 갖는 문제점이 있다. 최근 몇 년간 딥러닝 모델을 활용한 병충해 진단이 이 같은 문제를 해결할 수 있는 매우 유망한 접근법으로 떠오르고 있다[2]. 더 나아가 딥러닝 모델을 IoT 장치에 적용하여 농장에 설치함으로써 실시간으로 작물의 상태를 분석하고 자동으로 병충해를 탐지하는 시스템이 점차 도입되고 있다. 그러나 이러한 딥러닝 모델을 실제 현장에서 적용할 때는 데이터의 제한성과 IoT 장치의 자원 제한이라는 현실적 제약에 직면하게 된다. 전통적인 딥러닝 모델 특히, 심층 신경망은 일반적으로 수십에서 수백만 개 이상의 파라미터를 포함하고 있고, 이런 많은 수의 파라미터를 효과적으로 학습하기 위해서는 일반적으로 대규모 데이터셋이 요구된다. 하지만, 실제 농업 환경은 날씨, 조명, 계절, 작물의 성장 단계 등 다양한 조건에 따라 달라지므로 질병이나 특정 상황에 대한 이미지 데이터가 제한적인 경우가 많다. 이와 같이 데이터가 부족한 경우, 모델이 학습 데이터에 과적합되기 쉽고 이는 모델의 일반화 능력을 떨어트린다. 또한, 너무 많은 파라미터를 갖는 딥러닝 모델은 모델을 저장하기 위한 용량이 크고, 예측을 수행하는데 많은 연산량을 요구하므로 일반적으로 메모리 용량과 연산 자원의 제한이 명확한 IoT 장치에서 사용하는 것은 한계가 있다[3]. 메타 러닝은 모델이 여러 태스크에 대해 신속히 적응할 수 있도록 훈련하는 접근 방식으로, 전통적인 딥러닝 모델을 학습시킬 때 주어진 데이터가 제한될 때의 문제를 해결하기 위한 효과적인 대안으로 주목받고 있다. 메타 러닝은 기존에 학습한 유사한 태스크들로부터의 학습 경험을 토대로 제한된 데이터만으로도 특정 태스크를 효과적으로 학습할 수 있는 능력을 갖추고 있다. 따라서 특정 작물에 관한 데이터가 부족한 경우가 많은 농업 분야의 병충해 탐지에 적용될 수 있다. 하지만 메타 러닝 모델 역시 IoT 장치에 적용하는 데에는 한계가 있다. 구체적으로, 모델 설계 과정에서 크기와 효율성 같은 조건을 고려하지 않은 메타 러닝 모델의 경우, 일반적으로 복잡한 아키텍처와 많은 파라미터를 요구하여 모델 크기가 커지는 경향을 갖는다[4]. 이로 인해 메모리나 연산 자원이 제한된 IoT 장치에 실질적으로 사용하기에는 어려움이 있다. 따라서 다양한 작물과 그에 대한 여러 병충해 조합에 특화된 병충해 모니터링이 필요한 농업 현장에서는 IoT 장치의 메모리를 고려한 신경망 구조 설계 기술이 필요하다. 이러한 기술은 제한된 자원 환경에서도 최적의 성능을 제공할 수 있는 효율적인 모델을 설계할 수 있도록 하며, 동시에 메타 러닝의 장점을 결합하여 IoT 기반의 스마트 농업에 새로운 가능성을 제시한다. 본 논문에서는 메타 러닝 기반 신경망 구조 탐색 기법을 활용하여 IoT 장치의 자원과 학습 데이터가 제한된 환경에서도 효율적이고 정확한 작물 병충해 진단 예측 모델을 설계하는 방법을 제안하였다. 본 연구의 주요 공헌은 다음과 같다. 첫째, 병충해 조합에 따른 최적의 아키텍처를 자동으로 탐색할 수 있도록 하였다. 이를 통해 주어진 기존의 모델 대비 경량화된 모델로도 높은 분류 정확도를 달성하였다. 둘째, 메타 러닝을 통해 대규모 데이터 수집이 어려운 실제 환경에서 제한된 데이터만으로 효율적인 모델 학습이 가능하도록 하였다. 이는 새로운 병충해 조합에 대한 소규모 병충해 작물 이미지 데이터셋을 사용하여 적은 학습 단계로도 높은 정확도의 분류 예측을 가능하게 한다. 마지막으로, 모델 탐색 시 모델 크기를 조정할 수 있도록 하여 자원 제약이 있는 다양한 IoT 장치에서의 적용 가능성을 높였다. Ⅱ. 관련 연구2.1 메타 러닝메타 러닝은 모델이 다양한 태스크에 대해 빠르게 적응할 수 있도록 학습하는 방법론으로, ‘학습하는 방법을 학습하는' 학습 기법으로 알려져 있다[5]. 여기서 태스크란 모델이 해결해야하는 특정한 문제를 의미하며, 메타 러닝은 이 태스크들에 대해 일반화할 수 있는 학습 능력을 목표로 한다. 모델은 여러 태스크들에 대해 학습을 반복함으로써 새로운 태스크에서도 적은 데이터로 빠르게 성능을 낼 수 있는 능력을 갖추게 된다. 이 때문에 메타 러닝은 데이터 수집이 어렵고 다양한 태스크들을 다루는 농업과 같은 특화된 응용 분야에서의 실용성을 높일 수 있다. 메타 러닝을 달성할 수 있는 대표적인 방법으로는 MAML(Model-Agnostic Meta-Learning)[6]과 ProtoNet (Prototypical Networks)[7] 등이 있다. MAML은 특정 모델 구조에 구애받지 않고, 다양한 태스크로부터의 데이터를 이용하여 적은 학습 샘플만으로도 새로운 태스크에 빠르게 최적화할 수 있는 초기 파라미터를 학습하는 기법이다. ProtoNet은 각 클래스의 프로토타입을 정의하고 이를 기반으로 새로운 태스크에서 분류를 수행한다. 각 클래스의 프로토타입은 해당 클래스의 샘플 임베딩 벡터의 평균으로 계산되며, 새로운 샘플과 프로토타입 간의 거리를 측정하여 분류를 진행한다. MAML과 ProtoNet은 서로 다른 접근 방식을 취하지만, 모두 데이터가 제한적인 상황에서도 새로운 태스크에 빠르게 적응할 수 있다는 점에서 메타 러닝 기법으로서 중요한 역할을 한다. 이 외에도 MAML과 ProtoNet의 기법을 확장한 다양한 연구가 진행되고 있으며, 이러한 연구들은 데이터 효율성과 다양한 환경에서의 일반화 성능을 향상시키는 데 기여하고 있다. 2.2 신경망 구조 탐색신경망 구조 탐색은 주어진 태스크에 대해 최적의 신경망 구조를 자동으로 탐색하는 방법이다. 이는 번거롭고 시간이 소모되는 수작업 아키텍처 설계를 대체할 수 있고, 효과적인 모델 설계를 통해 높은 성능을 달성하여 최근 딥러닝 분야에서 널리 사용되고 있다. 기존의 탐색 전략에는 랜덤 탐색, 진화 알고리즘, 강화 학습, 베이지안 최적화 등이 있다[8]. 하지만 이러한 방법들은 대부분 수백, 수천 개의 아키텍처를 처음부터 학습해야하는 과정 때문에 연산 비용이 매우 높은 문제가 있다. 이러한 비용 문제를 개선하기 위해 최근 연구는 아키텍처를 변형하되 기존 가중치를 유지하는 네트워크 모피즘(network mophisms)과 같은 아이디어를 도입하거나, 가중치 공유(weight sharing) 기법을 사용해 탐색 과정에서 여러 아키텍처가 동일한 가중치를 재사용할 수 있게 하여 탐색 효율성을 향상시키는 기법을 사용한다[9]. 또한, 전체 아키텍처 학습을 피하고 부분적 또는 축소된 평가 방식을 통해 계산 자원을 절약하는 방법으로 다중 충실도 최적화(multi-fidelity optimization)[10]도 주목받고 있다. 다양한 방식으로 보다 효율적인 방법을 개발하는 데 중점을 두고 있지만, 여전히 작은 문제에 국한되는 경우가 많다. 신경망 설계의 위와 같은 한계를 극복하기 위해 Liu et al[11]은 경사 하강법 기반의 신경망 구조 탐색(Differentiable Architecture Search, DARTS)을 통해 아키텍처 탐색 공간을 연속적으로 만들어 아키텍처를 최적화하는 방법을 제안했다. 기존의 신경망 구조 탐색은 아키텍처의 구성 요소들을 선택하는 이산적인 문제로, 수많은 아키텍처들을 개별적으로 학습시켜 평가하기 때문에 연산 자원이 많이 소모된다. 반면 DARTS는 각 연산에 가중치를 부여하는 방식으로 후보 연산들을 하나의 혼합 연산으로 대체하여 탐색 공간을 연속적으로 만들었다. 이를 통해 탐색 공간을 미분 가능한 하나의 최적화 문제로 구성하고, 경사 하강법을 사용하여 네트워크 가중치와 아키텍처 가중치를 동시에 업데이트함으로써 계산 비용을 절감할 수 있다. 2.3 메타 러닝과 신경망 구조 탐색의 결합제한된 데이터에서 빠르게 학습할 수 있는 능력을 갖추고 있는 메타 러닝과 주어진 문제에 대해 최적의 신경망 구조를 자동으로 탐색하는 신경망 구조 탐색을 결합한 연구들은 새로운 데이터 환경에서도 적응력과 일반화 성능을 극대화시킬 수 있다는 점에서 주목받고 있다. Wong et al[12]은 신경망 구조 탐색과 전이학습을 결합하여 기존 신경망 구조 탐색의 계산 비용 문제를 해결하고, 새로운 태스크에서 효율적으로 신경망 구조를 설계하는 방식을 제안하였다. 여러 태스크에 대해 동시에 신경망 구조 탐색을 실행하여 컨트롤러가 여러 태스크 간에 일반화된 패턴을 학습하도록 하고, 학습이 끝난 후 학습된 컨트롤러를 새로운 태스크에 적용하여 하이퍼파라미터와 아키텍처 탐색 속도를 높인다. Kim 등[13]은 점진적 신경망 구조 탐색을 퓨샷(few shot) 러닝에 적용하여 적은 파라미터로도 기존 메타 러닝 모델보다 높은 정확도를 달성했다. 2.4 인공지능과 작물 병충해 진단딥러닝의 등장 이후, 합성곱 신경망(CNN)과 같은 모델들이 농업 분야에 도입되면서 작물 병충해를 진단하는 연구가 활발히 진행되었다. 예를 들어, 장서영 외[14]는 합성곱 신경망 기본 구조의 모델과 전이 학습 기반 사전 훈련 모델인 ResNet50을 이용하여 병충해 작물 이미지 분류 학습을 제안하였다. 김연이 외[15]는 클래스 불균형 등 작물 병충해 진단 학습 데이터의 품질에 초점을 맞추어 10종의 노지 작물을 기준으로 병충해 데이터셋을 구축하고 YOLOv5 모델을 적용해 학습하여 작물 병충해 진단 성능을 개선하였다. 딥러닝 모델은 특정 문제에서는 높은 성능을 발휘하지만, 많은 양의 데이터와 연산 자원을 필요로 하고 새로운 태스크를 학습하려면 오랜 시간이 걸린다는 점에서 메타 러닝이 주목받게 되었다. 메타 러닝은 모델이 다양한 작물의 병충해 데이터를 빠르게 학습하고 적응할 수 있도록 하여, 제한된 데이터 환경에서도 높은 분류 성능을 달성할 수 있는 접근법을 제안한다. Argueso et al[16]은 병충해 데이터셋을 소스 도메인과 타겟 도메인으로 나누고 소스 도메인에서 병충해 이미지의 특징을 학습한다. 이 과정에서 모델은 병충해 분류와 관련된 고유한 특징을 추출하고 이후 타겟 도메인의 소량의 데이터에서 이를 미세 조정하여 모델이 새로운 데이터에 빠르게 적응할 수 있도록 한다. Nuthalapati et al[17]은 분류기의 임베딩 함수를 활용해 입력 이미지의 특징을 추출해 모델을 학습시키고 거리 계산을 통해 학습된 이미지들과 입력 이미지들의 유사도를 비교하여 입력 샘플들을 최종적으로 분류한다. Chen et al[18]은 식물 질병을 탐지하고 예측에 중요한 입력 영역을 시각화하는 메타 학습 기반의 국소 특징 매칭 조건부 신경 적응 프로세스를 사용하여 특징 추출 후 학습된 이미지와 입 력 이미지 간의 특징 공간에서 거리를 계산하여 입력 이미지의 레이블을 하는 방법을 사용한다. 위와 같은 연구들은 메타 러닝 방법을 작물 병충해 진단 모델에 적용하여 적은 데이터로도 새로운 작물 진단 태스크를 학습하는 가능성을 보여주었으나, 큰 크기의 고정된 백본 네트워크에서 메타 러닝을 적용하여 IoT장치의 제약조건을 고려한 모델 설계가 고려되지 않아 실제 IoT장치를 이용한 적용에 한계가 있다. Ⅲ. 문제 정의현재 스마트 농업 환경에서는 대부분의 IoT 장치들이 클라우드와 연결되어 있어 대규모 모델을 활용할 수 있다. 그러나 실제 농업 현장에서는 네트워크 연결이 불안정하거나, 통신 인프라가 부족한외곽 지역 등 클라우드 서버와의 지속적인 연결이 어려운 환경이 다수 존재한다. 이러한 상황에서는 클라우드 기반 IoT 장치를 활용하기 어렵고, 모델이 IoT 장치 자체에서 구동되어야 한다. 이러한 제약은 모델의 크기와 연산자원을 제한할 수 있으므로 메모리와 연산자원이 제한된 실제 IoT 장치(예: Raspberry Pi4 등)를 고려하여 최적화된 모델을 사용하는 것이 중요하다. 또한, 공개된 병충해 작물 데이터셋(예: PlantVillage 등)이 존재하긴 하지만, 실제 농업 환경에서는 특정 지역의 특수한 작물이나 희귀한 병충해 유형 등 공개 데이터셋에서 찾기 어려운 사례가 많으며, 새롭게 데이터를 수집하더라도 소규모로만 수집될 가능성이 높다. 이러한 현실적인 데이터 제한 상황을 고려하면, 소규모 데이터만으로도 높은 정확도를 유지하고 빠르게 태스크에 적응 가능한 효율적인 접근법이 필요하다. 본 연구는 위와 같이 연산자원과 학습데이터가 제한된 환경에서도 효율적이고 정확한 작물 병충해 진단 예측 모델을 설계 및 학습할 수 있도록 하는 것을 목표로 한다. Ⅳ. 제안 방법4.1 메타 러닝 기반 신경망 구조 탐색 기법을 활용한 효율적인 작물 병충해 진단본 연구에서는 메타 러닝 기반 신경망 구조 탐색 기법을 활용하는 작물 병충해 진단 모델을 설계하고 학습하는 방법을 제안한다. 이 같은 접근을 통해 제한된 자원을 갖는 IoT 환경에서도 병충해 작물 이미지 분류 문제를 효율적으로 해결할 수 있다. 병충해 작물 분류 예측에 메타 러닝을 적용하는 일반적인 방법은 다양한 병충해와 작물 조합으로 모델을 메타 러닝 시켜 새로운 조합의 병충해 작물 태스크에도 빠르게 적응할 수 있는 초기 모델을 구하는 것이다. 본 논문에서는 신경망 구조 탐색 기법에 메타 러닝을 적용하여 탐색 효율성을 극대화하고 새로운 태스크에 빠르게 적응할 수 있도록 하였다. 특히, 탐색 대상 신경망의 크기를 제한할 수 있는 신경망 구조 탐색 기법의 특성을 활용하면 IoT 장치의 메모리 용량과 연산 자원에 맞는 신경망 크기를 갖는 작물 병충해 진단 모델을 구성할 수 있으므로, 자원이 제한된 IoT 환경에서도 효과적으로 활용할 수 있다. 신경망 구조 탐색 기법과 메타 러닝 적용에 대한 자세한 설명은 4.2절에 제시한다. 메타 러닝 과정을 거쳐 최적화된 모델은 IoT 장치에 배포되어 사용될 수 있다. 사용자가 IoT 장치를 통해 진단하고자 하는 작물 이미지를 촬영하면, IoT 장치에 내장된 모델이 해당 이미지를 분석하여 실시간 병충해 진단을 수행한다. 이후에도 새롭게 진단하고자 하는 병충해 작물 태스크에 대해 소량의 추가 데이터를 이용해 메타 러닝된 초기모델을 재학습하면, 해당 조합에 최적화된 새로운 경량 모델을 효율적으로 얻을 수 있다. 이러한 접근을 통해 모델은 적은 데이터로 다양한 병충해 작물 태스크에 대해 학습하면서, 신경망 구조의 제약조건 하에서 새로운 태스크에 적합한 최적의 신경망 구조를 빠르고 효율적으로 탐색할 수 있다. 이는 제한된 데이터와 적은 컴퓨팅 자원을 갖는 IoT 환경에서 효과적인 병충해 탐지 및 분류 시스템 구축을 가능케한다. 특히, 본 연구에서 탐색된 최적 모델은 파라미터 수가 약 1M개 수준으로 Raspberry Pi 4와 같은 대표적인 IoT 기기에서도 메모리 용량(최대 4GB RAM)을 고려했을 때 충분히 구동 가능하다. 4.2 작물 병충해 진단 예측 모델 메타 러닝 과정본 연구에서 메타 러닝의 각 태스크는 특정 작물과 병충해의 조합을 나타내는 소규모 이미지 데이터셋으로 구성된다. 구체적으로, n개의 서로 다른 병충해 작물 클래스가 있고 각 클래스당 k개의 제한된 이미지 샘플이 제공될 때, 이 n개 클래스에 대한 분류 문제가 하나의 태스크(n-plant k-image)로 구성된다. 예를 들어, 5-plant 1-image 문제는 5개의 서로 다른 병충해 클래스와 각 클래스당 1개의 학습 이미지를 포함하는 문제를 의미한다. 본 연구에서는 이처럼 데이터가 제한된 n-plant k-image 문제에 빠르게 적응할 수 있는 최적의 신경망 구조를 효과적으로 설계하기 위해 메타 러닝 기반 신경망 구조 탐색 기법[19]을 활용하였다. 이 기법은 메타 러닝 과정과 메타 테스트 과정으로 이루어진다. 메타 러닝 과정은 다양한 태스크에 대한 보편적인 모델 파라미터를 구하여 메타 테스트 과정에서 새로운 병충해 작물 태스크에 대해 모델을 빠르게 적응시킬 수 있게 하는 것을 목표로 하는 과정이다. 메타 테스트 과정에서는 메타 러닝을 통해 얻은 보편적인 모델 파라미터를 활용하여 새로운 병충해 작물 태스크에 최적화된 성능을 발휘하도록 모델을 적응시키는 것을 목표로 한다. 4.2.1. 메타 러닝 과정 본 연구에서 메타 러닝의 각 태스크는 특정 작물 메타 러닝 과정에서는 메타 테스트 과정에서 새로운 병충해 작물 태스크에 빠르게 적응할 수 있도록 하는 보편적인 모델 파라미터를 학습하며, 이같은 모델을 메타모델이라고 한다. 메타 모델의 효율성과 적응력을 극대화하기 위해 본 연구에서는 경사 하강법 기반의 신경망 구조 탐색 방식인 Differentiable Architecture Search(DARTS)[11]를 활용하고 이와 함께 메타 러닝 알고리즘 Reptile[20]을 적용하여 새로운 태스크에 쉽게 적응할 수 있는 메타 러닝된 신경망 구조를 탐색한다. DARTS의 목표는 그림 1과 같이 최종 네트워크를 구성하기 위해 필요한 기본 구성 요소인 셀의 구조를 찾아 신경망을 구성하는 것이다. 셀은 여러 개의 작은 계산 단위를 포함하는 블록으로, 이 블록들이 모여 전체 신경망을 구성하게 된다. 셀은 일반 셀(normal cell)과 축소 셀(reduction cell) 두 가지 종류가 있다. 이 두 셀은 서로 다른 역할을 수행하며 신경망 전체의 효율성과 성능을 극대화하기 위해 번갈아 가며 배치된다. 일반 셀은 입력 특징 맵을 받아 다양한 연산을 적용한 후 입력 크기와 같은 출력 특징 맵을 생성한다. 축소 셀은 입력 특징 맵에 다양한 연산을 적용한 후 특징 맵의 높이와 너비를 절반으로 줄이는 처리 과정이 포함되어있는 셀이다. 일반 셀과 축소 셀은 N개의 노드로 이루어진 방향성 비순환 그래프(Directed Acyclic Graph)로 표현되며. 각노드는 이미지를 처리한중간 결과를 의미하는 특징 맵을 나타낸다. 하나의 셀에는 두 개의 입력 노드와 하나의 출력 노드가 있다. 두 개의 입력 노드는 이전 셀의 출력으로 나오는 특징 맵이고 출력 노드는 해당 셀에서 계산된 특징 맵이다. 각 노드들은 노드와 노드 사이의 연산 과정을 나타내는 에지로 연결된다. DARTS는 각 노드 사이에서 어떤 연산을 수행할지 (즉, 어떤 에지를 선택할지) 명시적으로 선택하는 대신, 에지 후보를 동시에 고려하고, 소프트맥스 연산을 통해 에지의 선택을 확률적으로 표현한다.
(1)[TeX:] $$\hat{\alpha}_o^{i, j}=\frac{\exp \left(\alpha_o^{i, j}\right)}{\sum_{o \in O} \exp \left(\alpha_o^{i, j}\right)}$$
(2)[TeX:] $$\begin{aligned} x^{(i, j)} & =\sum_{i\lt j o \in O} \sum_{\alpha_o^{i, j}}{ }_o\left(x^{(i)}, w_o^{i, j}\right) \\ & =: \sum_{i\lt j} \text { MixedOp }\left(x^{(i)}, w^{i, j}\right) \end{aligned}$$예를 들어, O는 에지에서 사용할 수 있는 후보 연산들의 집합(e.g., 3*3 convolution, 5*5 convolution, 3*3 average pooling, …)을 의미하고 각 연산은 노드에 적용할 특정 함수 [TeX:] $$O(\cdot)$$을 나타낸다. 노드 [TeX:] $$x_j$$와 그 이전 노드 [TeX:] $$x_i$$는 에지 E(i,j)에 의해 연결되며 한 쌍의 노드 (i,j)에 대한 가중치를 혼합하는 연산은 α(i,j)로 파라미터화 된다. 그러면 아키텍처 탐색 작업은 α(i,j)의 집합을 학습하는 것으로 축소된다. 이렇게 혼합 연산이 모두 포함된 모델을 원샷 모델이라고한다. 학습과정에서 DARTS는 훈련 및 검증 손실에 대해 각각 경사 하강을 번갈아가며 원샷 모델 w의 가중치와 아키텍처 파라미터 의가중치를 모두 최적화한다. 탐색 단계가 끝나면 각 혼합 연산 [TeX:] $$\bar{o}^{(i, j)}$$를 가장 가중치가 높은 연산들 k개 (일반적으로 k=2)로 대체하고 다른 연산들은 모두 제거하는 가지치기(pruning)를 수행하여 이산적인 아키텍처를 얻을 수 있다. DARTS는 셀과 노드의 개수를 조절함으로써 탐색할 신경망 크기를 미리 설정하고 신경망 구조 탐색을 진행한다. 이러한 특성 덕분에, 메모리 용량과 연산 자원이 제한된 IoT 환경에서도 효과적인 성능을 발휘할 수 있다. DARTS의 신경망 구조 탐색 기능에 메타 러닝 알고리즘을 결합하면, 탐색된 구조가 다양한 태스크에서 높은 일반화 성능을 갖추게 하여 새로운 태스크에 쉽게 적응하게 만들 수 있다. 본 연구에서는 DARTS에 메타러닝을 적용하기 위하여 단순한 업데이트 방식의 장점을 가진 Reptile 알고리즘을 사용하였다. Reptile 알고리즘은 단일 그래디언트 업데이트로 메타 러닝을 수행하며, 간단한 방식으로도 다양한 태스크에 대한 일반화 성능을 효과적으로 유지한다. Reptile 알고리즘의 작동 방식은 다음과 같다. 먼저 여러 개의 샘플링된 태스크들에 대해 다중 경사 하강법을 적용하여 모델을 학습시킨다. 이 과정에서 모델은 태스크에 특화된 최적의 가중치로 업데이트된다. 이후, 메타 업데이트 단계에서 모델의 초기 가중치와 태스크 학습 후의 가중치 간의 차이를 기반으로 초기 가중치를 조정한다. 이 조정은 새로운 태스크에 빠르게 적응할 수 있도록 초기 가중치를 최적화하는 역할을 한다. 이러한 반복적인 과정은 다양한 태스크에 대한 일반화된 가중치를 학습하도록 하며, 새로운 태스크에 대해서 모델의 빠른 적응을 가능하게 한다. 신경망 구조 탐색 기법으로 DARTS를, 메타 러닝 알고리즘으로 Reptile을 사용하는 메타 러닝 기반 신경망 구조 탐색 기법을 활용한 작물 병충해 진단 모델 학습 알고리즘은 다음과 같은 과정으로 이루어진다. 먼저, 다양한 작물과 병충해 조합의 이미지를 수집하고 이를 n-plant k-image 태스크로 구성하는 데이터 전처리 과정을 거친다. 이후 메타 러닝 기반 모델 학습 단계에서는 다양한 n-plant k-image 태스크를 기반으로 모델을 학습한다. 태스크를 학습하는 모델을 간단하게 태스크 학습자(task-learner) Φ로 표현할 수 있다. 태스크 학습자는 수식 (3)을 단일 업데이트로 하여 k번의 학습 단계로 각 태스크 [TeX:] $$T_i$$에 대해 학습률 [TeX:] $$\lambda_{\text {task }}, \zeta_{\text {task }}$$로 모델의 가중치 w와 아키텍처 파라미터 α를 최적화하여 각각 [TeX:] $$w_{T_i}^* \text { 와 } \alpha_{T_i}^*$$를 구한다.
(3)[TeX:] $$\begin{aligned} \binom{w^{j+1}}{\alpha^{j+1}} & =\Phi\left(w^j, \alpha^j, D_{\text {train }}^{T_i}\right) \\ & =\binom{w^j-\lambda_{\text {task }} \nabla_w L_T\left(w^j, \alpha^j, D_{\text {train }}^{T_i}\right)}{\alpha^j-\zeta_{\text {task }} \nabla_\alpha L_T\left(w^j, \alpha^j, D_{\text {train }}^{T_i}\right)} \end{aligned}$$다양한 태스크에 대해 모델을 일반화된 가중치로 학습시키는 메타 러닝 알고리즘은 메타 학습자(Meta-learner) Ψ로 표현할 수 있다. 메타 학습자는 학습된 가중치 [TeX:] $$w_{T_i}^* \text { 와 } \alpha_{T_i}^*$$를 기반으로 수식 (4)를 단일 업데이트로 메타 러닝을 수행하여 모델의 초기 가중치 [TeX:] $$w_{\text {meta }} \text { 와 } \alpha_{\text {meta }}$$를 학습한다. 메타 러닝이 완료되면 모델의 가중치는 다양한 태스크들에 대한 보편적인 가중치로 수렴하며, 이를 통해 새로운 태스크에서도 빠른 적응이 가능해진다. 메타 러닝 기반 신경망 구조 탐색 기법을 활용한 작물 병충해 진단 모델 학습 알고리즘의 전체 과정
(4)[TeX:] $$\begin{aligned} \binom{w_{\text {meta }}^{i+1}}{\alpha_{\text {meta }}^{i+1}} & =\Psi^{\text {REPTILE }\left(\alpha_{\text {meta }}^i, w_{\text {meta }}^i, p^{\text {train }}, \Phi^k\right)} \\ & =\binom{w_{\text {meta }}^i+\lambda_{\text {meta }} \sum_{T_i}\left(w_{T_i}^*-w_{\text {meta }}^i\right)}{\alpha_{\text {meta }}^i+\zeta_{\text {meta }} \sum_{T_i}\left(\alpha_{T_i}^*-\alpha_{\text {meta }}^i\right)} \end{aligned}$$에 대한 파이프라인은 표 1과 그림 2에서 확인할 수 있다. 그림 2는 메타 학습 데이터셋에서 다양한 태스크를 샘플링하고, 이를 통해 모델을 메타 러닝하는 과정을 시각적으로 표현한 것이다. 그림에서 모델의 노드 간 연결을 나타내는 선들은 후보 연산을 나타내며, 그림에서는 3개의 후보 연산이 포함되어 있다. 메타 러닝 이후, 각 후보 연산들의 중요도가 가중치로 계산되며, 가중치가 클수록 연결선이 더 굵게 표현된다. 표(Table) 1. 병충해 작물 분류를 위한 메타 러닝 (Meta-Learning of Neural Architectures for Crop Disease Diagnosis)
4.2.2 메타 테스트 과정 메타 테스트는 다음과 같은 과정으로 이루어진다. 먼저, 진단하고자 하는 작물과 병충해 조합의 이미지를 기반으로 새로운 태스크를 정의한다. 이후, 메타 러닝된 모델을 새로운 태스크에 대해 재학습하여 태스크에 최적화된 가중치 [TeX:] $$w_T, \alpha_T$$를 도출한다. 이때 모델의 아키텍처 파라미터 [TeX:] $$\alpha_T,$$ 즉 각 후보 연산의 가중치는 태스크에 대한 중요도에 따라 조정된다. 이 과정을 태스크 적응 과정(task adaptation)이라고 한다. 이후 중요도가 낮은 연산을 제거하면, 새로운 태스크에 최적화된 최종 모델 구조를 얻을 수 있다. 이후에 사용자는 애플리케이션을 통해 진단하고자 하는 작물의 이미지를 촬영하여 실시간으로 촬영된 이미지를 분석하여 병충해를 분류할 수 있다. 이 같은 메타 러닝 모델 기반 작물 병충해 진단 신경망 구조 탐색을 통해 제한된 IoT 환경의 실제 병충해 진단 애플리케이션에서 적은 데이터로 빠른 적응, 유연성, 정확성 등 다양한 이점을 제공한다. 메타 테스트의 전체 과정에 대한 알고리즘과 파이프라인은 표 2와 그림 3에서 확인할 수 있다. 그림 3은 메타 테스트 데이터셋에서 새로운 태스크를 샘플링하여, 이를 기반으로 모델이 태스크 적응을 수행한다. 태스크 적응 단계에서는 메타 러닝을 통해 학습된 모델을 기반으로, 새로운 태스크의 데이터에 맞게 빠르게 조정이 이루어진다. 적응 과정이 완료된 후에는 프루닝 과정을 통해 태스크에 최적화된 최종 모델이 완성된다. 그림 3은 각 연산의 중요도가 반영된 가중치에 따라 특정 연결이 제거되거나 유지되는 과정을 시각적으로 보여준다. 최종적으로 얻어진 아키텍처는 새로운 태스크의 분류 성능을 최적화할 뿐만 아니라, 제한된 IoT 환경의 특성을 반영하여 신경망 구조를 탐색한 결과로써 효율적이고 간소화된 구조를 갖추어 제한된 IoT 환경에서도 실행 가능하도록 설계된다. Ⅴ. 실 험메타 러닝 기반 신경망 구조 탐색 기법을 활용한 병충해 작물 분류 모델에 대한 실험 및 평가를 진행한다. 5.1.절에서 실험을 진행한 환경 및 구성에 대해 설명하고, 5.2.절과 5.3.절에서 병충해 작물 분류 모델 성능 평가를 수행하여 알고리즘의 성능을 보인다. 5.1 실험 데이터셋실험은 작물 병충해 진단을 위한 대표적인 데이터셋인 PlantVillage 데이터셋을 활용하였다. PlantVillage 데이터셋은 다양한 작물의 잎에 나타나는 건강한 상태와 여러 가지 질병을 포함한 이미지 데이터셋이다. 이 데이터셋은 14종의 주요 작물과 38개의 클래스로 구성되어 있으며, 약 54,306개의 이미지로 구성되어 있다. 대표적인 작물로는 토마토, 옥수수, 감자, 포도, 사과 등이 포함된다. 우리는 데이터셋을 다양한 메타 러닝 및 메타 테스트 세트로 분할하여 실험함으로써 메타 러닝 신경망 구조 탐색 기반 작물 병충해 진단 기법의 성능을 검증하였다. 5.2 작물 병충해 분류 성능 비교딥러닝 기반의 작물 병충해 진단의 대표적 선행 연구인 Transformer-based few-shot learning (FSL)[17]기법과의 비교를 통해 제안하는 메타 러닝 신경망 구조 탐색 기반 작물 병충해 진단 기법의 성능을 평가한다. 선행 연구와의 성능 비교 공평성을 위해 앞선 선행 연구에서 사용한 데이터 분할 방식을 동일하게 적용하여 실험을 진행하였다. 해당 연구에서는 세 가지의 데이터 분할 세트를 사용하며, 세부적인 분할 방법은 다음과 같다. 분할 1에서 메타 테스트 세트는 10개의 서로 다른 토마토 클래스(1 healthy, and 9 diseased)로 구성되며, 메타 훈련 세트는 나머지 28개의 클래스로 구성된다. 분할 2에서 메타 테스트 세트는 4개의 서로 다른 사과 클래스(3 diseased, 1 healthy), 4개의 서로 다른 포도 클래스(3 diseased, 1 healthy), 2개의 서로 다른 체리 클래스(1 diseased, 1 healthy)로 구성되며, 메타 훈련 세트는 나머지 28개의 클래스로 구성된다. 분할 3에서 메타 테스트 세트는 4개의 서로 다른 옥수수 클래스(3 diseased, 1 healthy), 4개의 서로 다른 포도 클래스(3 diseased, 1 healthy), 2개의 서로 다른 복숭아 클래스(1 healthy, 1 diseased)로 구성되며, 메타 훈련 세트는 나머지 28개의 클래스로 구성된다. n-plant k-image 태스크는 다양한 데이터셋 분할에서 무작위로 샘플링하여 생성된다. DARTS를 기반으로 한 실험 환경은 다음과 같다. 우선 선행 연구 FSL[17]의 경우 모델의 파라미터 수가 약 76M개인데 반해, 제안 기법에서는 IoT장치의 제한된 자원을 고려하여 전체 파라미터 수를 약 1M개 내외가 되도록 셀 개수를 설정하여 일반 셀과 축소 셀을 탐색하도록 한다. 전체 모델은 6개의 셀, 각 셀은 4개의 중간 노드로 구성되며, 1, 3, 5번째 셀은 일반 셀, 2, 4, 6번째 셀은 축소 셀이다. 후보 연산 세트는 MaxPool3x3, AvgPool3x3, SkipConnect, Conv1x5-5x1, Conv3x3, SepConv3x3, DilatedConv3x3이다. 탐색 단계에서는 신경망의 가중치와 아키텍처 파라미터를 동시에 최적화하기 위해 bi-level optimization을 사용하였다. 신경망 구조 탐색은 10,000 에포크 동안 진행되었으며, SGD(Stochastic Gradient Descent) 옵티마이저와 함께 학습률 0.025, 아키텍처 파라미터 업데이트를 위한 가중치 감쇠 0.001으로 설정하였다. 평가 단계에서는 메타 러닝된 모델을 메타 테스트 세트에 대해 50 학습 단계 동안 태스크 적응 과정과 프루닝을 진행하여 최종 모델을 구성하였고, 최종 모델을 이용하여 제안 기법의 성능을 확인하였다. 또한 제한된 데이터 조건에서 성능을 확인하기 위해 5-plant 5-image 설정으로 진행되었다. 작물 병충해 분류 성능을 표 3에 나타내었다. 본 연구의 모델은 분할 1, 2, 3에 대한 실험에서 FSL[17]과 비교하여 비슷하거나 더 나은 성능을 달성하였다. 특히, 분할 1에서는 79%의 정확도를 달성해 기존 방법 대비 15.5% 더 높은 정확도를 기록하였다. 분할 2와 3에서는 88%와 89%의 정확도를 달성해 기존 모델 정확도를 상회하였다. 이러한 성능 향상은 우리의 메타 러닝기반 신경망 구조 탐색 기법이 병충해 작물 조합에 빠르게 적응하고 효과적인 연산 구조를 탐색하여 최적의 모델을 구성했기 때문이다. 선행 연구 FSL은 Transformer 기반 모델을 사용하여 상대적으로 많은 파라미터와 높은 계산량을 요구한다. 반면, 본 논문의 모델은 DARTS 기반의 convolution 연산과 skip connection 중심의 단순한 구조를 통해 계산 효율성을 극대화하였다. 또한, Reptile 알고리즘의 특성상 적은 반복으로도 빠르게 최적의 초기 가중치를 찾을 수 있어, 매우 적은 파라미터 수로도 효과적인 학습을 수행할 수 있었다. 실제로 제안 기법을 통해 탐색된 모델의 파라미터 수는 약 1M개로, 기존 모델이 약 76M개인 것과 비교하면 약 98.7% 더 적다. 메타 러닝을 통해 일반화된 초기 가중치를 제공함으로써 적은 학습 데이터만으로도 높은 성능을 달성할 수 있었으며, 이는 데이터가 부족한 병충해 작물 분류 및 리소스가 제한된 IoT 환경에서의 활용 가능성을 높인다. 표(Table) 3. 분류 정확도 비교 (Comparison of Classification Accuracy)
5.3 제안 기법 적응성 평가실제 환경에서는 다양한 작물 조합이 아닌 특정한 단일 작물에 대해서 적용될 가능성이 높으므로 이 같은 환경에서도 제안 기법 메타 모델이 일반화가 잘 되는지 검증하기 위한 추가 실험을 진행하였다. 이를 위해, 메타 러닝 단계에서는 목표로 하는 특정 작물을 제외한 다양한 작물과 병충해에 대한 모델을 학습시킨 후, 메타 테스트 단계에서 해당 특정 작물 병충해 데이터를 사용하였다. 데이터셋의 메타 테스트 세트는 4개의 서로 다른 사과 클래스(3 diseased, 1 healthy), 메타 훈련 세트는 나머지 34개의 클래스로 구성된다. 또한 본 실험에서는 단일 작물에 대한 모델을 고려하므로, 탐색 대상 모델은 앞선 실험에서의 절반 정도의 파라미터 개수를 갖는 모델로 설정하였다. 모델의 탐색 공간은 4개의 셀, 각 셀은 3개의 중간 노드로 구성되며, 1, 3번째 셀은 일반 셀, 2, 4번째 셀은 축소 셀이다. 평가 단계에서는 메타 러닝된 모델을 메타 테스트 세트에 대해 30 학습 단계 동안 태스크 적응 과정과 프루닝을 통해 최종 모델을 구성하여 모델의 성능을 확인하였다. 나머지 세부 설정은앞선 실험과 동일하다. 제한된 데이터 조건에서 성능을 확인하기 위해 4-plant 4-image 설정으로 진행되었다. 본 실험 결과, 앞선 실험에서 탐색한 모델의 절반 수준인 약 0.5M개의 파라미터만으로 75.8%의 정확도를 달성하였다. 이를 통해 제안 기법을 활용하면 적은 수의 파라미터를 가진 모델에서도 성능 저하 없이 준수한 분류 정확도를 유지할 수 있음을 확인하였다. 특히, 제안 기법을 이용하면 기존에 얻어진 다양한 작물에서의 병충해 데이터를 이용하여 새로운 작물의 병충해 진단을 위한 최적화된 메타 모델을 학습하고, 이를 이용하여 적은 데이터만을 갖는 특정 작물에 대해서도 빠르게 적응할 수 있음을 보였다. 이러한 접근 방식은 IoT 기반 농업 환경에서도 활용 가능성이 높아, 실용적이고 효율적인 솔루션을 제공할 수 있음을 시사한다. Ⅵ. 결 론본 연구에서는 제한된 데이터와 IoT 환경에서 메타 러닝 기반 신경망 구조 탐색 기법을 활용하여 병충해 작물 분류 문제를 효과적으로 해결할 수 있는 방법을 제시하였다. 기존 방법 대비 높은 효율성과 정확도를 달성하였으며, 특히 작은 데이터셋에서도 일반화 성능을 유지하는 메타 러닝 기반 신경망 구조 탐색 기법의 강점을 확인하였다. 실험 결과, 제안한 방법은 병충해 분류에서 우수한 성능을 보였으며, IoT 장치에서도 실시간으로 활용할 수 있는 가능성을 보여 스마트 농업 실현에 기여할 수 있음을 입증하였다. 그러나 본 연구는 IoT 장치에서의 실질적인 실행 속도를 고려하지 못했다는 한계가 있다. 향후 연구에서는 IoT 장치의 제한된 컴퓨팅 리소스와 메모리 환경에서도 원활히 작동할 수 있도록 단순히 모델의 크기를 기준으로 모델 탐색을 수행하는 것이 아니라 모델의 연산 효율성을 높이는 방향으로도 모델 탐색 최적화를 진행하여 실시간 병충해 진단 시스템의 현장 적용성을 높이고자 한다. 특히, 모델의 추론 지연 시간을 최소화하는 방향으로 연구를 확장하면 실시간 진단이 가능하도록 최적 모델을 탐색할 수 있다. 이러한 연구를 통해 스마트 농업 생태계 구축에 기여할 수 있을 것으로 기대된다. Biography이 현 석 (Hyun-Suk Lee)2012년 2월: 연세대학교 전기전자공학과 학사 2018년 2월: 연세대학교 전기전자공학과 박사 2018년 3월~2020년 8월: 연세대학교 전기전자공학과 박사후연구원 2019년 9월~2020년 8월: Department of Applied Mathematics and Theoretical Physics, University of Cambridge 박사후연구원 2020년 9월~2024년 8월: 세종대학교 지능기전공학부 조교수 2024년 9월~현재: 세종대학교 AI로봇학과 부교수 <관심분야> 무선통신, 통신망 자원 할당, 인공지능, 최적화, 디지털 트윈 [ORCID::0000-0001-5885-1711] References
|
StatisticsCite this articleIEEE StyleJ. Kim and H. Lee, "A Study on Meta-Learning Based Neural Architecture Search for Crop Disease Diagnosis in IoT Environments," The Journal of Korean Institute of Communications and Information Sciences, vol. 50, no. 9, pp. 1353-1363, 2025. DOI: 10.7840/kics.2025.50.9.1353.
ACM Style Ji-Uk Kim and Hyun-Suk Lee. 2025. A Study on Meta-Learning Based Neural Architecture Search for Crop Disease Diagnosis in IoT Environments. The Journal of Korean Institute of Communications and Information Sciences, 50, 9, (2025), 1353-1363. DOI: 10.7840/kics.2025.50.9.1353.
KICS Style Ji-Uk Kim and Hyun-Suk Lee, "A Study on Meta-Learning Based Neural Architecture Search for Crop Disease Diagnosis in IoT Environments," The Journal of Korean Institute of Communications and Information Sciences, vol. 50, no. 9, pp. 1353-1363, 9. 2025. (https://doi.org/10.7840/kics.2025.50.9.1353)
|


