--- license: mit language: - ko metrics: - accuracy - f1 base_model: - facebook/convnext-tiny-224 pipeline_tag: image-classification tags: - multispectral - convnext - image-classification - remote-sensing - agriculture - xai --- # ConvNext_Multi 모델 카드 _Last updated: 2025-09-25 08:56:58 ## 최신 업데이트 내역 - **핵심 수정사항:** 마늘 데이터셋 기반 사전 학습 모델에 대해 양파 생육 단계별 스펙트럼 특성을 반영한 전처리 파이프라인 및 하이퍼파라미터 최적화(학습률·배치 크기·스케줄러 등)를 적용 - **개선사항:** 양파 생육 상태 분류 정확도 및 일반화 성능 향상을 확인하였으며, 작물별 분광 반응 특성을 차별적으로 반영 - **추가 학습:** 양파 전용 멀티스펙트럼 데이터셋(Blue, Green, Red, NIR, RedEdge)을 활용한 재학습 과정을 수행하여, 드론·위성 영상 기반 작물 모니터링의 적용 가능성 확대 - **도메인 확장:** 기존 마늘 중심의 모델을 양파 작물 생육 분석까지 확장함으로써, 다중 작물 대상 정밀 농업(Precision Agriculture) 활용성 강화 ## Model Details ConvNext_Multi는 다중분광(멀티스펙트럼) 영상 데이터를 입력으로 하여 작물 및 식생을 분류하는 ConvNeXt 기반 이미지 분류 모델입니다. 드론 및 위성에서 촬영한 5밴드 (Blue, Green, Red, Near-Infrared, RedEdge) 영상을 효율적으로 처리하도록 설계되어, 고해상도 농업·환경 모니터링에 적합합니다. - **Developed by:** AI Research Team, MuhanRnd - **License:** MIT - **Base model:** facebook/convnext-tiny-224 - **Languages:** Korean (모델 주석 및 문서화) - **Model type:** 이미지 분류 (멀티밴드 입력) - **Created_date:** 2025-06-05 13:32:18 - **Updated_date:** 2025-09-25 08:56:58 ## Uses ### Direct Use - 다중분광 영상 기반 생육 상태 분류 - 드론 영상의 5밴드 입력 멀티스펙트럼 이미지 분류 작업 ### Downstream Use - 유사한 다중분광 데이터셋에 대한 파인튜닝 - 농업 외 기타 환경 모니터링 대상 분류 문제 적용 가능 ### Out-of-Scope Use - RGB 3밴드 영상만을 사용하는 경우 (입력 구조상 활용 불가) - 보정되지 않은 멀티밴드 이미지(다중분광 보정값 처리 필요) - 객체 검출, 분할 등 분류 이외의 태스크 ## Bias, Risks, and Limitations - 본 모델은 특정 지역 및 작물 데이터를 중심으로 학습되었으므로, 미학습 환경에서는 성능 저하가 발생할 수 있음 - 다중분광 영상의 품질, 촬영 조건, 전처리 과정에 민감함 - 데이터 편향으로 인해 특정 작물이나 배경에 과적합 가능성 존재 - 모델 예측은 보조적 판단 자료로 활용해야 하며, 최종 의사결정은 전문가 판단과 병행 필요 ## How to Get Started ```python from transformers import AutoModelForImageClassification, AutoFeatureExtractor import torch # 모델과 특징 추출기 불러오기 model = AutoModelForImageClassification.from_pretrained("MhRnd/ConvNext_Multi") extractor = AutoFeatureExtractor.from_pretrained("MhRnd/ConvNext_Multi") # 다중밴드 이미지 텐서 (예: [batch_size, 5, H, W]) inputs = extractor(multi_band_images, return_tensors="pt") # 모델 추론 outputs = model(**inputs) logits = outputs.logits predicted_class = torch.argmax(logits, dim=1) ``` ## Training Details - **Training Data:** - 드론 및 위성 촬영 다중분광(5밴드) 이미지 데이터셋 - 라벨: 주요 작물 및 생육 상태 클래스 - **Training Procedure:** - 파인튜닝: facebook/convnext-tiny-224 기반 - 에폭수: 300 - 배치사이즈: 16 - 옵티마이저: AdamW - 학습률: 1e-06, Step 스케줄러 사용 ## Evaluation - **Testing Data:** 별도 보유한 검증용 다중분광 이미지셋 - **Metrics:** 정확도(Accuracy), 손실(Loss) - **Performance:** - **베스트 성능 (Epoch 82):** - 훈련 손실: 0.6502 - 훈련 정확도: 0.9537 - 검증 손실: 0.7511 - 검증 정확도: 0.9286 - **마지막 업데이트:** 2025-09-25 08:56:58 ## Environmental Impact - **Hardware:** NVIDIA RTX 3090 GPU (350W) - **Training Duration:** 18.44 minutes - **Total FLOPs:** 16650438.17 GFLOPs ## Citation ``` @article{liu2022convnext, title={ConvNeXt: A ConvNet for the 2020s}, author={Liu, Zhuang and Mao, Han and Wu, Chao and Feichtenhofer, Christoph and Darrell, Trevor and Xie, Saining}, journal={arXiv preprint arXiv:2201.03545}, year={2022} } ``` ## Glossary - **다중분광 영상(Multispectral Imagery):** 여러 파장대의 빛을 분리하여 촬영한 영상으로, 작물의 생육 상태 분석 등에 활용됨 - **ConvNeXt:** 현대적인 구조를 갖춘 컨볼루션 신경망(CNN) ## Model Card Authors - AI Research Team, MuhanRnd - pyh5214@muhanit.kr