ConvNext_Multi / README.md

모델 카드 업데이트 - Epoch 54 (검증 정확도: 0.8571)

c5a85df verified 2 months ago

5.01 kB

	---
	license: mit
	language:
	- ko
	metrics:
	- accuracy
	- f1
	base_model:
	- facebook/convnext-tiny-224
	pipeline_tag: image-classification
	tags:
	- multispectral
	- convnext
	- image-classification
	- remote-sensing
	- agriculture
	- xai
	---

	# ConvNext_Multi 모델 카드

	_Last updated: 2025-09-25 08:56:58

	## 최신 업데이트 내역

	- 핵심 수정사항: 마늘 데이터셋 기반 사전 학습 모델에 대해 양파 생육 단계별 스펙트럼 특성을 반영한 전처리 파이프라인 및 하이퍼파라미터 최적화(학습률·배치 크기·스케줄러 등)를 적용

	- 개선사항: 양파 생육 상태 분류 정확도 및 일반화 성능 향상을 확인하였으며, 작물별 분광 반응 특성을 차별적으로 반영

	- 추가 학습: 양파 전용 멀티스펙트럼 데이터셋(Blue, Green, Red, NIR, RedEdge)을 활용한 재학습 과정을 수행하여, 드론·위성 영상 기반 작물 모니터링의 적용 가능성 확대

	- 도메인 확장: 기존 마늘 중심의 모델을 양파 작물 생육 분석까지 확장함으로써, 다중 작물 대상 정밀 농업(Precision Agriculture) 활용성 강화

	## Model Details

	ConvNext_Multi는 다중분광(멀티스펙트럼) 영상 데이터를 입력으로 하여 작물 및 식생을 분류하는 ConvNeXt 기반 이미지 분류 모델입니다. 드론 및 위성에서 촬영한 5밴드 (Blue, Green, Red, Near-Infrared, RedEdge) 영상을 효율적으로 처리하도록 설계되어, 고해상도 농업·환경 모니터링에 적합합니다.

	- Developed by: AI Research Team, MuhanRnd
	- License: MIT
	- Base model: facebook/convnext-tiny-224
	- Languages: Korean (모델 주석 및 문서화)
	- Model type: 이미지 분류 (멀티밴드 입력)
	- Created_date: 2025-06-05 13:32:18
	- Updated_date: 2025-09-25 08:56:58


	## Uses

	### Direct Use

	- 다중분광 영상 기반 생육 상태 분류
	- 드론 영상의 5밴드 입력 멀티스펙트럼 이미지 분류 작업

	### Downstream Use

	- 유사한 다중분광 데이터셋에 대한 파인튜닝
	- 농업 외 기타 환경 모니터링 대상 분류 문제 적용 가능

	### Out-of-Scope Use

	- RGB 3밴드 영상만을 사용하는 경우 (입력 구조상 활용 불가)
	- 보정되지 않은 멀티밴드 이미지(다중분광 보정값 처리 필요)
	- 객체 검출, 분할 등 분류 이외의 태스크

	## Bias, Risks, and Limitations

	- 본 모델은 특정 지역 및 작물 데이터를 중심으로 학습되었으므로, 미학습 환경에서는 성능 저하가 발생할 수 있음
	- 다중분광 영상의 품질, 촬영 조건, 전처리 과정에 민감함
	- 데이터 편향으로 인해 특정 작물이나 배경에 과적합 가능성 존재
	- 모델 예측은 보조적 판단 자료로 활용해야 하며, 최종 의사결정은 전문가 판단과 병행 필요

	## How to Get Started

	```python
	from transformers import AutoModelForImageClassification, AutoFeatureExtractor
	import torch

	# 모델과 특징 추출기 불러오기
	model = AutoModelForImageClassification.from_pretrained("MhRnd/ConvNext_Multi")
	extractor = AutoFeatureExtractor.from_pretrained("MhRnd/ConvNext_Multi")

	# 다중밴드 이미지 텐서 (예: [batch_size, 5, H, W])
	inputs = extractor(multi_band_images, return_tensors="pt")

	# 모델 추론
	outputs = model(**inputs)
	logits = outputs.logits
	predicted_class = torch.argmax(logits, dim=1)
	```

	## Training Details

	- Training Data:
	- 드론 및 위성 촬영 다중분광(5밴드) 이미지 데이터셋
	- 라벨: 주요 작물 및 생육 상태 클래스

	- Training Procedure:
	- 파인튜닝: facebook/convnext-tiny-224 기반
	- 에폭수: 300
	- 배치사이즈: 16
	- 옵티마이저: AdamW
	- 학습률: 1e-06, Step 스케줄러 사용

	## Evaluation

	- Testing Data: 별도 보유한 검증용 다중분광 이미지셋
	- Metrics: 정확도(Accuracy), 손실(Loss)
	- Performance:
	- 베스트 성능 (Epoch 82):
	- 훈련 손실: 0.6502
	- 훈련 정확도: 0.9537
	- 검증 손실: 0.7511
	- 검증 정확도: 0.9286
	- 마지막 업데이트: 2025-09-25 08:56:58


	## Environmental Impact

	- Hardware: NVIDIA RTX 3090 GPU (350W)
	- Training Duration: 18.44 minutes
	- Total FLOPs: 16650438.17 GFLOPs

	## Citation
	```
	@article{liu2022convnext,
	title={ConvNeXt: A ConvNet for the 2020s},
	author={Liu, Zhuang and Mao, Han and Wu, Chao and Feichtenhofer, Christoph and Darrell, Trevor and Xie, Saining},
	journal={arXiv preprint arXiv:2201.03545},
	year={2022}
	}
	```

	## Glossary

	- 다중분광 영상(Multispectral Imagery): 여러 파장대의 빛을 분리하여 촬영한 영상으로, 작물의 생육 상태 분석 등에 활용됨
	- ConvNeXt: 현대적인 구조를 갖춘 컨볼루션 신경망(CNN)

	## Model Card Authors

	- AI Research Team, MuhanRnd
	- pyh5214@muhanit.kr