kogpt2-chatbot-lora / README.md
minmingbb's picture
Upload README.md with huggingface_hub
48dcaf5 verified
metadata
license: cc-by-nc-nd-4.0
base_model: skt/kogpt2-base-v2
tags:
  - gpt2
  - lora
  - korean
  - chatbot
language:
  - ko

모델 이름

  • 모델 이름: LoRA 한국어 챗봇

모델 설명

  • 모델 설명: LoRA를 활용한 한국어 챗봇 대화 형성 모델입니다.

모델 상세

  • 베이스 모델: skt/kogpt2-base-v2
  • 파인튜닝 방법: LoRA
  • 언어: 한국어

LoRA 설정

  • LoRA rank: 8

학습 설정

  • 에폭: 10
  • 배치 크기: 10
  • 학습 속도: 0.0002

학습 결과

사용 방법

tokenizer_reload = AutoTokenizer.from_pretrained(model_name_upload)

# 2. 베이스 모델 불러오기
base_reload = AutoModelForCausalLM.from_pretrained("skt/kogpt2-base-v2")

# 3. 학습할 때와 똑같이 크기 조정
base_reload.resize_token_embeddings(len(tokenizer_reload))
base_reload.config.pad_token_id = tokenizer_reload.pad_token_id

# 4. LoRA 불러오기
model_reload = PeftModel.from_pretrained(base_reload, model_name_upload)

모델 정보