kogpt2-chatbot-lora / README.md

minmingbb

Upload README.md with huggingface_hub

48dcaf5 verified 3 months ago

preview code

raw

history blame contribute delete

1.06 kB

metadata

license: cc-by-nc-nd-4.0
base_model: skt/kogpt2-base-v2
tags:
  - gpt2
  - lora
  - korean
  - chatbot
language:
  - ko

모델 이름

모델 이름: LoRA 한국어 챗봇

모델 설명

모델 설명: LoRA를 활용한 한국어 챗봇 대화 형성 모델입니다.

모델 상세

베이스 모델: skt/kogpt2-base-v2
파인튜닝 방법: LoRA
언어: 한국어

LoRA 설정

LoRA rank: 8

학습 설정

에폭: 10
배치 크기: 10
학습 속도: 0.0002

학습 결과

사용 방법

tokenizer_reload = AutoTokenizer.from_pretrained(model_name_upload)

# 2. 베이스 모델 불러오기
base_reload = AutoModelForCausalLM.from_pretrained("skt/kogpt2-base-v2")

# 3. 학습할 때와 똑같이 크기 조정
base_reload.resize_token_embeddings(len(tokenizer_reload))
base_reload.config.pad_token_id = tokenizer_reload.pad_token_id

# 4. LoRA 불러오기
model_reload = PeftModel.from_pretrained(base_reload, model_name_upload)

minmingbb
/

kogpt2-chatbot-lora

모델 이름

모델 설명

모델 상세

LoRA 설정

학습 설정

학습 결과

사용 방법

모델 정보