nmj21c
/

gemma-7b-andj-sft

Text Generation

text-generation-inference

Model card Files Files and versions

nmj21c commited on Apr 5, 2024

Commit

0a09ba5

·

verified ·

1 Parent(s): c232d36

Update README.md

Files changed (1) hide show

README.md +8 -6

README.md CHANGED Viewed

@@ -6,20 +6,22 @@ language:
 # gemma-7b non IT 버전 채팅 파인 튜닝된 버전
-## version history
-- 0.1 : 2024-04-05
 ## 트레이닝 정보
-- Dataset : maywell/koVast
 - GPU : RTX 3090 24G x 1
 - optimizer : adamw_torch
 - lr scheduler type : cosine
-- trai hour : 140 hour
-- num of epoch : 1
 - train loss : 0.8991
 - eval loss : 0.7305
-## 사용법
 ```
 from transformers import AutoTokenizer, AutoModelForCausalLM
 import transformers

 # gemma-7b non IT 버전 채팅 파인 튜닝된 버전
+간단한 채팅 형태의 데이터로 파인 튜닝된 버전입니다.
+## history
+- 0.1 : 2024-04-05 최초 SFT버전 업로드, DPO는 고민 중
 ## 트레이닝 정보
+- 사용데이터셋 : maywell/koVast 을 philschmid/gemma-tokenizer-chatml 에 맞게 변조하여 사용
 - GPU : RTX 3090 24G x 1
 - optimizer : adamw_torch
 - lr scheduler type : cosine
+- 트레이닝 시간 : 140시간
+- 에포크 : 1
 - train loss : 0.8991
 - eval loss : 0.7305
+## 사용법 (bfloat16, GPU 메모리 약 17기가 필요)
 ```
 from transformers import AutoTokenizer, AutoModelForCausalLM
 import transformers