colable
/

llama2-ko-DPO

Text Generation

text-generation-inference

Model card Files Files and versions

colable commited on Feb 5, 2024

Commit

0a3bf58

·

verified ·

1 Parent(s): 566488a

Update README.md

Files changed (1) hide show

README.md +22 -0

README.md CHANGED Viewed

@@ -1,3 +1,25 @@
 ---
 license: mit
 ---

 ---
 license: mit
+language:
+- ko
 ---
+# open-llama-2-ko based model with modified DPO dataset
+This is an Korean Model based on
+* [beomi/open-llama-2-ko-7b]
+Dataset is modified from
+* [SJ-Donald/orca-dpo-pairs-ko]
+Parameters
+```
+learning_rate: float = 3e-4
+lr_scheduler: str = "cosine"
+warmup_ratio: float = 0.1
+lora_r: int = 16
+lora_alpha: int = 16
+lora_dropout: float = 0.05
+optim='paged_adamw_32bit'
+bf16=True
+```