Commit ยท
451f497
1
Parent(s): 94eb90f
Create README.md
Browse files
README.md
ADDED
|
@@ -0,0 +1,41 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
---
|
| 2 |
+
language:
|
| 3 |
+
- ko
|
| 4 |
+
- en
|
| 5 |
+
pipeline_tag: text-generation
|
| 6 |
+
tags:
|
| 7 |
+
- kroean
|
| 8 |
+
- llama
|
| 9 |
+
---
|
| 10 |
+
|
| 11 |
+
|
| 12 |
+
<p align="center" width="100%">
|
| 13 |
+
<img src="https://i.imgur.com/snFDU0P.png" alt="KoreanLM icon" style="width: 500px; display: block; margin: auto; border-radius: 10%;">
|
| 14 |
+
</p>
|
| 15 |
+
|
| 16 |
+
|
| 17 |
+
# KoreanLM: ํ๊ตญ์ด ์ธ์ด๋ชจ๋ธ ํ๋ก์ ํธ
|
| 18 |
+
|
| 19 |
+
KoreanLM์ ํ๊ตญ์ด ์ธ์ด๋ชจ๋ธ์ ๊ฐ๋ฐํ๊ธฐ ์ํ ์คํ์์ค ํ๋ก์ ํธ์
๋๋ค. ํ์ฌ ๋๋ถ๋ถ์ ์ธ์ด๋ชจ๋ธ๋ค์ ์์ด์ ์ด์ ์ ๋ง์ถ๊ณ ์์ด, ํ๊ตญ์ด์ ๋ํ ํ์ต์ด ์๋์ ์ผ๋ก ๋ถ์กฑํ๊ณ ํ ํฐํ ๊ณผ์ ์์ ๋นํจ์จ์ ์ธ ๊ฒฝ์ฐ๊ฐ ์์ต๋๋ค. ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ณ ํ๊ตญ์ด์ ์ต์ ํ๋ ์ธ์ด๋ชจ๋ธ์ ์ ๊ณตํ๊ธฐ ์ํด KoreanLM ํ๋ก์ ํธ๋ฅผ ์์ํ๊ฒ ๋์์ต๋๋ค.
|
| 20 |
+
|
| 21 |
+
|
| 22 |
+
## ํ๋ก์ ํธ ๋ชฉํ
|
| 23 |
+
|
| 24 |
+
1. ํ๊ตญ์ด์ ํนํ๋ ์ธ์ด๋ชจ๋ธ ๊ฐ๋ฐ: ํ๊ตญ์ด์ ๋ฌธ๋ฒ, ์ดํ, ๋ฌธํ์ ํน์ฑ์ ๋ฐ์ํ์ฌ ํ๊ตญ์ด๋ฅผ ๋ ์ ํํ๊ฒ ์ดํดํ๊ณ ์์ฑํ ์ ์๋ ์ธ์ด๋ชจ๋ธ์ ๊ฐ๋ฐํฉ๋๋ค.
|
| 25 |
+
|
| 26 |
+
2. ํจ์จ์ ์ธ ํ ํฐํ ๋ฐฉ์ ๋์
: ํ๊ตญ์ด ํ
์คํธ์ ํ ํฐํ ๊ณผ์ ์์ ํจ์จ์ ์ด๊ณ ์ ํํ ๋ถ์์ด ๊ฐ๋ฅํ ์๋ก์ด ํ ํฐํ ๋ฐฉ์์ ๋์
ํ์ฌ ์ธ์ด๋ชจ๋ธ์ ์ฑ๋ฅ์ ํฅ์์ํต๋๋ค.
|
| 27 |
+
|
| 28 |
+
3. ๊ฑฐ๋ ์ธ์ด๋ชจ๋ธ์ ์ฌ์ฉ์ฑ ๊ฐ์ : ํ์ฌ ๊ฑฐ๋ํ ์ฌ์ด์ฆ์ ์ธ์ด๋ชจ๋ธ๋ค์ ๊ธฐ์
์ด ์์ฌ์ ๋ฐ์ดํฐ๋ฅผ ํ์ธํ๋ํ๊ธฐ ์ด๋ ค์ด ๋ฌธ์ ๊ฐ ์์ต๋๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ํ๊ตญ์ด ์ธ์ด๋ชจ๋ธ์ ํฌ๊ธฐ๋ฅผ ์กฐ์ ํ์ฌ ์ฌ์ฉ์ฑ์ ๊ฐ์ ํ๊ณ , ์์ฐ์ด ์ฒ๋ฆฌ ์์
์ ๋ ์ฝ๊ฒ ์ ์ฉํ ์ ์๋๋ก ํฉ๋๋ค.
|
| 29 |
+
|
| 30 |
+
|
| 31 |
+
## ์ฌ์ฉ ๋ฐฉ๋ฒ
|
| 32 |
+
|
| 33 |
+
๋ค์์ transformers ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ํตํด ๋ชจ๋ธ๊ณผ ํ ํฌ๋์ด์ ๋ฅผ ๋ก๋ฉํ๋ ์์ ์
๋๋ค.
|
| 34 |
+
|
| 35 |
+
```python
|
| 36 |
+
|
| 37 |
+
import transformers
|
| 38 |
+
model = transformers.AutoModelForCausalLM.from_pretrained("quantumaikr/KoreanLM-3B")
|
| 39 |
+
tokenizer = transformers.AutoTokenizer.from_pretrained("quantumaikr/KoreanLM-3B")
|
| 40 |
+
|
| 41 |
+
```
|