sangwon1472 commited on
Commit
49871e2
Β·
1 Parent(s): e5a8be6

Expand model card

Browse files
Files changed (1) hide show
  1. README.md +330 -10
README.md CHANGED
@@ -1,18 +1,338 @@
1
  ---
2
  license: apache-2.0
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
3
  ---
 
4
  # gemma4-e2b-mud
5
 
6
- Gemma 4 E2B 기반 MUD μŠ€νƒ€μΌ νŒŒμΈνŠœλ‹ λͺ¨λΈ
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
7
 
8
- ## νŠΉμ§•
9
- - ν…μŠ€νŠΈ MUD 세계관 νŠΉν™”
10
- - λͺ…λ Ή 기반 μΈν„°λž™μ…˜
11
- - μ„œμ‚¬ 쀑심 좜λ ₯
12
 
13
- ## μ‚¬μš©λ²•
14
- Transformers λ˜λŠ” GGUF (LM Studio) μ‚¬μš© κ°€λŠ₯
15
 
16
- ## 포함 자료
17
- - `gemma-mud-colab-starter/`
18
- Colab ν•™μŠ΅ λ…ΈνŠΈλΆ, 데이터셋 μ˜ˆμ‹œ, LM Studio ν”„λ‘¬ν”„νŠΈ, μ‹€ν–‰ κ°€μ΄λ“œλ₯Ό ν•¨κ»˜ λ„£μ–΄λ‘” μŠ€νƒ€ν„° νŒ¨ν‚€μ§€
 
1
  ---
2
  license: apache-2.0
3
+ language:
4
+ - ko
5
+ library_name: transformers
6
+ pipeline_tag: text-generation
7
+ base_model:
8
+ - google/gemma-4-E2B-it
9
+ tags:
10
+ - gemma
11
+ - gemma4
12
+ - korean
13
+ - roleplay
14
+ - mud
15
+ - lore
16
+ - gguf
17
+ - llama.cpp
18
+ - lmstudio
19
+ - transformers
20
  ---
21
+
22
  # gemma4-e2b-mud
23
 
24
+ `gemma4-e2b-mud` λŠ” **Gemma 4 E2B 계열을 기반으둜 ν•œ ν•œκ΅­μ–΄ μš°μ£Όν•­ν–‰ ν…μŠ€νŠΈ MUD μŠ€νƒ€μΌ λͺ¨λΈ**이닀.
25
+ 짧은 λͺ…λ Ή λ°˜μ‘, NPC λŒ€μ‚¬, λ°© λΆ„μœ„κΈ° λ¬˜μ‚¬, μ „μŠΉ μ„€λͺ…, ν•­λ‘œ 힌트 같은 **κ²Œμž„ μ„œμ‚¬ λ ˆμ΄μ–΄**λ₯Ό 닀루기 μ’‹κ²Œ μ •λ¦¬ν•œ μ²΄ν¬ν¬μΈνŠΈμ™€, 이λ₯Ό μž¬ν˜„ν•˜κ±°λ‚˜ ν™•μž₯ν•  수 μžˆλŠ” **Colab μŠ€νƒ€ν„° νŒ¨ν‚€μ§€**, 그리고 **LM Studio용 GGUF**λ₯Ό ν•¨κ»˜ μ œκ³΅ν•œλ‹€.
26
+
27
+ 이 μ €μž₯μ†Œμ˜ 핡심 λ°©ν–₯은 β€œκ²Œμž„ μ—”μ§„μ˜ νŒμ •β€μ΄ μ•„λ‹ˆλΌ, **말투, λΆ„μœ„κΈ°, 짧은 세계관 응닡**을 AIκ°€ 맑도둝 λ§Œλ“œλŠ” 것이닀.
28
+
29
+ ## TL;DR
30
+
31
+ - 기반 λͺ¨λΈ: `google/gemma-4-E2B-it`
32
+ - μ£Ό μ‚¬μš© μ–Έμ–΄: ν•œκ΅­μ–΄
33
+ - μ£Ό μ‚¬μš© μ˜μ—­: ν…μŠ€νŠΈ MUD, NPC λŒ€ν™”, λ£Έ λ¬˜μ‚¬, μ „μŠΉ/λ‘œμ–΄ μ„€λͺ…
34
+ - 포함 ν˜•μ‹:
35
+ - Transformers 체크포인트
36
+ - LM Studio / llama.cpp 용 `GGUF`
37
+ - Colab / Unsloth μž¬ν˜„μš© μŠ€νƒ€ν„° νŒ¨ν‚€μ§€
38
+ - κ°€μž₯ 잘 λ§žλŠ” μž…λ ₯:
39
+ - `talk oracle`
40
+ - `look`
41
+ - `rumor`
42
+ - `scan signal`
43
+ - `First Fire Horizon이 μ–΄λ–€ 곳인지 μ„€λͺ…ν•΄μ€˜.`
44
+
45
+ ## 이 μ €μž₯μ†Œμ— λ“€μ–΄ μžˆλŠ” 것
46
+
47
+ ### 1. Transformers 체크포인트
48
+
49
+ λ£¨νŠΈμ—λŠ” λ³‘ν•©λœ Hugging Face ν˜•μ‹ λͺ¨λΈ κ°€μ€‘μΉ˜κ°€ λ“€μ–΄ μžˆλ‹€.
50
+
51
+ - `model-00001-of-00005.safetensors`
52
+ - `model-00002-of-00005.safetensors`
53
+ - `model-00003-of-00005.safetensors`
54
+ - `model-00004-of-00005.safetensors`
55
+ - `model-00005-of-00005.safetensors`
56
+ - `config.json`
57
+ - `processor_config.json`
58
+ - `tokenizer.json`
59
+ - `tokenizer_config.json`
60
+ - `chat_template.jinja`
61
+
62
+ ### 2. GGUF
63
+
64
+ LM Studio / llama.cpp 에 λ°”λ‘œ κ°€μ Έκ°ˆ 수 μžˆλ„λ‘ λ‹€μŒ GGUF νŒŒμΌμ„ ν•¨κ»˜ μ œκ³΅ν•œλ‹€.
65
+
66
+ - `gemma4-e2b-mud-Q4_K_M.gguf`
67
+
68
+ 이 νŒŒμΌμ€ 둜컬 μΆ”λ‘ , LM Studio ν…ŒμŠ€νŠΈ, λΉ λ₯Έ 배포에 μ ν•©ν•œ μ‹œμž‘μ μ΄λ‹€.
69
+
70
+ ### 3. Companion starter package
71
+
72
+ μ €μž₯μ†Œ μ•ˆμ˜ [`gemma-mud-colab-starter/`](./gemma-mud-colab-starter) ν΄λ”μ—λŠ” λ‹€μŒμ΄ ν¬ν•¨λ˜μ–΄ μžˆλ‹€.
73
+
74
+ - Colab λ…ΈνŠΈλΆ
75
+ - E2B / E4B μ‹€ν—˜μš© λ…ΈνŠΈλΆ λ³€ν˜•
76
+ - μ˜ˆμ‹œ 데이터셋
77
+ - LM Studio μ‹œμŠ€ν…œ ν”„λ‘¬ν”„νŠΈ
78
+ - ν…ŒμŠ€νŠΈ ν”„λ‘¬ν”„νŠΈ
79
+ - μ‹€ν–‰ μ•ˆλ‚΄μ™€ νŠΈλŸ¬λΈ”μŠˆνŒ… λ¬Έμ„œ
80
+
81
+ 즉 이 μ €μž₯μ†ŒλŠ” β€œλͺ¨λΈλ§Œ 던져 놓은 ν˜•νƒœβ€κ°€ μ•„λ‹ˆλΌ, **μ‹€ν—˜κ³Ό λ°°ν¬κΉŒμ§€ μ΄μ–΄μ§€λŠ” νŒ¨ν‚€μ§€ν˜• μ €μž₯μ†Œ**λ₯Ό λͺ©ν‘œλ‘œ ν•œλ‹€.
82
+
83
+ ## λͺ¨λΈ κ°œμš”
84
+
85
+ 이 λͺ¨λΈμ€ **Gemma 4 E2B instruct 계열을 ν…μŠ€νŠΈ MUD 톀에 맞게 닀듬은 νŒŒμƒ λͺ¨λΈ**이닀.
86
+
87
+ μ§€ν–₯ν•˜λŠ” 응닡은 μ•„λž˜μ™€ κ°™λ‹€.
88
+
89
+ - μ§§κ³  μ„ λͺ…ν•œ NPC λŒ€μ‚¬
90
+ - λΆ„μœ„κΈ°κ°€ μ‚΄μ•„ μžˆλŠ” λ°©/μž₯λ©΄ μ„€λͺ…
91
+ - 세계관 고유λͺ…사λ₯Ό μ€‘μ‹¬μœΌλ‘œ ν•œ μ „μŠΉ/λ‘œμ–΄ μ•ˆλ‚΄
92
+ - ν”Œλ ˆμ΄λ₯Ό λ•λŠ” 짧은 힌트
93
+ - λ²”μš© λΉ„μ„œν˜• 닡변보닀, **세계 μ•ˆμ— 머무λ₯΄λŠ” λ°˜μ‘**
94
+
95
+ λ°˜λŒ€λ‘œ μ•„λž˜μ™€ 같은 λ°©ν–₯은 ν”Όν•˜λ„λ‘ μ„€κ³„ν–ˆλ‹€.
96
+
97
+ - ν˜„μ‹€ κΈ°μ—…/DB/상식 μ„€λͺ…μœΌλ‘œ μƒˆλŠ” λ‹΅λ³€
98
+ - `AIλ‘œμ„œ...` 같은 메타 λ°œμ–Έ
99
+ - μž₯ν™©ν•œ 백과사전식 μ„€λͺ…
100
+ - κ²Œμž„ μƒνƒœλ₯Ό λͺ¨λΈμ΄ μž„μ˜λ‘œ ν™•μ •ν•˜λŠ” λ°œν™”
101
+
102
+ ## 기반 λͺ¨λΈκ³Ό ꡬ쑰
103
+
104
+ 이 μ €μž₯μ†Œμ˜ κΈ°λ°˜μ€ [`google/gemma-4-E2B-it`](https://huggingface.co/google/gemma-4-E2B-it) 이닀.
105
+ Gemma 4 E2BλŠ” Google의 μž‘μ€ Gemma 4 계열 λͺ¨λΈμ΄λ©°, 곡식 μΉ΄λ“œ κΈ°μ€€μœΌλ‘œ **Apache 2.0** λΌμ΄μ„ μŠ€λ₯Ό μ‚¬μš©ν•œλ‹€.
106
+
107
+ 주의:
108
+
109
+ - **이 μ €μž₯μ†Œ λ£¨νŠΈμ— 올라온 μ‹€μ œ κ°€μ€‘μΉ˜μ™€ GGUFλŠ” E2B κΈ°λ°˜μ΄λ‹€.**
110
+ - starter package μ•ˆμ— λ“€μ–΄ μžˆλŠ” `E4B` λ…ΈνŠΈλΆμ€ **E4B μ‹€ν—˜/μž¬ν•™μŠ΅μš© companion notebook** 이며, 루트 μ²΄ν¬ν¬μΈνŠΈκ°€ E4BλΌλŠ” λœ»μ€ μ•„λ‹ˆλ‹€.
111
+
112
+ 이 μ €μž₯μ†Œμ˜ 둜컬 `config.json` κΈ°μ€€ μ£Όμš” ν…μŠ€νŠΈ 섀정은 λ‹€μŒκ³Ό κ°™λ‹€.
113
+
114
+ - μ•„ν‚€ν…μ²˜: `Gemma4ForConditionalGeneration`
115
+ - `model_type`: `gemma4`
116
+ - ν…μŠ€νŠΈ hidden size: `1536`
117
+ - ν…μŠ€νŠΈ λ ˆμ΄μ–΄ 수: `35`
118
+ - attention heads: `8`
119
+ - key/value heads: `1`
120
+ - intermediate size: `6144`
121
+ - vocab size: `262144`
122
+ - sliding window: `512`
123
+
124
+ μ€‘μš”:
125
+
126
+ - **이 νŒŒμƒ λͺ¨λΈμ˜ μ‹€μ œ μ‚¬μš© μ΄ˆμ μ€ ν…μŠ€νŠΈ 생성**이닀.
127
+ - Gemma 4 E2B 계열 μžμ²΄λŠ” μž‘μ€ λ©€ν‹°λͺ¨λ‹¬ κ³„μ—΄μ΄μ§€λ§Œ, 이 μ €μž₯μ†Œμ˜ μŠ€νƒ€ν„° νŒ¨ν‚€μ§€μ™€ μ˜ˆμ‹œ ν”„λ‘¬ν”„νŠΈλŠ” **ν…μŠ€νŠΈ MUD μ‚¬μš© μ‹œλ‚˜λ¦¬μ˜€**에 맞좰져 μžˆλ‹€.
128
+ - ν•¨κ»˜ λ“€μ–΄ μžˆλŠ” GGUF 파일 μ—­μ‹œ LM Studioμ—μ„œ **ν…μŠ€νŠΈ λŒ€ν™” 쀑심**으둜 λ°”λ‘œ ν…ŒμŠ€νŠΈν•˜λŠ” μš©λ„μ— λ§žλ‹€.
129
+
130
+ ## μ–΄λ–€ μž‘μ—…μ— 잘 λ§žλŠ”κ°€
131
+
132
+ ### 잘 λ§žλŠ” μž‘μ—…
133
+
134
+ - ν…μŠ€νŠΈ MUD NPC λŒ€ν™”
135
+ - λ£Έ/μž₯λ©΄ λΆ„μœ„κΈ° λ¬˜μ‚¬
136
+ - 짧은 rumor / lore / signal 응닡
137
+ - 둜컬 μŠ€ν† λ¦¬ν…”λ§ ν…ŒμŠ€νŠΈ
138
+ - ν•œκ΅­μ–΄ 세계관 ν”„λ‘œν† νƒ€μ΄ν•‘
139
+ - MUD μ—”μ§„μ˜ β€œμ„œμ‚¬ λ ˆμ΄μ–΄β€ 뢄리 μ‹€ν—˜
140
+
141
+ ### 특히 잘 λ§žλŠ” μž…λ ₯ μŠ€νƒ€μΌ
142
+
143
+ - ν•œλ‘ 단어 λͺ…λ Ήν˜•
144
+ - `talk oracle`
145
+ - `look`
146
+ - `rumor`
147
+ - `scan signal`
148
+ - 짧은 μ„€λͺ… μš”μ²­ν˜•
149
+ - `First Fire Horizon이 μ–΄λ–€ 곳인지 μ„€λͺ…ν•΄μ€˜.`
150
+ - `Helios Verge의 μ˜λ―Έμ™€ μ€‘μš”μ„±μ„ μ„€λͺ…ν•΄μ€˜.`
151
+
152
+ ## μ–΄λ–€ μž‘μ—…μ—λŠ” λ§žμ§€ μ•ŠλŠ”κ°€
153
+
154
+ 이 λͺ¨λΈμ€ μ•„λž˜ 역할을 **직접 λ‹΄λ‹Ήν•˜μ§€ μ•ŠλŠ” 편이 μ•ˆμ „ν•˜λ‹€.**
155
+
156
+ - ν€˜μŠ€νŠΈ μ™„λ£Œ νŒμ •
157
+ - 보상 μ§€κΈ‰
158
+ - μ•„μ΄ν…œ/κ³¨λ“œ μ •μ‚°
159
+ - λ¬Έ μ—΄λ¦Ό/잠금 λ“± μƒνƒœ λ³€κ²½ ν™•μ •
160
+ - μ „νˆ¬ 승패 계산
161
+ - 법λ₯ , 의료, 금육 같은 κ³ μ‹ λ’° 정보 제곡
162
+
163
+ 즉, μΆ”μ²œ μ‚¬μš© κ΅¬μ‘°λŠ” λ‹€μŒκ³Ό κ°™λ‹€.
164
+
165
+ - **μ—”μ§„**: 이동, μ „νˆ¬, μƒνƒœ, 보상, ν€˜μŠ€νŠΈ 둜직
166
+ - **λͺ¨λΈ**: λŒ€μ‚¬, λΆ„μœ„κΈ°, μ „μŠΉ, 짧은 힌트, λ¬˜μ‚¬
167
+
168
+ ## λΉ λ₯Έ μ‹œμž‘
169
+
170
+ ### Transformers 둜 λ°”λ‘œ μ“°κΈ°
171
+
172
+ Gemma 4 곡식 λ¬Έμ„œμ˜ μ‚¬μš© 방식에 맞좰 `AutoProcessor` + `AutoModelForImageTextToText` 경둜둜 μ‹œμž‘ν•  수 μžˆλ‹€.
173
+
174
+ ```python
175
+ from transformers import AutoProcessor, AutoModelForImageTextToText
176
+ import torch
177
+
178
+ MODEL_ID = "sangwon1472/gemma4-e2b-mud"
179
+
180
+ processor = AutoProcessor.from_pretrained(MODEL_ID)
181
+ model = AutoModelForImageTextToText.from_pretrained(
182
+ MODEL_ID,
183
+ dtype="auto",
184
+ device_map="auto",
185
+ )
186
+
187
+ messages = [
188
+ {
189
+ "role": "system",
190
+ "content": "당신은 μš°μ£Όν•­ν–‰ ν…μŠ€νŠΈ MUD의 ν•­λ‘œ μ•ˆλ‚΄μžμ΄μž 세계관 ν•΄μ„€μžλ‹€. 닡변은 ν•œκ΅­μ–΄λ‘œ ν•œλ‹€."
191
+ },
192
+ {
193
+ "role": "user",
194
+ "content": "talk oracle"
195
+ },
196
+ ]
197
+
198
+ text = processor.apply_chat_template(
199
+ messages,
200
+ tokenize=False,
201
+ add_generation_prompt=True,
202
+ enable_thinking=False,
203
+ )
204
+
205
+ inputs = processor(text=text, return_tensors="pt").to(model.device)
206
+ input_len = inputs["input_ids"].shape[-1]
207
+
208
+ with torch.no_grad():
209
+ outputs = model.generate(
210
+ **inputs,
211
+ max_new_tokens=128,
212
+ temperature=1.0,
213
+ top_p=0.95,
214
+ top_k=64,
215
+ )
216
+
217
+ response = processor.decode(outputs[0][input_len:], skip_special_tokens=False)
218
+ print(processor.parse_response(response))
219
+ ```
220
+
221
+ ## LM Studio / llama.cpp μ‚¬μš©
222
+
223
+ 이 μ €μž₯μ†Œμ—λŠ” λ°”λ‘œ import κ°€λŠ₯ν•œ GGUF 파일이 ν¬ν•¨λ˜μ–΄ μžˆλ‹€.
224
+
225
+ - `gemma4-e2b-mud-Q4_K_M.gguf`
226
+
227
+ LM Studio μ—μ„œλŠ” 이 GGUFλ₯Ό κ°€μ Έμ™€μ„œ λ°”λ‘œ ν…ŒμŠ€νŠΈν•  수 μžˆλ‹€.
228
+ ν•¨κ»˜ μ œκ³΅ν•˜λŠ” μ‹œμŠ€ν…œ ν”„λ‘¬ν”„νŠΈμ™€ ν…ŒμŠ€νŠΈ λ¬Έμž₯은 starter package μ•ˆμ— μžˆλ‹€.
229
+
230
+ - [`lmstudio_system_prompt_ko.txt`](./gemma-mud-colab-starter/examples/lmstudio_system_prompt_ko.txt)
231
+ - [`lmstudio_system_prompt_npc_ko.txt`](./gemma-mud-colab-starter/examples/lmstudio_system_prompt_npc_ko.txt)
232
+ - [`lmstudio_system_prompt_lore_ko.txt`](./gemma-mud-colab-starter/examples/lmstudio_system_prompt_lore_ko.txt)
233
+ - [`lmstudio_test_prompts.md`](./gemma-mud-colab-starter/examples/lmstudio_test_prompts.md)
234
+
235
+ ### ꢌμž₯ μ‹œμž‘ ν”„λ‘¬ν”„νŠΈ
236
+
237
+ - `talk oracle`
238
+ - `look`
239
+ - `rumor`
240
+ - `scan signal`
241
+ - `First Fire Horizon이 μ–΄λ–€ 곳인지 μ„€λͺ…ν•΄μ€˜.`
242
+
243
+ ### ꢌμž₯ 생성 μ„€μ •
244
+
245
+ Gemma 4 계열은 곡식/μ‹€μ „ μ‚¬μš©μ—μ„œ μ•„λž˜ 값이 λ¬΄λ‚œν•œ μΆœλ°œμ μ΄λ‹€.
246
+
247
+ - `temperature = 1.0`
248
+ - `top_p = 0.95`
249
+ - `top_k = 64`
250
+
251
+ 보닀 μ§§κ³  μ•ˆμ •μ μΈ NPC 닡변이 ν•„μš”ν•˜λ©΄ μ•„λž˜μ²˜λŸΌ 쑰금 보수적으둜 μ‹œμž‘ν•΄λ„ μ’‹λ‹€.
252
+
253
+ - `temperature = 0.7`
254
+ - `max tokens = 96 ~ 128`
255
+
256
+ μœ„μ˜ β€œλ” μ§§κ²Œβ€ 섀정은 이 μ €μž₯μ†Œμ˜ MUD μš©λ„μ— 맞좘 μ‹€μ „ ꢌμž₯값이닀.
257
+
258
+ ## Companion starter package μ•ˆλ‚΄
259
+
260
+ ν•¨κ»˜ μ œκ³΅ν•˜λŠ” [`gemma-mud-colab-starter/`](./gemma-mud-colab-starter) ν΄λ”λŠ” λͺ¨λΈμ„ λ‹€μ‹œ ν•™μŠ΅ν•˜κ±°λ‚˜ λ³€ν˜•ν•΄ 보고 싢은 μ‚¬μš©μžλ₯Ό μœ„ν•œ ꡬ성이닀.
261
+
262
+ μ£Όμš” 파일:
263
+
264
+ - [`README.md`](./gemma-mud-colab-starter/README.md)
265
+ - [`run_instructions.md`](./gemma-mud-colab-starter/run_instructions.md)
266
+ - [`troubleshooting.md`](./gemma-mud-colab-starter/troubleshooting.md)
267
+ - [`Gemma4_MUD_QLoRA_Colab_Notebook-E2B.ipynb`](./gemma-mud-colab-starter/notebooks/Gemma4_MUD_QLoRA_Colab_Notebook-E2B.ipynb)
268
+ - [`Gemma4_MUD_QLoRA_Colab_Notebook-E4B.ipynb`](./gemma-mud-colab-starter/notebooks/Gemma4_MUD_QLoRA_Colab_Notebook-E4B.ipynb)
269
+
270
+ ν¬ν•¨λœ μ˜ˆμ‹œ 데이터셋:
271
+
272
+ - `combined_1000.jsonl` : 1000ν–‰ 원본
273
+ - `combined_1000.unsloth_chatml_dedup.jsonl` : 963ν–‰ 정리본
274
+ - `combined_1000.unsloth_gemma4_messages_dedup.jsonl` : 963ν–‰ Gemma 4 messages 정리본
275
+ - `gemma4_mud_alpaca_100.jsonl` : 100ν–‰ μ†Œν˜• μ˜ˆμ‹œ
276
+
277
+ μ€‘μš”:
278
+
279
+ - μœ„ 데이터셋은 **starter/retraining/example μš©λ„**둜 ν•¨κ»˜ λ„£μ–΄ λ‘” 것이닀.
280
+ - 이 μ €μž₯μ†Œμ˜ 체크포인트λ₯Ό μ΄ν•΄ν•˜κ±°λ‚˜ ν™•μž₯ν•˜λŠ” 데 도움을 μ£ΌλŠ” 자료이며, μž¬ν˜„ μ‹€ν—˜μ„ μœ„ν•œ 좜발점으둜 λ³΄λŠ” 편이 μ’‹λ‹€.
281
+
282
+ ## 응닡 ν’ˆμ§ˆμ„ λ³Ό λ•Œ 쒋은 κΈ°μ€€
283
+
284
+ μ •λ‹΅ λ¬Έμž₯을 μ™Έμ›Œ λ‚΄λŠ”μ§€κ°€ 핡심은 μ•„λ‹ˆλ‹€.
285
+ 더 μ€‘μš”ν•œ 것은 **μ‘λ‹΅μ˜ κ²°**이닀.
286
+
287
+ 쒋은 μ‹ ν˜Έ:
288
+
289
+ - ν•œκ΅­μ–΄λ‘œ λ‹΅ν•œλ‹€
290
+ - 세계관 μ•ˆμ— λ¨Έλ¬Έλ‹€
291
+ - μ§§κ³  λΆ„μœ„κΈ°κ°€ μžˆλ‹€
292
+ - λͺ…령어별 λ°˜μ‘ 결이 λ‹€λ₯΄λ‹€
293
+ - ν˜„μ‹€ 일반 상식 κ°•μ˜λ‘œ μƒˆμ§€ μ•ŠλŠ”λ‹€
294
+
295
+ 경계 μ‹ ν˜Έ:
296
+
297
+ - `Hello!` 둜 μ‹œμž‘ν•˜λŠ” λ²”μš© 챗봇 톀
298
+ - `Oracle Database` 같은 ν˜„μ‹€ 상식 λ°˜μ‘
299
+ - `AIλ‘œμ„œ` 같은 메타 λ°œμ–Έ
300
+ - 엔진이 ν•΄μ•Ό ν•  μƒνƒœ νŒμ •μ„ λͺ¨λΈοΏ½οΏ½οΏ½ 직접 μ„ μ–Έ
301
+
302
+ ## ν•œκ³„μ™€ μ£Όμ˜μ‚¬ν•­
303
+
304
+ 이 λͺ¨λΈμ€ νŠΉμ • μŠ€νƒ€μΌκ³Ό μš©λ„μ— 맞좘 **도메인 μ μ‘ν˜• λͺ¨λΈ**이닀. λ”°λΌμ„œ μ•„λž˜ ν•œκ³„λ₯Ό μ΄ν•΄ν•˜κ³  μ“°λŠ” 것이 μ’‹λ‹€.
305
+
306
+ - 세계관 톀은 κ°•ν™”λ˜μ§€λ§Œ, μž‘μ€ 도메인 적응 λͺ¨λΈ νŠΉμ„±μƒ **고유λͺ…사λ₯Ό κ³Όμž₯되게 μ΄μ–΄λΆ™μ΄κ±°λ‚˜ λΆ„μœ„κΈ°λ₯Ό 과생성**ν•  수 μžˆλ‹€.
307
+ - ν…μŠ€νŠΈ MUD μ„œμ‚¬μ—λŠ” 잘 λ§žμ§€λ§Œ, 일반 λΉ„μ„œν˜• μ§ˆμ˜μ‘λ‹΅μ˜ 정확도λ₯Ό λͺ©ν‘œλ‘œ ν•˜μ§€λŠ” μ•Šμ•˜λ‹€.
308
+ - μž₯ν™©ν•œ μ„€λͺ…을 쀄이기 μœ„ν•΄ ν”„λ‘¬ν”„νŠΈμ™€ μ‹œμŠ€ν…œ λ©”μ‹œμ§€λ₯Ό μ§§κ³  λͺ…ν™•ν•˜κ²Œ μœ μ§€ν•˜λŠ” 편이 μ’‹λ‹€.
309
+ - 곡식 벀치마크 기반 μž¬ν‰κ°€λ‚˜ 별도 μ•ˆμ „μ„± 평가λ₯Ό 이 μΉ΄λ“œμ—μ„œ μ œκ³΅ν•˜μ§€λŠ” μ•ŠλŠ”λ‹€.
310
+
311
+ ## ꢌμž₯ μ‚¬μš© νŒ¨ν„΄
312
+
313
+ 이 λͺ¨λΈμ€ μ•„λž˜μ²˜λŸΌ 뢙이면 κ°€μž₯ μžμ—°μŠ€λŸ½λ‹€.
314
+
315
+ 1. ν”Œλ ˆμ΄μ–΄ μž…λ ₯을 짧은 ν…μŠ€νŠΈ ν”„λ‘¬ν”„νŠΈλ‘œ μ •λ¦¬ν•œλ‹€.
316
+ 2. 엔진은 μƒνƒœ/νŒμ •μ„ μ²˜λ¦¬ν•œλ‹€.
317
+ 3. λͺ¨λΈμ€ λŒ€μ‚¬, λ¬˜μ‚¬, 힌트, μ „μŠΉ μ„€λͺ…을 μƒμ„±ν•œλ‹€.
318
+ 4. 엔진은 λͺ¨λΈ 좜λ ₯을 κ·ΈλŒ€λ‘œ 쓰기보닀, ν•„μš”ν•˜λ©΄ ν›„μ²˜λ¦¬ κ·œμΉ™μ„ λ‘”λ‹€.
319
+
320
+ 특히 μ•„λž˜ 선은 μ§€ν‚€λŠ” 편이 μ’‹λ‹€.
321
+
322
+ - **엔진이 κ²°μ •ν•΄μ•Ό ν•  것**: ν€˜μŠ€νŠΈ 성곡, 보상, μ „νˆ¬ νŒμ •, λ¬Έ μƒνƒœ
323
+ - **λͺ¨λΈμ΄ ν‘œν˜„ν•΄λ„ 쒋은 것**: λΆ„μœ„κΈ°, λͺ©μ†Œλ¦¬, μ—¬μš΄, λ‹¨μ„œ, λ¬Έν™”, μ‹ ν™”
324
+
325
+ ## λΌμ΄μ„ μŠ€μ™€ 좜처
326
+
327
+ - νŒŒμƒ 기반 λͺ¨λΈ: [`google/gemma-4-E2B-it`](https://huggingface.co/google/gemma-4-E2B-it)
328
+ - λΌμ΄μ„ μŠ€ ν‘œκΈ°: `Apache-2.0`
329
+ - GGUF 및 starter package λŠ” 이 μ €μž₯μ†Œ 배포 편의λ₯Ό μœ„ν•΄ ν•¨κ»˜ ν¬ν•¨ν–ˆλ‹€.
330
+
331
+ Gemma 4 자체의 ꡬ쑰와 κΈ°λ³Έ μ‚¬μš© 방식은 곡식 Gemma 4 μΉ΄λ“œμ™€ Unsloth Gemma 4 λ¬Έμ„œλ₯Ό μ°Έκ³ ν•˜λ©΄ μ’‹λ‹€.
332
 
333
+ - [Google Gemma 4 E2B model card](https://huggingface.co/google/gemma-4-E2B-it)
334
+ - [Unsloth Gemma 4 docs](https://unsloth.ai/docs/models/gemma-4)
 
 
335
 
336
+ ## ν•œ 쀄 μš”μ•½
 
337
 
338
+ `gemma4-e2b-mud` λŠ” **ν•œκ΅­μ–΄ μš°μ£Όν•­ν–‰ ν…μŠ€νŠΈ MUD의 λΆ„μœ„κΈ°, NPC λŒ€μ‚¬, μ „μŠΉ μ„€λͺ…을 λ‘œμ»¬μ—μ„œλ„ λΉ λ₯΄κ²Œ μ‹œν—˜ν•  수 있게 λ§Œλ“  Gemma 4 E2B νŒŒμƒ λͺ¨λΈ + GGUF + Colab starter package 묢음**이닀.