Commit
·
15c1ef1
1
Parent(s):
564c5be
컨텍스트 길이 증가
Browse files
src/generator/generator_gguf.py
CHANGED
|
@@ -25,7 +25,7 @@ class GGUFGenerator:
|
|
| 25 |
self,
|
| 26 |
model_path: str,
|
| 27 |
n_gpu_layers: int = 0,
|
| 28 |
-
n_ctx: int =
|
| 29 |
n_threads: int = 8,
|
| 30 |
config = None,
|
| 31 |
max_new_tokens: int = 256,
|
|
|
|
| 25 |
self,
|
| 26 |
model_path: str,
|
| 27 |
n_gpu_layers: int = 0,
|
| 28 |
+
n_ctx: int = 8192,
|
| 29 |
n_threads: int = 8,
|
| 30 |
config = None,
|
| 31 |
max_new_tokens: int = 256,
|
src/visualization/chatbot_app.py
CHANGED
|
@@ -166,7 +166,7 @@ def initialize_rag(model_type):
|
|
| 166 |
rag = GGUFRAGPipeline(
|
| 167 |
config=config,
|
| 168 |
n_gpu_layers=35, # T4에서 전체 레이어 GPU 사용
|
| 169 |
-
n_ctx=
|
| 170 |
n_threads=4, # CPU 스레드 (GPU 사용 시 낮게)
|
| 171 |
max_new_tokens=512, # 최대 생성 토큰
|
| 172 |
temperature=0.7,
|
|
|
|
| 166 |
rag = GGUFRAGPipeline(
|
| 167 |
config=config,
|
| 168 |
n_gpu_layers=35, # T4에서 전체 레이어 GPU 사용
|
| 169 |
+
n_ctx=8192, # 컨텍스트 길이
|
| 170 |
n_threads=4, # CPU 스레드 (GPU 사용 시 낮게)
|
| 171 |
max_new_tokens=512, # 최대 생성 토큰
|
| 172 |
temperature=0.7,
|