Dongjin1203 commited on
Commit
15c1ef1
·
1 Parent(s): 564c5be

컨텍스트 길이 증가

Browse files
src/generator/generator_gguf.py CHANGED
@@ -25,7 +25,7 @@ class GGUFGenerator:
25
  self,
26
  model_path: str,
27
  n_gpu_layers: int = 0,
28
- n_ctx: int = 2048,
29
  n_threads: int = 8,
30
  config = None,
31
  max_new_tokens: int = 256,
 
25
  self,
26
  model_path: str,
27
  n_gpu_layers: int = 0,
28
+ n_ctx: int = 8192,
29
  n_threads: int = 8,
30
  config = None,
31
  max_new_tokens: int = 256,
src/visualization/chatbot_app.py CHANGED
@@ -166,7 +166,7 @@ def initialize_rag(model_type):
166
  rag = GGUFRAGPipeline(
167
  config=config,
168
  n_gpu_layers=35, # T4에서 전체 레이어 GPU 사용
169
- n_ctx=4096, # 컨텍스트 길이
170
  n_threads=4, # CPU 스레드 (GPU 사용 시 낮게)
171
  max_new_tokens=512, # 최대 생성 토큰
172
  temperature=0.7,
 
166
  rag = GGUFRAGPipeline(
167
  config=config,
168
  n_gpu_layers=35, # T4에서 전체 레이어 GPU 사용
169
+ n_ctx=8192, # 컨텍스트 길이
170
  n_threads=4, # CPU 스레드 (GPU 사용 시 낮게)
171
  max_new_tokens=512, # 최대 생성 토큰
172
  temperature=0.7,