Spaces:

Dongjin1203
/

QLoRA_RAG_test

Sleeping

Dongjin1203 commited on Dec 9, 2025

Commit

acd788a

1 Parent(s): 9e0a8b0

컨텍스트 윈도우 값 수정, top_k 파라미터 수정

Files changed (1) hide show

src/utils/config.py CHANGED Viewed

@@ -41,7 +41,7 @@ class Config:
         self.COLLECTION_NAME = "rag_documents"
         # ===== 검색 설정 =====
-        self.DEFAULT_TOP_K = 10
         self.DEFAULT_ALPHA = 0.5
         self.DEFAULT_SEARCH_MODE = "hybrid_rerank"
@@ -87,7 +87,7 @@ class Config:
         # GGUF GPU 설정 (T4 Medium 최적화 - 8B 모델용)
         self.GGUF_N_GPU_LAYERS = int(os.getenv("GGUF_N_GPU_LAYERS", "35"))  # T4에서 8B 모델 전체를 GPU에 로드
-        self.GGUF_N_CTX = int(os.getenv("GGUF_N_CTX", "2048"))              # 컨텍스트 길이
         self.GGUF_N_THREADS = int(os.getenv("GGUF_N_THREADS", "4"))         # CPU 스레드 (GPU 사용 시 낮게)
         self.GGUF_MAX_NEW_TOKENS = int(os.getenv("GGUF_MAX_NEW_TOKENS", "512"))  # 최대 생성 토큰
         self.GGUF_TEMPERATURE = float(os.getenv("GGUF_TEMPERATURE", "0.7"))       # 생성 다양성

         self.COLLECTION_NAME = "rag_documents"
         # ===== 검색 설정 =====
+        self.DEFAULT_TOP_K = 5
         self.DEFAULT_ALPHA = 0.5
         self.DEFAULT_SEARCH_MODE = "hybrid_rerank"
         # GGUF GPU 설정 (T4 Medium 최적화 - 8B 모델용)
         self.GGUF_N_GPU_LAYERS = int(os.getenv("GGUF_N_GPU_LAYERS", "35"))  # T4에서 8B 모델 전체를 GPU에 로드
+        self.GGUF_N_CTX = int(os.getenv("GGUF_N_CTX", "4096"))              # 컨텍스트 길이
         self.GGUF_N_THREADS = int(os.getenv("GGUF_N_THREADS", "4"))         # CPU 스레드 (GPU 사용 시 낮게)
         self.GGUF_MAX_NEW_TOKENS = int(os.getenv("GGUF_MAX_NEW_TOKENS", "512"))  # 최대 생성 토큰
         self.GGUF_TEMPERATURE = float(os.getenv("GGUF_TEMPERATURE", "0.7"))       # 생성 다양성