Spaces:

Chatbot-TLU
/

M_chatbot

Sleeping

minh-4T commited on Mar 28

Commit

a802c71

verified ·

1 Parent(s): 1eda9e4

Update core/config.py

Files changed (1) hide show

core/config.py CHANGED Viewed

@@ -9,17 +9,27 @@ try:
 except Exception:
     pass
-# Read configuration from environment (safe for production). Defaults provided for convenience.
-GROQ_API_KEY = os.getenv('GROQ_API_KEY')
-LLM_MODEL = os.getenv('LLM_MODEL', 'llama-3.1-8b-instant')
-EMBED_MODEL = os.getenv('EMBED_MODEL', 'sentence-transformers/all-MiniLM-L6-v2')
-CROSS_ENCODER_MODEL = os.getenv('CROSS_ENCODER_MODEL', 'cross-encoder/ms-marco-MiniLM-L-6-v2')
-DATA_DIR = os.getenv('DATA_DIR', 'data')
-VECTOR_DIR = os.getenv('VECTOR_DIR', 'vectorstore')
-CHUNK_SIZE = int(os.getenv('CHUNK_SIZE', '1500'))
-CHUNK_OVERLAP = int(os.getenv('CHUNK_OVERLAP', '300'))
-TOP_K_RESULTS = int(os.getenv('TOP_K_RESULTS', '10'))
 FINAL_TOP_K = int(os.getenv('FINAL_TOP_K', '5'))
 QDRANT_URL = os.getenv('QDRANT_URL')
 QDRANT_API_KEY = os.getenv('QDRANT_API_KEY')
-DATABASE_URL = os.getenv('DATABASE_URL', 'sqlite:///chat_history.db')

 except Exception:
     pass
+GROQ_API_KEYS = os.getenv('GROQ_API_KEYS', os.getenv('GROQ_API_KEY', ''))
+GEMINI_API_KEYS = os.getenv('GEMINI_API_KEYS', '')
+# Name models
+LLM_MODEL = os.getenv('LLM_MODEL', 'llama-3.1-70b-versatile')
+FAST_LLM_MODEL = os.getenv('FAST_LLM_MODEL', 'llama-3.1-8b-instant')
+EMBED_MODEL = os.getenv('EMBED_MODEL', 'BAAI/bge-m3')
+CROSS_ENCODER_MODEL = os.getenv('CROSS_ENCODER_MODEL', 'BAAI/bge-reranker-base')
+# Chunking and retrieval settings
+CHUNK_SIZE = int(os.getenv('CHUNK_SIZE', '800'))
+CHUNK_OVERLAP = int(os.getenv('CHUNK_OVERLAP', '150'))
+TOP_K_RESULTS = int(os.getenv('TOP_K_RESULTS', '15'))
 FINAL_TOP_K = int(os.getenv('FINAL_TOP_K', '5'))
+# External service configs
 QDRANT_URL = os.getenv('QDRANT_URL')
 QDRANT_API_KEY = os.getenv('QDRANT_API_KEY')
+DATABASE_URL = os.getenv('DATABASE_URL')
+# - Context and output limits
+MAX_CONTEXT_CHARS = int(os.getenv('MAX_CONTEXT_CHARS', '12000'))
+MAX_OUT_CHARS = int(os.getenv('MAX_OUT_CHARS', '3000'))
+MAX_HISTORY_MESSAGES = int(os.getenv('MAX_HISTORY_MESSAGES', '20'))