Spaces:

datbkpro
/

voicebot

Sleeping

datbkpro commited on Oct 29, 2025

Commit

f16065f

verified ·

1 Parent(s): 673edb9

Update config/settings.py

Files changed (1) hide show

config/settings.py CHANGED Viewed

@@ -70,7 +70,11 @@ class Settings:
     DEFAULT_EMBEDDING_MODEL = 'sentence-transformers/all-MiniLM-L6-v2'
     DEFAULT_LLM_MODEL = "llama-3.1-8b-instant"
-    # Whisper Settings - TỐI ƯU HÓA
     WHISPER_MODEL = "whisper-large-v3"
     # TTS Settings
@@ -84,19 +88,19 @@ class Settings:
     EMBEDDING_DIMENSION = 768
     TOP_K_RESULTS = 5
-    # Audio Processing Settings - TỐI ƯU HÓA QUAN TRỌNG
     SAMPLE_RATE = 16000
     AUDIO_CHUNK_SIZE = 1024
-    AUDIO_SILENCE_THRESHOLD = 0.003  # Giảm ngưỡng cho nhạy hơn
-    MIN_AUDIO_DURATION = 0.8  # Tăng thời gian tối thiểu
-    MAX_AUDIO_DURATION = 15.0  # Tăng thời gian tối đa
-    # SpeechBrain VAD Settings - TỐI ƯU HÓA QUAN TRỌNG
     VAD_MODEL = "snakers4/silero-vad"
-    VAD_THRESHOLD = 0.3  # Tăng threshold để ổn định hơn
-    VAD_MIN_SPEECH_DURATION = 1.0  # Thời gian speech tối thiểu
-    VAD_MIN_SILENCE_DURATION = 2.0  # Thời gian silence tối thiểu để kết thúc
-    VAD_SPEECH_PAD_DURATION = 0.5  # Tăng padding
-    VAD_PRE_SPEECH_BUFFER = 0.3  # Thêm buffer trước khi speech
 settings = Settings()

     DEFAULT_EMBEDDING_MODEL = 'sentence-transformers/all-MiniLM-L6-v2'
     DEFAULT_LLM_MODEL = "llama-3.1-8b-instant"
+    # OCR Settings - THÊM CÀI ĐẶT OCR
+    OCR_MODEL = "kha-white/manga-ocr-base"  # OCR cho tiếng Việt và đa ngôn ngữ
+    EASYOCR_LANGUAGES = ['vi', 'en', 'fr', 'es', 'de', 'ja', 'ko', 'zh']  # Ngôn ngữ hỗ trợ
+    # Whisper Settings
     WHISPER_MODEL = "whisper-large-v3"
     # TTS Settings
     EMBEDDING_DIMENSION = 768
     TOP_K_RESULTS = 5
+    # Audio Processing Settings
     SAMPLE_RATE = 16000
     AUDIO_CHUNK_SIZE = 1024
+    AUDIO_SILENCE_THRESHOLD = 0.003
+    MIN_AUDIO_DURATION = 0.8
+    MAX_AUDIO_DURATION = 15.0
+    # VAD Settings
     VAD_MODEL = "snakers4/silero-vad"
+    VAD_THRESHOLD = 0.3
+    VAD_MIN_SPEECH_DURATION = 1.0
+    VAD_MIN_SILENCE_DURATION = 2.0
+    VAD_SPEECH_PAD_DURATION = 0.5
+    VAD_PRE_SPEECH_BUFFER = 0.3
 settings = Settings()