Spaces:

sashadd
/

LLM_RAG

Running

sashadd commited on 26 days ago

Commit

282737b

verified ·

1 Parent(s): d261794

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -9,13 +9,10 @@ from typing import Tuple, Dict
 # Конфигурация
 # ------------------------------------------------------------
 MODEL_NAMES = [
-    "tinkoff-ai/ruDialoGPT-small",
     "thelamapi/next2-0.8b",
     "Lamapi/next-1b",
     "Vikhrmodels/Vikhr-Llama-3.2-1B-instruct",
-    "Vikhrmodels/QVikhr-3-1.7B-Instruction-noreasoning",
-    "bigscience/mt0-base",
-    "BSC-LT/salamandra-2b-instruct"
 ]
 DEFAULT_MODEL = MODEL_NAMES[0]
@@ -105,6 +102,7 @@ def generate_response(
                 repetition_penalty=repetition_penalty,      # штраф за повторяющиеся токены
                 no_repeat_ngram_size=2,       # запрет повторения триграмм
                 early_stopping=True,          # остановка при достижении eos_token
                 pad_token_id=tokenizer.eos_token_id
             )
         latency = time.time() - start_time

 # Конфигурация
 # ------------------------------------------------------------
 MODEL_NAMES = [
     "thelamapi/next2-0.8b",
     "Lamapi/next-1b",
     "Vikhrmodels/Vikhr-Llama-3.2-1B-instruct",
+    "Vikhrmodels/QVikhr-3-1.7B-Instruction-noreasoning"
 ]
 DEFAULT_MODEL = MODEL_NAMES[0]
                 repetition_penalty=repetition_penalty,      # штраф за повторяющиеся токены
                 no_repeat_ngram_size=2,       # запрет повторения триграмм
                 early_stopping=True,          # остановка при достижении eos_token
+                top_k=50,
                 pad_token_id=tokenizer.eos_token_id
             )
         latency = time.time() - start_time