voicechatbot

Runtime error

redfernstech commited on Feb 13, 2025

Commit

14a964e

verified ·

1 Parent(s): 74286e0

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -29,7 +29,7 @@ class MessageRequest(BaseModel):
     message: str
     language: str
-repo_id = "deepseek-ai/deepseek-vl-7b-chat"
 llm_client = InferenceClient(
     model=repo_id,
     token=os.getenv("HF_TOKEN"),
@@ -65,8 +65,8 @@ templates = Jinja2Templates(directory="static")
 # Configure Llama index settings
 Settings.llm = HuggingFaceInferenceAPI(
-    model_name="deepseek-ai/deepseek-vl-7b-chat",
-    tokenizer_name="deepseek-ai/deepseek-vl-7b-chat",
     context_window=3000,
     token=os.getenv("HF_TOKEN"),
     max_new_tokens=512,

     message: str
     language: str
+repo_id = "meta-llama/Meta-Llama-3-8B-Instruct"
 llm_client = InferenceClient(
     model=repo_id,
     token=os.getenv("HF_TOKEN"),
 # Configure Llama index settings
 Settings.llm = HuggingFaceInferenceAPI(
+    model_name="meta-llama/Meta-Llama-3-8B-Instruct",
+    tokenizer_name="meta-llama/Meta-Llama-3-8B-Instruct",
     context_window=3000,
     token=os.getenv("HF_TOKEN"),
     max_new_tokens=512,