Spaces:

NCTCMumbai
/

HSN_Explanatory_notes_Chat_bot

Sleeping

NCTCMumbai commited on Mar 4, 2025

Commit

e6feb00

verified ·

1 Parent(s): 3d567bc

Update backend/query_llm.py

Files changed (1) hide show

backend/query_llm.py CHANGED Viewed

@@ -5,7 +5,7 @@ import gradio as gr
 from os import getenv
 from typing import Any, Dict, Generator, List
 from huggingface_hub import InferenceClient
 from transformers import AutoTokenizer
@@ -83,8 +83,24 @@ def generate_hf(prompt: str, history: str, temperature: float = 0.5, max_new_tok
     formatted_prompt = format_prompt(prompt, "hf")
     try:
-        stream = hf_client.text_generation(formatted_prompt, **generate_kwargs,
-                                            stream=True, details=True, return_full_text=False)
         output = ""
         for response in stream:
             output += response.token.text

 from os import getenv
 from typing import Any, Dict, Generator, List
+from gradio_client import Client
 from huggingface_hub import InferenceClient
 from transformers import AutoTokenizer
     formatted_prompt = format_prompt(prompt, "hf")
     try:
+        # stream = hf_client.text_generation(formatted_prompt, **generate_kwargs,
+        #                                     stream=True, details=True, return_full_text=False)
+        client_Qwen = Client("Qwen/Qwen1.5-110B-Chat-demo")
+        response = client_Qwen.predict(
+                    query=prompt,
+                    history=[],
+                    system="You are a helpful assistant.",
+                    api_name="/model_chat"
+                )
+                 # Extract the API output text
+        api_output = response[1] if response and len(response) > 1 else "No output received from the API."
+                #chatbot_responses.append((txt, api_output[0][1]))
+        print(response)
+        # Print the generated code
+        print(api_output[0][1])
+        stream=api_output[0][1]
         output = ""
         for response in stream:
             output += response.token.text