Spaces:

mechark
/

RAG-lab

Sleeping

mechark commited on Dec 14, 2025

Commit

7b00ff7

1 Parent(s): 2b08c2f

Use ChatHuggingFace wrapper for better model support

Files changed (1) hide show

src/rag/llm.py CHANGED Viewed

@@ -1,4 +1,4 @@
-from langchain_huggingface import HuggingFaceEndpoint
 from langchain_core.prompts import ChatPromptTemplate
 from src.prompts import SYSTEM_PROMPT
@@ -8,12 +8,15 @@ from src.core.config import settings
 def get_chain():
     prompt = ChatPromptTemplate.from_template(SYSTEM_PROMPT)
     llm = HuggingFaceEndpoint(
         repo_id=settings.MODEL_NAME,
         huggingfacehub_api_token=settings.HUGGINGFACE_TOKEN,
         temperature=settings.MODEL_TEMPERATURE,
         max_new_tokens=settings.MODEL_MAX_TOKENS,
-        task="conversational",
     )
-    return prompt | llm

+from langchain_huggingface import ChatHuggingFace, HuggingFaceEndpoint
 from langchain_core.prompts import ChatPromptTemplate
 from src.prompts import SYSTEM_PROMPT
 def get_chain():
     prompt = ChatPromptTemplate.from_template(SYSTEM_PROMPT)
+    # Create base endpoint
     llm = HuggingFaceEndpoint(
         repo_id=settings.MODEL_NAME,
         huggingfacehub_api_token=settings.HUGGINGFACE_TOKEN,
         temperature=settings.MODEL_TEMPERATURE,
         max_new_tokens=settings.MODEL_MAX_TOKENS,
     )
+    # Wrap with ChatHuggingFace for better conversational support
+    chat_llm = ChatHuggingFace(llm=llm)
+    return prompt | chat_llm