Spaces:

Asish22
/

code-crawler

Running

App Files Files Community

juliaturc commited on Sep 16, 2024

Commit

c010627

1 Parent(s): 3d780b8

Add Hugging Face cross-encoders

Browse files

Files changed (2) hide show

requirements.txt +12 -9
sage/chat.py +26 -5

requirements.txt CHANGED Viewed

@@ -3,15 +3,15 @@ Pygments==2.18.0
 cohere==5.9.2
 fastapi==0.112.2
 gradio>=4.26.0
-langchain==0.2.15
-langchain-anthropic==0.1.23
-langchain-cohere==0.2.4
-langchain-community==0.2.12
-langchain-core==0.2.36
-langchain-experimental==0.0.64
-langchain-ollama==0.1.2
-langchain-openai==0.1.22
-langchain-text-splitters==0.2.2
 marqo==3.7.0
 nbformat==5.10.4
 openai==1.42.0
@@ -19,6 +19,9 @@ pinecone==5.0.1
 python-dotenv==1.0.1
 requests==2.32.3
 semchunk==2.2.0
 tiktoken==0.7.0
 tree-sitter==0.22.3
 tree-sitter-language-pack==0.2.0

 cohere==5.9.2
 fastapi==0.112.2
 gradio>=4.26.0
+langchain==0.3.0
+langchain-anthropic==0.2.0
+langchain-cohere==0.3.0
+langchain-community==0.3.0
+langchain-core==0.3.0
+langchain-experimental==0.3.0
+langchain-ollama==0.2.0
+langchain-openai==0.2.0
+langchain-text-splitters==0.3.0
 marqo==3.7.0
 nbformat==5.10.4
 openai==1.42.0
 python-dotenv==1.0.1
 requests==2.32.3
 semchunk==2.2.0
+sentence-transformers==3.1.0
 tiktoken==0.7.0
+tokenizers==0.19.1
+transformers==4.44.2
 tree-sitter==0.22.3
 tree-sitter-language-pack==0.2.0

sage/chat.py CHANGED Viewed

@@ -10,10 +10,12 @@ import gradio as gr
 from dotenv import load_dotenv
 from langchain.chains import create_history_aware_retriever, create_retrieval_chain
 from langchain.chains.combine_documents import create_stuff_documents_chain
-from langchain.schema import AIMessage, HumanMessage
-from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
 from langchain.retrievers import ContextualCompressionRetriever
 from langchain_cohere import CohereRerank
 import sage.vector_store as vector_store
 from sage.llm import build_llm_via_langchain
@@ -26,8 +28,16 @@ def build_rag_chain(args):
     llm = build_llm_via_langchain(args.llm_provider, args.llm_model)
     retriever = vector_store.build_from_args(args).to_langchain().as_retriever()
-    if args.reranker == "cohere":
-        compressor = CohereRerank(model="rerank-english-v3.0", cohere_api_key=os.environ.get("COHERE_API_KEY"))
         retriever = ContextualCompressionRetriever(base_compressor=compressor, base_retriever=retriever)
     # Prompt to contextualize the latest query based on the chat history.
@@ -89,7 +99,12 @@ def main():
         default="http://localhost:8882",
         help="URL for the Marqo server. Required if using Marqo as embedder or vector store.",
     )
-    parser.add_argument("--reranker", default="cohere", choices=["none", "cohere"])
     parser.add_argument(
         "--share",
         default=False,
@@ -113,6 +128,12 @@ def main():
         else:
             raise ValueError("Please specify --llm_model")
     rag_chain = build_rag_chain(args)
     def _predict(message, history):

 from dotenv import load_dotenv
 from langchain.chains import create_history_aware_retriever, create_retrieval_chain
 from langchain.chains.combine_documents import create_stuff_documents_chain
 from langchain.retrievers import ContextualCompressionRetriever
+from langchain.retrievers.document_compressors import CrossEncoderReranker
+from langchain.schema import AIMessage, HumanMessage
 from langchain_cohere import CohereRerank
+from langchain_community.cross_encoders import HuggingFaceCrossEncoder
+from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
 import sage.vector_store as vector_store
 from sage.llm import build_llm_via_langchain
     llm = build_llm_via_langchain(args.llm_provider, args.llm_model)
     retriever = vector_store.build_from_args(args).to_langchain().as_retriever()
+    if args.reranker_provider == "none":
+        compressor = None
+    if args.reranker_provider == "huggingface":
+        encoder_model = HuggingFaceCrossEncoder(model_name=args.reranker_model)
+        compressor = CrossEncoderReranker(model=encoder_model, top_n=5)
+    if args.reranker_provider == "cohere":
+        compressor = CohereRerank(model=args.reranker_model, cohere_api_key=os.environ.get("COHERE_API_KEY"), top_n=5)
+    if compressor:
         retriever = ContextualCompressionRetriever(base_compressor=compressor, base_retriever=retriever)
     # Prompt to contextualize the latest query based on the chat history.
         default="http://localhost:8882",
         help="URL for the Marqo server. Required if using Marqo as embedder or vector store.",
     )
+    parser.add_argument("--reranker-provider", default="huggingface", choices=["none", "huggingface", "cohere"])
+    parser.add_argument(
+        "--reranker-model",
+        help="The reranker model name. When --reranker-provider=huggingface, we suggest choosing a model from the "
+        "SentenceTransformers Cross-Encoders library https://huggingface.co/cross-encoder?sort_models=downloads#models",
+    )
     parser.add_argument(
         "--share",
         default=False,
         else:
             raise ValueError("Please specify --llm_model")
+    if not args.reranker_model:
+        if args.reranker_provider == "cohere":
+            args.reranker_model = "rerank-english-v3.0"
+        elif args.reranker_provider == "huggingface":
+            args.reranker_model = "cross-encoder/ms-marco-TinyBERT-L-2-v2"
     rag_chain = build_rag_chain(args)
     def _predict(message, history):