Spaces:

Solshine
/

TestOfGradioRAGbyCodeLlama

Build error

App Files Files Community

Solshine commited on Feb 3, 2024

Commit

bf18e20

verified ·

1 Parent(s): 34b0ca7

Create app.py

Browse files

From codellama70B

Files changed (1) hide show

app.py +43 -0

app.py ADDED Viewed

	@@ -0,0 +1,43 @@

+import gradio as gr
+import pandas as pd
+import requests
+from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
+from rag_embeddings import RagRetriever
+# Load the RAG model
+rag_retriever = RagRetriever("rag_sequence")
+# Load the Mistral model
+tokenizer = AutoTokenizer.from_pretrained("EleutherAI/mistral-small-12L-4H-768d-albert")
+model = AutoModelForSeq2SeqLM.from_pretrained("EleutherAI/mistral-small-12L-4H-768d-albert")
+# Load the tabular data
+data = pd.read_csv("data.csv")
+#ADD DATASETS HERE
+def langchain(user_prompt, master_prompt):
+    # Retrieve data chunks using RAG embeddings
+    retrieved_data = rag_retriever.retrieve(user_prompt, data, num_results=5)
+    # Connect retrieved data chunks to user prompt and master prompt
+    input_text = user_prompt + " " + master_prompt + " " + " ".join(retrieved_data)
+    # Generate response using Mistral model
+    input_ids = tokenizer(input_text, return_tensors="pt").input_ids
+    generated_ids = model.generate(input_ids)
+    response = tokenizer.decode(generated_ids[0], skip_special_tokens=True)
+    return response
+iface = gr.Interface(
+    fn=langchain,
+    inputs=["text", "text"],
+    outputs="text",
+    title="LangChain App",
+    description="A Gradio app that retrieves specific datachunks using RAG embeding, from tabular csv data, and then connects those into the user prompt and the master prompt and then feed them into a Mistral model called from Hugging Face ran locally, then returns the response to the user via the gradio app GUI.",
+)
+iface.launch()
+iface.launch(share=True)