Spaces:

bziiit
/

VEGETALIS_AI_API

Sleeping

App Files Files Community

Ilyas KHIAT commited on Aug 27, 2024

Commit

55b4c5a

1 Parent(s): 6db239f

delete docs

Browse files

Files changed (3) hide show

main.py +17 -8
prompts.py +2 -0
rag.py +15 -5

main.py CHANGED Viewed

@@ -8,10 +8,13 @@ import os
 from dotenv import load_dotenv
 from rag import *
 from fastapi.responses import StreamingResponse
 load_dotenv()
 pinecone_api_key = os.environ.get("PINECONE_API_KEY")
 pc = Pinecone(api_key=pinecone_api_key)
@@ -84,14 +87,15 @@ async def upload_file(file: UploadFile, enterprise_data: Json[EnterpriseData]):
         text_chunks = get_text_chunks(text)
         # Create a vector store
-        vector_store = get_vectorstore(text_chunks, filename=file.filename, file_type="pdf", namespace=enterprise_data.id, index=index)
         if vector_store:
             return {
                 "file_name":file.filename,
                 "enterprise_id": enterprise_data.id,
                 "number_of_chunks": len(text_chunks),
-                "filename_id":vector_store["filename_id"]
             }
         else:
             raise HTTPException(status_code=500, detail="Could not create vector store")
@@ -137,11 +141,11 @@ import asyncio
 GENERATION_TIMEOUT_SEC = 60
-async def stream_generator(response):
     async with async_timeout.timeout(GENERATION_TIMEOUT_SEC):
         try:
             async for chunk in response:
-                yield "random data"
         except asyncio.TimeoutError:
             raise HTTPException(status_code=504, detail="Stream timed out")
@@ -152,17 +156,22 @@ def generate_answer(user_input: UserInput):
         prompt = user_input.prompt
         enterprise_id = user_input.enterprise_id
-        context = get_retreive_answer(enterprise_id, prompt, index)
         if not context:
             context = "No context found"
         if user_input.style_tonality is None:
-            answer = generate_response_via_langchain(prompt, model="gpt-4o",stream=user_input.stream,context = context , messages=user_input.messages)
         else:
-            answer = generate_response_via_langchain(prompt, model="gpt-4o",stream=user_input.stream,context = context , messages=user_input.messages,style=user_input.style_tonality.style,tonality=user_input.style_tonality.tonality)
         if user_input.stream:
-            return StreamingResponse(answer, media_type="application/json")
         return {
             "prompt": prompt,

 from dotenv import load_dotenv
 from rag import *
 from fastapi.responses import StreamingResponse
+import json
+from prompts import *
 load_dotenv()
 pinecone_api_key = os.environ.get("PINECONE_API_KEY")
+common_namespace = os.environ.get("COMMON_NAMESPACE")
 pc = Pinecone(api_key=pinecone_api_key)
         text_chunks = get_text_chunks(text)
         # Create a vector store
+        vector_store = get_vectorstore(text_chunks, filename=file.filename, file_type="pdf", namespace=enterprise_data.id, index=index,enterprise_name=enterprise_name)
         if vector_store:
             return {
                 "file_name":file.filename,
                 "enterprise_id": enterprise_data.id,
                 "number_of_chunks": len(text_chunks),
+                "filename_id":vector_store["filename_id"],
+                "enterprise_name":enterprise_name
             }
         else:
             raise HTTPException(status_code=500, detail="Could not create vector store")
 GENERATION_TIMEOUT_SEC = 60
+async def stream_generator(response,prompt):
     async with async_timeout.timeout(GENERATION_TIMEOUT_SEC):
         try:
             async for chunk in response:
+                yield json.dumps({"prompt": prompt, "content": chunk})
         except asyncio.TimeoutError:
             raise HTTPException(status_code=504, detail="Stream timed out")
         prompt = user_input.prompt
         enterprise_id = user_input.enterprise_id
+        template_prompt = base_template
+        context = get_retreive_answer(enterprise_id, prompt, index, common_namespace)
+        #final_prompt_simplified = prompt_formatting(prompt,template,context)
         if not context:
             context = "No context found"
         if user_input.style_tonality is None:
+            answer = generate_response_via_langchain(prompt, model="gpt-4o",stream=user_input.stream,context = context , messages=user_input.messages,template=template_prompt)
         else:
+            answer = generate_response_via_langchain(prompt, model="gpt-4o",stream=user_input.stream,context = context , messages=user_input.messages,style=user_input.style_tonality.style,tonality=user_input.style_tonality.tonality,template=template_prompt)
         if user_input.stream:
+            return StreamingResponse(stream_generator(answer,prompt), media_type="application/json")
         return {
             "prompt": prompt,

prompts.py ADDED Viewed

	@@ -0,0 +1,2 @@


1	+ base_template = "Vous êtes un spécialiste de la communication marketing responsable avec une expertise en stratégie de communication numérique, en gestion des médias sociaux, en création de contenu, en notoriété de la marque et en engagement communautaire, réponds avec un style {style} et une tonalité {tonality} dans ta communcation pour l'entreprise {entreprise}, sachant le context des documents suivants, {context}, et l'historique de la conversation, {messages}, {query}"
2	+

rag.py CHANGED Viewed

@@ -37,7 +37,7 @@ def get_text_chunks(text):
     chunks = text_splitter.split_text(text)
     return chunks
-def get_vectorstore(text_chunks,filename, file_type,namespace,index):
     try:
         embedding = OpenAIEmbeddings(model="text-embedding-3-large")
         vector_store = PineconeVectorStore(index=index, embedding=embedding,namespace=namespace)
@@ -52,7 +52,7 @@ def get_vectorstore(text_chunks,filename, file_type,namespace,index):
             document = Document(
             page_content=chunk,
-            metadata={"filename":filename,"file_type":file_type, "filename_id":clean_filename},
             )
             uuid = f"{clean_filename}_{i}"
@@ -83,7 +83,7 @@ def get_retreive_answer(enterprise_id,prompt,index,common_id):
             retriever_commun = vector_store_commun.as_retriever(
                 search_type="similarity_score_threshold",
-                search_kwargs={"k": 3, "score_threshold": 0.6},
             )
             response = retriever.invoke(prompt) + retriever_commun.invoke(prompt)
@@ -97,9 +97,19 @@ def get_retreive_answer(enterprise_id,prompt,index,common_id):
         print(e)
         return False
-def generate_response_via_langchain(query: str, stream: bool = False, model: str = "gpt-4o-mini",context:str="",messages = [],style:str="formal",tonality:str="neutral"):
     # Define the prompt template
-    template = "En tant qu'IA experte en marketing, réponds avec un style {style} et une tonalité {tonality} dans ta communcation, sachant le context suivant: {context}, et l'historique de la conversation: {messages}, {query}"
     prompt = PromptTemplate.from_template(template)

     chunks = text_splitter.split_text(text)
     return chunks
+def get_vectorstore(text_chunks,filename, file_type,namespace,index,enterprise_name):
     try:
         embedding = OpenAIEmbeddings(model="text-embedding-3-large")
         vector_store = PineconeVectorStore(index=index, embedding=embedding,namespace=namespace)
             document = Document(
             page_content=chunk,
+            metadata={"filename":filename,"file_type":file_type, "filename_id":clean_filename, "entreprise_name":enterprise_name},
             )
             uuid = f"{clean_filename}_{i}"
             retriever_commun = vector_store_commun.as_retriever(
                 search_type="similarity_score_threshold",
+                search_kwargs={"k": 3, "score_threshold": 0.5},
             )
             response = retriever.invoke(prompt) + retriever_commun.invoke(prompt)
         print(e)
         return False
+def reformat_prompt(prompt,enterprise_name,context,messages,query):
+    docs_names = []
+    for chunk in context:
+        chunk_name = chunk["metadata"]["filename"]
+        if chunk_name not in docs_names:
+            docs_names.append(chunk_name)
+    context = ", ".join(docs_names)
+    return prompt.format(entreprise=enterprise_name,context=context,messages=messages,query=query)
+def generate_response_via_langchain(query: str, stream: bool = False, model: str = "gpt-4o-mini",context:str="",messages = [],style:str="formal",tonality:str="neutral",template:str = ""):
     # Define the prompt template
+    if template == "":
+        template = "En tant qu'IA experte en marketing, réponds avec un style {style} et une tonalité {tonality} dans ta communcation, sachant le context suivant: {context}, et l'historique de la conversation, {messages}, {query}"
     prompt = PromptTemplate.from_template(template)