Spaces:

Penality
/

pdf-something

Build error

Penality commited on Feb 23, 2025

Commit

9aee54a

verified ·

1 Parent(s): 2a7ef32

Update app.py

added deug statements to observe code execution

Files changed (1) hide show

app.py CHANGED Viewed

@@ -26,20 +26,21 @@ def store_document(text):
     print("storing document")
     embedding = embedding_model.encode([text])
     index.add(np.array(embedding, dtype=np.float32))
     documents.append(text)
-    print(f"your document has been stored: \n{documents}")
     return "Document stored!"
 def retrieve_document(query):
-    print(f"retrieving doc based on {query}")
     query_embedding = embedding_model.encode([query])
     _, closest_idx = index.search(np.array(query_embedding, dtype=np.float32), 1)
-    print(f"retrieved: {documents[closest_idx[0][0]]}")
     return documents[closest_idx[0][0]]
@@ -87,15 +88,18 @@ def chatbot(pdf_file, user_question):
         return f"Error retrieving document relevant to the query: {user_question} \n{e}"
     if doc:
         # Split into smaller chunks
         chunks = split_text(doc)
         # Use only the first chunk (to optimize token usage)
         prompt = f"Based on this document, answer the question:\n\nDocument:\n{chunks[0]}\n\nQuestion: {user_question}"
     else:
               prompt=user_question
     try:
             response = together.Completion.create(
                 model="mistralai/Mistral-7B-Instruct-v0.1",
                 prompt=prompt,

     print("storing document")
     embedding = embedding_model.encode([text])
+    print(f"embedding: \n{embedding}")
     index.add(np.array(embedding, dtype=np.float32))
     documents.append(text)
+    print(f"your document has been stored")
     return "Document stored!"
 def retrieve_document(query):
+    print(f"retrieving doc based on: \n{query}")
     query_embedding = embedding_model.encode([query])
     _, closest_idx = index.search(np.array(query_embedding, dtype=np.float32), 1)
+    print(f"retrieved: \n{documents[closest_idx[0][0]]}")
     return documents[closest_idx[0][0]]
         return f"Error retrieving document relevant to the query: {user_question} \n{e}"
     if doc:
+        print("found doc")
         # Split into smaller chunks
         chunks = split_text(doc)
         # Use only the first chunk (to optimize token usage)
         prompt = f"Based on this document, answer the question:\n\nDocument:\n{chunks[0]}\n\nQuestion: {user_question}"
+        print(f"prompt: \n{prompt}")
     else:
               prompt=user_question
     try:
+            print("asking")
             response = together.Completion.create(
                 model="mistralai/Mistral-7B-Instruct-v0.1",
                 prompt=prompt,