Spaces:

Reza-galaxy21
/

IRI-PowerDistAI

Runtime error

App Files Files Community

Reza-galaxy21 commited on Feb 7, 2025

Commit

68cc812

verified ·

1 Parent(s): 9f6a01c

Update app.py

Browse files

Files changed (1) hide show

app.py +19 -40

app.py CHANGED Viewed

@@ -13,19 +13,14 @@ logger = logging.getLogger(__name__)
 # تنظیمات مسیرها
 UPLOAD_FOLDER = "uploaded_files"
-DATABASE_FILE = "/home/user/app/vector_database"  # بدون پسوند .pkl
 os.makedirs(UPLOAD_FOLDER, exist_ok=True)
-# مقداردهی کلید API
-openai_api_key = os.getenv("My_huggingface_key")
-if not openai_api_key:
-    logger.error("❌ کلید OpenAI API مقداردهی نشده است!")
 # بررسی و بارگذاری دیتابیس برداری
 def load_database():
     try:
         if os.path.exists(DATABASE_FILE):
-            embeddings = OpenAIEmbeddings(openai_api_key=openai_api_key)
             vector_db = FAISS.load_local(DATABASE_FILE, embeddings)
             logger.info(f"✅ دیتابیس بارگذاری شد: {DATABASE_FILE}")
             return vector_db
@@ -42,6 +37,7 @@ def save_database(vector_db):
         logger.info(f"✅ دیتابیس ذخیره شد: {DATABASE_FILE}")
     except Exception as e:
         logger.error(f"❌ خطا در ذخیره دیتابیس: {e}")
 global_vector_db = load_database()
@@ -61,12 +57,14 @@ def process_and_store_pdfs(file_paths):
         except Exception as e:
             logger.error(f"خطا در پردازش فایل {file_path}: {e}")
-    if not texts:
-        logger.warning("❌ هیچ متنی برای ذخیره‌سازی در FAISS یافت نشد.")
-        return None
     try:
         logger.info("در حال ایجاد embeddings و ذخیره‌سازی در FAISS...")
         embeddings = OpenAIEmbeddings(openai_api_key=openai_api_key)
         vector_db = FAISS.from_documents(texts, embeddings)
         logger.info(f"✅ ذخیره‌سازی در FAISS با موفقیت انجام شد. تعداد اسناد: {vector_db.index.ntotal}")
@@ -88,13 +86,18 @@ def chat_with_doc(query):
         retriever = global_vector_db.as_retriever(search_kwargs={"k": 5})
         docs = retriever.get_relevant_documents(query)
         if len(docs) == 0:
             return "هیچ اطلاعات مرتبطی یافت نشد."
-        context = "\n\n".join([doc.page_content for doc in docs])
-        logger.info(f"✅ اطلاعات مربوط به پرسش: {context}")
-        llm = ChatOpenAI(model_name="gpt-4", openai_api_key=openai_api_key)
         response = llm.predict(f"""سوال: {query}\n\nاطلاعات مرتبط:\n{context}\n\nپاسخ:""")
         final_response = f"پاسخ:\n{response}\n\nمنابع:\n"
@@ -115,12 +118,8 @@ def save_uploaded_file(file):
         global global_vector_db
         global_vector_db = process_and_store_pdfs([file_path])
         if global_vector_db:
             save_database(global_vector_db)
-            logger.info(f"📂 تعداد اسناد در دیتابیس: {global_vector_db.index.ntotal}")
-        else:
-            logger.error("❌ دیتابیس برداری مقداردهی نشده است!")
         return f"✅ فایل ذخیره شد: {file_path}"
     except Exception as e:
@@ -131,37 +130,16 @@ def debug_temp():
     debug_results = []
     # بررسی مقدار کلید API
     if openai_api_key:
         debug_results.append(f"✅ کلید API مقداردهی شده: {openai_api_key[:5]}****")
     else:
         debug_results.append("❌ کلید API مقداردهی نشده است!")
-    # بررسی فایل‌های PDF در مسیر آپلود
-    try:
-        pdf_files = [f for f in os.listdir(UPLOAD_FOLDER) if f.endswith(".pdf")]
-        if pdf_files:
-            file_paths = [os.path.join(UPLOAD_FOLDER, f) for f in pdf_files]
-            debug_results.append(f"✅ فایل‌های PDF در مسیر {UPLOAD_FOLDER}:")
-            # بررسی تعداد صفحات هر فایل
-            for file_path in file_paths:
-                try:
-                    loader = PyPDFLoader(file_path)
-                    documents = loader.load()
-                    debug_results.append(f"   - {os.path.basename(file_path)}: {len(documents)} صفحه")
-                except Exception as e:
-                    debug_results.append(f"❌ خط�� در بررسی صفحات {file_path}: {str(e)}")
-        else:
-            debug_results.append(f"❌ هیچ فایل PDF در مسیر {UPLOAD_FOLDER} وجود ندارد.")
-    except Exception as e:
-        debug_results.append(f"❌ خطا در بررسی پوشه {UPLOAD_FOLDER}: {e}")
     # بررسی وضعیت دیتابیس
     try:
         if os.path.exists(DATABASE_FILE):
             debug_results.append(f"✅ دیتابیس در مسیر {DATABASE_FILE} وجود دارد.")
-            # بررسی تعداد اسناد ذخیره شده
             if global_vector_db:
                 debug_results.append(f"   - تعداد اسناد در دیتابیس: {global_vector_db.index.ntotal}")
             else:
@@ -188,6 +166,7 @@ with gr.Blocks() as demo:
     debug_btn = gr.Button("🔍 بررسی دباگ موقت")
     debug_output = gr.Textbox(label="نتایج دباگ", lines=10, interactive=False)
     upload_btn.click(save_uploaded_file, inputs=[file], outputs=[upload_status])
     debug_btn.click(debug_temp, outputs=debug_output)

 # تنظیمات مسیرها
 UPLOAD_FOLDER = "uploaded_files"
+DATABASE_FILE = "/home/user/app/vector_database"
 os.makedirs(UPLOAD_FOLDER, exist_ok=True)
 # بررسی و بارگذاری دیتابیس برداری
 def load_database():
     try:
         if os.path.exists(DATABASE_FILE):
+            embeddings = OpenAIEmbeddings(openai_api_key=os.getenv("My_huggingface_key"))
             vector_db = FAISS.load_local(DATABASE_FILE, embeddings)
             logger.info(f"✅ دیتابیس بارگذاری شد: {DATABASE_FILE}")
             return vector_db
         logger.info(f"✅ دیتابیس ذخیره شد: {DATABASE_FILE}")
     except Exception as e:
         logger.error(f"❌ خطا در ذخیره دیتابیس: {e}")
+        raise e
 global_vector_db = load_database()
         except Exception as e:
             logger.error(f"خطا در پردازش فایل {file_path}: {e}")
     try:
         logger.info("در حال ایجاد embeddings و ذخیره‌سازی در FAISS...")
+        openai_api_key = os.getenv("My_huggingface_key")
+        if not openai_api_key:
+            logger.error("❌ کلید API مقداردهی نشده است!")
+            raise ValueError("❌ کلید OpenAI API یافت نشد.")
         embeddings = OpenAIEmbeddings(openai_api_key=openai_api_key)
         vector_db = FAISS.from_documents(texts, embeddings)
         logger.info(f"✅ ذخیره‌سازی در FAISS با موفقیت انجام شد. تعداد اسناد: {vector_db.index.ntotal}")
         retriever = global_vector_db.as_retriever(search_kwargs={"k": 5})
         docs = retriever.get_relevant_documents(query)
+        logger.info(f"✅ تعداد اسناد بازیابی‌شده: {len(docs)}")
         if len(docs) == 0:
             return "هیچ اطلاعات مرتبطی یافت نشد."
+        context = "\n\n".join([doc.page_content[:200] for doc in docs])  # نمایش ۲۰۰ کاراکتر اول از هر سند
+        logger.info(f"📄 اسناد بازیابی‌شده:\n{context}")
+        # تست جداگانه FAISS
+        return f"🔍 نتایج جستجو از FAISS:\n{context}"
+        llm = ChatOpenAI(model_name="gpt-4", openai_api_key=os.getenv("My_huggingface_key"))
         response = llm.predict(f"""سوال: {query}\n\nاطلاعات مرتبط:\n{context}\n\nپاسخ:""")
         final_response = f"پاسخ:\n{response}\n\nمنابع:\n"
         global global_vector_db
         global_vector_db = process_and_store_pdfs([file_path])
         if global_vector_db:
             save_database(global_vector_db)
         return f"✅ فایل ذخیره شد: {file_path}"
     except Exception as e:
     debug_results = []
     # بررسی مقدار کلید API
+    openai_api_key = os.getenv("My_huggingface_key")
     if openai_api_key:
         debug_results.append(f"✅ کلید API مقداردهی شده: {openai_api_key[:5]}****")
     else:
         debug_results.append("❌ کلید API مقداردهی نشده است!")
     # بررسی وضعیت دیتابیس
     try:
         if os.path.exists(DATABASE_FILE):
             debug_results.append(f"✅ دیتابیس در مسیر {DATABASE_FILE} وجود دارد.")
             if global_vector_db:
                 debug_results.append(f"   - تعداد اسناد در دیتابیس: {global_vector_db.index.ntotal}")
             else:
     debug_btn = gr.Button("🔍 بررسی دباگ موقت")
     debug_output = gr.Textbox(label="نتایج دباگ", lines=10, interactive=False)
+    submit_btn.click(chat_with_doc, inputs=[query], outputs=[response])
     upload_btn.click(save_uploaded_file, inputs=[file], outputs=[upload_status])
     debug_btn.click(debug_temp, outputs=debug_output)