Spaces:

Ed5
/

Checklist-Generator

Sleeping

App Files Files Community

Ed5 commited on Jan 26

Commit

12f8b2f

verified ·

1 Parent(s): b4a1570

Update app.py

Browse files

Files changed (1) hide show

app.py +17 -12

app.py CHANGED Viewed

@@ -11,28 +11,31 @@ from reportlab.pdfbase import pdfmetrics
 from reportlab.pdfbase.ttfonts import TTFont
 from reportlab.lib import colors
 class KDChecker:
     def __init__(self):
         self.excel_db = pd.DataFrame()
         self.cabinet_list = []
         self.known_docs = ["Э3", "В4", "ПЭ3", "ВО", "ТЭ5", "СБ", "С5", "ОЛ", "Э1", "Э4", "Э7", "Д3", "Э6"]
-    def load_excel_db(self, excel_file):
-        if excel_file is None:
             return "Файл не выбран", gr.update(choices=[], value=None)
         all_data = []
         sheets_log = []
         try:
-            xls = pd.read_excel(excel_file.name, sheet_name=None, header=None)
             for sheet_name, df_raw in xls.items():
                 header_row_index = -1
                 cab_col_idx = -1
                 rem_col_idx = -1
                 for i in range(min(20, len(df_raw))):
                     row_values = [str(x).lower().strip() for x in df_raw.iloc[i].values]
                     c_idx = -1
@@ -47,7 +50,7 @@ class KDChecker:
                         break
                 if header_row_index != -1:
-                    df = pd.read_excel(excel_file.name, sheet_name=sheet_name, header=header_row_index)
                     df_subset = df.iloc[:, [cab_col_idx, rem_col_idx]]
                     df_subset.columns = ["Cabinet", "Remark"]
@@ -78,6 +81,7 @@ class KDChecker:
     def extract_text(self, pdf_path):
         try:
             full_text = ""
             with pdfplumber.open(pdf_path) as pdf:
                 for page in pdf.pages:
                     full_text += (page.extract_text() or "") + "\n"
@@ -179,8 +183,9 @@ class KDChecker:
         # 2. Автопоиск
         else:
             all_pdf_text = ""
-            for file in files:
-                all_pdf_text += self.extract_text(file.name) + "\n"
             # А. По номеру
             pdf_numbers = self.find_all_decimal_numbers(all_pdf_text)
@@ -206,7 +211,6 @@ class KDChecker:
                     if found_by_method == "name": break
         if detected_cabinet == "Не определен":
-            examples = ", ".join(self.excel_db["Cabinet"].head(3).tolist())
             return f"⚠️ Шкаф не опознан автоматически.\nСовет: Выберите похожий шкаф из выпадающего списка вручную.", None
         is_clean_search = (found_by_method == "number")
@@ -216,8 +220,9 @@ class KDChecker:
             return f"⚠️ Шкаф '{detected_cabinet}' выбран, но в базе нет замечаний для него.", None
         processed_count = 0
-        for file in files:
-            fname = os.path.basename(file.name)
             dtype = self.determine_doc_type(fname)
             tasks = []
@@ -265,6 +270,7 @@ class KDChecker:
         y = height - 50
         c.setFont(font_name, 16)
         c.drawString(50, y, f"ЧЕК-ЛИСТ ПРОВЕРКИ КД")
         y -= 25
         c.setFont(font_name, 12)
@@ -368,5 +374,4 @@ def create_app():
 app = create_app()
 if __name__ == "__main__":
-    # авторизуемся передать логин и пароль, а так же ссылку коллегам
-     app.launch(auth=("admin", "12345"))

 from reportlab.pdfbase.ttfonts import TTFont
 from reportlab.lib import colors
 class KDChecker:
     def __init__(self):
         self.excel_db = pd.DataFrame()
         self.cabinet_list = []
+        # Список известных обозначений документов
         self.known_docs = ["Э3", "В4", "ПЭ3", "ВО", "ТЭ5", "СБ", "С5", "ОЛ", "Э1", "Э4", "Э7", "Д3", "Э6"]
+    def load_excel_db(self, excel_path):
+        # В Gradio 4.x файл приходит как строка (путь), а не объект
+        if excel_path is None:
             return "Файл не выбран", gr.update(choices=[], value=None)
         all_data = []
         sheets_log = []
         try:
+            # Читаем Excel напрямую по пути (excel_path)
+            xls = pd.read_excel(excel_path, sheet_name=None, header=None)
             for sheet_name, df_raw in xls.items():
                 header_row_index = -1
                 cab_col_idx = -1
                 rem_col_idx = -1
+                # Ищем строку заголовка
                 for i in range(min(20, len(df_raw))):
                     row_values = [str(x).lower().strip() for x in df_raw.iloc[i].values]
                     c_idx = -1
                         break
                 if header_row_index != -1:
+                    df = pd.read_excel(excel_path, sheet_name=sheet_name, header=header_row_index)
                     df_subset = df.iloc[:, [cab_col_idx, rem_col_idx]]
                     df_subset.columns = ["Cabinet", "Remark"]
     def extract_text(self, pdf_path):
         try:
             full_text = ""
+            # pdfplumber открывает файл по пути
             with pdfplumber.open(pdf_path) as pdf:
                 for page in pdf.pages:
                     full_text += (page.extract_text() or "") + "\n"
         # 2. Автопоиск
         else:
             all_pdf_text = ""
+            for file_path in files:
+                # file_path - это строка-путь
+                all_pdf_text += self.extract_text(file_path) + "\n"
             # А. По номеру
             pdf_numbers = self.find_all_decimal_numbers(all_pdf_text)
                     if found_by_method == "name": break
         if detected_cabinet == "Не определен":
             return f"⚠️ Шкаф не опознан автоматически.\nСовет: Выберите похожий шкаф из выпадающего списка вручную.", None
         is_clean_search = (found_by_method == "number")
             return f"⚠️ Шкаф '{detected_cabinet}' выбран, но в базе нет замечаний для него.", None
         processed_count = 0
+        for file_path in files:
+            # Получаем имя файла из пути
+            fname = os.path.basename(file_path)
             dtype = self.determine_doc_type(fname)
             tasks = []
         y = height - 50
         c.setFont(font_name, 16)
+        # Обработка кириллицы в заголовке
         c.drawString(50, y, f"ЧЕК-ЛИСТ ПРОВЕРКИ КД")
         y -= 25
         c.setFont(font_name, 12)
 app = create_app()
 if __name__ == "__main__":
+    app.launch(auth=("admin", "12345"))