Spaces:

Ed5
/

Checklist-Generator

Sleeping

App Files Files Community

Ed5 commited on Jan 26

Commit

41ccc3b

verified ·

1 Parent(s): 4512ed0

Update app.py

Browse files

Files changed (1) hide show

app.py +46 -39

app.py CHANGED Viewed

@@ -18,21 +18,44 @@ class KDChecker:
         self.known_docs = ["Э3", "В4", "ПЭ3", "ВО", "ТЭ5", "СБ", "С5", "ОЛ", "Э1", "Э4", "Э7", "Д3", "Э6"]
     def load_excel_db(self, excel_path):
         if excel_path is None:
-            return "Файл не выбран", gr.update(choices=[], value=None)
         all_data = []
         sheets_log = []
         try:
-            # --- ПРАВКА ДЛЯ СЕРВЕРА: явно указываем движок openpyxl ---
             xls = pd.read_excel(excel_path, sheet_name=None, header=None, engine='openpyxl')
             for sheet_name, df_raw in xls.items():
                 header_row_index = -1
                 cab_col_idx = -1
                 rem_col_idx = -1
                 for i in range(min(20, len(df_raw))):
                     row_values = [str(x).lower().strip() for x in df_raw.iloc[i].values]
                     c_idx = -1
@@ -64,17 +87,20 @@ class KDChecker:
                     sheets_log.append(f"Лист '{sheet_name}': заголовки не найдены")
             if not all_data:
-                return "❌ Ошибка: Не найдены заголовки 'Шкаф' и 'Примечание'.", gr.update(choices=[], value=None)
             self.excel_db = pd.concat(all_data, ignore_index=True)
             self.cabinet_list = sorted(self.excel_db["Cabinet"].unique().tolist())
             msg = f"✅ База знаний загружена успешно!\nВсего записей: {len(self.excel_db)}\nОбработаны листы: {', '.join(sheets_log)}"
             return msg, gr.update(choices=self.cabinet_list, value=None, interactive=True)
         except Exception as e:
-            # Выводим ошибку прямо в интерфейс
-            return f"❌ КРИТИЧЕСКАЯ ОШИБКА EXCEL: {str(e)}", gr.update(choices=[], value=None)
     def extract_text(self, pdf_path):
         try:
@@ -114,7 +140,6 @@ class KDChecker:
     def get_remarks(self, cabinet_key, is_clean_key=True):
         if self.excel_db.empty: return {}
         if is_clean_key:
             target = cabinet_key.replace(" ", "")
             mask = self.excel_db['Cabinet_Clean'].str.contains(re.escape(target), case=False, na=False)
@@ -123,43 +148,31 @@ class KDChecker:
         rows = self.excel_db[mask]
         if rows.empty: return {}
         parsed = {}
         for remark_cell in rows['Remark']:
             cell_text = str(remark_cell)
             cell_text = re.sub(r'(\d+)\.([А-ЯA-Z])', r'\1. \2', cell_text)
             items = re.split(r'(?:^|\n)\s*(?=\d+[\.\)])', cell_text)
             for item in items:
                 if len(item) < 3: continue
                 clean_item = item.strip()
                 clean_item_no_num = re.sub(r'^\d+[\.\)]\s*', '', clean_item)
                 doc_pattern = r'^(?:Документ\s+|В\s+)?([А-ЯA-Z0-9\s,\(\)\-]+?)(?:[\.\:\-]|\s+)(.*)'
                 match = re.match(doc_pattern, clean_item_no_num, re.IGNORECASE | re.DOTALL)
                 detected_docs = []
                 final_text = clean_item
                 if match:
                     potential_docs_str = match.group(1).upper()
                     cleaned_codes = potential_docs_str.replace("(", " ").replace(")", " ").replace(",", " ")
                     parts = cleaned_codes.split()
                     valid_parts = [p for p in parts if p in self.known_docs]
                     if valid_parts:
                         detected_docs = valid_parts
                         final_text = match.group(2).strip()
-                if not detected_docs:
-                    detected_docs = ["ALL"]
                 for doc in detected_docs:
                     if doc not in parsed: parsed[doc] = []
                     parsed[doc].append(final_text)
         return parsed
     def check_files(self, files, manual_cabinet):
@@ -226,11 +239,11 @@ class KDChecker:
         pdf_title = detected_cabinet
         if is_manual: pdf_title += " (Выбор вручную)"
-        # --- ВАЖНО: Проверка создания PDF ---
         try:
             pdf = self.create_pdf(pdf_title, checklist)
         except Exception as e:
-            return f"❌ Ошибка создания PDF: {e}\n(Возможно, не загружен шрифт arial.ttf?)", None
         total = sum(len(v) for v in checklist.values())
         method_str = "Ручной выбор" if is_manual else (
@@ -245,29 +258,26 @@ class KDChecker:
         form = c.acroForm
         width, height = A4
-        # --- ПОИСК ШРИФТА ДЛЯ СЕРВЕРА ---
         font_name = 'Helvetica'
-        font_path = "arial.ttf"  # Файл должен лежать в Files на Hugging Face
         if os.path.exists(font_path):
             try:
                 pdfmetrics.registerFont(TTFont('Arial', font_path))
                 font_name = 'Arial'
             except:
-                pass
-        # Если шрифт не найден, но мы на сервере - это проблема.
-        # Код попытается использовать Helvetica, но кириллица пропадет.
         y = height - 50
         c.setFont(font_name, 16)
-        # Защита от ошибок кодировки при отсутствии шрифта
         try:
             c.drawString(50, y, f"ЧЕК-ЛИСТ ПРОВЕРКИ КД")
         except:
              c.setFont("Helvetica", 16)
-             c.drawString(50, y, "CHECK-LIST (Font Error)")
              c.setFont(font_name, 16)
         y -= 25
@@ -278,7 +288,7 @@ class KDChecker:
             c.drawString(50, y, f"Шкаф: {disp_cab}")
         except:
              c.setFont("Helvetica", 12)
-             c.drawString(50, y, "Cabinet: (Name Error)")
              c.setFont(font_name, 12)
         c.drawString(400, y, f"Дата: {datetime.now().strftime('%d.%m.%Y')}")
@@ -300,10 +310,10 @@ class KDChecker:
             try:
                 c.drawString(50, y, f"Файл: {filename}")
             except:
-                 c.setFont("Helvetica", 11)
-                 c.drawString(50, y, f"File: {filename}")
-                 c.setFont(font_name, 11)
             c.setFillColor(colors.black)
             y -= 15
             c.setFont(font_name, 10)
@@ -339,13 +349,10 @@ class KDChecker:
                             c.showPage();
                             text_start_y = height - 50;
                             c.setFont(font_name, 10)
                         try:
                             c.drawString(65, text_start_y, l.strip())
                         except:
-                            # Игнорируем строки, которые нельзя напечатать без шрифта
-                            pass
                         text_start_y -= 12
                 y = text_start_y - 8

         self.known_docs = ["Э3", "В4", "ПЭ3", "ВО", "ТЭ5", "СБ", "С5", "ОЛ", "Э1", "Э4", "Э7", "Д3", "Э6"]
     def load_excel_db(self, excel_path):
+        # --- ЛОГГЕР ---
+        log = [f"[{datetime.now().strftime('%H:%M:%S')}] Старт функции загрузки"]
         if excel_path is None:
+            return "Файл не передан (excel_path is None)", gr.update(choices=[], value=None)
+        log.append(f"Путь к файлу: {excel_path}")
+        # Проверка размера файла (чтобы убедиться, что он загрузился)
+        try:
+            size = os.path.getsize(excel_path)
+            log.append(f"Размер файла: {size} байт")
+        except Exception as e:
+            log.append(f"Ошибка доступа к файлу: {e}")
+            return "\n".join(log), gr.update(choices=[], value=None)
+        # Проверка наличия движка
+        try:
+            import openpyxl
+            log.append("Библиотека openpyxl найдена.")
+        except ImportError:
+            return "ОШИБКА: Библиотека openpyxl не установлена на сервере!", gr.update(choices=[], value=None)
         all_data = []
         sheets_log = []
         try:
+            log.append("Попытка чтения Excel через pandas...")
+            # Явно указываем движок
             xls = pd.read_excel(excel_path, sheet_name=None, header=None, engine='openpyxl')
+            log.append(f"Файл прочитан. Найдены листы: {list(xls.keys())}")
             for sheet_name, df_raw in xls.items():
                 header_row_index = -1
                 cab_col_idx = -1
                 rem_col_idx = -1
+                # Поиск заголовков
                 for i in range(min(20, len(df_raw))):
                     row_values = [str(x).lower().strip() for x in df_raw.iloc[i].values]
                     c_idx = -1
                     sheets_log.append(f"Лист '{sheet_name}': заголовки не найдены")
             if not all_data:
+                log.append("Не найдены данные ни на одном листе.")
+                return "\n".join(log), gr.update(choices=[], value=None)
             self.excel_db = pd.concat(all_data, ignore_index=True)
             self.cabinet_list = sorted(self.excel_db["Cabinet"].unique().tolist())
+            log.append("Успешно объединили данные.")
             msg = f"✅ База знаний загружена успешно!\nВсего записей: {len(self.excel_db)}\nОбработаны листы: {', '.join(sheets_log)}"
             return msg, gr.update(choices=self.cabinet_list, value=None, interactive=True)
         except Exception as e:
+            # Возвращаем полный лог ошибки
+            log.append(f"КРИТИЧЕСКАЯ ОШИБКА: {str(e)}")
+            return "\n".join(log), gr.update(choices=[], value=None)
     def extract_text(self, pdf_path):
         try:
     def get_remarks(self, cabinet_key, is_clean_key=True):
         if self.excel_db.empty: return {}
         if is_clean_key:
             target = cabinet_key.replace(" ", "")
             mask = self.excel_db['Cabinet_Clean'].str.contains(re.escape(target), case=False, na=False)
         rows = self.excel_db[mask]
         if rows.empty: return {}
         parsed = {}
         for remark_cell in rows['Remark']:
             cell_text = str(remark_cell)
             cell_text = re.sub(r'(\d+)\.([А-ЯA-Z])', r'\1. \2', cell_text)
             items = re.split(r'(?:^|\n)\s*(?=\d+[\.\)])', cell_text)
             for item in items:
                 if len(item) < 3: continue
                 clean_item = item.strip()
                 clean_item_no_num = re.sub(r'^\d+[\.\)]\s*', '', clean_item)
                 doc_pattern = r'^(?:Документ\s+|В\s+)?([А-ЯA-Z0-9\s,\(\)\-]+?)(?:[\.\:\-]|\s+)(.*)'
                 match = re.match(doc_pattern, clean_item_no_num, re.IGNORECASE | re.DOTALL)
                 detected_docs = []
                 final_text = clean_item
                 if match:
                     potential_docs_str = match.group(1).upper()
                     cleaned_codes = potential_docs_str.replace("(", " ").replace(")", " ").replace(",", " ")
                     parts = cleaned_codes.split()
                     valid_parts = [p for p in parts if p in self.known_docs]
                     if valid_parts:
                         detected_docs = valid_parts
                         final_text = match.group(2).strip()
+                if not detected_docs: detected_docs = ["ALL"]
                 for doc in detected_docs:
                     if doc not in parsed: parsed[doc] = []
                     parsed[doc].append(final_text)
         return parsed
     def check_files(self, files, manual_cabinet):
         pdf_title = detected_cabinet
         if is_manual: pdf_title += " (Выбор вручную)"
+        # Создание PDF с защитой от отсутствия шрифта
         try:
             pdf = self.create_pdf(pdf_title, checklist)
         except Exception as e:
+            return f"❌ Ошибка создания PDF: {e}", None
         total = sum(len(v) for v in checklist.values())
         method_str = "Ручной выбор" if is_manual else (
         form = c.acroForm
         width, height = A4
+        # Ищем шрифт на сервере
         font_name = 'Helvetica'
+        font_path = "arial.ttf" # Ожидаем в корне
         if os.path.exists(font_path):
             try:
                 pdfmetrics.registerFont(TTFont('Arial', font_path))
                 font_name = 'Arial'
             except:
+                pass # Если шрифт битый, останется Helvetica
         y = height - 50
         c.setFont(font_name, 16)
+        # Безопасная печать заголовка
         try:
             c.drawString(50, y, f"ЧЕК-ЛИСТ ПРОВЕРКИ КД")
         except:
              c.setFont("Helvetica", 16)
+             c.drawString(50, y, "CHECK-LIST")
              c.setFont(font_name, 16)
         y -= 25
             c.drawString(50, y, f"Шкаф: {disp_cab}")
         except:
              c.setFont("Helvetica", 12)
+             c.drawString(50, y, "Cabinet name error (font)")
              c.setFont(font_name, 12)
         c.drawString(400, y, f"Дата: {datetime.now().strftime('%d.%m.%Y')}")
             try:
                 c.drawString(50, y, f"Файл: {filename}")
             except:
+                c.setFont("Helvetica", 11)
+                c.drawString(50, y, f"File: {filename}")
+                c.setFont(font_name, 11)
             c.setFillColor(colors.black)
             y -= 15
             c.setFont(font_name, 10)
                             c.showPage();
                             text_start_y = height - 50;
                             c.setFont(font_name, 10)
                         try:
                             c.drawString(65, text_start_y, l.strip())
                         except:
+                            pass # Игнорируем непечатаемые символы
                         text_start_y -= 12
                 y = text_start_y - 8