Spaces:

Ed5
/

single-line-scheme

Sleeping

App Files Files Community

Ed5 commited on Dec 30, 2025

Commit

5379578

verified ·

1 Parent(s): 3749910

Update 1_📊_Analysis.py

Browse files

Files changed (1) hide show

1_📊_Analysis.py +862 -836

1_📊_Analysis.py CHANGED Viewed

@@ -1,837 +1,863 @@
-import streamlit as st
-import pandas as pd
-import pdfplumber
-import re
-from io import BytesIO
-from typing import List, Tuple
-from pydantic import BaseModel
-from openpyxl import Workbook
-# ==================== МОДЕЛИ ====================
-class Counts(BaseModel):
-    RS485: int = 0
-    ETH: int = 0
-    TI: int = 0  # AI
-    TS: int = 0  # DI
-    TU: int = 0  # DO
-    AO: int = 0  # AO
-    def add(self, other: "Counts") -> None:
-        self.RS485 += other.RS485
-        self.ETH += other.ETH
-        self.TI += other.TI
-        self.TS += other.TS
-        self.TU += other.TU
-        self.AO += other.AO
-    def total(self) -> int:
-        return self.RS485 + self.ETH + self.TI + self.TS + self.TU + self.AO
-class PageResult(BaseModel):
-    page: int
-    is_scan: bool = False
-    has_hidden_signals: bool = False
-    has_undefined_tables: bool = False
-    mode_info: str = ""
-    counts: Counts = Counts()
-    debug_log: List[str] = []
-# ==================== УТИЛИТЫ (ОБЩИЕ) ====================
-def clean_str(s):
-    if s is None: return ""
-    return str(s).strip().replace('\n', ' ')
-def normalize_signal_type(text: str) -> str:
-    if not text: return ""
-    replacements = {
-        'а': 'a', 'А': 'a', 'о': 'o', 'О': 'o',
-        'с': 'c', 'С': 'c', 'е': 'e', 'Е': 'e',
-        'х': 'x', 'Х': 'x', '0': 'o'
-    }
-    t = str(text).lower().strip()
-    t = t.replace(" ", "").replace(".", "")
-    res = []
-    for char in t:
-        res.append(replacements.get(char, char))
-    return "".join(res)
-def is_garbage_row(row_str: str) -> bool:
-    s = row_str.lower()
-    if "изм." in s and "лист" in s: return True
-    if "подп." in s and "дата" in s: return True
-    if "инв. №" in s or "взам. инв" in s: return True
-    if len(s) < 20 and re.search(r"лист\s*\d+", s): return True
-    return False
-def is_4_20_ma(text: str) -> bool:
-    if not text: return False
-    if "4...20" in text or "4..20" in text or "0...20" in text: return True
-    if "4-20" in text or "4 - 20" in text: return True
-    pattern = r"(\d\s*м[аa])|(\bм[аa]\b)"
-    if re.search(pattern, text, re.IGNORECASE): return True
-    return False
-# === ВСПОМОГАТЕЛЬНЫЕ ФУНКЦИИ (ДЛЯ СПЕЦ. ТАБЛИЦ) ===
-def find_no_column(df: pd.DataFrame) -> int:
-    """Ищет колонку с номером (№, No, Pos) в шапке."""
-    for r in range(min(5, len(df))):
-        for c in range(len(df.columns)):
-            val = clean_str(df.iloc[r, c]).lower()
-            if "№" in val or "п/п" in val or val == "no" or "поз" in val:
-                return c
-    return 0  # По умолчанию 1-я колонка
-def is_valid_number(val: str) -> bool:
-    """Проверяет, является ли значение номером (1, 2, 23, 1.1)."""
-    v = val.replace(".", "").strip()
-    return v.isdigit() and len(v) < 6
-# ==================== БЛОК (GENERIC) ====================
-def analyze_headers_deep(df: pd.DataFrame) -> dict:
-    cols_map = {"type": -1, "cabinet": -1, "func": -1, "in": -1, "out": -1, "force_ignore": False}
-    rows_to_scan = min(15, len(df))
-    col_texts = []
-    all_header_text = ""
-    for c_idx in range(df.shape[1]):
-        txt_parts = []
-        for r_idx in range(rows_to_scan):
-            val = clean_str(df.iloc[r_idx, c_idx]).lower()
-            if "перечень" in val: continue
-            if val: txt_parts.append(val)
-        col_full = " ".join(txt_parts)
-        col_texts.append(col_full)
-        all_header_text += " " + col_full
-    strict_type_2 = "входной сигнал на" in all_header_text and "выходной сигнал с" in all_header_text
-    strict_type_1 = "тип сигнала" in all_header_text
-    if not strict_type_2 and not strict_type_1:
-        bad_keywords = ["наименование работ", "проверка", "монтаж", "содержание", "спецификация", "кол-во",
-                        "примечание"]
-        if any(bk in all_header_text for bk in bad_keywords):
-            cols_map["force_ignore"] = True
-            return cols_map, col_texts
-    for c_idx, full_text in enumerate(col_texts):
-        if strict_type_1:
-            if "тип" in full_text and "сигнал" in full_text:
-                cols_map["type"] = c_idx
-            elif "определение" in full_text and "функц" in full_text:
-                cols_map["func"] = c_idx
-            elif "место" in full_text and "устан" in full_text:
-                cols_map["cabinet"] = c_idx
-        if strict_type_2:
-            if "входной сигнал на" in full_text:
-                cols_map["in"] = c_idx
-            elif "выходной сигнал с" in full_text:
-                cols_map["out"] = c_idx
-        if not strict_type_1 and not strict_type_2:
-            if "тип" in full_text and "сигнал" in full_text:
-                cols_map["type"] = c_idx
-            elif "вход" in full_text and "сигнал" in full_text:
-                cols_map["in"] = c_idx
-            elif "вых" in full_text and "сигнал" in full_text:
-                cols_map["out"] = c_idx
-    if strict_type_2: cols_map["type"] = -1
-    if strict_type_1: cols_map["in"] = -1; cols_map["out"] = -1
-    return cols_map, col_texts
-def process_page_data_pdf(df: pd.DataFrame, cols: dict, cabinet_filter: str, debug_mode: bool) -> Tuple[
-    Counts, List[str]]:
-    c = Counts()
-    logs = []
-    if cols["in"] != -1 or cols["out"] != -1:
-        table_type = 2
-    elif cols["type"] != -1:
-        table_type = 1
-    else:
-        return c, logs
-    start_row = 0
-    for r in range(min(15, len(df))):
-        row_txt = " ".join([clean_str(x) for x in df.iloc[r]]).lower()
-        is_header = False
-        if table_type == 2:
-            if "вход" in row_txt and "выход" in row_txt: is_header = True
-        elif table_type == 1:
-            if "тип" in row_txt and "сигнал" in row_txt: is_header = True
-        if is_header: start_row = r + 1
-    BAN_WORDS = ["проверка", "монтаж", "демонтаж", "подключение", "блок питания", "шина", "клеммн", "узип",
-                 "автоматическ", "кабель", "жгут", "труба", "коробка", "модуль"]
-    for i in range(start_row, len(df)):
-        row = df.iloc[i]
-        row_full_text = " ".join([clean_str(x) for x in row]).lower()
-        if not row_full_text.replace(" ", ""): continue
-        if is_garbage_row(row_full_text): continue
-        if cabinet_filter and cabinet_filter.lower() not in row_full_text: continue
-        is_data_row = False
-        sig_raw_t1 = ""
-        if table_type == 1:
-            sig_raw_t1 = clean_str(row.iloc[cols["type"]]) if cols["type"] != -1 else ""
-            sig_norm = normalize_signal_type(sig_raw_t1)
-            if sig_norm in ["ai", "di", "do", "ao", "rtd",
-                            "tc"] or "rs" in sig_norm or "eth" in sig_norm: is_data_row = True
-            if not is_data_row and ("rs485" in row_full_text or "ethernet" in row_full_text): is_data_row = True
-        elif table_type == 2:
-            val_in = clean_str(row.iloc[cols["in"]]) if cols["in"] != -1 else ""
-            val_out = clean_str(row.iloc[cols["out"]]) if cols["out"] != -1 else ""
-            if (val_in or val_out) and "сигнал на" not in val_in:
-                if not any(w in row_full_text for w in BAN_WORDS) or any(
-                        x in row_full_text for x in ["4..20", "24", "rs", "eth"]): is_data_row = True
-        found = False
-        if table_type == 1:
-            sig_norm = normalize_signal_type(sig_raw_t1)
-            func_val = clean_str(row.iloc[cols["func"]]).lower() if cols["func"] != -1 else ""
-            full_ctx = row_full_text
-            if sig_norm in ["ai", "rtd", "tc"]:
-                c.TI += 1;
-                found = "TI (AI)"
-            elif sig_norm in ["di", "d1"]:
-                c.TS += 1;
-                found = "TS (DI)"
-            elif sig_norm in ["do", "d0", "dq"]:
-                c.TU += 1;
-                found = "TU (DO)"
-            elif sig_norm in ["ao", "aq"]:
-                c.AO += 1;
-                found = "TR (AO)"
-            elif "rs485" in full_ctx or "modbus" in full_ctx:
-                c.RS485 += 1;
-                found = "RS485"
-            elif "ethernet" in full_ctx:
-                c.ETH += 1;
-                found = "ETH"
-            elif not found and is_data_row:
-                if is_4_20_ma(func_val): c.TI += 1; found = "TI (Func 4-20)"
-        elif table_type == 2:
-            val_in = clean_str(row.iloc[cols["in"]]).lower() if cols["in"] != -1 else ""
-            val_out = clean_str(row.iloc[cols["out"]]).lower() if cols["out"] != -1 else ""
-            if val_in == "сигнал на" or val_out == "сигнал с": continue
-            row_context = val_in + " " + val_out
-            if "rs" in row_context and "485" in row_context:
-                c.RS485 += 1;
-                found = "RS485"
-            elif "eth" in row_context or "modbus" in row_context:
-                if not found: c.ETH += 1; found = "ETH"
-            if not found:
-                if val_in:
-                    if is_4_20_ma(val_in):
-                        c.TI += 1;
-                        found = "TI (AI 4-20)"
-                    elif "24" in val_in:
-                        c.TS += 1;
-                        found = "TS (DI 24V)"
-                    elif any(x in val_in for x in ["сух", "контакт", "no", "nc"]):
-                        c.TS += 1;
-                        found = "TS (DI)"
-                    elif "pt100" in val_in:
-                        c.TI += 1;
-                        found = "TI (RTD)"
-                if val_out:
-                    if is_4_20_ma(val_out):
-                        c.AO += 1;
-                        found = "AO"
-                    elif "24" in val_out:
-                        c.TU += 1;
-                        found = "TU (DO 24V)"
-                    elif any(x in val_out for x in ["реле", "ламп", "звук"]):
-                        c.TU += 1;
-                        found = "TU (DO)"
-        if debug_mode and found: logs.append(f"Стр {i} [Generic]: {found}")
-    return c, logs
-# ==================== ЛОГИКА ДЛЯ СПЕЦ. ТАБЛИЦ (КРАНЫ И Т.Д.) ====================
-def detect_spec_header(text_context: str) -> str:
-    """Расширенный поиск заголовков во всем тексте."""
-    t = text_context.lower().replace("\n", " ").replace("  ", " ")
-    if "таблица" in t:
-        if "краны" in t: return "CRANES"
-        if "телеизмерение" in t: return "TI"
-        if "телесигнализация" in t: return "TS"
-        if "телеуправление" in t: return "TU"
-        if "телерегулирование" in t: return "AO"
-    if "внешние цифровые" in t or ("интерфейс" in t and "протокол" in t and "таблица" in t):
-        return "DIGITAL"
-    return ""
-def process_spec_by_number(df: pd.DataFrame, mode: str, debug_mode: bool) -> Tuple[Counts, List[str]]:
-    """Считаем сигналы по наличию номера в колонке №."""
-    c = Counts()
-    logs = []
-    no_col = find_no_column(df)
-    start_row = 0
-    for r in range(min(5, len(df))):
-        val = clean_str(df.iloc[r, no_col])
-        if "№" in val or "п/п" in val or "no" in val.lower():
-            start_row = r + 1
-            break
-    for i in range(start_row, len(df)):
-        row_full = " ".join([clean_str(x) for x in df.iloc[i]]).lower()
-        if is_garbage_row(row_full): continue
-        if "примечание" in row_full: continue
-        val_no = clean_str(df.iloc[i, no_col])
-        if is_valid_number(val_no):
-            if mode == "CRANES":
-                c.TS += 4
-                c.TU += 2
-                if debug_mode: logs.append(f"Стр {i} [№{val_no}]: Кран -> +4 TS, +2 TU")
-            elif mode == "TI":
-                c.TI += 1
-                if debug_mode: logs.append(f"Стр {i} [№{val_no}]: TI")
-            elif mode == "TS":
-                c.TS += 1
-                if debug_mode: logs.append(f"Стр {i} [№{val_no}]: TS")
-            elif mode == "TU":
-                c.TU += 1
-                if debug_mode: logs.append(f"Стр {i} [№{val_no}]: TU")
-            elif mode == "AO":
-                c.AO += 1
-                if debug_mode: logs.append(f"Стр {i} [№{val_no}]: AO")
-    return c, logs
-def process_spec_digital(df: pd.DataFrame, debug_mode: bool) -> Tuple[Counts, List[str]]:
-    c = Counts()
-    logs = []
-    int_col = -1
-    start_row = 0
-    for r in range(min(5, len(df))):
-        row_vals = [clean_str(x).lower() for x in df.iloc[r]]
-        for idx, v in enumerate(row_vals):
-            if "интерфейс" in v:
-                int_col = idx
-                start_row = r + 1
-                break
-        if int_col != -1: break
-    if start_row == 0: start_row = 1
-    for i in range(start_row, len(df)):
-        row_txt = " ".join([clean_str(x).lower() for x in df.iloc[i]])
-        if is_garbage_row(row_txt): continue
-        if not row_txt.strip(): continue
-        val = clean_str(df.iloc[i, int_col]).lower() if int_col != -1 else row_txt
-        if "rs" in val and "485" in val:
-            c.RS485 += 1
-            if debug_mode: logs.append(f"Стр {i}: RS-485")
-        elif "eth" in val or "tcp" in val:
-            c.ETH += 1
-            if debug_mode: logs.append(f"Стр {i}: Ethernet")
-    return c, logs
-# ==================== ГЛАВНЫЙ АНАЛИЗАТОР PDF ====================
-def analyze_page_pdf(page, cabinet_filter: str, debug_mode: bool, last_mode: str) -> Tuple[PageResult, str]:
-    res = PageResult(page=page.page_number)
-    text = (page.extract_text() or "")
-    # --- ДЕТЕКЦИЯ СТРАНИЦ-КАРТИНОК ---
-    tables = page.extract_tables()
-    # Если таблиц нет, НО есть картинки -> Это скорее всего скан таблицы
-    if not tables:
-        if page.images:
-            res.is_scan = True
-            # Лог только в дебаг, чтобы не пугать раньше времени
-            if debug_mode: res.debug_log.append("Внимание: Найдена картинка, текстовы�� таблиц нет.")
-        return res, last_mode
-    current_mode_for_next_page = last_mode
-    for idx, table in enumerate(tables):
-        df = pd.DataFrame(table).fillna("")
-        if df.shape[0] < 2:
-            continue
-        spec_type = detect_spec_header(text)
-        if not spec_type and last_mode:
-            cols_check, _ = analyze_headers_deep(df)
-            is_generic = any(v != -1 for k, v in cols_check.items() if k != "force_ignore")
-            if not is_generic:
-                spec_type = last_mode
-        if spec_type:
-            # Специфическая логика
-            current_mode_for_next_page = spec_type
-            sub_c = Counts()
-            sub_logs = []
-            if spec_type in ["CRANES", "TI", "TS", "TU", "AO"]:
-                sub_c, sub_logs = process_spec_by_number(df, spec_type, debug_mode)
-            elif spec_type == "DIGITAL":
-                sub_c, sub_logs = process_spec_digital(df, debug_mode)
-            res.counts.add(sub_c)
-            res.debug_log.extend(sub_logs)
-            res.mode_info = spec_type
-            continue
-        # Старая логика (Generic)
-        cols_map, _ = analyze_headers_deep(df)
-        if cols_map.get("force_ignore"):
-            continue
-        valid_cols = any(v != -1 for k, v in cols_map.items() if k != "force_ignore")
-        if valid_cols:
-            current_mode_for_next_page = ""
-            sub_c, sub_logs = process_page_data_pdf(df, cols_map, cabinet_filter, debug_mode)
-            res.counts.add(sub_c)
-            res.debug_log.extend(sub_logs)
-            res.mode_info = "Generic"
-    return res, current_mode_for_next_page
-# ==================== EXCEL ====================
-def find_cabinets_excel(df: pd.DataFrame) -> List[str]:
-    cabinet_col_idx = -1
-    for r in range(min(20, len(df))):
-        row_vals = [clean_str(x).lower() for x in df.iloc[r]]
-        for c, val in enumerate(row_vals):
-            if "наименование" in val and "шкаф" in val: cabinet_col_idx = c; break
-        if cabinet_col_idx != -1: break
-    if cabinet_col_idx != -1:
-        raw = df.iloc[:, cabinet_col_idx].dropna().unique()
-        return sorted([clean_str(x) for x in raw if len(str(x)) > 3])
-    return []
-def analyze_excel(df: pd.DataFrame, cabinet_filter: str, debug_mode: bool) -> PageResult:
-    res = PageResult(page=1)
-    c = Counts()
-    col_cabinet = -1;
-    col_type = -1;
-    header_row = 0
-    for r in range(min(20, len(df))):
-        row_vals = [clean_str(x).lower() for x in df.iloc[r]]
-        for idx, val in enumerate(row_vals):
-            if "наименование" in val and "шкаф" in val: col_cabinet = idx
-            if ("интерфейс" in val or "тип сигнала" in val) and "плк" in val:
-                col_type = idx
-            elif ("интерфейс" in val or "тип" in val) and col_type == -1:
-                col_type = idx
-        if col_cabinet != -1 and col_type != -1: header_row = r + 1; break
-    if col_cabinet == -1 or col_type == -1: res.has_undefined_tables = True; return res
-    for i in range(header_row, len(df)):
-        row = df.iloc[i]
-        cab = clean_str(row.iloc[col_cabinet])
-        if cabinet_filter and cabinet_filter.lower() not in cab.lower(): continue
-        typ = normalize_signal_type(clean_str(row.iloc[col_type]))
-        found = ""
-        if typ in ["ai", "ti"]:
-            c.TI += 1;
-            found = "AI"
-        elif typ in ["di", "ts"]:
-            c.TS += 1;
-            found = "DI"
-        elif typ in ["do", "tu"]:
-            c.TU += 1;
-            found = "DO"
-        elif typ in ["ao"]:
-            c.AO += 1;
-            found = "AO"
-        elif "rs" in typ:
-            c.RS485 += 1;
-            found = "RS"
-        elif "eth" in typ:
-            c.ETH += 1;
-            found = "ETH"
-        if found and debug_mode and i < 100: res.debug_log.append(f"Row {i}: {found}")
-    res.counts = c
-    return res
-def find_cabinets_pdf(pdf_bytes: bytes) -> List[str]:
-    cabinets = set()
-    with pdfplumber.open(BytesIO(pdf_bytes)) as pdf:
-        for i in range(min(15, len(pdf.pages))):
-            text = pdf.pages[i].extract_text() or ""
-            matches = re.findall(r"(?:Шкаф|Щит)\s+([А-ЯA-Z0-9\-\.\(\)\s]+)", text, re.IGNORECASE)
-            for m in matches: cabinets.add(f"Шкаф {m.split()[0]}")
-    return sorted(list(cabinets))
-# ==================== ФУНКЦИИ ПОИСКА ВТОРОГО ВВОДА (ИСПРАВЛЕНО) ====================
-def check_second_input_text(text: str) -> bool:
-    """
-    Ищет Ввод 2 или Резерв, учитывая разрыв слов и специфику схем (QS).
-    """
-    t = text.lower().replace('\n', ' ')
-    # 1. Защита от ложных срабатываний (если это просто "Таблица 2" или "Ввод 2 сигналов")
-    # Если в строке есть слова "сигнал", "дискрет", "аналог" рядом с цифрой 2 - пропускаем.
-    if re.search(r"ввод\s*2\s*(?:дискрет|аналог|сигнал)", t):
-        return False
-    patterns = [
-        # Паттерн для ТАБЛИЦЫ (Скриншот 2): "Ввод 2 от резервного..."
-        # Ищет "Ввод 2", за которым (через пробел) не идет слово "сигнал"
-        r"ввод\s*(?:№)?\s*2\b(?!.*сигнал)",
-        # Паттерн для СХЕМЫ (Скриншот 1): "Ввод питания ... (рез.)"
-        # Ищет "Ввод", затем любой текст (до 40 символов), затем "(рез.)" или "резерв"
-        r"ввод\s*питания.{0,40}?\((?:рез\.|резерв)\)",
-        # Паттерн: "Ввод ... от резервного источника"
-        r"ввод.{0,20}?от\s*резервного",
-        # Паттерн для СХЕМЫ (Автоматы): Обычно 1QS - основной, 2QS - резервный
-        r"\b2\s*qs\b",
-        # Стандартные фразы
-        r"резервн[а-я]*\s*ввод",
-        r"питание\s*от\s*двух\s*вводов",
-        r"\bавр\b"
-    ]
-    for p in patterns:
-        if re.search(p, t):
-            return True
-    return False
-# ==================== УЛУЧШЕННЫЙ ПОИСК ИБП И ВРЕМЕНИ АВТОНОМИИ ====================
-def check_ups_and_time(text: str) -> Tuple[bool, str]:
-    """
-    Строгий поиск: ИБП засчитывается ТОЛЬКО если указано конкретное ВРЕМЯ (цифры).
-    Если стоит прочерк ("-"), время не находится, и галочка не ставится.
-    """
-    t = text.lower().replace('\n', ' ').replace('  ', ' ')
-    found_ups = False
-    found_time = ""
-    # 1. ПОИСК ВРЕМЕНИ (Главный критерий)
-    # Ищем: "автономн/бесперебой/резерв" ... (до 100 симв) ... ЦИФРА ... МИН/ЧАС
-    # \d+ гарантирует, что это цифра, а не прочерк "-".
-    strict_time_pat = r"(?:автономн|бесперебой|резерв|ибп|ups).{0,100}?(\d+(?:[\.,]\d+)?|од(?:ин|ного)|двух|пол)\s*(час|мин)"
-    match = re.search(strict_time_pat, t)
-    if match:
-        val = match.group(1)  # "1", "30", "одного"
-        unit = match.group(2)  # "час", "мин"
-        # Превращаем слова в цифры для красоты
-        if "одн" in val:
-            val = "1"
-        elif "дву" in val:
-            val = "2"
-        elif "пол" in val:
-            val = "0.5"
-        found_time = f"{val} {unit}."
-        found_ups = True
-        # 2. ПОИСК БАЙПАСА
-    # Если явно требуют "байпас" для ИБП, то ИБП нужен, даже если время не нашли (или оно стандартное)
-    if "байпас" in t and ("ибп" in t or "ups" in t):
-        found_ups = True
-        if not found_time:
-            found_time = "Стандарт (по байпасу)"
-    return found_ups, found_time
-def scan_ups_full_pdf(pdf_bytes: bytes) -> Tuple[bool, str]:
-    final_ups = False
-    final_time = ""
-    with pdfplumber.open(BytesIO(pdf_bytes)) as pdf:
-        for page in pdf.pages:
-            text = page.extract_text() or ""
-            is_ups, t_str = check_ups_and_time(text)
-            if is_ups:
-                final_ups = True
-                if t_str and "Стандарт" not in t_str:  # Приоритет конкретному времени
-                    final_time = t_str
-                elif t_str and not final_time:
-                    final_time = t_str
-    return final_ups, final_time
-def scan_ups_full_excel(df: pd.DataFrame) -> Tuple[bool, str]:
-    final_ups = False
-    final_time = ""
-    for r in range(min(300, len(df))):  # Смотрим первые 300 строк
-        row_txt = " ".join([clean_str(x) for x in df.iloc[r]])
-        is_ups, t_str = check_ups_and_time(row_txt)
-        if is_ups:
-            final_ups = True
-            if t_str and "Стандарт" not in t_str:
-                final_time = t_str
-                break  # Нашли точное время - выходим
-            elif t_str and not final_time:
-                final_time = t_str
-    return final_ups, final_time
-def check_input2_pdf(pdf_bytes: bytes) -> bool:
-    with pdfplumber.open(BytesIO(pdf_bytes)) as pdf:
-        # Сканируем первые 20 страниц (увеличили глубину поиска)
-        for i in range(min(20, len(pdf.pages))):
-            text = pdf.pages[i].extract_text() or ""
-            if check_second_input_text(text):
-                return True
-    return False
-def check_input2_excel(df: pd.DataFrame) -> bool:
-    # Сканируем первые 100 строк Excel (увеличили глубину поиска)
-    for r in range(min(100, len(df))):
-        row_txt = " ".join([clean_str(x) for x in df.iloc[r]]).lower()
-        if check_second_input_text(row_txt):
-            return True
-    return False
-# ==================== UI ====================
-st.set_page_config(page_title="Анализ сигналов", layout="wide")
-st.title("Подсчет сигналов ТС, ТИ, ТУ, TR")
-if "has_input2" not in st.session_state: st.session_state.has_input2 = False
-if "has_ups" not in st.session_state: st.session_state.has_ups = False
-if "ups_time_str" not in st.session_state: st.session_state.ups_time_str = ""
-if "detected_cabinets" not in st.session_state: st.session_state.detected_cabinets = []
-if "cabinet_final" not in st.session_state: st.session_state.cabinet_final = ""
-if "reserve_val" not in st.session_state: st.session_state.reserve_val = 20
-if "res_list" not in st.session_state: st.session_state.res_list = []
-if "debug_mode" not in st.session_state: st.session_state.debug_mode = True
-if "last_filename" not in st.session_state: st.session_state.last_filename = ""
-uploaded_files = st.file_uploader("Загрузите PDF или Excel (можно несколько)", type=["pdf", "xlsx"],
-                                  accept_multiple_files=True)
-if uploaded_files:
-    # Проверка: если состав файлов изменился, сбрасываем результаты
-    current_filenames = str(sorted([f.name for f in uploaded_files]))
-    if st.session_state.last_filename != current_filenames:
-        st.session_state.detected_cabinets = []
-        st.session_state.res_list = []
-        st.session_state.has_input2 = False
-        st.session_state.has_ups = False
-        st.session_state.ups_time_str = ""
-        st.session_state.last_filename = current_filenames
-    # Если список шкафов пуст, пробегаем по ВСЕМ файлам
-    if not st.session_state.detected_cabinets:
-        all_cabinets = set()
-        has_in2 = False
-        has_ups_found = False  # <--- Новая переменная
-        for file_obj in uploaded_files:
-            fname = file_obj.name.lower()
-            bytes_data = file_obj.getvalue()
-            try:
-                if fname.endswith(".xlsx"):
-                    df = pd.read_excel(BytesIO(bytes_data), header=None, engine='openpyxl')
-                    cabs = find_cabinets_excel(df)
-                    if check_input2_excel(df): has_in2 = True
-                    # --- НОВАЯ ПРОВЕРКА UPS ---
-                    is_u, t_s = scan_ups_full_excel(df)
-                    if is_u: has_ups_found = True
-                    if t_s: st.session_state.ups_time_str = t_s
-                    # --------------------------
-                    for c in cabs: all_cabinets.add(c)
-                else:
-                    cabs = find_cabinets_pdf(bytes_data)
-                    if check_input2_pdf(bytes_data): has_in2 = True
-                    # --- НОВАЯ ПРОВЕРКА UPS ---
-                    is_u, t_s = scan_ups_full_pdf(bytes_data)
-                    if is_u: has_ups_found = True
-                    if t_s: st.session_state.ups_time_str = t_s
-                    # --------------------------
-                    for c in cabs: all_cabinets.add(c)
-            except Exception as e:
-                pass
-        st.session_state.detected_cabinets = sorted(list(all_cabinets))
-        st.session_state.has_input2 = has_in2
-        st.session_state.has_ups = has_ups_found  # <--- Сохраняем результат
-    c_list = st.session_state.detected_cabinets
-    with st.container():
-        c1, c2 = st.columns(2)
-        with c1:
-            if c_list:
-                sel = st.selectbox("Шкаф:", ["(Все)"] + c_list)
-                st.session_state.cabinet_final = sel if sel != "(Все)" else ""
-            st.text_input("Фильтр:", value=st.session_state.cabinet_final, key="manual_filter_input")
-            if st.session_state.manual_filter_input: st.session_state.cabinet_final = st.session_state.manual_filter_input
-        with c2:
-            st.session_state.reserve_val = st.number_input("Резерв %:", value=st.session_state.reserve_val)
-            st.session_state.debug_mode = st.checkbox("Debug", value=st.session_state.debug_mode)
-            st.write("---")
-            # Чекбокс Ввод 2
-            st.session_state.has_input2 = st.checkbox("Есть Ввод 2 (Резерв)", value=st.session_state.has_input2)
-            # Чекбокс ИБП
-            st.session_state.has_ups = st.checkbox(
-                "Требуется ИБП (UPS)",
-                value=st.session_state.has_ups,
-                help="Включается автоматически, если в ТЗ найдено время автономной работы или требование байпаса."
-            )
-            # Поле времени (появляется только если нужен ИБП)
-            if st.session_state.has_ups:
-                # Если время нашли автоматически, оно подставится. Если нет - можно ввести вручную.
-                val_time = st.session_state.ups_time_str if st.session_state.ups_time_str else "10 мин."
-                st.session_state.ups_time_str = st.text_input("Время работы:", value=val_time)
-    if st.button("Старт", type="primary") and uploaded_files:
-        st.session_state.res_list = []
-        # Создаем общий прогресс-бар
-        total_files = len(uploaded_files)
-        main_bar = st.progress(0)
-        for file_idx, file_obj in enumerate(uploaded_files):
-            fname = file_obj.name.lower()
-            bytes_data = file_obj.getvalue()
-            # Логика обработки конкретного файла
-            if fname.endswith(".xlsx"):
-                try:
-                    df = pd.read_excel(BytesIO(bytes_data), header=None, engine='openpyxl')
-                    r = analyze_excel(df, st.session_state.cabinet_final, st.session_state.debug_mode)
-                    # Добавляем имя файла в лог для ясности
-                    r.debug_log.insert(0, f"=== ФАЙЛ: {file_obj.name} ===")
-                    st.session_state.res_list.append(r)
-                except Exception as e:
-                    st.error(f"Ошибка при чтении {file_obj.name}: {e}")
-            else:
-                try:
-                    with pdfplumber.open(BytesIO(bytes_data)) as pdf:
-                        last_mode = ""
-                        for i, p in enumerate(pdf.pages):
-                            r, last_mode = analyze_page_pdf(p, st.session_state.cabinet_final,
-                                                            st.session_state.debug_mode, last_mode)
-                            # Если это первая страница PDF, добавим метку файла
-                            if i == 0: r.debug_log.insert(0, f"=== ФАЙЛ: {file_obj.name} ===")
-                            st.session_state.res_list.append(r)
-                except Exception as e:
-                    st.error(f"Ошибка при чтении PDF {file_obj.name}: {e}")
-            # Обновляем прогресс
-            main_bar.progress((file_idx + 1) / total_files)
-if st.session_state.res_list:
-    st.divider()
-    total_c = Counts()
-    scanned_pages = []
-    for r in st.session_state.res_list:
-        total_c.add(r.counts)
-        if r.is_scan: scanned_pages.append(str(r.page))
-    st.subheader("Результаты")
-    # --- УМНЫЙ БЛОК ПРЕДУПРЕЖДЕНИЙ ---
-    # Показываем красный алерт ТОЛЬКО если сигналов МАЛО (< 15) и есть картинки.
-    # Если сигналов много (100+), мы считаем, что картинки - это штампы, и не пугаем пользователя.
-    total_signals_count = total_c.total()
-    if total_signals_count < 15 and scanned_pages:
-        st.error(
-            f"⚠️ ВНИМАНИЕ: Найдено всего {total_signals_count} сигналов. При этом обнаружены страницы-картинки (текст не распознан): {', '.join(scanned_pages)}. Вероятно, таблица сигналов находится там.")
-    elif total_signals_count < 15:
-        st.warning(
-            f"⚠️ Найдено всего {total_signals_count} сигналов. Проверьте документ, возможно формат таблиц не поддерживается.")
-    # ----------------------------------
-    if total_signals_count > 0:
-        c1, c2, c3, c4, c5, c6 = st.columns(6)
-        c1.metric("RS-485", total_c.RS485)
-        c2.metric("ETH", total_c.ETH)
-        c3.metric("AI (TI)", total_c.TI)
-        c4.metric("DI (TS)", total_c.TS)
-        c5.metric("DO (TU)", total_c.TU)
-        c6.metric("TR (AO)", total_c.AO)
-    else:
-        st.warning("Сигналы не найдены.")
-    if st.session_state.debug_mode:
-        with st.expander("LOGS"):
-            for r in st.session_state.res_list:
-                if r.debug_log:
-                    st.write(f"**Page {r.page}** [{r.mode_info}]")
-                    for l in r.debug_log:
-                        c = "green" if "->" in l else "blue" if "ПРОДОЛЖЕНИЕ" in l else "red" if "Внимание" in l else "black"
-                        st.markdown(f":{c}[{l}]")
-                    st.divider()
-    edit_data = pd.DataFrame({
-        "Тип": ["RS-485", "ETH", "AI (TI)", "DI (TS)", "DO (TU)", "TR (AO)"],
-        "Авто": [total_c.RS485, total_c.ETH, total_c.TI, total_c.TS, total_c.TU, total_c.AO],
-        "Коррекция": [0, 0, 0, 0, 0, 0]
-    })
-    edited = st.data_editor(edit_data, use_container_width=True, hide_index=True)
-    # === НОВЫЙ БЛОК: СОХРАНЕНИЕ РУЧНЫХ ПРАВОК В ПАМЯТЬ ===
-    saved_signals = {}
-    for idx, row in edited.iterrows():
-        # Складываем Авто + Коррекция
-        total_val = row["Авто"] + row["Коррекция"]
-        saved_signals[row["Тип"]] = total_val
-    # Сохраняем словарь в сессию, чтобы видеть его на других страницах-
-    st.session_state['manual_signals_counts'] = saved_signals
-    final_rows = []
-    for idx, row in edited.iterrows():
-        final_rows.append([row["Тип"], row["Авто"], row["Коррекция"], row["Авто"] + row["Коррекция"]])
-    df_ex = pd.DataFrame(final_rows, columns=["Тип", "Авто", "Коррекция", "Итого"])
-    bio = BytesIO()
-    with pd.ExcelWriter(bio, engine='openpyxl') as writer:
-        df_ex.to_excel(writer, index=False, sheet_name="Signals")
-        ws = writer.sheets['Signals']
-        ws["A8"] = f"Резерв {st.session_state.reserve_val}%"
-    bio.seek(0)
     st.download_button("Скачать отчет", bio, "signals.xlsx")

+import streamlit as st
+import pandas as pd
+import pdfplumber
+import re
+from io import BytesIO
+from typing import List, Tuple
+from pydantic import BaseModel
+from openpyxl import Workbook
+# ==================== МОДЕЛИ ====================
+class Counts(BaseModel):
+    RS485: int = 0
+    ETH: int = 0
+    TI: int = 0  # AI
+    TS: int = 0  # DI
+    TU: int = 0  # DO
+    AO: int = 0  # AO
+    def add(self, other: "Counts") -> None:
+        self.RS485 += other.RS485
+        self.ETH += other.ETH
+        self.TI += other.TI
+        self.TS += other.TS
+        self.TU += other.TU
+        self.AO += other.AO
+    def total(self) -> int:
+        return self.RS485 + self.ETH + self.TI + self.TS + self.TU + self.AO
+class PageResult(BaseModel):
+    page: int
+    is_scan: bool = False
+    has_hidden_signals: bool = False
+    has_undefined_tables: bool = False
+    mode_info: str = ""
+    counts: Counts = Counts()
+    debug_log: List[str] = []
+# ==================== УТИЛИТЫ (ОБЩИЕ) ====================
+def clean_str(s):
+    if s is None: return ""
+    return str(s).strip().replace('\n', ' ')
+def normalize_signal_type(text: str) -> str:
+    if not text: return ""
+    replacements = {
+        'а': 'a', 'А': 'a', 'о': 'o', 'О': 'o',
+        'с': 'c', 'С': 'c', 'е': 'e', 'Е': 'e',
+        'х': 'x', 'Х': 'x', '0': 'o'
+    }
+    t = str(text).lower().strip()
+    t = t.replace(" ", "").replace(".", "")
+    res = []
+    for char in t:
+        res.append(replacements.get(char, char))
+    return "".join(res)
+def is_garbage_row(row_str: str) -> bool:
+    s = row_str.lower()
+    if "изм." in s and "лист" in s: return True
+    if "подп." in s and "дата" in s: return True
+    if "инв. №" in s or "взам. инв" in s: return True
+    if len(s) < 20 and re.search(r"лист\s*\d+", s): return True
+    return False
+def is_4_20_ma(text: str) -> bool:
+    if not text: return False
+    if "4...20" in text or "4..20" in text or "0...20" in text: return True
+    if "4-20" in text or "4 - 20" in text: return True
+    pattern = r"(\d\s*м[аa])|(\bм[аa]\b)"
+    if re.search(pattern, text, re.IGNORECASE): return True
+    return False
+# === ВСПОМОГАТЕЛЬНЫЕ ФУНКЦИИ (ДЛЯ СПЕЦ. ТАБЛИЦ) ===
+def find_no_column(df: pd.DataFrame) -> int:
+    """Ищет колонку с номером (№, No, Pos) в шапке."""
+    for r in range(min(5, len(df))):
+        for c in range(len(df.columns)):
+            val = clean_str(df.iloc[r, c]).lower()
+            if "№" in val or "п/п" in val or val == "no" or "поз" in val:
+                return c
+    return 0  # По умолчанию 1-я колонка
+def is_valid_number(val: str) -> bool:
+    """Проверяет, является ли значение номером (1, 2, 23, 1.1)."""
+    v = val.replace(".", "").strip()
+    return v.isdigit() and len(v) < 6
+# ==================== БЛОК (GENERIC) ====================
+def analyze_headers_deep(df: pd.DataFrame) -> dict:
+    cols_map = {"type": -1, "cabinet": -1, "func": -1, "in": -1, "out": -1, "force_ignore": False}
+    rows_to_scan = min(15, len(df))
+    col_texts = []
+    all_header_text = ""
+    for c_idx in range(df.shape[1]):
+        txt_parts = []
+        for r_idx in range(rows_to_scan):
+            val = clean_str(df.iloc[r_idx, c_idx]).lower()
+            if "перечень" in val: continue
+            if val: txt_parts.append(val)
+        col_full = " ".join(txt_parts)
+        col_texts.append(col_full)
+        all_header_text += " " + col_full
+    strict_type_2 = "входной сигнал на" in all_header_text and "выходной сигнал с" in all_header_text
+    strict_type_1 = "тип сигнала" in all_header_text
+    if not strict_type_2 and not strict_type_1:
+        bad_keywords = ["наименование работ", "проверка", "монтаж", "содержание", "спецификация", "кол-во",
+                        "примечание"]
+        if any(bk in all_header_text for bk in bad_keywords):
+            cols_map["force_ignore"] = True
+            return cols_map, col_texts
+    for c_idx, full_text in enumerate(col_texts):
+        if strict_type_1:
+            if "тип" in full_text and "сигнал" in full_text:
+                cols_map["type"] = c_idx
+            elif "определение" in full_text and "функц" in full_text:
+                cols_map["func"] = c_idx
+            elif "место" in full_text and "устан" in full_text:
+                cols_map["cabinet"] = c_idx
+        if strict_type_2:
+            if "входной сигнал на" in full_text:
+                cols_map["in"] = c_idx
+            elif "выходной сигнал с" in full_text:
+                cols_map["out"] = c_idx
+        if not strict_type_1 and not strict_type_2:
+            if "тип" in full_text and "сигнал" in full_text:
+                cols_map["type"] = c_idx
+            elif "вход" in full_text and "сигнал" in full_text:
+                cols_map["in"] = c_idx
+            elif "вых" in full_text and "сигнал" in full_text:
+                cols_map["out"] = c_idx
+    if strict_type_2: cols_map["type"] = -1
+    if strict_type_1: cols_map["in"] = -1; cols_map["out"] = -1
+    return cols_map, col_texts
+def process_page_data_pdf(df: pd.DataFrame, cols: dict, cabinet_filter: str, debug_mode: bool) -> Tuple[
+    Counts, List[str]]:
+    c = Counts()
+    logs = []
+    if cols["in"] != -1 or cols["out"] != -1:
+        table_type = 2
+    elif cols["type"] != -1:
+        table_type = 1
+    else:
+        return c, logs
+    start_row = 0
+    for r in range(min(15, len(df))):
+        row_txt = " ".join([clean_str(x) for x in df.iloc[r]]).lower()
+        is_header = False
+        if table_type == 2:
+            if "вход" in row_txt and "выход" in row_txt: is_header = True
+        elif table_type == 1:
+            if "тип" in row_txt and "сигнал" in row_txt: is_header = True
+        if is_header: start_row = r + 1
+    BAN_WORDS = ["проверка", "монтаж", "демонтаж", "подключение", "блок питания", "шина", "клеммн", "узип",
+                 "автоматическ", "кабель", "жгут", "труба", "коробка", "модуль"]
+    for i in range(start_row, len(df)):
+        row = df.iloc[i]
+        row_full_text = " ".join([clean_str(x) for x in row]).lower()
+        if not row_full_text.replace(" ", ""): continue
+        if is_garbage_row(row_full_text): continue
+        if cabinet_filter and cabinet_filter.lower() not in row_full_text: continue
+        is_data_row = False
+        sig_raw_t1 = ""
+        if table_type == 1:
+            sig_raw_t1 = clean_str(row.iloc[cols["type"]]) if cols["type"] != -1 else ""
+            sig_norm = normalize_signal_type(sig_raw_t1)
+            if sig_norm in ["ai", "di", "do", "ao", "rtd",
+                            "tc"] or "rs" in sig_norm or "eth" in sig_norm: is_data_row = True
+            if not is_data_row and ("rs485" in row_full_text or "ethernet" in row_full_text): is_data_row = True
+        elif table_type == 2:
+            val_in = clean_str(row.iloc[cols["in"]]) if cols["in"] != -1 else ""
+            val_out = clean_str(row.iloc[cols["out"]]) if cols["out"] != -1 else ""
+            if (val_in or val_out) and "сигнал на" not in val_in:
+                if not any(w in row_full_text for w in BAN_WORDS) or any(
+                        x in row_full_text for x in ["4..20", "24", "rs", "eth"]): is_data_row = True
+        found = False
+        if table_type == 1:
+            sig_norm = normalize_signal_type(sig_raw_t1)
+            func_val = clean_str(row.iloc[cols["func"]]).lower() if cols["func"] != -1 else ""
+            full_ctx = row_full_text
+            if sig_norm in ["ai", "rtd", "tc"]:
+                c.TI += 1;
+                found = "TI (AI)"
+            elif sig_norm in ["di", "d1"]:
+                c.TS += 1;
+                found = "TS (DI)"
+            elif sig_norm in ["do", "d0", "dq"]:
+                c.TU += 1;
+                found = "TU (DO)"
+            elif sig_norm in ["ao", "aq"]:
+                c.AO += 1;
+                found = "TR (AO)"
+            elif "rs485" in full_ctx or "modbus" in full_ctx:
+                c.RS485 += 1;
+                found = "RS485"
+            elif "ethernet" in full_ctx:
+                c.ETH += 1;
+                found = "ETH"
+            elif not found and is_data_row:
+                if is_4_20_ma(func_val): c.TI += 1; found = "TI (Func 4-20)"
+        elif table_type == 2:
+            val_in = clean_str(row.iloc[cols["in"]]).lower() if cols["in"] != -1 else ""
+            val_out = clean_str(row.iloc[cols["out"]]).lower() if cols["out"] != -1 else ""
+            if val_in == "сигнал на" or val_out == "сигнал с": continue
+            row_context = val_in + " " + val_out
+            if "rs" in row_context and "485" in row_context:
+                c.RS485 += 1;
+                found = "RS485"
+            elif "eth" in row_context or "modbus" in row_context:
+                if not found: c.ETH += 1; found = "ETH"
+            if not found:
+                if val_in:
+                    if is_4_20_ma(val_in):
+                        c.TI += 1;
+                        found = "TI (AI 4-20)"
+                    elif "24" in val_in:
+                        c.TS += 1;
+                        found = "TS (DI 24V)"
+                    elif any(x in val_in for x in ["сух", "контакт", "no", "nc"]):
+                        c.TS += 1;
+                        found = "TS (DI)"
+                    elif "pt100" in val_in:
+                        c.TI += 1;
+                        found = "TI (RTD)"
+                if val_out:
+                    if is_4_20_ma(val_out):
+                        c.AO += 1;
+                        found = "AO"
+                    elif "24" in val_out:
+                        c.TU += 1;
+                        found = "TU (DO 24V)"
+                    elif any(x in val_out for x in ["реле", "ламп", "звук"]):
+                        c.TU += 1;
+                        found = "TU (DO)"
+        if debug_mode and found: logs.append(f"Стр {i} [Generic]: {found}")
+    return c, logs
+# ==================== ЛОГИКА ДЛЯ СПЕЦ. ТАБЛИЦ (КРАНЫ И Т.Д.) ====================
+def detect_spec_header(text_context: str) -> str:
+    """Расширенный поиск заголовков во всем тексте."""
+    t = text_context.lower().replace("\n", " ").replace("  ", " ")
+    if "таблица" in t:
+        if "краны" in t: return "CRANES"
+        if "телеизмерение" in t: return "TI"
+        if "телесигнализация" in t: return "TS"
+        if "телеуправление" in t: return "TU"
+        if "телерегулирование" in t: return "AO"
+    if "внешние цифровые" in t or ("интерфейс" in t and "протокол" in t and "таблица" in t):
+        return "DIGITAL"
+    return ""
+def process_spec_by_number(df: pd.DataFrame, mode: str, debug_mode: bool) -> Tuple[Counts, List[str]]:
+    """Считаем сигналы по наличию номера в колонке №."""
+    c = Counts()
+    logs = []
+    no_col = find_no_column(df)
+    start_row = 0
+    for r in range(min(5, len(df))):
+        val = clean_str(df.iloc[r, no_col])
+        if "№" in val or "п/п" in val or "no" in val.lower():
+            start_row = r + 1
+            break
+    for i in range(start_row, len(df)):
+        row_full = " ".join([clean_str(x) for x in df.iloc[i]]).lower()
+        if is_garbage_row(row_full): continue
+        if "примечание" in row_full: continue
+        val_no = clean_str(df.iloc[i, no_col])
+        if is_valid_number(val_no):
+            if mode == "CRANES":
+                c.TS += 4
+                c.TU += 2
+                if debug_mode: logs.append(f"Стр {i} [№{val_no}]: Кран -> +4 TS, +2 TU")
+            elif mode == "TI":
+                c.TI += 1
+                if debug_mode: logs.append(f"Стр {i} [№{val_no}]: TI")
+            elif mode == "TS":
+                c.TS += 1
+                if debug_mode: logs.append(f"Стр {i} [№{val_no}]: TS")
+            elif mode == "TU":
+                c.TU += 1
+                if debug_mode: logs.append(f"Стр {i} [№{val_no}]: TU")
+            elif mode == "AO":
+                c.AO += 1
+                if debug_mode: logs.append(f"Стр {i} [№{val_no}]: AO")
+    return c, logs
+def process_spec_digital(df: pd.DataFrame, debug_mode: bool) -> Tuple[Counts, List[str]]:
+    c = Counts()
+    logs = []
+    int_col = -1
+    start_row = 0
+    for r in range(min(5, len(df))):
+        row_vals = [clean_str(x).lower() for x in df.iloc[r]]
+        for idx, v in enumerate(row_vals):
+            if "интерфейс" in v:
+                int_col = idx
+                start_row = r + 1
+                break
+        if int_col != -1: break
+    if start_row == 0: start_row = 1
+    for i in range(start_row, len(df)):
+        row_txt = " ".join([clean_str(x).lower() for x in df.iloc[i]])
+        if is_garbage_row(row_txt): continue
+        if not row_txt.strip(): continue
+        val = clean_str(df.iloc[i, int_col]).lower() if int_col != -1 else row_txt
+        if "rs" in val and "485" in val:
+            c.RS485 += 1
+            if debug_mode: logs.append(f"Стр {i}: RS-485")
+        elif "eth" in val or "tcp" in val:
+            c.ETH += 1
+            if debug_mode: logs.append(f"Стр {i}: Ethernet")
+    return c, logs
+# ==================== ГЛАВНЫЙ АНАЛИЗАТОР PDF ====================
+def analyze_page_pdf(page, cabinet_filter: str, debug_mode: bool, last_mode: str) -> Tuple[PageResult, str]:
+    res = PageResult(page=page.page_number)
+    text = (page.extract_text() or "")
+    # --- ДЕТЕКЦИЯ СТРАНИЦ-КАРТИНОК ---
+    tables = page.extract_tables()
+    # Если таблиц нет, НО есть картинки -> Это скорее всего скан таблицы
+    if not tables:
+        if page.images:
+            res.is_scan = True
+            # Лог только в дебаг, чтобы не пугать раньше времени
+            if debug_mode: res.debug_log.append("Внимание: Найдена картинка, текстовых таблиц нет.")
+        return res, last_mode
+    current_mode_for_next_page = last_mode
+    for idx, table in enumerate(tables):
+        df = pd.DataFrame(table).fillna("")
+        if df.shape[0] < 2:
+            continue
+        spec_type = detect_spec_header(text)
+        if not spec_type and last_mode:
+            cols_check, _ = analyze_headers_deep(df)
+            is_generic = any(v != -1 for k, v in cols_check.items() if k != "force_ignore")
+            if not is_generic:
+                spec_type = last_mode
+        if spec_type:
+            # Специфическая логика
+            current_mode_for_next_page = spec_type
+            sub_c = Counts()
+            sub_logs = []
+            if spec_type in ["CRANES", "TI", "TS", "TU", "AO"]:
+                sub_c, sub_logs = process_spec_by_number(df, spec_type, debug_mode)
+            elif spec_type == "DIGITAL":
+                sub_c, sub_logs = process_spec_digital(df, debug_mode)
+            res.counts.add(sub_c)
+            res.debug_log.extend(sub_logs)
+            res.mode_info = spec_type
+            continue
+        # Старая логика (Generic)
+        cols_map, _ = analyze_headers_deep(df)
+        if cols_map.get("force_ignore"):
+            continue
+        valid_cols = any(v != -1 for k, v in cols_map.items() if k != "force_ignore")
+        if valid_cols:
+            current_mode_for_next_page = ""
+            sub_c, sub_logs = process_page_data_pdf(df, cols_map, cabinet_filter, debug_mode)
+            res.counts.add(sub_c)
+            res.debug_log.extend(sub_logs)
+            res.mode_info = "Generic"
+    return res, current_mode_for_next_page
+# ==================== EXCEL ====================
+def find_cabinets_excel(df: pd.DataFrame) -> List[str]:
+    cabinet_col_idx = -1
+    for r in range(min(20, len(df))):
+        row_vals = [clean_str(x).lower() for x in df.iloc[r]]
+        for c, val in enumerate(row_vals):
+            if "наименование" in val and "шкаф" in val: cabinet_col_idx = c; break
+        if cabinet_col_idx != -1: break
+    if cabinet_col_idx != -1:
+        raw = df.iloc[:, cabinet_col_idx].dropna().unique()
+        return sorted([clean_str(x) for x in raw if len(str(x)) > 3])
+    return []
+def analyze_excel(df: pd.DataFrame, cabinet_filter: str, debug_mode: bool) -> PageResult:
+    res = PageResult(page=1)
+    c = Counts()
+    col_cabinet = -1;
+    col_type = -1;
+    header_row = 0
+    for r in range(min(20, len(df))):
+        row_vals = [clean_str(x).lower() for x in df.iloc[r]]
+        for idx, val in enumerate(row_vals):
+            if "наименование" in val and "шкаф" in val: col_cabinet = idx
+            if ("интерфейс" in val or "тип сигнала" in val) and "плк" in val:
+                col_type = idx
+            elif ("интерфейс" in val or "тип" in val) and col_type == -1:
+                col_type = idx
+        if col_cabinet != -1 and col_type != -1: header_row = r + 1; break
+    if col_cabinet == -1 or col_type == -1: res.has_undefined_tables = True; return res
+    for i in range(header_row, len(df)):
+        row = df.iloc[i]
+        cab = clean_str(row.iloc[col_cabinet])
+        if cabinet_filter and cabinet_filter.lower() not in cab.lower(): continue
+        typ = normalize_signal_type(clean_str(row.iloc[col_type]))
+        found = ""
+        if typ in ["ai", "ti"]:
+            c.TI += 1;
+            found = "AI"
+        elif typ in ["di", "ts"]:
+            c.TS += 1;
+            found = "DI"
+        elif typ in ["do", "tu"]:
+            c.TU += 1;
+            found = "DO"
+        elif typ in ["ao"]:
+            c.AO += 1;
+            found = "AO"
+        elif "rs" in typ:
+            c.RS485 += 1;
+            found = "RS"
+        elif "eth" in typ:
+            c.ETH += 1;
+            found = "ETH"
+        if found and debug_mode and i < 100: res.debug_log.append(f"Row {i}: {found}")
+    res.counts = c
+    return res
+def find_cabinets_pdf(pdf_bytes: bytes) -> List[str]:
+    cabinets = set()
+    with pdfplumber.open(BytesIO(pdf_bytes)) as pdf:
+        for i in range(min(15, len(pdf.pages))):
+            text = pdf.pages[i].extract_text() or ""
+            matches = re.findall(r"(?:Шкаф|Щит)\s+([А-ЯA-Z0-9\-\.\(\)\s]+)", text, re.IGNORECASE)
+            for m in matches: cabinets.add(f"Шкаф {m.split()[0]}")
+    return sorted(list(cabinets))
+# ==================== ФУНКЦИИ ПОИСКА ВТОРОГО ВВОДА (ИСПРАВЛЕНО) ====================
+def check_second_input_text(text: str) -> bool:
+    """
+    Ищет Ввод 2 или Резерв, учитывая разрыв слов и специфику схем (QS).
+    """
+    t = text.lower().replace('\n', ' ')
+    # 1. Защита от ложных срабатываний (если это просто "Таблица 2" или "Ввод 2 сигналов")
+    # Если в строке есть слова "сигнал", "дискрет", "аналог" рядом с цифрой 2 - пропускаем.
+    if re.search(r"ввод\s*2\s*(?:дискрет|аналог|сигнал)", t):
+        return False
+    patterns = [
+        # Паттерн для ТАБЛИЦЫ (Скриншот 2): "Ввод 2 от резервного..."
+        # Ищет "Ввод 2", за которым (через пробел) не идет слово "сигнал"
+        r"ввод\s*(?:№)?\s*2\b(?!.*сигнал)",
+        # Паттерн для СХЕМЫ (Скриншот 1): "Ввод питания ... (рез.)"
+        # Ищет "Ввод", затем любой текст (до 40 символов), затем "(рез.)" или "резерв"
+        r"ввод\s*питания.{0,40}?\((?:рез\.|резерв)\)",
+        # Паттерн: "Ввод ... от резервного источника"
+        r"ввод.{0,20}?от\s*резервного",
+        # Паттерн для СХЕМЫ (Автоматы): Обычно 1QS - основной, 2QS - резервный
+        r"\b2\s*qs\b",
+        # Стандартные фразы
+        r"резервн[а-я]*\s*ввод",
+        r"питание\s*от\s*двух\s*вводов",
+        r"\bавр\b"
+    ]
+    for p in patterns:
+        if re.search(p, t):
+            return True
+    return False
+# ==================== УЛУЧШЕННЫЙ ПОИСК ИБП И ВРЕМЕНИ АВТОНОМИИ ====================
+def check_ups_and_time(text: str) -> Tuple[bool, str]:
+    """
+    Строгий поиск: ИБП засчитывается ТОЛЬКО если указано конкретное ВРЕМЯ (цифры).
+    Если стоит прочерк ("-"), время не находится, и галочка не ставится.
+    """
+    t = text.lower().replace('\n', ' ').replace('  ', ' ')
+    found_ups = False
+    found_time = ""
+    # 1. ПОИСК ВРЕМЕНИ (Главный критерий)
+    # Ищем: "автономн/бесперебой/резерв" ... (до 100 симв) ... ЦИФРА ... МИН/ЧАС
+    # \d+ гарантирует, что это цифра, а не прочерк "-".
+    strict_time_pat = r"(?:автономн|бесперебой|резерв|ибп|ups).{0,100}?(\d+(?:[\.,]\d+)?|од(?:ин|ного)|двух|пол)\s*(час|мин)"
+    match = re.search(strict_time_pat, t)
+    if match:
+        val = match.group(1)  # "1", "30", "одного"
+        unit = match.group(2)  # "час", "мин"
+        # Превращаем слова в цифры для красоты
+        if "одн" in val:
+            val = "1"
+        elif "дву" in val:
+            val = "2"
+        elif "пол" in val:
+            val = "0.5"
+        found_time = f"{val} {unit}."
+        found_ups = True
+        # 2. ПОИСК БАЙПАСА
+    # Если явно требуют "байпас" для ИБП, то ИБП нужен, даже если время не нашли (или оно стандартное)
+    if "байпас" in t and ("ибп" in t or "ups" in t):
+        found_ups = True
+        if not found_time:
+            found_time = "Стандарт (по байпасу)"
+    return found_ups, found_time
+def scan_ups_full_pdf(pdf_bytes: bytes) -> Tuple[bool, str]:
+    final_ups = False
+    final_time = ""
+    with pdfplumber.open(BytesIO(pdf_bytes)) as pdf:
+        for page in pdf.pages:
+            text = page.extract_text() or ""
+            is_ups, t_str = check_ups_and_time(text)
+            if is_ups:
+                final_ups = True
+                if t_str and "Станд��рт" not in t_str:  # Приоритет конкретному времени
+                    final_time = t_str
+                elif t_str and not final_time:
+                    final_time = t_str
+    return final_ups, final_time
+def scan_ups_full_excel(df: pd.DataFrame) -> Tuple[bool, str]:
+    final_ups = False
+    final_time = ""
+    for r in range(min(300, len(df))):  # Смотрим первые 300 строк
+        row_txt = " ".join([clean_str(x) for x in df.iloc[r]])
+        is_ups, t_str = check_ups_and_time(row_txt)
+        if is_ups:
+            final_ups = True
+            if t_str and "Стандарт" not in t_str:
+                final_time = t_str
+                break  # Нашли точное время - выходим
+            elif t_str and not final_time:
+                final_time = t_str
+    return final_ups, final_time
+def check_input2_pdf(pdf_bytes: bytes) -> bool:
+    with pdfplumber.open(BytesIO(pdf_bytes)) as pdf:
+        # Сканируем первые 20 страниц (увеличили глубину поиска)
+        for i in range(min(20, len(pdf.pages))):
+            text = pdf.pages[i].extract_text() or ""
+            if check_second_input_text(text):
+                return True
+    return False
+def check_input2_excel(df: pd.DataFrame) -> bool:
+    # Сканируем первые 100 строк Excel (увеличили глубину поиска)
+    for r in range(min(100, len(df))):
+        row_txt = " ".join([clean_str(x) for x in df.iloc[r]]).lower()
+        if check_second_input_text(row_txt):
+            return True
+    return False
+# ==================== КЕШИРОВАНИЕ (НОВОЕ) ====================
+@st.cache_data(show_spinner=False)
+def process_file_cached(filename: str, file_bytes: bytes, cabinet_filter: str, debug_mode: bool) -> List[PageResult]:
+    """
+    Эта функция выполняет тяжелую работу и ЗАПОМИНАЕТ результат.
+    Если подать те же байты файла, она вернет ответ мгновенно.
+    """
+    results = []
+    if filename.endswith(".xlsx"):
+        try:
+            df = pd.read_excel(BytesIO(file_bytes), header=None, engine='openpyxl')
+            r = analyze_excel(df, cabinet_filter, debug_mode)
+            r.debug_log.insert(0, f"=== ФАЙЛ: {filename} ===")
+            results.append(r)
+        except Exception as e:
+            # В кешированной функции нельзя использовать st.error, поэтому вернем пустой результат или обработаем позже
+            pass
+    else:
+        try:
+            with pdfplumber.open(BytesIO(file_bytes)) as pdf:
+                last_mode = ""
+                for i, p in enumerate(pdf.pages):
+                    r, last_mode = analyze_page_pdf(p, cabinet_filter, debug_mode, last_mode)
+                    if i == 0: r.debug_log.insert(0, f"=== ФАЙЛ: {filename} ===")
+                    results.append(r)
+        except Exception as e:
+            pass
+    return results
+# ==================== UI ====================
+st.set_page_config(page_title="Анализ сигналов", layout="wide")
+st.title("Подсчет сигналов ТС, ТИ, ТУ, TR")
+if "has_input2" not in st.session_state: st.session_state.has_input2 = False
+if "has_ups" not in st.session_state: st.session_state.has_ups = False
+if "ups_time_str" not in st.session_state: st.session_state.ups_time_str = ""
+if "detected_cabinets" not in st.session_state: st.session_state.detected_cabinets = []
+if "cabinet_final" not in st.session_state: st.session_state.cabinet_final = ""
+if "reserve_val" not in st.session_state: st.session_state.reserve_val = 20
+if "res_list" not in st.session_state: st.session_state.res_list = []
+if "debug_mode" not in st.session_state: st.session_state.debug_mode = True
+if "last_filename" not in st.session_state: st.session_state.last_filename = ""
+uploaded_files = st.file_uploader("Загрузите PDF или Excel (можно несколько)", type=["pdf", "xlsx"],
+                                  accept_multiple_files=True)
+if uploaded_files:
+    # Проверка: если состав файлов изменился, сбрасываем результаты
+    current_filenames = str(sorted([f.name for f in uploaded_files]))
+    if st.session_state.last_filename != current_filenames:
+        st.session_state.detected_cabinets = []
+        st.session_state.res_list = []
+        st.session_state.has_input2 = False
+        st.session_state.has_ups = False
+        st.session_state.ups_time_str = ""
+        st.session_state.last_filename = current_filenames
+    # Если список шкафов пуст, пробегаем по ВСЕМ файлам
+    if not st.session_state.detected_cabinets:
+        all_cabinets = set()
+        has_in2 = False
+        has_ups_found = False  # <--- Нова�� переменная
+        for file_obj in uploaded_files:
+            fname = file_obj.name.lower()
+            bytes_data = file_obj.getvalue()
+            try:
+                if fname.endswith(".xlsx"):
+                    df = pd.read_excel(BytesIO(bytes_data), header=None, engine='openpyxl')
+                    cabs = find_cabinets_excel(df)
+                    if check_input2_excel(df): has_in2 = True
+                    # --- НОВАЯ ПРОВЕРКА UPS ---
+                    is_u, t_s = scan_ups_full_excel(df)
+                    if is_u: has_ups_found = True
+                    if t_s: st.session_state.ups_time_str = t_s
+                    # --------------------------
+                    for c in cabs: all_cabinets.add(c)
+                else:
+                    cabs = find_cabinets_pdf(bytes_data)
+                    if check_input2_pdf(bytes_data): has_in2 = True
+                    # --- НОВАЯ ПРОВЕРКА UPS ---
+                    is_u, t_s = scan_ups_full_pdf(bytes_data)
+                    if is_u: has_ups_found = True
+                    if t_s: st.session_state.ups_time_str = t_s
+                    # --------------------------
+                    for c in cabs: all_cabinets.add(c)
+            except Exception as e:
+                pass
+        st.session_state.detected_cabinets = sorted(list(all_cabinets))
+        st.session_state.has_input2 = has_in2
+        st.session_state.has_ups = has_ups_found  # <--- Сохраняем результат
+    c_list = st.session_state.detected_cabinets
+    with st.container():
+        c1, c2 = st.columns(2)
+        with c1:
+            if c_list:
+                sel = st.selectbox("Шкаф:", ["(Все)"] + c_list)
+                st.session_state.cabinet_final = sel if sel != "(Все)" else ""
+            st.text_input("Фильтр:", value=st.session_state.cabinet_final, key="manual_filter_input")
+            if st.session_state.manual_filter_input: st.session_state.cabinet_final = st.session_state.manual_filter_input
+        with c2:
+            st.session_state.reserve_val = st.number_input("Резерв %:", value=st.session_state.reserve_val)
+            st.session_state.debug_mode = st.checkbox("Debug", value=st.session_state.debug_mode)
+            st.write("---")
+            # Чекбокс Ввод 2
+            st.session_state.has_input2 = st.checkbox("Есть Ввод 2 (Резерв)", value=st.session_state.has_input2)
+            # Чекбокс ИБП
+            st.session_state.has_ups = st.checkbox(
+                "Требуется ИБП (UPS)",
+                value=st.session_state.has_ups,
+                help="Включается автоматически, если в ТЗ найдено время автономной работы или требование байпаса."
+            )
+            # Поле времени (появляется только если нужен ИБП)
+            if st.session_state.has_ups:
+                # Если время нашли автоматически, оно подставится. Если нет - можно ввести вручную.
+                val_time = st.session_state.ups_time_str if st.session_state.ups_time_str else "10 мин."
+                st.session_state.ups_time_str = st.text_input("Время работы:", value=val_time)
+        if st.button("Старт", type="primary") and uploaded_files:
+            st.session_state.res_list = []
+            # Создаем общий прогресс-бар
+            total_files = len(uploaded_files)
+            main_bar = st.progress(0)
+            for file_idx, file_obj in enumerate(uploaded_files):
+                fname = file_obj.name.lower()
+                # Превращаем файл в байты, чтобы передать в кеш
+                bytes_data = file_obj.getvalue()
+                # --- ВЫЗЫВАЕМ КЕШИРОВАННУЮ ФУНКЦИЮ ---
+                # При повторном нажатии или добавлении файлов этот шаг выполнится за 0.01 сек
+                file_results = process_file_cached(
+                    file_obj.name,
+                    bytes_data,
+                    st.session_state.cabinet_final,
+                    st.session_state.debug_mode
+                )
+                if file_results:
+                    st.session_state.res_list.extend(file_results)
+                else:
+                    # Если вернулся пустой список, возможно была ошибка, но для кэша мы её подавили
+                    # Можно вывести предупреждение, если нужно
+                    pass
+                # Обновляем прогресс
+                main_bar.progress((file_idx + 1) / total_files)
+if st.session_state.res_list:
+    st.divider()
+    total_c = Counts()
+    scanned_pages = []
+    for r in st.session_state.res_list:
+        total_c.add(r.counts)
+        if r.is_scan: scanned_pages.append(str(r.page))
+    st.subheader("Результаты")
+    # --- УМНЫЙ БЛОК ПРЕДУПРЕЖДЕНИЙ ---
+    # Показываем красный алерт ТОЛЬКО если сигналов МАЛО (< 15) и есть картинки.
+    # Если сигналов много (100+), мы считаем, что картинки - это штампы, и не пугаем пользователя.
+    total_signals_count = total_c.total()
+    if total_signals_count < 15 and scanned_pages:
+        st.error(
+            f"⚠️ ВНИМАНИЕ: Найдено всего {total_signals_count} сигналов. При этом обнаружены страницы-картинки (текст не распознан): {', '.join(scanned_pages)}. Вероятно, таблица сигналов находится там.")
+    elif total_signals_count < 15:
+        st.warning(
+            f"⚠️ Найдено всего {total_signals_count} сигналов. Проверьте документ, возможно формат таблиц не поддерживается.")
+    # ----------------------------------
+    if total_signals_count > 0:
+        c1, c2, c3, c4, c5, c6 = st.columns(6)
+        c1.metric("RS-485", total_c.RS485)
+        c2.metric("ETH", total_c.ETH)
+        c3.metric("AI (TI)", total_c.TI)
+        c4.metric("DI (TS)", total_c.TS)
+        c5.metric("DO (TU)", total_c.TU)
+        c6.metric("TR (AO)", total_c.AO)
+    else:
+        st.warning("Сигналы не найдены.")
+    if st.session_state.debug_mode:
+        with st.expander("LOGS"):
+            for r in st.session_state.res_list:
+                if r.debug_log:
+                    st.write(f"**Page {r.page}** [{r.mode_info}]")
+                    for l in r.debug_log:
+                        c = "green" if "->" in l else "blue" if "ПРОДОЛЖЕНИЕ" in l else "red" if "Внимание" in l else "black"
+                        st.markdown(f":{c}[{l}]")
+                    st.divider()
+    edit_data = pd.DataFrame({
+        "Тип": ["RS-485", "ETH", "AI (TI)", "DI (TS)", "DO (TU)", "TR (AO)"],
+        "Авто": [total_c.RS485, total_c.ETH, total_c.TI, total_c.TS, total_c.TU, total_c.AO],
+        "Коррекция": [0, 0, 0, 0, 0, 0]
+    })
+    edited = st.data_editor(edit_data, use_container_width=True, hide_index=True)
+    # === НОВЫЙ БЛОК: СОХРАНЕНИЕ РУЧНЫХ ПРАВОК В ПАМЯТЬ ===
+    saved_signals = {}
+    for idx, row in edited.iterrows():
+        # Складываем Авто + Коррекция
+        total_val = row["Авто"] + row["Коррекция"]
+        saved_signals[row["Тип"]] = total_val
+    # Сохраняем словарь в сессию, чтобы видеть его на других страницах-
+    st.session_state['manual_signals_counts'] = saved_signals
+    final_rows = []
+    for idx, row in edited.iterrows():
+        final_rows.append([row["Тип"], row["Авто"], row["Коррекция"], row["Авто"] + row["Коррекция"]])
+    df_ex = pd.DataFrame(final_rows, columns=["Тип", "Авто", "Коррекция", "Итого"])
+    bio = BytesIO()
+    with pd.ExcelWriter(bio, engine='openpyxl') as writer:
+        df_ex.to_excel(writer, index=False, sheet_name="Signals")
+        ws = writer.sheets['Signals']
+        ws["A8"] = f"Резерв {st.session_state.reserve_val}%"
+    bio.seek(0)
     st.download_button("Скачать отчет", bio, "signals.xlsx")