nansha

Running

App Files Files Community

Ethscriptions commited on Nov 25, 2025

Commit

08c72b2

verified ·

1 Parent(s): dcaee93

Update app.py

Browse files

Files changed (1) hide show

app.py +82 -43

app.py CHANGED Viewed

@@ -6,6 +6,7 @@ import time
 from collections import defaultdict
 import json
 import os
 from datetime import datetime, timedelta, time as dt_time
 import io
 import warnings
@@ -22,6 +23,7 @@ from itertools import combinations
 from dotenv import load_dotenv
 load_dotenv()  # 加载本地 .env 文件
 # --- 全局配置和常量 ---
 TOKEN_FILE = 'token_data.json'
 # --- 环境变量获取 (替代硬编码) ---
@@ -1326,79 +1328,118 @@ def generate_schedule_check_logs(schedule_list, date_str):
 def check_tms_file_availability(schedule_list, tms_data, date_str):
     """
     对比排片表和TMS数据，检查影厅是否缺失对应的影片文件
     """
     if not schedule_list:
-        return ["未获取到排片数据，无法检查。"]
     if not tms_data:
-        return ["未获取到 TMS 数据，无法检查。"]
-    # 1. 预处理 TMS 数据：建立 { '影厅号(纯数字)': [影片名列表] } 的映射
-    # tms_data 结构: {'1号厅': [{'content_name':..., 'details': {'assert_name':...}}], ...}
-    tms_map = defaultdict(list)
-    import re
-    def get_hall_num(name):
-        # 提取影厅名称中的数字，例如 "1号厅" -> "1", "IMAX厅" -> "IMAX" (如果没数字)
         nums = re.findall(r'\d+', str(name))
         return nums[0] if nums else str(name)
     for hall_name, movies in tms_data.items():
-        hall_key = get_hall_num(hall_name)
         for movie in movies:
-            # 收集 assert_name (显示名) 和 content_name (文件名)
-            # 转为大写方便不区分大小写匹配
             if movie.get('details', {}).get('assert_name'):
-                tms_map[hall_key].append(str(movie['details']['assert_name']).upper())
             if movie.get('content_name'):
-                tms_map[hall_key].append(str(movie['content_name']).upper())
     # 2. 遍历排片数据进行检查
-    missing_files_log = []
-    # 用于缓存已经检查过的 (影厅, 影片) 组合，避免重复报错
     checked_combinations = set()
     for item in schedule_list:
-        # 排片数据字段可能不同，做一下兼容
         hall_raw = item.get('hallName') or item.get('Hall')
         movie_raw = item.get('movieName') or item.get('Movie')
         if not hall_raw or not movie_raw:
             continue
-        hall_num = get_hall_num(hall_raw)
-        # 清洗影片名，去掉版本后缀，获取核心片名 (使用现有的 clean_movie_title 逻辑)
-        # 这里为了匹配更宽泛，我们直接取 cleaning 后的基础名，并不依赖 canonical_names (因为可能还在预售没通过API获取到)
-        movie_clean = clean_movie_title(movie_raw).upper()
-        # 组合键
-        combo_key = (hall_num, movie_clean)
         if combo_key in checked_combinations:
             continue
         checked_combinations.add(combo_key)
-        # 开始检查
         if hall_num not in tms_map:
-            # 如果 TMS 里甚至没读到这个厅的数据（可能是坏了或者网络问题），视情况报错，这里先提示
-            # missing_files_log.append(f"⚠️ 影厅异常：TMS 中未找到【{hall_raw}】的数据，无法检查该厅《{movie_raw}》。")
             continue
-            # 核心匹配逻辑：只要 TMS 列表中有一个文件名包含了排片名的核心词，就认为有片
-        # 例如：排片 "抓娃娃"，TMS 有 "Zhuawawa_..." 或 "抓娃娃(数字2D)..." -> 匹配成功
         has_file = False
         tms_files = tms_map[hall_num]
         for tms_file in tms_files:
-            if movie_clean in tms_file:
                 has_file = True
                 break
         if not has_file:
-            missing_files_log.append(
-                f"❌ 缺片警告：【{hall_raw}】排映《{movie_raw}》，但服务器未检测到包含“{movie_clean}”的文件。")
-    return missing_files_log
 # --- 5. UI 渲染与交互逻辑 ---
@@ -1760,8 +1801,7 @@ def main():
                         check_date_str = check_date.strftime('%Y-%m-%d')
                         with st.spinner(f"正在获取 {check_date_str} 的排片数据并连接 TMS 服务器..."):
-                            # 1. 获取次日排片 (如果之前没获取过)
-                            # 注意：为了确保数据最新，这里重新快速获取一次原始数据
                             schedule_data, _ = get_api_data_with_token_management(check_date_str)
                             if not schedule_data:
@@ -1769,24 +1809,23 @@ def main():
                             else:
                                 try:
                                     # 2. 获取 TMS 数据
-                                    # 提取排片中出现的所有影片名作为优先查询关键词，加快 TMS 搜索速度 (虽然后台是全量拉取)
                                     df_sched = pd.DataFrame(schedule_data)
                                     priority_titles = df_sched[
                                         'movieName'].unique().tolist() if 'movieName' in df_sched.columns else []
                                     tms_hall_data, _ = fetch_and_process_server_movies(priority_titles)
-                                    # 3. 执行比对
-                                    missing_logs = check_tms_file_availability(schedule_data, tms_hall_data,
-                                                                               check_date_str)
-                                    if not missing_logs:
                                         st.success(
                                             f"✅ 核对完成：{check_date_str} 所有排映影片在对应影厅服务器中均存在关联文件。")
                                     else:
-                                        st.error(f"⚠️ 发现 {len(missing_logs)} 个潜在缺片风险！")
-                                        for log in missing_logs:
-                                            st.code(log)
                                 except Exception as e:
                                     st.error(f"核对过程中发生错误: {e}")

 from collections import defaultdict
 import json
 import os
+import re
 from datetime import datetime, timedelta, time as dt_time
 import io
 import warnings
 from dotenv import load_dotenv
 load_dotenv()  # 加载本地 .env 文件
 # --- 全局配置和常量 ---
 TOKEN_FILE = 'token_data.json'
 # --- 环境变量获取 (替代硬编码) ---
 def check_tms_file_availability(schedule_list, tms_data, date_str):
     """
     对比排片表和TMS数据，检查影厅是否缺失对应的影片文件
+    优化：仅匹配核心片名（去除版本后缀），优化影厅名显示，合并日志输出
     """
     if not schedule_list:
+        return "未获取到排片数据，无法检查。"
     if not tms_data:
+        return "未获取到 TMS 数据，无法检查。"
+    # --- 内部辅助函数 ---
+    def get_core_movie_name(raw_name):
+        """
+        获取核心片名用于匹配：
+        1. 先执行标准的 clean_movie_title (统一命名)
+        2. 再去除所有括号及括号内的内容 (去除版本/制式信息)
+        例如：'疯狂动物城2（数字3D）' -> '疯狂动物城2'
+        """
+        # 1. 基础清洗 (利用现有的逻辑处理中英文/特殊后缀)
+        # 注意：这里我们不传入 canonical_names，只做规则清洗
+        name = clean_movie_title(raw_name)
+        # 2. 正则去除中文全角括号及内容 （...）
+        name = re.sub(r'（.*?）', '', name)
+        # 3. 正则去除英文半角括号及内容 (...)
+        name = re.sub(r'\(.*?\)', '', name)
+        return name.strip()
+    def clean_hall_display_name(raw_name):
+        """去除影厅名两端多余的 【】 [] 符号"""
+        return str(raw_name).strip('【】[] ')
+    def get_hall_key_num(name):
+        """提取影厅数字ID用于数据匹配 (如 '1号厅' -> '1')"""
         nums = re.findall(r'\d+', str(name))
         return nums[0] if nums else str(name)
+    # ------------------
+    # 1. 预处理 TMS 数据
+    # 结构: {'1': ['Zootopia2', '疯狂动物城2', ...], ...}
+    tms_map = defaultdict(set)  # 使用 set 提高查找效率
     for hall_name, movies in tms_data.items():
+        hall_key = get_hall_key_num(hall_name)
         for movie in movies:
+            # 收集 Assert Name (显示名)
             if movie.get('details', {}).get('assert_name'):
+                # 同样对 TMS 里的名字取核心名，提高匹配率
+                core_tms_name = get_core_movie_name(str(movie['details']['assert_name']))
+                tms_map[hall_key].add(core_tms_name.upper())
+                # 保留原始 Assert Name 用于兜底匹配
+                tms_map[hall_key].add(str(movie['details']['assert_name']).upper())
+            # 收集 Content Name (文件名/UUID)
             if movie.get('content_name'):
+                tms_map[hall_key].add(str(movie['content_name']).upper())
     # 2. 遍历排片数据进行检查
+    missing_logs = []
     checked_combinations = set()
     for item in schedule_list:
         hall_raw = item.get('hallName') or item.get('Hall')
         movie_raw = item.get('movieName') or item.get('Movie')
         if not hall_raw or not movie_raw:
             continue
+        # 准备数据
+        hall_num = get_hall_key_num(hall_raw)
+        hall_display = clean_hall_display_name(hall_raw)  # 清洗后的影厅名
+        # 获取排片的核心片名 (去掉版本后缀)
+        target_movie_core = get_core_movie_name(movie_raw).upper()
+        # 组合键去重 (同一厅同一部片只报一次)
+        combo_key = (hall_num, target_movie_core)
         if combo_key in checked_combinations:
             continue
         checked_combinations.add(combo_key)
+        # 检查逻辑
         if hall_num not in tms_map:
+            # 找不到影厅数据暂不报错，可能是未映射或设备离线，避免刷屏
             continue
+            # 核心匹配：检查 TMS 集合中是否包含核心片名
+        # 方式A：精确匹配核心名 (推荐，最准)
+        # 方式B：模糊包含 (target in tms_file)
         has_file = False
         tms_files = tms_map[hall_num]
+        # 策略：只要 TMS 中有一个文件名 包含 我们的核心排片名，就视为有片
+        # 例如：排片 core='疯狂动物城2'，TMS='疯狂动物城2_IMAX' -> 匹配成功
         for tms_file in tms_files:
+            if target_movie_core in tms_file:
                 has_file = True
                 break
         if not has_file:
+            # 记录日志，使用清洗后的影厅名和排片原名
+            missing_logs.append(f"【{hall_display}】排映《{movie_raw}》，但服务器未检测到包含“{target_movie_core}”的文件。")
+    # 3. 格式化输出
+    if not missing_logs:
+        return None  # 返回 None 表示一切正常
+    # 生成带编号的字符串
+    formatted_output = []
+    for idx, log in enumerate(missing_logs, 1):
+        formatted_output.append(f"{idx}. ❌ 缺片警告：{log}")
+    return "\n".join(formatted_output)
 # --- 5. UI 渲染与交互逻辑 ---
                         check_date_str = check_date.strftime('%Y-%m-%d')
                         with st.spinner(f"正在获取 {check_date_str} 的排片数据并连接 TMS 服务器..."):
+                            # 1. 获取次日排片
                             schedule_data, _ = get_api_data_with_token_management(check_date_str)
                             if not schedule_data:
                             else:
                                 try:
                                     # 2. 获取 TMS 数据
                                     df_sched = pd.DataFrame(schedule_data)
                                     priority_titles = df_sched[
                                         'movieName'].unique().tolist() if 'movieName' in df_sched.columns else []
                                     tms_hall_data, _ = fetch_and_process_server_movies(priority_titles)
+                                    # 3. 执行比对 (使用新函数)
+                                    logs_text = check_tms_file_availability(schedule_data, tms_hall_data,
+                                                                            check_date_str)
+                                    if logs_text is None:
                                         st.success(
                                             f"✅ 核对完成：{check_date_str} 所有排映影片在对应影厅服务器中均存在关联文件。")
                                     else:
+                                        st.warning("⚠️ 发现潜在缺片风险！请检查以下影厅服务器：")
+                                        # 这里使用 st.code 展示多行带编号的文本
+                                        st.code(logs_text, language="text")
                                 except Exception as e:
                                     st.error(f"核对过程中发生错误: {e}")