Spaces:

hlyangster
/

SubtitleFixer

Sleeping

App Files Files Community

hlyangster commited on Mar 13, 2025

Commit

db6a296

verified ·

1 Parent(s): 6dcee9d

Update core.py

Browse files

Files changed (1) hide show

core.py +35 -9

core.py CHANGED Viewed

@@ -3,6 +3,7 @@ import google.generativeai as genai
 import pysrt
 import re
 import os
 # 解析 SRT 檔案
 def parse_srt(srt_path):
@@ -64,7 +65,7 @@ def validate_srt(original_srt, modified_srt):
     return True, "驗證通過"
-def process_files(api_key, test_transcript_file, test_srt_file, batch_size):
     # 1. 配置 Gemini API
     try:
         genai.configure(api_key=api_key)
@@ -95,10 +96,10 @@ def process_files(api_key, test_transcript_file, test_srt_file, batch_size):
     all_reports = []
     keys = list(srt_data.keys()) # 取得編號
-    # 使用重疊批次而非固定批次
-    overlap = max(2, batch_size // 4)  # 25% 的重疊
-    # 處理每個批次
     for i in range(0, len(keys), batch_size - overlap):
         end_idx = min(i + batch_size, len(keys))
         batch_keys = keys[i:end_idx]
@@ -146,11 +147,36 @@ def process_files(api_key, test_transcript_file, test_srt_file, batch_size):
         )
         try:
-            response = model.generate_content(prompt)
-            corrected_subtitle = response.text
-            print(f"第 {i // (batch_size - overlap) + 1} 批次 Gemini 模型的回應：")
-            print(corrected_subtitle)
             # 使用 re.split 分割字幕和報告
             parts = re.split(r'<<<分隔符號>>>', corrected_subtitle, maxsplit=1) # 只分割一次

 import pysrt
 import re
 import os
+import time
 # 解析 SRT 檔案
 def parse_srt(srt_path):
     return True, "驗證通過"
+def process_files(api_key, test_transcript_file, test_srt_file, batch_size, delay_seconds=2):
     # 1. 配置 Gemini API
     try:
         genai.configure(api_key=api_key)
     all_reports = []
     keys = list(srt_data.keys()) # 取得編號
+    # 使用固定數量的重疊而非百分比
+    overlap = 2  # 固定重疊2條字幕
+    # 處理每個批次，使用固定重疊數量
     for i in range(0, len(keys), batch_size - overlap):
         end_idx = min(i + batch_size, len(keys))
         batch_keys = keys[i:end_idx]
         )
         try:
+            # 添加重試機制與間隔時間
+            max_retries = 3
+            retry_count = 0
+            retry_delay = 5  # 初始等待秒數
+            while retry_count < max_retries:
+                try:
+                    # 添加間隔時間以避免觸發限流
+                    if i > 0:
+                        print(f"等待 {retry_delay} 秒以避免達到API限制...")
+                        time.sleep(retry_delay)
+                    response = model.generate_content(prompt)
+                    corrected_subtitle = response.text
+                    print(f"第 {i // (batch_size - overlap) + 1} 批次 Gemini 模型的回應：")
+                    print(corrected_subtitle)
+                    break  # 成功獲取回應，跳出重試循環
+                except Exception as retry_error:
+                    retry_count += 1
+                    if "429" in str(retry_error):
+                        print(f"遇到配額限制 (429)，重試 {retry_count}/{max_retries}...")
+                        retry_delay *= 2  # 指數退避策略
+                    else:
+                        # 其他錯誤，直接拋出
+                        raise retry_error
+                    if retry_count >= max_retries:
+                        raise retry_error
             # 使用 re.split 分割字幕和報告
             parts = re.split(r'<<<分隔符號>>>', corrected_subtitle, maxsplit=1) # 只分割一次