Spaces:

tomo2chin2
/

PDF_SlideShow

Paused

tomo2chin2 commited on Oct 7, 2025

Commit

3a1e0f5

verified ·

1 Parent(s): abe5a08

Upload app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -47,6 +47,32 @@ class VideoResponse(BaseModel):
     total_pages: Optional[int] = None
     video_duration: Optional[float] = None  # 秒
 # ==============================
 # コア機能実装
 # ==============================
@@ -65,6 +91,9 @@ def download_pdf_from_url(pdf_url: str) -> str:
         Exception: ダウンロード失敗時
     """
     try:
         logger.info(f"PDFダウンロード開始: {pdf_url}")
         # HTTPリクエスト
@@ -363,6 +392,9 @@ def process_pdf_url(pdf_url, duration_per_page, dpi, progress=gr.Progress()):
         if not pdf_url:
             return None, "❌ PDF URLを入力してください", None
         progress(0, desc="PDFダウンロード中...")
         # PDFダウンロード

     total_pages: Optional[int] = None
     video_duration: Optional[float] = None  # 秒
+# ==============================
+# URL前処理ユーティリティ
+# ==============================
+def sanitize_url(url: str) -> str:
+    """
+    URLからバックスラッシュやエスケープシーケンスを除去
+    Args:
+        url: 元のURL文字列
+    Returns:
+        str: クリーニングされたURL
+    """
+    # バックスラッシュを除去
+    cleaned_url = url.replace('\', '')
+    # 前後の空白を削除
+    cleaned_url = cleaned_url.strip()
+    # ダブルクォートを除去（JSON文字列から来た場合）
+    cleaned_url = cleaned_url.strip('"').strip("'")
+    logger.info(f"URL sanitized: {url} → {cleaned_url}")
+    return cleaned_url
 # ==============================
 # コア機能実装
 # ==============================
         Exception: ダウンロード失敗時
     """
     try:
+        # URLをサニタイズ（バックスラッシュ等を除去）
+        pdf_url = sanitize_url(pdf_url)
         logger.info(f"PDFダウンロード開始: {pdf_url}")
         # HTTPリクエスト
         if not pdf_url:
             return None, "❌ PDF URLを入力してください", None
+        # URLをサニタイズ
+        pdf_url = sanitize_url(pdf_url)
         progress(0, desc="PDFダウンロード中...")
         # PDFダウンロード