Spaces:

tomo2chin2
/

PDF_SlideShow

Paused

App Files Files Community

tomo2chin2 commited on Oct 7, 2025

Commit

abe5a08

verified ·

1 Parent(s): 13ff327

Upload 5 files

Browse files

Files changed (5) hide show

README.md +233 -6
app.py +507 -0
packages.txt +2 -0
requirements.txt +9 -0
実装ステップ.md +709 -0

README.md CHANGED Viewed

@@ -1,12 +1,239 @@
 ---
-title: PDF SlideShow
-emoji: 🏆
 colorFrom: blue
-colorTo: indigo
 sdk: gradio
-sdk_version: 5.49.0
 app_file: app.py
-pinned: false
 ---
-Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

 ---
+title: PDF to Video Converter
+emoji: 🎬
 colorFrom: blue
+colorTo: purple
 sdk: gradio
+sdk_version: 4.19.2
 app_file: app.py
+pinned: true
 ---
+# 📄 PDF to Video Converter 🎬
+PDFファイルをスライドショー動画に変換するAPIです。指定されたURLからPDFをダウンロードし、各ページを画像化して、1ページあたり指定秒数のスライドショー動画を生成します。
+## 🌟 機能
+### ✅ 主要機能
+- **PDF URLからのダウンロード**: HTTPリクエストで指定されたURLからPDFを取得
+- **PDF→画像変換**: pdf2imageを使用して各ページを高品質な画像に変換
+- **スライドショー動画生成**: 各画像を指定秒数（デフォルト5秒）表示する動画を作成
+- **Hugging Faceアップロード**: 生成した動画をデータセットリポジトリに自動保存
+- **URL返却**: アップロードされた動画のアクセス可能なURLを返却
+### 🎨 ユーザーインターフェース
+- **Gradio UI**: 直感的なWebインターフェース
+- **FastAPI**: RESTful APIエンドポイント
+- **リアルタイム進捗表示**: 処理状況を確認可能
+- **動画プレビュー**: 生成された動画をその場で確認
+## 🔌 API仕様
+### エンドポイント: `POST /api/pdf-to-video`
+#### リクエスト
+```json
+{
+  "pdf_url": "https://example.com/sample.pdf",
+  "duration_per_page": 5,
+  "dpi": 150
+}
+```
+**パラメータ:**
+- `pdf_url` (string, 必須): PDFファイルのURL
+- `duration_per_page` (integer, オプション): 1ページあたりの表示秒数（デフォルト: 5）
+- `dpi` (integer, オプション): 画像解像度（デフォルト: 150）
+#### レスポンス
+```json
+{
+  "status": "success",
+  "video_url": "https://huggingface.co/datasets/username/repo/resolve/main/videos/video_20250107_123456_abc123.mp4",
+  "message": "動画の生成とアップロードに成功しました",
+  "total_pages": 10,
+  "video_duration": 50.0
+}
+```
+**フィールド:**
+- `status` (string): 処理結果（"success" または "error"）
+- `video_url` (string): 生成された動画のURL
+- `message` (string): 処理結果メッセージ
+- `total_pages` (integer): PDFの総ページ数
+- `video_duration` (float): 動画の総再生時間（秒）
+### エンドポイント: `GET /health`
+ヘルスチェック用エンドポイント
+#### レスポンス
+```json
+{
+  "status": "healthy",
+  "service": "PDF to Video API",
+  "hf_configured": true
+}
+```
+## 🛠️ 技術スタック
+- **Gradio 4.19.2**: WebUI/SDK
+- **FastAPI**: REST APIフレームワーク
+- **pdf2image**: PDF→画像変換
+- **OpenCV (cv2)**: 動画生成エンジン
+- **huggingface_hub**: データセットアップロード
+- **Pillow**: 画像処理
+- **requests**: HTTP通信
+## ⚙️ 環境変数
+以下の環境変数を設定する必要があります：
+| 変数名 | 必須 | デフォルト値 | 説明 |
+|--------|------|--------------|------|
+| `HF_TOKEN` | ✅ | - | Hugging Face認証トークン |
+| `HF_REPO_ID` | ❌ | `tomo2chin2/video-storage` | データセットリポジトリID |
+### HF_TOKENの取得方法
+1. [Hugging Face](https://huggingface.co/)にログイン
+2. Settings → Access Tokens に移動
+3. "New token" をクリック
+4. Write権限を付与してトークンを生成
+5. 生成されたトークンをコピー
+6. Space設定の "Repository secrets" に追加
+## 🚀 使用方法
+### Web UIから使用
+1. Space URLにアクセス
+2. PDF URLを入力欄に貼り付け
+3. 表示秒数とDPIを調整（任意）
+4. 「🎬 動画生成」ボタンをクリック
+5. 生成された動画URLをコピー
+### APIから使用
+#### curlの例
+```bash
+curl -X POST "https://your-space.hf.space/api/pdf-to-video" \
+  -H "Content-Type: application/json" \
+  -d '{
+    "pdf_url": "https://www.w3.org/WAI/ER/tests/xhtml/testfiles/resources/pdf/dummy.pdf",
+    "duration_per_page": 5,
+    "dpi": 150
+  }'
+```
+#### Pythonの例
+```python
+import requests
+response = requests.post(
+    "https://your-space.hf.space/api/pdf-to-video",
+    json={
+        "pdf_url": "https://example.com/sample.pdf",
+        "duration_per_page": 5,
+        "dpi": 150
+    }
+)
+result = response.json()
+print(f"動画URL: {result['video_url']}")
+```
+#### JavaScriptの例
+```javascript
+fetch('https://your-space.hf.space/api/pdf-to-video', {
+  method: 'POST',
+  headers: {
+    'Content-Type': 'application/json',
+  },
+  body: JSON.stringify({
+    pdf_url: 'https://example.com/sample.pdf',
+    duration_per_page: 5,
+    dpi: 150
+  })
+})
+.then(response => response.json())
+.then(data => console.log('動画URL:', data.video_url));
+```
+## 📊 処理フロー
+```
+1. PDF URLダウンロード
+   ↓
+2. PDF→画像変換（pdf2image）
+   ↓
+3. 画像サイズ統一（Pillow）
+   ↓
+4. 動画生成（OpenCV）
+   - 各ページを指定秒数表示
+   - 30fps
+   ↓
+5. Hugging Faceアップロード
+   ↓
+6. URL返却
+```
+## 🧪 テスト用サンプルPDF
+以下のURLでテスト可能です：
+- **W3C ダミーPDF**: `https://www.w3.org/WAI/ER/tests/xhtml/testfiles/resources/pdf/dummy.pdf`
+- **小サイズPDF**: 処理時間が短く、動作確認に最適
+## ⚠️ 制限事項
+1. **PDFサイズ**: 大きなPDF（20ページ以上）は処理に時間がかかります
+2. **タイムアウト**: Hugging Face Spacesのタイムアウト制限（〜60秒）に注意
+3. **同時リクエスト**: 大量の同時リクエストには対応していません
+4. **ファイル形式**: PDFのみ対応（画像ファイルは非対応）
+## 🔧 トラブルシューティング
+### エラー: "HuggingFace API が初期化されていません"
+→ `HF_TOKEN` 環境変数が設定されているか確認してください
+### エラー: "PDFのダウンロードに失敗しました"
+→ PDF URLが正しいか、アクセス可能か確認してください
+### エラー: "PDFの画像変換に失敗しました"
+→ PDFが破損していないか確認してください
+### 動画が生成されない
+→ ログを確認し、どの段階でエラーが発生しているか特定してください
+## 📁 ファイル構成
+```
+majin/v4_spinoff/HUG/
+├── app.py                  # メインアプリケーション
+├── requirements.txt        # Python依存パッケージ
+├── packages.txt            # システムパッケージ
+├── README.md               # このファイル
+└── 実装ステップ.md         # 詳細な実装手順
+```
+## 🤝 貢献
+プルリクエストやイシューの報告を歓迎します。
+## 📜 ライセンス
+MIT License
+## 📞 連絡先
+問題や質問がある場合は、Issueを作成してください。
+---
+**最終更新**: 2025-10-07

app.py ADDED Viewed

	@@ -0,0 +1,507 @@

+"""
+PDF to Video Converter API
+PDFをダウンロードして各ページを画像化し、スライドショー動画を生成してHugging Faceにアップロードする
+"""
+import gradio as gr
+from fastapi import FastAPI, HTTPException
+from fastapi.middleware.cors import CORSMiddleware
+from pydantic import BaseModel, HttpUrl
+from typing import Optional
+import requests
+import tempfile
+import os
+import logging
+import numpy as np
+from datetime import datetime
+import uuid
+from pathlib import Path
+# 画像・動画処理ライブラリ
+from pdf2image import convert_from_path
+from PIL import Image
+import cv2
+# Hugging Face Hub
+from huggingface_hub import HfApi, login
+# ロギング設定
+logging.basicConfig(level=logging.INFO)
+logger = logging.getLogger(__name__)
+# ==============================
+# リクエスト/レスポンスモデル
+# ==============================
+class PdfToVideoRequest(BaseModel):
+    """PDF→動画変換リクエストモデル"""
+    pdf_url: HttpUrl
+    duration_per_page: int = 5  # デフォルト5秒
+    dpi: int = 150  # デフォルトDPI
+class VideoResponse(BaseModel):
+    """動画生成レスポンスモデル"""
+    status: str
+    video_url: Optional[str] = None
+    message: str
+    total_pages: Optional[int] = None
+    video_duration: Optional[float] = None  # 秒
+# ==============================
+# コア機能実装
+# ==============================
+def download_pdf_from_url(pdf_url: str) -> str:
+    """
+    指定されたURLからPDFをダウンロードして一時ファイルとして保存
+    Args:
+        pdf_url: PDFファイルのURL
+    Returns:
+        str: ダウンロードされたPDFファイルのパス
+    Raises:
+        Exception: ダウンロード失敗時
+    """
+    try:
+        logger.info(f"PDFダウンロード開始: {pdf_url}")
+        # HTTPリクエスト
+        response = requests.get(pdf_url, timeout=30, stream=True)
+        response.raise_for_status()
+        # Content-Typeの検証
+        content_type = response.headers.get('Content-Type', '')
+        if 'pdf' not in content_type.lower():
+            logger.warning(f"Content-Type が PDF ではありません: {content_type}")
+        # 一時ファイルに保存
+        with tempfile.NamedTemporaryFile(suffix=".pdf", delete=False) as tmp_file:
+            tmp_path = tmp_file.name
+            for chunk in response.iter_content(chunk_size=8192):
+                tmp_file.write(chunk)
+        logger.info(f"PDFダウンロード完了: {tmp_path} ({os.path.getsize(tmp_path)} bytes)")
+        return tmp_path
+    except requests.exceptions.RequestException as e:
+        logger.error(f"PDFダウンロードエラー: {e}")
+        raise Exception(f"PDFのダウンロードに失敗しました: {e}")
+def convert_pdf_to_images(pdf_path: str, dpi: int = 150) -> list:
+    """
+    PDFファイルを画像リストに変換
+    Args:
+        pdf_path: PDFファイルのパス
+        dpi: 解像度（デフォルト150）
+    Returns:
+        list: PIL.Imageオブジェクトのリスト
+    """
+    try:
+        logger.info(f"PDF→画像変換開始: {pdf_path}, DPI={dpi}")
+        # PDFを画像に変換
+        images = convert_from_path(
+            pdf_path,
+            dpi=dpi,
+            fmt='jpeg',  # JPEG形式で出力
+            thread_count=2  # 並列処理スレッド数
+        )
+        logger.info(f"PDF変換完了: {len(images)}ページ")
+        return images
+    except Exception as e:
+        logger.error(f"PDF変換エラー: {e}")
+        raise Exception(f"PDFの画像変換に失敗しました: {e}")
+def create_video_from_images(
+    images: list,
+    duration_per_page: int = 5,
+    fps: int = 30
+) -> str:
+    """
+    画像リストからスライドショー動画を生成
+    Args:
+        images: PIL.Imageオブジェクトのリスト
+        duration_per_page: 1ページあたりの表示秒数（デフォルト5秒）
+        fps: フレームレート（デフォルト30fps）
+    Returns:
+        str: 生成された動画ファイルのパス
+    """
+    try:
+        if not images:
+            raise ValueError("画像リストが空です")
+        logger.info(f"動画生成開始: {len(images)}ページ, {duration_per_page}秒/ページ, {fps}fps")
+        # 全画像を同じサイズにリサイズ（最初の画像のサイズに統一）
+        first_img = images[0]
+        width, height = first_img.size
+        logger.info(f"動画サイズ: {width}x{height}")
+        # 一時ファイルパス
+        tmp_video = tempfile.NamedTemporaryFile(suffix=".mp4", delete=False)
+        video_path = tmp_video.name
+        tmp_video.close()
+        # 動画ライター初期化
+        fourcc = cv2.VideoWriter_fourcc(*'mp4v')
+        video_writer = cv2.VideoWriter(
+            video_path,
+            fourcc,
+            fps,
+            (width, height)
+        )
+        # 各画像を指定秒数分のフレームとして追加
+        frames_per_page = duration_per_page * fps
+        for idx, img in enumerate(images):
+            logger.info(f"ページ {idx+1}/{len(images)} を処理中...")
+            # 画像をリサイズ（必要な場合）
+            if img.size != (width, height):
+                img = img.resize((width, height), Image.Resampling.LANCZOS)
+            # PIL Image → OpenCV形式に変換（RGB→BGR）
+            img_array = np.array(img)
+            if len(img_array.shape) == 3 and img_array.shape[2] == 3:
+                img_bgr = cv2.cvtColor(img_array, cv2.COLOR_RGB2BGR)
+            else:
+                img_bgr = img_array
+            # 同じフレームを複数回書き込み（静止画として表示）
+            for _ in range(frames_per_page):
+                video_writer.write(img_bgr)
+        video_writer.release()
+        logger.info(f"動画生成完了: {video_path} ({os.path.getsize(video_path)} bytes)")
+        return video_path
+    except Exception as e:
+        logger.error(f"動画生成エラー: {e}")
+        raise Exception(f"動画の生成に失敗しました: {e}")
+# ==============================
+# Hugging Face アップロード
+# ==============================
+class VideoUploader:
+    """Hugging Face Datasetへの動画アップロード機能"""
+    def __init__(self):
+        self.repo_id = os.environ.get("HF_REPO_ID", "tomo2chin2/video-storage")
+        self.token = os.environ.get("HF_TOKEN")
+        if not self.token:
+            logger.warning("HF_TOKEN 環境変数が設定されていません")
+            self.api = None
+            return
+        try:
+            # ログイン
+            login(token=self.token)
+            self.api = HfApi()
+            logger.info(f"HuggingFace にログイン完了: {self.repo_id}")
+        except Exception as e:
+            logger.error(f"HuggingFace ログインエラー: {e}")
+            self.api = None
+    def upload_video(self, video_path: str, prefix: str = "video") -> str:
+        """
+        動画をHugging Faceデータセットにアップロード
+        Args:
+            video_path: アップロードする動画ファイルのパス
+            prefix: ファイル名のプレフィックス
+        Returns:
+            str: アップロードされた動画のURL
+        """
+        if not self.api:
+            raise Exception("HuggingFace API が初期化されていません。HF_TOKEN を確認してください。")
+        try:
+            # ユニークなファイル名を生成
+            timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
+            unique_id = str(uuid.uuid4())[:8]
+            filename = f"{prefix}_{timestamp}_{unique_id}.mp4"
+            path_in_repo = f"videos/{filename}"
+            logger.info(f"動画アップロード開始: {path_in_repo}")
+            # アップロード実行
+            upload_info = self.api.upload_file(
+                path_or_fileobj=video_path,
+                path_in_repo=path_in_repo,
+                repo_id=self.repo_id,
+                repo_type="dataset"
+            )
+            # URLを構築
+            video_url = f"https://huggingface.co/datasets/{self.repo_id}/resolve/main/{path_in_repo}"
+            logger.info(f"動画アップロード完了: {video_url}")
+            return video_url
+        except Exception as e:
+            logger.error(f"動画アップロードエラー: {e}")
+            raise Exception(f"動画のアップロードに失敗しました: {e}")
+# グローバルなアップローダーインスタンスを作成
+video_uploader = VideoUploader()
+# ==============================
+# FastAPI アプリケーション
+# ==============================
+app = FastAPI(
+    title="PDF to Video API",
+    description="PDFをスライドショー動画に変換するAPI",
+    version="1.0.0"
+)
+# CORS設定
+app.add_middleware(
+    CORSMiddleware,
+    allow_origins=["*"],
+    allow_credentials=True,
+    allow_methods=["*"],
+    allow_headers=["*"],
+)
+@app.post(
+    "/api/pdf-to-video",
+    response_model=VideoResponse,
+    tags=["Video Generation"],
+    summary="PDFをスライドショー動画に変換",
+    description="指定されたURLからPDFをダウンロードし、各ページを画像化して動画を生成します。"
+)
+async def pdf_to_video(request: PdfToVideoRequest):
+    """PDF→動画変換APIエンドポイント"""
+    pdf_path = None
+    video_path = None
+    try:
+        logger.info(f"API リクエスト受信: {request.pdf_url}")
+        # 1. PDFダウンロード
+        pdf_path = download_pdf_from_url(str(request.pdf_url))
+        # 2. PDF→画像変換
+        images = convert_pdf_to_images(pdf_path, dpi=request.dpi)
+        total_pages = len(images)
+        # 3. 動画生成
+        video_path = create_video_from_images(
+            images,
+            duration_per_page=request.duration_per_page
+        )
+        # 4. Hugging Faceにアップロード
+        video_url = video_uploader.upload_video(video_path, prefix="pdf_video")
+        # 動画の総再生時間を計算
+        video_duration = total_pages * request.duration_per_page
+        logger.info(f"処理完了: {video_url}")
+        return VideoResponse(
+            status="success",
+            video_url=video_url,
+            message="動画の生成とアップロードに成功しました",
+            total_pages=total_pages,
+            video_duration=video_duration
+        )
+    except Exception as e:
+        logger.error(f"エラー発生: {e}", exc_info=True)
+        raise HTTPException(
+            status_code=500,
+            detail=f"動画生成に失敗しました: {str(e)}"
+        )
+    finally:
+        # 一時ファイルのクリーンアップ
+        if pdf_path and os.path.exists(pdf_path):
+            try:
+                os.remove(pdf_path)
+                logger.info(f"一時PDFファイル削除: {pdf_path}")
+            except Exception as e:
+                logger.warning(f"PDFファイル削除エラー: {e}")
+        if video_path and os.path.exists(video_path):
+            try:
+                os.remove(video_path)
+                logger.info(f"一時動画ファイル削除: {video_path}")
+            except Exception as e:
+                logger.warning(f"動画ファイル削除エラー: {e}")
+@app.get("/health")
+async def health_check():
+    """ヘルスチェックエンドポイント"""
+    return {
+        "status": "healthy",
+        "service": "PDF to Video API",
+        "hf_configured": video_uploader.api is not None
+    }
+# ==============================
+# Gradio UI
+# ==============================
+def process_pdf_url(pdf_url, duration_per_page, dpi, progress=gr.Progress()):
+    """Gradio UIからの処理関数"""
+    try:
+        if not pdf_url:
+            return None, "❌ PDF URLを入力してください", None
+        progress(0, desc="PDFダウンロード中...")
+        # PDFダウンロード
+        pdf_path = download_pdf_from_url(pdf_url)
+        progress(0.3, desc="PDF→画像変換中...")
+        # PDF→画像変換
+        images = convert_pdf_to_images(pdf_path, dpi=dpi)
+        total_pages = len(images)
+        progress(0.6, desc=f"動画生成中（{total_pages}ページ）...")
+        # 動画生成
+        video_path = create_video_from_images(
+            images,
+            duration_per_page=duration_per_page
+        )
+        progress(0.9, desc="Hugging Faceにアップロード中...")
+        # アップロード
+        video_url = video_uploader.upload_video(video_path, prefix="pdf_video")
+        # クリーンアップ
+        if pdf_path and os.path.exists(pdf_path):
+            os.remove(pdf_path)
+        if video_path and os.path.exists(video_path):
+            os.remove(video_path)
+        video_duration = total_pages * duration_per_page
+        progress(1.0, desc="完了！")
+        return (
+            video_url,  # ビデオURL
+            f"✅ 成功: {total_pages}ページ、{video_duration}秒の動画を生成しました",
+            video_url  # プレビュー用
+        )
+    except Exception as e:
+        logger.error(f"Gradio処理エラー: {e}", exc_info=True)
+        return None, f"❌ エラー: {str(e)}", None
+# Gradio UI定義
+with gr.Blocks(title="PDF to Video Converter", theme=gr.themes.Soft()) as demo:
+    gr.Markdown("# 📄 PDF → 🎬 動画変換")
+    gr.Markdown("PDFのURLを指定すると、各ページをスライドショー動画に変換します。")
+    with gr.Row():
+        with gr.Column(scale=2):
+            pdf_url_input = gr.Textbox(
+                label="PDF URL",
+                placeholder="https://example.com/sample.pdf",
+                info="変換したいPDFファイルのURLを入力してください"
+            )
+            with gr.Row():
+                duration_slider = gr.Slider(
+                    minimum=1,
+                    maximum=10,
+                    step=1,
+                    value=5,
+                    label="1ページあたりの表示秒数"
+                )
+                dpi_slider = gr.Slider(
+                    minimum=72,
+                    maximum=300,
+                    step=1,
+                    value=150,
+                    label="画像解像度（DPI）",
+                    info="高いほど高画質ですが処理時間が増加します"
+                )
+            convert_btn = gr.Button("🎬 動画生成", variant="primary", size="lg")
+        with gr.Column(scale=1):
+            status_output = gr.Textbox(
+                label="ステータス",
+                interactive=False
+            )
+            video_url_output = gr.Textbox(
+                label="動画URL",
+                interactive=False,
+                info="生成された動画のURL"
+            )
+    with gr.Row():
+        video_preview = gr.Video(
+            label="プレビュー",
+            interactive=False
+        )
+    # イベント設定
+    convert_btn.click(
+        fn=process_pdf_url,
+        inputs=[pdf_url_input, duration_slider, dpi_slider],
+        outputs=[video_url_output, status_output, video_preview]
+    )
+    # 使用例とサンプルURL
+    gr.Markdown("""
+    ## 📖 使用方法
+    1. PDFのURLを入力
+    2. 1ページあたりの表示秒数を調整（デフォルト5秒）
+    3. 解像度（DPI）を調整（デフォルト150）
+    4. 「動画生成」ボタンをクリック
+    5. 生成された動画URLをコピーして利用
+    ## 🔗 サンプルPDF URL（テスト用）
+    - W3C サンプル: `https://www.w3.org/WAI/ER/tests/xhtml/testfiles/resources/pdf/dummy.pdf`
+    ## ⚙️ 環境変数
+    - `HF_TOKEN`: Hugging Face認証トークン（必須）
+    - `HF_REPO_ID`: データセットリポジトリID（デフォルト: tomo2chin2/video-storage）
+    ## 🔗 APIエンドポイント
+    - `POST /api/pdf-to-video`: PDF→動画変換API
+    - `GET /health`: ヘルスチェック
+    """)
+    # 環境変数情報表示
+    hf_repo = os.environ.get("HF_REPO_ID", "tomo2chin2/video-storage")
+    hf_configured = "✅ 設定済み" if video_uploader.api else "❌ 未設定"
+    gr.Markdown(f"""
+    ## 📊 現在の設定
+    - HuggingFace リポジトリ: `{hf_repo}`
+    - HF_TOKEN: {hf_configured}
+    """)
+# FastAPIにGradioをマウント
+app = gr.mount_gradio_app(app, demo, path="/")
+# ==============================
+# アプリケーション起動
+# ==============================
+if __name__ == "__main__":
+    import uvicorn
+    logger.info("Starting PDF to Video Converter API...")
+    uvicorn.run(app, host="0.0.0.0", port=7860)

packages.txt ADDED Viewed

	@@ -0,0 +1,2 @@


1	+ poppler-utils
2	+ ffmpeg

requirements.txt ADDED Viewed

	@@ -0,0 +1,9 @@

+gradio==4.19.2
+fastapi
+uvicorn[standard]
+pdf2image
+opencv-python-headless
+Pillow
+requests
+huggingface_hub
+python-dotenv

実装ステップ.md ADDED Viewed

	@@ -0,0 +1,709 @@

+# PDF→動画変換API 実装ステップ
+## 📋 プロジェクト概要
+### 目的
+PDFファイルをURLから取得し、各ページを画像に分解して5秒ずつ表示するスライドショー動画を生成し、Hugging Faceデータセットリポジトリに保存してURLを返すAPIを構築する。
+### 技術スタック
+- **Gradio 4.19.2** - UI/SDK（Hugging Face Spacesのフレームワーク）
+- **FastAPI** - RESTful APIエンドポイント
+- **pdf2image** - PDF→画像変換（popplerベース）
+- **OpenCV (cv2)** - 動画生成
+- **huggingface_hub** - データセットへのファイルアップロード
+- **requests** - PDF URLからのダウンロード
+### 処理フロー
+```
+PDF URL → ダウンロード → PDF→画像変換 → 動画生成（5秒/ページ） → HF Dataset保存 → URL返却
+```
+---
+## 🗂️ ディレクトリ構造
+```
+majin/v4_spinoff/HUG/
+├── 実装ステップ.md          # 本ドキュメント
+├── app.py                   # メインアプリケーション
+├── requirements.txt         # Python依存パッケージ
+├── packages.txt             # システムパッケージ
+├── README.md                # Hugging Face Space設定
+├── .env.example             # 環境変数のサンプル
+└── FASTAPI_GRADIO_sample/   # 参考資料（既存）
+```
+---
+## 📝 実装ステップ
+### フェーズ1: 環境セットアップ
+#### ステップ1.1: packages.txt作成
+システムレベルの依存パッケージを定義します。
+**ファイル: `packages.txt`**
+```
+poppler-utils
+ffmpeg
+```
+**解説:**
+- `poppler-utils`: pdf2imageがPDFをレンダリングするために必要
+- `ffmpeg`: OpenCVの動画エンコーディングに必要
+#### ステップ1.2: requirements.txt作成
+Pythonパッケージの依存関係を定義します。
+**ファイル: `requirements.txt`**
+```
+gradio==4.19.2
+fastapi
+uvicorn[standard]
+pdf2image
+opencv-python-headless
+Pillow
+requests
+huggingface_hub
+python-dotenv
+```
+**解説:**
+- `opencv-python-headless`: GUI不要のOpenCV（Spaceに最適）
+- `huggingface_hub`: Dataset APIアクセス用
+- `python-dotenv`: 環境変数管理（開発時）
+---
+### フェーズ2: コア機能実装
+#### ステップ2.1: PDFダウンロード機能
+```python
+import requests
+import tempfile
+import os
+from pathlib import Path
+def download_pdf_from_url(pdf_url: str) -> str:
+    """
+    指定されたURLからPDFをダウンロードして一時ファイルとして保存
+    Args:
+        pdf_url: PDFファイルのURL
+    Returns:
+        str: ダウンロードされたPDFファイルのパス
+    Raises:
+        Exception: ダウンロード失敗時
+    """
+    try:
+        logger.info(f"PDFダウンロード開始: {pdf_url}")
+        # HTTPリクエスト
+        response = requests.get(pdf_url, timeout=30, stream=True)
+        response.raise_for_status()
+        # Content-Typeの検証
+        content_type = response.headers.get('Content-Type', '')
+        if 'pdf' not in content_type.lower():
+            logger.warning(f"Content-Type が PDF ではありません: {content_type}")
+        # 一時ファイルに保存
+        with tempfile.NamedTemporaryFile(suffix=".pdf", delete=False) as tmp_file:
+            tmp_path = tmp_file.name
+            for chunk in response.iter_content(chunk_size=8192):
+                tmp_file.write(chunk)
+        logger.info(f"PDFダウンロード完了: {tmp_path}")
+        return tmp_path
+    except requests.exceptions.RequestException as e:
+        logger.error(f"PDFダウンロードエラー: {e}")
+        raise Exception(f"PDFのダウンロードに失敗しました: {e}")
+```
+**ポイント:**
+- `stream=True`で大きなファイルにも対応
+- タイムアウト設定で無限待機を防止
+- Content-Type検証でPDF以外のファイルを警告
+#### ステップ2.2: PDF→画像変換機能
+```python
+from pdf2image import convert_from_path
+from PIL import Image
+import logging
+logger = logging.getLogger(__name__)
+def convert_pdf_to_images(pdf_path: str, dpi: int = 150) -> list:
+    """
+    PDFファイルを画像リストに変換
+    Args:
+        pdf_path: PDFファイルのパス
+        dpi: 解像度（デフォルト150）
+    Returns:
+        list: PIL.Imageオブジェクトのリスト
+    """
+    try:
+        logger.info(f"PDF→画像変換開始: {pdf_path}, DPI={dpi}")
+        # PDFを画像に変換
+        images = convert_from_path(
+            pdf_path,
+            dpi=dpi,
+            fmt='jpeg',  # JPEG形式で出力
+            thread_count=2  # 並列処理スレッド数
+        )
+        logger.info(f"PDF変換完了: {len(images)}ページ")
+        return images
+    except Exception as e:
+        logger.error(f"PDF変換エラー: {e}")
+        raise Exception(f"PDFの画像変換に失敗しました: {e}")
+```
+**ポイント:**
+- DPI調整で画質と処理速度のバランス調整
+- JPEG形式で動画サイズを抑制
+- thread_count でリソース使用を制御
+#### ステップ2.3: 画像→動画生成機能
+```python
+import cv2
+import numpy as np
+from PIL import Image
+import tempfile
+def create_video_from_images(
+    images: list,
+    duration_per_page: int = 5,
+    fps: int = 30
+) -> str:
+    """
+    画像リストからスライドショー動画を生成
+    Args:
+        images: PIL.Imageオブジェクトのリスト
+        duration_per_page: 1ページあたりの表示秒数（デフォルト5秒）
+        fps: フレームレート（デフォルト30fps）
+    Returns:
+        str: 生成された動画ファイルのパス
+    """
+    try:
+        if not images:
+            raise ValueError("画像リストが空です")
+        logger.info(f"動画生成開始: {len(images)}ページ, {duration_per_page}秒/ページ, {fps}fps")
+        # 全画像を同じサイズにリサイズ（最初の画像のサイズに統一）
+        first_img = images[0]
+        width, height = first_img.size
+        logger.info(f"動画サイズ: {width}x{height}")
+        # 一時ファイルパス
+        tmp_video = tempfile.NamedTemporaryFile(suffix=".mp4", delete=False)
+        video_path = tmp_video.name
+        tmp_video.close()
+        # 動画ライター初期化
+        fourcc = cv2.VideoWriter_fourcc(*'mp4v')
+        video_writer = cv2.VideoWriter(
+            video_path,
+            fourcc,
+            fps,
+            (width, height)
+        )
+        # 各画像を指定秒数分のフレームとして追加
+        frames_per_page = duration_per_page * fps
+        for idx, img in enumerate(images):
+            logger.info(f"ページ {idx+1}/{len(images)} を処理中...")
+            # 画像をリサイズ（必要な場合）
+            if img.size != (width, height):
+                img = img.resize((width, height), Image.Resampling.LANCZOS)
+            # PIL Image → OpenCV形式に変換（RGB→BGR）
+            img_array = np.array(img)
+            if len(img_array.shape) == 3 and img_array.shape[2] == 3:
+                img_bgr = cv2.cvtColor(img_array, cv2.COLOR_RGB2BGR)
+            else:
+                img_bgr = img_array
+            # 同じフレームを複数回書き込み（静止画として表示）
+            for _ in range(frames_per_page):
+                video_writer.write(img_bgr)
+        video_writer.release()
+        logger.info(f"動画生成完了: {video_path}")
+        return video_path
+    except Exception as e:
+        logger.error(f"動画生成エラー: {e}")
+        raise Exception(f"動画の生成に失敗しました: {e}")
+```
+**ポイント:**
+- 全画像を統一サイズにリサイズ（動画の要件）
+- RGB→BGR変換（OpenCVの要件）
+- フレーム数計算: `duration_per_page * fps`
+#### ステップ2.4: Hugging Faceアップロード機能
+```python
+from huggingface_hub import HfApi, login
+import os
+from datetime import datetime
+import uuid
+class VideoUploader:
+    """Hugging Face Datasetへの動画アップロード機能"""
+    def __init__(self):
+        self.repo_id = os.environ.get("HF_REPO_ID", "tomo2chin2/video-storage")
+        self.token = os.environ.get("HF_TOKEN")
+        if not self.token:
+            raise ValueError("HF_TOKEN 環境変数が設定されていません")
+        # ログイン
+        login(token=self.token)
+        self.api = HfApi()
+        logger.info(f"HuggingFace にログイン完了: {self.repo_id}")
+    def upload_video(self, video_path: str, prefix: str = "video") -> str:
+        """
+        動画をHugging Faceデータセットにアップロード
+        Args:
+            video_path: アップロードする動画ファイルのパス
+            prefix: ファイル名のプレフィックス
+        Returns:
+            str: アップロードされた動画のURL
+        """
+        try:
+            # ユニークなファイル名を生成
+            timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
+            unique_id = str(uuid.uuid4())[:8]
+            filename = f"{prefix}_{timestamp}_{unique_id}.mp4"
+            path_in_repo = f"videos/{filename}"
+            logger.info(f"動画アップロード開始: {path_in_repo}")
+            # アップロード実行
+            upload_info = self.api.upload_file(
+                path_or_fileobj=video_path,
+                path_in_repo=path_in_repo,
+                repo_id=self.repo_id,
+                repo_type="dataset"
+            )
+            # URLを構築
+            video_url = f"https://huggingface.co/datasets/{self.repo_id}/resolve/main/{path_in_repo}"
+            logger.info(f"動画アップロード完了: {video_url}")
+            return video_url
+        except Exception as e:
+            logger.error(f"動画アップロードエラー: {e}")
+            raise Exception(f"動画のアップロードに失敗しました: {e}")
+```
+**ポイント:**
+- タイムスタンプ+UUIDでファイル名の一意性を保証
+- `repo_type="dataset"` でデータセットリポジトリを指定
+- URL形式: `https://huggingface.co/datasets/{repo_id}/resolve/main/{path}`
+---
+### フェーズ3: FastAPI実装
+#### ステップ3.1: リクエスト/レスポンスモデル定義
+```python
+from pydantic import BaseModel, HttpUrl
+from typing import Optional
+class PdfToVideoRequest(BaseModel):
+    """PDF→動画変換リクエストモデル"""
+    pdf_url: HttpUrl
+    duration_per_page: int = 5  # デフォルト5秒
+    dpi: int = 150  # デフォルトDPI
+class VideoResponse(BaseModel):
+    """動画生成レスポンスモデル"""
+    status: str
+    video_url: Optional[str] = None
+    message: str
+    total_pages: Optional[int] = None
+    video_duration: Optional[float] = None  # 秒
+```
+#### ステップ3.2: APIエンドポイント実装
+```python
+from fastapi import FastAPI, HTTPException
+from fastapi.middleware.cors import CORSMiddleware
+import logging
+# ロギング設定
+logging.basicConfig(level=logging.INFO)
+logger = logging.getLogger(__name__)
+app = FastAPI(title="PDF to Video API")
+# CORS設定
+app.add_middleware(
+    CORSMiddleware,
+    allow_origins=["*"],
+    allow_credentials=True,
+    allow_methods=["*"],
+    allow_headers=["*"],
+)
+# グローバルなアップローダーインスタンス
+video_uploader = VideoUploader()
+@app.post(
+    "/api/pdf-to-video",
+    response_model=VideoResponse,
+    tags=["Video Generation"],
+    summary="PDFをスライドショー動画に変換",
+    description="指定されたURLからPDFをダウンロードし、各ページを画像化して動画を生成します。"
+)
+async def pdf_to_video(request: PdfToVideoRequest):
+    """PDF→動画変換APIエンドポイント"""
+    pdf_path = None
+    video_path = None
+    try:
+        logger.info(f"API リクエスト受信: {request.pdf_url}")
+        # 1. PDFダウンロード
+        pdf_path = download_pdf_from_url(str(request.pdf_url))
+        # 2. PDF→画像変換
+        images = convert_pdf_to_images(pdf_path, dpi=request.dpi)
+        total_pages = len(images)
+        # 3. 動画生成
+        video_path = create_video_from_images(
+            images,
+            duration_per_page=request.duration_per_page
+        )
+        # 4. Hugging Faceにアップロード
+        video_url = video_uploader.upload_video(video_path, prefix="pdf_video")
+        # 動画の総再生時間を計算
+        video_duration = total_pages * request.duration_per_page
+        logger.info(f"処理完了: {video_url}")
+        return VideoResponse(
+            status="success",
+            video_url=video_url,
+            message="動画の生成とアップロードに成功しました",
+            total_pages=total_pages,
+            video_duration=video_duration
+        )
+    except Exception as e:
+        logger.error(f"エラー発生: {e}", exc_info=True)
+        raise HTTPException(
+            status_code=500,
+            detail=f"動画生成に失敗しました: {str(e)}"
+        )
+    finally:
+        # 一時ファイルのクリーンアップ
+        if pdf_path and os.path.exists(pdf_path):
+            try:
+                os.remove(pdf_path)
+                logger.info(f"一時PDFファイル削除: {pdf_path}")
+            except Exception as e:
+                logger.warning(f"PDFファイル削除エラー: {e}")
+        if video_path and os.path.exists(video_path):
+            try:
+                os.remove(video_path)
+                logger.info(f"一時動画ファイル削除: {video_path}")
+            except Exception as e:
+                logger.warning(f"動画ファイル削除エラー: {e}")
+@app.get("/health")
+async def health_check():
+    """ヘルスチェックエンドポイント"""
+    return {"status": "healthy", "service": "PDF to Video API"}
+```
+---
+### フェーズ4: Gradio UI実装
+```python
+import gradio as gr
+def process_pdf_url(pdf_url, duration_per_page, dpi):
+    """Gradio UIからの処理関数"""
+    try:
+        if not pdf_url:
+            return None, "PDF URLを入力してください", None
+        # 内部的にAPI関数を呼び出し
+        request = PdfToVideoRequest(
+            pdf_url=pdf_url,
+            duration_per_page=duration_per_page,
+            dpi=dpi
+        )
+        # 同期的に処理（Gradioは非同期不要）
+        import asyncio
+        result = asyncio.run(pdf_to_video(request))
+        return (
+            result.video_url,  # ビデオURL
+            f"✅ 成功: {result.total_pages}ページ、{result.video_duration}秒の動画を生成しました",
+            result.video_url  # プレビュー用
+        )
+    except Exception as e:
+        logger.error(f"Gradio処理エラー: {e}")
+        return None, f"❌ エラー: {str(e)}", None
+# Gradio UI定義
+with gr.Blocks(title="PDF to Video Converter", theme=gr.themes.Soft()) as demo:
+    gr.Markdown("# 📄 PDF → 🎬 動画変換")
+    gr.Markdown("PDFのURLを指定すると、各ページをスライドショー動画に変換します。")
+    with gr.Row():
+        with gr.Column(scale=2):
+            pdf_url_input = gr.Textbox(
+                label="PDF URL",
+                placeholder="https://example.com/sample.pdf",
+                info="変換したいPDFファイルのURLを入力してください"
+            )
+            with gr.Row():
+                duration_slider = gr.Slider(
+                    minimum=1,
+                    maximum=10,
+                    step=1,
+                    value=5,
+                    label="1ページあたりの表示秒数"
+                )
+                dpi_slider = gr.Slider(
+                    minimum=72,
+                    maximum=300,
+                    step=1,
+                    value=150,
+                    label="画像解像度（DPI）",
+                    info="高いほど高画質ですが処理時間が増加します"
+                )
+            convert_btn = gr.Button("🎬 動画生成", variant="primary", size="lg")
+        with gr.Column(scale=1):
+            status_output = gr.Textbox(
+                label="ステータス",
+                interactive=False
+            )
+            video_url_output = gr.Textbox(
+                label="動画URL",
+                interactive=False,
+                info="生成された動画のURL"
+            )
+    with gr.Row():
+        video_preview = gr.Video(
+            label="プレビュー",
+            interactive=False
+        )
+    # イベント設定
+    convert_btn.click(
+        fn=process_pdf_url,
+        inputs=[pdf_url_input, duration_slider, dpi_slider],
+        outputs=[video_url_output, status_output, video_preview]
+    )
+    # 使用例
+    gr.Markdown("""
+    ## 📖 使用方法
+    1. PDFのURLを入力
+    2. 1ページあたりの表示秒数を調整（デフォルト5秒）
+    3. 解像度（DPI）を調整（デフォルト150）
+    4. 「動画生成」ボタンをクリック
+    5. 生成された動画URLをコピーして利用
+    ## ⚙️ 環境変数
+    - `HF_TOKEN`: Hugging Face認証トークン（必須）
+    - `HF_REPO_ID`: データセットリポジトリID（例: username/repo-name）
+    ## 🔗 APIエンドポイント
+    - `POST /api/pdf-to-video`: PDF→動画変換API
+    - `GET /health`: ヘルスチェック
+    """)
+# FastAPIにGradioをマウント
+app = gr.mount_gradio_app(app, demo, path="/")
+```
+---
+### フェーズ5: 設定ファイル作成
+#### README.md (Hugging Face Space設定)
+```markdown
+---
+title: PDF to Video Converter
+emoji: 🎬
+colorFrom: blue
+colorTo: purple
+sdk: gradio
+sdk_version: 4.19.2
+app_file: app.py
+pinned: true
+---
+# PDF to Video Converter
+PDFファイルをスライドショー動画に変換するAPIです。
+## 機能
+- PDF URLからのダウンロード
+- 各ページを画像化
+- 1ページ5秒のスライドショー動画生成
+- Hugging Faceデータセットへの自動アップロード
+## API仕様
+- `POST /api/pdf-to-video`
+## 環境変数
+- `HF_TOKEN`: 必須
+- `HF_REPO_ID`: データセットリポジトリID
+```
+---
+## 🚀 デプロイ手順
+### 1. Hugging Face Spaceの作成
+1. https://huggingface.co/new-space にアクセス
+2. Space名を入力（例: `pdf-to-video-converter`）
+3. SDKで「Gradio」を選択
+4. 「Create Space」をクリック
+### 2. ファイルのアップロード
+```bash
+git clone https://huggingface.co/spaces/your-username/pdf-to-video-converter
+cd pdf-to-video-converter
+# ファイルをコピー
+cp majin/v4_spinoff/HUG/app.py .
+cp majin/v4_spinoff/HUG/requirements.txt .
+cp majin/v4_spinoff/HUG/packages.txt .
+cp majin/v4_spinoff/HUG/README.md .
+# コミット&プッシュ
+git add .
+git commit -m "Initial implementation"
+git push
+```
+### 3. 環境変数の設定
+Space設定画面で以下を設定：
+- `HF_TOKEN`: あなたのHugging Face Tokenを設定
+- `HF_REPO_ID`: 動画保存先のデータセットリポジトリID
+### 4. 動作確認
+- Space URLにアクセス
+- サンプルPDF URLで動作テスト
+- APIエンドポイント `/api/pdf-to-video` をテスト
+---
+## 🧪 テスト方法
+### curlでのAPIテスト
+```bash
+curl -X POST "https://your-space-url.hf.space/api/pdf-to-video" \
+  -H "Content-Type: application/json" \
+  -d '{
+    "pdf_url": "https://www.w3.org/WAI/ER/tests/xhtml/testfiles/resources/pdf/dummy.pdf",
+    "duration_per_page": 5,
+    "dpi": 150
+  }'
+```
+### Pythonでのテスト
+```python
+import requests
+response = requests.post(
+    "https://your-space-url.hf.space/api/pdf-to-video",
+    json={
+        "pdf_url": "https://example.com/sample.pdf",
+        "duration_per_page": 5,
+        "dpi": 150
+    }
+)
+print(response.json())
+# {"status": "success", "video_url": "https://...", ...}
+```
+---
+## ⚠️ 注意事項
+1. **PDFサイズ制限**: 大きなPDFは処理に時間がかかります（目安: 10ページ以下を推奨）
+2. **タイムアウト**: Hugging Face Spacesのタイムアウト制限に注意
+3. **ストレージ**: データセットリポジトリの容量制限を確認
+4. **セキュリティ**: PDF URLは信頼できるソースのみを使用
+---
+## 🔧 トラブルシューティング
+### pdf2imageエラー
+- `packages.txt`に`poppler-utils`が含まれているか確認
+### 動画エンコードエラー
+- `packages.txt`に`ffmpeg`が含まれているか確認
+- OpenCVのバージョンを確認
+### アップロードエラー
+- `HF_TOKEN`が正しく設定されているか確認
+- データセットリポジトリが存在するか確認
+- トークンに書き込み権限があるか確認
+---
+## 📚 参考資料
+- [pdf2image Documentation](https://github.com/Belval/pdf2image)
+- [OpenCV Video I/O](https://docs.opencv.org/4.x/dd/d43/tutorial_py_video_display.html)
+- [Hugging Face Hub API](https://huggingface.co/docs/huggingface_hub/guides/upload)
+- [Gradio Documentation](https://www.gradio.app/docs/)
+---
+## 📝 更新履歴
+- 2025-10-07: 初版作成