Update README.md
Browse files
README.md
CHANGED
|
@@ -1,3 +1,76 @@
|
|
| 1 |
-
|
| 2 |
-
|
| 3 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
# 多言語・簡易多モーダルWeb参照AIエージェント(Hugging Face Spaces対応)
|
| 2 |
+
|
| 3 |
+
## 概要
|
| 4 |
+
|
| 5 |
+
このプロジェクトは、テキスト・画像・動画を入力として受け取り、多言語でのWeb情報検索と要約を並列に行い、指定された言語で結果を統合・出力するAIエージェントです。
|
| 6 |
+
|
| 7 |
+
**Hugging Face Spaces(無料ティア)でのデプロイを想定**して設計されています。
|
| 8 |
+
|
| 9 |
+
---
|
| 10 |
+
|
| 11 |
+
## 主な機能
|
| 12 |
+
|
| 13 |
+
* テキスト、画像、動画のマルチモーダル入力に対応
|
| 14 |
+
* 入力言語の自動検出と処理
|
| 15 |
+
* タスクの自動分解と並列処理(非同期実行)
|
| 16 |
+
* Web検索とページ要約(Serper API + BeautifulSoup)
|
| 17 |
+
* アップロードされた画像・動画のLLMによる簡易分析(GPT-4oなど)
|
| 18 |
+
* 指定言語での統合出力(日本語、英語、スペイン語、フランス語、中国語)
|
| 19 |
+
|
| 20 |
+
---
|
| 21 |
+
|
| 22 |
+
## 使用技術
|
| 23 |
+
|
| 24 |
+
* **フロントエンド/UI**: Gradio
|
| 25 |
+
* **バックエンド**: Python + asyncio + OpenAI API
|
| 26 |
+
* **Web検索**: Serper API([https://serper.dev)](https://serper.dev))
|
| 27 |
+
* **LLM**: GPT-4o(openaiライブラリ経由)
|
| 28 |
+
* **画像処理**: Pillow(軽量な画像サイズ取得など)
|
| 29 |
+
* **動画処理**: MoviePy(キーフレーム抽出)
|
| 30 |
+
|
| 31 |
+
---
|
| 32 |
+
|
| 33 |
+
## インストールと実行方法
|
| 34 |
+
|
| 35 |
+
```bash
|
| 36 |
+
# 依存ライブラリのインストール
|
| 37 |
+
pip install -r requirements.txt
|
| 38 |
+
|
| 39 |
+
# 環境変数の設定(.envファイルまたはシェルで)
|
| 40 |
+
export OPENAI_API_KEY=your_openai_key
|
| 41 |
+
export SERPER_API_KEY=your_serper_key
|
| 42 |
+
|
| 43 |
+
# アプリ起動
|
| 44 |
+
python app.py
|
| 45 |
+
```
|
| 46 |
+
|
| 47 |
+
---
|
| 48 |
+
|
| 49 |
+
## Hugging Face Spacesでの注意点
|
| 50 |
+
|
| 51 |
+
* **無料ティアでは** CPUリソースとディスク容量に制限があります。
|
| 52 |
+
* 画像・動画の処理はアップロードされた小ファイル(短時間の.mp4等)に限定してください。
|
| 53 |
+
* Webからの画像・動画の**ダウンロード・保存は行わず、URLと要約のみ表示**されます。
|
| 54 |
+
* GPT-4oの使用により画像・動画内容の要約は可能ですが、コスト・速度に注意。
|
| 55 |
+
* 外部APIキーは Spaces の Secrets に登録してください(例: `OPENAI_API_KEY`, `SERPER_API_KEY`)。
|
| 56 |
+
|
| 57 |
+
---
|
| 58 |
+
|
| 59 |
+
## 今後の拡張可能性
|
| 60 |
+
|
| 61 |
+
* Gemini API や Claude API 対応
|
| 62 |
+
* 音声抽出および文字起こし対応(短時間動画)
|
| 63 |
+
* 出力形式のカスタマイズ(Markdown, JSONなど)
|
| 64 |
+
|
| 65 |
+
---
|
| 66 |
+
|
| 67 |
+
## 作者
|
| 68 |
+
|
| 69 |
+
tugaa
|
| 70 |
+
|
| 71 |
+
---
|
| 72 |
+
|
| 73 |
+
## ライセンス
|
| 74 |
+
|
| 75 |
+
MIT
|
| 76 |
+
|