| # AI投資インサイト・アナライザー (AII_HFace) プロジェクト仕様書 (改訂版) | |
| ## 1. プロジェクト概要 | |
| 「AI投資インサイト・アナライザー」は、Web上の経済・金融ニュースを幅広く自動収集し、Googleの最新AIモデル「Gemini 2.5 Flash」を活用して、投資家視点での多角的な分析とスコアリングを提供するWebアプリケーションです。 | |
| Hugging Face Spacesでの運用を前提とし、環境構築不要で誰でも利用可能な「手軽さ」と、プロのアナリスト並みの「深い洞察」の両立を目指します。 | |
| ## 2. 主な機能 | |
| ### 2.1 ニュース収集 (News Collector) | |
| 複数の主要経済メディアおよびアグリゲーターからRSSフィード経由で最新ニュースを取得します。 | |
| * **収集ソース**: | |
| * NHKビジネス | |
| * ITmedia ビジネスオンライン | |
| * Yahoo!ニュース (経済) | |
| * 朝日新聞 (経済) | |
| * 東洋経済オンライン | |
| * ダイヤモンド・オンライン | |
| * CoinDesk Japan (暗号資産) | |
| * はてなブックマーク (経済・金融カテゴリ) | |
| * **注目度フィルタリング**: | |
| * はてなブックマークAPIを利用して各記事のブックマーク数を取得。 | |
| * ブックマーク数(世間の注目度)順に記事をソートし、ノイズを低減します。 | |
| * **重複排除**: | |
| * 記事タイトルの類似度判定(Jaccard係数等)を行い、同一トピックの重複記事を自動的に除外します。 | |
| ### 2.2 AI選別・分析 (AI Analyst) | |
| 収集したニュースの中から、AIがさらに「投資価値」の高い記事を厳選し、詳細分析を行います。 | |
| * **AIモデル**: Google Gemini 2.5 Flash | |
| * **AI選別 (Curator)**: | |
| * 注目度上位の記事(最大40件程度)から、AIが「意外性」「市場インパクト」「情報の深さ」を基準に**トップ5件**を選抜。 | |
| * 単純なアクセス数だけでなく、質的な価値判断を加えることで情報の粒度を高めます。 | |
| * **詳細分析・スコアリング**: | |
| * 選抜された記事に対して以下の項目を分析・出力します。 | |
| * **歴史的類似性**: 過去の類似相場や事例と、その後の株価推移の提示。 | |
| * **弱気視点/リスク**: 好材料に見えるニュースでも警戒すべき落とし穴やリスク要因。 | |
| * **影響セクター**: 具体的に恩恵(メリット)または打撃(デメリット)を受ける業界・企業名。 | |
| * **市場影響度スコア**: -10(歴史的暴落)〜 +10(歴史的高騰)の21段階評価(0は中立)。 | |
| ### 2.3 ユーザーインターフェース (Web UI) | |
| * **フレームワーク**: Gradio (Python) | |
| * **機能**: | |
| * **APIキー設定**: サイドバーにてユーザー自身のGemini APIキーを入力(セキュアな設計)。 | |
| * **リアルタイムログ**: ニュース取得、選別、解析の各ステップの進捗をコンソール風に表示。 | |
| * **レポート表示**: 解析完了後、スコアアイコン(📈/📉)付きで見やすいレポートカードを表示。 | |
| ## 3. 技術スタック | |
| | カテゴリ | 技術・ライブラリ | 備考 | | |
| | :--- | :--- | :--- | | |
| | **言語** | Python 3.10+ | | | |
| | **UI** | Gradio | シンプルかつインタラクティブなUI構築 | | |
| | **AIモデル** | Google Gemini 2.5 Flash | `google-genai` SDKを使用 | | |
| | **データ収集** | `feedparser`, `requests` | RSS解析、HTTP通信 | | |
| | **テキスト処理** | `re` (正規表現) | HTMLタグ除去、タイトル正規化 | | |
| | **ホスティング** | Hugging Face Spaces | Docker / CPU Basic | | |
| ## 4. 処理フロー (Data Pipeline) | |
| 1. **Fetch**: 指定されたRSSソースから記事・タイトル・リンクを一括取得。 | |
| 2. **Deduplicate**: タイトル類似度による重複記事の削除。 | |
| 3. **Sort**: はてなブックマーク数に基づく降順ソート(注目度順)。 | |
| 4. **Select (AI)**: 上位記事の概要をGeminiに渡し、投資価値の高い5件を選定(Batch Processing)。 | |
| 5. **Analyze (AI)**: 選定された各記事について詳細なインサイトと思考プロセスを生成。 | |
| 6. **Display**: UI上に解析結果とスコアをレンダリング。 | |
| ## 5. 今後の拡張予定 | |
| * **マルチモーダル対応**: ニュース画像の解析(チャート画像の認識など)。 | |
| * **通知機能**: 特に重要なニュース(スコア±8以上など)の検知時にアラートを表示。 | |
| * **ソース拡充**: 海外ニュースソース(Bloomberg, Reutersなど)の追加検討。 | |