Spaces:
Sleeping
Sleeping
| marp: true | |
| theme: default | |
| size: 16:9 | |
| paginate: true | |
| header: "DiabetesLLM: Guideline-based Instructable System" | |
| footer: "2025 | University of Tsukuba | Kosuke Shimizu" | |
| style: | | |
| /* 全体のフォントと色設定 */ | |
| section { | |
| font-family: 'Helvetica Neue', 'Arial', 'Hiragino Kaku Gothic ProN', 'Meiryo', sans-serif; | |
| color: #333; | |
| padding: 40px 50px; | |
| background-color: #fff; | |
| } | |
| /* 見出しのデザイン */ | |
| h1 { | |
| font-size: 2.4em; | |
| color: #003366; /* 濃紺:信頼感 */ | |
| margin-bottom: 0.2em; | |
| border-bottom: none; | |
| } | |
| h2 { | |
| font-size: 1.6em; | |
| color: #003366; | |
| border-bottom: 2px solid #003366; | |
| padding-bottom: 10px; | |
| margin-top: 0; | |
| } | |
| h3 { | |
| font-size: 1.2em; | |
| color: #0055aa; | |
| margin-top: 0; | |
| margin-bottom: 10px; | |
| } | |
| /* 強調・テキスト装飾 */ | |
| strong { color: #b00020; font-weight: bold; } /* 落ち着いた赤 */ | |
| .center { text-align: center; } | |
| .small { font-size: 0.8em; color: #666; } | |
| /* レイアウト用コンテナ(Flexbox) */ | |
| .columns { | |
| display: flex; | |
| justify-content: space-between; | |
| align-items: flex-start; | |
| gap: 30px; | |
| } | |
| .col { | |
| flex: 1; | |
| /* 均等配置 */ | |
| } | |
| /* ボックスデザイン */ | |
| .box { | |
| background-color: #f4f8fb; | |
| border-left: 6px solid #003366; | |
| padding: 15px; | |
| margin-top: 20px; | |
| border-radius: 4px; | |
| box-shadow: 0 2px 5px rgba(0,0,0,0.05); | |
| } | |
| .box-alert { | |
| background-color: #fff5f5; | |
| border-left: 6px solid #c00; | |
| padding: 15px; | |
| border-radius: 4px; | |
| } | |
| /* テーブルの微調整 */ | |
| table { | |
| width: 100%; | |
| border-collapse: collapse; | |
| font-size: 0.9em; | |
| } | |
| th { | |
| background-color: #003366; | |
| color: #fff; | |
| font-weight: normal; | |
| } | |
| tr:nth-child(even) { background-color: #f9f9f9; } | |
| /* 数式の余白 */ | |
| .math-block { | |
| background: #fff; | |
| padding: 10px; | |
| text-align: center; | |
| margin: 20px 0; | |
| border: 1px solid #eee; | |
| } | |
| <div style="display:flex; flex-direction:column; justify-content:center; height:100%; text-align:center;"> | |
| # DiabetesLLM | |
| **不確実性推定と階層的検索を用いた** | |
| **ガイドライン準拠型 糖尿病療養指導支援システム** | |
| <br> | |
| **清水 紘輔** | |
| University of Tsukuba | 2025 | |
| </div> | |
| --- | |
| ## 1. 臨床応用における生成AIの「致命的欠陥」 | |
| LLMは流暢ですが、医療応用には**構造的な欠陥**があります。 | |
| <div class="columns"> | |
| <div class="col box-alert"> | |
| ### ❌ 確率論的オウム返し | |
| LLMは単語を確率的に繋げているだけで、**医学的な真偽(Valid/Invalid)を判定できません** | |
| </div> | |
| <div class="col box-alert"> | |
| ### ⚠️ ハルシネーション | |
| 「もっともらしい嘘」をつく特性は、誤った用量・用法を提示する**具体的危険性**があります | |
| </div> | |
| </div> | |
| <br> | |
| </div> | |
| --- | |
| ## 2. システム設計:Clinical Reasoningの模倣 | |
| 医学的な推論をシステムモジュールとして再構成しました | |
| | 医師の思考ステップ | DiabetesLLMのモジュール | 技術的実装 (How) | | |
| | :--- | :--- | :--- | | |
| | **1. トリアージ** | **Safety Filter** | ルールベースによる緊急度判定 | | |
| | **2. 鑑別診断** | **Hierarchical Indexing** | ベクトル検索による「章」の特定 | | |
| | **3. 確信度の確認** | **Uncertainty Est.** | エントロピー計算による閾値判定 | | |
| | **4. 文献参照** | **Retrieval-Augmented Generation** | ガイドライン本文の引用・抽出 | | |
| | **5. インフォーム** | **Generation** | 抽出知識の平易化・要約 | | |
| <div class="center small" style="margin-top:10px;"> 「医学的判断」と「言語表現」を完全に分離するアーキテクチャ | |
| </div> | |
| --- | |
| ## 3. 技術詳細①:階層的検索 (Hierarchical Retrieval) | |
| 単純な検索では文脈を見失います。本システムは**2段階のスコープ**で検索します | |
| <div class="columns"> | |
| <div class="col"> | |
| ### Step 1: Macro Scope | |
| **「どの章の話か?」** | |
| 入力ベクトル $\mathbf{q}$ と各章の代表ベクトル $\mathbf{c}_i$ を比較 | |
| * 例:「シックデイ」の章を特定 | |
| * 効果:無関係な章を**数理的に遮断** | |
| </div> | |
| <div class="col" style="border-left: 1px solid #ccc; padding-left: 20px;"> | |
| ### Step 2: Micro Scope | |
| **「どの段落か?」** | |
| 特定された章の中だけで詳細検索 | |
| * 例:インスリン調整の段落を抽出 | |
| * 効果:**文脈の取り違えを防止** | |
| </div> | |
| </div> | |
| --- | |
| ## 4. 技術詳細②:不確実性に基づく「拒否」判断 | |
| 「分からなくても自信満々に答える」AIを防ぐため、迷いを数値化します。 | |
| <div class="math-block"> | |
| $$ | |
| H(p) = - \sum_{z \in \text{Chapters}} p(z \mid q) \log p(z \mid q) | |
| $$ | |
| </div> | |
| <div class="columns"> | |
| <div class="col"> | |
| ✅ <b>複雑性(H(p))が小さい</b><br> | |
| 意図が明確(特定章に自信あり)<br> | |
| →<b>回答生成へ</b> | |
| </div> | |
| <div class="col"> | |
| 🛑 <b>複雑性(H(p))が大きい</b><br> | |
| 意図が曖昧(分布が平坦)<br> | |
| →<b>回答拒否・受診勧奨</b> | |
| </div> | |
| </div> | |
| <div class="box" style="margin-top:10px; padding:10px;"> | |
| <b>Point:</b> 医療倫理:まずは害をなすなを<b>数理的な閾値処理</b>として実装。 | |
| </div> | |
| --- | |
| ## 5. RAGの役割:記憶ではなく「参照」 | |
| LLMには記憶させず、常に外部資料を「参照」させます。 | |
| | 比較項目 | 従来のLLM (ChatGPT等) | DiabetesLLM (提案手法)| | |
| | :--- | :--- | :--- | | |
| | **情報源** | 学習済みデータ(ブラックボックス) | **ガイドラインのみ** | | |
| | **出典** | 不明 | **ページ・段落を明示可能** | | |
| | **最新性** | 学習時点まで | **情報差替で即時対応** | | |
| | **制御** | 困難(制御不能な生成) | **容易(参照箇所の限定)** | | |
| --- | |
| ## 6. 実装フロー:シックデイ時の対応例 | |
| **Input:** 「熱があり食欲がない。インスリンは打つべき?」 | |
| 1. **Safety Check** | |
| 「意識レベル」「呼吸苦」等の緊急性がないことを確認 | |
| 2. **Indexing** | |
| 入力ベクトルが「シックデイ」章に近いと判定 | |
| 3. **Entropy Check** | |
| 判定の確信度が高いため、プロセス続行 | |
| 4. **Retrieval Augmented Generation** | |
| ガイドラインP.xx「シックデイの対応・インスリン調整」を取得 | |
| 5. **Generation** | |
| --- | |
| ## 7. 医療安全上の利点 (Traceability) | |
| 本システムは、出力結果の監査が可能です | |
| ### 根拠の透明性 | |
| AIが「なぜその回答をしたか」を、参照したガイドラインのページ番号・段落IDで完全に追跡可能です。 | |
| <div class="box"> | |
| ニューラルネットワークのブラックボックス性を排し、<b>工学的に管理可能な状態</b>を担保しています。 | |
| </div> | |
| --- | |
| ## 8. 結論と今後の展望 | |
| **DiabetesLLM** は、生成AIを「魔法の杖」としてではなく、**「制御可能なモジュール」**として医療システムに組み込みました。 | |
| * **Safety First** | |
| エントロピーによる「分からない」の検知。 | |
| * **Evidence Based** | |
| RAGによるガイドラインへの完全準拠。 | |
| * **Explainability** | |
| 階層的検索によるプロセス可視化。 | |
| <br> | |
| **Next Step:** | |
| 実際の指導場面におけるログデータを用いた、不確実性閾値($\tau$)の臨床的妥当性の検証。 | |
| --- | |
| <div style="display:flex; justify-content:center; align-items:center; height:100%;"> | |
| # ご清聴ありがとうございました | |
| </div> |