Spaces:
Sleeping
Sleeping
File size: 7,620 Bytes
5f860f1 | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 | ---
marp: true
theme: default
size: 16:9
paginate: true
header: "DiabetesLLM: Guideline-based Instructable System"
footer: "2025 | University of Tsukuba | Kosuke Shimizu"
style: |
/* 全体のフォントと色設定 */
section {
font-family: 'Helvetica Neue', 'Arial', 'Hiragino Kaku Gothic ProN', 'Meiryo', sans-serif;
color: #333;
padding: 40px 50px;
background-color: #fff;
}
/* 見出しのデザイン */
h1 {
font-size: 2.4em;
color: #003366; /* 濃紺:信頼感 */
margin-bottom: 0.2em;
border-bottom: none;
}
h2 {
font-size: 1.6em;
color: #003366;
border-bottom: 2px solid #003366;
padding-bottom: 10px;
margin-top: 0;
}
h3 {
font-size: 1.2em;
color: #0055aa;
margin-top: 0;
margin-bottom: 10px;
}
/* 強調・テキスト装飾 */
strong { color: #b00020; font-weight: bold; } /* 落ち着いた赤 */
.center { text-align: center; }
.small { font-size: 0.8em; color: #666; }
/* レイアウト用コンテナ(Flexbox) */
.columns {
display: flex;
justify-content: space-between;
align-items: flex-start;
gap: 30px;
}
.col {
flex: 1;
/* 均等配置 */
}
/* ボックスデザイン */
.box {
background-color: #f4f8fb;
border-left: 6px solid #003366;
padding: 15px;
margin-top: 20px;
border-radius: 4px;
box-shadow: 0 2px 5px rgba(0,0,0,0.05);
}
.box-alert {
background-color: #fff5f5;
border-left: 6px solid #c00;
padding: 15px;
border-radius: 4px;
}
/* テーブルの微調整 */
table {
width: 100%;
border-collapse: collapse;
font-size: 0.9em;
}
th {
background-color: #003366;
color: #fff;
font-weight: normal;
}
tr:nth-child(even) { background-color: #f9f9f9; }
/* 数式の余白 */
.math-block {
background: #fff;
padding: 10px;
text-align: center;
margin: 20px 0;
border: 1px solid #eee;
}
---
<div style="display:flex; flex-direction:column; justify-content:center; height:100%; text-align:center;">
# DiabetesLLM
**不確実性推定と階層的検索を用いた**
**ガイドライン準拠型 糖尿病療養指導支援システム**
<br>
**清水 紘輔**
University of Tsukuba | 2025
</div>
---
## 1. 臨床応用における生成AIの「致命的欠陥」
LLMは流暢ですが、医療応用には**構造的な欠陥**があります。
<div class="columns">
<div class="col box-alert">
### ❌ 確率論的オウム返し
LLMは単語を確率的に繋げているだけで、**医学的な真偽(Valid/Invalid)を判定できません**
</div>
<div class="col box-alert">
### ⚠️ ハルシネーション
「もっともらしい嘘」をつく特性は、誤った用量・用法を提示する**具体的危険性**があります
</div>
</div>
<br>
</div>
---
## 2. システム設計:Clinical Reasoningの模倣
医学的な推論をシステムモジュールとして再構成しました
| 医師の思考ステップ | DiabetesLLMのモジュール | 技術的実装 (How) |
| :--- | :--- | :--- |
| **1. トリアージ** | **Safety Filter** | ルールベースによる緊急度判定 |
| **2. 鑑別診断** | **Hierarchical Indexing** | ベクトル検索による「章」の特定 |
| **3. 確信度の確認** | **Uncertainty Est.** | エントロピー計算による閾値判定 |
| **4. 文献参照** | **Retrieval-Augmented Generation** | ガイドライン本文の引用・抽出 |
| **5. インフォーム** | **Generation** | 抽出知識の平易化・要約 |
<div class="center small" style="margin-top:10px;"> 「医学的判断」と「言語表現」を完全に分離するアーキテクチャ
</div>
---
## 3. 技術詳細①:階層的検索 (Hierarchical Retrieval)
単純な検索では文脈を見失います。本システムは**2段階のスコープ**で検索します
<div class="columns">
<div class="col">
### Step 1: Macro Scope
**「どの章の話か?」**
入力ベクトル $\mathbf{q}$ と各章の代表ベクトル $\mathbf{c}_i$ を比較
* 例:「シックデイ」の章を特定
* 効果:無関係な章を**数理的に遮断**
</div>
<div class="col" style="border-left: 1px solid #ccc; padding-left: 20px;">
### Step 2: Micro Scope
**「どの段落か?」**
特定された章の中だけで詳細検索
* 例:インスリン調整の段落を抽出
* 効果:**文脈の取り違えを防止**
</div>
</div>
---
## 4. 技術詳細②:不確実性に基づく「拒否」判断
「分からなくても自信満々に答える」AIを防ぐため、迷いを数値化します。
<div class="math-block">
$$
H(p) = - \sum_{z \in \text{Chapters}} p(z \mid q) \log p(z \mid q)
$$
</div>
<div class="columns">
<div class="col">
✅ <b>複雑性(H(p))が小さい</b><br>
意図が明確(特定章に自信あり)<br>
→<b>回答生成へ</b>
</div>
<div class="col">
🛑 <b>複雑性(H(p))が大きい</b><br>
意図が曖昧(分布が平坦)<br>
→<b>回答拒否・受診勧奨</b>
</div>
</div>
<div class="box" style="margin-top:10px; padding:10px;">
<b>Point:</b> 医療倫理:まずは害をなすなを<b>数理的な閾値処理</b>として実装。
</div>
---
## 5. RAGの役割:記憶ではなく「参照」
LLMには記憶させず、常に外部資料を「参照」させます。
| 比較項目 | 従来のLLM (ChatGPT等) | DiabetesLLM (提案手法)|
| :--- | :--- | :--- |
| **情報源** | 学習済みデータ(ブラックボックス) | **ガイドラインのみ** |
| **出典** | 不明 | **ページ・段落を明示可能** |
| **最新性** | 学習時点まで | **情報差替で即時対応** |
| **制御** | 困難(制御不能な生成) | **容易(参照箇所の限定)** |
---
## 6. 実装フロー:シックデイ時の対応例
**Input:** 「熱があり食欲がない。インスリンは打つべき?」
1. **Safety Check**
「意識レベル」「呼吸苦」等の緊急性がないことを確認
2. **Indexing**
入力ベクトルが「シックデイ」章に近いと判定
3. **Entropy Check**
判定の確信度が高いため、プロセス続行
4. **Retrieval Augmented Generation**
ガイドラインP.xx「シックデイの対応・インスリン調整」を取得
5. **Generation**
---
## 7. 医療安全上の利点 (Traceability)
本システムは、出力結果の監査が可能です
### 根拠の透明性
AIが「なぜその回答をしたか」を、参照したガイドラインのページ番号・段落IDで完全に追跡可能です。
<div class="box">
ニューラルネットワークのブラックボックス性を排し、<b>工学的に管理可能な状態</b>を担保しています。
</div>
---
## 8. 結論と今後の展望
**DiabetesLLM** は、生成AIを「魔法の杖」としてではなく、**「制御可能なモジュール」**として医療システムに組み込みました。
* **Safety First**
エントロピーによる「分からない」の検知。
* **Evidence Based**
RAGによるガイドラインへの完全準拠。
* **Explainability**
階層的検索によるプロセス可視化。
<br>
**Next Step:**
実際の指導場面におけるログデータを用いた、不確実性閾値($\tau$)の臨床的妥当性の検証。
---
<div style="display:flex; justify-content:center; align-items:center; height:100%;">
# ご清聴ありがとうございました
</div> |