Spaces:

MedSwin
/

Introduction

Sleeping

App Files Files Community

Lê Đăng Khoa (Liam) commited on Jan 22

Commit

8e6de34

verified ·

1 Parent(s): 16c50b5

Update index.html

Browse files

Files changed (1) hide show

index.html +173 -389

index.html CHANGED Viewed

@@ -3,7 +3,7 @@
 <head>
   <meta charset="UTF-8" />
   <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-  <title>MedSwin — Multi-Agent Biomedical LLM + Retrieval for EMR & Guidelines</title>
   <meta name="description" content="MedSwin: evidence-constrained, auditable multi-agent clinical QA with two-stage biomedical retrieval, calibrated reranking, and distilled 7B medical LLM for deployable decision support." />
   <link rel="icon" href="assets/logo.svg">
@@ -434,59 +434,57 @@
     </section>
     <!-- Overview -->
-    <section id="overview" class="section">
-      <div class="container">
-        <div class="flex flex-col lg:flex-row lg:items-end lg:justify-between gap-6 mb-10" data-aos="fade-up">
-          <div>
-            <h2 class="text-3xl lg:text-4xl font-extrabold tracking-tight">Overview</h2>
-            <p class="mt-3 text-slate-300 max-w-3xl">
-              MedSwin treats clinical QA as an <span class="text-slate-100 font-semibold">evidence-constrained pipeline</span>, producing:
-              an answer, a compact evidence bundle under a context budget, and a structured trace for audit and safety review.
-            </p>
-          </div>
-          <div class="flex flex-wrap gap-2">
-            <span class="badge"><i data-lucide="clipboard-list" class="icon"></i> Answer</span>
-            <span class="badge"><i data-lucide="files" class="icon"></i> Evidence bundle</span>
-            <span class="badge"><i data-lucide="route" class="icon"></i> Trace</span>
-          </div>
-        </div>
-        <div class="grid md:grid-cols-3 gap-6">
-          <div class="card glass" data-aos="zoom-in-up">
-            <div class="card-body">
-              <div class="flex items-center gap-2 font-extrabold text-lg"><i data-lucide="users" class="icon"></i> Specialised Agents</div>
-              <p class="mt-3 text-slate-300">
-                A role-based team exchanges typed artifacts:
-                Query Normaliser, Evidence Retriever, EMR Summariser, Guideline Synthesiser, and Safety Critic.
               </p>
-              <div class="mt-4 text-xs text-slate-400">Outcome: modularity + clear responsibility boundaries.</div>
             </div>
-          </div>
-          <div class="card glass" data-aos="zoom-in-up" data-aos-delay="100">
-            <div class="card-body">
-              <div class="flex items-center gap-2 font-extrabold text-lg"><i data-lucide="search-check" class="icon"></i> Two-Stage Retrieval</div>
-              <p class="mt-3 text-slate-300">
-                Hybrid dense+lexical candidate generation, then long-context biomedical reranking with calibrated scores for
-                deterministic evidence inclusion policies.
               </p>
-              <div class="mt-4 text-xs text-slate-400">Outcome: fewer critical omissions under token budget.</div>
             </div>
-          </div>
-          <div class="card glass" data-aos="zoom-in-up" data-aos-delay="200">
-            <div class="card-body">
-              <div class="flex items-center gap-2 font-extrabold text-lg"><i data-lucide="cpu" class="icon"></i> Deployable 7B LLM</div>
-              <p class="mt-3 text-slate-300">
-                A compact medical model is trained with large-scale augmentation (SFT) then refined via hard/soft-label KD from
-                a larger instructor, enabling institution-controlled deployment.
               </p>
-              <div class="mt-4 text-xs text-slate-400">Outcome: practical inference without sacrificing alignment.</div>
             </div>
           </div>
         </div>
       </div>
-    </section>
     <!-- Contributions -->
     <section id="contributions" class="section">
@@ -865,374 +863,160 @@ sequenceDiagram
     </section>
     <!-- Retrieval -->
-    <section id="retrieval" class="section">
-      <div class="container">
-        <div class="flex flex-col lg:flex-row lg:items-end lg:justify-between gap-6 mb-10" data-aos="fade-up">
-          <div>
-            <h2 class="text-3xl lg:text-4xl font-extrabold tracking-tight">Two-Stage Retrieval & Calibrated Reranking</h2>
-            <p class="mt-3 text-slate-300 max-w-3xl">
-              MedSwin selects a compact, diverse evidence set under budget using hybrid retrieval, a long-context biomedical reranker,
-              and policy-aware selection with sufficiency constraints.
-            </p>
-          </div>
-          <div class="flex flex-wrap gap-2">
-            <span class="badge"><i data-lucide="database" class="icon"></i> Dense + BM25</span>
-            <span class="badge"><i data-lucide="badge-check" class="icon"></i> Calibrated p</span>
-            <span class="badge"><i data-lucide="layers" class="icon"></i> MMR diversity</span>
-          </div>
-        </div>
-        <div class="grid lg:grid-cols-2 gap-6">
-          <!-- Accordion: stage 1/2/policy -->
-          <div class="card glass" data-aos="fade-up">
-            <div class="card-body">
-              <h3 class="text-xl font-extrabold tracking-tight">Pipeline (click to expand)</h3>
-              <div class="mt-5 space-y-3">
-                <div class="accordion-item rounded-2xl border border-white/10 bg-slate-950/40 p-4">
-                  <button class="accordion-btn font-extrabold" type="button">
-                    <span class="inline-flex items-center gap-2"><i data-lucide="scan-search" class="icon"></i> Stage 1 — Candidate generation</span>
-                    <i data-lucide="chevron-down" class="icon"></i>
-                  </button>
-                  <div class="accordion-panel">
-                    <p class="mt-3 text-sm text-slate-300">
-                      Retrieve top-K dense candidates using ANN over biomedical embeddings, then union with BM25 results to handle rare terms and abbreviations.
-                    </p>
-                    <div class="codeblock mt-3">
-                      <button class="copy-btn" data-copy="#codeStage1"><i data-lucide="copy" class="icon"></i> Copy</button>
-                      <pre id="codeStage1"><code>// Candidate pool
-C(q) = TopK'( Cdense(q) ∪ Clex(q) )
-K' ≥ K</code></pre>
-                    </div>
-                  </div>
-                </div>
-                <div class="accordion-item rounded-2xl border border-white/10 bg-slate-950/40 p-4">
-                  <button class="accordion-btn font-extrabold" type="button">
-                    <span class="inline-flex items-center gap-2"><i data-lucide="badge-check" class="icon"></i> Stage 2 — Long-context reranking</span>
-                    <i data-lucide="chevron-down" class="icon"></i>
-                  </button>
-                  <div class="accordion-panel">
-                    <p class="mt-3 text-sm text-slate-300">
-                      A pointwise LLM reranker scores each (query, passage) pair and provides a calibrated probability used by downstream policy checks.
-                    </p>
-                    <div class="codeblock mt-3">
-                      <button class="copy-btn" data-copy="#codeCalib"><i data-lucide="copy" class="icon"></i> Copy</button>
-                      <pre id="codeCalib"><code>// Calibrated probability (Platt / temperature scaling)
-p_cal(q,d) = σ( (ℓ(q,d) − b) / T )</code></pre>
-                    </div>
-                  </div>
-                </div>
-                <div class="accordion-item rounded-2xl border border-white/10 bg-slate-950/40 p-4">
-                  <button class="accordion-btn font-extrabold" type="button">
-                    <span class="inline-flex items-center gap-2"><i data-lucide="sliders" class="icon"></i> Policy-aware selection (budget + sufficiency)</span>
-                    <i data-lucide="chevron-down" class="icon"></i>
-                  </button>
-                  <div class="accordion-panel">
-                    <p class="mt-3 text-sm text-slate-300">
-                      Fuse calibrated reranker probability with dense/lexical signals and lightweight clinical priors, then select a diverse set under budget.
-                      Accept only if EMR and CPG sufficiency targets are met; otherwise trigger “retrieve-more.”
-                    </p>
-                    <div class="mt-3 rounded-2xl border border-white/10 bg-slate-950/40 p-4 text-sm text-slate-200">
-                      <div class="font-extrabold mb-2">Fusion score (illustrative)</div>
-                      <div class="math">
-                        \( S(q,d)= \alpha p_{cal} + \beta \tilde{s}_{emb} + \gamma \tilde{s}_{lex} + \rho f_{recency} + \eta f_{section} + \zeta f_{source} \)
-                      </div>
-                      <div class="text-xs text-slate-400 mt-2">Rendered with KaTeX · weights are interpretable and non-negative.</div>
-                    </div>
-                  </div>
-                </div>
               </div>
-            </div>
-          </div>
-          <!-- Visual: selection checklist -->
-          <div class="card glass" data-aos="fade-up" data-aos-delay="120">
-            <div class="card-body">
-              <h3 class="text-xl font-extrabold tracking-tight">What “evidence sufficiency” means in practice</h3>
-              <p class="mt-3 text-slate-300">
-                The orchestrator treats sufficiency as a gate: if the selected bundle lacks required guideline and EMR coverage above calibrated thresholds, it will not synthesise a confident answer.
               </p>
-              <div class="mt-5 grid gap-3">
-                <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
-                  <div class="flex items-center justify-between">
-                    <div class="font-extrabold inline-flex items-center gap-2"><i data-lucide="book-open-check" class="icon"></i> CPG coverage</div>
-                    <span class="badge"><i data-lucide="check" class="icon"></i> required</span>
-                  </div>
-                  <p class="text-sm text-slate-300 mt-2">Ensure key recommendations & contraindications are present (not just background text).</p>
-                </div>
-                <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
-                  <div class="flex items-center justify-between">
-                    <div class="font-extrabold inline-flex items-center gap-2"><i data-lucide="file-heart" class="icon"></i> EMR coverage</div>
-                    <span class="badge"><i data-lucide="check" class="icon"></i> required</span>
-                  </div>
-                  <p class="text-sm text-slate-300 mt-2">Include patient-specific meds/labs/history signals needed to avoid unsafe generalisations.</p>
-                </div>
-                <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
-                  <div class="flex items-center justify-between">
-                    <div class="font-extrabold inline-flex items-center gap-2"><i data-lucide="layers" class="icon"></i> Diversity under budget</div>
-                    <span class="badge"><i data-lucide="check" class="icon"></i> recommended</span>
-                  </div>
-                  <p class="text-sm text-slate-300 mt-2">Use MMR-style selection to avoid redundant passages and preserve coverage breadth.</p>
-                </div>
-                <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
-                  <div class="flex items-center justify-between">
-                    <div class="font-extrabold inline-flex items-center gap-2"><i data-lucide="shield-alert" class="icon"></i> Safety critique</div>
-                    <span class="badge"><i data-lucide="check" class="icon"></i> required</span>
-                  </div>
-                  <p class="text-sm text-slate-300 mt-2">Detect missing evidence, conflicts, or contraindication risks; request retrieve-more if needed.</p>
-                </div>
-              </div>
-              <div class="mt-5 rounded-2xl border border-white/10 bg-slate-950/40 p-4">
-                <div class="flex items-center gap-2 font-extrabold"><i data-lucide="terminal" class="icon"></i> Example trace fields</div>
-                <p class="text-sm text-slate-300 mt-2">doc_id · guideline_version · section_tags · chunk_offsets · scores · thresholds · tool_calls</p>
-              </div>
             </div>
-          </div>
-        </div>
-      </div>
-    </section>
-    <!-- Training -->
-    <section id="training" class="section">
-      <div class="container">
-        <div class="flex flex-col lg:flex-row lg:items-end lg:justify-between gap-6 mb-10" data-aos="fade-up">
-          <div>
-            <h2 class="text-3xl lg:text-4xl font-extrabold tracking-tight">Data, Training & Distillation</h2>
-            <p class="mt-3 text-slate-300 max-w-3xl">
-              MedSwin’s deployable 7B model is produced via SFT on augmented biomedical QA, then KD (hard + soft labels) from a larger instructor,
-              using PEFT techniques to fit modest GPU footprints.
-            </p>
-          </div>
-          <div class="flex flex-wrap gap-2">
-            <span class="badge"><i data-lucide="wand-2" class="icon"></i> SFT</span>
-            <span class="badge"><i data-lucide="git-merge" class="icon"></i> KD</span>
-            <span class="badge"><i data-lucide="bolt" class="icon"></i> QLoRA/LoRA</span>
-          </div>
-        </div>
-        <div class="grid lg:grid-cols-2 gap-6">
-          <!-- Timeline / stepper -->
-          <div class="card glass" data-aos="fade-up">
-            <div class="card-body">
-              <h3 class="text-xl font-extrabold tracking-tight">Pipeline Timeline</h3>
-              <p class="mt-2 text-slate-300">A readable progression from data → model → deployable checkpoints.</p>
-              <div class="mt-6 space-y-3">
-                <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
-                  <div class="flex items-center gap-3">
-                    <span class="badge">A</span>
-                    <div class="font-extrabold">Augmentation & QA gates</div>
-                  </div>
-                  <p class="text-sm text-slate-300 mt-2">
-                    Paraphrasing + multi-variant formatting, back-translation, style standardisation, PHI scrubbing, deduplication,
-                    and medical consistency checks to prevent semantic drift.
-                  </p>
-                </div>
-                <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
-                  <div class="flex items-center gap-3">
-                    <span class="badge">B</span>
-                    <div class="font-extrabold">SFT (instruction alignment)</div>
-                  </div>
-                  <p class="text-sm text-slate-300 mt-2">
-                    Student learns consistent instruction following and robust clinical writing styles from mixed supervision sources.
-                  </p>
-                </div>
-                <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
-                  <div class="flex items-center gap-3">
-                    <span class="badge">C</span>
-                    <div class="font-extrabold">Knowledge Distillation (KD)</div>
-                  </div>
-                  <p class="text-sm text-slate-300 mt-2">
-                    Hard labels expand coverage; soft labels preserve calibration/uncertainty. Training uses a combined CE + KL objective at temperature τ.
-                  </p>
-                </div>
-                <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
-                  <div class="flex items-center gap-3">
-                    <span class="badge">D</span>
-                    <div class="font-extrabold">Model Merging</div>
-                  </div>
-                  <p class="text-sm text-slate-300 mt-2">
-                    Weight-space merging can combine SFT robustness and KD teacher-aligned behaviour without extra full training passes.
-                  </p>
-                </div>
               </div>
             </div>
-          </div>
-          <!-- Tabs: SFT / KD / Reranker training -->
-          <div class="card glass" data-aos="fade-up" data-aos-delay="120">
-            <div class="card-body">
-              <div class="flex items-center justify-between gap-4">
-                <h3 class="text-xl font-extrabold tracking-tight">Training Modules</h3>
-                <span class="text-xs text-slate-400">Click tabs</span>
-              </div>
-              <div class="mt-5 flex flex-wrap gap-2" role="tablist" aria-label="Training tabs">
-                <button class="tab active" data-tab="train-sft" role="tab" aria-selected="true">SFT</button>
-                <button class="tab" data-tab="train-kd" role="tab" aria-selected="false">KD</button>
-                <button class="tab" data-tab="train-rer" role="tab" aria-selected="false">Reranker</button>
-              </div>
-              <div class="mt-5">
-                <div id="train-sft" class="tabpanel">
-                  <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
-                    <div class="flex items-center gap-2 font-extrabold"><i data-lucide="wand-2" class="icon"></i> Supervised Fine-Tuning</div>
-                    <p class="text-sm text-slate-300 mt-2">
-                      Optimises token-level cross-entropy over instruction-formatted examples; stratified mixing reduces overfitting to any single genre.
-                    </p>
-                    <div class="mt-3 text-xs text-slate-400">
-                      Focus: instruction following, neutral clinical tone, and robust completion behaviour.
-                    </div>
-                  </div>
-                </div>
-                <div id="train-kd" class="tabpanel hidden">
-                  <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
-                    <div class="flex items-center gap-2 font-extrabold"><i data-lucide="git-merge" class="icon"></i> Knowledge Distillation</div>
-                    <p class="text-sm text-slate-300 mt-2">
-                      Combines hard labels (teacher completions) and soft labels (teacher token distributions) to transfer calibrated reasoning.
-                    </p>
-                    <div class="codeblock mt-3">
-                      <button class="copy-btn" data-copy="#codeKD"><i data-lucide="copy" class="icon"></i> Copy</button>
-                      <pre id="codeKD"><code>// Per-step objective (illustrative)
-L_t = α * CE(y_t) + (1-α) * τ^2 * KL( p_T(·|τ) || p_S(·) )</code></pre>
-                    </div>
-                    <div class="mt-3 text-xs text-slate-400">
-                      Storage efficiency: top-k teacher log-probs per step (renormalised) keeps KD tractable.
-                    </div>
-                  </div>
-                </div>
-                <div id="train-rer" class="tabpanel hidden">
-                  <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
-                    <div class="flex items-center gap-2 font-extrabold"><i data-lucide="badge-check" class="icon"></i> Biomedical Reranker</div>
-                    <p class="text-sm text-slate-300 mt-2">
-                      LoRA-adapts a long-context pointwise LLM reranker for biomedical relevance scoring. Calibration enables threshold-based policy use.
-                    </p>
-                    <ul class="mt-3 space-y-2 text-sm text-slate-300">
-                      <li class="flex gap-2"><i data-lucide="dot" class="icon"></i> Long passages (guidelines / multi-paragraph evidence)</li>
-                      <li class="flex gap-2"><i data-lucide="dot" class="icon"></i> Calibrated probabilities for inclusion thresholds</li>
-                      <li class="flex gap-2"><i data-lucide="dot" class="icon"></i> PEFT-friendly for site-specific constraints</li>
-                    </ul>
-                  </div>
-                </div>
-              </div>
-              <div class="mt-5 flex flex-wrap gap-2">
-                <a class="chip" target="_blank" rel="noopener noreferrer" href="https://huggingface.co/collections/MedSwin/finetuning">
-                  <i data-lucide="wand-2" class="icon"></i> Fine-tune Collection
-                </a>
-                <a class="chip" target="_blank" rel="noopener noreferrer" href="https://huggingface.co/collections/MedSwin/rag">
-                  <i data-lucide="database" class="icon"></i> RAG Collection
-                </a>
-                <a class="chip" target="_blank" rel="noopener noreferrer" href="https://huggingface.co/spaces/MedSwin/Augmentation">
-                  <i data-lucide="filter" class="icon"></i> Ingestion Pipeline
-                </a>
               </div>
             </div>
           </div>
         </div>
       </div>
-    </section>
-    <!-- Evaluation -->
-    <section id="evaluation" class="section">
-      <div class="container">
-        <div class="flex flex-col lg:flex-row lg:items-end lg:justify-between gap-6 mb-10" data-aos="fade-up">
-          <div>
-            <h2 class="text-3xl lg:text-4xl font-extrabold tracking-tight">Evaluation & Safety</h2>
-            <p class="mt-3 text-slate-300 max-w-3xl">
-              MedSwin evaluates beyond generic RAG metrics by emphasising retrieval quality, guideline coverage, and answer faithfulness—plus runtime guardrails.
-            </p>
-          </div>
-          <div class="flex flex-wrap gap-2">
-            <span class="badge"><i data-lucide="clipboard-check" class="icon"></i> Faithfulness</span>
-            <span class="badge"><i data-lucide="book-open-check" class="icon"></i> Guideline coverage</span>
-            <span class="badge"><i data-lucide="shield-check" class="icon"></i> Guardrails</span>
-          </div>
-        </div>
-        <!-- Counters -->
-        <div class="grid md:grid-cols-3 gap-6">
-          <div class="card glass" data-aos="fade-up">
-            <div class="card-body text-center">
-              <div class="text-4xl font-extrabold tracking-tight metric-value" data-count="500000">0</div>
-              <div class="text-sm text-slate-400 mt-1">Augmented supervision scale (illustrative)</div>
             </div>
-          </div>
-          <div class="card glass" data-aos="fade-up" data-aos-delay="120">
-            <div class="card-body text-center">
-              <div class="text-4xl font-extrabold tracking-tight metric-value" data-count="5">0</div>
-              <div class="text-sm text-slate-400 mt-1">Core agents in audit loop</div>
             </div>
-          </div>
-          <div class="card glass" data-aos="fade-up" data-aos-delay="240">
-            <div class="card-body text-center">
-              <div class="text-4xl font-extrabold tracking-tight metric-value" data-count="2">0</div>
-              <div class="text-sm text-slate-400 mt-1">End-to-end benchmark families</div>
             </div>
           </div>
         </div>
-        <div class="mt-8 grid lg:grid-cols-2 gap-6">
-          <div class="card glass" data-aos="fade-up">
-            <div class="card-body">
-              <h3 class="text-xl font-extrabold tracking-tight">What’s measured</h3>
-              <div class="mt-4 space-y-3">
-                <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
-                  <div class="font-extrabold inline-flex items-center gap-2"><i data-lucide="search" class="icon"></i> Retrieval quality</div>
-                  <p class="text-sm text-slate-300 mt-2">How well the evidence bundle matches the clinical information need under budget.</p>
-                </div>
-                <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
-                  <div class="font-extrabold inline-flex items-center gap-2"><i data-lucide="book-open" class="icon"></i> Guideline coverage</div>
-                  <p class="text-sm text-slate-300 mt-2">Presence of actionable recommendations + contraindications, not just generic background.</p>
-                </div>
-                <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
-                  <div class="font-extrabold inline-flex items-center gap-2"><i data-lucide="check-check" class="icon"></i> Answer faithfulness</div>
-                  <p class="text-sm text-slate-300 mt-2">Does the final answer stay grounded in retrieved evidence and cite what it used?</p>
-                </div>
               </div>
             </div>
-          </div>
-          <div class="card glass" data-aos="fade-up" data-aos-delay="120">
-            <div class="card-body">
-              <h3 class="text-xl font-extrabold tracking-tight">Runtime guards</h3>
-              <p class="mt-2 text-slate-300">
-                At inference time, MedSwin prioritises safety and transparency: when evidence is weak or incomplete, it avoids confident recommendations.
               </p>
-              <div class="mt-4 grid gap-3">
-                <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
-                  <div class="font-extrabold inline-flex items-center gap-2"><i data-lucide="help-circle" class="icon"></i> Clarify vs answer</div>
-                  <p class="text-sm text-slate-300 mt-2">If sufficiency fails, the system requests missing context or expands retrieval.</p>
-                </div>
-                <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
-                  <div class="font-extrabold inline-flex items-center gap-2"><i data-lucide="quote" class="icon"></i> Citation-required output</div>
-                  <p class="text-sm text-slate-300 mt-2">Answers are paired with evidence references and trace-friendly provenance fields.</p>
-                </div>
-                <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
-                  <div class="font-extrabold inline-flex items-center gap-2"><i data-lucide="shield-alert" class="icon"></i> Safety critique stage</div>
-                  <p class="text-sm text-slate-300 mt-2">Detect missing contraindications and unsafe advice before final response.</p>
-                </div>
               </div>
             </div>
           </div>
         </div>
       </div>
-    </section>
     <!-- Team -->

 <head>
   <meta charset="UTF-8" />
   <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+  <title>MedSwin — Project Introduction</title>
   <meta name="description" content="MedSwin: evidence-constrained, auditable multi-agent clinical QA with two-stage biomedical retrieval, calibrated reranking, and distilled 7B medical LLM for deployable decision support." />
   <link rel="icon" href="assets/logo.svg">
     </section>
     <!-- Overview -->
+    <div class="container">
+      <div class="grid lg:grid-cols-5 gap-8 items-start">
+        <!-- Left: narrative -->
+        <div class="lg:col-span-3" data-aos="fade-up">
+          <h2 class="text-3xl lg:text-4xl font-extrabold tracking-tight">Overview</h2>
+          <p class="mt-4 text-slate-300 leading-relaxed">
+            MedSwin frames clinical QA as an <span class="font-semibold text-slate-100">evidence-constrained decision pipeline</span>.
+            Every answer is gated by evidence sufficiency, bounded by a strict context budget, and accompanied by a
+            replayable trace suitable for audit and safety review.
+          </p>
+          <div class="mt-6 grid sm:grid-cols-3 gap-4">
+            <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
+              <div class="font-extrabold inline-flex items-center gap-2">
+                <i data-lucide="message-square" class="icon"></i> Answer
+              </div>
+              <p class="text-sm text-slate-300 mt-2">
+                Clinically phrased, uncertainty-aware output generated only when evidence gates are satisfied.
               </p>
             </div>
+            <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
+              <div class="font-extrabold inline-flex items-center gap-2">
+                <i data-lucide="files" class="icon"></i> Evidence bundle
+              </div>
+              <p class="text-sm text-slate-300 mt-2">
+                Compact EMR + guideline passages selected under token and diversity constraints.
               </p>
             </div>
+            <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
+              <div class="font-extrabold inline-flex items-center gap-2">
+                <i data-lucide="route" class="icon"></i> Trace
+              </div>
+              <p class="text-sm text-slate-300 mt-2">
+                Structured artifact log: retrieval, ranking, policies, safety checks.
               </p>
             </div>
           </div>
         </div>
+        <!-- Right: compact system summary -->
+        <aside class="lg:col-span-2 rounded-3xl border border-white/10 bg-slate-950/40 p-6" data-aos="fade-up">
+          <div class="font-extrabold text-lg tracking-tight mb-3">Why MedSwin is different</div>
+          <ul class="space-y-3 text-sm text-slate-300">
+            <li class="flex gap-2"><i data-lucide="check" class="icon text-emerald-300"></i> Refuses to answer when evidence is insufficient</li>
+            <li class="flex gap-2"><i data-lucide="check" class="icon text-emerald-300"></i> Explicit EMR + CPG coverage requirements</li>
+            <li class="flex gap-2"><i data-lucide="check" class="icon text-emerald-300"></i> Deterministic retrieval policies (no silent guessing)</li>
+            <li class="flex gap-2"><i data-lucide="check" class="icon text-emerald-300"></i> Local-deployable, auditable by design</li>
+          </ul>
+        </aside>
       </div>
+    </div>
     <!-- Contributions -->
     <section id="contributions" class="section">
     </section>
     <!-- Retrieval -->
+    <div class="container">
+      <div class="grid lg:grid-cols-5 gap-8 items-start">
+        <div class="lg:col-span-3" data-aos="fade-up">
+          <h2 class="text-3xl lg:text-4xl font-extrabold tracking-tight">
+            Two-Stage Retrieval & Calibrated Reranking
+          </h2>
+          <p class="mt-4 text-slate-300 leading-relaxed">
+            Evidence selection is separated into recall-oriented candidate generation and precision-oriented reranking.
+            This avoids early truncation while enabling deterministic, policy-aware inclusion decisions.
+          </p>
+          <div class="mt-6 space-y-4">
+            <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
+              <div class="font-extrabold inline-flex items-center gap-2">
+                <i data-lucide="scan-search" class="icon"></i> Stage 1 — Candidate generation
               </div>
+              <p class="text-sm text-slate-300 mt-2">
+                Dense ANN retrieval is unioned with BM25 to preserve rare clinical terms, abbreviations, and lab-specific phrasing.
               </p>
             </div>
+            <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
+              <div class="font-extrabold inline-flex items-center gap-2">
+                <i data-lucide="badge-check" class="icon"></i> Stage 2 — Long-context reranking
               </div>
+              <p class="text-sm text-slate-300 mt-2">
+                A biomedical LLM reranker scores each passage and outputs calibrated probabilities usable as policy thresholds.
+              </p>
             </div>
+            <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
+              <div class="font-extrabold inline-flex items-center gap-2">
+                <i data-lucide="sliders" class="icon"></i> Policy-aware selection
               </div>
+              <p class="text-sm text-slate-300 mt-2">
+                Final selection enforces EMR + guideline sufficiency, diversity (MMR-style), and a strict token budget.
+              </p>
             </div>
           </div>
         </div>
+        <!-- Right: sufficiency gate -->
+        <aside class="lg:col-span-2 rounded-3xl border border-white/10 bg-slate-950/40 p-6" data-aos="fade-up">
+          <div class="font-extrabold text-lg tracking-tight mb-3">Evidence acceptance gate</div>
+          <ul class="space-y-3 text-sm text-slate-300">
+            <li class="flex gap-2"><i data-lucide="book-open-check" class="icon"></i> Required guideline recommendations present</li>
+            <li class="flex gap-2"><i data-lucide="file-heart" class="icon"></i> Patient-specific EMR signals included</li>
+            <li class="flex gap-2"><i data-lucide="layers" class="icon"></i> Redundancy reduced under budget</li>
+            <li class="flex gap-2"><i data-lucide="shield-alert" class="icon"></i> Safety critic approves synthesis</li>
+          </ul>
+        </aside>
       </div>
+    </div>
+    <!-- Training -->
+    <div class="container">
+      <div class="grid lg:grid-cols-5 gap-8 items-start">
+        <div class="lg:col-span-3" data-aos="fade-up">
+          <h2 class="text-3xl lg:text-4xl font-extrabold tracking-tight">
+            Data, Training & Distillation
+          </h2>
+          <p class="mt-4 text-slate-300 leading-relaxed">
+            MedSwin’s deployable 7B model is trained for reliability rather than raw scale,
+            combining large-scale augmentation, supervised fine-tuning, and knowledge distillation.
+          </p>
+          <div class="mt-6 space-y-4">
+            <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
+              <div class="font-extrabold">A · Data augmentation</div>
+              <p class="text-sm text-slate-300 mt-2">
+                Paraphrasing, formatting variants, deduplication, and medical consistency checks expand coverage without semantic drift.
+              </p>
             </div>
+            <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
+              <div class="font-extrabold">B · Supervised fine-tuning</div>
+              <p class="text-sm text-slate-300 mt-2">
+                Aligns the student to clinical instruction style, tone control, and structured answers.
+              </p>
             </div>
+            <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
+              <div class="font-extrabold">C · Knowledge distillation</div>
+              <p class="text-sm text-slate-300 mt-2">
+                Hard labels expand task coverage; soft labels preserve calibration and uncertainty from a larger instructor.
+              </p>
             </div>
           </div>
         </div>
+        <!-- Right: why KD -->
+        <aside class="lg:col-span-2 rounded-3xl border border-white/10 bg-slate-950/40 p-6" data-aos="fade-up">
+          <div class="font-extrabold text-lg tracking-tight mb-3">Why distillation?</div>
+          <ul class="space-y-3 text-sm text-slate-300">
+            <li class="flex gap-2"><i data-lucide="cpu" class="icon"></i> Enables local inference on modest GPUs</li>
+            <li class="flex gap-2"><i data-lucide="shield-check" class="icon"></i> Preserves calibrated reasoning behaviour</li>
+            <li class="flex gap-2"><i data-lucide="settings" class="icon"></i> PEFT-friendly (LoRA / QLoRA)</li>
+            <li class="flex gap-2"><i data-lucide="lock" class="icon"></i> Institution-controlled deployment</li>
+          </ul>
+        </aside>
+      </div>
+    </div>
+    <!-- Evaluation -->
+    <div class="container">
+      <div class="grid lg:grid-cols-5 gap-8 items-start">
+        <div class="lg:col-span-3" data-aos="fade-up">
+          <h2 class="text-3xl lg:text-4xl font-extrabold tracking-tight">
+            Evaluation & Safety
+          </h2>
+          <p class="mt-4 text-slate-300 leading-relaxed">
+            MedSwin evaluates clinical QA systems beyond answer accuracy, focusing on evidence quality,
+            guideline compliance, and runtime safety behaviour.
+          </p>
+          <div class="mt-6 grid sm:grid-cols-3 gap-4">
+            <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
+              <div class="font-extrabold inline-flex items-center gap-2">
+                <i data-lucide="search" class="icon"></i> Retrieval quality
               </div>
+              <p class="text-sm text-slate-300 mt-2">
+                Evidence relevance and coverage under a fixed token budget.
+              </p>
             </div>
+            <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
+              <div class="font-extrabold inline-flex items-center gap-2">
+                <i data-lucide="book-open-check" class="icon"></i> Guideline coverage
+              </div>
+              <p class="text-sm text-slate-300 mt-2">
+                Presence of actionable recommendations and contraindications.
               </p>
+            </div>
+            <div class="rounded-2xl border border-white/10 bg-slate-950/40 p-4">
+              <div class="font-extrabold inline-flex items-center gap-2">
+                <i data-lucide="check-check" class="icon"></i> Faithfulness
               </div>
+              <p class="text-sm text-slate-300 mt-2">
+                Final answers remain grounded in cited evidence only.
+              </p>
             </div>
           </div>
         </div>
+        <!-- Right: safety behaviour -->
+        <aside class="lg:col-span-2 rounded-3xl border border-white/10 bg-slate-950/40 p-6" data-aos="fade-up">
+          <div class="font-extrabold text-lg tracking-tight mb-3">Runtime safety behaviour</div>
+          <ul class="space-y-3 text-sm text-slate-300">
+            <li class="flex gap-2"><i data-lucide="help-circle" class="icon"></i> Clarifies when evidence is missing</li>
+            <li class="flex gap-2"><i data-lucide="quote" class="icon"></i> Enforces citation-required answers</li>
+            <li class="flex gap-2"><i data-lucide="shield-alert" class="icon"></i> Safety critic checks contraindications</li>
+            <li class="flex gap-2"><i data-lucide="users" class="icon"></i> Designed for human-in-the-loop use</li>
+          </ul>
+        </aside>
       </div>
+    </div>
     <!-- Team -->