Spaces:

xiaohy
/

MathTutor-MIA-Demo

Sleeping

App Files Files Community

xiaohy commited on 9 days ago

Commit

4272ed3

verified ·

1 Parent(s): f637360

Update app.py

Browse files

Files changed (1) hide show

app.py +155 -153

app.py CHANGED Viewed

@@ -202,10 +202,10 @@ def cb_sample(src):
     pool=member_data if src=="成员数据（训练集）" else non_member_data
     s=pool[np.random.randint(len(pool))]; m=s['metadata']
     tm={'calculation':'基础计算','word_problem':'应用题','concept':'概念问答','error_correction':'错题订正'}
-    md=("| 字段 (Field) | 记录值 (Value) |\n|---|---|\n| 👤 姓名 | "+clean_text(str(m.get('name','')))+
-        " |\n| 🆔 学号 | "+clean_text(str(m.get('student_id','')))+
-        " |\n| 🏫 班级 | "+clean_text(str(m.get('class','')))+
-        " |\n| 💯 成绩 | "+clean_text(str(m.get('score','')))+" 分 |\n| 📝 类型 | "+tm.get(s.get('task_type',''),'')+" |\n")
     return md, clean_text(s.get('question','')), clean_text(s.get('answer',''))
@@ -243,16 +243,16 @@ def cb_attack(idx, src, target):
     pl,pc=("训练成员","🔴") if pred else ("非训练成员","🟢")
     al,ac=("训练成员","🔴") if is_mem else ("非训练成员","🟢")
     if correct and pred and is_mem:
-        v="⚠️ **攻击成功：隐私泄露**\n\n> 模型对该样本过于熟悉（Loss < 阈值），攻击者成功判定为训练数据。"
     elif correct:
-        v="✅ **判定正确：边界安全**\n\n> 攻击者的判定与真实身份一致，符合安全预期。"
     else:
-        v="🛡️ **防御成功：干扰生效**\n\n> 攻击者的判定发生错误，防御策略起到了保护作用。"
-    res=(v+"\n\n**🎯 攻击目标**: `"+lbl+"`　|　**📊 AUC风险值**: `"+f"{auc_v:.4f}"+"`\n\n"
-         "| 指标 | 攻击者推测 | 系统真实身份 |\n|---|---|---|\n"
          "| 身份 | "+pc+" "+pl+" | "+ac+" "+al+" |\n"
-         "| 核心参数 | Loss: `"+f"{loss:.4f}"+"` | 判定阈值: `"+f"{thr:.4f}"+"` |\n")
-    qtxt="**📝 样本题号 #"+str(idx)+"**\n\n"+clean_text(sample.get('question',''))[:500]
     return qtxt, gauge, res
@@ -266,21 +266,19 @@ def cb_eval(model):
     k=EVAL_KEY.get(model,"baseline"); acc=EVAL_ACC.get(model,bl_acc)
     q=EVAL_POOL[np.random.randint(len(EVAL_POOL))]; ok=q.get(k,q.get('baseline',False))
     ic="✅ 正确" if ok else "❌ 错误"
-    note="\n\n> 💡 输出扰动不改变模型结构参数，准确率与基线完全一致。" if u"\u03c3" in model else ""
-    return ("**🖥️ 模型**: `"+model+"`　|　**准确率**: `"+f"{acc:.1f}%"+"`\n\n"
-            "| 测试项目 | 内容 |\n|---|---|\n"
-            "| 🏷️ 类型 | "+q['type_cn']+" |\n| ❓ 题目 | "+q['question']+" |\n"
-            "| 🎯 答案 | "+q['answer']+" |\n| 🤖 判定 | "+ic+" |"+note)
-# ══════════════ 全新高科技 + 等宽高 CSS 皮肤 ══════════════
 CSS = """
-/* 1. 带有科技网格的全局背景 */
 body {
     background-color: #f1f5f9 !important;
-    background-image: radial-gradient(#cbd5e1 1px, transparent 1px) !important;
-    background-size: 24px 24px !important;
     font-family: -apple-system, BlinkMacSystemFont, "Segoe UI", Roboto, Helvetica, Arial, sans-serif !important;
 }
 .gradio-container {
@@ -288,14 +286,14 @@ body {
     margin: 40px auto !important;
 }
-/* 2. 纯白科技感悬浮 Title 面板 */
 .title-area {
     background: #ffffff;
-    padding: 28px 40px;
     border-radius: 12px;
     box-shadow: 0 4px 6px -1px rgba(0, 0, 0, 0.05), 0 2px 4px -1px rgba(0, 0, 0, 0.03);
-    margin-bottom: 24px;
-    border-left: 6px solid #2563eb; /* 克莱因蓝修��线 */
     text-align: left;
 }
 .title-area h1 {
@@ -314,27 +312,27 @@ body {
 /* 3. 核心大招：死死锁住所有标签页的大小，防止跳动 */
 .tabitem {
-    background: rgba(255, 255, 255, 0.98) !important;
     border-radius: 0 0 12px 12px !important;
     border: 1px solid #e2e8f0 !important;
     border-top: none !important;
-    box-shadow: 0 4px 12px rgba(0, 0, 0, 0.05) !important;
     padding: 32px 40px !important;
-    /* 让所有页面高度一致的魔法参数 */
     height: 760px !important;
     max-height: 760px !important;
     overflow-y: auto !important;
     overflow-x: hidden !important;
 }
-/* 优雅的隐藏式滚动条 */
 .tabitem::-webkit-scrollbar { width: 6px; }
 .tabitem::-webkit-scrollbar-track { background: transparent; }
 .tabitem::-webkit-scrollbar-thumb { background: #cbd5e1; border-radius: 10px; }
 .tabitem::-webkit-scrollbar-thumb:hover { background: #94a3b8; }
-/* 4. Tab 导航栏拟态设计 */
 .tab-nav {
     border-bottom: none !important;
     gap: 4px !important;
@@ -345,7 +343,7 @@ body {
     padding: 12px 24px !important;
     font-weight: 600 !important;
     color: #64748b !important;
-    background: #e2e8f0 !important;
     border: 1px solid #e2e8f0 !important;
     border-bottom: none !important;
     border-radius: 10px 10px 0 0 !important;
@@ -363,7 +361,7 @@ body {
     box-shadow: 0 -4px 6px -2px rgba(0,0,0,0.02) !important;
 }
-/* 5. 内部标题排版与修饰 */
 .prose h2 {
     font-size: 1.3rem !important;
     color: #0f172a !important;
@@ -379,7 +377,7 @@ body {
     margin-top: 1.5em !important;
 }
-/* 6. 高级数据表格 (斑马纹) */
 .prose table {
     width: 100% !important;
     border-collapse: separate !important;
@@ -406,7 +404,7 @@ body {
 .prose tr:last-child td { border-bottom: none !important; }
 .prose tr:hover td { background: #f0f9ff !important; }
-/* 7. 纯色科技感按钮 */
 button.primary {
     background: #2563eb !important;
     color: white !important;
@@ -423,7 +421,7 @@ button.primary:hover {
     box-shadow: 0 6px 10px -1px rgba(37, 99, 235, 0.3) !important;
 }
-/* 8. 提示/警报框 (突出显示) */
 .prose blockquote {
     border-left: 4px solid #3b82f6 !important;
     background: #eff6ff !important;
@@ -434,161 +432,165 @@ button.primary:hover {
     margin: 1.5em 0 !important;
 }
 footer { display: none !important; }
 """
 with gr.Blocks(title="MIA攻防研究", theme=gr.themes.Base(), css=CSS) as demo:
     gr.HTML("""<div class="title-area">
-        <h1>🎓 教育大模型中的成员推理攻击及其防御研究</h1>
-        <p>Membership Inference Attack & Defense on Educational LLM Dashboard</p>
     </div>""")
-    # ═══════ Tab 1: 实验总览 ═══════
-    with gr.Tab("📊 实验总览"):
-        with gr.Row():
-            with gr.Column(scale=1):
-                gr.Markdown(
-                    "## 📌 研究背景与目标\n\n"
-                    "大语言模型在教育领域的应用日益广泛（如AI数学辅导），模型训练不可避免地接触学生敏感数据。"
-                    "**成员推理攻击 (MIA)** 可判断某条数据是否参与了训练，构成隐私威胁。\n\n"
-                    "本研究基于 **" + model_name + "** 微调的数学辅导模型，验证MIA风险的存在性，"
-                    "并探索 **标签平滑**（训练期）与 **输出扰动**（推理期）两类防御策略的有效性及其对模型效用的影响。\n\n"
-                    "## 🚀 实验流程\n\n"
-                    "| 阶段 | 内容 | 方法 |\n|---|---|---|\n"
-                    "| 1. 数据准备 | 2000条数学辅导对话 | 模板化生成，含姓名/学号/成绩 |\n"
-                    "| 2. 基线训练 | " + model_name + " + LoRA | 标准微调(r=8, alpha=16, 10 epochs) |\n"
-                    "| 3. 防御训练 | " + u"\u03b5=0.02 / \u03b5=0.2" + " | 两组标签平滑参数分别训练 |\n"
-                    "| 4. 攻击测试 | 3个模型 + 3组扰动 | Loss阈值判定，AUC评估 |\n"
-                    "| 5. 效用评估 | 300道数学题 | 6种配置分别测试准确率 |\n"
-                )
-            with gr.Column(scale=1):
-                gr.Markdown("## 📈 实验核心指标\n")
-                gr.Markdown(
-                    "| 🛡️ 策略配置 | 📊 AUC | 🎯 准确率 | 💡 说明 |\n|---|---|---|---|\n"
-                    "| **基线（无防御）** | **" + f"{bl_auc:.4f}" + "** | " + f"{bl_acc:.1f}%" + " | 攻击风险基准 |\n"
-                    "| " + u"LS(\u03b5=0.02)" + " | " + f"{s002_auc:.4f}" + " | " + f"{s002_acc:.1f}%" + " | 训练期防御 |\n"
-                    "| " + u"LS(\u03b5=0.2)" + " | " + f"{s02_auc:.4f}" + " | " + f"{s02_acc:.1f}%" + " | 训练期防御 |\n"
-                    "| " + u"OP(\u03c3=0.01)" + " | " + f"{op001_auc:.4f}" + " | " + f"{bl_acc:.1f}%" + " | 推理期防御 |\n"
-                    "| " + u"OP(\u03c3=0.015)" + " | " + f"{op0015_auc:.4f}" + " | " + f"{bl_acc:.1f}%" + " | 推理期防御 |\n"
-                    "| " + u"OP(\u03c3=0.02)" + " | " + f"{op002_auc:.4f}" + " | " + f"{bl_acc:.1f}%" + " | 推理期防御 |\n\n"
-                    "> 💡 **指标提示**: AUC越接近0.5 = 防御越有效；准确率越高 = 模型效用越好。"
-                )
-    # ═══════ Tab 2: 数据与模型 (双列修复版) ═══════
-    with gr.Tab("📁 数据与模型"):
-        with gr.Row():
-            with gr.Column():
-                gr.Markdown(
-                    "## 📦 实验数据集概况\n\n"
-                    "| 数据组 | 数量 | 用途 | 说明 |\n|---|---|---|---|\n"
-                    "| 🔴 成员数据 | 1000条 | 模型训练 | 模型会\"记住\"，Loss偏低 |\n"
-                    "| 🟢 非成员数据 | 1000条 | 攻击对照 | 模型\"没见过\"，Loss偏高 |\n\n"
-                    "> ⚠️ 两组数据格式完全相同（均含隐私字段），这是MIA实验的标准设置——攻击者无法从格式区分成员与否。"
-                )
-            with gr.Column():
-                gr.Markdown(
-                    "## 🗂️ 任务类型分布\n\n"
-                    "| 任务类别 | 数据数量 | 占比权重 |\n|---|---|---|\n"
-                    "| 🧮 基础计算 | 800 | 40% |\n| 📝 应用题 | 600 | 30% |\n| 🧠 概念问答 | 400 | 20% |\n| ✍️ 错题订正 | 200 | 10% |\n"
-                )
-        gr.Markdown("## 🔍 数据样例浏览提取")
         with gr.Row(equal_height=True):
             with gr.Column(scale=2):
-                d_src = gr.Radio(["成员数据（训练集）","非成员数据（测试集）"], value="成员数据（训练集）", label="选择靶向数据来源")
-                d_btn = gr.Button("🎲 随机提取样本", variant="primary")
                 d_meta = gr.Markdown()
             with gr.Column(scale=3):
-                d_q = gr.Textbox(label="🧑‍🎓 学生提问 (Prompt)", lines=4, interactive=False)
-                d_a = gr.Textbox(label="🤖 标准回答 (Ground Truth)", lines=4, interactive=False)
         d_btn.click(cb_sample, [d_src], [d_meta, d_q, d_a])
-    # ═══════ Tab 3: 攻击与防御验证 ═══════
-    with gr.Tab("🎯 攻击验证"):
-        gr.Markdown("## 🕵️ 成员推理攻击交互演示\n\n"
-                    "配置攻击目标实体与数据源，系统将执行 Loss 计算并映射攻击边界，以此判定数据归属。")
         with gr.Row(equal_height=True):
             with gr.Column(scale=2):
                 a_target = gr.Radio([u"基线模型 (Baseline)",u"标签平滑 (\u03b5=0.02)",u"标签平滑 (\u03b5=0.2)",
                     u"输出扰动 (\u03c3=0.01)",u"输出扰动 (\u03c3=0.015)",u"输出扰动 (\u03c3=0.02)"],
-                    value=u"基线模型 (Baseline)", label="选择攻击目标")
                 a_src = gr.Radio(["成员数据（训练集）","非成员数据（测试集）"], value="成员数据（训练集）", label="数据来源")
-                a_idx = gr.Slider(0, 999, step=1, value=12, label="定位样本 ID")
-                a_btn = gr.Button("⚡ 执行成员推理攻击", variant="primary", size="lg")
                 a_qtxt = gr.Markdown()
             with gr.Column(scale=3):
-                a_gauge = gr.Plot(label="Loss位置判定 (Decision Boundary)")
                 a_res = gr.Markdown()
         a_btn.click(cb_attack, [a_idx, a_src, a_target], [a_qtxt, a_gauge, a_res])
-    # ═══════ Tab 4: 防御效果分析 ═══════
-    with gr.Tab("🛡️ 防御分析"):
-        with gr.Row():
-            with gr.Column():
-                gr.Markdown("## 📉 MIA攻击AUC全局对比\n\n> 柱子越矮 = AUC越低 = 攻击越难成功 = 防御越有效")
-                gr.Plot(value=fig_auc_bar())
-            with gr.Column():
-                gr.Markdown(
-                    "## ⚙️ 防御机制技术说明\n\n"
-                    "| 维度 | 标签平滑 (Label Smoothing) | 输出扰动 (Output Perturbation) |\n|---|---|---|\n"
-                    "| **阶段** | 训练期 | 推理期 |\n"
-                    "| **原理** | 软化标签降低记忆 | Loss加噪遮蔽信号 |\n"
-                    "| **需重训** | 是 | 否 |\n"
-                    "| **效用** | 取决于参数 | 无损耗 |\n"
-                    "| **部署** | 训练时介入 | 即插即用 API |\n\n"
-                    "**标签平滑公式**: `y_smooth = (1 - ε) * y_onehot + ε / V`\n\n"
-                    "**输出扰动公式**: `L_perturbed = L_original + N(0, σ²)`\n"
-                )
-        gr.Markdown("## 🏔️ Loss分布形态对比\n### 1. 三个模型（训练期防御效果）\n\n> 蓝色=成员，红色=非成员。两色重叠（Overlap）越多 = 攻击者越难区分")
         gr.Plot(value=fig_loss_dist())
-        gr.Markdown("### 2. 输出扰动效果（推理期防御）\n\n> 在基线模型Loss上加噪声，随噪声方差(σ)增大，双侧分布交融程度加深")
         gr.Plot(value=fig_perturb_dist())
-    # ═══════ Tab 5: 效用评估 ═══════
-    with gr.Tab("⚖️ 效用评估"):
-        gr.Markdown("## 🎯 模型数学效用基准测试\n\n> 抽取300道复杂数学测试题，评估各安全策略对模型实际解题能力的影响。")
         with gr.Row(equal_height=True):
             with gr.Column(): gr.Plot(value=fig_acc_bar())
             with gr.Column(): gr.Plot(value=fig_tradeoff())
-        gr.Markdown("## 🎮 在线效用抽样演示\n\n从测试题库中随机抽取，流式验证不同模型/策略的保留作答情况。")
         with gr.Row(equal_height=True):
             with gr.Column(scale=1):
                 e_model = gr.Radio([u"基线模型",u"标签平滑 (\u03b5=0.02)",u"标签平滑 (\u03b5=0.2)",
-                    u"输出扰动 (\u03c3=0.01)",u"输出扰动 (\u03c3=0.015)",u"输出扰动 (\u03c3=0.02)"], value=u"基线模型", label="选择验证模型")
-                e_btn = gr.Button("🧪 随机抽题测试", variant="primary")
             with gr.Column(scale=2):
                 e_res = gr.Markdown()
         e_btn.click(cb_eval, [e_model], [e_res])
-    # ═══════ Tab 6: 研究结论 (双列修复版) ═══════
-    with gr.Tab("📝 研究结论"):
-        gr.Markdown("## 💡 核心研究发现与最佳实践\n\n---")
-        with gr.Row():
-            with gr.Column():
-                gr.Markdown(
-                    "### 🚨 一、教育大模型存在强MIA风险\n\n"
-                    "基线模型 AUC = **" + f"{bl_auc:.4f}" + "** > 0.5，成员平均Loss (" + f"{bl_m_mean:.4f}"
-                    + ") 显著低于非成员 (" + f"{bl_nm_mean:.4f}" + ")。实验铁证表明，模型对训练数据存在极强的可利用记忆效应，教育隐私面临直接威胁。\n\n"
-                    "### 🛡️ 二、标签平滑（训练期防御）\n\n"
-                    "| 参数 | AUC | ���确率 | 分析结论 |\n|---|---|---|---|\n"
-                    "| **基线** | " + f"{bl_auc:.4f}" + " | " + f"{bl_acc:.1f}%" + " | 无防御裸奔 |\n"
-                    "| **" + u"\u03b5=0.02" + "** | " + f"{s002_auc:.4f}" + " | " + f"{s002_acc:.1f}%" + " | 正则化提升泛化红利 |\n"
-                    "| **" + u"\u03b5=0.2" + "** | " + f"{s02_auc:.4f}" + " | " + f"{s02_acc:.1f}%" + " | 进入强力防御深水区 |\n\n"
-                )
-            with gr.Column():
-                gr.Markdown(
-                    "### 🎛️ 三、输出扰动（推理期防御）\n\n"
-                    "| 参数 | 最终 AUC | AUC 降幅 | 模型准确率 |\n|---|---|---|---|\n"
-                    "| **" + u"\u03c3=0.01" + "** | " + f"{op001_auc:.4f}" + " | " + f"{bl_auc-op001_auc:.4f}" + " | " + f"{bl_acc:.1f}%" + " |\n"
-                    "| **" + u"\u03c3=0.015" + "** | " + f"{op0015_auc:.4f}" + " | " + f"{bl_auc-op0015_auc:.4f}" + " | " + f"{bl_acc:.1f}%" + " |\n"
-                    "| **" + u"\u03c3=0.02" + "** | " + f"{op002_auc:.4f}" + " | " + f"{bl_auc-op002_auc:.4f}" + " | " + f"{bl_acc:.1f}%" + " |\n\n"
-                    "**结论**: 零效用损失，适合已部署系统的无痛后期加固。\n\n"
-                    "### ⚖️ 四、隐私-效用权衡总结\n\n"
-                    "两类策略机制完美互补：\n"
-                    "1. **标签平滑**：从训练阶段物理阻断模型记忆，且微量平滑具有正向效用收益。\n"
-                    "2. **输出扰动**：从推理阶段统计遮蔽外部嗅探信号，零损耗即插即用。\n"
-                    "> **架构建议**: 业务生产环境中，建议组合使用这两层屏障，构建立体防御体系。"
-                )
 demo.launch()

     pool=member_data if src=="成员数据（训练集）" else non_member_data
     s=pool[np.random.randint(len(pool))]; m=s['metadata']
     tm={'calculation':'基础计算','word_problem':'应用题','concept':'概念问答','error_correction':'错题订正'}
+    md=("| 字段 | 值 |\n|---|---|\n| 姓名 | "+clean_text(str(m.get('name','')))+
+        " |\n| 学号 | "+clean_text(str(m.get('student_id','')))+
+        " |\n| 班级 | "+clean_text(str(m.get('class','')))+
+        " |\n| 成绩 | "+clean_text(str(m.get('score','')))+" 分 |\n| 类型 | "+tm.get(s.get('task_type',''),'')+" |\n")
     return md, clean_text(s.get('question','')), clean_text(s.get('answer',''))
     pl,pc=("训练成员","🔴") if pred else ("非训练成员","🟢")
     al,ac=("训练成员","🔴") if is_mem else ("非训练成员","🟢")
     if correct and pred and is_mem:
+        v="⚠️ **攻击成功：隐私泄露**\n\n模型对该样本过于熟悉（Loss < 阈值），攻击者成功判定为训练数据。"
     elif correct:
+        v="✅ **判定正确**\n\n攻击者的判定与真实身份一致。"
     else:
+        v="🛡️ **防御成功**\n\n攻击者的判定错误，防御起到了保护作用。"
+    res=(v+"\n\n**攻击目标**: "+lbl+"　|　**AUC**: "+f"{auc_v:.4f}"+"\n\n"
+         "| | 攻击者判定 | 真实身份 |\n|---|---|---|\n"
          "| 身份 | "+pc+" "+pl+" | "+ac+" "+al+" |\n"
+         "| Loss | "+f"{loss:.4f}"+" | 阈值: "+f"{thr:.4f}"+" |\n")
+    qtxt="**样本 #"+str(idx)+"**\n\n"+clean_text(sample.get('question',''))[:500]
     return qtxt, gauge, res
     k=EVAL_KEY.get(model,"baseline"); acc=EVAL_ACC.get(model,bl_acc)
     q=EVAL_POOL[np.random.randint(len(EVAL_POOL))]; ok=q.get(k,q.get('baseline',False))
     ic="✅ 正确" if ok else "❌ 错误"
+    note="\n\n> 输出扰动不改变模型参数，准确率与基线一致。" if u"\u03c3" in model else ""
+    return ("**"+model+"**　(准确率: "+f"{acc:.1f}%"+")\n\n"
+            "| 项目 | 内容 |\n|---|---|\n"
+            "| 类型 | "+q['type_cn']+" |\n| 题目 | "+q['question']+" |\n"
+            "| 正确答案 | "+q['answer']+" |\n| 判定 | "+ic+" |"+note)
+# ══════════════ 极致干净、高度统一的 CSS 皮肤 ══════════════
 CSS = """
+/* 1. 干净的背景与字体体系 */
 body {
     background-color: #f1f5f9 !important;
     font-family: -apple-system, BlinkMacSystemFont, "Segoe UI", Roboto, Helvetica, Arial, sans-serif !important;
 }
 .gradio-container {
     margin: 40px auto !important;
 }
+/* 2. 抛弃深蓝渐变，采用清爽的白色主标题面板 */
 .title-area {
     background: #ffffff;
+    padding: 30px 40px;
     border-radius: 12px;
     box-shadow: 0 4px 6px -1px rgba(0, 0, 0, 0.05), 0 2px 4px -1px rgba(0, 0, 0, 0.03);
+    margin-bottom: 20px;
+    border-left: 6px solid #2563eb; /* 左侧科技蓝修饰线 */
     text-align: left;
 }
 .title-area h1 {
 /* 3. 核心大招：死死锁住所有标签页的大小，防止跳动 */
 .tabitem {
+    background: #ffffff !important;
     border-radius: 0 0 12px 12px !important;
     border: 1px solid #e2e8f0 !important;
     border-top: none !important;
+    box-shadow: 0 4px 6px -1px rgba(0, 0, 0, 0.05) !important;
     padding: 32px 40px !important;
+    /* 就是这两行代码，让你的每一页大小绝对一致 */
     height: 760px !important;
     max-height: 760px !important;
     overflow-y: auto !important;
     overflow-x: hidden !important;
 }
+/* 美化内页的滚动条，让它看起来更高级 */
 .tabitem::-webkit-scrollbar { width: 6px; }
 .tabitem::-webkit-scrollbar-track { background: transparent; }
 .tabitem::-webkit-scrollbar-thumb { background: #cbd5e1; border-radius: 10px; }
 .tabitem::-webkit-scrollbar-thumb:hover { background: #94a3b8; }
+/* 4. Tab 导航栏的极简拟物设计 */
 .tab-nav {
     border-bottom: none !important;
     gap: 4px !important;
     padding: 12px 24px !important;
     font-weight: 600 !important;
     color: #64748b !important;
+    background: #f1f5f9 !important;
     border: 1px solid #e2e8f0 !important;
     border-bottom: none !important;
     border-radius: 10px 10px 0 0 !important;
     box-shadow: 0 -4px 6px -2px rgba(0,0,0,0.02) !important;
 }
+/* 5. 内部排版（去掉默认的黑粗体，改为高级灰黑） */
 .prose h2 {
     font-size: 1.3rem !important;
     color: #0f172a !important;
     margin-top: 1.5em !important;
 }
+/* 6. 高级数据表格 */
 .prose table {
     width: 100% !important;
     border-collapse: separate !important;
 .prose tr:last-child td { border-bottom: none !important; }
 .prose tr:hover td { background: #f0f9ff !important; }
+/* 7. 纯色扁平化高级按钮 */
 button.primary {
     background: #2563eb !important;
     color: white !important;
     box-shadow: 0 6px 10px -1px rgba(37, 99, 235, 0.3) !important;
 }
+/* 8. 提示/警报框 */
 .prose blockquote {
     border-left: 4px solid #3b82f6 !important;
     background: #eff6ff !important;
     margin: 1.5em 0 !important;
 }
+/* 隐藏底部水印 */
 footer { display: none !important; }
 """
 with gr.Blocks(title="MIA攻防研究", theme=gr.themes.Base(), css=CSS) as demo:
     gr.HTML("""<div class="title-area">
+        <h1>教育大模型中的成员推理攻击及其防御研究</h1>
+        <p>Membership Inference Attack & Defense on Educational LLM</p>
     </div>""")
+    # ═══════ Tab 1 ═══════
+    with gr.Tab("实验总览"):
+        gr.Markdown(
+            "## 研究背景与目标\n\n"
+            "大语言模型在教育领域的应用日益广泛（如AI数学辅导），模型训练不可避免地接触学生敏感数据。"
+            "**成员推理攻击 (MIA)** 可判断某条数据是否参与了训练，构成隐私威胁。\n\n"
+            "本研究基于 **" + model_name + "** 微调的数学辅导模型，验证MIA风险的存在性，"
+            "并探索 **标签平滑**（训练期）与 **输出扰动**（推理期）两类防御策略的有效性及其对模型效用的影响。\n\n---")
+        gr.Markdown("## 实验核心指标\n")
+        gr.Markdown(
+            "| 策略 | AUC | 准确率 | 说明 |\n|---|---|---|---|\n"
+            "| **基线（无防御）** | **" + f"{bl_auc:.4f}" + "** | " + f"{bl_acc:.1f}%" + " | 攻击风险基准 |\n"
+            "| " + u"LS(\u03b5=0.02)" + " | " + f"{s002_auc:.4f}" + " | " + f"{s002_acc:.1f}%" + " | 训练期防御 |\n"
+            "| " + u"LS(\u03b5=0.2)" + " | " + f"{s02_auc:.4f}" + " | " + f"{s02_acc:.1f}%" + " | 训练期防御 |\n"
+            "| " + u"OP(\u03c3=0.01)" + " | " + f"{op001_auc:.4f}" + " | " + f"{bl_acc:.1f}%" + " | 推理期防御 |\n"
+            "| " + u"OP(\u03c3=0.015)" + " | " + f"{op0015_auc:.4f}" + " | " + f"{bl_acc:.1f}%" + " | 推理期防御 |\n"
+            "| " + u"OP(\u03c3=0.02)" + " | " + f"{op002_auc:.4f}" + " | " + f"{bl_acc:.1f}%" + " | 推理期防御 |\n\n"
+            "> AUC越接近0.5 = 防御越有效　|　准确率越高 = 模型效用越好\n\n---")
+        gr.Markdown(
+            "## 实验流程\n\n"
+            "| 阶段 | 内容 | 方法 |\n|---|---|---|\n"
+            "| 1. 数据准备 | 2000条数学辅导对话 | 模板化生成，含姓名/学号/成绩 |\n"
+            "| 2. 基线训练 | " + model_name + " + LoRA | 标准微调(r=8, alpha=16, 10 epochs) |\n"
+            "| 3. 防御训练 | " + u"\u03b5=0.02 / \u03b5=0.2" + " | 两组标签平滑参数分别训练 |\n"
+            "| 4. 攻击测试 | 3个模型 + 3组扰动 | Loss阈值判定，AUC评估 |\n"
+            "| 5. 效用评估 | 300道数学题 | 6种配置分别测试准确率 |\n"
+            "| 6. 综合分析 | 隐私-效用权衡 | 定量对比与可视化 |\n")
+    # ═══════ Tab 2 ═══════
+    with gr.Tab("数据与模型"):
+        gr.Markdown(
+            "## 实验数据集\n\n"
+            "| 数据组 | 数量 | 用途 | 说明 |\n|---|---|---|---|\n"
+            "| 成员数据 | 1000条 | 模型训练 | 模型会\"记住\"，Loss偏低 |\n"
+            "| 非成员数据 | 1000条 | 攻击对照 | 模型\"没见过\"，Loss偏高 |\n\n"
+            "> 两组数据格式完全相同（均含隐私字段），这是MIA实验的标准设置——攻击者无法从格式区分\n\n"
+            "| 任务类型 | 数量 | 占比 |\n|---|---|---|\n"
+            "| 基础计算 | 800 | 40% |\n| 应用题 | 600 | 30% |\n| 概念问答 | 400 | 20% |\n| 错题订正 | 200 | 10% |\n")
+        gr.Markdown("### 数据样例浏览")
         with gr.Row(equal_height=True):
             with gr.Column(scale=2):
+                d_src = gr.Radio(["成员数据（训练集）","非成员数据（测试集）"], value="成员数据（训练集）", label="数据来源")
+                d_btn = gr.Button("随机提取样本", variant="primary")
                 d_meta = gr.Markdown()
             with gr.Column(scale=3):
+                d_q = gr.Textbox(label="学生提问", lines=4, interactive=False)
+                d_a = gr.Textbox(label="标准回答", lines=4, interactive=False)
         d_btn.click(cb_sample, [d_src], [d_meta, d_q, d_a])
+    # ═══════ Tab 3 ═══════
+    with gr.Tab("攻击与防御验证"):
+        gr.Markdown("## 成员推理攻击交互演示\n\n"
+                    "选择攻击目标和数据来源，系统实时计算Loss并判定成员身份。通过切换不同目标形成对照实验。")
         with gr.Row(equal_height=True):
             with gr.Column(scale=2):
                 a_target = gr.Radio([u"基线模型 (Baseline)",u"标签平滑 (\u03b5=0.02)",u"标签平滑 (\u03b5=0.2)",
                     u"输出扰动 (\u03c3=0.01)",u"输出扰动 (\u03c3=0.015)",u"输出扰动 (\u03c3=0.02)"],
+                    value=u"基线模型 (Baseline)", label="攻击目标")
                 a_src = gr.Radio(["成员数据（训练集）","非成员数据（测试集）"], value="成员数据（训练集）", label="数据来源")
+                a_idx = gr.Slider(0, 999, step=1, value=12, label="样本 ID")
+                a_btn = gr.Button("执行成员推理攻击", variant="primary", size="lg")
                 a_qtxt = gr.Markdown()
             with gr.Column(scale=3):
+                a_gauge = gr.Plot(label="Loss位置判定")
                 a_res = gr.Markdown()
         a_btn.click(cb_attack, [a_idx, a_src, a_target], [a_qtxt, a_gauge, a_res])
+    # ═══════ Tab 4 ═══════
+    with gr.Tab("防御效果分析"):
+        gr.Markdown("## MIA攻击AUC对比\n\n> 柱子越矮 = AUC越低 = 攻击越难成功 = 防御越有效")
+        gr.Plot(value=fig_auc_bar())
+        gr.Markdown("## Loss分布对比\n### 三个模型（训练期防御效果）\n\n> 蓝色=成员，红色=非成员。两色重叠越多 = 攻击者越难区分")
         gr.Plot(value=fig_loss_dist())
+        gr.Markdown("### 输出扰动效果（推理期防御）\n\n> 在基线模型Loss上加噪声，随噪声增大分布更加重叠")
         gr.Plot(value=fig_perturb_dist())
+        gr.Markdown(
+            "## 完整实验数据\n\n"
+            "| 策略 | 类型 | AUC | 准确率 | AUC变化 |\n|---|---|---|---|---|\n"
+            "| 基线 | — | " + f"{bl_auc:.4f}" + " | " + f"{bl_acc:.1f}%" + " | — |\n"
+            "| " + u"LS(\u03b5=0.02)" + " | 训练期 | " + f"{s002_auc:.4f}" + " | " + f"{s002_acc:.1f}%" + " | " + f"{s002_auc-bl_auc:+.4f}" + " |\n"
+            "| " + u"LS(\u03b5=0.2)" + " | 训练期 | " + f"{s02_auc:.4f}" + " | " + f"{s02_acc:.1f}%" + " | " + f"{s02_auc-bl_auc:+.4f}" + " |\n"
+            "| " + u"OP(\u03c3=0.01)" + " | 推理期 | " + f"{op001_auc:.4f}" + " | " + f"{bl_acc:.1f}%" + " | " + f"{op001_auc-bl_auc:+.4f}" + " |\n"
+            "| " + u"OP(\u03c3=0.015)" + " | 推理期 | " + f"{op0015_auc:.4f}" + " | " + f"{bl_acc:.1f}%" + " | " + f"{op0015_auc-bl_auc:+.4f}" + " |\n"
+            "| " + u"OP(\u03c3=0.02)" + " | 推理期 | " + f"{op002_auc:.4f}" + " | " + f"{bl_acc:.1f}%" + " | " + f"{op002_auc-bl_auc:+.4f}" + " |\n\n"
+            "## 防御机制说明\n\n"
+            "| 维度 | 标签平滑 | 输出扰动 |\n|---|---|---|\n"
+            "| 阶段 | 训练期 | 推理期 |\n"
+            "| 原理 | 软化标签降低记忆 | Loss加噪遮蔽信号 |\n"
+            "| 需重训 | 是 | 否 |\n"
+            "| 效用影响 | 取决于参数 | 无 |\n"
+            "| 部署 | 训练时介入 | 即插即用 |\n\n"
+            "**标签平滑**: y_smooth = (1 - " + u"\u03b5" + ") * y_onehot + " + u"\u03b5" + " / V\n\n"
+            "**输出扰动**: L_perturbed = L_original + N(0, " + u"\u03c3" + u"\u00b2" + ")\n")
+        for fn, cap in [("fig1_loss_distribution_comparison.png","Loss分布对比"),
+                         ("fig2_privacy_utility_tradeoff_fixed.png","隐私-效用权衡"),
+                         ("fig3_defense_comparison_bar.png","防御策略AUC对比")]:
+            p = os.path.join(BASE_DIR,"figures",fn)
+            if os.path.exists(p):
+                gr.Markdown("### "+cap); gr.Image(value=p, show_label=False, height=420)
+    # ═══════ Tab 5 ═══════
+    with gr.Tab("效用评估"):
+        gr.Markdown("## 模型效用测试\n\n> 基于300道数学测试题评估各策略对模型实际能力的影响")
         with gr.Row(equal_height=True):
             with gr.Column(): gr.Plot(value=fig_acc_bar())
             with gr.Column(): gr.Plot(value=fig_tradeoff())
+        gr.Markdown("### 在线效用演示\n\n从测试题库中随机抽取，查看不同模型/策略的作答情况。")
         with gr.Row(equal_height=True):
             with gr.Column(scale=1):
                 e_model = gr.Radio([u"基线模型",u"标签平滑 (\u03b5=0.02)",u"标签平滑 (\u03b5=0.2)",
+                    u"输出扰动 (\u03c3=0.01)",u"输出扰动 (\u03c3=0.015)",u"输出扰动 (\u03c3=0.02)"], value=u"基线模型", label="选择模型")
+                e_btn = gr.Button("随机抽题测试", variant="primary")
             with gr.Column(scale=2):
                 e_res = gr.Markdown()
         e_btn.click(cb_eval, [e_model], [e_res])
+    # ═══════ Tab 6 ═══════
+    with gr.Tab("研究结论"):
+        gr.Markdown(
+            "## 核心研究发现\n\n---\n\n"
+            "### 一、教育大模型存在可量化的MIA风险\n\n"
+            "基线模型 AUC = **" + f"{bl_auc:.4f}" + "** > 0.5，成员平均Loss (" + f"{bl_m_mean:.4f}"
+            + ") < 非成员 (" + f"{bl_nm_mean:.4f}" + ")，模型对训练数据存在可利用的记忆效应。\n\n---\n\n"
+            "### 二、标签平滑（训练期防御）\n\n"
+            "| 参数 | AUC | 准确率 | 分析 |\n|---|---|---|---|\n"
+            "| 基线 | " + f"{bl_auc:.4f}" + " | " + f"{bl_acc:.1f}%" + " | 无防御 |\n"
+            "| " + u"\u03b5=0.02" + " | " + f"{s002_auc:.4f}" + " | " + f"{s002_acc:.1f}%" + " | 正则化提升泛化 |\n"
+            "| " + u"\u03b5=0.2" + " | " + f"{s02_auc:.4f}" + " | " + f"{s02_acc:.1f}%" + " | 防御增强 |\n\n---\n\n"
+            "### 三、输出扰动（推理期防御）\n\n"
+            "| 参数 | AUC | AUC降幅 | 准确率 |\n|---|---|---|---|\n"
+            "| " + u"\u03c3=0.01" + " | " + f"{op001_auc:.4f}" + " | " + f"{bl_auc-op001_auc:.4f}" + " | " + f"{bl_acc:.1f}%" + " |\n"
+            "| " + u"\u03c3=0.015" + " | " + f"{op0015_auc:.4f}" + " | " + f"{bl_auc-op0015_auc:.4f}" + " | " + f"{bl_acc:.1f}%" + " |\n"
+            "| " + u"OP(\u03c3=0.02)" + " | " + f"{op002_auc:.4f}" + " | " + f"{bl_auc-op002_auc:.4f}" + " | " + f"{bl_acc:.1f}%" + " |\n\n"
+            "零效用损失，适合已部署系统的后期加固。\n\n---\n\n"
+            "### 四、隐私-效用权衡总结\n\n"
+            "| 策略 | AUC | 准确率 | 隐私 | 效用 |\n|---|---|---|---|---|\n"
+            "| 基线 | " + f"{bl_auc:.4f}" + " | " + f"{bl_acc:.1f}%" + " | 风险最高 | 基准 |\n"
+            "| " + u"LS(\u03b5=0.02)" + " | " + f"{s002_auc:.4f}" + " | " + f"{s002_acc:.1f}%" + " | 降低 | 提升 |\n"
+            "| " + u"LS(\u03b5=0.2)" + " | " + f"{s02_auc:.4f}" + " | " + f"{s02_acc:.1f}%" + " | 显著降低 | 可接受 |\n"
+            "| " + u"OP(\u03c3=0.02)" + " | " + f"{op002_auc:.4f}" + " | " + f"{bl_acc:.1f}%" + " | 显著降低 | 不变 |\n\n"
+            "两类策略机制互补：标签平滑从训练阶段降低记忆，输出扰动从推理阶段遮蔽信号。可根据实际需求灵活选择。\n")
+    gr.HTML("<div style='text-align:center;color:#94a3b8;font-size:.82rem;padding:16px 0 8px'>"
+            "</div>")
 demo.launch()