Spaces:

hikewa
/

dialectic-reasoning

Sleeping

Kenny Wang commited on Apr 4

Commit

219170b

1 Parent(s): be5a3a5

Add v7 (best-of-N, 13/14 strong) as default model

Files changed (2) hide show

.claude/unitares-session.json ADDED Viewed

+{
+  "server_url": "http://localhost:8767",
+  "agent_name": "claude_dialectic-reasoning-space_20260403",
+  "agent_id": "Claude_Code_20260403",
+  "client_session_id": "agent-a2c5b67e-59c"
+}

app.py CHANGED Viewed

@@ -7,7 +7,11 @@ from transformers import AutoModelForCausalLM, AutoTokenizer
 from peft import PeftModel
 MODELS = {
-    "Qwen3-4B v6 (falsifiable, best)": {
         "base": "Qwen/Qwen3-4B",
         "adapter": "hikewa/dialectic-qwen3-4b-v6-lora",
     },
@@ -118,14 +122,14 @@ demo = gr.ChatInterface(
     additional_inputs=[
         gr.Dropdown(
             choices=list(MODELS.keys()),
-            value="Qwen3-4B v6 (falsifiable, best)",
             label="Model",
         ),
     ],
     title="Dialectic Reasoning Models",
     description=(
         "Fine-tuned on dialectic reasoning traces with falsifiability-based quality filtering. "
-        "v6 (89 traces, 100% falsifiable) scores 8.4 on Mistral-strict rubric — up from v3's 6.8. "
         "Pick a model and ask a question involving competing perspectives."
     ),
     examples=[

 from peft import PeftModel
 MODELS = {
+    "Qwen3-4B v7 (best-of-N, latest)": {
+        "base": "Qwen/Qwen3-4B",
+        "adapter": "hikewa/dialectic-qwen3-4b-v7-lora",
+    },
+    "Qwen3-4B v6 (falsifiable)": {
         "base": "Qwen/Qwen3-4B",
         "adapter": "hikewa/dialectic-qwen3-4b-v6-lora",
     },
     additional_inputs=[
         gr.Dropdown(
             choices=list(MODELS.keys()),
+            value="Qwen3-4B v7 (best-of-N, latest)",
             label="Model",
         ),
     ],
     title="Dialectic Reasoning Models",
     description=(
         "Fine-tuned on dialectic reasoning traces with falsifiability-based quality filtering. "
+        "v7 (113 best-of-N traces from 6 providers) scores 8.3 Mistral-strict with 13/14 strong verdicts. "
         "Pick a model and ask a question involving competing perspectives."
     ),
     examples=[