Spaces:

mindchain
/

react-blog

Running

App Files Files Community

mindchain commited on Dec 30, 2025

Commit

df92f8e

1 Parent(s): 55cccea

Separate Finetuning and Steering as two distinct disciplines

Browse files

Files changed (1) hide show

index.html +44 -22

index.html CHANGED Viewed

@@ -170,36 +170,58 @@ Alles läuft in Containern - reproduzierbar und isoliert.
 <a href="https://docs.docker.com/ai/mcp-catalog-and-toolkit/server-docker/" class="link">Docker MCP Server Docs</a>
 • Container <span style="color: #667eea;">on-demand</span> erstellen
 • Nach Gebrauch automatisch <span style="color: #667eea;">kill & cleanup</span>
-• Jeder Loop in frischem Container
 • <span style="color: #667eea;">Alle mit Docker Sandboxes!</span>
 • GPU-Container für ML Workloads
-• <span style="color: #667eea;">Gilt auch für Agenten im Docker MCP Gateway!</span>
-<strong>4. HF Skills</strong> (Model Training)
-HuggingFace Skills für Training auf Loop-Ergebnissen.
-<a href="https://github.com/huggingface/skills" class="link">HF Skills GitHub</a>
-• model-trainer: SFT/DPO/GRPO
-• Ergebnisse werden Dataset
-• Agent lernt aus eigenen Erfolgen/Fehlern
-<strong>5. Gemma Scope 2 + Neuronpedia</strong> (Interpretability)
-Training wird transparent und steuerbar.
-<a href="https://www.neuronpedia.org/gemma-scope-2" class="link">neuronpedia.org/gemma-scope-2</a>
-<span style="color: #667eea;">Discovery:</span> SAE Features finden die Verhalten bestimmen
-<span style="color: #667eea;">Steering:</span> Feature-Stärke ändern (↑/↓)
-<span style="color: #667eea;">Freezing:</span> Gelernte Patterns fixieren
-<strong>Der vollständige Loop:</strong>
 1. Ralph startet → Agent führt Task aus
 2. Beads tracked → Graph speichert Fortschritt
 3. Docker MCP → Container on-demand erstellen
-4. Agent arbeitet → Isoliert im Container
-5. Gemma Scope 2 → Activations werden analysiert
-6. Neuronpedia → Discovery: Wichtige Features finden
-7. Steering → Agent-Verhalten aktiv korrigieren
-8. HF Skills → Gelerntes in Model trainieren
-9. Freezing → Erfolgreiche Patterns fixieren
 10. Container cleanup → Automatisch kill & löschen
 11. Loop wiederholt → Verbesserter Agent

 <a href="https://docs.docker.com/ai/mcp-catalog-and-toolkit/server-docker/" class="link">Docker MCP Server Docs</a>
 • Container <span style="color: #667eea;">on-demand</span> erstellen
 • Nach Gebrauch automatisch <span style="color: #667eea;">kill & cleanup</span>
 • <span style="color: #667eea;">Alle mit Docker Sandboxes!</span>
 • GPU-Container für ML Workloads
+<strong>Zwei Disziplinen für Agent-Verbesserung:</strong>
+<span style="color: #667eea;">━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━</span>
+<strong>🔧 PATH A: Finetuning</strong> (Permanent)
+<a href="https://github.com/huggingface/skills" class="link">HF Skills GitHub</a>
+• <strong>Was:</strong> Model-Gewichte werden dauerhaft geändert
+• <strong>Wie:</strong> SFT, DPO, GRPO auf HF Jobs
+• <strong>Resultat:</strong> Neues Model mit gelerntem Verhalten
+• <strong>Dauer:</strong> Permanent
+• <strong>Vorteil:</strong> Gelerntes Wissen bleibt erhalten
+<strong>🎯 PATH B: Steering</strong> (Runtime)
+<a href="https://www.neuronpedia.org/gemma-scope-2" class="link">Gemma Scope 2 + Neuronpedia</a>
+• <strong>Was:</strong> Verhalten zur Laufzeit beeinflussen
+• <strong>Wie:</strong> Activation Engineering / Feature Steering
+• <strong>Resultat:</strong> Verändert Output ohne Gewichtsänderung
+• <strong>Dauer:</strong> Nur während Inference
+• <strong>Vorteil:</strong> Reversible, kein Retraining nötig
+<span style="color: #667eea;">━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━</span>
+<strong>Beide Pfade kombinieren:</strong>
+<strong>Discovery Skills</strong> (Gemma Scope 2 + Neuronpedia)
+• SAE Features finden die Verhalten bestimmen
+• Circuits identifizieren (Kausal-Ketten)
+• 4TB+ activations, explanations, metadata
+<strong>Steering Skills</strong> (Runtime Control)
+• Feature-Stärke erhöhen/verringern (↑/↓)
+• API: POST /api/steer mit strength_multiplier
+• Sofortige Wirkung ohne Training
+<strong>Freezing Skills</strong> (Persistenz)
+• Wichtige Circuits identifizieren und speichern
+• Erfolgreiche Patterns in Finetuning übernehmen
+• Agent-Verhalten konsistent halten
+<strong>Der Loop mit beiden Disziplinen:</strong>
 1. Ralph startet → Agent führt Task aus
 2. Beads tracked → Graph speichert Fortschritt
 3. Docker MCP → Container on-demand erstellen
+4. Agent arbeitet → Isoliert im Sandbox-Container
+5. <span style="color: #667eea;">[PATH A]</span> HF Skills → Finetuning für permanentes Lernen
+6. <span style="color: #667eea;">[PATH B]</span> Gemma Scope → Activations analysieren
+7. <span style="color: #667eea;">[PATH B]</span> Neuronpedia → Discovery: Features finden
+8. <span style="color: #667eea;">[PATH B]</span> Steering → Laufzeit-Korrektur
+9. <span style="color: #667eea;">[BOTH]</span> Freezing → Erfolgreiche Patterns fixieren
 10. Container cleanup → Automatisch kill & löschen
 11. Loop wiederholt → Verbesserter Agent