Spaces:
Running
Running
mindchain
commited on
Commit
·
a15826a
1
Parent(s):
a592242
Add Self-Improving Agent Loop post
Browse files- index.html +43 -0
index.html
CHANGED
|
@@ -124,6 +124,49 @@ Plus im Gateway: GitHub, Sentry, Z-Image, Web-Search, Browser Automation
|
|
| 124 |
<strong>Alle Tools on-demand</strong> - verfügbar wenn benötigt, ohne Token-Overhead!</div>
|
| 125 |
</div>
|
| 126 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 127 |
<div class="post">
|
| 128 |
<span class="tag">Claude Code Plugin</span>
|
| 129 |
<h2>🐑 Ralph Wiggum</h2>
|
|
|
|
| 124 |
<strong>Alle Tools on-demand</strong> - verfügbar wenn benötigt, ohne Token-Overhead!</div>
|
| 125 |
</div>
|
| 126 |
|
| 127 |
+
<div class="post">
|
| 128 |
+
<span class="tag">Agent Training Loop</span>
|
| 129 |
+
<h2>🔄 Ralph Wiggum + Beads + HF Skills = Self-Improving Agent</h2>
|
| 130 |
+
<div class="date">30. Dez 2025 • Closed-Loop AI Agent Training</div>
|
| 131 |
+
<div class="content"><strong>Die Vision:</strong> Ein Agent, der sich selbst verbessert durch iterative Schleifen.
|
| 132 |
+
|
| 133 |
+
<strong>Der Loop:</strong>
|
| 134 |
+
|
| 135 |
+
<span style="color: #667eea;">1. Ralph Wiggum startet</span> (/ralph-loop)
|
| 136 |
+
• Agent führt Task aus
|
| 137 |
+
• Stop-Hook fährt Resultat ein
|
| 138 |
+
|
| 139 |
+
<span style="color: #667eea;">2. Beads tracked</span>
|
| 140 |
+
• Task wird als Graph-Node gespeichert
|
| 141 |
+
• Dependencies und Blocker werden sichtbar
|
| 142 |
+
• Git-backed - jeder Loop ist versioniert
|
| 143 |
+
|
| 144 |
+
<span style="color: #667eea;">3. HF Skills trainieren</span>
|
| 145 |
+
• Ergebnisse aus Loop werden Dataset
|
| 146 |
+
• model-trainer: SFT/DPO/GRPO auf neuen Daten
|
| 147 |
+
• Agent lernt aus eigenen Erfolgen/Fehlern
|
| 148 |
+
|
| 149 |
+
<span style="color: #667eea;">4. Loop wiederholt</span>
|
| 150 |
+
• Verbesserter Agent startet nächsten Durchlauf
|
| 151 |
+
• Beads zeigt Fortschritt im Graph
|
| 152 |
+
• Performance wird gemessen
|
| 153 |
+
|
| 154 |
+
<strong>Use Cases:</strong>
|
| 155 |
+
• Code-Refactoring Agent trainieren
|
| 156 |
+
• Bug-Finding Skills verbessern
|
| 157 |
+
• Domain-spezifische Tasks optimieren
|
| 158 |
+
|
| 159 |
+
<strong>Die Kombination:</strong> Ralph liefert die Schleife, Beads das Gedächtnis, HF Skills das Lernen.
|
| 160 |
+
|
| 161 |
+
Plus: Gemma Scope 2 + Neuronpedia für mechanistic interpretability - sieh WAS der Agent lernt!
|
| 162 |
+
|
| 163 |
+
Links:
|
| 164 |
+
<a href="https://github.com/anthropics/claude-code/tree/main/plugins/ralph-wiggum" class="link">Ralph Wiggum GitHub</a>
|
| 165 |
+
<a href="https://github.com/steveyegge/beads" class="link">Beads GitHub</a>
|
| 166 |
+
<a href="https://github.com/huggingface/skills" class="link">HF Skills GitHub</a>
|
| 167 |
+
<a href="https://huggingface.co/blog/hf-skills-training" class="link">HF Skills Blog</a></div>
|
| 168 |
+
</div>
|
| 169 |
+
|
| 170 |
<div class="post">
|
| 171 |
<span class="tag">Claude Code Plugin</span>
|
| 172 |
<h2>🐑 Ralph Wiggum</h2>
|