mindchain commited on
Commit
a15826a
·
1 Parent(s): a592242

Add Self-Improving Agent Loop post

Browse files
Files changed (1) hide show
  1. index.html +43 -0
index.html CHANGED
@@ -124,6 +124,49 @@ Plus im Gateway: GitHub, Sentry, Z-Image, Web-Search, Browser Automation
124
  <strong>Alle Tools on-demand</strong> - verfügbar wenn benötigt, ohne Token-Overhead!</div>
125
  </div>
126
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
127
  <div class="post">
128
  <span class="tag">Claude Code Plugin</span>
129
  <h2>🐑 Ralph Wiggum</h2>
 
124
  <strong>Alle Tools on-demand</strong> - verfügbar wenn benötigt, ohne Token-Overhead!</div>
125
  </div>
126
 
127
+ <div class="post">
128
+ <span class="tag">Agent Training Loop</span>
129
+ <h2>🔄 Ralph Wiggum + Beads + HF Skills = Self-Improving Agent</h2>
130
+ <div class="date">30. Dez 2025 • Closed-Loop AI Agent Training</div>
131
+ <div class="content"><strong>Die Vision:</strong> Ein Agent, der sich selbst verbessert durch iterative Schleifen.
132
+
133
+ <strong>Der Loop:</strong>
134
+
135
+ <span style="color: #667eea;">1. Ralph Wiggum startet</span> (/ralph-loop)
136
+ • Agent führt Task aus
137
+ • Stop-Hook fährt Resultat ein
138
+
139
+ <span style="color: #667eea;">2. Beads tracked</span>
140
+ • Task wird als Graph-Node gespeichert
141
+ • Dependencies und Blocker werden sichtbar
142
+ • Git-backed - jeder Loop ist versioniert
143
+
144
+ <span style="color: #667eea;">3. HF Skills trainieren</span>
145
+ • Ergebnisse aus Loop werden Dataset
146
+ • model-trainer: SFT/DPO/GRPO auf neuen Daten
147
+ • Agent lernt aus eigenen Erfolgen/Fehlern
148
+
149
+ <span style="color: #667eea;">4. Loop wiederholt</span>
150
+ • Verbesserter Agent startet nächsten Durchlauf
151
+ • Beads zeigt Fortschritt im Graph
152
+ • Performance wird gemessen
153
+
154
+ <strong>Use Cases:</strong>
155
+ • Code-Refactoring Agent trainieren
156
+ • Bug-Finding Skills verbessern
157
+ • Domain-spezifische Tasks optimieren
158
+
159
+ <strong>Die Kombination:</strong> Ralph liefert die Schleife, Beads das Gedächtnis, HF Skills das Lernen.
160
+
161
+ Plus: Gemma Scope 2 + Neuronpedia für mechanistic interpretability - sieh WAS der Agent lernt!
162
+
163
+ Links:
164
+ <a href="https://github.com/anthropics/claude-code/tree/main/plugins/ralph-wiggum" class="link">Ralph Wiggum GitHub</a>
165
+ <a href="https://github.com/steveyegge/beads" class="link">Beads GitHub</a>
166
+ <a href="https://github.com/huggingface/skills" class="link">HF Skills GitHub</a>
167
+ <a href="https://huggingface.co/blog/hf-skills-training" class="link">HF Skills Blog</a></div>
168
+ </div>
169
+
170
  <div class="post">
171
  <span class="tag">Claude Code Plugin</span>
172
  <h2>🐑 Ralph Wiggum</h2>