oakai:alpha10

Domänenspezifisches Sprachmodell für Retail- und Kundenanalytik Ein von OAKAI auf Basis von Qwen2.5-7B feinabgestimmtes, vollständig lokal lauffähiges Modell. Klarheit – statt Hype.


Überblick

oakai:alpha10 ist auf wiederkehrende Analyseaufgaben im Retail- und E-Commerce-Umfeld spezialisiert und liefert dafür präzise, maschinenlesbare Antworten in festem Format bei minimaler Latenz. Es wurde nicht auf breiteres Weltwissen trainiert, sondern gezielt für den Einsatz in automatisierten Datenpipelines optimiert – etwa zur Auswertung von Bestellungen, Kundenbewertungen und Serviceanfragen.

Aufgabe Beschreibung Beispiel-Output
Kundensegmentierung Bestellungen als B2B/B2C einordnen B2B_bestaetigt
Feedback-Analyse Bewertungen nach Stimmung und Problemtyp Sentiment: negative, bug: ja
Semantisches Matching Anliegen auf inhaltliche Gleichheit prüfen Ja, dasselbe Problem.
Themen-Clustering Serviceanfragen Kategorien zuordnen Produktverbindung

Benchmark

40 ungesehene Testfälle (10 je Aufgabe), deterministisch (Temperatur 0), gemessen auf Mac Studio M4 Max.

Modell Gesamt-Genauigkeit Zeit/Antwort Tokens/Antwort
oakai:alpha10 90 % 0,34 s 4
qwen2.5:7b (Basis) 85 % 2,87 s 220
gemma4:latest (12B) 92 % 8,41 s 634

Kernergebnis: Praktisch die Genauigkeit eines rund 3× größeren Modells, bei 25× kürzerer Antwortzeit und einem um Faktor 150 knapperen, direkt weiterverarbeitbaren Output.

(Ein weiteres Modell, gemma3:12b, wurde wegen eines Konfigurationsfehlers während der Messung aus der Wertung genommen, um die Vergleichbarkeit zu wahren.)


Verwendung

Mit Ollama (empfohlen)

# GGUF herunterladen, dann ein Modelfile anlegen:
cat > Modelfile <<'EOF'
FROM ./oakai-alpha10-q4_K_M.gguf
PARAMETER temperature 0.6
PARAMETER num_ctx 8192
PARAMETER stop "<|im_end|>"
SYSTEM """Du bist oakai:alpha10, ein KI-Assistent von OAKAI.
Spezialisiert auf deutsche Semantik, Klassifikation und Textanalyse."""
EOF

ollama create oakai:alpha10 -f Modelfile
ollama run oakai:alpha10 "Ordne diese Serviceanfrage einer Kategorie zu.
Anfrage: Mein Geraet verbindet sich nicht mehr mit dem Smartphone."

Mit llama.cpp

llama-cli -m oakai-alpha10-q4_K_M.gguf -p "Klassifiziere diese Bestellung als B2B oder B2C: Firma Muster GmbH, 120 Stueck, USt-ID ja"

Modelldetails

  • Basismodell: Qwen2.5-7B-Instruct (Apache 2.0)
  • Trainingsmethode: QLoRA (4-bit), 1200 Iterationen, MLX auf Apple Silicon
  • Validierungs-Loss: 4,12 → 0,30
  • Quantisierung: Q4_K_M (~4,7 GB)
  • Sprache: Deutsch
  • Kontextlänge: bis 32.768 Token

Trainingsdaten

Trainiert auf 5.000 synthetischen Beispielen aus dem Retail-/E-Commerce-Kontext (fiktive Marke, Produkt- und Firmennamen frei erfunden). Die zugrundeliegenden Muster – B2B/B2C-Signale, die Divergenz zwischen Sternebewertung und tatsächlichem Textinhalt, sowie typische Cluster von Serviceanfragen – sind realen Analyseaufgaben nachempfunden. Das Modell enthält keine echten Kundendaten.


Stärken und Grenzen

Stärken: sehr schnelle, knappe, maschinenlesbare Klassifikation; läuft vollständig lokal (Datenschutz); keine Betriebskosten; kompakt; lizenzsauber weitergebbar.

Grenzen: liefert Labels statt erklärender Fließtexte; auf die trainierten Aufgabentypen spezialisiert; vereinzelt Sprach-Artefakte der Basis möglich; auf synthetischer Datenbasis trainiert (Proof of Concept); feste Kategorien (neue erfordern erneutes Training).


Lizenz

Apache License 2.0. Abgeleitet von Qwen2.5-7B-Instruct (© Alibaba Cloud). Siehe LICENSE und NOTICE. Fine-Tuning und Distribution: OAKAI / Ralph Ray Schwehr, 2026.

Dieses Modell ist ein Proof of Concept.

Downloads last month
-
GGUF
Model size
8B params
Architecture
qwen2
Hardware compatibility
Log In to add your hardware

4-bit

Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for RaSchwehr/oakai-alpha10

Base model

Qwen/Qwen2.5-7B
Adapter
(2242)
this model