File size: 4,517 Bytes
a0faedd
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
---
license: apache-2.0
language:
- de
- en
tags:
- chat
- assistant
- german
- text
- gguf
- llama-cpp
- ollama
pipeline_tag: text-generation
---

# 🇩🇪 German-Text-3.1

> **Der deutsche Text-Assistent von [Keyvan.ai](https://german-ocr.de) — Teil der German-OCR-3 Kollektion.**

```bash
ollama run Keyvan/german-text-3.1
```

---

## Die Geschichte

German-OCR-3 begann als kleine Idee: ein Modell, das **deutsche Geschäftsdokumente**
wirklich versteht — Rechnungen, Briefe, Bescheide, Verträge. Nicht „auch deutsch", sondern
auf deutsche Sprache und deutsche Bürokratie spezialisiert.

Die **3.1-Generation** ist die feinabgestimmte, engineered + optimierte Version dieser
Kollektion. Zwei spezialisierte Modelle für zwei Aufgaben:

| Modell | Rolle |
|---|---|
| **🇩🇪 German-Text-3.1** *(du bist hier)* | Text-Assistent für Übersetzung, Zusammenfassung, Analyse, Umschreibung, Chat |
| 👁 [**German-OCR-3.1**](https://ollama.com/Keyvan/german-ocr-3.1) | Vision-OCR — extrahiert deutsche Geschäftsdokumente strukturiert als JSON |

Jedes Modell wurde für seine Aufgabe brand-konsistent konfiguriert, mit deutscher
Identität, sauberem Output ohne Thinking-Leak, und Multi-Quant-Distribution.

---

## ✨ Was kann das Modell?

| Aufgabe | Beispiel |
|---|---|
| 🌍 **Übersetzung** DE↔EN multilingual | „Bitte schicken Sie mir die Rechnung bis Freitag." → "Please send me the invoice by Friday." |
| 📝 **Zusammenfassung** | Mehrseitiger Bescheid → 2 Sätze, Zahlen + Namen exakt |
| ✍️ **Umschreibung** | Informell → formelles Geschäftsdeutsch |
| 🔍 **Analyse** | Hauptaussagen, Risiken, Empfehlungen |
| 💬 **Chat** | Q&A über deutsche Geschäftssprache, Verwaltung, Dokumente |
| 🛠 **Tool-Use** | Function-Calling kompatibel |

Stark im **deutschen Geschäftskontext**: Verträge, Behördenschreiben, Rechnungen,
Mahnungen, Lieferscheine, Steuerbescheide.

---

## 🚀 Quick Start

### Ollama (1 Zeile)

```bash
ollama run Keyvan/german-text-3.1
>>> Übersetze ins Englische: Bitte schicken Sie mir die Rechnung bis Freitag.
Please send me the invoice by Friday.
```

API:

```bash
curl http://localhost:11434/api/chat -d '{
  "model": "Keyvan/german-text-3.1",
  "messages": [{"role":"user","content":"Fasse zusammen: ..."}],
  "think": false
}'
```

### llama-server (HF GGUF)

```bash
hf download Keyven/german-text-3.1 german-text-3.1-4B-Q8_0.gguf
llama-server -m german-text-3.1-4B-Q8_0.gguf --port 8080 -ngl 99
```

---

## 📦 Files (auf [HuggingFace](https://huggingface.co/Keyven/german-text-3.1))

### 4B Variant — Empfohlen für Qualität

| File | Größe | Use case |
|---|---|---|
| `german-text-3.1-4B-Q4_K_M.gguf` | 2.6 GB | Compact GPU |
| `german-text-3.1-4B-Q5_K_M.gguf` | 2.9 GB | Balanced |
| `german-text-3.1-4B-Q6_K.gguf` | 3.3 GB | Near-lossless |
| `german-text-3.1-4B-Q8_0.gguf` | 4.3 GB | ⭐ **Recommended** |
| `german-text-3.1-4B-F16.gguf` | 8.0 GB | Full precision |

### 2B Variant — Edge / Low-RAM

| File | Größe | Use case |
|---|---|---|
| `german-text-3.1-2B-Q4_K_M.gguf` | 1.2 GB | Edge, ~2 GB RAM |
| `german-text-3.1-2B-Q8_0.gguf` | 1.9 GB | Schneller |
| `german-text-3.1-2B-F16.gguf` | 3.6 GB | Full precision 2B |

---

## 🛠 Hardware

| Variant | RAM (CPU) | VRAM (GPU) |
|---|---|---|
| 2B Q4 | 2 GB | 2 GB |
| 4B Q4 | 4 GB | 4 GB |
| 4B Q8 | 6 GB | 6 GB |
| 4B F16 | 10 GB | 10 GB |

CPU-Inference möglich, GPU empfohlen. Context: **32 768 Tokens**.

---

## 🤝 German-OCR Familie

| | Was | Wo |
|---|---|---|
| 🇩🇪 **German-Text-3.1** | Text-Assistent (du bist hier) | [ollama.com](https://ollama.com/Keyvan/german-text-3.1) · [HF](https://huggingface.co/Keyven/german-text-3.1) |
| 👁 **German-OCR-3.1** | Vision OCR (DE-Rechnungen → JSON) | [ollama.com](https://ollama.com/Keyvan/german-ocr-3.1) · [HF](https://huggingface.co/Keyven/german-ocr-3.1) |
| ☁️ **German-OCR Cloud API** | Managed OCR Service | [german-ocr.de](https://german-ocr.de) |
| 📝 **German-OCR for Word** | Office Add-in | [office.german-ocr.de](https://office.german-ocr.de) |

---

## 📜 License & Credits

**Apache License 2.0** — kommerzielle Nutzung mit Attribution erlaubt.

**NOTICE**: Aufgebaut auf [Qwen3.5](https://qwenlm.github.io/) von Alibaba Cloud.
Die German-OCR-3.1-Kollektion ist eine in Deutschland engineered + optimierte
Distribution für deutsche Geschäftsdokumente. Architecture credit: Qwen Team.

Build mit ❤️ in 🇩🇪 von **[Keyvan Hardani](https://german-ocr.de)**.