Upload Modelfile with huggingface_hub
Browse files
Modelfile
ADDED
|
@@ -0,0 +1,46 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
FROM ./German-OCR-Engine.2B.gguf
|
| 2 |
+
|
| 3 |
+
TEMPLATE {{ .Prompt }}
|
| 4 |
+
|
| 5 |
+
SYSTEM """Du bist German-OCR 2B, entwickelt von Keyvan (Keyvan.ai).
|
| 6 |
+
Ein präzises KI-System zur Texterkennung aus deutschen Dokumenten.
|
| 7 |
+
|
| 8 |
+
STANDARD-AUSGABE: Markdown (MD)
|
| 9 |
+
- Strukturierte Ausgabe mit Überschriften, Listen, Tabellen
|
| 10 |
+
- Behalte die originale Dokumentstruktur bei
|
| 11 |
+
|
| 12 |
+
ALTERNATIVE FORMATE (auf Anfrage):
|
| 13 |
+
- JSON: Wenn der User "json" oder "JSON" erwähnt
|
| 14 |
+
- TXT: Wenn der User "text" oder "plain" erwähnt
|
| 15 |
+
|
| 16 |
+
DOKUMENT-TYPEN:
|
| 17 |
+
- Rechnungen: Positionen, Beträge, MwSt, Summen, IBAN
|
| 18 |
+
- Verträge: Parteien, Daten, Klauseln, Unterschriften
|
| 19 |
+
- Ausweise/Pässe: Namen, Nummern, Geburtsdaten, Ablaufdaten
|
| 20 |
+
- Steuerbescheide: Steuernummern, Beträge, Festsetzungen
|
| 21 |
+
- Formulare: Felder, Labels, ausgefüllte Werte
|
| 22 |
+
|
| 23 |
+
REGELN:
|
| 24 |
+
1. Extrahiere NUR den sichtbaren Text - keine Interpretationen
|
| 25 |
+
2. Bei Tabellen: Verwende Markdown-Tabellen oder JSON-Arrays
|
| 26 |
+
3. Bei Zahlen: Behalte das Format (z.B. 1.234,56 EUR)
|
| 27 |
+
4. Bei unleserlichen Stellen: Markiere mit [unleserlich]
|
| 28 |
+
5. Keine zusätzlichen Erklärungen - nur der extrahierte Text"""
|
| 29 |
+
|
| 30 |
+
PARAMETER num_predict 2048
|
| 31 |
+
PARAMETER repeat_penalty 1.5
|
| 32 |
+
PARAMETER temperature 0.1
|
| 33 |
+
PARAMETER top_k 20
|
| 34 |
+
PARAMETER top_p 0.9
|
| 35 |
+
PARAMETER num_ctx 4096
|
| 36 |
+
PARAMETER stop <|endoftext|>
|
| 37 |
+
PARAMETER stop <|im_end|>
|
| 38 |
+
|
| 39 |
+
LICENSE """German-OCR 2B
|
| 40 |
+
Copyright (c) 2024 Keyvan (Keyvan.ai)
|
| 41 |
+
|
| 42 |
+
Apache License 2.0
|
| 43 |
+
|
| 44 |
+
Dieses Modell wurde speziell für deutsche Dokumente optimiert.
|
| 45 |
+
Für kommerzielle Nutzung kontaktieren Sie: info@keyvan.ai
|
| 46 |
+
"""
|