Update README.md
Browse files
README.md
CHANGED
|
@@ -1,23 +1,52 @@
|
|
| 1 |
-
|
| 2 |
-
tags:
|
| 3 |
-
- gguf
|
| 4 |
-
- llama.cpp
|
| 5 |
-
- unsloth
|
| 6 |
|
| 7 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 8 |
|
| 9 |
-
#
|
| 10 |
|
| 11 |
-
|
| 12 |
|
| 13 |
-
|
| 14 |
-
- For text only LLMs: `./llama.cpp/llama-cli -hf nekam13/zbynka --jinja`
|
| 15 |
-
- For multimodal models: `./llama.cpp/llama-mtmd-cli -hf nekam13/zbynka --jinja`
|
| 16 |
|
| 17 |
-
|
| 18 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 19 |
|
| 20 |
-
|
| 21 |
-
An Ollama Modelfile is included for easy deployment.
|
| 22 |
-
This was trained 2x faster with [Unsloth](https://github.com/unslothai/unsloth)
|
| 23 |
-
[<img src="https://raw.githubusercontent.com/unslothai/unsloth/main/images/unsloth%20made%20with%20love.png" width="200"/>](https://github.com/unslothai/unsloth)
|
|
|
|
| 1 |
+
# 🧙♀️ Zbyňka: Strážkyně historie a moudrosti (v. 2026)
|
|
|
|
|
|
|
|
|
|
|
|
|
| 2 |
|
| 3 |
+
**Zbyňka** je personalizovaný AI model (finetunovaný Qwen 2.5 3B), který slouží jako digitální inkarnace moudrosti a znalostí o české kouzelnické historii, škole **RAKALUM** (Rudolfova akademie) a fenoménu **kouzlonesu**.
|
| 4 |
+
|
| 5 |
+
Model je trénován pro rok **2026** a je navržen tak, aby odpovídal kultivovanou češtinou s nadhledem a hlubokou znalostí lokálního kontextu.
|
| 6 |
+
|
| 7 |
+
## 📊 Datové zdroje
|
| 8 |
+
|
| 9 |
+
Model vychází z unikátních datasetů spravovaných v rámci projektu:
|
| 10 |
+
|
| 11 |
+
* **[Kouzelnická historie v ČR (JSON)](https://huggingface.co/datasets/nekam13/zbynka-dataset/resolve/main/Kouzelnick%C3%A1%20historie%20v%20%C4%8CR_260214_145343_tokens.json)** – Hlavní vědomostní báze v tokenizovaném formátu.
|
| 12 |
+
* **[Hlavní konverzační dataset (CSV)](https://huggingface.co/datasets/nekam13/zbynka-dataset/resolve/main/cvsdataset.csv)** – Instrukční data definující tón hlasu a osobnost Zbyňky.
|
| 13 |
+
|
| 14 |
+
## 🛠 Technické parametry tréninku
|
| 15 |
+
|
| 16 |
+
Model byl vytvořen pomocí knihovny **Unsloth** na architektuře Llama/Qwen.
|
| 17 |
+
|
| 18 |
+
* **Formát:** GGUF (vhodné pro mobilní zařízení a lokální běh).
|
| 19 |
+
* **Kvantizace:** `q4_k_m` (optimální poměr mezi inteligencí a velikostí).
|
| 20 |
+
* **Kontextové okno:** 32k (v mobilních aplikacích doporučeno 2048 pro úsporu RAM).
|
| 21 |
+
* **Tréninková metoda:** LoRA (Low-Rank Adaptation).
|
| 22 |
|
| 23 |
+
## 📱 Použití v PocketPal AI (Mobile)
|
| 24 |
|
| 25 |
+
Pro správné fungování Zbyňky v mobilu je nutné nastavit následující parametry:
|
| 26 |
|
| 27 |
+
### 1. System Prompt
|
|
|
|
|
|
|
| 28 |
|
| 29 |
+
> Jsi moderní AI agentka inspirovaná moudrostí Zbyňky Čechové. Žiješ v roce 2026, jsi vstřícná a prozřívavá. Odpovídáš česky a využíváš své znalosti o Rudolfově akademii (RAKALUM) a historii kouzlonesu.
|
| 30 |
+
|
| 31 |
+
### 2. Prompt Template (ChatML)
|
| 32 |
+
|
| 33 |
+
Model byl trénován na šabloně **ChatML**. Ujistěte se, že vaše aplikace používá tyto značky:
|
| 34 |
+
|
| 35 |
+
```text
|
| 36 |
+
<|im_start|>system
|
| 37 |
+
[System Prompt]<|im_end|>
|
| 38 |
+
<|im_start|>user
|
| 39 |
+
[Vaše otázka]<|im_end|>
|
| 40 |
+
<|im_start|>assistant
|
| 41 |
+
|
| 42 |
+
```
|
| 43 |
+
|
| 44 |
+
### 3. Doporučené parametry generování
|
| 45 |
+
|
| 46 |
+
* **Temperature:** 0.4 - 0.7 (nižší pro fakta, vyšší pro povídání).
|
| 47 |
+
* **Repeat Penalty:** 1.1.
|
| 48 |
+
* **Stop Tokens:** `<|im_end|>`, `<|endoftext|>`.
|
| 49 |
+
|
| 50 |
+
---
|
| 51 |
|
| 52 |
+
**Poznámka autora:** Tento model je ve fázi beta a jeho znalosti historie jsou neustále doplňovány. V roce 2026 je Zbyňka připravena pomoci každému, kdo hledá radu nebo vhled do tajů české magie.
|
|
|
|
|
|
|
|
|