nativemind commited on
Commit
ac17011
·
verified ·
1 Parent(s): 1e85d2d

Upload folder using huggingface_hub

Browse files
Files changed (2) hide show
  1. README.md +118 -16
  2. README_GGUF.md +149 -0
README.md CHANGED
@@ -1,24 +1,44 @@
1
  # Braindler Final Model v2
2
 
3
- Модель fine-tuned на датасетах:
4
 
5
- ## Датасеты
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
6
 
7
  1. **mozgach_trener** (97 примеров)
8
- - Образовательный контент на русском
9
- - Алфавит, цифры, цвета, фигуры
10
-
11
- 2. **alice_gift** (175 примеров)
12
- - Дополнительные текстовые данные
13
 
14
- ## Статистика обучения
 
15
 
16
- - Всего примеров: 163
17
- - Эпох: 3
18
- - Базовая модель: nativemind/braindler_full_trained_model
19
- - Дата: 2025-10-20
20
 
21
- ## Использование
 
 
22
 
23
  ```python
24
  from transformers import AutoModelForCausalLM, AutoTokenizer
@@ -28,15 +48,97 @@ tokenizer = AutoTokenizer.from_pretrained("nativemind/braindler_final_model")
28
 
29
  prompt = "User: Как произносится буква А?\nAssistant:"
30
  inputs = tokenizer(prompt, return_tensors="pt")
31
- outputs = model.generate(**inputs, max_length=200)
32
  print(tokenizer.decode(outputs[0]))
33
  ```
34
 
35
- ## Контакты
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
36
 
37
  - Email: anton.v.dodonov@gmail.com
38
  - HuggingFace: nativemind
 
39
 
40
  ---
41
 
42
- © 2025 NativeMind. NativeMindNONC License (Non-Commercial)
 
 
 
1
  # Braindler Final Model v2
2
 
3
+ 🎓 **Образовательный AI-ассистент для изучения русского языка**
4
 
5
+ Модель fine-tuned на образовательных датасетах для помощи детям и взрослым в изучении русского языка.
6
+
7
+ ## 📦 Доступные форматы
8
+
9
+ ### HuggingFace (PyTorch)
10
+ Стандартный формат для использования с Transformers (501 MB)
11
+
12
+ ### GGUF (llama.cpp / Ollama)
13
+ Оптимизированные квантизированные версии для локального запуска:
14
+
15
+ | Версия | Размер | Качество | Рекомендация |
16
+ |--------|--------|----------|--------------|
17
+ | Q2_K | 68 MB | Минимальное | Слабые устройства 📱 |
18
+ | Q3_K_S | 73 MB | Низкое | Мобильные 💻 |
19
+ | Q4_K_S | 84 MB | Среднее | Баланс ⚖️ |
20
+ | **Q4_K_M** | **90 MB** | **Хорошее** | ⭐ **РЕКОМЕНДУЕТСЯ** |
21
+ | Q5_K_M | 99 MB | Высокое | Продакшн 💎 |
22
+ | Q8_0 | 133 MB | Отличное | Максимум 🏆 |
23
+ | F16 | 244 MB | Без потерь | GPU 🎯 |
24
+
25
+ ## 📚 Датасеты для обучения
26
 
27
  1. **mozgach_trener** (97 примеров)
28
+ - Алфавит (66 примеров)
29
+ - Цифры (11 примеров)
30
+ - Цвета (10 примеров)
31
+ - Геометрические фигуры (5 примеров)
32
+ - Голосовые команды (5 примеров)
33
 
34
+ 2. **alice_gift** (66 примеров)
35
+ - Дополнительные текстовые данные на русском
36
 
37
+ **Всего примеров: 163 | Эпох: 3**
 
 
 
38
 
39
+ ## 🚀 Использование
40
+
41
+ ### С Transformers (PyTorch)
42
 
43
  ```python
44
  from transformers import AutoModelForCausalLM, AutoTokenizer
 
48
 
49
  prompt = "User: Как произносится буква А?\nAssistant:"
50
  inputs = tokenizer(prompt, return_tensors="pt")
51
+ outputs = model.generate(**inputs, max_length=200, temperature=0.7)
52
  print(tokenizer.decode(outputs[0]))
53
  ```
54
 
55
+ ### С Ollama (GGUF) ⭐ Рекомендуется
56
+
57
+ ```bash
58
+ # 1. Скачайте GGUF файл
59
+ huggingface-cli download nativemind/braindler_final_model \
60
+ braindler_final_model_Q4_K_M.gguf --local-dir ./
61
+
62
+ # 2. Создайте Modelfile
63
+ cat > Modelfile << 'EOF'
64
+ FROM ./braindler_final_model_Q4_K_M.gguf
65
+ TEMPLATE """{{- if .System }}System: {{ .System }}{{- end }}
66
+ User: {{ .Prompt }}
67
+ Assistant:"""
68
+ PARAMETER temperature 0.7
69
+ PARAMETER top_p 0.9
70
+ PARAMETER num_ctx 2048
71
+ SYSTEM """Ты - Braindler, образовательный ассистент для изучения русского языка. Помогаешь учить буквы, цифры, цвета и слова. Отвечай дружелюбно и понятно."""
72
+ EOF
73
+
74
+ # 3. Создайте модель
75
+ ollama create braindler -f Modelfile
76
+
77
+ # 4. Запустите
78
+ ollama run braindler
79
+ ```
80
+
81
+ ### С llama.cpp
82
+
83
+ ```bash
84
+ # Скачайте GGUF файл и запустите
85
+ ./llama-cli \
86
+ -m braindler_final_model_Q4_K_M.gguf \
87
+ -p "User: Расскажи о букве А\nAssistant:" \
88
+ -n 128 --temp 0.7 -ngl 99
89
+ ```
90
+
91
+ ## 📖 Примеры
92
+
93
+ ```
94
+ User: Как произносится буква А?
95
+ Assistant: Буква 'А' произносится как 'а'. Попробуй произнести её вслух: а.
96
+
97
+ User: Назови слова на букву Б
98
+ Assistant: Слова на букву 'б': банан, бабочка, барабан, белка
99
+
100
+ User: Что такое треугольник?
101
+ Assistant: Треугольник - это фигура с 3 сторонами и 3 углами. Похож на крышу дома.
102
+ ```
103
+
104
+ ## 📊 Характеристики модели
105
+
106
+ - Базовая модель: nativemind/braindler_full_trained_model
107
+ - Архитектура: GPT-2 (125M параметров)
108
+ - Язык: Русский 🇷🇺
109
+ - Контекст: 2048 токенов
110
+ - Задача: Text Generation, Образовательный ассистент
111
+ - Лицензия: NativeMindNONC (Non-Commercial)
112
+
113
+ ## 🎯 Применение
114
+
115
+ - Образовательные приложения для детей
116
+ - Обучение рус��кому языку
117
+ - Интерактивные образовательные боты
118
+ - Голосовые ассистенты
119
+ - Локальные AI приложения
120
+
121
+ ## ⚙️ Рекомендации по выбору версии
122
+
123
+ - **Мобильные устройства**: Q2_K или Q3_K_S
124
+ - **Десктопы/ноутбуки**: Q4_K_M ⭐ (лучший баланс)
125
+ - **Продакшн**: Q5_K_M
126
+ - **Максимальное качество**: Q8_0 или F16
127
+
128
+ ## 🔗 Ссылки
129
+
130
+ - **Model**: https://huggingface.co/nativemind/braindler_final_model
131
+ - **Dataset 1**: https://huggingface.co/datasets/nativemind/mozgach_trener
132
+ - **Dataset 2**: https://huggingface.co/datasets/nativemind/mozgach_alice_gift
133
+
134
+ ## 📧 Контакты
135
 
136
  - Email: anton.v.dodonov@gmail.com
137
  - HuggingFace: nativemind
138
+ - Дата: 2025-10-20
139
 
140
  ---
141
 
142
+ © 2025 NativeMind. Для некоммерческого использования.
143
+
144
+ **Образование должно быть доступным!** 🎓
README_GGUF.md ADDED
@@ -0,0 +1,149 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ # Braindler Final Model - GGUF Versions
2
+
3
+ Высококачественные квантизированные версии модели Braindler для использования с **llama.cpp**, **Ollama**, **LM Studio** и другими.
4
+
5
+ ## 📦 Доступные версии
6
+
7
+ | Квантизация | Размер | Качество | Рекомендация |
8
+ |-------------|--------|----------|--------------|
9
+ | **Q2_K** | 68 MB | Минимальное | Для ограниченных устройств 📱 |
10
+ | **Q3_K_S** | 73 MB | Низкое | Для слабых устройств 💻 |
11
+ | **Q4_K_S** | 84 MB | Среднее | Хороший баланс ⚖️ |
12
+ | **Q4_K_M** | 90 MB | Хорошее | ⭐ **РЕКОМЕНДУЕТСЯ** для большинства |
13
+ | **Q5_K_M** | 99 MB | Высокое | Отличное качество 💎 |
14
+ | **Q8_0** | 133 MB | Отличное | Почти без потерь 🏆 |
15
+ | **F16** | 244 MB | Без потерь | Для GPU/референса 🎯 |
16
+
17
+ ## 🚀 Использование с Ollama
18
+
19
+ ### 1. Создайте Modelfile
20
+
21
+ ```dockerfile
22
+ FROM ./braindler_final_model_Q4_K_M.gguf
23
+
24
+ TEMPLATE """{{- if .System }}
25
+ System: {{ .System }}
26
+ {{- end }}
27
+ User: {{ .Prompt }}
28
+ Assistant:"""
29
+
30
+ PARAMETER temperature 0.7
31
+ PARAMETER top_p 0.9
32
+ PARAMETER top_k 40
33
+ PARAMETER num_ctx 2048
34
+
35
+ SYSTEM """Ты - Braindler, образовательный ассистент для детей и взрослых, изучающих русский язык. Помогаешь учить буквы, цифры, цвета и слова. Отвечай дружелюбно и понятно."""
36
+ ```
37
+
38
+ ### 2. Создайте модель в Ollama
39
+
40
+ ```bash
41
+ ollama create braindler -f Modelfile
42
+ ```
43
+
44
+ ### 3. Запустите модель
45
+
46
+ ```bash
47
+ ollama run braindler
48
+ ```
49
+
50
+ ```bash
51
+ >>> Как произносится буква А?
52
+ Буква 'А' произносится как 'а'. Попробуй произнести её вслух: а.
53
+
54
+ >>> Назови слова на букву Б
55
+ Слова на букву 'б': банан, бабочка, барабан, белка
56
+ ```
57
+
58
+ ## 🔧 Использование с llama.cpp
59
+
60
+ ```bash
61
+ # Запуск интерактивного чата
62
+ ./llama.cpp/build/bin/llama-cli \
63
+ -m braindler_final_model_Q4_K_M.gguf \
64
+ -p "User: Как произносится буква А?\nAssistant:" \
65
+ -n 128 \
66
+ --temp 0.7 \
67
+ --top-p 0.9
68
+
69
+ # Использование с GPU Metal (Apple Silicon)
70
+ ./llama.cpp/build/bin/llama-cli \
71
+ -m braindler_final_model_Q4_K_M.gguf \
72
+ -ngl 99 \
73
+ -p "User: Расскажи о цифре 5\nAssistant:"
74
+ ```
75
+
76
+ ## 💻 Использование с LM Studio
77
+
78
+ 1. Скачайте любую GGUF версию
79
+ 2. Откройте LM Studio
80
+ 3. Перетащите файл `.gguf` в окно
81
+ 4. Загрузите модель и начните чат
82
+
83
+ ## 📊 Характеристики модели
84
+
85
+ - **Архитектура**: GPT-2 (125M параметров)
86
+ - **Базовая модель**: nativemind/braindler_full_trained_model
87
+ - **Датасеты для fine-tuning**:
88
+ - mozgach_trener (97 примеров) - алфавит, цифры, цвета, фигуры
89
+ - alice_gift (66 примеров) - дополнительные текстовые данные
90
+ - **Язык**: Русский 🇷🇺
91
+ - **Контекст**: 2048 токенов
92
+ - **Лицензия**: NativeMindNONC (Non-Commercial)
93
+
94
+ ## 🎯 Применение
95
+
96
+ - Образовательные приложения для детей
97
+ - Обучение русскому языку
98
+ - Интерактивные образовательные чат-боты
99
+ - Голосовые ассистенты
100
+ - Локальные AI приложения без интернета
101
+
102
+ ## 📖 Примеры промптов
103
+
104
+ ```
105
+ User: Как правильно произнести букву 'А'?
106
+ Assistant: Буква 'А' произносится как 'а'. Попробуй произнести её вслух: а.
107
+
108
+ User: Назови слова на букву Б
109
+ Assistant: Слова на букву 'б': банан, бабочка, барабан, белка
110
+
111
+ User: Расскажи о цвете красный
112
+ Assistant: Цвет 'красный' - это один из основных цветов. Это цвет яблока, помидора и клубники. Яркий и теплый цвет.
113
+
114
+ User: Что такое треугольник?
115
+ Assistant: Треугольник - это фигура с 3 сторонами и 3 углами. Похож на крышу дома или пирамиду.
116
+ ```
117
+
118
+ ## ⚙️ Рекомендации по выбору версии
119
+
120
+ ### Для мобильных/слабых устройств
121
+ → **Q2_K** или **Q3_K_S** (68-73 MB)
122
+
123
+ ### Для десктопов/ноутбуков
124
+ → **Q4_K_M** (90 MB) ⭐ лучший баланс
125
+
126
+ ### Для производствен��ого использования
127
+ → **Q5_K_M** (99 MB) высокое качество
128
+
129
+ ### Для максимального качества
130
+ → **Q8_0** (133 MB) или **F16** (244 MB)
131
+
132
+ ## 🔗 Ссылки
133
+
134
+ - **HuggingFace Model**: https://huggingface.co/nativemind/braindler_final_model
135
+ - **Dataset 1**: https://huggingface.co/datasets/nativemind/mozgach_trener
136
+ - **Dataset 2**: https://huggingface.co/datasets/nativemind/mozgach_alice_gift
137
+
138
+ ## 📧 Контакты
139
+
140
+ - **Email**: anton.v.dodonov@gmail.com
141
+ - **HuggingFace**: nativemind
142
+ - **Дата**: 2025-10-20
143
+
144
+ ---
145
+
146
+ © 2025 NativeMind. Для некоммерческого использования.
147
+
148
+ **Образование должно быть доступным!** 🎓
149
+