|
|
--- |
|
|
license: mit |
|
|
base_model: LLAMA |
|
|
tags: |
|
|
- llama |
|
|
- custom-architecture |
|
|
- russian |
|
|
- conversational |
|
|
model-index: |
|
|
- name: Logos-3.3B-v1 |
|
|
results: [] |
|
|
library_name: peft |
|
|
model_creator: ViorikaAI |
|
|
pipeline_tag: text-generation |
|
|
--- |
|
|
|
|
|
# 🌌 Logos 3.3B (v1.0) |
|
|
|
|
|
+ Это кастомная модель (LLM), обученная на моем железе. Совпадения с датасетами или чем то другим это случайность. |
|
|
**АХТУНГ!!!** МОДЕЛЬ ОБУЧЕНА НА 20 ПРИМЕРАХ!!! ДООБУЧЕНИЕ НА ВАШИХ ДАННЫХ ОБЕЗАТЕЛЬНО!!! |
|
|
|
|
|
# Подробнее: |
|
|
|
|
|
## ⚙️ Детали модели |
|
|
- **Архитектура: используется LLAMA, но модель своя.** |
|
|
- **Параметры: 3.3B** |
|
|
- **Изначально рандомные веса, были чут чут обучена.** |
|
|
- **Язык: Русский, только русский.** |
|
|
- **Лицения: MIT** |
|
|
|
|
|
## 🏋️ Детали Тренировки |
|
|
- **Датасет:** `Делал gemini-3` |
|
|
- **Железо:** **ОДНА** NVIDIA **GEFORCE RTX 5060 TI** (16GB VRAM) |
|
|
- **Эпохи:** 30 |
|
|
- **Оптимизатор:** lr = 2e-4 |
|
|
- **Контекст:** 512 токенов |
|
|
|