logos / README.md
ViorikaAI's picture
Update README.md
8d61597 verified
metadata
license: mit
base_model: LLAMA
tags:
  - llama
  - custom-architecture
  - russian
  - conversational
model-index:
  - name: Logos-3.3B-v1
    results: []
library_name: peft
model_creator: ViorikaAI
pipeline_tag: text-generation

🌌 Logos 3.3B (v1.0)

  • Это кастомная модель (LLM), обученная на моем железе. Совпадения с датасетами или чем то другим это случайность. АХТУНГ!!! МОДЕЛЬ ОБУЧЕНА НА 20 ПРИМЕРАХ!!! ДООБУЧЕНИЕ НА ВАШИХ ДАННЫХ ОБЕЗАТЕЛЬНО!!!

Подробнее:

⚙️ Детали модели

  • Архитектура: используется LLAMA, но модель своя.
  • Параметры: 3.3B
  • Изначально рандомные веса, были чут чут обучена.
  • Язык: Русский, только русский.
  • Лицения: MIT

🏋️ Детали Тренировки

  • Датасет: Делал gemini-3
  • Железо: ОДНА NVIDIA GEFORCE RTX 5060 TI (16GB VRAM)
  • Эпохи: 30
  • Оптимизатор: lr = 2e-4
  • Контекст: 512 токенов