K.AI 2 — Живая русскоязычная модель для генерации текстов

K.AI 2 — это компактная языковая модель, обученная с нуля на русскоязычных фанфиках. Цель проекта — создать «живую» нейросеть, которая отвечает естественно, без пластикового привкуса корпоративных LLM, и при этом не требует датацентров для работы. Модель запускается даже на MacBook 2011 года и выдаёт ~50 токенов/сек благодаря собственному движку XLLM.

Это Base Model — модель без инструктивной настройки и без каких-либо фильтров. Она генерирует текст как есть: и про любовь, и про кровь. Единственное ограничение — её собственный «мозг»: без грамотного промпта модель склонна скатываться в романтику.

⚠️ Модель нецензурирована. Она может генерировать контент любого характера. Используйте ответственно.


Model Details

Описание

K.AI 2 — это сверхлёгкая LLM на архитектуре Llama 3, обученная с нуля на ~2 ГБ русскоязычных фанфиков. Это не файнтюн существующей модели — веса обучены полностью с нуля. Модель понимает только русский язык.

Ключевая идея: максимально компактная и оптимизированная модель, способная генерировать живые, эмоциональные тексты на потребительском (и даже устаревшем) железе.

  • Разработчик: XellTech
  • Тип модели: Causal Language Model (Base, без instruct-тюнинга)
  • Архитектура: Llama 3 (8 слоёв, 512 dim, QKV, RoPE)
  • Язык: Русский
  • Лицензия: GPL-3.0
  • Обучена с нуля: Да (не является дообучением)

Ресурсы


Использование

Для чего подходит

  • Генерация фанфиков и художественных текстов на русском языке
  • Эксперименты с локальными LLM на слабом железе
  • Тестирование и исследование поведения маленьких моделей
  • Развлечение и творчество без ограничений

Как запустить

Рекомендуемый способ запуска — через XLLM, собственный inference-движок на C++, оптимизированный специально под эту модель. Работает на Linux, Windows и macOS вплоть до 10.6.8.

Скачать XLLM и файлы модели: xelltech.ru/kai_landing.html

Или попробуйте прямо в браузере: kai.xelltech.ru

Для чего НЕ подходит

  • Задачи, требующие фактологической точности (модель галлюцинирует)
  • Любые языки, кроме русского
  • Использование как instruct/chat-модели (это base model, без выравнивания)
  • Продакшн-системы и критичные приложения

Особенности и ограничения

Характер модели

  • Живой стиль — тексты звучат эмоционально и естественно, а не как корпоративная болванка
  • Без фильтрации — модель не отказывается от тем, генерирует всё подряд
  • Романтический уклон — модель обожает любовные линии и склонна затягивать туда даже жёсткие сюжеты. Без тщательной настройки промпта «ум падает в бездну» романтики
  • Маленький мозг — это компактная модель; качество и связность текста ограничены её размером

Риски

  • Генерация NSFW, жестокого или неприемлемого контента без каких-либо предупреждений
  • Фактологические ошибки и галлюцинации
  • Стереотипы и предвзятости, унаследованные из обучающих данных (фанфики)

Обучение

Данные

~2 ГБ русскоязычных фанфиков. Модель обучена с нуля — это не дообучение какой-либо существующей модели.

Архитектура

Параметр Значение
Базовая архитектура Llama 3
Количество слоёв 8
Размерность 512
Внимание QKV с RoPE
Язык Только русский

Производительность

Устройство Скорость
MacBook (2011) через XLLM ~50 токенов/сек

Техническая инфраструктура

Движок — XLLM

Собственный inference-движок на C++, разработанный XellTech. Ключевые особенности:

  • Экстремальная оптимизация под маленькие модели
  • Поддержка macOS 10.6.8+, Linux, Windows
  • Минимальные требования к железу
  • Подробнее: xelltech.ru/kai_landing.html

Цитирование

Если вы используете K.AI 2 в своих проектах или исследованиях:

@misc{kai2,
  title={K.AI 2: Compact Russian Language Model for Creative Text Generation},
  author={XellTech},
  year={2025},
  url={https://xelltech.ru/kai_landing.html}
}

Контакт

Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support