Это модель предназначенная для генерации анекдотов на русском языке. Обучена на кастомном BPE токенайзере из 1024 токенов, а за основу модели была взята архитектура трансформеров. На графики ниже вы можете найти ошибку на валидации и трейне по мере обучения модели (1000 шагов).
Результаты для nano модели: Заходит в бармену в как избирается:- А что ты нашей больше ты так-зать! Вась.\n [EOS] Штирлиц пришел домой и банной головорит:\n- На, и без без будет, чтобы не понять?[EOS]
- Downloads last month
- -
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support
