--- tags: - model_hub_mixin - pytorch_model_hub_mixin datasets: - IgorVolochay/russian_jokes language: - ru - en pipeline_tag: text2text-generation --- # [Легковесный трансформер для генерации текста с ALiBi, GQA и SwiGLU.] ## 📖 Описание Данная модель представляет собой трансформерную архитектуру, оптимизированную для работы с короткими текстами. Она использует: - **ALiBi** для позиционного кодирования - **GQA** для эффективного механизма внимания - **SwiGLU** в Feed-Forward блоке для лучшей обработки информации Модель обучена на [IgorVolochay/russian_jokes] и предназначена для генерации осмысленного текста в пределах контекста **≤250 токенов**. --- This model has been pushed to the Hub using the [PytorchModelHubMixin](https://huggingface.co/docs/huggingface_hub/package_reference/mixins#huggingface_hub.PyTorchModelHubMixin) integration: - Library: [More Information Needed] - Docs: [More Information Needed]