--- library_name: transformers language: - ru pipeline_tag: text2text-generation --- # basic-go/rut5-base-texificator-st1 Модель предназначена для нормализации исходного текста, содержащего математические сущности, выраженные в смеси полусловесных формулировок и/или различных математических языков разметки, в текст, приведенный в соответствие с правилами системы компьютерной вёрстки LaTeX для русского языка. ## Использование Пример ниже демонстрирует нормализацию: ```python from transformers import pipeline normalizer = pipeline("text2text-generation", model="basic-go/rut5-base-texificator-st1") inputs = ["неопределённый интеграл жи штрих от икс дэ икс равно жи от икс плюс цэ большое", r"f : RR^(2) -> RR^(3)"] results = normalizer(inputs, max_length=128, do_sample=True, length_penalty=0.5, top_k=100, num_beams=7, early_stopping=True, repetition_penalty=2.5) print(results) # [{'generated_text': "\\(\\int g'(x)dx=g(x)+C\\)"}, {'generated_text': '\\(f : \\mathbb{R}^2 \\to \\mathbb{R}^3\\)'}] ``` Вместе с тем рекомендуется использовать модель в составе библиотеки [Emma](https://github.com/basic-go-ahead/emma) для актуальной пред- и постобработки данных.