|
|
--- |
|
|
license: apache-2.0 |
|
|
language: |
|
|
- ru |
|
|
metrics: |
|
|
- rouge |
|
|
- f1 |
|
|
base_model: |
|
|
- ai-forever/rugpt3large_based_on_gpt2 |
|
|
pipeline_tag: text-generation |
|
|
library_name: transformers |
|
|
tags: |
|
|
- text-adaptation |
|
|
- russian |
|
|
- gpt3 |
|
|
- cefr |
|
|
- ruadapt |
|
|
- simplification |
|
|
--- |
|
|
|
|
|
# 📝 RuAdapt-CEFR: Генерация адаптированного текста на русском 🇷🇺 |
|
|
|
|
|
**RuAdapt-CEFR** — это модель, разработанная студентами **ДГТУ "Школа Икс"**, предназначенная для упрощения и адаптации текстов на основе их сложности. |
|
|
|
|
|
### 🚀 Особенности модели: |
|
|
✅ Основана на **[ai-forever/rugpt3large_based_on_gpt2](https://huggingface.co/ai-forever/rugpt3large_based_on_gpt2)** |
|
|
✅ Дообучена на **RuAdapt** и **RuSimpleSentEval** |
|
|
✅ Позволяет адаптировать тексты под уровни **CEFR (A1–C2)** |
|
|
✅ Генерирует тексты, сохраняя смысл оригинала, но упрощая лексику и грамматику |
|
|
|
|
|
### 🎯 Использование |
|
|
Модель принимает промпт следующего формата: |
|
|
|
|
|
``` |
|
|
Адаптируй текст {text} на уровень по CEFR: {level} <eos> Адаптированный текст: {target} |
|
|
``` |
|
|
|
|
|
Пример запроса: |
|
|
|
|
|
```python |
|
|
from transformers import pipeline |
|
|
|
|
|
model = "ваш_юзернейм/ruadapt-cefr" |
|
|
pipe = pipeline("text-generation", model=model) |
|
|
|
|
|
text = "Научно-технический прогресс оказывает огромное влияние на современный мир." |
|
|
level = "A2" |
|
|
|
|
|
prompt = f"Адаптируй текст {text} на уровень по CEFR: {level} <eos> Адаптированный текст:" |
|
|
result = pipe(prompt, max_length=100) |
|
|
|
|
|
print(result[0]["generated_text"]) |
|
|
``` |
|
|
|
|
|
### 🔗 Ссылка на Google Colab |
|
|
## 📌 [Открыть в Google Colab](https://colab.research.google.com/drive/1Cauh9O7HdkrEUs8NU69-zSkQwncS5wBG) |
|
|
|
|
|
### 📚 Датасеты |
|
|
* RuAdapt |
|
|
|
|
|
* RuSimpleSentEval |
|
|
|
|
|
### 🎨 Области применения |
|
|
* Упрощение текстов для изучающих русский язык |
|
|
|
|
|
* Автоматическая адаптация текстов под CEFR |
|
|
|
|
|
* Образовательные и академические задачи |