Auttar commited on
Commit
dc9bf58
·
verified ·
1 Parent(s): 9560c0c

Upload README.md with huggingface_hub

Browse files
Files changed (1) hide show
  1. README.md +14 -7
README.md CHANGED
@@ -1,11 +1,12 @@
1
  ---
2
  language: ru
 
3
  tags:
4
  - summarization
5
  - t5
6
  - russian
7
  - sentiment-analysis
8
- license: mit
9
  ---
10
 
11
  # RuT5-Base for Sentiment Summarization
@@ -17,12 +18,14 @@ license: mit
17
  Создание кратких, информативных резюме отзывов с выделением ключевых плюсов и минусов.
18
 
19
  ## Метрики на тестовой выборке
 
20
  | Модель | ROUGE-1 | ROUGE-2 | ROUGE-L |
21
  |--------|---------|---------|---------|
22
  | Baseline (TF-IDF) | 0.0331 | 0.0029 | 0.0291 |
23
- | **ruT5-base** | **0.1337** | **0.0673** | **0.1337** |
24
 
25
  ## Использование
 
26
  ```python
27
  from transformers import T5ForConditionalGeneration, T5Tokenizer
28
 
@@ -35,18 +38,22 @@ def summarize(review):
35
  outputs = model.generate(inputs.input_ids, max_length=128, num_beams=4)
36
  return tokenizer.decode(outputs[0], skip_special_tokens=True)
37
 
 
38
  # Пример
39
  review = "Фильм отличный! Актеры играют великолепно, сюжет захватывает."
40
  print(summarize(review))
41
 
 
42
  # Обучение
43
- - Базовая модель: sberbank-ai/ruT5-base
44
 
45
- - Датасет: Kinopoisk с сгенерированными резюме
46
 
47
- - Эпохи: 3
48
 
49
- - Learning rate: 5e-5
50
 
51
- - Batch size: 4
52
 
 
 
 
1
  ---
2
  language: ru
3
+ license: mit
4
  tags:
5
  - summarization
6
  - t5
7
  - russian
8
  - sentiment-analysis
9
+ pipeline_tag: summarization
10
  ---
11
 
12
  # RuT5-Base for Sentiment Summarization
 
18
  Создание кратких, информативных резюме отзывов с выделением ключевых плюсов и минусов.
19
 
20
  ## Метрики на тестовой выборке
21
+
22
  | Модель | ROUGE-1 | ROUGE-2 | ROUGE-L |
23
  |--------|---------|---------|---------|
24
  | Baseline (TF-IDF) | 0.0331 | 0.0029 | 0.0291 |
25
+ | ruT5-base | 0.1497 | 0.0600 | 0.1497 |
26
 
27
  ## Использование
28
+
29
  ```python
30
  from transformers import T5ForConditionalGeneration, T5Tokenizer
31
 
 
38
  outputs = model.generate(inputs.input_ids, max_length=128, num_beams=4)
39
  return tokenizer.decode(outputs[0], skip_special_tokens=True)
40
 
41
+
42
  # Пример
43
  review = "Фильм отличный! Актеры играют великолепно, сюжет захватывает."
44
  print(summarize(review))
45
 
46
+ `````
47
  # Обучение
48
+ Базовая модель: sberbank-ai/ruT5-base
49
 
50
+ Датасет: Kinopoisk с сгенерированными резюме
51
 
52
+ Эпохи: 3
53
 
54
+ Learning rate: 5e-5
55
 
56
+ Batch size: 4
57
 
58
+ # Ссылки
59
+ Модель: https://huggingface.co/Auttar/RuT5SentimentSummarization