combi2k2 commited on
Commit
e0ac4c4
·
1 Parent(s): 462dffd

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +71 -0
README.md ADDED
@@ -0,0 +1,71 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ # Machine Reading Comprehension Vietnamese
2
+
3
+ **[Colab Notebook](https://colab.research.google.com/drive/1JeyjSluVLIoZGzC_kOq6HXGUX-JMN3VP?usp=sharing)**
4
+
5
+ ## Overview
6
+
7
+ | Option | Description |
8
+ | ------:| -----------:|
9
+ | **Language Model:** | xlm-roberta-base |
10
+ | **Language** | Vietnamese |
11
+ | **Downstream-task** | Extractive QA |
12
+ | **Training Data** | UIT-ViQuAD2.0 |
13
+ | **Eval Data** | UIT-ViQuAD2.0 |
14
+ | **Infrastructure** | cuda Tesla P100-PCIE-16GB |
15
+
16
+ ## Hyperparameter
17
+
18
+ ```
19
+ batch_size = 16
20
+ n_epochs = 10
21
+ base_LM_model = "xlm-roberta-base"
22
+ max_seq_len = 256
23
+ learning_rate = 2e-5
24
+ weight_decay = 0.01
25
+ ```
26
+ ## Performance
27
+
28
+ Evaluated on the UIT-ViQuAD2.0 dev set with the official eval script.
29
+
30
+ ```
31
+ 'exact': 29.947276,
32
+ 'f1': 43.627568,
33
+ 'total': 2845,
34
+ 'HasAns_exact': 43.827160,
35
+ 'HasAns_f1': 63.847958,
36
+ 'HasAns_total': 1944,
37
+ 'NoAns_exact': 0.0,
38
+ 'NoAns_f1': 0.0,
39
+ 'NoAns_total': 901
40
+ ```
41
+
42
+ ## Usage
43
+ ```python
44
+ from transformers import {
45
+ AutoModelForQuestionAnswering,
46
+ AutoTokenizer,
47
+ pipeline
48
+ }
49
+
50
+ model_checkpoint = "results/checkpoint-16000"
51
+ question_answerer = pipeline("question-answering", model = model_checkpoint)
52
+
53
+ # a) get predictions
54
+ QA_input = {
55
+ 'question': 'Hiến pháp Mali quy định thế nào đối với tôn giáo?',
56
+ 'context': 'Ước tính có khoảng 90% dân số Mali theo đạo Hồi (phần lớn là hệ phái Sunni), khoảng 5% là theo Kitô giáo (khoảng hai phần ba theo Giáo hội Công giáo Rôma và một phần ba là theo Tin Lành) và 5% còn lại theo các tín ngưỡng vật linh truyền thống bản địa. Một số ít người Mali theo thuyết vô thần và thuyết bất khả tri, phần lớn họ thực hiện những nghi lễ tôn giáo cơ bản hằng ngày. Các phong tục Hồi giáo ở Mali có mức độ vừa phải, khoan dung, và đã thay đổi theo các điều kiện của địa phương; các mối quan hệ giữa người Hồi giáo và các cộng đồng tôn giáo nhỏ khác nói chung là thân thiện. Hiến pháp của Mali đã quy định một thể chế nhà nước thế tục và ủng hộ quyền tự do tôn giáo, và chính phủ Mali phải đảm bảo quyền này.'
57
+ }
58
+ res = question_answerer(QA_input)
59
+
60
+ # b) Load model & tokenizer
61
+ model = AutoModelForQuestionAnswering.from_pretrained(model_checkpoint)
62
+ tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
63
+ ```
64
+
65
+ ## Author
66
+ Duc Nguyen
67
+
68
+ ## Citation
69
+ ```
70
+ Kiet Van Nguyen, Son Quoc Tran, Luan Thanh Nguyen, Tin Van Huynh, Son T. Luu, Ngan Luu-Thuy Nguyen. "VLSP 2021 Shared Task: Vietnamese Machine Reading Comprehension." The 8th International Workshop on Vietnamese Language and Speech Processing (VLSP 2021) .
71
+ ```