wanglaiqi
commited on
Commit
·
372125e
1
Parent(s):
26dc311
update
Browse files
README.md
CHANGED
|
@@ -10,9 +10,13 @@ tags:
|
|
| 10 |
---
|
| 11 |
|
| 12 |
# 中文语法纠错任务介绍
|
| 13 |
-
|
| 14 |
Task:中文语法纠错任务(Chinese Grammatical Error Correction,CGEC)
|
| 15 |
CGEC任务输入一句中文文本,文本纠错技术对句子中存在拼写、语法、语义等错误进行自动纠正,输出纠正后的文本。
|
| 16 |
|
| 17 |
# 中文语法纠错方法
|
| 18 |
主流的方法为seq2seq和seq2edits,常用的中文纠错数据集包括Lang8、NLPCC18和CGED等。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 10 |
---
|
| 11 |
|
| 12 |
# 中文语法纠错任务介绍
|
|
|
|
| 13 |
Task:中文语法纠错任务(Chinese Grammatical Error Correction,CGEC)
|
| 14 |
CGEC任务输入一句中文文本,文本纠错技术对句子中存在拼写、语法、语义等错误进行自动纠正,输出纠正后的文本。
|
| 15 |
|
| 16 |
# 中文语法纠错方法
|
| 17 |
主流的方法为seq2seq和seq2edits,常用的中文纠错数据集包括Lang8、NLPCC18和CGED等。
|
| 18 |
+
|
| 19 |
+
# 模型描述
|
| 20 |
+
我们采用基于transformer的seq2seq方法建模文本纠错任务。模型选择上,我们使用中文BART作为预训练模型,然后在Lang8和CGED训练数据上进行finetune。
|
| 21 |
+
在不引入额外资源的情况下,本模型在LANG8测试集上达到了SOTA。
|
| 22 |
+
|