Duyu/Pinyin-Hanzi
Viewer • Updated • 1.65M • 57 • 1
基于Transformer的预训练汉语拼音序列转汉字序列模型,训练数据全部采用Duyu/Pinyin-Hanzi(单击此处 跳转至数据集页面)
| 模型相关参数 | 数值 |
|---|---|
| 参数量 | 62,200,184 (62M) |
| 可学习参数量比例 | 100% |
| Transformer编码器层数 | 8 |
| Transformer解码器层数 | 6 |
| 词嵌入维度 | 512 |
| 多头注意力层注意力头数 | 16 |
| Transformer前馈层维度 | 1024 |
| 截断长度 | 14 |
模型推理: 轻量级模型,常见的家用计算机配置(8GB内存及以上)即可运行,若有NVIDIA GPU(使用CUDA)可加速。
模型训练: 可在CPU设备上运行(8GB内存及以上),但训练速度非常慢,建议使用NVIDIA GeForce RTX 2080及以上配置的加速卡GPU。
(一)环境准备:
numpy、pandas、torchpip install numpy pandas
# 请查看PyTorch官方文档,以进行torch的安装。
run.py)及预训练权重(pinyin2hanzi_transformer.pth)(二)模型推理:
use_main()的注释,增加train_main()的注释。use_main()中的模型文件路径及汉语拼音序列。(三)模型训练:
CSV文件。train_main()的注释,增加use_main()的注释。train_main()中的各项参数。DuYu (Chinese Simplified: 杜宇, No.202103180009, qluduyu09@163.com), Faculty of Computer Science and Technology, Qilu University of Technology (Shandong Academy of Sciences).
项目在GitHub平台同步开源:https://github.com/duyu09/Pinyin2Hanzi-Transformer