Update README.md
Browse files
README.md
CHANGED
|
@@ -15,7 +15,7 @@ base_model:
|
|
| 15 |
pipeline_tag: text-generation
|
| 16 |
---
|
| 17 |
## 模型描述
|
| 18 |
-
YModel2是SnifferCaptain训练的到目前为止(11/23/2025
|
| 19 |
## 模型细节
|
| 20 |
- 模型借鉴了MFA( https://arxiv.org/abs/2412.19255 )的优化思路,将PEGA(Position Embedding Gate Attention)升级到了PEGA2版本,在性能持平甚至超越PEGA的同时,带来了接近3x的速度提升。
|
| 21 |
- 模型在FFN部分采用了GeGLU。
|
|
|
|
| 15 |
pipeline_tag: text-generation
|
| 16 |
---
|
| 17 |
## 模型描述
|
| 18 |
+
YModel2是SnifferCaptain训练的到目前为止(11/23/2025)最强大的大语言模型。其推理速度、数学能力、代码能力以及常识回答相比YModel1.x版本均有长足的进步。
|
| 19 |
## 模型细节
|
| 20 |
- 模型借鉴了MFA( https://arxiv.org/abs/2412.19255 )的优化思路,将PEGA(Position Embedding Gate Attention)升级到了PEGA2版本,在性能持平甚至超越PEGA的同时,带来了接近3x的速度提升。
|
| 21 |
- 模型在FFN部分采用了GeGLU。
|