SnifferCaptain commited on
Commit
4e70444
·
verified ·
1 Parent(s): 8c54c2e

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +1 -1
README.md CHANGED
@@ -15,7 +15,7 @@ base_model:
15
  pipeline_tag: text-generation
16
  ---
17
  ## 模型描述
18
- YModel2是SnifferCaptain训练的到目前为止(11/23/2025)最强大的大预言模型。其推理速度、数学能力、代码能力以及常识回答相比YModel1.x版本均有长足的进步。
19
  ## 模型细节
20
  - 模型借鉴了MFA( https://arxiv.org/abs/2412.19255 )的优化思路,将PEGA(Position Embedding Gate Attention)升级到了PEGA2版本,在性能持平甚至超越PEGA的同时,带来了接近3x的速度提升。
21
  - 模型在FFN部分采用了GeGLU。
 
15
  pipeline_tag: text-generation
16
  ---
17
  ## 模型描述
18
+ YModel2是SnifferCaptain训练的到目前为止(11/23/2025)最强大的大语言模型。其推理速度、数学能力、代码能力以及常识回答相比YModel1.x版本均有长足的进步。
19
  ## 模型细节
20
  - 模型借鉴了MFA( https://arxiv.org/abs/2412.19255 )的优化思路,将PEGA(Position Embedding Gate Attention)升级到了PEGA2版本,在性能持平甚至超越PEGA的同时,带来了接近3x的速度提升。
21
  - 模型在FFN部分采用了GeGLU。