HelioAI commited on
Commit
97fcdfb
·
verified ·
1 Parent(s): 5e297e9

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +6 -6
README.md CHANGED
@@ -19,7 +19,7 @@ tags:
19
  base_model: deepseek-ai/DeepSeek-R1-0528-Qwen3-8B
20
  pipeline_tag: text-generation
21
  model-index:
22
- - name: Helio1-Ray-8B
23
  results:
24
  - task:
25
  type: text-generation
@@ -34,7 +34,7 @@ model-index:
34
  ---
35
 
36
  <div align="center">
37
- <h1>🌟 Helio1-Ray-8B</h1>
38
  <p align="center">
39
  <img src="logo.png" width="200" alt="HelioAI Logo">
40
  </p>
@@ -53,7 +53,7 @@ model-index:
53
 
54
  ## 🔥 О модели
55
 
56
- Helio1-Ray-8B — это модель **с агентским подходом к решению задач**. Вместо того чтобы «угадывать» ответ, она **пишет программу для его решения**.
57
 
58
  Спросите её «2+2» — и она напишет калькулятор. Спросите сложную математическую задачу — и она создаст программу, которая решит её точно. Это принципиально другой уровень надёжности: модель не галлюцинирует результат вычислений, а **программно верифицирует** каждый шаг.
59
 
@@ -84,7 +84,7 @@ Helio1-Ray-8B — это модель **с агентским подходом
84
 
85
  ### Код и программное решение задач
86
 
87
- | Бенчмарк | DeepSeek R1 (671B) | R1-0528 Base (8B) | **Helio1-Ray-8B** | Прирост |
88
  |---|:---:|:---:|:---:|:---:|
89
  | **LiveCodeBench** 2408-2505 (Pass@1) | 63.5 | 73.3 | **79.4** | **+8.3%** ↑ |
90
  | **Aider-Polyglot** (Acc.) | 53.3 | 71.6 | **78.2** | **+9.2%** ↑ |
@@ -92,7 +92,7 @@ Helio1-Ray-8B — это модель **с агентским подходом
92
 
93
  ### Математика (агентское программное решение)
94
 
95
- | Бенчмарк | DeepSeek R1 (671B) | R1-0528 Base (8B) | **Helio1-Ray-8B** | Подход |
96
  |---|:---:|:---:|:---:|---|
97
  | **AIME 2024** (Pass@1) | 79.8 | 91.4 | **94.2** | Программное решение ↑ |
98
  | **AIME 2025** (Pass@1) | 70.0 | 87.5 | **91.8** | Программное решение ↑ |
@@ -103,7 +103,7 @@ Helio1-Ray-8B — это модель **с агентским подходом
103
 
104
  ### Общие бенчмарки
105
 
106
- | Бенчмарк | R1-0528 Base (8B) | **Helio1-Ray-8B** |
107
  |---|:---:|:---:|
108
  | **MMLU-Pro** (EM) | 85.0 | **84.7** |
109
  | **GPQA-Diamond** (Pass@1) | 81.0 | **80.4** |
 
19
  base_model: deepseek-ai/DeepSeek-R1-0528-Qwen3-8B
20
  pipeline_tag: text-generation
21
  model-index:
22
+ - name: Helio1-Ray-8B-Preview
23
  results:
24
  - task:
25
  type: text-generation
 
34
  ---
35
 
36
  <div align="center">
37
+ <h1>🌟 Helio1-Ray-8B-Preview</h1>
38
  <p align="center">
39
  <img src="logo.png" width="200" alt="HelioAI Logo">
40
  </p>
 
53
 
54
  ## 🔥 О модели
55
 
56
+ Helio1-Ray-8B-Preview — это модель **с агентским подходом к решению задач**. Вместо того чтобы «угадывать» ответ, она **пишет программу для его решения**.
57
 
58
  Спросите её «2+2» — и она напишет калькулятор. Спросите сложную математическую задачу — и она создаст программу, которая решит её точно. Это принципиально другой уровень надёжности: модель не галлюцинирует результат вычислений, а **программно верифицирует** каждый шаг.
59
 
 
84
 
85
  ### Код и программное решение задач
86
 
87
+ | Бенчмарк | DeepSeek R1 (671B) | R1-0528 Base (8B) | **Helio1-Ray-8B-Preview** | Прирост |
88
  |---|:---:|:---:|:---:|:---:|
89
  | **LiveCodeBench** 2408-2505 (Pass@1) | 63.5 | 73.3 | **79.4** | **+8.3%** ↑ |
90
  | **Aider-Polyglot** (Acc.) | 53.3 | 71.6 | **78.2** | **+9.2%** ↑ |
 
92
 
93
  ### Математика (агентское программное решение)
94
 
95
+ | Бенчмарк | DeepSeek R1 (671B) | R1-0528 Base (8B) | **Helio1-Ray-8B-Preview** | Подход |
96
  |---|:---:|:---:|:---:|---|
97
  | **AIME 2024** (Pass@1) | 79.8 | 91.4 | **94.2** | Программное решение ↑ |
98
  | **AIME 2025** (Pass@1) | 70.0 | 87.5 | **91.8** | Программное решение ↑ |
 
103
 
104
  ### Общие бенчмарки
105
 
106
+ | Бенчмарк | R1-0528 Base (8B) | **Helio1-Ray-8B-Preview** |
107
  |---|:---:|:---:|
108
  | **MMLU-Pro** (EM) | 85.0 | **84.7** |
109
  | **GPQA-Diamond** (Pass@1) | 81.0 | **80.4** |