Update README.md
Browse files
README.md
CHANGED
|
@@ -5,4 +5,98 @@ language:
|
|
| 5 |
- zh
|
| 6 |
base_model:
|
| 7 |
- huihui-ai/Qwen3-8B-abliterated
|
| 8 |
-
---
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 5 |
- zh
|
| 6 |
base_model:
|
| 7 |
- huihui-ai/Qwen3-8B-abliterated
|
| 8 |
+
---
|
| 9 |
+
# 🤖 StrikeGPT-R1-Zero: 网络安全渗透领域推理模型
|
| 10 |
+
|
| 11 |
+
## 🚀 模型简介
|
| 12 |
+
**StrikeGPT-R1-Zero** 是基于 **Qwen3** 进行黑盒蒸馏的专家模型,其教师模型为 DeepSeek-R1,涵盖:
|
| 13 |
+
🔒 AI安全 | 🛡️ API安全 | 📱 APP安全 | 🕵️ APT | 🚩 CTF
|
| 14 |
+
🏭 ICS安全 | 💻 渗透测试ALL | ☁️ 云上安全 | 📜 代码审计
|
| 15 |
+
🦠 免杀 | 🌐 内网安全 | 💾 电子取证 | ₿ 区块链安全 | 🕳️ 溯源反制 | 🌍 物联网(IoT)安全<br>
|
| 16 |
+
🚨 应急响应 | 🚗 整车安全 | 👥 社会工程学 | 💼 渗透测试面试
|
| 17 |
+
### 👉 [点击访问可交互式详细数据分布图](https://bouquets-ai.github.io/StrikeGPT-R1-Zero/WEB)
|
| 18 |
+
### 🌟 模型亮点
|
| 19 |
+
- 🧩采用**思维链(CoT)推理数据**优化模型逻辑能力,显著提升在漏洞分析等复杂任务的表现
|
| 20 |
+
- 💪Base模型采用Qwen3相较于Distill-Llama更适合中国宝宝体制
|
| 21 |
+
- ⚠️**无道德限制**在特定领域的学术研究有不一样的表现(请在符合当地法律的情况下使用)
|
| 22 |
+
- ✨特定情况下如断网状态下的**网络安全大赛**,相较于本地RAG形式StrikeGPT-R1-Zero逻辑推理能力更强,在复杂任务处理方面表现更佳。
|
| 23 |
+
|
| 24 |
+
## 📊 数据分布
|
| 25 |
+

|
| 26 |
+
|
| 27 |
+
|
| 28 |
+
## 🛠️模型部署
|
| 29 |
+
### 通过ollama进行部署
|
| 30 |
+
`ollama run hf.co/Bouquets/StrikeGPT-R1-Zero-8B-Q4_K_M-GGUF:Q4_K_M`
|
| 31 |
+
|
| 32 |
+
经过量化后自我认知有点问题
|
| 33 |
+
|
| 34 |
+

|
| 35 |
+
|
| 36 |
+
|
| 37 |
+
## 🎯 核心能力展示&对比(原模型有道德限制就不做比较,简单比较SecGPT-7B模型【大佬写的评估脚本我改不来/(ㄒoㄒ)/~~】)
|
| 38 |
+

|
| 39 |
+
|
| 40 |
+
### CTF
|
| 41 |
+

|
| 42 |
+

|
| 43 |
+
|
| 44 |
+
#### Reverse Engineering
|
| 45 |
+

|
| 46 |
+

|
| 47 |
+
#### PWN
|
| 48 |
+

|
| 49 |
+

|
| 50 |
+
#### Web
|
| 51 |
+

|
| 52 |
+

|
| 53 |
+
#### Crypto
|
| 54 |
+

|
| 55 |
+

|
| 56 |
+
|
| 57 |
+
#### Misc
|
| 58 |
+

|
| 59 |
+

|
| 60 |
+
#### Blockchain
|
| 61 |
+

|
| 62 |
+

|
| 63 |
+
#### IoT
|
| 64 |
+

|
| 65 |
+

|
| 66 |
+
|
| 67 |
+
### 内网安全
|
| 68 |
+

|
| 69 |
+

|
| 70 |
+
|
| 71 |
+
### 社工
|
| 72 |
+

|
| 73 |
+

|
| 74 |
+
|
| 75 |
+
### 代码编写
|
| 76 |
+

|
| 77 |
+

|
| 78 |
+
|
| 79 |
+
### 代码审计(联动项目DeepSeekSelfTool)
|
| 80 |
+

|
| 81 |
+
|
| 82 |
+
|
| 83 |
+
|
| 84 |
+
## 📈 实验数据走势图
|
| 85 |
+
有些许梯度爆炸,总体问题不大
|
| 86 |
+

|
| 87 |
+
|
| 88 |
+
## 💰 训练成本
|
| 89 |
+
- **DeepSeek-R1 API调用费用**: ¥450 (均在打折时调用,正常调用价格在¥1800)
|
| 90 |
+
- **服务器开销**: ¥4?0
|
| 91 |
+
- **电子资源**: ¥??
|
| 92 |
+

|
| 93 |
+
|
| 94 |
+
|
| 95 |
+
## ⚖️ 使用须知
|
| 96 |
+
> 本模型仅供**合法安全研究**与**教育用途**。使用者需遵守所在地法律法规,开发者不对滥用行为负责。<br>
|
| 97 |
+
> 提示:使用即表示您同意本声明
|
| 98 |
+
|
| 99 |
+
💡 **提示**: 模型可能存在幻觉或知识盲区,关键场景请交叉验证!
|
| 100 |
+
|
| 101 |
+
|
| 102 |
+
|