Create README.md
Browse files
README.md
ADDED
|
@@ -0,0 +1,36 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
---
|
| 2 |
+
license: mit
|
| 3 |
+
language:
|
| 4 |
+
- zh
|
| 5 |
+
base_model:
|
| 6 |
+
- Qwen/Qwen3-1.7B-Base
|
| 7 |
+
tags:
|
| 8 |
+
- legal
|
| 9 |
+
---
|
| 10 |
+
|
| 11 |
+
|
| 12 |
+
|
| 13 |
+
## 概述
|
| 14 |
+
|
| 15 |
+
近年来,法律领域对可靠AI系统的需求快速增长。然而,法律推理既**知识密集**又**结构密集**,通用LLM往往存在法律知识理解不足、推理与实践脱节等问题,难以满足法律系统对可靠性的要求。
|
| 16 |
+
|
| 17 |
+
**LegalOne-R1** 是一系列专门为中文法律领域训练的LLM,采用**多阶段训练框架**来联合增强法律知识和推理能力。模型基于 **昇腾 Atlas 910B** 计算平台与 **昇思 MindSpore** AI 框架完成训练。
|
| 18 |
+
|
| 19 |
+
- **中期训练**:基于困惑度的数据调度方法-Plasticity-Adjusted Sampling (PAS),从广泛、异构的通用数据平滑过渡到专业化法律任务,在有效注入法律知识的同时避免灾难性遗忘。
|
| 20 |
+
- **监督微调**:我们建立了一个模拟专业法律工作流程的代理系统Legal Agentic CoT Distillation (LEAD),能够综合大规模、高一致性的推理轨迹,培养模型执行可靠推理的能力。
|
| 21 |
+
- **强化学习**:采用多阶段课程学习,从简单到复杂逐步塑造推理能力,形成更内化、更自主的"法律思维"模式。
|
| 22 |
+
|
| 23 |
+
**LegalOne-R1-8B** 在**法规解释、判例法推理、法律问答、文档起草**等任务上超越通用 LLM 和现有法律模型。在 **LexEval、LewBench、JecQA** 等权威评测中,整体性能可媲美更大参数规模的通用模型(如 **DeepSeek-R1、Qwen3-Max**),并在部分任务上实现超越。尤其在**法律概念理解、法条记忆、多跳推理**等关键任务上,**LegalOne-R1-8B** 达到了当前开源模型的**领先水平**。
|
| 24 |
+
|
| 25 |
+
|
| 26 |
+
|
| 27 |
+
## 模型系列
|
| 28 |
+
|
| 29 |
+
### Model Access
|
| 30 |
+
|
| 31 |
+
| 模型 | 参数量 | 基座模型 | 支持语言 | 链接 |
|
| 32 |
+
|-------|-----------|------------|---------------------|------|
|
| 33 |
+
| LegalOne-R1-1.7B | 1.7B | Qwen3-1.7B-Base | 中文 & 英文 | [HF Link](https://huggingface.co/CSHaitao/LegalOne-R1-1.7B) |
|
| 34 |
+
| LegalOne-R1-4B | 4B | Qwen3-4B-Base | 中文 & 英文 | [HF Link](https://huggingface.co/CSHaitao/LegalOne-R1-4B) |
|
| 35 |
+
| LegalOne-R1-8B | 8B | Qwen3-8B-Base | 中文 & 英文 | [HF Link](https://huggingface.co/CSHaitao/LegalOne-R1-8B) |
|
| 36 |
+
|