CSHaitao commited on
Commit
174c931
·
verified ·
1 Parent(s): c14df89

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +36 -0
README.md ADDED
@@ -0,0 +1,36 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ license: mit
3
+ language:
4
+ - zh
5
+ base_model:
6
+ - Qwen/Qwen3-1.7B-Base
7
+ tags:
8
+ - legal
9
+ ---
10
+
11
+
12
+
13
+ ## 概述
14
+
15
+ 近年来,法律领域对可靠AI系统的需求快速增长。然而,法律推理既**知识密集**又**结构密集**,通用LLM往往存在法律知识理解不足、推理与实践脱节等问题,难以满足法律系统对可靠性的要求。
16
+
17
+ **LegalOne-R1** 是一系列专门为中文法律领域训练的LLM,采用**多阶段训练框架**来联合增强法律知识和推理能力。模型基于 **昇腾 Atlas 910B** 计算平台与 **昇思 MindSpore** AI 框架完成训练。
18
+
19
+ - **中期训练**:基于困惑度的数据调度方法-Plasticity-Adjusted Sampling (PAS),从广泛、异构的通用数据平滑过渡到专业化法律任务,在有效注入法律知识的同时避免灾难性遗忘。
20
+ - **监督微调**:我们建立了一个模拟专业法律工作流程的代理系统Legal Agentic CoT Distillation (LEAD),能够综合大规模、高一致性的推理轨迹,培养模型执行可靠推理的能力。
21
+ - **强化学习**:采用多阶段课程学习,从简单到复杂逐步塑造推理能力,形成更内化、更自主的"法律思维"模式。
22
+
23
+ **LegalOne-R1-8B** 在**法规解释、判例法推理、法律问答、文档起草**等任务上超越通用 LLM 和现有法律模型。在 **LexEval、LewBench、JecQA** 等权威评测中,整体性能可媲美更大参数规模的通用模型(如 **DeepSeek-R1、Qwen3-Max**),并在部分任务上实现超越。尤其在**法律概念理解、法条记忆、多跳推理**等关键任务上,**LegalOne-R1-8B** 达到了当前开源模型的**领先水平**。
24
+
25
+
26
+
27
+ ## 模型系列
28
+
29
+ ### Model Access
30
+
31
+ | 模型 | 参数量 | 基座模型 | 支持语言 | 链接 |
32
+ |-------|-----------|------------|---------------------|------|
33
+ | LegalOne-R1-1.7B | 1.7B | Qwen3-1.7B-Base | 中文 & 英文 | [HF Link](https://huggingface.co/CSHaitao/LegalOne-R1-1.7B) |
34
+ | LegalOne-R1-4B | 4B | Qwen3-4B-Base | 中文 & 英文 | [HF Link](https://huggingface.co/CSHaitao/LegalOne-R1-4B) |
35
+ | LegalOne-R1-8B | 8B | Qwen3-8B-Base | 中文 & 英文 | [HF Link](https://huggingface.co/CSHaitao/LegalOne-R1-8B) |
36
+