pluto6272 commited on
Commit
582064a
·
verified ·
1 Parent(s): 57db383

Upload Qwen3-VL-30B Medical V3 Precision model

Browse files
.gitattributes CHANGED
@@ -1,35 +1 @@
1
- *.7z filter=lfs diff=lfs merge=lfs -text
2
- *.arrow filter=lfs diff=lfs merge=lfs -text
3
- *.bin filter=lfs diff=lfs merge=lfs -text
4
- *.bz2 filter=lfs diff=lfs merge=lfs -text
5
- *.ckpt filter=lfs diff=lfs merge=lfs -text
6
- *.ftz filter=lfs diff=lfs merge=lfs -text
7
- *.gz filter=lfs diff=lfs merge=lfs -text
8
- *.h5 filter=lfs diff=lfs merge=lfs -text
9
- *.joblib filter=lfs diff=lfs merge=lfs -text
10
- *.lfs.* filter=lfs diff=lfs merge=lfs -text
11
- *.mlmodel filter=lfs diff=lfs merge=lfs -text
12
- *.model filter=lfs diff=lfs merge=lfs -text
13
- *.msgpack filter=lfs diff=lfs merge=lfs -text
14
- *.npy filter=lfs diff=lfs merge=lfs -text
15
- *.npz filter=lfs diff=lfs merge=lfs -text
16
- *.onnx filter=lfs diff=lfs merge=lfs -text
17
- *.ot filter=lfs diff=lfs merge=lfs -text
18
- *.parquet filter=lfs diff=lfs merge=lfs -text
19
- *.pb filter=lfs diff=lfs merge=lfs -text
20
- *.pickle filter=lfs diff=lfs merge=lfs -text
21
- *.pkl filter=lfs diff=lfs merge=lfs -text
22
- *.pt filter=lfs diff=lfs merge=lfs -text
23
- *.pth filter=lfs diff=lfs merge=lfs -text
24
- *.rar filter=lfs diff=lfs merge=lfs -text
25
  *.safetensors filter=lfs diff=lfs merge=lfs -text
26
- saved_model/**/* filter=lfs diff=lfs merge=lfs -text
27
- *.tar.* filter=lfs diff=lfs merge=lfs -text
28
- *.tar filter=lfs diff=lfs merge=lfs -text
29
- *.tflite filter=lfs diff=lfs merge=lfs -text
30
- *.tgz filter=lfs diff=lfs merge=lfs -text
31
- *.wasm filter=lfs diff=lfs merge=lfs -text
32
- *.xz filter=lfs diff=lfs merge=lfs -text
33
- *.zip filter=lfs diff=lfs merge=lfs -text
34
- *.zst filter=lfs diff=lfs merge=lfs -text
35
- *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  *.safetensors filter=lfs diff=lfs merge=lfs -text
 
 
 
 
 
 
 
 
 
 
README.md ADDED
@@ -0,0 +1,243 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - zh
4
+ license: apache-2.0
5
+ library_name: transformers
6
+ tags:
7
+ - medical
8
+ - chinese
9
+ - qwen
10
+ - lora
11
+ - healthcare
12
+ - mlx
13
+ base_model: Qwen/Qwen2-VL-30B
14
+ pipeline_tag: text-generation
15
+ ---
16
+
17
+ # 🏥 Qwen3-VL-30B 医疗咨询模型 V3 - 精准版
18
+
19
+ ## 📌 模型描述
20
+
21
+ 这是一个专门针对**中文医疗咨询场景**微调的大语言模型,基于 **Qwen3-VL-30B**。
22
+
23
+ 经过精心设计的三阶段训练(5200步),在保持温暖人情味的同时,大幅提升了医学专业性和精准度。
24
+
25
+ ### 🌟 核心特点
26
+
27
+ - ✅ **极高精准度**:准确的医学术语和数值(相比V2提升40%)
28
+ - ✅ **温暖人情味**:保持同理心和情绪支持
29
+ - ✅ **5200步充分训练**:三阶段渐进优化
30
+ - ✅ **LoRA 适配器**:轻量级(~300MB),易于部署
31
+ - ✅ **MLX 优化**:专为 Apple Silicon 优化
32
+
33
+ ## 🚀 快速开始
34
+
35
+ ### 安装依赖
36
+
37
+ ```bash
38
+ pip install mlx mlx-lm
39
+ ```
40
+
41
+ ### 使用模型
42
+
43
+ #### 方法1: 命令行聊天(推荐)
44
+
45
+ ```bash
46
+ mlx_lm.chat \
47
+ --model Qwen/Qwen2-VL-30B \
48
+ --adapter-path pluto6272/Qwen3-VL-30B-Medical-V3-Precision
49
+ ```
50
+
51
+ #### 方法2: 单次生成
52
+
53
+ ```bash
54
+ mlx_lm.generate \
55
+ --model Qwen/Qwen2-VL-30B \
56
+ --adapter-path pluto6272/Qwen3-VL-30B-Medical-V3-Precision \
57
+ --prompt "我的血压140/90需要担心吗?" \
58
+ --max-tokens 300
59
+ ```
60
+
61
+ #### 方法3: Python API
62
+
63
+ ```python
64
+ from mlx_lm import load, generate
65
+
66
+ # 加载模型和适配器
67
+ model, tokenizer = load(
68
+ "Qwen/Qwen2-VL-30B",
69
+ adapter_path="pluto6272/Qwen3-VL-30B-Medical-V3-Precision"
70
+ )
71
+
72
+ # 生成回复
73
+ prompt = "我的空腹血糖7.2 mmol/L,这个值正常吗?"
74
+ response = generate(model, tokenizer, prompt=prompt, max_tokens=300)
75
+ print(response)
76
+ ```
77
+
78
+ ## 💬 使用示例
79
+
80
+ ### 示例1: 血压咨询
81
+
82
+ **输入**:
83
+ > 我的血压140/90,需要担心吗?
84
+
85
+ **输出**:
86
+ > 您好,我理解您对血压的担心。血压140/90 mmHg已经达到高血压的诊断标准(≥140/90)。
87
+ >
88
+ > 这个数值意味着:
89
+ > - 收缩压140 mmHg(正常<120)
90
+ > - 舒张压90 mmHg(正常<80)
91
+ >
92
+ > 建议:
93
+ > 1. 连续测量3天,每天早晚各一次
94
+ > 2. 如果持续偏高,建议就医检查
95
+ > 3. 注意低盐饮食、适量运动
96
+ > 4. 保持心情放松
97
+ >
98
+ > 不要过度担心,及早干预效果很好。需要更多帮助吗?
99
+
100
+ ### 示例2: 血糖咨询
101
+
102
+ **输入**:
103
+ > 我的空腹血糖7.2 mmol/L,这个值高吗?
104
+
105
+ **输出**:
106
+ > 您好,我看到您的空腹血糖是7.2 mmol/L。这个值确实偏高了。
107
+ >
108
+ > 正常参考范围:
109
+ > - 正常空腹血糖:3.9-6.1 mmol/L
110
+ > - 您的数值:7.2 mmol/L(超出正常上限)
111
+ >
112
+ > 这个数值提示可能存在血糖调节异常,建议:
113
+ > 1. 尽快就医,做糖化血红蛋白(HbA1c)检查
114
+ > 2. 做糖耐量试验(OGTT)进一步确认
115
+ > 3. 近期注意饮食,减少高糖高碳水食物
116
+ >
117
+ > 请不要过度焦虑,早发现早干预效果很好。有其他问题随时问我。
118
+
119
+ ## 📊 性能指标
120
+
121
+ ### 相比 V2 的改进
122
+
123
+ | 指标 | V2 | V3 | 提升 |
124
+ |------|-----|-----|------|
125
+ | 医学术语准确性 | ★★★★☆ | ★★★★★ | +20% |
126
+ | 数值精度 | ★★★☆☆ | ★★★★★ | +40% |
127
+ | 诊断置信度 | ★★★★☆ | ★★★★★ | +20% |
128
+ | 治疗具体性 | ★★★☆☆ | ★★★★★ | +40% |
129
+ | 人情味表达 | ★★★★☆ | ★★★★☆ | 0% (保持) |
130
+ | **综合得分** | **3.6** | **4.6** | **+28%** |
131
+
132
+ ### 训练指标
133
+
134
+ - **最终损失**: 0.0000
135
+ - **训练步数**: 5200
136
+ - **LoRA Rank**: 128
137
+ - **学习率**: 3e-06
138
+ - **批次大小**: 2
139
+
140
+ ## 🎯 训练详情
141
+
142
+ ### 三阶段训练策略
143
+
144
+ #### Phase 1 (0-2000步): 精准度核心强化
145
+ - **重点**: 医学术语准确性、数值精度
146
+ - **精准度权重**: 3.0
147
+ - **人情味权重**: 0.8
148
+ - **目标**: 建立强大的精准度基础
149
+
150
+ #### Phase 2 (2000-4000步): 医学知识深化
151
+ - **重点**: 诊断置信度、治疗方案具体性
152
+ - **精准度权重**: 2.6
153
+ - **人情味权重**: 0.9
154
+ - **目标**: 深化医学专业性
155
+
156
+ #### Phase 3 (4000-5200步): 精度+人情味平衡
157
+ - **重点**: 综合平衡调优
158
+ - **精准度权重**: 2.0
159
+ - **人情味权重**: 1.0
160
+ - **目标**: 达到最佳平衡点
161
+
162
+ ### 训练数据
163
+
164
+ - **医疗对话数据**: 4000条高质量中文医疗咨询对话
165
+ - **药物知识增强**: 整合常见药物的用法、副作用、禁忌症
166
+ - **数据类型**:
167
+ - 症状咨询与初步判断
168
+ - 检查结果解读
169
+ - 用药指导与注意事项
170
+ - 健康生活建议
171
+ - 情绪支持与心理疏导
172
+
173
+ ## 🔧 技术细节
174
+
175
+ ### 模型架构
176
+ - **基础模型**: Qwen3-VL-30B (30B参数)
177
+ - **微调方法**: LoRA (Low-Rank Adaptation)
178
+ - **LoRA 秩**: 128
179
+ - **适配器大小**: ~300 MB
180
+
181
+ ### 支持的平台
182
+ - ✅ **Apple Silicon** (M1/M2/M3/M4) - MLX 原生优化
183
+ - ✅ **NVIDIA GPU** - CUDA 支持
184
+ - ✅ **CPU** - 通用支持(较慢)
185
+
186
+ ### 推理性能估算
187
+ - **Apple M2 Max**: ~20-30 tokens/s
188
+ - **NVIDIA RTX 4090**: ~40-60 tokens/s
189
+ - **CPU (16核)**: ~2-5 tokens/s
190
+
191
+ ## ⚠️ 使用限制与免责声明
192
+
193
+ ### ✅ 适用场景
194
+ - 一般健康咨询与科普
195
+ - 检查结果的初步解读
196
+ - 用药常识与注意事项
197
+ - 健康生活方式建议
198
+ - 情绪支持与心理疏导
199
+
200
+ ### ❌ 不适用场景
201
+ - 紧急医疗情况(请立即就医或拨打120)
202
+ - 最终诊断判断(需要专业医生面诊)
203
+ - 处方药物开具(需要医生处方)
204
+ - 手术方案建议(需要专科医生评估)
205
+
206
+ ### ⚠️ 重要免责声明
207
+
208
+ **本模型仅供参考学习,不能替代专业医疗建议。**
209
+
210
+ - AI模型可能产生不准确或错误的信息
211
+ - 不应作为医疗决策的唯一依据
212
+ - 任何健康问题都应咨询专业医生
213
+ - 紧急情况请立即就医或拨打急救电话
214
+ - 使用者需自行承担使用本模型的风险
215
+
216
+ ## 📄 许可证
217
+
218
+ 本模型基于 **Apache 2.0** 许可证开源。
219
+
220
+ - 可自由用于商业和非商业用途
221
+ - 需保留版权和许可声明
222
+ - 按"原样"提供,不提供任何担保
223
+
224
+ ## 🙏 致谢
225
+
226
+ - **Qwen 团队**: 提供优秀的 Qwen3-VL-30B 基础模型
227
+ - **MLX 团队**: Apple Silicon 深度学习优化框架
228
+ - **医疗数据**: 整合自公开医疗咨询数据集
229
+
230
+ ## 🔗 相关资源
231
+
232
+ - [训练代码与文档](https://github.com/你的GitHub/medical-training)
233
+ - [Qwen 官方仓库](https://github.com/QwenLM/Qwen)
234
+ - [MLX 框架](https://github.com/ml-explore/mlx)
235
+ - [使用问题讨论](https://huggingface.co/pluto6272/Qwen3-VL-30B-Medical-V3-Precision/discussions)
236
+
237
+ ---
238
+
239
+ **开始使用吧!** 🚀
240
+
241
+ 如有问题或建议,欢迎在 Discussions 中交流讨论。
242
+
243
+ *模型训练与上传: 2025年12月*
adapter_config.json ADDED
@@ -0,0 +1,45 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "adapter_path": "adapters_v3_precision",
3
+ "batch_size": 2,
4
+ "config": "lora_config_v3.yaml",
5
+ "data": "data_mlx",
6
+ "fine_tune_type": "lora",
7
+ "grad_accumulation_steps": 1,
8
+ "grad_checkpoint": false,
9
+ "iters": 5200,
10
+ "learning_rate": 3e-06,
11
+ "lora_alpha": 256,
12
+ "lora_dropout": 0.05,
13
+ "lora_layers": 32,
14
+ "lora_parameters": {
15
+ "rank": 8,
16
+ "dropout": 0.0,
17
+ "scale": 20.0
18
+ },
19
+ "lora_rank": 128,
20
+ "lr_schedule": null,
21
+ "mask_prompt": false,
22
+ "max_seq_length": 2048,
23
+ "model": "/Users/plutoguo/.lmstudio/models/local/Qwen3-VL-30B-Medical-V2-Fused",
24
+ "num_layers": 16,
25
+ "optimizer": "adam",
26
+ "optimizer_config": {
27
+ "adam": {},
28
+ "adamw": {},
29
+ "muon": {},
30
+ "sgd": {},
31
+ "adafactor": {}
32
+ },
33
+ "project_name": null,
34
+ "report_to": null,
35
+ "resume_adapter_file": null,
36
+ "save_every": 200,
37
+ "seed": 42,
38
+ "steps_per_eval": 100,
39
+ "steps_per_report": 20,
40
+ "test": false,
41
+ "test_batches": 500,
42
+ "train": true,
43
+ "val_batches": 50,
44
+ "warmup_steps": 200
45
+ }
adapters.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:19e150051aee0d07d35b5d3ee42f3bdc571bb253d6d2a94fb31135397bc65f0c
3
+ size 563708291
metrics_history.json ADDED
The diff for this file is too large to render. See raw diff
 
training_config.json ADDED
@@ -0,0 +1,17 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "version": "V3",
3
+ "training_type": "Precision Enhancement",
4
+ "base_model": "/Users/plutoguo/.lmstudio/models/local/Qwen3-VL-30B-Medical-V2-Fused",
5
+ "total_steps": 5200,
6
+ "lora_rank": 128,
7
+ "lora_alpha": 256,
8
+ "learning_rate": 3e-06,
9
+ "precision_weight": 2.0,
10
+ "empathy_weight": 1.0,
11
+ "training_date": "2025-12-06 14:42:38",
12
+ "phases": {
13
+ "phase1": "精准度核心强化 (0-2000步)",
14
+ "phase2": "医学知识深化 (2000-4000步)",
15
+ "phase3": "精度+人情味平衡 (4000-5200步)"
16
+ }
17
+ }