XuehangCang's picture
Update README.md
27a98ea verified
---
language:
- zh
license: apache-2.0
base_model: Qwen/Qwen3.5-2B
datasets:
- XuehangCang/MicroMajor-AIAppTech
tags:
- sft
- lora
- qwen
- education
- ai-application
- chinese
- causal-lm
pipeline_tag: text-generation
---
`MicroMajor-2B-AIAppTech` 是针对**人工智能应用技术**微专业方向打造的垂直领域小模型
以 [Qwen/Qwen3.5-2B](https://huggingface.co/Qwen/Qwen3.5-2B) 为基座,使用专属课程 Q&A 数据集 [XuehangCang/MicroMajor-AIAppTech](https://huggingface.co/datasets/XuehangCang/MicroMajor-AIAppTech) 进行有监督微调,覆盖课程如下:
| 序号 | 课程名称 |
|:---:|---------|
| 1 | 人工智能概述 |
| 2 | Python 程序设计实践 |
| 3 | 机器学习基础 |
| 4 | 自然语言处理应用与实践 |
| 5 | 人工智能实践 |
---
## 评测结果
评测方法:25 道专业题(5 课程 × 5 题),与基座模型 Qwen3.5-2B 进行对比
评分规则:关键词命中率得分(0–6 分)+ 回答完整性得分(0–4 分)= 综合得分(0–10 分)
### 各课程均分对比
| 课程 | MicroMajor-2B-AIAppTech | Qwen3.5-2B | 提升幅度 |
|------|:-----------------------:|:------------------:|:--------:|
| 人工智能概述 | **8.40** | 7.52 | +0.88 |
| Python程序设计实践 | **8.63** | 7.77 | +0.86 |
| 机器学习基础 | **9.14** | 8.46 | +0.68 |
| 自然语言处理应用与实践 | **8.48** | 7.99 | +0.49 |
| 人工智能实践 | **8.63** | 7.60 | +1.03 |
| **全科综合** | **8.66** | **7.87** | **+0.79** |
### 多维度对比
| 维度 | MicroMajor-2B-AIAppTech | Qwen3.5-2B |
|------|:-----------------------:|:------------------:|
| 关键词均分(/6) | **4.66** | 3.87 |
| 完整性均分(/4) | 4.00 | 4.00 |
| 综合均分(/10) | **8.66** | 7.87 |
| 平均回答字符数 | 836 字 | 830 字 |
| 平均推理耗时 | 11.2 秒 | 11.3 秒 |
---
## 模型信息
| 属性 | 详情 |
|------|------|
| 基座模型 | Qwen/Qwen3.5-2B |
| 模型架构 | Qwen3_5ForCausalLM |
| 参数量 | ~2B |
| 隐藏层维度 | 2048 |
| Transformer 层数 | 24 |
| 注意力头数 | 8(KV 头数:2) |
| 最大上下文长度 | 262,144 tokens |
| 推理精度 | bfloat16 |
| 语言 | 中文为主 |
---
## 训练详情
### 数据集
- **数据集**:[XuehangCang/MicroMajor-AIAppTech](https://huggingface.co/datasets/XuehangCang/MicroMajor-AIAppTech)
- **格式**:`question` / `thinking` / `answer` 三字段,助手回复使用 `<think></think>` 包裹推理链,后接最终答案(Chain-of-Thought 风格)
### 微调方法
- **方法**:LoRA SFT
- **框架**:🤗 Transformers + TRL + PEFT
### 超参数配置
| 超参数 | 值 |
|-------|----|
| 微调方法 | LoRA |
| LoRA Rank (r) | 16 |
| LoRA Alpha | 32 |
| LoRA Dropout | 0.05 |
| LoRA 目标模块 | all-linear(q/k/v/o_proj、gate/up/down_proj 等全部线性层) |
| 训练轮次 | 3 epochs |
| 单卡 Batch Size | 2 |
| 梯度累积步数 | 8(等效全局 batch = 16) |
| 学习率 | 2e-4 |
| 学习率调度 | Cosine |
| Warmup 比例 | 5% |
| 权重衰减 | 0.01 |
| 优化器 | AdamW Fused |
| 训练精度 | bfloat16 |
| 最大序列长度 | 2048 tokens |
| 梯度检查点 | ✅ 开启 |
---
## 快速开始
### 环境依赖
```bash
pip install transformers>=4.51.0 torch accelerate
```
### 推理示例
```python
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
model_path = "XuehangCang/MicroMajor-2B-AIAppTech"
tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(
model_path,
torch_dtype=torch.bfloat16,
device_map="auto",
trust_remote_code=True,
)
model.eval()
question = "请简述 Transformer 架构中 Self-Attention 的计算过程。"
messages = [{"role": "user", "content": question}]
text = tokenizer.apply_chat_template(
messages,
tokenize=False,
add_generation_prompt=True,
)
inputs = tokenizer(text, return_tensors="pt").to(model.device)
with torch.no_grad():
output_ids = model.generate(
**inputs,
max_new_tokens=512,
temperature=0.7,
top_p=0.9,
do_sample=True,
pad_token_id=tokenizer.eos_token_id,
)
new_ids = output_ids[0][inputs["input_ids"].shape[-1]:]
print(tokenizer.decode(new_ids, skip_special_tokens=True))
```
### 使用 pipeline
```python
from transformers import pipeline
pipe = pipeline(
"text-generation",
model="XuehangCang/MicroMajor-2B-AIAppTech",
torch_dtype="bfloat16",
device_map="auto",
)
messages = [{"role": "user", "content": "什么是 RAG?它在 AI 应用中有什么作用?"}]
result = pipe(messages, max_new_tokens=512, temperature=0.7)
print(result[0]["generated_text"][-1]["content"])
```
---
## 适用场景
- 🎓 **AI 专业课程辅助**:为学生提供人工智能应用技术各科目的问答辅导
- 📚 **智能题库与练习**:生成专业习题解析、概念解释
- 🤖 **课程智能助手**:集成至教学平台,回答学生关于课程知识点的问题
- 🔬 **垂直领域研究**:作为教育领域小模型微调方法的参考实现
---
## 局限性
- 本模型专注于**人工智能应用技术**垂直领域,通用知识覆盖相对有限
- 评测基于关键词匹配与字符数统计,建议结合人工评估使用
- 参数量为 2B,复杂推理任务建议配合 Chain-of-Thought 提示词
- 模型回答可能存在幻觉,请结合教材内容进行核实
---
## 引用
如果本模型对您的研究或教学有所帮助,欢迎引用:
```bibtex
@misc{MicroMajor-2B-AIAppTech,
author = {XuehangCang},
title = {MicroMajor-2B-AIAppTech: A Domain-Specific LLM for AI Application Technology Education},
year = {2026},
publisher = {Hugging Face},
url = {https://huggingface.co/XuehangCang/MicroMajor-2B-AIAppTech}
}
```
---
## 许可证
本模型基于 Qwen3.5-2B 微调,遵循 [Apache 2.0 License](https://www.apache.org/licenses/LICENSE-2.0)