| --- |
| language: |
| - zh |
| license: apache-2.0 |
| base_model: Qwen/Qwen3.5-2B |
| datasets: |
| - XuehangCang/MicroMajor-AIAppTech |
| tags: |
| - sft |
| - lora |
| - qwen |
| - education |
| - ai-application |
| - chinese |
| - causal-lm |
| pipeline_tag: text-generation |
| --- |
| |
|
|
|
|
| `MicroMajor-2B-AIAppTech` 是针对**人工智能应用技术**微专业方向打造的垂直领域小模型 |
|
|
| 以 [Qwen/Qwen3.5-2B](https://huggingface.co/Qwen/Qwen3.5-2B) 为基座,使用专属课程 Q&A 数据集 [XuehangCang/MicroMajor-AIAppTech](https://huggingface.co/datasets/XuehangCang/MicroMajor-AIAppTech) 进行有监督微调,覆盖课程如下: |
|
|
| | 序号 | 课程名称 | |
| |:---:|---------| |
| | 1 | 人工智能概述 | |
| | 2 | Python 程序设计实践 | |
| | 3 | 机器学习基础 | |
| | 4 | 自然语言处理应用与实践 | |
| | 5 | 人工智能实践 | |
|
|
| --- |
|
|
| ## 评测结果 |
|
|
| 评测方法:25 道专业题(5 课程 × 5 题),与基座模型 Qwen3.5-2B 进行对比 |
| 评分规则:关键词命中率得分(0–6 分)+ 回答完整性得分(0–4 分)= 综合得分(0–10 分) |
|
|
|
|
| ### 各课程均分对比 |
|
|
| | 课程 | MicroMajor-2B-AIAppTech | Qwen3.5-2B | 提升幅度 | |
| |------|:-----------------------:|:------------------:|:--------:| |
| | 人工智能概述 | **8.40** | 7.52 | +0.88 | |
| | Python程序设计实践 | **8.63** | 7.77 | +0.86 | |
| | 机器学习基础 | **9.14** | 8.46 | +0.68 | |
| | 自然语言处理应用与实践 | **8.48** | 7.99 | +0.49 | |
| | 人工智能实践 | **8.63** | 7.60 | +1.03 | |
| | **全科综合** | **8.66** | **7.87** | **+0.79** | |
|
|
| ### 多维度对比 |
|
|
| | 维度 | MicroMajor-2B-AIAppTech | Qwen3.5-2B | |
| |------|:-----------------------:|:------------------:| |
| | 关键词均分(/6) | **4.66** | 3.87 | |
| | 完整性均分(/4) | 4.00 | 4.00 | |
| | 综合均分(/10) | **8.66** | 7.87 | |
| | 平均回答字符数 | 836 字 | 830 字 | |
| | 平均推理耗时 | 11.2 秒 | 11.3 秒 | |
|
|
|
|
| --- |
|
|
| ## 模型信息 |
|
|
| | 属性 | 详情 | |
| |------|------| |
| | 基座模型 | Qwen/Qwen3.5-2B | |
| | 模型架构 | Qwen3_5ForCausalLM | |
| | 参数量 | ~2B | |
| | 隐藏层维度 | 2048 | |
| | Transformer 层数 | 24 | |
| | 注意力头数 | 8(KV 头数:2) | |
| | 最大上下文长度 | 262,144 tokens | |
| | 推理精度 | bfloat16 | |
| | 语言 | 中文为主 | |
| |
| --- |
| |
| ## 训练详情 |
| |
| ### 数据集 |
| |
| - **数据集**:[XuehangCang/MicroMajor-AIAppTech](https://huggingface.co/datasets/XuehangCang/MicroMajor-AIAppTech) |
| - **格式**:`question` / `thinking` / `answer` 三字段,助手回复使用 `<think>…</think>` 包裹推理链,后接最终答案(Chain-of-Thought 风格) |
| |
| ### 微调方法 |
| |
| - **方法**:LoRA SFT |
| - **框架**:🤗 Transformers + TRL + PEFT |
| |
| ### 超参数配置 |
| |
| | 超参数 | 值 | |
| |-------|----| |
| | 微调方法 | LoRA | |
| | LoRA Rank (r) | 16 | |
| | LoRA Alpha | 32 | |
| | LoRA Dropout | 0.05 | |
| | LoRA 目标模块 | all-linear(q/k/v/o_proj、gate/up/down_proj 等全部线性层) | |
| | 训练轮次 | 3 epochs | |
| | 单卡 Batch Size | 2 | |
| | 梯度累积步数 | 8(等效全局 batch = 16) | |
| | 学习率 | 2e-4 | |
| | 学习率调度 | Cosine | |
| | Warmup 比例 | 5% | |
| | 权重衰减 | 0.01 | |
| | 优化器 | AdamW Fused | |
| | 训练精度 | bfloat16 | |
| | 最大序列长度 | 2048 tokens | |
| | 梯度检查点 | ✅ 开启 | |
| |
| --- |
| |
| ## 快速开始 |
| |
| ### 环境依赖 |
| |
| ```bash |
| pip install transformers>=4.51.0 torch accelerate |
| ``` |
| |
| ### 推理示例 |
| |
| ```python |
| import torch |
| from transformers import AutoTokenizer, AutoModelForCausalLM |
| |
| model_path = "XuehangCang/MicroMajor-2B-AIAppTech" |
|
|
| tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True) |
| model = AutoModelForCausalLM.from_pretrained( |
| model_path, |
| torch_dtype=torch.bfloat16, |
| device_map="auto", |
| trust_remote_code=True, |
| ) |
| model.eval() |
| |
| question = "请简述 Transformer 架构中 Self-Attention 的计算过程。" |
| messages = [{"role": "user", "content": question}] |
|
|
| text = tokenizer.apply_chat_template( |
| messages, |
| tokenize=False, |
| add_generation_prompt=True, |
| ) |
| inputs = tokenizer(text, return_tensors="pt").to(model.device) |
| |
| with torch.no_grad(): |
| output_ids = model.generate( |
| **inputs, |
| max_new_tokens=512, |
| temperature=0.7, |
| top_p=0.9, |
| do_sample=True, |
| pad_token_id=tokenizer.eos_token_id, |
| ) |
| |
| new_ids = output_ids[0][inputs["input_ids"].shape[-1]:] |
| print(tokenizer.decode(new_ids, skip_special_tokens=True)) |
| ``` |
| |
| ### 使用 pipeline |
| |
| ```python |
| from transformers import pipeline |
| |
| pipe = pipeline( |
| "text-generation", |
| model="XuehangCang/MicroMajor-2B-AIAppTech", |
| torch_dtype="bfloat16", |
| device_map="auto", |
| ) |
| |
| messages = [{"role": "user", "content": "什么是 RAG?它在 AI 应用中有什么作用?"}] |
| result = pipe(messages, max_new_tokens=512, temperature=0.7) |
| print(result[0]["generated_text"][-1]["content"]) |
| ``` |
| |
| --- |
| |
| ## 适用场景 |
| |
| - 🎓 **AI 专业课程辅助**:为学生提供人工智能应用技术各科目的问答辅导 |
| - 📚 **智能题库与练习**:生成专业习题解析、概念解释 |
| - 🤖 **课程智能助手**:集成至教学平台,回答学生关于课程知识点的问题 |
| - 🔬 **垂直领域研究**:作为教育领域小模型微调方法的参考实现 |
| |
| --- |
| |
| ## 局限性 |
| |
| - 本模型专注于**人工智能应用技术**垂直领域,通用知识覆盖相对有限 |
| - 评测基于关键词匹配与字符数统计,建议结合人工评估使用 |
| - 参数量为 2B,复杂推理任务建议配合 Chain-of-Thought 提示词 |
| - 模型回答可能存在幻觉,请结合教材内容进行核实 |
| |
| --- |
| |
| |
| ## 引用 |
| |
| 如果本模型对您的研究或教学有所帮助,欢迎引用: |
| |
| ```bibtex |
| @misc{MicroMajor-2B-AIAppTech, |
| author = {XuehangCang}, |
| title = {MicroMajor-2B-AIAppTech: A Domain-Specific LLM for AI Application Technology Education}, |
| year = {2026}, |
| publisher = {Hugging Face}, |
| url = {https://huggingface.co/XuehangCang/MicroMajor-2B-AIAppTech} |
| } |
| ``` |
| |
| --- |
| |
| ## 许可证 |
| |
| 本模型基于 Qwen3.5-2B 微调,遵循 [Apache 2.0 License](https://www.apache.org/licenses/LICENSE-2.0) |
| |