--- language: - zh license: apache-2.0 base_model: Qwen/Qwen3.5-2B datasets: - XuehangCang/MicroMajor-AIAppTech tags: - sft - lora - qwen - education - ai-application - chinese - causal-lm pipeline_tag: text-generation --- `MicroMajor-2B-AIAppTech` 是针对**人工智能应用技术**微专业方向打造的垂直领域小模型 以 [Qwen/Qwen3.5-2B](https://huggingface.co/Qwen/Qwen3.5-2B) 为基座,使用专属课程 Q&A 数据集 [XuehangCang/MicroMajor-AIAppTech](https://huggingface.co/datasets/XuehangCang/MicroMajor-AIAppTech) 进行有监督微调,覆盖课程如下: | 序号 | 课程名称 | |:---:|---------| | 1 | 人工智能概述 | | 2 | Python 程序设计实践 | | 3 | 机器学习基础 | | 4 | 自然语言处理应用与实践 | | 5 | 人工智能实践 | --- ## 评测结果 评测方法:25 道专业题(5 课程 × 5 题),与基座模型 Qwen3.5-2B 进行对比 评分规则:关键词命中率得分(0–6 分)+ 回答完整性得分(0–4 分)= 综合得分(0–10 分) ### 各课程均分对比 | 课程 | MicroMajor-2B-AIAppTech | Qwen3.5-2B | 提升幅度 | |------|:-----------------------:|:------------------:|:--------:| | 人工智能概述 | **8.40** | 7.52 | +0.88 | | Python程序设计实践 | **8.63** | 7.77 | +0.86 | | 机器学习基础 | **9.14** | 8.46 | +0.68 | | 自然语言处理应用与实践 | **8.48** | 7.99 | +0.49 | | 人工智能实践 | **8.63** | 7.60 | +1.03 | | **全科综合** | **8.66** | **7.87** | **+0.79** | ### 多维度对比 | 维度 | MicroMajor-2B-AIAppTech | Qwen3.5-2B | |------|:-----------------------:|:------------------:| | 关键词均分(/6) | **4.66** | 3.87 | | 完整性均分(/4) | 4.00 | 4.00 | | 综合均分(/10) | **8.66** | 7.87 | | 平均回答字符数 | 836 字 | 830 字 | | 平均推理耗时 | 11.2 秒 | 11.3 秒 | --- ## 模型信息 | 属性 | 详情 | |------|------| | 基座模型 | Qwen/Qwen3.5-2B | | 模型架构 | Qwen3_5ForCausalLM | | 参数量 | ~2B | | 隐藏层维度 | 2048 | | Transformer 层数 | 24 | | 注意力头数 | 8(KV 头数:2) | | 最大上下文长度 | 262,144 tokens | | 推理精度 | bfloat16 | | 语言 | 中文为主 | --- ## 训练详情 ### 数据集 - **数据集**:[XuehangCang/MicroMajor-AIAppTech](https://huggingface.co/datasets/XuehangCang/MicroMajor-AIAppTech) - **格式**:`question` / `thinking` / `answer` 三字段,助手回复使用 `` 包裹推理链,后接最终答案(Chain-of-Thought 风格) ### 微调方法 - **方法**:LoRA SFT - **框架**:🤗 Transformers + TRL + PEFT ### 超参数配置 | 超参数 | 值 | |-------|----| | 微调方法 | LoRA | | LoRA Rank (r) | 16 | | LoRA Alpha | 32 | | LoRA Dropout | 0.05 | | LoRA 目标模块 | all-linear(q/k/v/o_proj、gate/up/down_proj 等全部线性层) | | 训练轮次 | 3 epochs | | 单卡 Batch Size | 2 | | 梯度累积步数 | 8(等效全局 batch = 16) | | 学习率 | 2e-4 | | 学习率调度 | Cosine | | Warmup 比例 | 5% | | 权重衰减 | 0.01 | | 优化器 | AdamW Fused | | 训练精度 | bfloat16 | | 最大序列长度 | 2048 tokens | | 梯度检查点 | ✅ 开启 | --- ## 快速开始 ### 环境依赖 ```bash pip install transformers>=4.51.0 torch accelerate ``` ### 推理示例 ```python import torch from transformers import AutoTokenizer, AutoModelForCausalLM model_path = "XuehangCang/MicroMajor-2B-AIAppTech" tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True) model = AutoModelForCausalLM.from_pretrained( model_path, torch_dtype=torch.bfloat16, device_map="auto", trust_remote_code=True, ) model.eval() question = "请简述 Transformer 架构中 Self-Attention 的计算过程。" messages = [{"role": "user", "content": question}] text = tokenizer.apply_chat_template( messages, tokenize=False, add_generation_prompt=True, ) inputs = tokenizer(text, return_tensors="pt").to(model.device) with torch.no_grad(): output_ids = model.generate( **inputs, max_new_tokens=512, temperature=0.7, top_p=0.9, do_sample=True, pad_token_id=tokenizer.eos_token_id, ) new_ids = output_ids[0][inputs["input_ids"].shape[-1]:] print(tokenizer.decode(new_ids, skip_special_tokens=True)) ``` ### 使用 pipeline ```python from transformers import pipeline pipe = pipeline( "text-generation", model="XuehangCang/MicroMajor-2B-AIAppTech", torch_dtype="bfloat16", device_map="auto", ) messages = [{"role": "user", "content": "什么是 RAG?它在 AI 应用中有什么作用?"}] result = pipe(messages, max_new_tokens=512, temperature=0.7) print(result[0]["generated_text"][-1]["content"]) ``` --- ## 适用场景 - 🎓 **AI 专业课程辅助**:为学生提供人工智能应用技术各科目的问答辅导 - 📚 **智能题库与练习**:生成专业习题解析、概念解释 - 🤖 **课程智能助手**:集成至教学平台,回答学生关于课程知识点的问题 - 🔬 **垂直领域研究**:作为教育领域小模型微调方法的参考实现 --- ## 局限性 - 本模型专注于**人工智能应用技术**垂直领域,通用知识覆盖相对有限 - 评测基于关键词匹配与字符数统计,建议结合人工评估使用 - 参数量为 2B,复杂推理任务建议配合 Chain-of-Thought 提示词 - 模型回答可能存在幻觉,请结合教材内容进行核实 --- ## 引用 如果本模型对您的研究或教学有所帮助,欢迎引用: ```bibtex @misc{MicroMajor-2B-AIAppTech, author = {XuehangCang}, title = {MicroMajor-2B-AIAppTech: A Domain-Specific LLM for AI Application Technology Education}, year = {2026}, publisher = {Hugging Face}, url = {https://huggingface.co/XuehangCang/MicroMajor-2B-AIAppTech} } ``` --- ## 许可证 本模型基于 Qwen3.5-2B 微调,遵循 [Apache 2.0 License](https://www.apache.org/licenses/LICENSE-2.0)