# 中文语言模型对比实验报告 --- ## 1. 模型及类别选择 ### 1.1 模型类型与背景说明 本实验选用了两款语言生成模型: - **DeepSeek-7B-Chat**:DeepSeek官方发布的7B参数对话优化模型,适合多轮对话生成任务,支持高质量自然语言生成。 - **Google Flan-T5-Base**:Google开源的基础版Flan-T5模型,基于T5架构,支持多种自然语言理解与生成任务。 ### 1.2 模型用途对比简述 - DeepSeek更侧重于对话生成和上下文连贯,适用于智能问答、聊天机器人。 - Flan-T5则是通用文本生成和理解模型,适用范围广泛,包括文本摘要、翻译、问答等。 ### 1.3 选取标准与模型异同点分析 - 选取理由:两模型均公开且参数量适中,便于部署对比实验。 - 异同点: - DeepSeek参数较多(7B),优化对话表现; - Flan-T5体积较小,灵活多样; - 两者均支持采样生成,但生成风格和侧重点不同。 --- ## 2. 系统实现细节 ### 2.1 Gradio交互界面截图 (在此插入实际界面截图,图片路径示例:`assets/ui_screenshot.png`) ### 2.2 输入与输出流程图 ```mermaid flowchart TD A[用户输入文本] --> B[Gradio 输入框] B --> C{调用两个模型} C --> D[DeepSeek-7B-Chat生成] C --> E[Flan-T5-Base生成] D --> F[显示DeepSeek结果] E --> G[显示Flan-T5结果]