| # 中文语言模型对比实验报告 | |
| --- | |
| ## 1. 模型及类别选择 | |
| ### 1.1 模型类型与背景说明 | |
| 本实验选用了两款语言生成模型: | |
| - **DeepSeek-7B-Chat**:DeepSeek官方发布的7B参数对话优化模型,适合多轮对话生成任务,支持高质量自然语言生成。 | |
| - **Google Flan-T5-Base**:Google开源的基础版Flan-T5模型,基于T5架构,支持多种自然语言理解与生成任务。 | |
| ### 1.2 模型用途对比简述 | |
| - DeepSeek更侧重于对话生成和上下文连贯,适用于智能问答、聊天机器人。 | |
| - Flan-T5则是通用文本生成和理解模型,适用范围广泛,包括文本摘要、翻译、问答等。 | |
| ### 1.3 选取标准与模型异同点分析 | |
| - 选取理由:两模型均公开且参数量适中,便于部署对比实验。 | |
| - 异同点: | |
| - DeepSeek参数较多(7B),优化对话表现; | |
| - Flan-T5体积较小,灵活多样; | |
| - 两者均支持采样生成,但生成风格和侧重点不同。 | |
| --- | |
| ## 2. 系统实现细节 | |
| ### 2.1 Gradio交互界面截图 | |
| (在此插入实际界面截图,图片路径示例:`assets/ui_screenshot.png`) | |
| ### 2.2 输入与输出流程图 | |
| ```mermaid | |
| flowchart TD | |
| A[用户输入文本] --> B[Gradio 输入框] | |
| B --> C{调用两个模型} | |
| C --> D[DeepSeek-7B-Chat生成] | |
| C --> E[Flan-T5-Base生成] | |
| D --> F[显示DeepSeek结果] | |
| E --> G[显示Flan-T5结果] | |