A newer version of the Gradio SDK is available:
6.4.0
中文语言模型对比实验报告
1. 模型及类别选择
1.1 模型类型与背景说明
本实验选用了两款语言生成模型:
- DeepSeek-7B-Chat:DeepSeek官方发布的7B参数对话优化模型,适合多轮对话生成任务,支持高质量自然语言生成。
- Google Flan-T5-Base:Google开源的基础版Flan-T5模型,基于T5架构,支持多种自然语言理解与生成任务。
1.2 模型用途对比简述
- DeepSeek更侧重于对话生成和上下文连贯,适用于智能问答、聊天机器人。
- Flan-T5则是通用文本生成和理解模型,适用范围广泛,包括文本摘要、翻译、问答等。
1.3 选取标准与模型异同点分析
- 选取理由:两模型均公开且参数量适中,便于部署对比实验。
- 异同点:
- DeepSeek参数较多(7B),优化对话表现;
- Flan-T5体积较小,灵活多样;
- 两者均支持采样生成,但生成风格和侧重点不同。
2. 系统实现细节
2.1 Gradio交互界面截图
(在此插入实际界面截图,图片路径示例:assets/ui_screenshot.png)
2.2 输入与输出流程图
flowchart TD
A[用户输入文本] --> B[Gradio 输入框]
B --> C{调用两个模型}
C --> D[DeepSeek-7B-Chat生成]
C --> E[Flan-T5-Base生成]
D --> F[显示DeepSeek结果]
E --> G[显示Flan-T5结果]