1142

Sleeping

1142 / src /report.md

Create report.md

e81ae4b verified 7 months ago

1.43 kB

	# 中文语言模型对比实验报告

	---

	## 1. 模型及类别选择

	### 1.1 模型类型与背景说明
	本实验选用了两款语言生成模型：

	- DeepSeek-7B-Chat：DeepSeek官方发布的7B参数对话优化模型，适合多轮对话生成任务，支持高质量自然语言生成。
	- Google Flan-T5-Base：Google开源的基础版Flan-T5模型，基于T5架构，支持多种自然语言理解与生成任务。

	### 1.2 模型用途对比简述
	- DeepSeek更侧重于对话生成和上下文连贯，适用于智能问答、聊天机器人。
	- Flan-T5则是通用文本生成和理解模型，适用范围广泛，包括文本摘要、翻译、问答等。

	### 1.3 选取标准与模型异同点分析
	- 选取理由：两模型均公开且参数量适中，便于部署对比实验。
	- 异同点：
	- DeepSeek参数较多（7B），优化对话表现；
	- Flan-T5体积较小，灵活多样；
	- 两者均支持采样生成，但生成风格和侧重点不同。

	---

	## 2. 系统实现细节

	### 2.1 Gradio交互界面截图
	（在此插入实际界面截图，图片路径示例：`assets/ui_screenshot.png`）

	### 2.2 输入与输出流程图

	```mermaid
	flowchart TD
	A[用户输入文本] --> B[Gradio 输入框]
	B --> C{调用两个模型}
	C --> D[DeepSeek-7B-Chat生成]
	C --> E[Flan-T5-Base生成]
	D --> F[显示DeepSeek结果]
	E --> G[显示Flan-T5结果]