1142

Sleeping

App Files Files Community

1142 / src /report.md

longdiyao

Create report.md

e81ae4b verified 7 months ago

preview code

raw

history blame contribute delete

1.43 kB

A newer version of the Gradio SDK is available: 6.4.0

Upgrade

中文语言模型对比实验报告

1. 模型及类别选择

1.1 模型类型与背景说明

本实验选用了两款语言生成模型：

DeepSeek-7B-Chat：DeepSeek官方发布的7B参数对话优化模型，适合多轮对话生成任务，支持高质量自然语言生成。
Google Flan-T5-Base：Google开源的基础版Flan-T5模型，基于T5架构，支持多种自然语言理解与生成任务。

1.2 模型用途对比简述

DeepSeek更侧重于对话生成和上下文连贯，适用于智能问答、聊天机器人。
Flan-T5则是通用文本生成和理解模型，适用范围广泛，包括文本摘要、翻译、问答等。

1.3 选取标准与模型异同点分析

选取理由：两模型均公开且参数量适中，便于部署对比实验。
异同点：
- DeepSeek参数较多（7B），优化对话表现；
- Flan-T5体积较小，灵活多样；
- 两者均支持采样生成，但生成风格和侧重点不同。

2. 系统实现细节

2.1 Gradio交互界面截图

（在此插入实际界面截图，图片路径示例：assets/ui_screenshot.png）

2.2 输入与输出流程图

flowchart TD
    A[用户输入文本] --> B[Gradio 输入框]
    B --> C{调用两个模型}
    C --> D[DeepSeek-7B-Chat生成]
    C --> E[Flan-T5-Base生成]
    D --> F[显示DeepSeek结果]
    E --> G[显示Flan-T5结果]