Spaces:
Sleeping
Sleeping
Create report.md
#4
by duguanl - opened
report.md
ADDED
|
@@ -0,0 +1,24 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
# 📊 实验报告
|
| 2 |
+
|
| 3 |
+
## 实验目标
|
| 4 |
+
本实验比较两个 LLM 模型的输出质量,采用 GRACE 框架评估其表现。
|
| 5 |
+
|
| 6 |
+
## 模型介绍
|
| 7 |
+
- **Model A**:GPT-2
|
| 8 |
+
- **Model B**:DistilGPT2
|
| 9 |
+
|
| 10 |
+
## GRACE 维度评分
|
| 11 |
+
| 模型 | Generalization | Relevance | Artistry | Efficiency |
|
| 12 |
+
|----------|----------------|-----------|----------|------------|
|
| 13 |
+
| Model A | 4.0 | 4.5 | 3.5 | 4.0 |
|
| 14 |
+
| Model B | 3.5 | 4.0 | 4.0 | 3.5 |
|
| 15 |
+
|
| 16 |
+
## 总结
|
| 17 |
+
模型 A 在通用性和效率上表现更优;模型 B 在艺术性方面略胜一筹。
|
| 18 |
+
|
| 19 |
+
## 开发分工
|
| 20 |
+
- 同学 A:实现 Model A 封装、主界面集成与 GRACE 可视化
|
| 21 |
+
- 同学 B:实现 Model B 封装、Arena 模块与报告撰写
|
| 22 |
+
|
| 23 |
+
## 提交记录
|
| 24 |
+
见 Files 页面和 Git 历史,可追溯每位同学的修改。
|