File size: 3,371 Bytes
9984a7d
d7cb9d0
81a2e17
 
 
9984a7d
 
 
 
81a2e17
9984a7d
 
d7cb9d0
81a2e17
d7cb9d0
81a2e17
 
 
e0e224f
d7cb9d0
 
81a2e17
 
 
 
d7cb9d0
e0e224f
d7cb9d0
e0e224f
81a2e17
 
 
d7cb9d0
81a2e17
e0e224f
d7cb9d0
 
 
 
 
e0e224f
 
d7cb9d0
e0e224f
d7cb9d0
 
 
 
 
 
 
 
 
 
 
 
 
81a2e17
 
 
d7cb9d0
e0e224f
 
d7cb9d0
 
 
 
 
e0e224f
d7cb9d0
e0e224f
d7cb9d0
 
 
 
e0e224f
 
 
d7cb9d0
 
e0e224f
 
81a2e17
d7cb9d0
 
81a2e17
 
 
 
 
d7cb9d0
 
 
 
 
 
 
81a2e17
 
 
 
 
d7cb9d0
 
e0e224f
 
 
d7cb9d0
e0e224f
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
---
title: Zero123++ 工程六视图生成器
emoji: 🎨
colorFrom: blue
colorTo: purple
sdk: gradio
sdk_version: 5.49.1
app_file: app.py
pinned: false
license: mit
---

# Zero123++ 工程六视图生成器

将单张主视图转换为工程六视图(通过旋转输入 + 选择视角实现)

## 功能特点

- 📷 单图生成工程六视图
- 🎯 接近标准正交投影视图(前/后/左/右/上/下)
- 🚀 基于 Zero123++ v1.2 模型
- ✨ 简洁的 Gradio 界面

## 使用方法

1. 上传一张主视图图片(建议正方形,>= 320x320)
2. 点击"生成工程六视图"按钮
3. 等待 2-3 分钟(需要 3 次推理)
4. 下载生成的六视图合成图

## 输出说明

生成的图像包含 6 个视图,排列为 2 行 3 列:

```
┌─────────┬─────────┬─────────┐
│  主视图  │  右视图  │  后视图  │
├─────────┼─────────┼─────────┤
│  左视图  │  俯视图  │  底视图  │
└─────────┴─────────┴─────────┘
```

### 视角实现方法

| 视图 | 实现方法 | 说明 |
|-----|---------|------|
| 主视图 | Zero123++ 30° 视角 | 正面视角 |
| 右视图 | Zero123++ 90° 视角 | 右侧视角 |
| 后视图 | Zero123++ 210° 视角 | 背面视角 |
| 左视图 | Zero123++ 270° 视角 | 左侧视角 |
| 俯视图 | 输入旋转-90° → Zero123++ | 从上往下看 |
| 底视图 | 输入旋转+90° → Zero123++ | 从下往上看 |

**技术说明:**
- Zero123++ 固定输出 6 个环绕视角(30°, 90°, 150°, 210°, 270°, 330°)
- 无法自定义视角参数
- 通过选择合适的输出视角 + 旋转输入图片来模拟工程六视图

## 技术细节

- **模型**: [Zero123++ v1.2](https://huggingface.co/sudo-ai/zero123plus-v1.2)
- **框架**: Diffusers + Gradio
- **硬件**: 需要 GPU (推荐至少 T4 或更高)
- **推理方式**:
  - 第 1 次推理: 水平视图(主/右/后/左)
  - 第 2 次推理: 俯视图(输入旋转-90°)
  - 第 3 次推理: 底视图(输入旋转+90°)
- **总耗时**: 约 2-3 分钟(取决于 GPU 性能)

## v1.2 改进

- 相机内参处理更精细
- 输出视野角统一为 30°
- 仰角从 30°/-20° 改为 20°/-10°
- 更适合 3D 生成而非新视角合成

## 应用场景

- 🏗️ **工程制图**: 生成类似工程图的六视图
- 🎮 **3D 建模**: 为 3D 建模提供多视角参考
- 📐 **产品设计**: 产品的多角度展示
- 🎨 **艺术创作**: 角色或物体的多视角参考

**注意**: 由于 Zero123++ 的固定视角限制,生成的视图是"接近"而非"严格"的正交视图。

## 引用

如果使用了这个模型,请引用:

```bibtex
@misc{shi2023zero123plus,
    title={Zero123++: a Single Image to Consistent Multi-view Diffusion Base Model},
    author={Ruoxi Shi and Hansheng Chen and Zhuoyang Zhang and Minghua Liu and Chao Xu and Xinyue Wei and Linghao Chen and Chong Zeng and Hao Su},
    year={2023},
    eprint={2310.15110},
    archivePrefix={arXiv},
    primaryClass={cs.CV}
}
```

## 许可证

- 代码: Apache 2.0
- 模型权重: CC-BY-NC 4.0 (非商业用途)

## 致谢

- [Zero123++](https://github.com/SUDO-AI-3D/zero123plus) - 原始项目
- [Hugging Face](https://huggingface.co/) - 模型托管和部署平台