depth-anything-3

Running on Zero

App Files Files Community

depth-anything-3 / SPACES_SETUP.md

linhaotong

update

4845d25 about 1 month ago

preview code

raw

history blame

4.67 kB

	# Hugging Face Spaces 部署指南

	## 📋 概述

	这个项目已经配置好可以部署到 Hugging Face Spaces，使用 `@spaces.GPU` 装饰器来动态分配 GPU 资源。

	## 🎯 关键文件

	### 1. `app.py` - 主应用文件

	```python
	import spaces
	from depth_anything_3.app.gradio_app import DepthAnything3App
	from depth_anything_3.app.modules.model_inference import ModelInference

	# 使用 monkey-patching 将 GPU 装饰器应用到推理函数
	original_run_inference = ModelInference.run_inference

	@spaces.GPU(duration=120) # 请求 GPU，最多 120 秒
	def gpu_run_inference(self, args, *kwargs):
	return original_run_inference(self, args, *kwargs)

	ModelInference.run_inference = gpu_run_inference
	```

	工作原理：
	- `@spaces.GPU` 装饰器在函数调用时动态分配 GPU
	- `duration=120` 表示单次推理最多使用 GPU 120 秒
	- 通过 monkey-patching，我们将装饰器应用到已有的推理函数上，无需修改核心代码

	### 2. `README.md` - Spaces 配置

	```yaml
	---
	title: Depth Anything 3
	sdk: gradio
	sdk_version: 5.49.1
	app_file: app.py
	pinned: false
	license: cc-by-nc-4.0
	---
	```

	这个 YAML 前置内容告诉 Hugging Face Spaces：
	- 使用 Gradio SDK
	- 入口文件是 `app.py`
	- 使用的 Gradio 版本

	### 3. `pyproject.toml` - 依赖配置

	已经更新，包含了 `spaces` 依赖：

	```toml
	[project.optional-dependencies]
	app = ["gradio>=5", "pillow>=9.0", "spaces"]
	```

	## 🚀 部署步骤

	### 方式 1：通过 Hugging Face 网页界面

	1. 在 Hugging Face 创建一个新的 Space
	2. 选择 Gradio 作为 SDK
	3. 上传你的代码（包括 `app.py`, `src/`, `pyproject.toml` 等）
	4. Space 会自动构建并启动

	### 方式 2：通过 Git

	```bash
	# 克隆你的 Space 仓库
	git clone https://huggingface.co/spaces/YOUR_USERNAME/YOUR_SPACE_NAME
	cd YOUR_SPACE_NAME

	# 添加你的代码
	cp -r /path/to/depth-anything-3/* .

	# 提交并推送
	git add .
	git commit -m "Initial commit"
	git push
	```

	## 🔧 配置选项

	### GPU 类型

	Hugging Face Spaces 支持不同的 GPU 类型：

	- Free (T4): 免费，适合小型模型
	- A10G: 付费，更强大
	- A100: 付费，最强大

	### GPU Duration

	在 `app.py` 中可以调整：

	```python
	@spaces.GPU(duration=120) # 120 秒
	```

	- 设置太短：复杂推理可能超时
	- 设置太长：浪费资源
	- 推荐：根据实际推理时间设置（可以先设长一点，然后根据日志调整）

	### 环境变量

	可以在 Space 设置中配置环境变量：

	- `DA3_MODEL_DIR`: 模型目录路径
	- `DA3_WORKSPACE_DIR`: 工作空间目录
	- `DA3_GALLERY_DIR`: 图库目录

	## 📊 监控和调试

	### 查看日志

	在 Spaces 界面点击 "Logs" 标签可以看到：

	```
	🚀 Launching Depth Anything 3 on Hugging Face Spaces...
	📦 Model Directory: depth-anything/DA3NESTED-GIANT-LARGE
	📁 Workspace Directory: workspace/gradio
	🖼️ Gallery Directory: workspace/gallery
	```

	### GPU 使用情况

	在装饰的函数内部，可以检查 GPU 状态：

	```python
	print(torch.cuda.is_available()) # True
	print(torch.cuda.device_count()) # 1 (通常)
	print(torch.cuda.get_device_name(0)) # 'Tesla T4' 或其他
	```

	## 🎓 示例代码

	查看 `example_spaces_gpu.py` 了解 `@spaces.GPU` 装饰器的基本用法。

	## ❓ 常见问题

	### Q: 为什么使用 monkey-patching？

	A: 这样可以在不修改核心代码的情况下添加 Spaces 支持。如果你想更优雅的方式，可以：

	1. 直接在 `ModelInference.run_inference` 方法上添加装饰器
	2. 创建一个继承自 `ModelInference` 的新类

	### Q: 如何测试本地是否能运行？

	A: 本地运行时，`spaces.GPU` 装饰器会被忽略（如果没有安装 spaces 包），或者会直接执行函数而不做特殊处理。

	```bash
	# 本地测试
	python app.py
	```

	### Q: 可以装饰多个函数吗？

	A: 可以！你可以给任何需要 GPU 的函数添加 `@spaces.GPU` 装饰器。

	```python
	@spaces.GPU(duration=60)
	def function1():
	pass

	@spaces.GPU(duration=120)
	def function2():
	pass
	```

	### Q: 如何优化 GPU 使用？

	A: 一些建议：

	1. 只装饰必要的函数：不要装饰整个 app，只装饰实际使用 GPU 的推理函数
	2. 设置合适的 duration：根据实际需求设置
	3. 清理 GPU 内存：在函数结束时调用 `torch.cuda.empty_cache()`
	4. 批处理：如果可能，批量处理多个请求

	## 🔗 相关资源

	- [Hugging Face Spaces 文档](https://huggingface.co/docs/hub/spaces)
	- [Spaces GPU 使用指南](https://huggingface.co/docs/hub/spaces-gpus)
	- [Gradio 文档](https://gradio.app/docs)

	## 📝 许可证

	Apache-2.0