Initial commit: Single mouse WebRTC pose estimation project

4673545 7 months ago

6.11 kB

	# 单鼠姿态检测WebRTC实时处理系统

	## 🎯 项目简介

	这是一个基于YOLOv8的单鼠姿态检测WebRTC实时处理系统，支持8个关键点检测，提供完整的WebSocket和REST API接口，专为实时视频流处理和前端集成设计。

	### 🌟 核心特性

	- ✅ 实时姿态检测: 8个关键点精准识别 (鼻子、左耳、右耳、躯干、左腿、右腿、尾巴根部、尾巴尖)
	- ✅ WebRTC流处理: 支持30+ FPS实时视频流处理
	- ✅ 双服务架构: Gradio可视化界面 + FastAPI RESTful服务
	- ✅ 多客户端支持: WebSocket连接管理，支持并发处理
	- ✅ 完整API: REST API + WebSocket + 批量处理
	- ✅ GPU/CPU自适应: 自动检测和使用最佳计算设备
	- ✅ 前端友好: 标准协议，易于集成各种前端框架

	## 📁 项目结构

	```
	single_mouse_webrtc_project/
	├── README.md # 项目主文档
	├── API对接文档.md # 详细API对接文档
	├── README_Gradio_WebRTC.md # WebRTC技术文档
	├── PROJECT_CHECKLIST.md # 部署检查清单
	├── requirements_gradio_webrtc.txt # Python依赖文件
	├── deploy.sh # 自动部署脚本
	├── start_gradio_webrtc.py # 服务启动管理器
	├── gradio_webrtc_server.py # Gradio WebRTC服务器
	├── gradio_webrtc_api.py # FastAPI REST服务器
	├── test_gradio_webrtc_client.py # 完整测试客户端
	├── check_model.py # 模型检查脚本
	├── inspect_model.py # 模型详细检查脚本
	├── create_test_image.py # 测试图像生成脚本
	├── test_mouse.jpg # 测试用小鼠图像
	└── models/ # 模型文件目录
	└── kunin-mice-pose.v0.1.5n.pt # YOLOv8姿态检测模型
	```

	## 🚀 快速启动

	### 方法1: 自动部署 (推荐)

	```bash
	# 进入项目目录
	cd single_mouse_webrtc_project

	# 运行自动部署脚本
	./deploy.sh
	```

	### 方法2: 手动部署

	```bash
	# 1. 创建Python虚拟环境
	conda create -n mouse-webrtc python=3.11
	conda activate mouse-webrtc

	# 2. 安装依赖
	pip install -r requirements_gradio_webrtc.txt

	# 3. 检查模型
	python check_model.py

	# 4. 启动服务
	python start_gradio_webrtc.py
	```

	### 服务地址

	启动成功后，您将看到以下服务地址：

	- Gradio界面: http://localhost:7860
	- API服务: http://localhost:8765
	- WebSocket流: ws://localhost:8765/ws/stream
	- API文档: http://localhost:8765/docs

	### 测试验证

	```bash
	# 运行完整测试套件
	python test_gradio_webrtc_client.py
	```

	## 📡 API使用示例

	### WebSocket实时流处理

	```javascript
	const ws = new WebSocket('ws://localhost:8765/ws/stream');

	ws.onopen = () => console.log('WebSocket连接成功');

	// 发送图像帧
	function sendFrame(imageBase64) {
	const frameData = {
	image: imageBase64,
	conf_threshold: 0.3,
	frame_id: Date.now(),
	timestamp: Date.now() / 1000
	};
	ws.send(JSON.stringify(frameData));
	}

	// 接收检测结果
	ws.onmessage = (event) => {
	const result = JSON.parse(event.data);
	if (result.success && result.mouse_detected) {
	console.log('检测到小鼠:', result.keypoints.length, '个关键点');
	// 处理检测结果...
	}
	};
	```

	### REST API单帧处理

	```javascript
	// 处理单张图像
	fetch('http://localhost:8765/api/process_frame', {
	method: 'POST',
	headers: { 'Content-Type': 'application/json' },
	body: JSON.stringify({
	image: imageBase64,
	conf_threshold: 0.3
	})
	})
	.then(response => response.json())
	.then(result => {
	console.log('检测结果:', result);
	});
	```

	## 🎯 关键点说明

	系统检测8个关键点：

	\| 索引 \| 名称 \| 描述 \|
	\|------\|------\|------\|
	\| 0 \| nose \| 鼻子 \|
	\| 1 \| left_ear \| 左耳 \|
	\| 2 \| right_ear \| 右耳 \|
	\| 3 \| torso \| 躯干 \|
	\| 4 \| left_leg \| 左腿 \|
	\| 5 \| right_leg \| 右腿 \|
	\| 6 \| tail_base \| 尾巴根部 \|
	\| 7 \| tail_tip \| 尾巴尖 \|

	## 📊 性能指标

	- 处理速度: 30+ FPS (GPU) / 6-15 FPS (CPU)
	- 检测精度: 置信度阈值可调 (默认0.3)
	- 延迟: < 50ms (本地处理)
	- 并发连接: 支持多客户端同时连接
	- 内存占用: ~2GB (GPU) / ~1GB (CPU)

	## 🛠️ 故障排除

	### 常见问题

	1. 模型加载失败
	```bash
	# 检查模型文件
	ls -la models/
	python check_model.py
	```

	2. 端口占用
	```bash
	# 检查端口使用情况
	lsof -i :7860
	lsof -i :8765
	```

	3. 依赖缺失
	```bash
	# 重新安装依赖
	pip install -r requirements_gradio_webrtc.txt
	```

	4. GPU不可用
	```bash
	# 检查CUDA环境
	python -c "import torch; print(torch.cuda.is_available())"
	```

	### 调试模式

	```bash
	# 启用详细日志
	export LOG_LEVEL=DEBUG
	python start_gradio_webrtc.py
	```

	## 📚 文档说明

	- README.md: 项目总体介绍和快速开始
	- API对接文档.md: 详细的API使用指南，包含完整示例
	- README_Gradio_WebRTC.md: WebRTC技术实现细节
	- PROJECT_CHECKLIST.md: 部署检查清单

	## 🔗 集成指南

	### 前端集成

	本系统专为前端集成设计，支持：

	- 纯HTML/JavaScript: 直接使用WebSocket连接
	- React.js/Vue.js: 组件化集成
	- 移动端: 支持WebRTC标准协议
	- 桌面应用: Electron等框架兼容

	详细集成示例请参考 `API对接文档.md`。

	### 后端集成

	- Python: 使用`websockets`库连接
	- Node.js: 使用`ws`模块
	- 其他语言: 支持标准WebSocket协议

	## 📄 许可证

	本项目为内部使用，请确保模型文件和代码的合规使用。

	## 🤝 技术支持

	如遇到问题或需要技术支持，请：

	1. 首先查看故障排除部分
	2. 运行完整测试验证环境
	3. 查看详细的API对接文档
	4. 联系项目维护者

	---

	项目版本: 1.0.0
	最后更新: 2025-06-05
	兼容性: Python 3.11+, 支持GPU/CPU