File size: 1,514 Bytes
e68f211
 
 
 
 
 
 
 
 
 
4f150e2
4cc0c69
4f150e2
9f83ce9
4f150e2
9f83ce9
4f150e2
 
 
 
 
e68f211
 
 
 
4f150e2
e68f211
 
 
 
 
4f150e2
e68f211
 
 
4f150e2
e68f211
 
 
 
 
 
 
 
 
 
4f150e2
e68f211
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
---
title: Sign Language Inference
emoji: 🔠
colorFrom: blue
colorTo: green
sdk: docker
app_file: app.py
pinned: false
---

# Sign Language Inference API

Đây là dự án triển khai inference của mô hình nhận dạng cử chỉ/ngôn ngữ ký hiệu thông qua video, sử dụng FastAPI và triển khai trên Hugging Face Spaces.

## Mục đích

- Cho phép người dùng upload video và nhận kết quả nhận dạng cử chỉ.
- Hỗ trợ nhiều kiến trúc mô hình: `dsta_slr`, `sl_gcn`, `spoter`.
- Cho phép lựa chọn output gồm: 
  - `predictions`: Chỉ trả về kết quả dự đoán.
  - `csv`: Trả về đường dẫn tới file kết quả `results.csv`.
  - `video`: Trả về đường dẫn tới video đầu ra.
  - `all`: Trả về tất cả kết quả trên.

## Cách sử dụng

Sử dụng lệnh `POST` tới endpoint `/inference` với các tham số:
- `model_name`: Một trong `dsta_slr`, `sl_gcn`, `spoter`
- `output_option`: Một trong `predictions`, `csv`, `video`, `all`
- `output_dir`: Thư mục output muốn lưu kết quả
- Upload kèm file video trong form-data

Ví dụ:
```python
import requests

url = 'https://<your-space>.hf.space/inference'
video_path = '/path/to/your_video.mp4'
params = {
    'model_name': 'spoter',
    'output_option': 'all',
    'output_dir': 'custom_output_folder'
}
files = {
    'file': open(video_path, 'rb')
}

response = requests.post(url=url, files=files, params=params)
print(response.json())