thienphuc12339 commited on
Commit
4f150e2
·
verified ·
1 Parent(s): 9f83ce9

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +26 -27
README.md CHANGED
@@ -1,30 +1,29 @@
1
- # Vietnamese Sign Language Translation
2
 
3
- The Vietnamese Sign Language Translation is a project focused on developing advanced AI technology to accurately interpret Vietnamese sign language through body movements.
4
 
5
- ## Installation
6
- 1. Create an environment with `Python == 3.9.19`
7
- 2. Install `Pytorchvideo`
8
- ```
9
- cd src/libs
10
- git clone https://github.com/facebookresearch/pytorchvideo.git
11
- pip install -e pytorchvideo
12
- ```
13
- 3. Install other requirements
14
- ```
15
- cd ../..
16
- pip install -r requirements.txt
17
- ```
18
 
19
- ## Inference
20
- 1. Prepare configurations for inference. Template for each architecture can be found at src/configs.
21
- 2. Modify the inference config:
22
- ```
23
- inference:
24
- source: webcam or path/to/video.mp4
25
- output_dir: path/to/output/dir
26
- ```
27
- 3. Enter this command from `root` directory of the project to start inference.
28
- ```
29
- python src/inference.py --config_path path/to/config.yaml
30
- ```
 
 
 
 
 
 
 
 
 
 
 
 
1
+ # Sign Language Inference API
2
 
3
+ Đây dự án triển khai inference của hình nhận dạng cử chỉ/ngôn ngữ hiệu thông qua video, sử dụng FastAPI và triển khai trên Hugging Face Spaces.
4
 
5
+ ## Mục đích
 
 
 
 
 
 
 
 
 
 
 
 
6
 
7
+ - Cho phép người dùng upload video và nhận kết quả nhận dạng cử chỉ.
8
+ - Hỗ trợ nhiều kiến trúc hình: `dsta_slr`, `sl_gcn`, `spoter`.
9
+ - Cho phép lựa chọn output gồm:
10
+ - `predictions`: Chỉ trả về kết quả dự đoán.
11
+ - `csv`: Trả về đường dẫn tới file kết quả `results.csv`.
12
+ - `video`: Trả về đường dẫn tới video đầu ra có vẽ skeleton và chú thích.
13
+ - `all`: Trả về tất cả các kết quả trên.
14
+
15
+ ## Cấu trúc dự án
16
+
17
+ - `app.py`: File chính chạy FastAPI API.
18
+ - `configs.py`: Định nghĩa các lớp cấu hình `ModelConfig`, `InferenceConfig`.
19
+ - `data.py`, `tools.py`, `utils.py`, `visualization.py`: Các tiện ích, xử lý pose, pipeline inference.
20
+ - `requirements.txt`: Danh sách các thư viện cần thiết.
21
+ - `Dockerfile`: Định nghĩa môi trường Docker để deploy lên Hugging Face Spaces (nếu sử dụng chế độ Docker).
22
+
23
+ ## Cách cài đặt và chạy (Local)
24
+
25
+ 1. Tạo và kích hoạt môi trường ảo (tùy chọn):
26
+ ```bash
27
+ python3 -m venv venv
28
+ source venv/bin/activate # Trên Linux/macOS
29
+ venv\Scripts\activate # Trên Windows