LEGIONM36
/

Video-Classification-Video-Swin-Transformer-Model

Video Classification

Model card Files Files and versions

Video-Classification-Video-Swin-Transformer-Model / readme.md

LEGIONM36's picture

Upload 4 files

469c325 verified about 2 months ago

|

history blame contribute delete

614 Bytes

Swin Transformer for Video

Model Architecture

Type: Video Swin Transformer (Tiny - Swin3D-T)
Source: Torchvision models.swin3d_t.
Modifications: Classification head (Linear) modified to output 2 classes (Binary).
Features: Hierarchical transformer with shifted windows, adapted for 3D Video processing.

Dataset Structure

Expects Dataset folder in parent directory.

Dataset/
├── violence/
└── no-violence/

How to Run

Install dependencies: torch, opencv-python, scikit-learn, numpy, torchvision.
Run python train.py.