vanitas-sft / README.md

Upload README.md with huggingface_hub

503684c verified about 1 month ago

859 Bytes

tags:
  - vanitas
  - spoken-dialogue
  - mamba-ssm
  - flow-matching
license: mit
datasets:
  - kyutai/DailyTalkContiguous

Vanitas SFT Model

Perception Stream: Mamba-2 SSM (4 layers, d=256)
Cognition Core: Sparse Attention (4 layers, d=256)
Production Stream: Mamba-2 + Flow Matching (4 layers, d=256)

Supervised fine-tuned model for real-time spoken dialogue, trained on kyutai/DailyTalkContiguous.

Architecture