OpenMOSS-Team
/

MOSS-Audio-Tokenizer

Feature Extraction

moss-audio-tokenizer

audio-tokenizer

moss-tts-family

MOSS Audio Tokenizer

speech-tokenizer

trust-remote-code

Model card Files Files and versions

fdugyt commited on Feb 13

Commit

e4217e3

·

verified ·

1 Parent(s): 6381a50

add arxiv link in readme

Files changed (1) hide show

README.md +2 -0

README.md CHANGED Viewed

@@ -13,6 +13,8 @@ tags:
 # MossAudioTokenizer
 **MOSSAudioTokenizer** is a unified discrete audio tokenizer based on the **Cat** (**C**ausal **A**udio **T**okenizer with **T**ransformer) architecture. Scaling to 1.6 billion parameters, it functions as a unified discrete interface, delivering both lossless-quality reconstruction and high-level semantic alignment.
 **Key Features:**

 # MossAudioTokenizer
+This is the code for MOSS-Audio-Tokenizer presented in [MOSS-Audio-Tokenizer: Scaling Audio Tokenizers for Future Audio Foundation Models](https://arxiv.org/abs/2602.10934).
 **MOSSAudioTokenizer** is a unified discrete audio tokenizer based on the **Cat** (**C**ausal **A**udio **T**okenizer with **T**ransformer) architecture. Scaling to 1.6 billion parameters, it functions as a unified discrete interface, delivering both lossless-quality reconstruction and high-level semantic alignment.
 **Key Features:**