Zeyue7
/

AudioX

Model card Files Files and versions

Zeyue7 commited on Apr 1, 2025

Commit

a90b58b

·

1 Parent(s): 8e48b17

update

Files changed (1) hide show

README.md +16 -2

README.md CHANGED Viewed

@@ -4,9 +4,9 @@ license: cc-by-nc-4.0
 # AudioX
-## AudioX: A Simple Audio-to-Audio Generation Framework with Long-Short-Term Modeling
-[TL;DR]: AudioX is a framework for generating high-fidelity audio aligned with audio content, utilizing Long-Short-Term modeling, and has been accepted to CVPR 2025.
 ### Links
 - **[Paper](https://arxiv.org/abs/2503.10522)**: Explore the research behind VidMuse.
@@ -18,3 +18,17 @@ license: cc-by-nc-4.0
 GIT_LFS_SKIP_SMUDGE=1 git clone https://huggingface.co/Zeyue7/AudioX
 cd AudioX
 ```

 # AudioX
+## 🎧 AudioX: Diffusion Transformer for Anything-to-Audio Generation
+[TL;DR]: AudioX is a unified Diffusion Transformer model for Anything-to-Audio and Music Generation, capable of generating high-quality general audio and music, offering flexible natural language control, and seamlessly processing various modalities including text, video, image, music, and audio.
 ### Links
 - **[Paper](https://arxiv.org/abs/2503.10522)**: Explore the research behind VidMuse.
 GIT_LFS_SKIP_SMUDGE=1 git clone https://huggingface.co/Zeyue7/AudioX
 cd AudioX
 ```
+## Citation
+If you find our work useful, please consider citing:
+```
+@article{tian2025audiox,
+  title={AudioX: Diffusion Transformer for Anything-to-Audio Generation},
+  author={Tian, Zeyue and Jin, Yizhu and Liu, Zhaoyang and Yuan, Ruibin and Tan, Xu and Chen, Qifeng and Xue, Wei and Guo, Yike},
+  journal={arXiv preprint arXiv:2503.10522},
+  year={2025}
+}
+```