auffusion
/

auffusion-full

Model card Files Files and versions

auffusion commited on Jan 3, 2024

Commit

db5169f

·

1 Parent(s): 6b038b2

first commit

Files changed (1) hide show

README.md +15 -0

README.md CHANGED Viewed

@@ -68,4 +68,19 @@ prompt = "Rolling thunder with lightning strikes"
 output = pipeline(prompt=prompt, num_inference_steps=100, guidance_scale=7.5)
 audio = output.audios[0]
 IPython.display.Audio(data=audio, rate=16000)
 ```

 output = pipeline(prompt=prompt, num_inference_steps=100, guidance_scale=7.5)
 audio = output.audios[0]
 IPython.display.Audio(data=audio, rate=16000)
+```
+##  Citation
+Please consider citing the following article if you found our work useful:
+```bibtex
+@article{xue2024auffusion,
+  title={Auffusion: Leveraging the Power of Diffusion and Large Language Models for Text-to-Audio Generation},
+  author={Jinlong Xue and Yayue Deng and Yingming Gao and Ya Li},
+  journal={arXiv preprint arXiv:2401.01044},
+  year={2024}
+}
+```
 ```