Spaces:

swayamshetkar
/

beatloo

Sleeping

App Files Files Community

swayamshetkar commited on Oct 23, 2025

Commit

3a0b35b

verified ·

1 Parent(s): bfd8166

Update app.py

Browse files

Files changed (1) hide show

app.py +20 -7

app.py CHANGED Viewed

@@ -13,24 +13,37 @@ model.to(device)
 def generate_music(prompt, duration):
     if not prompt.strip():
         return None, "Please enter a prompt."
     inputs = processor(text=[prompt], return_tensors="pt").to(device)
-    max_new_tokens = int(256 * (duration / 8))  # simple scaling
     with torch.no_grad():
         audio = model.generate(**inputs, max_new_tokens=max_new_tokens)
     sr = model.config.audio_encoder.sampling_rate
     audio_arr = audio[0, 0].cpu().numpy()
     tmp = tempfile.NamedTemporaryFile(suffix=".wav", delete=False)
     wavfile.write(tmp.name, rate=sr, data=audio_arr)
-    return tmp.name, f"Generated {duration}s of audio!"
 with gr.Blocks(title="MusicGen 🎶") as demo:
-    gr.Markdown("# 🎵 MusicGen — Text-to-Music Generator (Small Model)")
     with gr.Row():
-        prompt = gr.Textbox(label="Describe your music", placeholder="e.g. lo-fi hip hop with piano")
-        duration = gr.Slider(4, 20, value=8, step=1, label="Duration (seconds)")
     btn = gr.Button("Generate 🎧")
-    audio_out = gr.Audio(label="Output", type="filepath")
     msg = gr.Textbox(label="Status", interactive=False)
     btn.click(generate_music, inputs=[prompt, duration], outputs=[audio_out, msg])
-demo.launch()

 def generate_music(prompt, duration):
     if not prompt.strip():
         return None, "Please enter a prompt."
+    if duration > 60:
+        return None, "❌ Duration too long — max allowed is 60 seconds."
+    # Prepare inputs
     inputs = processor(text=[prompt], return_tensors="pt").to(device)
+    # Scale tokens with duration (MusicGen ≈ 256 tokens ≈ 8 seconds)
+    max_new_tokens = int(256 * (duration / 8))
+    max_new_tokens = min(max_new_tokens, 2048)  # Safety cap
+    # Generate audio
     with torch.no_grad():
         audio = model.generate(**inputs, max_new_tokens=max_new_tokens)
     sr = model.config.audio_encoder.sampling_rate
     audio_arr = audio[0, 0].cpu().numpy()
+    # Save temp file
     tmp = tempfile.NamedTemporaryFile(suffix=".wav", delete=False)
     wavfile.write(tmp.name, rate=sr, data=audio_arr)
+    return tmp.name, f"✅ Generated {duration}s of audio!"
 with gr.Blocks(title="MusicGen 🎶") as demo:
+    gr.Markdown("# 🎵 MusicGen — Text-to-Music Generator (Extended 60 s Version)")
     with gr.Row():
+        prompt = gr.Textbox(label="🎼 Describe your music", placeholder="e.g. dreamy lo-fi with soft piano")
+        duration = gr.Slider(4, 60, value=15, step=1, label="Duration (seconds)")
     btn = gr.Button("Generate 🎧")
+    audio_out = gr.Audio(label="🎶 Output", type="filepath")
     msg = gr.Textbox(label="Status", interactive=False)
     btn.click(generate_music, inputs=[prompt, duration], outputs=[audio_out, msg])
+demo.launch(share=True)