Spaces:

lucksadasd
/

homework

Build error

App Files Files Community

lucksadasd commited on Apr 22, 2025

Commit

f5e616f

verified ·

1 Parent(s): fb083bd

Update app.py

Browse files

Files changed (1) hide show

app.py +23 -11

app.py CHANGED Viewed

@@ -1,5 +1,6 @@
 import os
-import torch\ import gradio as gr
 from transformers import pipeline
 from diffusers import StableDiffusionPipeline
@@ -41,16 +42,20 @@ def transcribe(audio_path):
 def generate(description, model_choice, guidance_scale, negative_prompt, style):
     # 构造给 LLM 的指令
-    instruction = f"请将以下简短描述扩展为 Stable Diffusion 友好的提示词，包含细节和风格：\n" \
-                  f"描述: '{description}'\n" \
-                  f"风格: '{style}'"
     result = llm(instruction, max_length=128)[0]["generated_text"].strip()
     prompt = result
     # 根据模型选择生成图像
-    if model_choice == "SDXL":
-        image = sd_xl(prompt, guidance_scale=guidance_scale, negative_prompt=negative_prompt).images[0]
-    else:
-        image = sd_v15(prompt, guidance_scale=guidance_scale, negative_prompt=negative_prompt).images[0]
     return prompt, image
 # Step 3: 构建 Gradio 界面
@@ -83,8 +88,15 @@ with gr.Blocks(title="Prompt-to-Image Generator") as demo:
             prompt_output = gr.Textbox(label="生成的提示词")
             image_output = gr.Image(label="生成的图像")
-    # 绑定语音转文字
-    audio_input.change(fn=transcribe, inputs=audio_input, outputs=desc_input, visible=False)
     # 点击按钮生成提示词并绘图
     generate_btn.click(
         fn=generate,
@@ -94,4 +106,4 @@ with gr.Blocks(title="Prompt-to-Image Generator") as demo:
 # Step 4: 启动应用
 if __name__ == "__main__":
-    demo.launch(server_name="0.0.0.0", server_port=7860)

 import os
+import torch
+import gradio as gr
 from transformers import pipeline
 from diffusers import StableDiffusionPipeline
 def generate(description, model_choice, guidance_scale, negative_prompt, style):
     # 构造给 LLM 的指令
+    instruction = (
+        f"请将以下简短描述扩展为 Stable Diffusion 友好的提示词，包含细节和风格：\n"
+        f"描述: '{description}'\n"
+        f"风格: '{style}'"
+    )
     result = llm(instruction, max_length=128)[0]["generated_text"].strip()
     prompt = result
     # 根据模型选择生成图像
+    pipeline = sd_xl if model_choice == "SDXL" else sd_v15
+    image = pipeline(
+        prompt,
+        guidance_scale=guidance_scale,
+        negative_prompt=negative_prompt
+    ).images[0]
     return prompt, image
 # Step 3: 构建 Gradio 界面
             prompt_output = gr.Textbox(label="生成的提示词")
             image_output = gr.Image(label="生成的图像")
+    # 绑定语音转文字（仅当启用时）
+    def conditional_transcribe(audio_path, use_voice_flag):
+        return transcribe(audio_path) if use_voice_flag else None
+    audio_input.change(
+        fn=conditional_transcribe,
+        inputs=[audio_input, use_voice],
+        outputs=desc_input
+    )
     # 点击按钮生成提示词并绘图
     generate_btn.click(
         fn=generate,
 # Step 4: 启动应用
 if __name__ == "__main__":
+    demo.launch(server_name="0.0.0.0", server_port=7860)