Spaces:

fizzarif7
/

voice2comic

Sleeping

App Files Files Community

fizzarif7 commited on Jul 9, 2025

Commit

ef570d2

verified ·

1 Parent(s): 1991603

Update app.py

Browse files

Files changed (1) hide show

app.py +27 -16

app.py CHANGED Viewed

@@ -11,15 +11,15 @@ from reportlab.lib.pagesizes import letter
 from reportlab.lib.styles import getSampleStyleSheet
 import google.generativeai as genai
-from huggingface_hub import InferenceClient
 # Load API keys
 load_dotenv()
 api_key = os.getenv("GOOGLE_API_KEY")
-hf_token = os.getenv("HF_token")
 if not api_key or not hf_token:
-    raise EnvironmentError("Missing API keys. Check GOOGLE_API_KEY and HF_token in .env.")
 # Configure models
 genai.configure(api_key=api_key)
@@ -54,15 +54,7 @@ def explain_scene(image):
         response = text_model.generate_content([image, "Explain this image scene in detail."])
         return response.text.strip()
     except:
-        try:
-            buffered = BytesIO()
-            image.save(buffered, format="PNG")
-            buffered.seek(0)
-            result = hf_client.image_to_text("Salesforce/blip-image-captioning-base", image=buffered)
-            return result.strip()
-        except:
-            traceback.print_exc()
-            return "Explanation unavailable."
 def text_to_speech(text):
     try:
@@ -339,7 +331,7 @@ with gr.Blocks(
         generate_btn = gr.Button("➕ Generate This Scene", elem_id="generate-btn")
         ai_coauthor_btn = gr.Button("🤖 Let AI Write This One", elem_id="ai-write-btn")
         recreate_btn = gr.Button("🔄 Recreate This Scene", elem_id="recreate-btn")
-        next_btn = gr.Button("⏭️ Next Scene", elem_id="next-btn")
     status = gr.Markdown()
     image_output = gr.Image(label="🖼️ Scene Image", type="pil")
@@ -350,7 +342,7 @@ with gr.Blocks(
         tts_btn = gr.Button("🔊 Read Aloud", elem_id="tts-btn")
         tts_audio = gr.Audio(label="Audio", autoplay=False)
-    done_btn = gr.Button("✅ Finalize Story & Export", visible=False, elem_id="done-btn")
     txt_file = gr.File(label="📄 Explanations (.txt)")
     pdf_file = gr.File(label="📘 Scene PDF")
@@ -387,7 +379,7 @@ with gr.Blocks(
         ]
     )
-    next_btn.click(
         fn=generate_scene,
         inputs=[
             scene_total, theme, char_count, character_names, dialogue,
@@ -397,9 +389,28 @@ with gr.Blocks(
         outputs=[
             image_output, summary_output, explanation_output,
             scene_images, scene_summaries, scene_explanations,
-            status, done_btn
         ]
     )
     ai_coauthor_btn.click(
         fn=ai_write_scene,

 from reportlab.lib.styles import getSampleStyleSheet
 import google.generativeai as genai
 # Load API keys
 load_dotenv()
 api_key = os.getenv("GOOGLE_API_KEY")
 if not api_key or not hf_token:
+    raise EnvironmentError("Missing API keys. Check GOOGLE_API_KEY in .env.")
 # Configure models
 genai.configure(api_key=api_key)
         response = text_model.generate_content([image, "Explain this image scene in detail."])
         return response.text.strip()
     except:
+        return "Explanation unavailable."
 def text_to_speech(text):
     try:
         generate_btn = gr.Button("➕ Generate This Scene", elem_id="generate-btn")
         ai_coauthor_btn = gr.Button("🤖 Let AI Write This One", elem_id="ai-write-btn")
         recreate_btn = gr.Button("🔄 Recreate This Scene", elem_id="recreate-btn")
+        next_btn = gr.Button("⏭️ Reset", elem_id="reset-btn")
     status = gr.Markdown()
     image_output = gr.Image(label="🖼️ Scene Image", type="pil")
         tts_btn = gr.Button("🔊 Read Aloud", elem_id="tts-btn")
         tts_audio = gr.Audio(label="Audio", autoplay=False)
+    done_btn = gr.Button("✅ Done", visible=False, elem_id="done-btn")
     txt_file = gr.File(label="📄 Explanations (.txt)")
     pdf_file = gr.File(label="📘 Scene PDF")
         ]
     )
+    reset_btn.click(
         fn=generate_scene,
         inputs=[
             scene_total, theme, char_count, character_names, dialogue,
         outputs=[
             image_output, summary_output, explanation_output,
             scene_images, scene_summaries, scene_explanations,
+            status, done_btn,
+            character_names, dialogue, dialogue_speaker,
+            char_styles, char_moods, bg_style
+        ],
+        _js=None
+    ).then(
+        fn=lambda: [
+            gr.update(value=""),  # character_names
+            gr.update(value=""),  # dialogue
+            gr.update(value=""),  # dialogue_speaker
+            gr.update(value=""),  # char_styles
+            gr.update(value=""),  # char_moods
+            gr.update(value="Fantasy")  # bg_style default value
+        ],
+        inputs=[],
+        outputs=[
+            character_names, dialogue, dialogue_speaker,
+            char_styles, char_moods, bg_style
         ]
     )
     ai_coauthor_btn.click(
         fn=ai_write_scene,