Spaces:

shingguy1
/

Assignment1

Sleeping

App Files Files Community

shingguy1 commited on Apr 24, 2025

Commit

226a292

verified ·

1 Parent(s): 73ca6b2

Update app.py

Browse files

Files changed (1) hide show

app.py +25 -7

app.py CHANGED Viewed

@@ -1,4 +1,3 @@
 import streamlit as st
 from PIL import Image
 from transformers import BlipProcessor, BlipForConditionalGeneration, pipeline
@@ -6,6 +5,7 @@ from gtts import gTTS
 import os
 import tempfile
 @st.cache_resource
 def load_models():
     processor = BlipProcessor.from_pretrained("Salesforce/blip-image-captioning-base")
@@ -15,6 +15,7 @@ def load_models():
 processor, blip_model, gpt2 = load_models()
 st.title("🖼️📖 Storyteller for Kids")
 st.write("Upload an image and let the app create and read a magical story just for kids!")
@@ -32,14 +33,31 @@ if uploaded_file:
         st.write(f"**Caption:** {caption}")
     with st.spinner("Writing a children's story..."):
-        prompt = f"Write a story for children aged 3-10 about this: {caption}"
-        story_output = gpt2(prompt, max_length=120, do_sample=True)[0]["generated_text"]
         story = story_output.strip().replace('\n', ' ')
         st.success("Story created!")
         st.write(f"**Story:**\n\n{story}")
     with st.spinner("Converting story to audio..."):
-        tts = gTTS(text=story, lang='en')
-        with tempfile.NamedTemporaryFile(delete=False, suffix=".mp3") as fp:
-            tts.save(fp.name)
-            st.audio(fp.name, format="audio/mp3")

 import streamlit as st
 from PIL import Image
 from transformers import BlipProcessor, BlipForConditionalGeneration, pipeline
 import os
 import tempfile
+# Load models
 @st.cache_resource
 def load_models():
     processor = BlipProcessor.from_pretrained("Salesforce/blip-image-captioning-base")
 processor, blip_model, gpt2 = load_models()
+# UI
 st.title("🖼️📖 Storyteller for Kids")
 st.write("Upload an image and let the app create and read a magical story just for kids!")
         st.write(f"**Caption:** {caption}")
     with st.spinner("Writing a children's story..."):
+        prompt = f"Write a short, imaginative story for children aged 3-10 about this: {caption}"
+        story_output = gpt2(
+            prompt,
+            max_length=100,
+            num_return_sequences=1,
+            do_sample=True,
+            temperature=0.9,
+            top_p=0.95,
+            top_k=50,
+            repetition_penalty=1.2,
+            pad_token_id=50256,
+            eos_token_id=50256,
+        )[0]["generated_text"]
         story = story_output.strip().replace('\n', ' ')
+        # Truncate to ~100 words for safety
+        story = " ".join(story.split()[:100])
         st.success("Story created!")
         st.write(f"**Story:**\n\n{story}")
     with st.spinner("Converting story to audio..."):
+        try:
+            tts = gTTS(text=story, lang='en')
+            with tempfile.NamedTemporaryFile(delete=False, suffix=".mp3") as fp:
+                tts.save(fp.name)
+                st.audio(fp.name, format="audio/mp3")
+                st.success("Audio playback ready!")
+        except Exception as e:
+            st.error(f"Text-to-speech failed: {e}")