Spaces:

Nepjune
/

Project_image_captioning_blip

Runtime error

App Files Files Community

Nepjune commited on Feb 29, 2024

Commit

a761387

verified ·

1 Parent(s): e5af486

Update app.py

Browse files

Files changed (1) hide show

app.py +5 -32

app.py CHANGED Viewed

@@ -1,9 +1,12 @@
 from transformers import pipeline, BlipForConditionalGeneration, BlipProcessor
 import torchaudio
 from torchaudio.transforms import Resample
 import torch
 import gradio as gr
-from flask import Flask, jsonify, render_template_string
 # Initialize TTS model from Hugging Face
 tts_model_name = "Kamonwan/blip-image-captioning-new"
@@ -14,8 +17,6 @@ model_id = "Kamonwan/blip-image-captioning-new"
 blip_model = BlipForConditionalGeneration.from_pretrained(model_id)
 blip_processor = BlipProcessor.from_pretrained(model_id)
-app = Flask(__name__)
 def generate_caption(image):
     # Generate caption from image using Blip model
     inputs = blip_processor(images=image, return_tensors="pt")
@@ -38,35 +39,7 @@ def generate_caption_api():
 @app.route('/')
 def index():
-    return render_template_string("""
-    <!DOCTYPE html>
-    <html lang="en">
-    <head>
-        <meta charset="UTF-8">
-        <meta name="viewport" content="width=device-width, initial-scale=1.0">
-        <title>Gradio Interface</title>
-    </head>
-    <body>
-        <h1>Gradio Interface</h1>
-        {{ gr_interface|safe }}
-    </body>
-    </html>
-    """, gr_interface=demo.get_interface())
 if __name__ == '__main__':
-    demo = gr.Interface(
-        fn=generate_caption,
-        inputs=gr.Image(),
-        outputs=[
-            gr.Textbox(label="Generated caption"),
-            gr.Button("Convert to Audio"),
-            gr.Audio(type="filepath", label="Generated Audio")
-        ],
-        live=True
-    )
-    # Start Gradio interface
-    demo.launch(share=True)
-    # Start Flask app
     app.run(host='0.0.0.0', port=5000)

+# app.py
+from flask import Flask, render_template, request, jsonify
 from transformers import pipeline, BlipForConditionalGeneration, BlipProcessor
 import torchaudio
 from torchaudio.transforms import Resample
 import torch
 import gradio as gr
+app = Flask(__name__)
 # Initialize TTS model from Hugging Face
 tts_model_name = "Kamonwan/blip-image-captioning-new"
 blip_model = BlipForConditionalGeneration.from_pretrained(model_id)
 blip_processor = BlipProcessor.from_pretrained(model_id)
 def generate_caption(image):
     # Generate caption from image using Blip model
     inputs = blip_processor(images=image, return_tensors="pt")
 @app.route('/')
 def index():
+    return render_template("index.html")
 if __name__ == '__main__':
     app.run(host='0.0.0.0', port=5000)