Spaces:

MicroHealth
/

AV-to-transcripts

Paused

App Files Files Community

bluenevus commited on Apr 23, 2025

Commit

53bdf99

verified ·

1 Parent(s): 8369f51

Update app.py

Browse files

Files changed (1) hide show

app.py +59 -17

app.py CHANGED Viewed

@@ -4,7 +4,7 @@ import torch
 from transformers import WhisperProcessor, WhisperForConditionalGeneration
 import requests
 from bs4 import BeautifulSoup
-import tempfile
 import os
 import soundfile as sf
 from spellchecker import SpellChecker
@@ -12,9 +12,12 @@ from pydub import AudioSegment
 import librosa
 import numpy as np
 from pyannote.audio import Pipeline
-from pywebio import start_server, config
-from pywebio.input import input
-from pywebio.output import put_text, put_markdown, put_file
 # Initialize the speaker diarization pipeline
 try:
@@ -171,18 +174,57 @@ def transcribe_video(url):
         print(error_message)
         return error_message
-def video_transcription():
-    put_markdown("# Video Transcription")
-    video_url = input(label="Video URL")
-    if video_url:
-        put_text("Transcribing video...")
-        transcript = transcribe_video(video_url)
-        if transcript:
-            put_text(transcript)
-            put_file('transcript.txt', content=transcript.encode('utf-8'), label="Download Transcript")
-        else:
-            put_text("Failed to transcribe video.")
 if __name__ == '__main__':
-    config(title="Video Transcription", description="Transcribe audio from a video URL using Whisper and PyAnnote")
-    start_server(video_transcription, port=7860, debug=True)

 from transformers import WhisperProcessor, WhisperForConditionalGeneration
 import requests
 from bs4 import BeautifulSoup
+import tempfile
 import os
 import soundfile as sf
 from spellchecker import SpellChecker
 import librosa
 import numpy as np
 from pyannote.audio import Pipeline
+import dash
+from dash import dcc, html, Input, Output, State
+import dash_bootstrap_components as dbc
+from dash.exceptions import PreventUpdate
+import base64
+import threading
 # Initialize the speaker diarization pipeline
 try:
         print(error_message)
         return error_message
+app = dash.Dash(__name__, external_stylesheets=[dbc.themes.BOOTSTRAP])
+app.layout = dbc.Container([
+    dbc.Row([
+        dbc.Col([
+            html.H1("Video Transcription", className="text-center mb-4"),
+            dbc.Card([
+                dbc.CardBody([
+                    dbc.Input(id="video-url", type="text", placeholder="Enter video URL"),
+                    dbc.Button("Transcribe", id="transcribe-button", color="primary", className="mt-3"),
+                    dbc.Spinner(html.Div(id="transcription-output", className="mt-3")),
+                    dcc.Download(id="download-transcript")
+                ])
+            ])
+        ], width=12)
+    ])
+], fluid=True)
+@app.callback(
+    Output("transcription-output", "children"),
+    Output("download-transcript", "data"),
+    Input("transcribe-button", "n_clicks"),
+    State("video-url", "value"),
+    prevent_initial_call=True
+)
+def update_transcription(n_clicks, url):
+    if not url:
+        raise PreventUpdate
+    def transcribe():
+        transcript = transcribe_video(url)
+        return transcript
+    # Run transcription in a separate thread
+    thread = threading.Thread(target=transcribe)
+    thread.start()
+    thread.join()
+    transcript = transcribe()
+    if transcript:
+        download_data = dict(content=transcript, filename="transcript.txt")
+        return dbc.Card([
+            dbc.CardBody([
+                html.H5("Transcription Result"),
+                html.Pre(transcript),
+                dbc.Button("Download Transcript", id="btn-download", color="secondary", className="mt-3")
+            ])
+        ]), download_data
+    else:
+        return "Failed to transcribe video.", None
 if __name__ == '__main__':
+    app.run(debug=True, host='0.0.0.0', port=7860)