Spaces:

MicroHealth
/

AV-to-transcripts

Paused

bluenevus commited on Apr 22, 2025

Commit

4d8a5fc

verified ·

1 Parent(s): c831597

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -7,12 +7,26 @@ from pydub import AudioSegment
 from pydub.silence import split_on_silence
 import io
 import os
 # Load the transcription model
 transcription_pipeline = pipeline("automatic-speech-recognition", model="facebook/wav2vec2-base-960h")
 def download_audio_from_url(url):
-    response = requests.get(url)
     audio_bytes = response.content
     return audio_bytes

 from pydub.silence import split_on_silence
 import io
 import os
+from bs4 import BeautifulSoup
+import re
 # Load the transcription model
 transcription_pipeline = pipeline("automatic-speech-recognition", model="facebook/wav2vec2-base-960h")
 def download_audio_from_url(url):
+    if "share" in url:
+        # Extract the direct MP4 URL from the shareable link
+        response = requests.get(url)
+        soup = BeautifulSoup(response.content, 'html.parser')
+        video_tag = soup.find('video')
+        if video_tag and 'src' in video_tag.attrs:
+            video_url = video_tag['src']
+        else:
+            raise ValueError("Direct video URL not found in the shareable link.")
+    else:
+        video_url = url
+    response = requests.get(video_url)
     audio_bytes = response.content
     return audio_bytes