Spaces:

gmustafa413
/

AudioToSummaryGenerator

Build error

App Files Files Community

gmustafa413 commited on Feb 26, 2025

Commit

9c9499a

verified ·

1 Parent(s): fc9f129

Update app.py

Browse files

Files changed (1) hide show

app.py +47 -19

app.py CHANGED Viewed

@@ -2,9 +2,11 @@ import streamlit as st
 from transformers import Wav2Vec2ForCTC, Wav2Vec2Processor, pipeline
 import torch
 import librosa
 # Load models
-@st.cache_resource  # Cache the models for faster reloads
 def load_models():
     processor = Wav2Vec2Processor.from_pretrained("facebook/wav2vec2-base-960h")
     model = Wav2Vec2ForCTC.from_pretrained("facebook/wav2vec2-base-960h")
@@ -14,27 +16,51 @@ def load_models():
 processor, model, summarizer = load_models()
 # Function to convert audio to text
-def audio_to_text(audio_path):
-    speech, _ = librosa.load(audio_path, sr=16000)
-    input_values = processor(speech, return_tensors="pt", sampling_rate=16000).input_values
-    with torch.no_grad():
-        logits = model(input_values).logits
-    predicted_ids = torch.argmax(logits, dim=-1)
-    transcription = processor.decode(predicted_ids[0])
-    return transcription
 # Function to summarize text
 def summarize_text(text):
-    summary = summarizer(text, max_length=130, min_length=30, do_sample=False)
-    return summary[0]['summary_text']
 # Streamlit app
 def main():
     st.title("Audio Summarization App")
-    st.write("Upload an audio file to get a summary of its content.")
     # File uploader
-    audio_file = st.file_uploader("Upload Audio File", type=["wav", "mp3", "ogg"])
     if audio_file is not None:
         st.audio(audio_file, format="audio/wav")
@@ -44,13 +70,15 @@ def main():
             with st.spinner("Processing audio..."):
                 # Convert audio to text
                 text = audio_to_text(audio_file)
-                st.subheader("Transcribed Text:")
-                st.write(text)
-                # Summarize the text
-                summary = summarize_text(text)
-                st.subheader("Summary:")
-                st.write(summary)
 if __name__ == "__main__":
     main()

 from transformers import Wav2Vec2ForCTC, Wav2Vec2Processor, pipeline
 import torch
 import librosa
+import soundfile as sf
+import io
 # Load models
+@st.cache_resource
 def load_models():
     processor = Wav2Vec2Processor.from_pretrained("facebook/wav2vec2-base-960h")
     model = Wav2Vec2ForCTC.from_pretrained("facebook/wav2vec2-base-960h")
 processor, model, summarizer = load_models()
 # Function to convert audio to text
+def audio_to_text(audio_file):
+    try:
+        # Read the audio file from BytesIO
+        audio_bytes = audio_file.read()
+        audio_file.seek(0)  # Reset the file pointer
+        # Use soundfile to read the audio data
+        with io.BytesIO(audio_bytes) as f:
+            data, samplerate = sf.read(f)
+        # Resample to 16kHz if necessary
+        if samplerate != 16000:
+            data = librosa.resample(data, orig_sr=samplerate, target_sr=16000)
+        # Convert to input values for the model
+        input_values = processor(data, return_tensors="pt", sampling_rate=16000).input_values
+        # Perform inference
+        with torch.no_grad():
+            logits = model(input_values).logits
+        # Decode the output
+        predicted_ids = torch.argmax(logits, dim=-1)
+        transcription = processor.decode(predicted_ids[0])
+        return transcription
+    except Exception as e:
+        st.error(f"Error processing audio: {e}")
+        return None
 # Function to summarize text
 def summarize_text(text):
+    try:
+        summary = summarizer(text, max_length=130, min_length=30, do_sample=False)
+        return summary[0]['summary_text']
+    except Exception as e:
+        st.error(f"Error summarizing text: {e}")
+        return None
 # Streamlit app
 def main():
     st.title("Audio Summarization App")
+    st.write("Upload an audio file (WAV or MP3) to get a summary of its content.")
     # File uploader
+    audio_file = st.file_uploader("Upload Audio File", type=["wav", "mp3"])
     if audio_file is not None:
         st.audio(audio_file, format="audio/wav")
             with st.spinner("Processing audio..."):
                 # Convert audio to text
                 text = audio_to_text(audio_file)
+                if text:
+                    st.subheader("Transcribed Text:")
+                    st.write(text)
+                    # Summarize the text
+                    summary = summarize_text(text)
+                    if summary:
+                        st.subheader("Summary:")
+                        st.write(summary)
 if __name__ == "__main__":
     main()