Spaces:

Subbu1304
/

voice_project

Runtime error

Subbu1304 commited on Feb 1, 2025

Commit

e3e59a6

verified ·

1 Parent(s): 3800959

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -3,7 +3,7 @@ from transformers import Wav2Vec2ForCTC, Wav2Vec2Processor
 import torch
 import soundfile as sf
-# Load the Wav2Vec2Processor and model correctly
 processor = Wav2Vec2Processor.from_pretrained("facebook/wav2vec2-large-xlsr-53")
 model = Wav2Vec2ForCTC.from_pretrained("facebook/wav2vec2-large-xlsr-53")
@@ -15,7 +15,7 @@ def transcribe_audio(audio):
     # Read the audio file
     audio_input, _ = sf.read(audio.name)
-    # Process audio input
     input_values = processor(audio_input, return_tensors="pt").input_values
     # Get model logits (raw prediction)
@@ -36,3 +36,4 @@ iface = gr.Interface(fn=transcribe_audio,
 iface.launch()

 import torch
 import soundfile as sf
+# Correctly load the Wav2Vec2Processor and model
 processor = Wav2Vec2Processor.from_pretrained("facebook/wav2vec2-large-xlsr-53")
 model = Wav2Vec2ForCTC.from_pretrained("facebook/wav2vec2-large-xlsr-53")
     # Read the audio file
     audio_input, _ = sf.read(audio.name)
+    # Process audio input using the processor
     input_values = processor(audio_input, return_tensors="pt").input_values
     # Get model logits (raw prediction)
 iface.launch()