Spaces:

Marek4321
/

QualiLab

Sleeping

App Files Files Community

Marek4321 commited on Jul 9, 2025

Commit

d406562

verified ·

1 Parent(s): a451ea6

Update transcription.py

Browse files

Files changed (1) hide show

transcription.py +7 -39

transcription.py CHANGED Viewed

@@ -1,9 +1,9 @@
-# transcription.py - Poprawiony moduł transkrypcji
 import os
 import time
 import streamlit as st
-from typing import List, Dict, Optional, Union
 from pathlib import Path
 try:
@@ -142,8 +142,7 @@ class AudioTranscriber:
                 params = {
                     'model': MODEL_SETTINGS['whisper']['model'],
                     'file': audio_file,
-                    'temperature': MODEL_SETTINGS['whisper']['temperature'],
-                    'response_format': 'text'  # Zwróć tylko tekst
                 }
                 # Dodaj język tylko jeśli nie jest auto
@@ -154,7 +153,7 @@ class AudioTranscriber:
                 transcript = self.client.audio.transcriptions.create(**params)
             # Sprawdź czy otrzymaliśmy wynik
-            if not transcript or len(transcript.strip()) == 0:
                 raise Exception("Pusty wynik transkrypcji")
             # Estymacja kosztu (Whisper API: $0.006 per minute)
@@ -163,10 +162,10 @@ class AudioTranscriber:
             self.transcription_stats['total_duration'] += estimated_duration
             self.transcription_stats['total_cost_estimate'] += estimated_cost
-            st.success(f"✅ Transkrypcja otrzymana ({len(transcript.split())} słów)")
             # Oczyść i zwróć transkrypcję
-            return self.clean_transcription(transcript)
         except Exception as e:
             st.error(f"❌ Błąd Whisper API: {str(e)}")
@@ -353,35 +352,4 @@ def get_file_duration_estimate(file_path: str) -> float:
 # Test modułu
 if __name__ == "__main__":
     print("🧪 Test AudioTranscriber")
-    # Test bez prawdziwego API key
-    try:
-        transcriber = AudioTranscriber("test-key")
-        print("✅ AudioTranscriber zainicjalizowany")
-        # Test rozpoznania typu wywiadu
-        test_fgi = """
-        Moderator: Dzień dobry wszystkim. Co wszyscy myślicie o tym produkcie?
-        Uczestnik 1: Ja uważam, że...
-        Uczestnik 2: Ale czy zgadzacie się, że...
-        Moderator: A co sądzicie o tym?
-        """
-        test_idi = """
-        Interviewer: Opowiedz mi o swoich doświadczeniach z tym produktem.
-        Respondent: Moje doświadczenia są bardzo pozytywne...
-        Interviewer: A jak się czujesz gdy używasz tego produktu?
-        """
-        print(f"Test FGI: {transcriber.detect_interview_type(test_fgi)}")
-        print(f"Test IDI: {transcriber.detect_interview_type(test_idi)}")
-        # Test walidacji pliku
-        test_file = "test.mp3"
-        result, message = validate_audio_file(test_file)
-        print(f"Test walidacji: {result} - {message}")
-    except Exception as e:
-        print(f"❌ Błąd testu: {e}")
-    print("✅ Test zakończony")

+# transcription.py - Szybka poprawka importów
 import os
 import time
 import streamlit as st
+from typing import List, Dict, Optional, Union, Tuple  # Dodano Tuple
 from pathlib import Path
 try:
                 params = {
                     'model': MODEL_SETTINGS['whisper']['model'],
                     'file': audio_file,
+                    'temperature': MODEL_SETTINGS['whisper']['temperature']
                 }
                 # Dodaj język tylko jeśli nie jest auto
                 transcript = self.client.audio.transcriptions.create(**params)
             # Sprawdź czy otrzymaliśmy wynik
+            if not transcript or not hasattr(transcript, 'text') or len(transcript.text.strip()) == 0:
                 raise Exception("Pusty wynik transkrypcji")
             # Estymacja kosztu (Whisper API: $0.006 per minute)
             self.transcription_stats['total_duration'] += estimated_duration
             self.transcription_stats['total_cost_estimate'] += estimated_cost
+            st.success(f"✅ Transkrypcja otrzymana ({len(transcript.text.split())} słów)")
             # Oczyść i zwróć transkrypcję
+            return self.clean_transcription(transcript.text)
         except Exception as e:
             st.error(f"❌ Błąd Whisper API: {str(e)}")
 # Test modułu
 if __name__ == "__main__":
     print("🧪 Test AudioTranscriber")
+    print("✅ Import OK - wszystkie typy dostępne")