Spaces:

emmajeed
/

transcriptinator_v2

Build error

App Files Files Community

emmajeed commited on Dec 26, 2025

Commit

5fdd6f4

verified ·

1 Parent(s): be49b91

Update transcribe_core.py

Browse files

Files changed (1) hide show

transcribe_core.py +7 -43

transcribe_core.py CHANGED Viewed

@@ -255,70 +255,44 @@ def create_transcript_markdown(audio_filename: str, transcription: str, summary:
 def process_audio_file(audio_file_path: str, gemini_provider: TranscriptionProvider, openrouter_provider: TranscriptionProvider = None, progress_callback=None) -> Tuple[str, str]:
-    """
-    Process an audio file and return the markdown content or ZIP of multiple files.
-    Args:
-        audio_file_path: Path to audio file
-        gemini_provider: GeminiProvider for transcription
-        openrouter_provider: Optional OpenRouterProvider for summary/ideas (if None, uses gemini_provider)
-        progress_callback: Optional callback function for progress updates
-    Returns:
-        Tuple of (output_file_path, is_zip_boolean_as_string)
-        - If single file: ("path/to/file.md", "False")
-        - If chunked: ("path/to/file.zip", "True")
-    """
     audio_filename = os.path.basename(audio_file_path)
     base_name = os.path.splitext(audio_filename)[0]
-    # Check file size
     file_size_mb = os.path.getsize(audio_file_path) / (1024 * 1024)
-    print(f"\nProcessing: {audio_filename} ({file_size_mb:.2f}MB)")
-    # Determine if chunking is needed
     files_to_transcribe = []
     if file_size_mb > 30:
-        print(f"File is larger than 30MB. Chunking into smaller parts...")
         if progress_callback:
             progress_callback("📦 Chunking large audio file...", 0.1)
         chunked_files = chunk_audio_file(audio_file_path)
         files_to_transcribe.extend(chunked_files)
     else:
-        print("File is small enough to process directly")
         files_to_transcribe.append(audio_file_path)
-    # Process each file (chunk or original)
     markdown_files = []
     total_files = len(files_to_transcribe)
     for idx, file_path in enumerate(files_to_transcribe, 1):
         file_name = os.path.basename(file_path)
-        print(f"\nTranscribing {idx}/{total_files}: {file_name}")
         if progress_callback:
             progress = 0.2 + (0.6 * (idx - 1) / total_files)
             progress_callback(f"🎙️ Transcribing part {idx}/{total_files}...", progress)
-        # Transcribe using Gemini
         transcription = generate_transcription(file_path, gemini_provider)
-        if progress_callback:
-            progress_callback(f"📝 Generating metadata for part {idx}/{total_files}...", progress + 0.1)
-        # Generate metadata using OpenRouter if available, otherwise Gemini
         text_provider = openrouter_provider if openrouter_provider else gemini_provider
         summary = generate_summary(transcription, text_provider)
         key_ideas = generate_key_ideas(transcription, text_provider)
-        # Create markdown
         markdown_content = create_transcript_markdown(file_name, transcription, summary, key_ideas)
-        # Save markdown file to outputs directory
-        output_dir = "outputs"
-        os.makedirs(output_dir, exist_ok=True)
         output_filename = os.path.splitext(file_name)[0] + ".md"
         markdown_path = os.path.join(output_dir, output_filename)
@@ -327,39 +301,29 @@ def process_audio_file(audio_file_path: str, gemini_provider: TranscriptionProvi
         markdown_files.append(markdown_path)
-        # Clean up chunk audio file
         if "_part" in file_name:
             try:
                 os.remove(file_path)
-                print(f"Deleted chunk: {file_name}")
             except Exception as e:
                 print(f"Warning: Could not delete chunk {file_name}: {e}")
-    # Return result
     if len(markdown_files) == 1:
-        # Single file - return as-is
         return markdown_files[0], "False"
     else:
-        # Multiple files - create ZIP
         if progress_callback:
             progress_callback("📦 Creating ZIP file...", 0.9)
-        output_dir = "outputs"
-        os.makedirs(output_dir, exist_ok=True)
         zip_filename = f"{base_name}_transcripts.zip"
         zip_path = os.path.join(output_dir, zip_filename)
         with zipfile.ZipFile(zip_path, 'w', zipfile.ZIP_DEFLATED) as zipf:
             for md_file in markdown_files:
-                # Add with proper filename
                 basename = os.path.basename(md_file)
                 zipf.write(md_file, basename)
-                # Delete individual md files after adding to ZIP
                 try:
                     os.remove(md_file)
                 except Exception as e:
                     print(f"Warning: Could not delete {md_file}: {e}")
-        print(f"\n✅ Created ZIP with {len(markdown_files)} transcripts: {zip_filename}")
-        return zip_path, "True"

 def process_audio_file(audio_file_path: str, gemini_provider: TranscriptionProvider, openrouter_provider: TranscriptionProvider = None, progress_callback=None) -> Tuple[str, str]:
+    # 1. SETUP ABSOLUTE PATH (Keep this)
+    current_dir = os.path.dirname(os.path.abspath(__file__))
+    output_dir = os.path.join(current_dir, "outputs")
+    os.makedirs(output_dir, exist_ok=True)
     audio_filename = os.path.basename(audio_file_path)
     base_name = os.path.splitext(audio_filename)[0]
     file_size_mb = os.path.getsize(audio_file_path) / (1024 * 1024)
     files_to_transcribe = []
     if file_size_mb > 30:
         if progress_callback:
             progress_callback("📦 Chunking large audio file...", 0.1)
         chunked_files = chunk_audio_file(audio_file_path)
         files_to_transcribe.extend(chunked_files)
     else:
         files_to_transcribe.append(audio_file_path)
     markdown_files = []
     total_files = len(files_to_transcribe)
     for idx, file_path in enumerate(files_to_transcribe, 1):
         file_name = os.path.basename(file_path)
         if progress_callback:
             progress = 0.2 + (0.6 * (idx - 1) / total_files)
             progress_callback(f"🎙️ Transcribing part {idx}/{total_files}...", progress)
         transcription = generate_transcription(file_path, gemini_provider)
         text_provider = openrouter_provider if openrouter_provider else gemini_provider
         summary = generate_summary(transcription, text_provider)
         key_ideas = generate_key_ideas(transcription, text_provider)
         markdown_content = create_transcript_markdown(file_name, transcription, summary, key_ideas)
+        # 2. FIX: Use the absolute output_dir established at the top
         output_filename = os.path.splitext(file_name)[0] + ".md"
         markdown_path = os.path.join(output_dir, output_filename)
         markdown_files.append(markdown_path)
         if "_part" in file_name:
             try:
                 os.remove(file_path)
             except Exception as e:
                 print(f"Warning: Could not delete chunk {file_name}: {e}")
     if len(markdown_files) == 1:
         return markdown_files[0], "False"
     else:
         if progress_callback:
             progress_callback("📦 Creating ZIP file...", 0.9)
+        # 3. FIX: Use absolute zip path
         zip_filename = f"{base_name}_transcripts.zip"
         zip_path = os.path.join(output_dir, zip_filename)
         with zipfile.ZipFile(zip_path, 'w', zipfile.ZIP_DEFLATED) as zipf:
             for md_file in markdown_files:
                 basename = os.path.basename(md_file)
                 zipf.write(md_file, basename)
                 try:
                     os.remove(md_file)
                 except Exception as e:
                     print(f"Warning: Could not delete {md_file}: {e}")
+        return zip_path, "True"