Spaces:

vyluong
/

PoC_ASR_v6_dev

Running

vyluong commited on 7 days ago

Commit

f2fe172

verified ·

1 Parent(s): f14c6b9

Update app/services/processor.py

Files changed (1) hide show

app/services/processor.py CHANGED Viewed

@@ -8,7 +8,6 @@ from collections import defaultdict, Counter
 import numpy as np
 import librosa
-import torch
 from app.core.config import get_settings
 from app.services.transcription import TranscriptionService
@@ -173,12 +172,11 @@ def merge_consecutive_segments(
         gap = seg.start - prev.end
-        overlap = prev.end - seg.start
         if (
             seg.speaker == prev.speaker
             and gap <= max_gap
-            and overlap <= max_overlap
         ):
             prev.end = max(
@@ -225,7 +223,6 @@ class Processor:
         # 2: Load audio
         y, sr = librosa.load(wav_path, sr=16000, mono=True)
-        waveform = torch.from_numpy(y).unsqueeze(0)
         if y.size == 0:
             raise ValueError("Empty audio")
         duration = len(y) / sr
@@ -248,8 +245,8 @@ class Processor:
         diarization_segments = [
             SpeakerSegment(
-                start=new_start,
-                end=new_end,
                 speaker=s.speaker,
                 confidence=getattr(s, "confidence", 1.0),
             )

 import numpy as np
 import librosa
 from app.core.config import get_settings
 from app.services.transcription import TranscriptionService
         gap = seg.start - prev.end
         if (
             seg.speaker == prev.speaker
+            and gap >= -max_overlap
             and gap <= max_gap
         ):
             prev.end = max(
         # 2: Load audio
         y, sr = librosa.load(wav_path, sr=16000, mono=True)
         if y.size == 0:
             raise ValueError("Empty audio")
         duration = len(y) / sr
         diarization_segments = [
             SpeakerSegment(
+                start=s.start,
+                end=s.end,
                 speaker=s.speaker,
                 confidence=getattr(s, "confidence", 1.0),
             )