STBack23
/

OmniSub

STBack23 commited on 5 days ago

Commit

8564246

verified ·

1 Parent(s): 3700132

Fix pyannote 4.x DiarizeOutput API (no itertracks)

Files changed (1) hide show

src/omnisub/diarize.py CHANGED Viewed

@@ -27,6 +27,22 @@ class SpeakerTurn:
         return max(0.0, self.end - self.start)
 def diarize_audio(
     audio_path: str | Path,
     *,
@@ -58,11 +74,11 @@ def diarize_audio(
     diarization = pipeline(str(audio_path), **params)
     turns: List[SpeakerTurn] = []
-    for segment, _, speaker in diarization.itertracks(yield_label=True):
-        if max_time is not None and segment.start > max_time:
             continue
         turns.append(
-            SpeakerTurn(speaker=str(speaker), start=float(segment.start), end=float(segment.end))
         )
     turns.sort(key=lambda t: t.start)
     return turns

         return max(0.0, self.end - self.start)
+def _iter_diarization_turns(diarization) -> List[tuple]:
+    """Duyệt lượt nói — hỗ trợ pyannote 4.x (DiarizeOutput) và 3.x (Annotation)."""
+    # pyannote 4.x community-1: exclusive mode gọn hơn khi gán speaker cho subtitle
+    for attr in ("exclusive_speaker_diarization", "speaker_diarization"):
+        tracks = getattr(diarization, attr, None)
+        if tracks is not None:
+            return [(turn, speaker) for turn, speaker in tracks]
+    # pyannote 3.x legacy
+    if hasattr(diarization, "itertracks"):
+        return [
+            (segment, speaker)
+            for segment, _, speaker in diarization.itertracks(yield_label=True)
+        ]
+    raise TypeError(f"Không hiểu output diarization: {type(diarization)!r}")
 def diarize_audio(
     audio_path: str | Path,
     *,
     diarization = pipeline(str(audio_path), **params)
     turns: List[SpeakerTurn] = []
+    for turn, speaker in _iter_diarization_turns(diarization):
+        if max_time is not None and turn.start > max_time:
             continue
         turns.append(
+            SpeakerTurn(speaker=str(speaker), start=float(turn.start), end=float(turn.end))
         )
     turns.sort(key=lambda t: t.start)
     return turns