Spaces:

Veronyka
/

IA-youtube-transcript

Sleeping

travahacker commited on Feb 5

Commit

46b613a

1 Parent(s): 872c0c4

feat: timestamps [MM:SS] na transcrição para localizar no vídeo

Files changed (1) hide show

app.py CHANGED Viewed

@@ -19,6 +19,16 @@ except ImportError:
     spaces = _Spaces()
 @spaces.GPU(duration=180)
 def transcrever(audio, modelo: str, idioma: str) -> str:
     """Transcreve áudio enviado com Whisper."""
@@ -57,7 +67,7 @@ def transcrever(audio, modelo: str, idioma: str) -> str:
                 "text": seg.text.strip(),
             })
-        # Parágrafos: quebra de linha dupla quando pausa > 1.5s entre segmentos
         PAUSA_PARAGRAFO = 1.5
         linhas = []
         prev_end = 0
@@ -66,7 +76,8 @@ def transcrever(audio, modelo: str, idioma: str) -> str:
                 continue
             if prev_end > 0 and (s["start"] - prev_end) > PAUSA_PARAGRAFO:
                 linhas.append("")  # linha em branco = novo parágrafo
-            linhas.append(s["text"])
             prev_end = s["end"]
         texto = "\n".join(linhas)
         if not texto:

     spaces = _Spaces()
+def _fmt_tempo(segundos: float) -> str:
+    """Formata segundos como MM:SS ou HH:MM:SS."""
+    h = int(segundos // 3600)
+    m = int((segundos % 3600) // 60)
+    s = int(segundos % 60)
+    if h > 0:
+        return f"{h:01d}:{m:02d}:{s:02d}"
+    return f"{m:01d}:{s:02d}"
 @spaces.GPU(duration=180)
 def transcrever(audio, modelo: str, idioma: str) -> str:
     """Transcreve áudio enviado com Whisper."""
                 "text": seg.text.strip(),
             })
+        # Timestamp + parágrafos: [MM:SS] texto, linha em branco quando pausa > 1.5s
         PAUSA_PARAGRAFO = 1.5
         linhas = []
         prev_end = 0
                 continue
             if prev_end > 0 and (s["start"] - prev_end) > PAUSA_PARAGRAFO:
                 linhas.append("")  # linha em branco = novo parágrafo
+            ts = _fmt_tempo(s["start"])
+            linhas.append(f"[{ts}] {s['text']}")
             prev_end = s["end"]
         texto = "\n".join(linhas)
         if not texto: