Spaces:

JunyiAcademy
/

vaitor2

Sleeping

youngtsai commited on Feb 5, 2024

Commit

d363c44

1 Parent(s): c7454f7

from youtube_transcript_api._errors import NoTranscriptFound

Files changed (1) hide show

app.py CHANGED Viewed

@@ -6,7 +6,10 @@ from docx import Document
 import os
 from openai import OpenAI
 import json
 from youtube_transcript_api import YouTubeTranscriptApi
 from moviepy.editor import VideoFileClip
 from pytube import YouTube
@@ -218,6 +221,16 @@ def extract_youtube_id(url):
     else:
         return None
 def process_transcript_and_screenshots(video_id):
     print("====process_transcript_and_screenshots====")
     service = init_drive_service()
@@ -229,7 +242,11 @@ def process_transcript_and_screenshots(video_id):
     exists, file_id = check_file_exists(service, folder_id, file_name)
     if not exists:
         # 从YouTube获取逐字稿并上传
-        transcript = YouTubeTranscriptApi.get_transcript(video_id, languages=['zh-TW'])
         transcript_text = json.dumps(transcript, ensure_ascii=False, indent=2)
         file_id = upload_content_directly(service, file_name, folder_id, transcript_text)
         print("逐字稿已上传到Google Drive")

 import os
 from openai import OpenAI
 import json
 from youtube_transcript_api import YouTubeTranscriptApi
+from youtube_transcript_api._errors import NoTranscriptFound
 from moviepy.editor import VideoFileClip
 from pytube import YouTube
     else:
         return None
+def get_transcript(video_id):
+    languages = ['zh-TW', 'zh-Hant', 'en']  # 優先順序列表
+    for language in languages:
+        try:
+            transcript = YouTubeTranscriptApi.get_transcript(video_id, languages=[language])
+            return transcript  # 成功獲取字幕，直接返回結果
+        except NoTranscriptFound:
+            continue  # 當前語言的字幕沒有找到，繼續嘗試下一個語言
+    return None  # 所有嘗試都失敗，返回None
 def process_transcript_and_screenshots(video_id):
     print("====process_transcript_and_screenshots====")
     service = init_drive_service()
     exists, file_id = check_file_exists(service, folder_id, file_name)
     if not exists:
         # 从YouTube获取逐字稿并上传
+        transcript = get_transcript(video_id)
+        if transcript:
+            print("成功獲取字幕")
+        else:
+            print("沒有找到字幕")
         transcript_text = json.dumps(transcript, ensure_ascii=False, indent=2)
         file_id = upload_content_directly(service, file_name, folder_id, transcript_text)
         print("逐字稿已上传到Google Drive")