Spaces:

JunyiAcademy
/

vaitor2

Sleeping

App Files Files Community

youngtsai commited on Feb 4, 2024

Commit

7ed5900

1 Parent(s): a931b41

folder_id = create_folder_if_not_exists(service, video_id, parent_folder_id)

Browse files

Files changed (1) hide show

app.py +26 -3

app.py CHANGED Viewed

@@ -14,6 +14,8 @@ import os
 from google.oauth2 import service_account
 from googleapiclient.discovery import build
 from urllib.parse import urlparse, parse_qs
@@ -55,6 +57,24 @@ def init_drive_service():
     service = build('drive', 'v3', credentials=credentials)
     return service
 # 检查Google Drive上是否存在文件
 def check_file_exists(service, folder_name, file_name):
     query = f"name = '{file_name}' and '{folder_name}' in parents and trashed = false"
@@ -136,17 +156,20 @@ def process_youtube_link(link):
     # 假设您已经获取了 YouTube 视频的逐字稿并存储在变量 `transcript` 中
     video_id = extract_youtube_id(link)
     service = init_drive_service()
-    folder_name = 'youtube逐字稿圖檔/{video_id}'  # Google Drive上的文件夹ID
     file_name = f"{video_id}_transcript.txt"
     # 检查逐字稿是否存在
-    exists, file_id = check_file_exists(service, folder_name, file_name)
     if not exists:
         # 获取逐字稿
         transcript = YouTubeTranscriptApi.get_transcript(video_id, languages=['en'])
         transcript_text = "\n".join([f"{item['start']}: {item['text']}" for item in transcript])
         # 上传到Google Drive
-        upload_to_drive(service, file_name, folder_name, transcript_text)
         print("逐字稿已上传到Google Drive")
     else:
         print("逐字稿已存在于Google Drive中")

 from google.oauth2 import service_account
 from googleapiclient.discovery import build
+from googleapiclient.http import MediaFileUpload
 from urllib.parse import urlparse, parse_qs
     service = build('drive', 'v3', credentials=credentials)
     return service
+def create_folder_if_not_exists(service, folder_name, parent_id):
+    """检查是否存在特定名称的文件夹，如果不存在则创建"""
+    query = f"mimeType='application/vnd.google-apps.folder' and name='{folder_name}' and '{parent_id}' in parents and trashed=false"
+    response = service.files().list(q=query, spaces='drive', fields="files(id, name)").execute()
+    folders = response.get('files', [])
+    if not folders:
+        # 文件夹不存在，创建新文件夹
+        file_metadata = {
+            'name': folder_name,
+            'mimeType': 'application/vnd.google-apps.folder',
+            'parents': [parent_id]
+        }
+        folder = service.files().create(body=file_metadata, fields='id').execute()
+        return folder.get('id')
+    else:
+        # 文件夹已存在
+        return folders[0]['id']
 # 检查Google Drive上是否存在文件
 def check_file_exists(service, folder_name, file_name):
     query = f"name = '{file_name}' and '{folder_name}' in parents and trashed = false"
     # 假设您已经获取了 YouTube 视频的逐字稿并存储在变量 `transcript` 中
     video_id = extract_youtube_id(link)
     service = init_drive_service()
+    parent_folder_id = '1GgI4YVs0KckwStVQkLa1NZ8IpaEMurkL'  # youtube逐字稿圖檔的ID
+    # 检查/创建视频ID命名的子文件夹
+    folder_id = create_folder_if_not_exists(service, video_id, parent_folder_id)
     file_name = f"{video_id}_transcript.txt"
     # 检查逐字稿是否存在
+    exists, file_id = check_file_exists(service, folder_id, file_name)
     if not exists:
         # 获取逐字稿
         transcript = YouTubeTranscriptApi.get_transcript(video_id, languages=['en'])
         transcript_text = "\n".join([f"{item['start']}: {item['text']}" for item in transcript])
         # 上传到Google Drive
+        upload_to_drive(service, file_name, folder_id, transcript_text)
         print("逐字稿已上传到Google Drive")
     else:
         print("逐字稿已存在于Google Drive中")