Spaces:

JunyiAcademy
/

vaitor2

Sleeping

App Files Files Community

youngtsai commited on Feb 14, 2024

Commit

f4b5a4c

1 Parent(s): 05867f4

def get_questions(video_id, df_string):

Browse files

Files changed (1) hide show

app.py +28 -5

app.py CHANGED Viewed

@@ -51,6 +51,7 @@ from urllib.parse import urlparse, parse_qs
 OUTPUT_PATH = 'videos'
 TRANSCRIPTS = []
 CURRENT_INDEX = 0
 OPEN_AI_KEY = os.getenv("OPEN_AI_KEY")
 client = OpenAI(api_key=OPEN_AI_KEY)
@@ -295,6 +296,10 @@ def process_youtube_link(link):
     # 使用 YouTube API 获取逐字稿
     # 假设您已经获取了 YouTube 视频的逐字稿并存储在变量 `transcript` 中
     video_id = extract_youtube_id(link)
     download_youtube_video(video_id, output_path=OUTPUT_PATH)
     try:
@@ -335,8 +340,7 @@ def process_youtube_link(link):
     TRANSCRIPTS = formatted_transcript
     # 基于逐字稿生成其他所需的输出
-    # questions = generate_questions(formatted_simple_transcript)
-    questions = ["", "", ""]
     formatted_transcript_json = json.dumps(formatted_transcript, ensure_ascii=False, indent=2)
     summary_json = get_video_id_summary(video_id, formatted_simple_transcript)
     summary = summary_json["summary"]
@@ -566,8 +570,27 @@ def generate_questions(df_string):
     return questions
-def get_questions(df_string):
-    questions = generate_questions(df_string)
     q1 = questions[0] if len(questions) > 0 else ""
     q2 = questions[1] if len(questions) > 1 else ""
     q3 = questions[2] if len(questions) > 2 else ""
@@ -724,7 +747,7 @@ with gr.Blocks() as demo:
     btn_2.click(respond, inputs=[btn_2, df_string_output, chatbot], outputs=[msg, chatbot])
     btn_3.click(respond, inputs=[btn_3, df_string_output, chatbot], outputs=[msg, chatbot])
-    btn_create_question.click(get_questions, inputs = [df_string_output], outputs = [btn_1, btn_2, btn_3])
     # file_upload.change(process_file, inputs=file_upload, outputs=df_string_output)
     file_upload.change(process_file, inputs=file_upload, outputs=[btn_1, btn_2, btn_3, df_summarise, df_string_output])

 OUTPUT_PATH = 'videos'
 TRANSCRIPTS = []
 CURRENT_INDEX = 0
+VIDEO_ID = ""
 OPEN_AI_KEY = os.getenv("OPEN_AI_KEY")
 client = OpenAI(api_key=OPEN_AI_KEY)
     # 使用 YouTube API 获取逐字稿
     # 假设您已经获取了 YouTube 视频的逐字稿并存储在变量 `transcript` 中
     video_id = extract_youtube_id(link)
+    global VIDEO_ID
+    VIDEO_ID = video_id
     download_youtube_video(video_id, output_path=OUTPUT_PATH)
     try:
     TRANSCRIPTS = formatted_transcript
     # 基于逐字稿生成其他所需的输出
+    questions = get_questions(video_id, formatted_simple_transcript)
     formatted_transcript_json = json.dumps(formatted_transcript, ensure_ascii=False, indent=2)
     summary_json = get_video_id_summary(video_id, formatted_simple_transcript)
     summary = summary_json["summary"]
     return questions
+def get_questions(video_id, df_string):
+    # 去 g drive 確認是有有 video_id_questions.json
+    print("===get_questions===")
+    service = init_drive_service()
+    parent_folder_id = '1GgI4YVs0KckwStVQkLa1NZ8IpaEMurkL'
+    folder_id = create_folder_if_not_exists(service, video_id, parent_folder_id)
+    file_name = f'{video_id}_questions.json'
+    # 检查檔案是否存在
+    exists, file_id = check_file_exists(service, folder_id, file_name)
+    if not exists:
+        questions = generate_questions(df_string)
+        questions_text = json.dumps(questions, ensure_ascii=False, indent=2)
+        upload_content_directly(service, file_name, folder_id, questions_text)
+        print("questions已上傳到Google Drive")
+    else:
+        # 逐字稿已存在，下载逐字稿内容
+        print("questions已存在于Google Drive中")
+        questions_text = download_file_as_string(service, file_id)
+        questions = json.loads(questions_text)
     q1 = questions[0] if len(questions) > 0 else ""
     q2 = questions[1] if len(questions) > 1 else ""
     q3 = questions[2] if len(questions) > 2 else ""
     btn_2.click(respond, inputs=[btn_2, df_string_output, chatbot], outputs=[msg, chatbot])
     btn_3.click(respond, inputs=[btn_3, df_string_output, chatbot], outputs=[msg, chatbot])
+    btn_create_question.click(get_questions, inputs = [VIDEO_ID, df_string_output], outputs = [btn_1, btn_2, btn_3])
     # file_upload.change(process_file, inputs=file_upload, outputs=df_string_output)
     file_upload.change(process_file, inputs=file_upload, outputs=[btn_1, btn_2, btn_3, df_summarise, df_string_output])