Spaces:

JunyiAcademy
/

vaitor2

Sleeping

App Files Files Community

youngtsai commited on Feb 24, 2024

Commit

3341bca

1 Parent(s): 893dd35

def chat_with_youtube_transcript(youtube_id, thread_id, user_message, chat_history, socratic_mode=False):

Browse files

Files changed (1) hide show

app.py +27 -19

app.py CHANGED Viewed

@@ -292,8 +292,7 @@ def update_file_on_drive(service, file_id, file_content):
     print(f"文件已更新，文件ID: {updated_file['id']}")
-# ====drive====
 def process_file(file):
     # 读取文件
     if file.name.endswith('.csv'):
@@ -464,9 +463,6 @@ def process_transcript_and_screenshots_on_gcs(video_id):
     return updated_transcript_json
 def process_youtube_link(link):
     # 使用 YouTube API 获取逐字稿
     # 假设您已经获取了 YouTube 视频的逐字稿并存储在变量 `transcript` 中
@@ -546,8 +542,6 @@ def process_youtube_link(link):
         first_image, \
         first_text,
 def format_transcript_to_html(formatted_transcript):
     html_content = ""
     for entry in formatted_transcript:
@@ -583,7 +577,6 @@ def download_youtube_video(youtube_id, output_path=OUTPUT_PATH):
     print(f"Video downloaded successfully: {output_path}/{youtube_id}.mp4")
 def screenshot_youtube_video(youtube_id, snapshot_sec):
     video_path = f'{OUTPUT_PATH}/{youtube_id}.mp4'
     file_name = f"{youtube_id}_{snapshot_sec}.jpg"
@@ -1007,18 +1000,32 @@ def respond(user_message, data, chat_history, socratic_mode=False):
 def chat_with_youtube_transcript(youtube_id, thread_id, user_message, chat_history, socratic_mode=False):
     assistant_id = "asst_kmvZLNkDUYaNkMNtZEAYxyPq"
     client = OPEN_AI_CLIENT
     # 创建线程
-    if thread_id is None or thread_id == "":
         thread = client.beta.threads.create()
-        # 向线程添加初始系统消息，指定使用的 YouTube 视频ID
-        client.beta.threads.messages.create(
-            thread_id=thread.id,
-            role="system",
-            content=f"""
-                使用 YouTube 视频逐字稿数据：youtube_id = {youtube_id}，
-                如果沒有找到逐字稿，就告訴 user 你有沒有逐字稿的資料。
-            """
-        )
     else:
         thread = client.beta.threads.retrieve(thread_id)
@@ -1032,7 +1039,8 @@ def chat_with_youtube_transcript(youtube_id, thread_id, user_message, chat_histo
     # 运行助手，生成响应
     run = client.beta.threads.runs.create(
         thread_id=thread.id,
-        assistant_id=assistant_id
     )
     # check run status

     print(f"文件已更新，文件ID: {updated_file['id']}")
+# ----  Main Functions ----
 def process_file(file):
     # 读取文件
     if file.name.endswith('.csv'):
     return updated_transcript_json
 def process_youtube_link(link):
     # 使用 YouTube API 获取逐字稿
     # 假设您已经获取了 YouTube 视频的逐字稿并存储在变量 `transcript` 中
         first_image, \
         first_text,
 def format_transcript_to_html(formatted_transcript):
     html_content = ""
     for entry in formatted_transcript:
     print(f"Video downloaded successfully: {output_path}/{youtube_id}.mp4")
 def screenshot_youtube_video(youtube_id, snapshot_sec):
     video_path = f'{OUTPUT_PATH}/{youtube_id}.mp4'
     file_name = f"{youtube_id}_{snapshot_sec}.jpg"
 def chat_with_youtube_transcript(youtube_id, thread_id, user_message, chat_history, socratic_mode=False):
     assistant_id = "asst_kmvZLNkDUYaNkMNtZEAYxyPq"
     client = OPEN_AI_CLIENT
+    instructions = f"""
+        你是一個擅長資料分析跟影片教學的老師，user 為學生
+        請找到 file youtube_id = {youtube_id} 為資料文本，自行判斷資料的種類，
+        如果 file 沒有資料，請告訴用戶沒有逐字稿資料，但仍然可以進行對話
+        並進行對話，使用 zh-TW
+        如果是影片類型，不用解釋逐字稿格式，直接回答學生問題
+        socratic_mode = {socratic_mode}
+        如果 socratic_mode = True，
+        - 請用蘇格拉底式的提問方式，引導學生思考，並且給予學生一些提示
+        - 不要直接給予答案，讓學生自己思考
+        - 但可以給予一些提示跟引導，例如給予影片的時間軸，讓學生自己去找答案
+        - 在你回答的開頭標註【蘇格拉底助教】
+        如果 socratic_mode = False，
+        - 直接回答學生問題
+        如果學生問了一些問題你無法判斷，請告訴學生你無法判斷，並建議學生可以問其他問題
+        或者你可以反問學生一些問題，幫助學生更好的理解資料
+        如果學生的問題與資料文本無關，請告訴學生你無法回答超出範圍的問題
+        最後，如果 socratic_mode = True
+    """
     # 创建线程
+    if not thread_id:
         thread = client.beta.threads.create()
+        thread_id = thread.id
     else:
         thread = client.beta.threads.retrieve(thread_id)
     # 运行助手，生成响应
     run = client.beta.threads.runs.create(
         thread_id=thread.id,
+        assistant_id=assistant_id,
+        instructions=instructions,
     )
     # check run status