Spaces:

JunyiAcademy
/

vaitor2

Sleeping

App Files Files Community

youngtsai commited on Apr 6, 2024

Commit

ec27b5b

1 Parent(s): 86e761a

delete global VIDEO_ID

Browse files

Files changed (1) hide show

app.py +3 -6

app.py CHANGED Viewed

@@ -72,7 +72,6 @@ else:
 TRANSCRIPTS = []
 CURRENT_INDEX = 0
-VIDEO_ID = ""
 OPEN_AI_CLIENT = OpenAI(api_key=OPEN_AI_KEY)
 GROQ_CLIENT = Groq(api_key=GROQ_API_KEY)
@@ -531,8 +530,6 @@ def process_youtube_link(password, link):
     # 使用 YouTube API 获取逐字稿
     # 假设您已经获取了 YouTube 视频的逐字稿并存储在变量 `transcript` 中
     video_id = extract_youtube_id(link)
-    global VIDEO_ID
-    VIDEO_ID = video_id
     try:
         transcript = process_transcript_and_screenshots_on_gcs(video_id)
@@ -627,12 +624,12 @@ def create_formatted_simple_transcript(transcript):
         formatted_simple_transcript.append(line)
     return formatted_simple_transcript
-def create_formatted_transcript(transcript):
     formatted_transcript = []
     for entry in transcript:
         start_time = format_seconds_to_time(entry['start'])
         end_time = format_seconds_to_time(entry['start'] + entry['duration'])
-        embed_url = get_embedded_youtube_link(VIDEO_ID, entry['start'])
         img_file_id = entry['img_file_id']
         screenshot_path = img_file_id
         line = {
@@ -1454,7 +1451,7 @@ def create_LLM_content(video_id, df_string, kind):
         else:
             transcript = df_string
         formatted_simple_transcript = create_formatted_simple_transcript(transcript)
-        formatted_transcript = create_formatted_transcript(transcript)
         content = generate_key_moments(formatted_simple_transcript, formatted_transcript)
         update_LLM_content(video_id, content, kind)
         content = json.dumps(content, ensure_ascii=False, indent=2)

 TRANSCRIPTS = []
 CURRENT_INDEX = 0
 OPEN_AI_CLIENT = OpenAI(api_key=OPEN_AI_KEY)
 GROQ_CLIENT = Groq(api_key=GROQ_API_KEY)
     # 使用 YouTube API 获取逐字稿
     # 假设您已经获取了 YouTube 视频的逐字稿并存储在变量 `transcript` 中
     video_id = extract_youtube_id(link)
     try:
         transcript = process_transcript_and_screenshots_on_gcs(video_id)
         formatted_simple_transcript.append(line)
     return formatted_simple_transcript
+def create_formatted_transcript(video_id, transcript):
     formatted_transcript = []
     for entry in transcript:
         start_time = format_seconds_to_time(entry['start'])
         end_time = format_seconds_to_time(entry['start'] + entry['duration'])
+        embed_url = get_embedded_youtube_link(video_id, entry['start'])
         img_file_id = entry['img_file_id']
         screenshot_path = img_file_id
         line = {
         else:
             transcript = df_string
         formatted_simple_transcript = create_formatted_simple_transcript(transcript)
+        formatted_transcript = create_formatted_transcript(video_id, transcript)
         content = generate_key_moments(formatted_simple_transcript, formatted_transcript)
         update_LLM_content(video_id, content, kind)
         content = json.dumps(content, ensure_ascii=False, indent=2)