Spaces:

Kims12
/

YT

Sleeping

App Files Files Community

Kims12 commited on Jan 16, 2025

Commit

cf025db

verified ·

1 Parent(s): 39b6012

Create app.py

Browse files

Files changed (1) hide show

app.py +80 -0

app.py ADDED Viewed

	@@ -0,0 +1,80 @@

+import os
+import requests
+import json
+import gradio as gr
+import re
+# Hugging Face 환경 변수로부터 RapidAPI 키와 호스트 가져오기
+AA_KEY = os.getenv("AA_KEY")
+AA_HOST = "youtube-transcriptor.p.rapidapi.com"
+# 자막 언어 우선순위 리스트
+LANGUAGE_PRIORITY = ['ko', 'en', 'ja', 'zh']
+# 유튜브 URL에서 비디오 ID를 추출하는 함수
+def get_video_id(youtube_url):
+   # 유튜브 URL 또는 youtu.be 단축 URL에서 video_id 추출
+   video_id_match = re.search(r"(?<=v=)[^#&?]*", youtube_url) or re.search(r"(?<=youtu.be/)[^#&?]*", youtube_url)
+   # YouTube Shorts URL 처리
+   if not video_id_match:
+       video_id_match = re.search(r"(?<=shorts/)[^#&?]*", youtube_url)
+   return video_id_match.group(0) if video_id_match else None
+# 유튜브 자막을 요청하는 함수 (언어 우선순위를 적용하여 시도)
+def get_youtube_transcript(youtube_url):
+    try:
+        # 비디오 ID 추출
+        video_id = get_video_id(youtube_url)
+        if video_id is None:
+            return {"error": "잘못된 유튜브 URL입니다."}
+        url = "https://youtube-transcriptor.p.rapidapi.com/transcript"
+        headers = {
+            "x-rapidapi-key": AA_KEY,
+            "x-rapidapi-host": AA_HOST
+        }
+        # 1. 우선순위 언어로 시도
+        for lang in LANGUAGE_PRIORITY:
+            querystring = {"video_id": video_id, "lang": lang}
+            response = requests.get(url, headers=headers, params=querystring)
+            if response.status_code == 200:
+                data = response.json()
+                if data and not isinstance(data, str) and "error" not in data:
+                    return {"language": lang, "data": data}
+                if isinstance(data, dict) and "availableLangs" in data:
+                    available_langs = data["availableLangs"]
+                    # 2. 가능한 언어가 있다면 해당 언어로 시도
+                    for available_lang in available_langs:
+                        querystring = {"video_id": video_id, "lang": available_lang}
+                        response = requests.get(url, headers=headers, params=querystring)
+                        if response.status_code == 200:
+                            data = response.json()
+                            if data and not isinstance(data, str) and "error" not in data:
+                                return {"language": available_lang, "data": data}
+        # 3. 모든 시도 실패시
+        return {"error": "자막을 찾을 수 없습니다."}
+    except Exception as e:
+        return {"error": "자막을 불러오는데 실패했습니다."}
+# Gradio 인터페이스 함수
+def youtube_transcript_interface(youtube_url):
+    transcript_data = get_youtube_transcript(youtube_url)
+    return json.dumps(transcript_data, ensure_ascii=False, indent=2)
+# Gradio 인터페이스 생성
+interface = gr.Interface(
+   fn=youtube_transcript_interface,
+   inputs="text",
+   outputs="text",
+   title="YouTube 자막 추출기",
+   description="유튜브 URL을 입력하세요."
+)
+# Gradio 인터페이스 실행
+interface.launch()