Spaces:

Jey813
/

lingscope_app

Runtime error

App Files Files Community

lingscope_app / app.py

Jey813

Update app.py

fb7b386 verified 5 months ago

raw

history blame contribute delete

12.9 kB

	import os
	import json
	import tempfile
	import gradio as gr
	import openai
	from transformers import pipeline

	# =========================
	# 🔧 설정
	# =========================
	openai.api_key = os.environ.get("OPENAI_API_KEY")

	# Hugging Face 번역 파이프라인 (양방향 포함)
	translator_ko_to_en = pipeline("translation", model="Helsinki-NLP/opus-mt-ko-en")
	translator_ko_to_de = pipeline("translation", model="Helsinki-NLP/opus-mt-ko-de")
	translator_en_to_ko = pipeline("translation", model="Helsinki-NLP/opus-mt-en-ko")
	translator_de_to_ko = pipeline("translation", model="Helsinki-NLP/opus-mt-de-ko")

	# =========================
	# 🧠 유틸: OpenAI 호출
	# =========================
	def gpt(messages, temperature=0.7, model="gpt-4"):
	"""단일 ChatCompletion 래퍼"""
	resp = openai.ChatCompletion.create(
	model=model,
	messages=messages,
	temperature=temperature
	)
	return resp.choices[0].message["content"].strip()

	# =========================
	# 🧩 핵심 로직
	# =========================
	def make_variants(input_text, source_lang, target_lang, direct_translation):
	"""
	직역을 기준으로 원어민이 자연스럽게 쓰는 변형 번역 2개를 추가로 생성 (총 3개)
	"""
	sys_msg = "You are a bilingual translator who produces concise, natural alternatives."
	user_msg = f"""
	[원문] ({source_lang}): {input_text}
	[직역] ({target_lang}): {direct_translation}

	위 직역을 기준으로, {target_lang} 원어민이 실제로 많이 쓰는 자연스러운 변형 2가지를 만들어줘.
	- 맥락: 일상 대화 기준
	- 각 변형은 1문장
	- 과장/슬랭은 과하지 않게
	- 출력 형식:
	1) 변형A: ...
	2) 변형B: ...
	"""
	out = gpt([{"role":"system","content":sys_msg},{"role":"user","content":user_msg}], temperature=0.6)
	# 간단 파싱
	variants = [direct_translation]
	for line in out.splitlines():
	line = line.strip()
	if line.startswith("1)") or line.lower().startswith("변형a"):
	variants.append(line.split(":",1)[1].strip() if ":" in line else line)
	elif line.startswith("2)") or line.lower().startswith("변형b"):
	variants.append(line.split(":",1)[1].strip() if ":" in line else line)
	# fallback
	return variants[:3] if len(variants)>=3 else (variants + ["", ""])[:3]

	def back_translate_list(variants, source_lang, target_lang):
	"""각 변형 번역을 모국어로 역번역하여 비교 테이블용 데이터 생성"""
	back_list = []
	for v in variants:
	if not v:
	back_list.append("")
	continue
	if source_lang == "한국어" and target_lang == "영어":
	back_ = translator_en_to_ko(v)[0]["translation_text"]
	elif source_lang == "한국어" and target_lang == "독일어":
	back_ = translator_de_to_ko(v)[0]["translation_text"]
	else:
	back_ = "(역번역 미지원)"
	back_list.append(back_)
	return back_list

	def build_explanations(input_text, variants, source_lang, target_lang):
	"""표현/문법/단어/문화 설명을 섹션별 마크다운으로 생성"""
	best = variants[0] if variants else ""
	sys_msg = "You are a concise yet friendly language tutor who explains in Korean with clear headings and bullet points."
	user_msg = f"""
	다음 표현에 대해 한국어로 설명해줘. 간결하지만 핵심은 빠짐없이.

	[원문] ({source_lang}): {input_text}
	[대표 번역] ({target_lang}): {best}
	[다른 변형 번역들]: {variants[1:]}

	아래 섹션 제목을 그대로 사용해:
	## 표현 설명
	- 어떤 상황/관계에서 쓰는지, 뉘앙스(격식/친근감)

	## 문법 포인트
	- 핵심 문법 요소 2~3개 (조사/전치사, 시제, 어순 등)
	- 간단 예문 각 1개

	## 단어/표현 설명
	- 어려울 수 있는 단어/구절 3개: 의미 + 짧은 예문

	## 문화적 차이
	- 한국어와 대상 언어 사이의 기대/예의/관습 차이 2~3가지
	"""
	return gpt([{"role":"system","content":sys_msg},{"role":"user","content":user_msg}], temperature=0.5)

	def build_pronunciation(input_text, variants, source_lang, target_lang):
	"""발음 가이드(텍스트). IPA/강세/리듬 포인트"""
	best = variants[0] if variants else ""
	sys_msg = "You provide compact pronunciation guides (IPA-ish, stress, rhythm)."
	user_msg = f"""
	다음 두 문장에 대한 발음 가이드를 한국어로 간단히 적어줘.

	[원문] ({source_lang}): {input_text}
	[대표 번역] ({target_lang}): {best}

	형식:
	- 원문: (가능하면 간단 IPA/한글표기) + 강세/리듬 포인트
	- 번역: (IPA/강세) + 자연스러운 억양 팁
	"""
	return gpt([{"role":"system","content":sys_msg},{"role":"user","content":user_msg}], temperature=0.4)

	def build_roleplay(input_text, variants, target_lang):
	"""격식/친근 2가지 톤의 짧은 Role Play"""
	best = variants[0] if variants else ""
	sys_msg = "You create short, practical role-play dialogues for language learners."
	user_msg = f"""
	다음 표현을 활용한 짧은 대화 2가지를 만들어줘. 각 대화는 6~8 턴.
	- 톤1: 격식(직장/공적인 상황)
	- 톤2: 친근(친구/가벼운 상황)
	- 대상 언어: {target_lang}
	- 대화 후 한국어 요약 한 줄

	표현: "{best}"
	"""
	return gpt([{"role":"system","content":sys_msg},{"role":"user","content":user_msg}], temperature=0.7)

	def suggest_resources(input_text, target_lang):
	"""학습 자료 추천: 유튜브/검색 키워드"""
	sys_msg = "You suggest search keywords for YouTube and web to find usage contexts."
	user_msg = f"""
	아래 표현을 실제 맥락에서 볼 수 있는 자료를 찾기 위한 검색 키워드를 제안해줘.
	- 언어: {target_lang}
	- 5~7개 키워드, 따옴표 없이, 한 줄에 하나
	표현: {input_text}
	"""
	out = gpt([{"role":"system","content":sys_msg},{"role":"user","content":user_msg}], temperature=0.5)
	# 클릭 가능한 검색 URL 문자열 생성
	items = [s.strip("-• ").strip() for s in out.splitlines() if s.strip()]
	md_lines = []
	base = "https://www.youtube.com/results?search_query="
	for k in items:
	url = base + k.replace(" ", "+")
	md_lines.append(f"- [{k}]({url})")
	return "\n".join(md_lines)

	# =========================
	# 🚀 메인 함수 (Gradio에 연결)
	# =========================
	def run_pipeline(input_text, source_lang, target_lang, favorites_state):
	if not input_text.strip():
	return (
	"", [], None, "", "", "", favorites_state, gr.update(visible=False), None
	)

	# 1) 기본 번역
	if source_lang == "한국어" and target_lang == "영어":
	direct = translator_ko_to_en(input_text)[0]['translation_text']
	elif source_lang == "한국어" and target_lang == "독일어":
	direct = translator_ko_to_de(input_text)[0]['translation_text']
	else:
	return (
	input_text, ["(지원되지 않는 언어쌍입니다.)"], None, "(지원되지 않는 언어쌍)", "", "", favorites_state, gr.update(visible=False), None
	)

	# 2) 변형 3가지
	variants = make_variants(input_text, source_lang, target_lang, direct)

	# 3) 역번역 테이블 데이터
	backs = back_translate_list(variants, source_lang, target_lang)
	back_table = {
	"번역(Variant)": variants,
	"역번역(모국어)": backs
	}

	# 4) 설명 섹션
	explanations_md = build_explanations(input_text, variants, source_lang, target_lang)

	# 5) 발음 가이드
	pron_md = build_pronunciation(input_text, variants, source_lang, target_lang)

	# 6) Role Play
	roleplay_md = build_roleplay(input_text, variants, target_lang)

	# 7) 자료 추천
	resources_md = suggest_resources(input_text, target_lang)

	# 8) 즐겨찾기 카드(현재 결과)
	current_card = {
	"원문": input_text,
	"대표 번역": variants[0],
	"다른 변형": variants[1:],
	"역번역": backs,
	"설명": explanations_md,
	"발음": pron_md,
	"role_play": roleplay_md
	}

	# 다운로드 파일은 Save 버튼 클릭 시 생성하도록 하므로 여기서는 None
	return (
	input_text,
	variants,
	back_table,
	explanations_md,
	pron_md,
	roleplay_md,
	favorites_state,
	gr.update(visible=True),
	resources_md
	)

	def save_to_favorites(input_text, variants, backs, explanations_md, pron_md, roleplay_md, favorites_state):
	if favorites_state is None:
	favorites_state = []
	entry = {
	"원문": input_text,
	"변형번역": variants,
	"역번역": backs,
	"설명": explanations_md,
	"발음": pron_md,
	"role_play": roleplay_md
	}
	favorites_state.append(entry)
	return favorites_state, f"저장 완료! (총 {len(favorites_state)}건)"

	def export_favorites(favorites_state):
	if not favorites_state:
	return None
	fd, path = tempfile.mkstemp(suffix=".json")
	with os.fdopen(fd, "w", encoding="utf-8") as f:
	json.dump(favorites_state, f, ensure_ascii=False, indent=2)
	return path

	def load_sample(sample_text):
	return gr.update(value=sample_text)

	# =========================
	# 🎛️ Gradio UI
	# =========================
	with gr.Blocks(title="🌐 문화 간 표현 비교 + 문법 & 어휘 도우미 (확장판)") as demo:
	gr.Markdown("## 🌐 문화 간 표현 비교 + 문법 & 어휘 도우미\n입력한 표현을 기반으로 자연스러운 번역 3가지, 역번역 비교, 문법/문화 설명, Role Play, 발음 가이드까지 한 번에!")

	with gr.Row():
	with gr.Column(scale=5):
	input_text = gr.Textbox(label="비교할 문장 입력", placeholder="예: 고생했어!", lines=2)
	with gr.Row():
	src_dd = gr.Dropdown(["한국어"], label="모국어 선택", value="한국어")
	tgt_dd = gr.Dropdown(["영어", "독일어"], label="비교 언어 선택", value="영어")
	with gr.Accordion("샘플 문장 불러오기", open=False):
	gr.Markdown("- 상황별로 바로 테스트해보세요.")
	with gr.Row():
	b1 = gr.Button("친구 위로: 고생했어!")
	b2 = gr.Button("격려: 수고 많았어, 정말 고마워.")
	b3 = gr.Button("업무: 오늘 일정 확인 부탁드립니다.")
	submit = gr.Button("🚀 Submit", variant="primary")

	with gr.Column(scale=7):
	tabs = gr.Tabs()

	with tabs:
	with gr.Tab("결과 요약"):
	orig_out = gr.Textbox(label="원문", interactive=False)
	variants_out = gr.HighlightedText(
	label="번역 3가지 (직역 + 자연스러운 변형)",
	combine_adjacent=True
	)
	resources_md = gr.Markdown(visible=False)

	with gr.Tab("역방향 비교"):
	back_table = gr.Dataframe(headers=["번역(Variant)", "역번역(모국어)"], interactive=False)

	with gr.Tab("설명"):
	explain_out = gr.Markdown()

	with gr.Tab("발음 가이드"):
	pron_out = gr.Markdown()

	with gr.Tab("Role Play"):
	role_out = gr.Markdown()

	with gr.Tab("즐겨찾기"):
	fav_state = gr.State([])
	save_btn = gr.Button("⭐ 현재 결과 저장")
	save_status = gr.Markdown("")
	export_btn = gr.Button("⬇️ 즐겨찾기 JSON 내보내기")
	export_file = gr.File(label="다운로드 파일")

	# ---------- 이벤트 바인딩 ----------
	submit.click(
	fn=run_pipeline,
	inputs=[input_text, src_dd, tgt_dd, fav_state],
	outputs=[orig_out, variants_out, back_table, explain_out, pron_out, role_out, fav_state, resources_md, resources_md],
	)

	# 샘플 버튼
	b1.click(fn=load_sample, inputs=None, outputs=input_text, _js=None, kwargs={"sample_text":"고생했어!"})
	b2.click(fn=load_sample, inputs=None, outputs=input_text, kwargs={"sample_text":"수고 많았어, 정말 고마워."})
	b3.click(fn=load_sample, inputs=None, outputs=input_text, kwargs={"sample_text":"오늘 일정 확인 부탁드립니다."})

	# 즐겨찾기 저장
	save_btn.click(
	fn=save_to_favorites,
	inputs=[orig_out, variants_out, back_table, explain_out, pron_out, role_out, fav_state],
	outputs=[fav_state, save_status]
	)

	# 내보내기
	export_btn.click(fn=export_favorites, inputs=[fav_state], outputs=[export_file])

	demo.launch()