Spaces:

Jey813
/

lingscope_app

Runtime error

File size: 12,860 Bytes

import os
import json
import tempfile
import gradio as gr
import openai
from transformers import pipeline

# =========================
# 🔧 설정
# =========================
openai.api_key = os.environ.get("OPENAI_API_KEY")

# Hugging Face 번역 파이프라인 (양방향 포함)
translator_ko_to_en = pipeline("translation", model="Helsinki-NLP/opus-mt-ko-en")
translator_ko_to_de = pipeline("translation", model="Helsinki-NLP/opus-mt-ko-de")
translator_en_to_ko = pipeline("translation", model="Helsinki-NLP/opus-mt-en-ko")
translator_de_to_ko = pipeline("translation", model="Helsinki-NLP/opus-mt-de-ko")

# =========================
# 🧠 유틸: OpenAI 호출
# =========================
def gpt(messages, temperature=0.7, model="gpt-4"):
    """단일 ChatCompletion 래퍼"""
    resp = openai.ChatCompletion.create(
        model=model,
        messages=messages,
        temperature=temperature
    )
    return resp.choices[0].message["content"].strip()

# =========================
# 🧩 핵심 로직
# =========================
def make_variants(input_text, source_lang, target_lang, direct_translation):
    """
    직역을 기준으로 원어민이 자연스럽게 쓰는 변형 번역 2개를 추가로 생성 (총 3개)
    """
    sys_msg = "You are a bilingual translator who produces concise, natural alternatives."
    user_msg = f"""
[원문] ({source_lang}): {input_text}
[직역] ({target_lang}): {direct_translation}

위 직역을 기준으로, {target_lang} 원어민이 실제로 많이 쓰는 자연스러운 변형 2가지를 만들어줘.
- 맥락: 일상 대화 기준
- 각 변형은 1문장
- 과장/슬랭은 과하지 않게
- 출력 형식:
1) 변형A: ...
2) 변형B: ...
"""
    out = gpt([{"role":"system","content":sys_msg},{"role":"user","content":user_msg}], temperature=0.6)
    # 간단 파싱
    variants = [direct_translation]
    for line in out.splitlines():
        line = line.strip()
        if line.startswith("1)") or line.lower().startswith("변형a"):
            variants.append(line.split(":",1)[1].strip() if ":" in line else line)
        elif line.startswith("2)") or line.lower().startswith("변형b"):
            variants.append(line.split(":",1)[1].strip() if ":" in line else line)
    # fallback
    return variants[:3] if len(variants)>=3 else (variants + ["", ""])[:3]

def back_translate_list(variants, source_lang, target_lang):
    """각 변형 번역을 모국어로 역번역하여 비교 테이블용 데이터 생성"""
    back_list = []
    for v in variants:
        if not v:
            back_list.append("")
            continue
        if source_lang == "한국어" and target_lang == "영어":
            back_ = translator_en_to_ko(v)[0]["translation_text"]
        elif source_lang == "한국어" and target_lang == "독일어":
            back_ = translator_de_to_ko(v)[0]["translation_text"]
        else:
            back_ = "(역번역 미지원)"
        back_list.append(back_)
    return back_list

def build_explanations(input_text, variants, source_lang, target_lang):
    """표현/문법/단어/문화 설명을 섹션별 마크다운으로 생성"""
    best = variants[0] if variants else ""
    sys_msg = "You are a concise yet friendly language tutor who explains in Korean with clear headings and bullet points."
    user_msg = f"""
다음 표현에 대해 한국어로 설명해줘. 간결하지만 핵심은 빠짐없이.

[원문] ({source_lang}): {input_text}
[대표 번역] ({target_lang}): {best}
[다른 변형 번역들]: {variants[1:]}

아래 섹션 제목을 그대로 사용해:
## 표현 설명
- 어떤 상황/관계에서 쓰는지, 뉘앙스(격식/친근감)

## 문법 포인트
- 핵심 문법 요소 2~3개 (조사/전치사, 시제, 어순 등)
- 간단 예문 각 1개

## 단어/표현 설명
- 어려울 수 있는 단어/구절 3개: 의미 + 짧은 예문

## 문화적 차이
- 한국어와 대상 언어 사이의 기대/예의/관습 차이 2~3가지
"""
    return gpt([{"role":"system","content":sys_msg},{"role":"user","content":user_msg}], temperature=0.5)

def build_pronunciation(input_text, variants, source_lang, target_lang):
    """발음 가이드(텍스트). IPA/강세/리듬 포인트"""
    best = variants[0] if variants else ""
    sys_msg = "You provide compact pronunciation guides (IPA-ish, stress, rhythm)."
    user_msg = f"""
다음 두 문장에 대한 발음 가이드를 한국어로 간단히 적어줘.

[원문] ({source_lang}): {input_text}
[대표 번역] ({target_lang}): {best}

형식:
- 원문: (가능하면 간단 IPA/한글표기) + 강세/리듬 포인트
- 번역: (IPA/강세) + 자연스러운 억양 팁
"""
    return gpt([{"role":"system","content":sys_msg},{"role":"user","content":user_msg}], temperature=0.4)

def build_roleplay(input_text, variants, target_lang):
    """격식/친근 2가지 톤의 짧은 Role Play"""
    best = variants[0] if variants else ""
    sys_msg = "You create short, practical role-play dialogues for language learners."
    user_msg = f"""
다음 표현을 활용한 짧은 대화 2가지를 만들어줘. 각 대화는 6~8 턴.
- 톤1: 격식(직장/공적인 상황)
- 톤2: 친근(친구/가벼운 상황)
- 대상 언어: {target_lang}
- 대화 후 한국어 요약 한 줄

표현: "{best}"
"""
    return gpt([{"role":"system","content":sys_msg},{"role":"user","content":user_msg}], temperature=0.7)

def suggest_resources(input_text, target_lang):
    """학습 자료 추천: 유튜브/검색 키워드"""
    sys_msg = "You suggest search keywords for YouTube and web to find usage contexts."
    user_msg = f"""
아래 표현을 실제 맥락에서 볼 수 있는 자료를 찾기 위한 검색 키워드를 제안해줘.
- 언어: {target_lang}
- 5~7개 키워드, 따옴표 없이, 한 줄에 하나
표현: {input_text}
"""
    out = gpt([{"role":"system","content":sys_msg},{"role":"user","content":user_msg}], temperature=0.5)
    # 클릭 가능한 검색 URL 문자열 생성
    items = [s.strip("-• ").strip() for s in out.splitlines() if s.strip()]
    md_lines = []
    base = "https://www.youtube.com/results?search_query="
    for k in items:
        url = base + k.replace(" ", "+")
        md_lines.append(f"- [{k}]({url})")
    return "\n".join(md_lines)

# =========================
# 🚀 메인 함수 (Gradio에 연결)
# =========================
def run_pipeline(input_text, source_lang, target_lang, favorites_state):
    if not input_text.strip():
        return (
            "", [], None, "", "", "", favorites_state, gr.update(visible=False), None
        )

    # 1) 기본 번역
    if source_lang == "한국어" and target_lang == "영어":
        direct = translator_ko_to_en(input_text)[0]['translation_text']
    elif source_lang == "한국어" and target_lang == "독일어":
        direct = translator_ko_to_de(input_text)[0]['translation_text']
    else:
        return (
            input_text, ["(지원되지 않는 언어쌍입니다.)"], None, "(지원되지 않는 언어쌍)", "", "", favorites_state, gr.update(visible=False), None
        )

    # 2) 변형 3가지
    variants = make_variants(input_text, source_lang, target_lang, direct)

    # 3) 역번역 테이블 데이터
    backs = back_translate_list(variants, source_lang, target_lang)
    back_table = {
        "번역(Variant)": variants,
        "역번역(모국어)": backs
    }

    # 4) 설명 섹션
    explanations_md = build_explanations(input_text, variants, source_lang, target_lang)

    # 5) 발음 가이드
    pron_md = build_pronunciation(input_text, variants, source_lang, target_lang)

    # 6) Role Play
    roleplay_md = build_roleplay(input_text, variants, target_lang)

    # 7) 자료 추천
    resources_md = suggest_resources(input_text, target_lang)

    # 8) 즐겨찾기 카드(현재 결과)
    current_card = {
        "원문": input_text,
        "대표 번역": variants[0],
        "다른 변형": variants[1:],
        "역번역": backs,
        "설명": explanations_md,
        "발음": pron_md,
        "role_play": roleplay_md
    }

    # 다운로드 파일은 Save 버튼 클릭 시 생성하도록 하므로 여기서는 None
    return (
        input_text,
        variants,
        back_table,
        explanations_md,
        pron_md,
        roleplay_md,
        favorites_state,
        gr.update(visible=True),
        resources_md
    )

def save_to_favorites(input_text, variants, backs, explanations_md, pron_md, roleplay_md, favorites_state):
    if favorites_state is None:
        favorites_state = []
    entry = {
        "원문": input_text,
        "변형번역": variants,
        "역번역": backs,
        "설명": explanations_md,
        "발음": pron_md,
        "role_play": roleplay_md
    }
    favorites_state.append(entry)
    return favorites_state, f"저장 완료! (총 {len(favorites_state)}건)"

def export_favorites(favorites_state):
    if not favorites_state:
        return None
    fd, path = tempfile.mkstemp(suffix=".json")
    with os.fdopen(fd, "w", encoding="utf-8") as f:
        json.dump(favorites_state, f, ensure_ascii=False, indent=2)
    return path

def load_sample(sample_text):
    return gr.update(value=sample_text)

# =========================
# 🎛️ Gradio UI
# =========================
with gr.Blocks(title="🌐 문화 간 표현 비교 + 문법 & 어휘 도우미 (확장판)") as demo:
    gr.Markdown("## 🌐 문화 간 표현 비교 + 문법 & 어휘 도우미\n입력한 표현을 기반으로 **자연스러운 번역 3가지, 역번역 비교, 문법/문화 설명, Role Play, 발음 가이드**까지 한 번에!")

    with gr.Row():
        with gr.Column(scale=5):
            input_text = gr.Textbox(label="비교할 문장 입력", placeholder="예: 고생했어!", lines=2)
            with gr.Row():
                src_dd = gr.Dropdown(["한국어"], label="모국어 선택", value="한국어")
                tgt_dd = gr.Dropdown(["영어", "독일어"], label="비교 언어 선택", value="영어")
            with gr.Accordion("샘플 문장 불러오기", open=False):
                gr.Markdown("- 상황별로 바로 테스트해보세요.")
                with gr.Row():
                    b1 = gr.Button("친구 위로: 고생했어!")
                    b2 = gr.Button("격려: 수고 많았어, 정말 고마워.")
                    b3 = gr.Button("업무: 오늘 일정 확인 부탁드립니다.")
            submit = gr.Button("🚀 Submit", variant="primary")

        with gr.Column(scale=7):
            tabs = gr.Tabs()

            with tabs:
                with gr.Tab("결과 요약"):
                    orig_out = gr.Textbox(label="원문", interactive=False)
                    variants_out = gr.HighlightedText(
                        label="번역 3가지 (직역 + 자연스러운 변형)",
                        combine_adjacent=True
                    )
                    resources_md = gr.Markdown(visible=False)

                with gr.Tab("역방향 비교"):
                    back_table = gr.Dataframe(headers=["번역(Variant)", "역번역(모국어)"], interactive=False)

                with gr.Tab("설명"):
                    explain_out = gr.Markdown()

                with gr.Tab("발음 가이드"):
                    pron_out = gr.Markdown()

                with gr.Tab("Role Play"):
                    role_out = gr.Markdown()

                with gr.Tab("즐겨찾기"):
                    fav_state = gr.State([])
                    save_btn = gr.Button("⭐ 현재 결과 저장")
                    save_status = gr.Markdown("")
                    export_btn = gr.Button("⬇️ 즐겨찾기 JSON 내보내기")
                    export_file = gr.File(label="다운로드 파일")

    # ---------- 이벤트 바인딩 ----------
    submit.click(
        fn=run_pipeline,
        inputs=[input_text, src_dd, tgt_dd, fav_state],
        outputs=[orig_out, variants_out, back_table, explain_out, pron_out, role_out, fav_state, resources_md, resources_md],
    )

    # 샘플 버튼
    b1.click(fn=load_sample, inputs=None, outputs=input_text, _js=None, kwargs={"sample_text":"고생했어!"})
    b2.click(fn=load_sample, inputs=None, outputs=input_text, kwargs={"sample_text":"수고 많았어, 정말 고마워."})
    b3.click(fn=load_sample, inputs=None, outputs=input_text, kwargs={"sample_text":"오늘 일정 확인 부탁드립니다."})

    # 즐겨찾기 저장
    save_btn.click(
        fn=save_to_favorites,
        inputs=[orig_out, variants_out, back_table, explain_out, pron_out, role_out, fav_state],
        outputs=[fav_state, save_status]
    )

    # 내보내기
    export_btn.click(fn=export_favorites, inputs=[fav_state], outputs=[export_file])

demo.launch()