Spaces:

everydayconversify
/

conversify-model

Sleeping

App Files Files Community

everydayconversify commited on Jul 5, 2025

Commit

ab57525

verified ·

1 Parent(s): ee22dcb

Update app.py

Browse files

Files changed (1) hide show

app.py +20 -2

app.py CHANGED Viewed

@@ -1,13 +1,19 @@
 import torch
 from fastapi import FastAPI
 from pydantic import BaseModel
 from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
 import uvicorn
 app = FastAPI()
 MODEL_ID = "Qwen/Qwen1.5-1.8B-Chat"
 tokenizer = AutoTokenizer.from_pretrained(MODEL_ID)
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_ID,
@@ -15,21 +21,27 @@ model = AutoModelForCausalLM.from_pretrained(
     device_map="auto",
 )
 pipe = pipeline(
     "text-generation",
     model=model,
     tokenizer=tokenizer,
 )
 class TranslationRequest(BaseModel):
     text: str
-    target_lang: str
 @app.post("/translate")
 async def translate(request: TranslationRequest):
     korean_text = request.text
     target_lang = request.target_lang
     if target_lang == 'english':
         prompt = f"Translate the following Korean sentence into natural, everyday English. Provide only the translated sentence, without any additional explanations or quotation marks.\n\nKorean: \"{korean_text}\"\n\nEnglish:"
     elif target_lang == 'japanese':
@@ -37,10 +49,12 @@ async def translate(request: TranslationRequest):
     else:
         return {"error": "Invalid target language"}
     messages = [
         {"role": "user", "content": prompt}
     ]
     outputs = pipe(
         messages,
         max_new_tokens=150,
@@ -49,11 +63,15 @@ async def translate(request: TranslationRequest):
         top_k=50,
     )
     generated_text = outputs[0]["generated_text"]
     translated_text = generated_text.split("assistant\n")[-1].strip()
     return {"translated_text": translated_text}
 @app.get("/")
 def read_root():
     return {"message": "Translation API is running"}

+# app.py
 import torch
 from fastapi import FastAPI
 from pydantic import BaseModel
 from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
 import uvicorn
+# 1. FastAPI 앱 인스턴스 생성
 app = FastAPI()
+# 2. AI 모델과 토크나이저를 앱 시작 시 한번만 로딩 (매우 중요!)
+#    요청이 올 때마다 로딩하면 서버가 터져버릴 거야.
 MODEL_ID = "Qwen/Qwen1.5-1.8B-Chat"
+# 메모리 효율을 위해 bfloat16 사용하고, accelerate 라이브러리로 하드웨어 자동 할당
 tokenizer = AutoTokenizer.from_pretrained(MODEL_ID)
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_ID,
     device_map="auto",
 )
+# Transformers 라이브러리의 pipeline을 사용하면 코드가 더 간결해져.
 pipe = pipeline(
     "text-generation",
     model=model,
     tokenizer=tokenizer,
 )
+# 3. 요청 본문(Request Body)의 데이터 형식을 지정
+#    프론트엔드에서 "text"라는 키에 번역할 문장을 담아서 보내야 한다는 규칙.
 class TranslationRequest(BaseModel):
     text: str
+    target_lang: str # 'english' 또는 'japanese'
+# 4. API 엔드포인트(Endpoint) 생성
+#    "/translate" 라는 주소로 POST 요청이 들어왔을 때 이 함수가 실행돼.
 @app.post("/translate")
 async def translate(request: TranslationRequest):
     korean_text = request.text
     target_lang = request.target_lang
+    # 프롬프트 엔지니어링: 모델에게 원하는 결과물을 명확하게 지시
     if target_lang == 'english':
         prompt = f"Translate the following Korean sentence into natural, everyday English. Provide only the translated sentence, without any additional explanations or quotation marks.\n\nKorean: \"{korean_text}\"\n\nEnglish:"
     elif target_lang == 'japanese':
     else:
         return {"error": "Invalid target language"}
+    # Gemma/Qwen 같은 챗봇 모델을 위한 대화 형식
     messages = [
         {"role": "user", "content": prompt}
     ]
+    # 파이프라인으로 텍스트 생성 실행
     outputs = pipe(
         messages,
         max_new_tokens=150,
         top_k=50,
     )
+    # 결과물에서 필요한 부분만 추출
     generated_text = outputs[0]["generated_text"]
+    # 'assistant\n' 다음에 오는 실제 번역 결과만 깔끔하게 잘라내기
     translated_text = generated_text.split("assistant\n")[-1].strip()
+    # 5. 프론트엔드에 번역된 텍스트를 JSON 형태로 반환
     return {"translated_text": translated_text}
+# 서버가 잘 작동하는지 확인하기 위한 기본 주소
 @app.get("/")
 def read_root():
     return {"message": "Translation API is running"}