Spaces:

simahu
/

Helsinki

Running

App Files Files Community

simahu commited on Jan 7

Commit

899124f

verified ·

1 Parent(s): 23013b9

Update app.py

Browse files

Files changed (1) hide show

app.py +29 -0

app.py CHANGED Viewed

@@ -4,12 +4,28 @@ from typing import Optional
 from transformers import MarianMTModel, MarianTokenizer
 import datetime
 import logging
 logger = logging.getLogger("translate")
 logger.setLevel(logging.INFO)
 app = FastAPI(title="翻译服务")
 # 加载翻译模型
 MODEL_NAME = "Helsinki-NLP/opus-mt-tc-bible-big-zhx-en"
 logger.info(f"{datetime.datetime.now()} Loading model {MODEL_NAME}...")
@@ -26,11 +42,24 @@ class TranslateResponse(BaseModel):
 @app.post("/api/translate", response_model=TranslateResponse)
 async def translate(req: TranslateRequest):
     # tokenizer 会处理编码
     batch = tokenizer([req.text], return_tensors="pt", padding=True)
     translated = model.generate(**batch)
     output = tokenizer.decode(translated[0], skip_special_tokens=True)
     return TranslateResponse(
         translated_text=output,
         detected_lang=None  # 简单翻译版暂不返回检测语言

 from transformers import MarianMTModel, MarianTokenizer
 import datetime
 import logging
+import hashlib
+import time
 logger = logging.getLogger("translate")
 logger.setLevel(logging.INFO)
 app = FastAPI(title="翻译服务")
+cache = {}  # {hash: (translated_text, expire_ts)}
+def _hash_text(text: str) -> str:
+    return hashlib.sha256(text.encode("utf-8")).hexdigest()
+def _clean_cache():
+    now = time.time()
+    # 清理过期缓存
+    expired_keys = [k for k, (_, exp) in cache.items() if exp < now]
+    for k in expired_keys:
+        del cache[k]
 # 加载翻译模型
 MODEL_NAME = "Helsinki-NLP/opus-mt-tc-bible-big-zhx-en"
 logger.info(f"{datetime.datetime.now()} Loading model {MODEL_NAME}...")
 @app.post("/api/translate", response_model=TranslateResponse)
 async def translate(req: TranslateRequest):
+    _clean_cache()
+    h = _hash_text(req.text)
+    # 查缓存
+    if h in cache:
+        translated_text, expire_ts = cache[h]
+        if expire_ts > time.time():
+            logger.info(f"Cache hit: {h}")
+            return TranslateResponse(translated_text=translated_text)
     # tokenizer 会处理编码
     batch = tokenizer([req.text], return_tensors="pt", padding=True)
     translated = model.generate(**batch)
     output = tokenizer.decode(translated[0], skip_special_tokens=True)
+    # 写缓存（保留30分钟）
+    cache[h] = (output, time.time() + 30 * 60)
     return TranslateResponse(
         translated_text=output,
         detected_lang=None  # 简单翻译版暂不返回检测语言