Spaces:

Piggihex
/

CodeT5

Sleeping

Sixparticle commited on Apr 7

Commit

a983386

1 Parent(s): c1d9331

Fix tokenizer init fallback for HF Spaces startup

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,7 +4,11 @@ import torch
 # 加载 CodeT5+ 模型
 model_name = "Salesforce/codet5p-220m"
-tokenizer = AutoTokenizer.from_pretrained(model_name, use_fast=True, trust_remote_code=True)
 model = AutoModelForSeq2SeqLM.from_pretrained(model_name, trust_remote_code=True)
 def generate_code(prompt: str, max_length: int = 128) -> str:

 # 加载 CodeT5+ 模型
 model_name = "Salesforce/codet5p-220m"
+try:
+    tokenizer = AutoTokenizer.from_pretrained(model_name, use_fast=True, trust_remote_code=True)
+except TypeError:
+    # Some tokenizer repos expose added_tokens metadata that breaks fast tokenizer init.
+    tokenizer = AutoTokenizer.from_pretrained(model_name, use_fast=False, trust_remote_code=True)
 model = AutoModelForSeq2SeqLM.from_pretrained(model_name, trust_remote_code=True)
 def generate_code(prompt: str, max_length: int = 128) -> str: