Spaces:

rafavidal1709
/

Summarization-Deep-Seek-R1

Runtime error

rafavidal1709 commited on Feb 18, 2025

Commit

8eeb059

verified ·

1 Parent(s): 5e77219

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -8,19 +8,21 @@ MODEL_NAME = "deepseek-ai/DeepSeek-R1"
 # Configuração segura para CPU
 tokenizer = AutoTokenizer.from_pretrained(
     MODEL_NAME,
-    trust_remote_code=True  # Removendo a revisão específica
 )
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_NAME,
     trust_remote_code=True,
-    torch_dtype=torch.float32,  # Força o uso de float32 em CPU
-    device_map="cpu",  # Garante que o modelo rode na CPU
     low_cpu_mem_usage=True,  # Otimiza uso de memória
-    load_in_8bit=False,  # Evita tentativas de quantização FP8
-    offload_folder="offload"  # Pasta para descarregar partes do modelo
 )
 def summarize_text(text):
     prompt = f"Resuma em português ({TARGET_LENGTH} caracteres): {text}"
     inputs = tokenizer(prompt, return_tensors="pt", max_length=2048, truncation=True)

 # Configuração segura para CPU
 tokenizer = AutoTokenizer.from_pretrained(
     MODEL_NAME,
+    trust_remote_code=True
 )
+# Carregamento do modelo para CPU
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_NAME,
     trust_remote_code=True,
+    torch_dtype=torch.float32,  # Garante que usa float32 em CPU
+    device_map="cpu",  # Força execução na CPU
     low_cpu_mem_usage=True,  # Otimiza uso de memória
+    load_in_8bit=False,  # Desativa FP8
+    load_in_4bit=False,  # Garante que não tentará usar FP8/4bit
 )
 def summarize_text(text):
     prompt = f"Resuma em português ({TARGET_LENGTH} caracteres): {text}"
     inputs = tokenizer(prompt, return_tensors="pt", max_length=2048, truncation=True)