Spaces:

cafe3310
/

ling-playground-basic

Sleeping

cafe3310 commited on Sep 23

Commit

a074dc6

1 Parent(s): cb25b17

fix: 推理前将输入张量移动到模型设备

Files changed (1) hide show

comp.py CHANGED Viewed

@@ -46,8 +46,8 @@ def completion_node(state: GraphState) -> dict:
     prompt += "Assistant:"
     # --- 模型调用 ---
-    # 使用 device_map="auto" 时，我们无需手动将张量移动到特定设备
-    input_ids = tokenizer(prompt, return_tensors="pt").input_ids
     output_ids = model.generate(
         input_ids,
         max_new_tokens=512,  # 暂时硬编码

     prompt += "Assistant:"
     # --- 模型调用 ---
+    # 虽然模型设备是自动映射的，但输入张量仍需显式移动到模型所在的设备
+    input_ids = tokenizer(prompt, return_tensors="pt").input_ids.to(model.device)
     output_ids = model.generate(
         input_ids,
         max_new_tokens=512,  # 暂时硬编码