Spaces:

colin730
/

SummarizerApp

Running

ming commited on Nov 28, 2025

Commit

cfe8d29

1 Parent(s): 12a2e7c

fix: Move inputs to model device in _single_chunk_summarize to fix CPU/GPU device mismatch

Files changed (1) hide show

app/services/hf_streaming_summarizer.py CHANGED Viewed

@@ -619,6 +619,13 @@ class HFStreamingSummarizer:
             inputs = _to_singleton_batch(inputs)
             # Validate pad/eos ids
             pad_id = self.tokenizer.pad_token_id
             eos_id = self.tokenizer.eos_token_id

             inputs = _to_singleton_batch(inputs)
+            # Move inputs to model device (required when model is on CUDA)
+            model_device = next(self.model.parameters()).device
+            inputs = {
+                k: v.to(model_device) if isinstance(v, torch.Tensor) else v
+                for k, v in inputs.items()
+            }
             # Validate pad/eos ids
             pad_id = self.tokenizer.pad_token_id
             eos_id = self.tokenizer.eos_token_id