Spaces:

jatingocodeo
/

phi-vlm

Sleeping

jatingocodeo commited on Apr 12, 2025

Commit

0bdc84a

verified ·

1 Parent(s): 6ae1346

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -43,18 +43,23 @@ Description: """
     # Generate response
     with torch.no_grad():
         outputs = model.generate(
-            **inputs,
             max_new_tokens=max_length,
             temperature=temperature,
             top_p=top_p,
-            num_return_sequences=1,
-            pad_token_id=tokenizer.eos_token_id,
-            do_sample=True
         )
     # Decode and return the response
-    full_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
-    return full_text.split("Description: ")[-1].strip()
 def create_demo(model_id):
     # Load model and tokenizer

     # Generate response
     with torch.no_grad():
         outputs = model.generate(
+            input_ids=inputs['input_ids'],  # Explicitly use input_ids
+            attention_mask=inputs['attention_mask'],  # Add attention mask
             max_new_tokens=max_length,
             temperature=temperature,
             top_p=top_p,
+            do_sample=True,
+            pad_token_id=tokenizer.pad_token_id,
+            bos_token_id=tokenizer.bos_token_id,
+            eos_token_id=tokenizer.eos_token_id,
+            use_cache=True,  # Enable caching
+            return_dict_in_generate=True,  # Return as dict
+            output_scores=True  # Get scores
         )
     # Decode and return the response
+    generated_text = tokenizer.decode(outputs.sequences[0], skip_special_tokens=True)
+    return generated_text.split("Description: ")[-1].strip()
 def create_demo(model_id):
     # Load model and tokenizer