Spaces:

hamxaameer
/

OutfitOrbit-Chatbot-Assistant

Running

hamxaameer commited on 5 days ago

Commit

7980cb3

verified ·

1 Parent(s): 25c4058

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -123,12 +123,12 @@ def initialize_llm():
         model.eval()
         # Create pipeline for generation
         logger.info("   Creating text-generation pipeline...")
         llm_client = pipeline(
             "text-generation",
             model=model,
             tokenizer=tokenizer,
-            device=0 if device == "cuda" else -1,
             max_new_tokens=512,
             pad_token_id=tokenizer.eos_token_id
         )

         model.eval()
         # Create pipeline for generation
+        # NOTE: When using accelerate/quantization, do NOT specify device parameter
         logger.info("   Creating text-generation pipeline...")
         llm_client = pipeline(
             "text-generation",
             model=model,
             tokenizer=tokenizer,
             max_new_tokens=512,
             pad_token_id=tokenizer.eos_token_id
         )