Spaces:

NV9523
/

agent_support

Runtime error

NV9523 commited on Oct 2, 2025

Commit

079004b

verified ·

1 Parent(s): 6bc7f9b

Update generator.py

Files changed (1) hide show

generator.py CHANGED Viewed

@@ -1,27 +1,31 @@
 import torch
 from transformers import TextIteratorStreamer
 from threading import Thread
-from model_loader import model, tokenizer
 # Prompt ngầm
 SYSTEM_PROMPT = "Bạn là chatbot chuyên tóm tắt và tổng hợp ý chính từ nội dung người dùng đưa ra."
 def generate_text(prompt, max_new_tokens=1024):
     inputs = tokenizer(SYSTEM_PROMPT + "\nUser: " + prompt + "\nBot:", return_tensors="pt").to("cpu")
     streamer = TextIteratorStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True)
     generation_kwargs = dict(
         **inputs,
         max_new_tokens=max_new_tokens,
-        do_sample=False,   # Greedy decoding để nhanh hơn
-        temperature=0.7,
-        top_p=0.9,
         streamer=streamer
     )
     thread = Thread(target=model.generate, kwargs=generation_kwargs)
     thread.start()
-    # Trả về stream kết quả
     for new_text in streamer:
         yield new_text

 import torch
 from transformers import TextIteratorStreamer
 from threading import Thread
+from model_loader import load_model
+# Load model & tokenizer từ file model_loader
+model, tokenizer = load_model()
 # Prompt ngầm
 SYSTEM_PROMPT = "Bạn là chatbot chuyên tóm tắt và tổng hợp ý chính từ nội dung người dùng đưa ra."
 def generate_text(prompt, max_new_tokens=1024):
+    # Ghép prompt ngầm + user input
     inputs = tokenizer(SYSTEM_PROMPT + "\nUser: " + prompt + "\nBot:", return_tensors="pt").to("cpu")
+    # Tạo streamer để stream output
     streamer = TextIteratorStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True)
     generation_kwargs = dict(
         **inputs,
         max_new_tokens=max_new_tokens,
+        do_sample=False,  # Greedy decoding để nhanh hơn
         streamer=streamer
     )
+    # Chạy model.generate trong thread
     thread = Thread(target=model.generate, kwargs=generation_kwargs)
     thread.start()
+    # Stream text trả ra dần
     for new_text in streamer:
         yield new_text