Spaces:

cochi1706
/

CodingAssistant

Sleeping

cochi1706 commited on Nov 15, 2025

Commit

db09be5

1 Parent(s): b0d2e27

Refactor text generation in chatbot application to utilize max_new_tokens for improved clarity and added truncation support. Removed unnecessary print statement for generated answer length.

Files changed (1) hide show

app.py CHANGED Viewed

@@ -75,15 +75,15 @@ def respond(
         add_generation_prompt=True
     )
-    # Sử dụng pipeline để generate text
     generated = text_generator(
         prompt,
-        max_length=len(tokenizer.encode(prompt)) + max_tokens,
         max_new_tokens=max_tokens,
         num_return_sequences=1,
         temperature=temperature,
         top_p=top_p,
         do_sample=True,
     )
     # Lấy câu trả lời từ kết quả
@@ -97,7 +97,6 @@ def respond(
     if not answer or len(answer.strip()) == 0:
         answer = "Xin lỗi, tôi không thể tạo phản hồi."
-    print(f"Generated answer length: {len(answer)}")
     return answer

         add_generation_prompt=True
     )
+    # Sử dụng pipeline để generate text - chỉ dùng max_new_tokens
     generated = text_generator(
         prompt,
         max_new_tokens=max_tokens,
         num_return_sequences=1,
         temperature=temperature,
         top_p=top_p,
         do_sample=True,
+        truncation=True,
     )
     # Lấy câu trả lời từ kết quả
     if not answer or len(answer.strip()) == 0:
         answer = "Xin lỗi, tôi không thể tạo phản hồi."
     return answer