lovebird25 / UI_TESTING.md
Paul
update code
6102083

A newer version of the Gradio SDK is available: 6.13.0

Upgrade

UI Testing Guide

Sau khi deploy thành công lên Hugging Face Spaces, bạn có thể test trực tiếp trên UI.

🚀 Truy cập UI

  1. Vào URL của Space: https://your-space-name.hf.space
  2. UI sẽ hiển thị với 3 tabs: Intent, Tone, và Reply Suggestion

📝 Cách Test trên UI

Tab 1: Intent Classification

  1. Chọn tab "Intent"
  2. Input có sẵn default value hoặc click vào Examples để chọn conversation mẫu
  3. Click "Predict Intent" hoặc nhấn Enter
  4. Xem kết quả trong JSON format với các intent được sắp xếp theo score

Example input:

Tối nay anh có lịch đột xuất. ||| Thế mai được không?

Tab 2: Tone Detection

  1. Chọn tab "Tone"
  2. Input có sẵn default value hoặc click vào Examples
  3. Click "Predict Tone" hoặc nhấn Enter
  4. Xem kết quả trong JSON format với các tone được sắp xếp theo score

Example input:

Em dễ thương quá. ||| Cảm ơn anh nha

Tab 3: Reply Suggestion (Main Feature)

  1. Chọn tab "Reply Suggestion"
  2. Input conversation theo format: "male message ||| female message"
    • Hoặc click vào Examples để chọn conversation mẫu
    • Hoặc dùng default value có sẵn
  3. Click "Generate Reply Suggestion" hoặc nhấn Enter
  4. Xem kết quả:
    • Suggested Reply: Câu trả lời được generate
    • Detailed Result: JSON với đầy đủ thông tin (intent, tone, scores, model type)

Example input:

Tối nay anh có lịch đột xuất. ||| Thế mai được không?

Expected output:

  • Suggested Reply: "Mai được nha, em sắp xếp lại lịch cho."
  • Detailed Result: Intent, tone, scores, model type (finetuned/base)

🎯 Quick Test Examples

Test Case 1: Invite/Schedule

Input: Tối nay anh có lịch đột xuất. ||| Thế mai được không?
Expected Intent: invite_propose hoặc rapport
Expected Tone: warm hoặc plain

Test Case 2: Flirt/Compliment

Input: Em dễ thương quá. ||| Cảm ơn anh nha
Expected Intent: flirt_charm
Expected Tone: warm hoặc playful

Test Case 3: Small Talk

Input: Anh đang làm gì đấy? ||| Đang làm việc
Expected Intent: rapport hoặc smalltalk
Expected Tone: plain hoặc curious

✅ Checklist Test

  • Intent tab hiển thị và chạy được
  • Tone tab hiển thị và chạy được
  • Reply Suggestion tab hiển thị và chạy được
  • Examples click được và load vào input
  • Default values có sẵn trong input boxes
  • Enter key trigger generate
  • Output hiển thị đúng format
  • Generated reply hợp lý và contextually appropriate
  • Detailed result JSON có đầy đủ thông tin
  • Model type được hiển thị (finetuned/base)

🔍 Kiểm tra kết quả

Intent/Tone Response:

  • ✅ Có ít nhất 1 result với score > 0
  • ✅ Results được sắp xếp theo score giảm dần
  • ✅ Labels không có prefix partner_ (đã được clean)

Reply Suggestion Response:

  • ✅ Có suggestion text (không rỗng)
  • ✅ Suggestion ≤ 25 từ
  • ✅ Intent và tone đã được detect
  • ✅ Model type được hiển thị
  • ✅ Suggestion phù hợp với context

🐛 Troubleshooting

UI không load?

  • Check Space đã deploy xong chưa
  • Xem Logs tab trong Space

Examples không hoạt động?

  • Click vào example sẽ tự động load vào input box
  • Sau đó click button để generate

Không có output?

  • Check format input: "male ||| female" (có dấu |||)
  • Xem Logs tab để check lỗi
  • App sẽ tự động fallback nếu có lỗi

Generated reply không tốt?

  • Check xem model đã fine-tune xong chưa (xem Logs)
  • Model type trong output sẽ cho biết đang dùng model nào
  • Fine-tuned model sẽ cho kết quả tốt hơn

📸 Screenshot Tips

Khi test, có thể screenshot:

  1. Input conversation
  2. Generated reply
  3. Detailed result JSON
  4. Model type indicator

Để document và review sau.