LocalMate / tests /react_comparison_report.md
Cuong2004's picture
fix ReAct loop
0140f42
|
raw
history blame
2.68 kB

LocalMate Agent Test Report

Generated: 2025-12-18 00:47:10

Summary

Metric Single Mode ReAct Mode
Total Tests 1 1
Success 1 1
Avg Duration 16642ms 58227ms

Detailed Results

Test Case 2: Location-based search

Query: Nhà hàng gần bãi biển Mỹ Khê

Single Mode

  • Status: ✅ Success
  • Duration: 16642ms
  • Tools Used: find_nearby_places

Workflow:

  • Intent Analysis Tool: None | Results: 0
  • Tool Planning Tool: None | Results: 0
  • Execute find_nearby_places Tool: find_nearby_places | Results: 5
  • LLM Synthesis Tool: None | Results: 0

Response Preview:

Chào bạn! Dựa trên kết quả tìm kiếm mới nhất, mình đã tìm được những nhà hàng rất gần bãi biển Mỹ Khê cho bạn. Đặc biệt có một số địa điểm cực kỳ gần chỉ dưới 1km:

🍽️ Top nhà hàng gần biển Mỹ Khê...

ReAct Mode

  • Status: ✅ Success
  • Duration: 58227ms
  • Tools Used: get_location_coordinates, find_nearby_places
  • Steps: 5
  • Intent Detected: react_multi_step

Workflow Steps:

  • Step 1: Tôi cần tìm tọa độ của bãi biển Mỹ Khê để làm điểm... Tool: get_location_coordinates | Results: 0
  • Step 2: Tôi đã có tọa độ của bãi biển Mỹ Khê. Bây giờ tôi ... Tool: find_nearby_places | Results: 5
  • Step 3: Để giải quyết bài toán này, tôi sẽ phân tích các t... Tool: get_location_coordinates | Results: 0
  • Step 4: Tôi đã có tọa độ của bãi biển Mỹ Khê và đã tìm đượ... Tool: get_location_coordinates | Results: 0
  • Step 5: Tôi đã có tọa độ của bãi biển Mỹ Khê và đã tìm đượ... Tool: None | Results: 0

Response Preview:

Chào bạn! Mình đã tìm được những nhà hàng rất gần bãi biển Mỹ Khê cho bạn. Đây là top 3 địa điểm nổi bật nhất:

🍽️ Top 3 nhà hàng gần biển Mỹ Khê

1. Be Man Restaurant ⭐3.7 (0.75 km)

  • *Nhà ...

Analysis

Tool Usage Comparison

Test Single Mode Tools ReAct Mode Tools ReAct Steps
2 find_nearby_places get_location_coordinates, find_nearby_places 5

Key Observations

  1. Multi-tool queries: ReAct mode can chain multiple tools for complex queries
  2. Single-tool queries: Both modes perform similarly for simple queries
  3. Reasoning steps: ReAct mode shows explicit reasoning before each tool call