Spaces:

ammaraak
/

todo-api

Configuration error

App Files Files Community

todo-api / PHASE_III_SELF_TEST.md

Nanny7

feat: latest changes and deployment documentation

de4dcc8 23 days ago

preview code

raw

history blame contribute delete

3.41 kB

Phase III Self-Test & Auto-Fix Report

AI Todo Agent - Comprehensive Testing

🧪 Test Environment:

Backend: https://ammaraak-todo-app-backend.hf.space
Frontend: https://frontend-cpmn4soug-ammar-ahmed-khans-projects-6b1515e7.vercel.app
Test User: autotest@example.com
JWT Token: eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJzdWIiOiI3MjBhMDE4YS03ZTAwLTRjN2QtYjMyOS0xMjRmOGRmZjNlMTkiLCJleHAiOjE3Njk5NzcxOTV9.vZDod2BUcCEI9a6p0wKLR6x8fx6eAdhIJVZLK2KIrr0

📋 Test Results:

✅ Test 1: User Signup

{
  "step": "User Registration",
  "status": "PASS",
  "response": "User created successfully with JWT token",
  "user_id": "720a018a-7e00-4c7d-b329-124f8dff3e19",
  "error": null,
  "fix_applied": "no"
}

🔍 Test 2: AI Chat - Create Task (English)

Request:

POST /api/chat
{
  "message": "Add a task to buy groceries",
  "conversation_id": null
}

Expected:

AI understands English
Invokes create_task MCP tool
Returns success in English
Saves conversation to DB

🔍 Test 3: AI Chat - Create Task (Urdu)

Request:

POST /api/chat
{
  "message": "داؤن لوگ کو لائے",
  "conversation_id": "<previous>"
}

Expected:

AI detects Urdu language
Invokes create_task with Urdu text
Returns response in Urdu
Links to same conversation

🔍 Test 4: List Tasks

Request:

POST /api/chat
{
  "message": "Show my tasks",
  "conversation_id": "<previous>"
}

Expected:

Invokes list_tasks MCP tool
Returns all user's tasks
Response in matching language

🔍 Test 5: Complete Task

Request:

POST /api/chat
{
  "message": "Mark task 1 as done",
  "conversation_id": "<previous>"
}

Expected:

Invokes update_task with status=completed
Confirms completion
Task marked completed in DB

🔍 Test 6: JWT Security - Cross-User Access

Request:

POST /api/todos
Headers: Authorization: Bearer <token_user_a>
Get todos for user_b

Expected:

✅ Returns only user_a's todos
❌ Cannot access user_b's data

🔍 Test 7: Memory Persistence

Action:

Start conversation
Create 3 tasks
Get new conversation_id
Resume with same conversation_id

Expected:

✅ Conversation history loaded
✅ Previous context maintained
✅ Can reference earlier tasks

🔍 Test 8: Language Matching

Action:

User sends English message
AI responds in English
User sends Urdu message
AI responds in Urdu

Expected:

✅ Response language matches input
✅ No language mixing

🔍 Test 9: MCP Tool Enforcement

Verify:

AI NEVER reasons about tools
ONLY invokes MCP tools
Tools execute atomically

Expected:

✅ Qwen prompt enforces tool usage
✅ No direct SQL/manipulation by AI

🔍 Test 10: Error Handling

Tests:

Invalid JWT
Expired JWT
Malformed task data
Non-existent task ID

Expected:

✅ Graceful error messages
✅ No server crashes
✅ Proper HTTP status codes

📊 Summary (In Progress):

Total Tests: 10 Passed: 1 (✅ Signup) Failed: 0 Pending: 9 Fixes Applied: 0

⏳ Testing Status:

Currently running comprehensive Phase III tests... Backend: ✅ RUNNING Frontend: ✅ CONNECTED Database: ✅ CONNECTED

Next: Running AI chat tests...