# Thai Validation Readiness > สถานะ v0.19.0: Clinical Readiness Enhancements + Thai Validation Readiness Pack > เอกสารนี้ใช้กำหนดขอบเขตที่ปลอดภัยของ prototype และสิ่งที่ต้องทำก่อนนำไปใช้กับเด็กไทยจริง ## A. Current Status โมเดลปัจจุบันถูก train/evaluate จาก public corpora ภาษาอังกฤษในรูปแบบ CHAT/TalkBank/ASDBank เป็นหลัก และใช้เพื่อสาธิต workflow ของ AI-assisted screening support, risk estimate, decision support และ progress tracking ข้อจำกัดสำคัญ: - ยังไม่ได้ validated กับข้อมูลเด็กไทย - ยังไม่มี Thai child clinical dataset ในโปรเจกต์นี้ - ยังไม่ควรใช้เป็นเครื่องมือวินิจฉัย ASD - ยังไม่พร้อมสำหรับ clinical deployment - ผลลัพธ์ทุกแบบต้องอ่านร่วมกับผู้เชี่ยวชาญแบบ human-in-the-loop ## B. What Is Already Ready สิ่งที่ prototype เตรียมไว้แล้ว: - audio/CHAT pipeline สำหรับแปลง audio เป็น `.cha` และสกัด features - 13-feature schema ที่ใช้ร่วมกันระหว่าง model, dashboard และ artifacts - Model Trust dashboard สำหรับ threshold, calibration, fairness audit, decision curve, subgroup และ leave-one-corpus-out review - uncertainty band เพื่อไม่บังคับผลลัพธ์ binary เมื่อโมเดลไม่มั่นใจ - XAI/explainability เพื่อดู feature contribution ของแต่ละ prediction - progress tracking จาก longitudinal sessions - parent-safe wording และ no-data-retention framing ใน public demo - AI Transcript Reviewer สำหรับตรวจ `.cha`, Thai language tag readiness และ ASR confidence ก่อน feature extraction - Therapist Progress Report สำหรับสรุป trend หลาย session เป็น Markdown/PDF โดยไม่สรุปผลทางการแพทย์แทนผู้เชี่ยวชาญ - AI Speech Therapist Assistant สำหรับสรุป transcript quality, speech-language patterns, screening risk estimates และ progress trends ให้ therapist review - Clinician Workflow Simulator สำหรับสาธิต transcript QA, screening pattern interpretation และ progress case brief ใน workflow เดียว - fairness/calibration CSV exports สำหรับ ECE, Brier score, group TPR/FPR difference และ demographic parity difference บนข้อมูลเดิม ## C. What Is Still Required For Real Thai Deployment ก่อนใช้งานจริงกับเด็กไทย ต้องมีอย่างน้อย: - Thai child speech/audio dataset - expert-confirmed labels จากนักบำบัดหรือแพทย์ผู้เชี่ยวชาญ - metadata ด้าน age, sex, language background และบริบทการบันทึก - gold transcript หรือ human-reviewed transcript - ASR quality evaluation สำหรับเสียงเด็กไทย - feature drift analysis ระหว่าง gold transcript และ ASR transcript - external validation แยกจากข้อมูลที่ใช้พัฒนา - calibration สำหรับ population ไทย - subgroup performance แยกตามอายุ เพศ ภาษา และกลุ่มพัฒนาการ - fairness and calibration monitoring หลัง recalibration กับข้อมูลไทย - IRB/consent/privacy workflow ที่ชัดเจน - clinician workflow testing ก่อนตัดสินใจ deploy ## D. Minimal Future Pilot Design pilot ระยะ feasibility ควรเริ่มขนาดเล็กและเน้นตรวจ workflow มากกว่าการ claim clinical accuracy: - 30-50 cases เป็น feasibility pilot - ถ้าเป็นไปได้ควรมีกลุ่ม ASD / TD / developmental delay - audio 5-10 นาทีต่อเด็กหนึ่งคน - transcript ต้องผ่าน human review - เก็บ metadata อายุ เพศ ภาษาในบ้าน และบริบท session - เปรียบเทียบ gold transcript features vs ASR transcript features - เปรียบเทียบ original English-trained model vs recalibrated model - เปรียบเทียบ screening output กับ expert assessment - รายงานผลเป็น feasibility, data quality, feature drift และ calibration readiness ไม่ใช่ Thai diagnostic validation ## E. Safe Claim Wording ใช้คำเหล่านี้: - screening support - risk estimate - progress tracking - decision support - requires expert assessment - human-in-the-loop - external validation required หลีกเลี่ยง wording ที่สื่อว่า: - ระบบสรุปผลทางการแพทย์ได้เอง - ระบบยืนยัน ASD ได้ - ระบบผ่าน validation กับเด็กไทยแล้ว - ระบบแทน clinician ได้ - ระบบพร้อมใช้งานจริงทางคลินิกแล้ว ถ้ากล่าวถึง parent screening tools ภายนอก ให้ระบุว่าเป็นเครื่องมือ established ภายนอก และต้องตรวจ permission/licensing ก่อนทำ electronic หรือ commercial use ห้าม copy คำถาม M-CHAT-R/F เข้าโปรเจกต์นี้ ## AI Speech Therapist Assistant Assistant layer นี้ทำหน้าที่ช่วยนักบำบัดด้านภาษาและการสื่อสารอ่านผลจากระบบเดิมอย่างปลอดภัย: - สรุป Transcript QA ว่า transcript ใช้ต่อได้หรือควรให้คนตรวจเพิ่ม - อธิบาย speech-language pattern จาก 13-feature schema โดยใช้ wording แบบ descriptive - สรุป screening risk estimate เมื่อมี probability จากโมเดล - สรุป progress trend จากหลาย session และสร้าง therapist-facing case brief Assistant นี้เป็น decision support เท่านั้น ต้องมี human-in-the-loop และยังต้องใช้ร่วมกับ expert assessment เสมอ ในบริบทไทยยังต้องมี Thai validation dataset, external validation, calibration และ subgroup audit ก่อนใช้งานจริง ## v0.19.0 Readiness Enhancements v0.19.0 เพิ่มชั้นตรวจสอบที่ทำได้โดยไม่ต้องใช้ Thai child data: - ตรวจ Thai characters ใน utterance และเตือนเมื่อ `@Languages` ยังไม่มี `tha` - อ่านค่า ASR/diarization confidence จาก transcript metadata หากมี และเตือนเมื่อ average confidence ต่ำกว่า 0.6 - สร้าง fairness/calibration audit จาก `binary_oof_predictions.csv` เพื่อดู ECE, Brier score, TPR/FPR difference และ demographic parity difference - เพิ่ม PDF export สำหรับ therapist progress report - เพิ่ม Clinician Workflow Simulator เพื่อทดลอง workflow แบบ human-in-the-loop ข้อควรระวัง: fairness/calibration audit ในรอบนี้ใช้ English-speaking public corpora เป็นหลัก จึงเป็น governance readiness signal ไม่ใช่ Thai clinical validation result ## F. No Thai Data Yet: What This Demo Proves ถึงแม้ยังไม่มี Thai clinical validation data, demo นี้พิสูจน์ได้ว่า: - technical workflow เป็นไปได้ ตั้งแต่ audio/CHAT ไปจนถึง features, risk estimate และ report - model governance structure ถูกเตรียมไว้ เช่น model card, uncertainty band, calibration view, fairness audit และ subgroup audit framework - reporting and safety layer มีแล้ว เช่น parent-safe wording, AI Transcript Reviewer, ASR confidence warning และ Thai-safe therapist report - therapist-facing explanation layer มีแล้วผ่าน AI Speech Therapist Assistant - ระบบสามารถรับ Thai validation data ในอนาคตผ่าน schema และ workflow เดิม แต่ demo นี้ยังไม่พิสูจน์ Thai clinical accuracy และไม่ควรใช้เพื่อบอกว่าโมเดลแม่นยำสำหรับเด็กไทย จนกว่าจะมี external validation, calibration และ expert-reviewed Thai dataset ที่เหมาะสม