transcript_ai / README.md
Janiusx
Specify app_file in README metadata
44c3653
|
Raw
History Blame Contribute Delete
5.16 kB
metadata
title: Typhoon Video Transcriber
emoji: 🌀
colorFrom: indigo
colorTo: purple
sdk: static
app_file: index.html
pinned: false

Typhoon Video Transcriber

แอปพลิเคชันถอดความวิดีโอ (Speech-to-Text) อัจฉริยะในเบราว์เซอร์ ทำงานร่วมกับโมเดลภาษาประมวลผลเสียงภาษาไทยประสิทธิภาพสูงของ OpenTyphoon ASR API (SCB 10X)

คุณสมบัติเด่น

  1. แยกเสียงในบราว์เซอร์ (Client-side Extraction): ถอดรหัสและแยกสัญญาณเสียงออกจากไฟล์วิดีโอโดยตรงด้วย Web Audio API โดยไม่ต้องอัปโหลดวิดีโอทั้งไฟล์ขึ้นเซิร์ฟเวอร์ส่วนกลาง
  2. แปลงไฟล์เสียงแบบอะซิงโครนัส (Web Worker WAV Encoder): แปลงเสียงเป็นรูปแบบ 16-bit Mono WAV 16kHz ผ่าน Web Worker เบื้องหลัง เพื่อคงความลื่นไหลของหน้าจอ UI แม้ไฟล์วิดีโอมีขนาดใหญ่
  3. อินเตอร์เฟสอินเตอร์แอคทีฟ (Interactive Timeline Sync): ไฮไลต์ประโยคตามวิดีโอที่กำลังเล่นอยู่แบบ Real-time และสามารถคลิกที่ประโยคเพื่อสั่งการให้ตัวเล่นวิดีโอข้ามไปยังส่วนนั้น ๆ ได้ทันที
  4. ค้นหาข้อความ (Text Search): ระบบค้นหาคำและประโยคพร้อมไฮไลต์คำพ้องแบบทันที
  5. ฟังก์ชันการ Export: ดาวน์โหลดสคริปต์ที่ได้ออกมาเป็นไฟล์ Text (.txt), SRT Subtitles (.srt), VTT Subtitles (.vtt) และ JSON (.json)
  6. API Key Security & Default: บันทึกข้อมูลคีย์ใน localStorage ของเบราว์เซอร์ของคุณ และเชื่อมต่อโดยตรงกับ OpenTyphoon API เท่านั้น ปราศจากการดักจับหรือเก็บข้อมูลผ่านเซิร์ฟเวอร์ภายนอก

ขั้นตอนการติดตั้งและรันโปรแกรม

แอปพลิเคชันนี้ออกแบบมาให้ไม่มี Dependency ภายนอกใด ๆ สามารถเริ่มทำงานได้ทันทีด้วย Node.js:

  1. เปิด Terminal หรือ PowerShell ในโฟลเดอร์นี้
  2. รันคำสั่งเริ่มเซิร์ฟเวอร์:
    node server.js
    
  3. เปิดเว็บเบราว์เซอร์แล้วเข้าใช้งานที่ลิงก์ด้านล่าง: http://localhost:3000

การเตรียมคีย์ OpenTyphoon API

  • ระบบได้รับการตั้งค่าเริ่มต้นด้วย API Key ของคุณที่ให้มาเรียบร้อยแล้ว
  • หากต้องการเปลี่ยนหรืออัปเดต API Key:
    1. คลิกปุ่ม "ตั้งค่า API" ที่แถบเมนูด้านขวาบน
    2. ใส่ API Key ของคุณในช่องกรอกข้อมูลแล้วกดบันทึก

ขั้นตอนการใช้งาน

  1. อัปโหลดวิดีโอ: ลากไฟล์วิดีโอของคุณมาวางที่กล่องอัปโหลด หรือกดเพื่อเลือกไฟล์จากเครื่อง
  2. เริ่มต้นถอดสคริปต์:
    • กดปุ่ม "ถอดความด้วย Typhoon AI" เพื่อทำการถอดเสียงจริง
    • หรือกดปุ่ม "ทดลองใช้ระบบพรีวิว (Demo Mode)" หากต้องการทดสอบระบบนำทาง ข้อความไฮไลต์ และการ Export โดยไม่ตัดโควต้า API จริง
  3. ดาวน์โหลดข้อมูล: คลิกที่ปุ่ม "ดาวน์โหลด (Export)" และเลือกฟอร์แมตไฟล์ที่ต้องการบันทึกเก็บไว้ใช้งาน