Spaces:

tudeplom
/

api-stt

Sleeping

App Files Files Community

tudeplom commited on Mar 28

Commit

17fd256

verified ·

1 Parent(s): d1806f3

Update app.py

Browse files

Files changed (1) hide show

app.py +27 -36

app.py CHANGED Viewed

@@ -1,50 +1,41 @@
 import os
 import json
-from fastapi import FastAPI, UploadFile, File, HTTPException
-from fastapi.middleware.cors import CORSMiddleware
-from vosk import Model, KaldiRecognizer
 import wave
-# Kiểm tra model
 MODEL_PATH = "model/vosk-model"
 if not os.path.exists(MODEL_PATH):
     raise Exception("❌ Model Vosk không tìm thấy!")
 print("✅ Đang tải model Vosk...")
 model = Model(MODEL_PATH)
-# Tạo app FastAPI
-app = FastAPI()
-# Cấu hình CORS để hỗ trợ API
-app.add_middleware(
-    CORSMiddleware,
-    allow_origins=["*"],  # Cho phép tất cả nguồn
-    allow_credentials=True,
-    allow_methods=["*"],
-    allow_headers=["*"],
-)
-@app.post("/stt")
-async def speech_to_text(audio: UploadFile = File(...)):
-    """Nhận file âm thanh và trả về văn bản."""
-    try:
-        with wave.open(audio.file, "rb") as wf:
-            if wf.getnchannels() != 1 or wf.getsampwidth() != 2 or wf.getframerate() != 16000:
-                raise HTTPException(status_code=400, detail="❌ File âm thanh phải là WAV mono 16kHz 16-bit.")
-            rec = KaldiRecognizer(model, 16000)
-            while True:
-                data = wf.readframes(4000)
-                if len(data) == 0:
-                    break
-                rec.AcceptWaveform(data)
-            result = json.loads(rec.Result())
-            return {"text": result.get("text", "")}
-    except Exception as e:
-        raise HTTPException(status_code=500, detail=f"❌ Lỗi xử lý âm thanh: {str(e)}")
 if __name__ == "__main__":
-    import uvicorn
-    uvicorn.run(app, host="0.0.0.0", port=7860)

 import os
 import json
 import wave
+import numpy as np
+import soundfile as sf
+from vosk import Model, KaldiRecognizer
+from flask import Flask
+from flask_socketio import SocketIO, emit
+# Cấu hình Flask & WebSocket
+app = Flask(__name__)
+socketio = SocketIO(app, cors_allowed_origins="*")
+# Kiểm tra và load model Vosk
 MODEL_PATH = "model/vosk-model"
 if not os.path.exists(MODEL_PATH):
     raise Exception("❌ Model Vosk không tìm thấy!")
 print("✅ Đang tải model Vosk...")
 model = Model(MODEL_PATH)
+# Tạo bộ nhận diện giọng nói
+rec = KaldiRecognizer(model, 16000)
+# Xử lý dữ liệu âm thanh nhận từ client
+@socketio.on("audio_chunk")
+def handle_audio(audio_data):
+    print(f"📩 Nhận dữ liệu âm thanh: {len(audio_data)} bytes")
+    # Chuyển đổi dữ liệu âm thanh thành numpy array
+    audio_np = np.frombuffer(audio_data, dtype=np.int16)
+    # Nhận diện giọng nói
+    if rec.AcceptWaveform(audio_np.tobytes()):
+        result = json.loads(rec.Result())
+        text = result.get("text", "")
+        print(f"📤 Kết quả nhận diện: {text}")
+        emit("stt_result", {"text": text})  # Gửi kết quả về client theo thời gian thực
+# Chạy Flask server
 if __name__ == "__main__":
+    socketio.run(app, host="0.0.0.0", port=5000, debug=True)