api-stt / app.py
tudeplom's picture
Update app.py
de1cb80 verified
raw
history blame
1.73 kB
import os
import wave
import json
import numpy as np
from flask import Flask, request, jsonify
from flask_cors import CORS
from vosk import Model, KaldiRecognizer
# Khởi tạo Flask app
app = Flask(__name__)
CORS(app)
# Đường dẫn model Vosk
MODEL_PATH = "model"
if not os.path.exists(MODEL_PATH):
raise Exception("Model Vosk không tìm thấy! Đảm bảo đã tải về model đúng thư mục.")
model = Model(MODEL_PATH)
def process_audio(file_path):
""" Xử lý file audio và trả về văn bản nhận dạng """
wf = wave.open(file_path, "rb")
if wf.getnchannels() != 1:
return {"error": "Chỉ hỗ trợ file WAV mono (1 kênh)"}
rec = KaldiRecognizer(model, wf.getframerate())
result_text = ""
while True:
data = wf.readframes(4000)
if len(data) == 0:
break
if rec.AcceptWaveform(data):
result_text += json.loads(rec.Result())["text"] + " "
wf.close()
os.remove(file_path) # Xóa file sau khi xử lý
return {"text": result_text.strip()}
@app.route("/")
def home():
return "✅ Vosk STT API đang chạy! Gửi file âm thanh đến /stt để nhận dạng."
@app.route("/stt", methods=["POST"])
def stt():
if "audio" not in request.files:
return jsonify({"error": "Không tìm thấy file audio!"}), 400
audio_file = request.files["audio"]
if not audio_file.filename.endswith(".wav"):
return jsonify({"error": "Chỉ hỗ trợ file WAV!"}), 400
file_path = "temp.wav"
audio_file.save(file_path)
result = process_audio(file_path)
return jsonify(result)
if __name__ == "__main__":
app.run(host="0.0.0.0", port=7860, debug=True)