tudeplom commited on
Commit
b0d49d5
·
verified ·
1 Parent(s): 2aa1fa1

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +33 -24
app.py CHANGED
@@ -3,12 +3,16 @@ import json
3
  import numpy as np
4
  from vosk import Model, KaldiRecognizer
5
  from flask import Flask, request, jsonify
 
6
 
7
  # Cấu hình Flask
8
  app = Flask(__name__)
9
 
 
 
 
10
  # Kiểm tra và load model Vosk
11
- MODEL_PATH = "model/vosk-model" # Thay thế với đường dẫn đến mô hình của bạn
12
  if not os.path.exists(MODEL_PATH):
13
  raise Exception("❌ Model Vosk không tìm thấy!")
14
  print("✅ Đang tải model Vosk...")
@@ -18,31 +22,36 @@ model = Model(MODEL_PATH)
18
  rec = KaldiRecognizer(model, 16000)
19
 
20
  # API nhận dữ liệu âm thanh và trả kết quả nhận diện giọng nói
21
- @app.route('/stt', methods=['POST'])
22
- def handle_audio():
23
- # Kiểm tra xem có tệp âm thanh không
24
- if 'file' not in request.files:
25
- return jsonify({"error": "Không có tệp âm thanh trong yêu cầu."}), 400
26
-
27
- audio_file = request.files['file']
28
-
29
- # Đọc dữ liệu âm thanh từ tệp
30
- audio_data = audio_file.read()
31
- print(f"📩 Nhận dữ liệu âm thanh: {len(audio_data)} bytes")
32
-
33
- # Chuyển đổi dữ liệu âm thanh thành numpy array (16-bit mono)
34
- audio_np = np.frombuffer(audio_data, dtype=np.int16)
 
 
 
 
35
 
36
- # Nhận diện giọng nói
37
- if rec.AcceptWaveform(audio_np.tobytes()):
38
- result = json.loads(rec.Result())
39
- text = result.get("text", "")
40
- print(f"📤 Kết quả nhận diện: {text}")
41
- return jsonify({"text": text}) # Gửi kết quả nhận diện về client
42
- else:
43
- # Nếu không có kết quả nhận diện hoặc dữ liệu chưa đủ để nhận diện
44
- return jsonify({"text": ""}) # Trả về chuỗi rỗng nếu không có kết quả
45
 
46
  # Chạy Flask server
47
  if __name__ == "__main__":
 
48
  app.run(host="0.0.0.0", port=5000, debug=True)
 
3
  import numpy as np
4
  from vosk import Model, KaldiRecognizer
5
  from flask import Flask, request, jsonify
6
+ from flask_restplus import Api, Resource, reqparse
7
 
8
  # Cấu hình Flask
9
  app = Flask(__name__)
10
 
11
+ # Tạo đối tượng API với Swagger documentation
12
+ api = Api(app, version='1.0', title='Vosk STT API', description='API cho nhận diện giọng nói sử dụng Vosk')
13
+
14
  # Kiểm tra và load model Vosk
15
+ MODEL_PATH = "model/vosk-model" # Thay thế bằng đường dẫn đến mô hình Vosk của bạn
16
  if not os.path.exists(MODEL_PATH):
17
  raise Exception("❌ Model Vosk không tìm thấy!")
18
  print("✅ Đang tải model Vosk...")
 
22
  rec = KaldiRecognizer(model, 16000)
23
 
24
  # API nhận dữ liệu âm thanh và trả kết quả nhận diện giọng nói
25
+ @api.route('/stt')
26
+ class SpeechToText(Resource):
27
+ def post(self):
28
+ """
29
+ Nhận dữ liệu âm thanh trả về kết quả nhận diện giọng nói.
30
+ """
31
+ # Kiểm tra xem có tệp âm thanh không
32
+ if 'file' not in request.files:
33
+ return jsonify({"error": "Không tệp âm thanh trong yêu cầu."}), 400
34
+
35
+ audio_file = request.files['file']
36
+
37
+ # Đọc dữ liệu âm thanh từ tệp
38
+ audio_data = audio_file.read()
39
+ print(f"📩 Nhận dữ liệu âm thanh: {len(audio_data)} bytes")
40
+
41
+ # Chuyển đổi dữ liệu âm thanh thành numpy array (16-bit mono)
42
+ audio_np = np.frombuffer(audio_data, dtype=np.int16)
43
 
44
+ # Nhận diện giọng nói
45
+ if rec.AcceptWaveform(audio_np.tobytes()):
46
+ result = json.loads(rec.Result())
47
+ text = result.get("text", "")
48
+ print(f"📤 Kết quả nhận diện: {text}")
49
+ return jsonify({"text": text}) # Gửi kết quả nhận diện về client
50
+ else:
51
+ # Nếu không có kết quả nhận diện hoặc dữ liệu chưa đủ để nhận diện
52
+ return jsonify({"text": ""}) # Trả về chuỗi rỗng nếu không có kết quả
53
 
54
  # Chạy Flask server
55
  if __name__ == "__main__":
56
+ print("🚀 API Flask đang chạy tại http://localhost:5000")
57
  app.run(host="0.0.0.0", port=5000, debug=True)