import gradio as gr import numpy as np import librosa import librosa.display import matplotlib matplotlib.use("Agg") import matplotlib.pyplot as plt import pywt import os import json import random import tempfile from PIL import Image from tensorflow.keras.models import load_model from sklearn.preprocessing import StandardScaler SAMPLE_RATE = 22050 MAX_DURATION = 5 TIME_STEPS = 20 USE_DENOISE = True model = load_model("Huan_luyen_6_huhong.h5") def load_scaler_from_json(filepath): with open(filepath, 'r') as f: data = json.load(f) scaler = StandardScaler() scaler.mean_ = np.array(data['mean_']) scaler.scale_ = np.array(data['scale_']) scaler.n_features_in_ = len(scaler.mean_) return scaler scaler = load_scaler_from_json("scaler.json") with open("label_map.json", "r") as f: label_map = json.load(f) index_to_label = {v: k for k, v in label_map.items()} def denoise_wavelet(signal, wavelet='db8', level=4): coeffs = pywt.wavedec(signal, wavelet, level=level) sigma = np.median(np.abs(coeffs[-1])) / 0.6745 uthresh = sigma * np.sqrt(2 * np.log(len(signal))) coeffs_denoised = [pywt.threshold(c, value=uthresh, mode='soft') for c in coeffs] return pywt.waverec(coeffs_denoised, wavelet) def create_sequences(mfcc, time_steps=20): return np.array([mfcc[i:i+time_steps] for i in range(len(mfcc) - time_steps)]) def cat_2s_ngau_nhien(y, sr, duration=2): if len(y) < duration * sr: return y start = random.randint(0, len(y) - duration * sr) return y[start:start + duration * sr] def tao_anh_mel(file_path): y, sr = librosa.load(file_path, sr=None, mono=True) y = cat_2s_ngau_nhien(y, sr) S = librosa.feature.melspectrogram(y=y, sr=sr, n_mels=128) S_dB = librosa.power_to_db(S, ref=np.max) fig, ax = plt.subplots(figsize=(6, 3)) img = librosa.display.specshow(S_dB, sr=sr, x_axis='time', y_axis='mel', ax=ax, cmap='magma') ax.set_title("Phổ tần Mel", fontsize=10) fig.colorbar(img, ax=ax) plt.tight_layout() path = os.path.join(tempfile.gettempdir(), "mel.png") fig.savefig(path, dpi=80) plt.close() return Image.open(path) def tao_wavelet_transform(file_path): y, sr = librosa.load(file_path, sr=None, mono=True) y = cat_2s_ngau_nhien(y, sr) coef, _ = pywt.cwt(y, scales=np.arange(1, 128), wavelet='morl', sampling_period=1/sr) fig, ax = plt.subplots(figsize=(6, 3)) ax.imshow(np.abs(coef), extent=[0, len(y)/sr, 1, 128], cmap='plasma', aspect='auto', origin='lower') ax.set_title("Phổ sóng con (Wavelet)") ax.set_xlabel("Thời gian (s)") ax.set_ylabel("Tần số (scale)") plt.tight_layout() path = os.path.join(tempfile.gettempdir(), "wavelet.png") fig.savefig(path, dpi=80) plt.close() return Image.open(path) def tao_waveform_image(file_path): y, sr = librosa.load(file_path, sr=None, mono=True) y = cat_2s_ngau_nhien(y, sr) fig, ax = plt.subplots(figsize=(6, 2.5)) librosa.display.waveshow(y, sr=sr, ax=ax, color='steelblue') ax.set_title("Biểu đồ Sóng Âm (Waveform)") ax.set_xlabel("Thời gian (s)") ax.set_ylabel("Biên độ") plt.tight_layout() path = os.path.join(tempfile.gettempdir(), "waveform.png") fig.savefig(path, dpi=80) plt.close() return Image.open(path) def bao_san_sang(file_path): if not file_path: return "" return "✅ Âm thanh đã sẵn sàng. Nhấn kiểm tra ngay!" def sinh_anh(file_path): if not file_path: return None, None, None mel_img = tao_anh_mel(file_path) wavelet_img = tao_wavelet_transform(file_path) waveform_img = tao_waveform_image(file_path) return mel_img, wavelet_img, waveform_img def du_doan(file_path): if not file_path: return "❌ Chưa có âm thanh." signal, sr = librosa.load(file_path, sr=SAMPLE_RATE, mono=True) signal, _ = librosa.effects.trim(signal) signal = librosa.util.fix_length(signal, size=SAMPLE_RATE * MAX_DURATION) if USE_DENOISE: signal = denoise_wavelet(signal) mfcc = librosa.feature.mfcc(y=signal, sr=sr, n_mfcc=13).T mfcc = scaler.transform(mfcc) X_input = create_sequences(mfcc, time_steps=TIME_STEPS) if len(X_input) == 0: return "⚠️ Âm thanh quá ngắn để phân tích." y_preds = model.predict(X_input, verbose=0) avg_probs = np.mean(y_preds, axis=0) pred_index = np.argmax(avg_probs) confidence = avg_probs[pred_index] * 100 pred_label = "HƯ HỎNG KHÁC" if confidence < 60 else index_to_label[pred_index] html = f"""

📋 Kết Quả:
✅ Tình trạng: {pred_label.upper()}
📊 Độ tin cậy: {confidence:.2f}%

Xác suất từng lớp:
""" for i, prob in enumerate(avg_probs): html += f"- {index_to_label[i]}: {prob*100:.1f}%
" html += "

" return html def reset_output(): return "", None, None, None, "" def chon_file(f1, f2): return f1 if f1 else f2 with gr.Blocks(css=""" #check-btn { background: #007acc; color: white; height: 48px; font-size: 16px; font-weight: bold; border-radius: 10px; } """) as demo: gr.HTML("""

""") gr.Markdown("""

CHẨN ĐOÁN HƯ HỎNG TỪ ÂM THANH ĐỘNG CƠ

""") with gr.Row(): audio_file = gr.Audio(type="filepath", label="📂 Tải File Âm Thanh", interactive=True) audio_mic = gr.Audio(type="filepath", label="🎤 Ghi Âm", sources=["microphone"], interactive=True) thong_bao_ready = gr.HTML() btn_check = gr.Button("🔍 KIỂM TRA NGAY", elem_id="check-btn") output_html = gr.HTML() with gr.Accordion("📊 Phân tích Âm Thanh", open=False): mel_output = gr.Image(label="") wavelet_output = gr.Image(label="") waveform_output = gr.Image(label="") def xu_ly_toan_bo(file_path): tb = bao_san_sang(file_path) mel, wavl, wave = sinh_anh(file_path) kq = du_doan(file_path) return tb, mel, wavl, wave, kq audio_file.change( fn=xu_ly_toan_bo, inputs=audio_file, outputs=[thong_bao_ready, mel_output, wavelet_output, waveform_output, output_html] ) audio_mic.change( fn=xu_ly_toan_bo, inputs=audio_mic, outputs=[thong_bao_ready, mel_output, wavelet_output, waveform_output, output_html] ) btn_check.click( fn=lambda f1, f2: du_doan(chon_file(f1, f2)), inputs=[audio_file, audio_mic], outputs=output_html ) audio_file.clear(fn=reset_output, outputs=[ thong_bao_ready, mel_output, wavelet_output, waveform_output, output_html ]) audio_mic.clear(fn=reset_output, outputs=[ thong_bao_ready, mel_output, wavelet_output, waveform_output, output_html ]) demo.launch()