Spaces:

RJ40under40
/

AudioClassifier

Sleeping

App Files Files Community

RJ40under40 commited on 19 days ago

Commit

779e17c

verified ·

1 Parent(s): 016625d

Update app.py

Browse files

Files changed (1) hide show

app.py +8 -7

app.py CHANGED Viewed

@@ -1,5 +1,5 @@
 # ======================================================
-# HCL AI VOICE DETECTION API – HF SPACES SAFE
 # ======================================================
 import base64
@@ -13,7 +13,7 @@ from fastapi.middleware.cors import CORSMiddleware
 from fastapi.security.api_key import APIKeyHeader
 from pydantic import BaseModel
-from transformers import AutoProcessor, AutoModelForAudioClassification
 # ======================================================
 # CONFIG
@@ -21,7 +21,8 @@ from transformers import AutoProcessor, AutoModelForAudioClassification
 API_KEY_NAME = "access_token"
 API_KEY_VALUE = "HCL_SECURE_KEY_2026"
-MODEL_ID = "superb/wav2vec2-base-superb-ks"  # ✅ VERIFIED, EXISTS
 TARGET_SR = 16000
 # ======================================================
@@ -36,7 +37,7 @@ logger = logging.getLogger("voice-detection")
 DEVICE = "cuda" if torch.cuda.is_available() else "cpu"
 logger.info(f"Using device: {DEVICE}")
-processor = AutoProcessor.from_pretrained(MODEL_ID)
 model = AutoModelForAudioClassification.from_pretrained(MODEL_ID).to(DEVICE)
 model.eval()
@@ -57,7 +58,7 @@ app.add_middleware(
 )
 # ======================================================
-# SCHEMAS
 # ======================================================
 class AudioRequest(BaseModel):
     audio_base64: str
@@ -87,7 +88,7 @@ def decode_audio(b64_audio: str):
 def analyze_voice(audio):
-    inputs = processor(
         audio,
         sampling_rate=TARGET_SR,
         return_tensors="pt"
@@ -100,8 +101,8 @@ def analyze_voice(audio):
         probs = torch.softmax(logits, dim=-1)
     confidence, pred = torch.max(probs, dim=-1)
     label = "AI_GENERATED" if pred.item() == 1 else "HUMAN"
     return label, round(confidence.item(), 4)

 # ======================================================
+# HCL AI VOICE DETECTION API – HF SPACES (STABLE)
 # ======================================================
 import base64
 from fastapi.security.api_key import APIKeyHeader
 from pydantic import BaseModel
+from transformers import AutoFeatureExtractor, AutoModelForAudioClassification
 # ======================================================
 # CONFIG
 API_KEY_NAME = "access_token"
 API_KEY_VALUE = "HCL_SECURE_KEY_2026"
+# ✅ VERIFIED audio-classification model
+MODEL_ID = "superb/wav2vec2-base-superb-ks"
 TARGET_SR = 16000
 # ======================================================
 DEVICE = "cuda" if torch.cuda.is_available() else "cpu"
 logger.info(f"Using device: {DEVICE}")
+feature_extractor = AutoFeatureExtractor.from_pretrained(MODEL_ID)
 model = AutoModelForAudioClassification.from_pretrained(MODEL_ID).to(DEVICE)
 model.eval()
 )
 # ======================================================
+# SCHEMA
 # ======================================================
 class AudioRequest(BaseModel):
     audio_base64: str
 def analyze_voice(audio):
+    inputs = feature_extractor(
         audio,
         sampling_rate=TARGET_SR,
         return_tensors="pt"
         probs = torch.softmax(logits, dim=-1)
     confidence, pred = torch.max(probs, dim=-1)
     label = "AI_GENERATED" if pred.item() == 1 else "HUMAN"
     return label, round(confidence.item(), 4)