Spaces:

CLMARRARA
/

tech_challenge_fase_4_audio_backend

Sleeping

App Files Files Community

CLMARRARA commited on Apr 21

Commit

53e656d

1 Parent(s): 3b37a6b

Adicionado POC do serviço de audio (Adicionado Roberta)

Browse files

Files changed (3) hide show

app/api.py +2 -1
app/audio_processor.py +7 -8
app/sentiment_model.py +15 -22

app/api.py CHANGED Viewed

@@ -41,7 +41,8 @@ def analyze(request: Request, data: dict):
     try:
         result = process_audio(
             video_base64=video_base64,
-            audio_base64=audio_base64
         )
         log("Finalizado analise de audio", logger=logger)

     try:
         result = process_audio(
             video_base64=video_base64,
+            audio_base64=audio_base64,
+            logger=logger
         )
         log("Finalizado analise de audio", logger=logger)

app/audio_processor.py CHANGED Viewed

@@ -3,6 +3,7 @@ import tempfile
 import os
 from app.config import WHISPER_MODEL, WHISPER_MODEL_PATH
 os.environ["XDG_CACHE_HOME"] = str(WHISPER_MODEL_PATH) # "./models"
 from app.sentiment_model import analyze_sentiment
 import whisper
 from moviepy.editor import VideoFileClip
@@ -41,7 +42,7 @@ def extract_audio_from_video(video_path):
 # -------------------------
 # 🔥 PROCESSAMENTO PRINCIPAL
 # -------------------------
-def process_audio(video_base64=None, audio_base64=None):
     video_path = None
     audio_path = None
@@ -52,14 +53,14 @@ def process_audio(video_base64=None, audio_base64=None):
         # -------------------------
         if audio_base64:
-            print("Recebido áudio base64")
             audio_path = save_base64_to_file(audio_base64, ".wav")
         elif video_base64:
-            print("Recebido vídeo base64")
             video_path = save_base64_to_file(video_base64, ".mp4")
-            print("Extraindo áudio do vídeo...")
             audio_path = extract_audio_from_video(video_path)
         else:
@@ -69,7 +70,7 @@ def process_audio(video_base64=None, audio_base64=None):
         # 🎯 2. WHISPER
         # -------------------------
-        print("Transcrevendo com Whisper...")
         result = whisper_model.transcribe(
             audio_path,
@@ -78,15 +79,13 @@ def process_audio(video_base64=None, audio_base64=None):
             fp16=False  # importante para CPU
         )
-        # text = result["text"]
         text = " ".join([seg["text"] for seg in result["segments"]])
         # -------------------------
         # 🎯 3. ROBERTA (cardiffnlp/twitter-xlm-roberta)
         # -------------------------
-        sentiment, score = analyze_sentiment(text)
         print(f"Sentimento: {sentiment} ({score})")

 import os
 from app.config import WHISPER_MODEL, WHISPER_MODEL_PATH
 os.environ["XDG_CACHE_HOME"] = str(WHISPER_MODEL_PATH) # "./models"
+from app.logger import log
 from app.sentiment_model import analyze_sentiment
 import whisper
 from moviepy.editor import VideoFileClip
 # -------------------------
 # 🔥 PROCESSAMENTO PRINCIPAL
 # -------------------------
+def process_audio(video_base64=None, audio_base64=None, logger=None):
     video_path = None
     audio_path = None
         # -------------------------
         if audio_base64:
+            log("Recebido áudio base64", logger=logger)
             audio_path = save_base64_to_file(audio_base64, ".wav")
         elif video_base64:
+            log("Recebido vídeo base64", logger=logger)
             video_path = save_base64_to_file(video_base64, ".mp4")
+            log("Extraindo áudio do vídeo...", logger=logger)
             audio_path = extract_audio_from_video(video_path)
         else:
         # 🎯 2. WHISPER
         # -------------------------
+        log("Transcrevendo com Whisper...", logger=logger)
         result = whisper_model.transcribe(
             audio_path,
             fp16=False  # importante para CPU
         )
         text = " ".join([seg["text"] for seg in result["segments"]])
         # -------------------------
         # 🎯 3. ROBERTA (cardiffnlp/twitter-xlm-roberta)
         # -------------------------
+        sentiment, score = analyze_sentiment(text, logger)
         print(f"Sentimento: {sentiment} ({score})")

app/sentiment_model.py CHANGED Viewed

@@ -1,3 +1,4 @@
 from transformers import pipeline
 _pipeline = None
@@ -30,26 +31,7 @@ def split_text(text, max_length=300):
     return chunks
-def analyze_sentiment_v1(text: str):
-    model = get_pipeline()
-    #result = model(text[:512])[0]
-    result = model(text)[0]
-    label = result["label"]
-    score = result["score"]
-    if label == "LABEL_0":
-        sentiment = "negative"
-    elif label == "LABEL_1":
-        sentiment = "neutral"
-    else:
-        sentiment = "positive"
-    return sentiment, score
-def analyze_sentiment(text: str):
     model = get_pipeline()
     # 🔥 quebra em partes menores
@@ -58,6 +40,9 @@ def analyze_sentiment(text: str):
     results = []
     for chunk in chunks:
         r = model(chunk)[0]
         results.append(r)
@@ -72,11 +57,19 @@ def analyze_sentiment(text: str):
     }
     if not results:
-        return "neutral...", 0
     total = 0
     for r in results:
-        total += score_map[r["label"]] * r["score"]
     avg = total / len(results)

+from app.logger import log
 from transformers import pipeline
 _pipeline = None
     return chunks
+def analyze_sentiment(text: str, logger=None):
     model = get_pipeline()
     # 🔥 quebra em partes menores
     results = []
     for chunk in chunks:
+        if not chunk.strip():
+            continue
         r = model(chunk)[0]
         results.append(r)
     }
     if not results:
+        log("Não houve resultado", "warning", logger=logger)
+        return "neutral", 0
     total = 0
     for r in results:
+        label = r["label"]
+        score = r["score"]
+        if label not in score_map:
+            continue
+        log(f"Label: {label} | Score: {score}")
+        total += score_map[label] * score
     avg = total / len(results)