Spaces:

vyluong
/

POC_ASR_v6

Running

App Files Files Community

colab-user commited on Mar 17

Commit

22bc992

1 Parent(s): 1ef53da

fix response api

Browse files

Files changed (3) hide show

app/api/routes.py +10 -3
app/services/processor.py +8 -5
app/static/js/app.js +6 -0

app/api/routes.py CHANGED Viewed

@@ -15,6 +15,7 @@ from app.services.audio_processor import AudioProcessor, AudioProcessingError
 from app.services.transcription import TranscriptionService, AVAILABLE_MODELS
 from app.services.diarization import DiarizationService
 from app.services.processor import Processor
 logger = logging.getLogger(__name__)
 settings = get_settings()
@@ -97,15 +98,20 @@ async def transcribe_audio(
         with csv_path.open("w", newline="", encoding="utf-8-sig") as f:
             writer = csv.DictWriter(
                 f,
-                fieldnames=["start", "end", "speaker", "text"],
             )
             writer.writeheader()
             for seg in result.segments:
                 writer.writerow({
                     "start": round(seg.start, 2),
                     "end": round(seg.end, 2),
                     "speaker": roles.get(seg.speaker, seg.speaker),
                     "text": seg.text,
                 })
@@ -122,7 +128,8 @@ async def transcribe_audio(
                     "speaker": seg.speaker,
                     "role": seg.role,
                     "text": seg.text,
-                    "emotion": seg.emotion
                 }
                 for seg in result.segments
             ],
@@ -136,7 +143,7 @@ async def transcribe_audio(
                 {
                     "time": p.time,
                     "emotion": p.emotion,
-                    "icon": p.icon
                 }
                 for p in (result.emotion_timeline or [])
             ],

 from app.services.transcription import TranscriptionService, AVAILABLE_MODELS
 from app.services.diarization import DiarizationService
 from app.services.processor import Processor
+from app.services.emo import EmotionService
 logger = logging.getLogger(__name__)
 settings = get_settings()
         with csv_path.open("w", newline="", encoding="utf-8-sig") as f:
             writer = csv.DictWriter(
                 f,
+                fieldnames=["start", "end", "speaker", "text", "emotion", "icon"],
             )
             writer.writeheader()
             for seg in result.segments:
+                emotion = seg.emotion or ""
+                icon = EmotionService.meta.get(emotion, {}).get("emoji", "") if emotion else ""
                 writer.writerow({
                     "start": round(seg.start, 2),
                     "end": round(seg.end, 2),
                     "speaker": roles.get(seg.speaker, seg.speaker),
                     "text": seg.text,
+                    "emotion": emotion,
+                    "icon": icon
                 })
                     "speaker": seg.speaker,
                     "role": seg.role,
                     "text": seg.text,
+                    "emotion": seg.emotion,
+                    "icon": EmotionService.meta.get(seg.emotion, {}).get("emoji", "") if seg.emotion else ""
                 }
                 for seg in result.segments
             ],
                 {
                     "time": p.time,
                     "emotion": p.emotion,
+                    "icon": p.icon
                 }
                 for p in (result.emotion_timeline or [])
             ],

app/services/processor.py CHANGED Viewed

@@ -17,7 +17,6 @@ from app.services.alignment import AlignmentService
 from app.services.transcription import WordTimestamp
 from app.services.emo import EmotionService
 from app.services.diarization import DiarizationService, SpeakerSegment, DiarizationResult
 logger = logging.getLogger(__name__)
@@ -41,7 +40,6 @@ class EmotionPoint:
     emotion: str
     icon: Optional[str]
 @dataclass
 class EmotionChange:
     time: float
@@ -605,8 +603,10 @@ class Processor:
             role = seg.role or "UNKNOWN"
             speaker_icon = speaker_icons.get(seg.speaker, "⚪")
             lines.append(
-                f"{ts} {speaker_icon} [{seg.speaker}|{role}] {seg.text}"
             )
         return "\n".join(lines)
@@ -618,7 +618,10 @@ class Processor:
         output = StringIO()
         writer = csv.writer(output)
-        writer.writerow(["start", "end", "speaker", "text"])
         for seg in segments:
-            writer.writerow([round(seg.start, 3), round(seg.end, 3), seg.speaker, seg.text])
         return output.getvalue()

 from app.services.transcription import WordTimestamp
 from app.services.emo import EmotionService
 from app.services.diarization import DiarizationService, SpeakerSegment, DiarizationResult
 logger = logging.getLogger(__name__)
     emotion: str
     icon: Optional[str]
 @dataclass
 class EmotionChange:
     time: float
             role = seg.role or "UNKNOWN"
             speaker_icon = speaker_icons.get(seg.speaker, "⚪")
+            emotion = seg.emotion or ""
+            emotion_icon = EmotionService.meta.get(emotion, {}).get("emoji", "") if emotion else ""
             lines.append(
+                f"{ts} {speaker_icon} [{seg.speaker}|{role}] {seg.text} {emotion_icon} {emotion}"
             )
         return "\n".join(lines)
         output = StringIO()
         writer = csv.writer(output)
+        writer.writerow(["start", "end", "speaker", "text", "emotion", "icon"])
         for seg in segments:
+            emotion = seg.emotion or ""
+            icon = EmotionService.meta.get(emotion, {}).get("emoji", "") if emotion else ""
+            writer.writerow([round(seg.start, 3), round(seg.end, 3), seg.speaker, seg.text, emotion, icon])
         return output.getvalue()

app/static/js/app.js CHANGED Viewed

@@ -246,6 +246,9 @@ document.addEventListener('DOMContentLoaded', () => {
         segments.forEach((segment) => {
             const role = segment.role || 'UNKNOWN';
             if (!(role in roleColors)) {
                 colorIndex++;
                 roleColors[role] = `speaker-${Math.min(colorIndex, 5)}`;
@@ -268,6 +271,9 @@ document.addEventListener('DOMContentLoaded', () => {
                     </span>
                 </div>
                 <p class="segment-text">${text}</p>
             `;
             elements.transcriptContainer.appendChild(segmentEl);

         segments.forEach((segment) => {
             const role = segment.role || 'UNKNOWN';
+            const emotion = segment.emotion || 'Neutral';
+            const icon = segment.icon || '😐';
             if (!(role in roleColors)) {
                 colorIndex++;
                 roleColors[role] = `speaker-${Math.min(colorIndex, 5)}`;
                     </span>
                 </div>
                 <p class="segment-text">${text}</p>
+                <div class="segment-emotion">
+                    ${icon} ${escapeHtml(emotion)}
+                </div>
             `;
             elements.transcriptContainer.appendChild(segmentEl);