Spaces:

raphgonda
/

SpeechEvaluation

Build error

App Files Files Community

raphgonda commited on Feb 3, 2025

Commit

224e007

verified ·

1 Parent(s): 7f6a027

Update app.py

Browse files

Files changed (1) hide show

app.py +33 -9

app.py CHANGED Viewed

@@ -1,7 +1,7 @@
 import gradio as gr
 import whisper
-# Load the Whisper model
 model = whisper.load_model("base")
 # Define the waiter prompt in Korean.
@@ -17,24 +17,48 @@ prompt_text = """
 def process_audio(audio_file):
     if audio_file is None:
         return "오디오 파일이 없습니다. 다시 시도해 주세요."
     result = model.transcribe(audio_file, language='ko')
     transcription = result["text"].strip()
     return transcription
 with gr.Blocks() as demo:
     gr.Markdown("## 한국어 주문 녹음 앱")
     # Embed the animated GIF for the waiter animation.
     gr.Image(value="https://s13.gifyu.com/images/b2NQh.gif", label="웨이터 안내 애니메이션")
     gr.Markdown(prompt_text)
-    # Removed the "source" argument
     audio_input = gr.Audio(type="filepath", label="녹음: 주문 내용을 말씀해 주세요")
-    submit_btn = gr.Button("전송")
     transcription_output = gr.Textbox(label="주문 녹취 결과", placeholder="여기에 전사 결과가 나타납니다.")
     submit_btn.click(process_audio, inputs=audio_input, outputs=transcription_output)
-demo.launch()

 import gradio as gr
 import whisper
+# Load the Whisper model
 model = whisper.load_model("base")
 # Define the waiter prompt in Korean.
 def process_audio(audio_file):
     if audio_file is None:
         return "오디오 파일이 없습니다. 다시 시도해 주세요."
     result = model.transcribe(audio_file, language='ko')
     transcription = result["text"].strip()
     return transcription
+def evaluate_transcription(transcription):
+    if transcription is None or transcription.strip() == "":
+        return "입력된 내용이 없습니다."
+    # Simulated GPT evaluation response.
+    dummy_response = (
+        "GPT 평가 결과:\n"
+        "주문 내용이 전반적으로 명확합니다. "
+        "더 구체적인 요청이나 추가 정보가 있으면 좋겠지만, 현재 주문은 잘 전달된 것 같습니다."
+    )
+    return dummy_response
 with gr.Blocks() as demo:
     gr.Markdown("## 한국어 주문 녹음 앱")
     # Embed the animated GIF for the waiter animation.
     gr.Image(value="https://s13.gifyu.com/images/b2NQh.gif", label="웨이터 안내 애니메이션")
     gr.Markdown(prompt_text)
+    # Audio input (without source parameter)
     audio_input = gr.Audio(type="filepath", label="녹음: 주문 내용을 말씀해 주세요")
+    # Transcription output
     transcription_output = gr.Textbox(label="주문 녹취 결과", placeholder="여기에 전사 결과가 나타납니다.")
+    # Evaluation output (simulated GPT feedback)
+    evaluation_output = gr.Textbox(label="GPT 평가 결과", placeholder="여기에 평가 결과가 나타납니다.")
+    # Buttons
+    submit_btn = gr.Button("전송")
+    evaluate_btn = gr.Button("평가")
+    # When clicking "전송", process the audio and display the transcription.
     submit_btn.click(process_audio, inputs=audio_input, outputs=transcription_output)
+    # When clicking "평가", simulate GPT's evaluation.
+    evaluate_btn.click(evaluate_transcription, inputs=transcription_output, outputs=evaluation_output)
+demo.launch()