Spaces:

imperialhtech
/

audiooo333

Sleeping

App Files Files Community

syafiqq02 commited on May 26, 2025

Commit

10e3cf1

1 Parent(s): 8d0e8af

gradio

Browse files

Files changed (1) hide show

app.py +89 -27

app.py CHANGED Viewed

@@ -6,68 +6,130 @@ from sumy.parsers.plaintext import PlaintextParser
 from sumy.nlp.tokenizers import Tokenizer
 from sumy.summarizers.lsa import LsaSummarizer
-# Mengunduh tokenizer NLTK jika belum tersedia
 nltk.download('punkt')
 nltk.download('punkt_tab')
-# API Key Groq (Gantilah dengan API Key Anda)
 GROQ_API_KEY = "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"
-# Inisialisasi klien API Groq
 groq_client = Groq(api_key=GROQ_API_KEY)
 def save_to_file(content, filename):
-    """Menyimpan teks ke file."""
     with open(filename, 'w', encoding='utf-8') as file:
         file.write(content)
     return filename
-def transcribe_and_summarize(audio_path):
-    """Transkripsi audio menggunakan Groq API dan model Whisper Large V3, lalu melakukan summarization dengan LSA."""
     with open(audio_path, "rb") as audio_file:
         response = groq_client.audio.transcriptions.create(
             model="whisper-large-v3",
             file=audio_file,
             response_format="text"
         )
-    transcription = response  # Hasil transkripsi teks
-    # Meringkas hasil transkripsi dengan Sumy LSA (5 kalimat)
     parser = PlaintextParser.from_string(transcription, Tokenizer("english"))
     summarizer = LsaSummarizer()
-    summary_sentences = summarizer(parser.document, 5)  # Mengambil 5 kalimat terpenting
-    # Menggabungkan ringkasan menjadi satu teks
     summarized_text = " ".join([str(sentence) for sentence in summary_sentences])
-    # Menghitung jumlah token dalam teks asli dan hasil ringkasan
     original_tokens = len(nltk.word_tokenize(transcription))
     summarized_tokens = len(nltk.word_tokenize(summarized_text))
-    # Menyimpan hasil ringkasan
     summarized_file = save_to_file(summarized_text, 'summarized_transcription.txt')
-    return summarized_text, summarized_file, audio_path, original_tokens, summarized_tokens
-# Antarmuka Gradio
-with gr.Blocks(title="AI-based Medical Transcription & Summarization with Groq API") as app:
-    gr.Markdown("## Medical Transcription & Summarization with Groq API")
     with gr.Row():
         with gr.Column():
-            audio_input = gr.Audio("microphone", type="filepath", label="🎙️ Rekam Suara")
-            transcribe_button = gr.Button("🎧 Transkripsi & Ringkas dengan Whisper Large V3 (LSA 5 Kalimat)")
-            summarize_box = gr.Textbox(label="📄 Ringkasan Transkripsi", lines=10, interactive=False)
-            token_count_box = gr.Textbox(label="🔢 Info Token (Asli & Ringkasan", interactive=False)
         with gr.Column():
-            download_audio = gr.File(label="⬇️ Download Rekaman")
-            download_summary = gr.File(label="⬇️ Download Ringkasan")
     transcribe_button.click(
-        transcribe_and_summarize,
         inputs=[audio_input],
-        outputs=[summarize_box, download_summary, download_audio, token_count_box]
     )
-app.launch(share=True)

 from sumy.nlp.tokenizers import Tokenizer
 from sumy.summarizers.lsa import LsaSummarizer
+# Download tokenizer NLTK
 nltk.download('punkt')
 nltk.download('punkt_tab')
+# API Key Groq
 GROQ_API_KEY = "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"
 groq_client = Groq(api_key=GROQ_API_KEY)
 def save_to_file(content, filename):
     with open(filename, 'w', encoding='utf-8') as file:
         file.write(content)
     return filename
+def transcribe_and_summarize_generate(audio_path):
+    # Transkripsi
     with open(audio_path, "rb") as audio_file:
         response = groq_client.audio.transcriptions.create(
             model="whisper-large-v3",
             file=audio_file,
             response_format="text"
         )
+    transcription = response
+    # Summarization LSA
     parser = PlaintextParser.from_string(transcription, Tokenizer("english"))
     summarizer = LsaSummarizer()
+    summary_sentences = summarizer(parser.document, 5)
     summarized_text = " ".join([str(sentence) for sentence in summary_sentences])
+    # Token info
     original_tokens = len(nltk.word_tokenize(transcription))
     summarized_tokens = len(nltk.word_tokenize(summarized_text))
+    token_info = f"Asli: {original_tokens} token | Ringkasan: {summarized_tokens} token"
+    # SOAP
+    prompt_soap = f"""
+    Anda adalah asisten medis yang membantu dokter dalam menyusun catatan SOAP berdasarkan percakapan dokter dan pasien.
+    Ringkaskan dalam bentuk paragraf tanpa adanya bullet point dan gunakan bahasa Indonesia.
+    Harap buat ringkasan dalam format berikut:
+    Subjective:
+    Objective:
+    Assessment:
+    Plan:
+    ### Percakapan:
+    {transcription}
+    Tolong jangan tambahkan informasi tambahan selain yang berkaitan dengan diagnosis, obat, hasil lab, dan radiologi.
+    """
+    response_soap = groq_client.chat.completions.create(
+        model="llama3-8b-8192",
+        messages=[{"role": "user", "content": prompt_soap}]
+    )
+    soap_content = response_soap.choices[0].message.content
+    # Tags
+    prompt_tags = f"""
+    Identifikasi dan berikan luaran dalam bahasa Indonesia tags berikut dari percakapan dengan format:
+    Diagnosis:
+    Obat:
+    Hasil Lab:
+    Radiologi:
+    ### Percakapan:
+    {transcription}
+    Tolong jangan tambahkan informasi tambahan selain yang berkaitan dengan diagnosis, obat, hasil lab, dan radiologi.
+    """
+    response_tags = groq_client.chat.completions.create(
+        model="llama3-8b-8192",
+        messages=[{"role": "user", "content": prompt_tags}]
+    )
+    tags_content = response_tags.choices[0].message.content
+    # Save files
     summarized_file = save_to_file(summarized_text, 'summarized_transcription.txt')
+    soap_file = save_to_file(soap_content, 'soap_summary.txt')
+    tags_file = save_to_file(tags_content, 'medical_tags.txt')
+    return (
+        summarized_text,
+        soap_content,
+        tags_content,
+        token_info,
+        summarized_file,
+        soap_file,
+        tags_file,
+        audio_path
+    )
+# Gradio UI
+with gr.Blocks(title="SOAP AI: Transkripsi dan Ringkasan Medis Otomatis") as app:
+    gr.Markdown("## 🧠 SOAP AI - Transkripsi, Ringkasan, dan Deteksi Medis Otomatis")
     with gr.Row():
         with gr.Column():
+            audio_input = gr.Audio("microphone", type="filepath", label="🎙️ Rekam Percakapan")
+            transcribe_button = gr.Button("🩺 Jalankan Proses Lengkap (Transkripsi + Ringkasan + SOAP + Tags)")
         with gr.Column():
+            summarize_box = gr.Textbox(label="📄 Ringkasan LSA (5 Kalimat)", lines=5, interactive=False)
+            soap_box = gr.Textbox(label="📋 Ringkasan SOAP", lines=8, interactive=False)
+            tags_box = gr.Textbox(label="🏷️ Medical Tags", lines=6, interactive=False)
+            token_box = gr.Textbox(label="🔢 Token Info", interactive=False)
+    with gr.Row():
+        download_summary = gr.File(label="⬇️ Download Ringkasan LSA")
+        download_soap = gr.File(label="⬇️ Download SOAP")
+        download_tags = gr.File(label="⬇️ Download Tags")
+        download_audio = gr.File(label="⬇️ Download Audio")
     transcribe_button.click(
+        transcribe_and_summarize_generate,
         inputs=[audio_input],
+        outputs=[
+            summarize_box,
+            soap_box,
+            tags_box,
+            token_box,
+            download_summary,
+            download_soap,
+            download_tags,
+            download_audio
+        ]
     )
+app.launch(share=True)