Spaces:

XINZHANG-Geotab
/

transcript_summary

Sleeping

App Files Files Community

XINZHANG-Geotab commited on Apr 2, 2024

Commit

c3ad4b8

verified ·

1 Parent(s): 364f00c

Upload 4 files

Browse files

Files changed (1) hide show

app.py +93 -24

app.py CHANGED Viewed

@@ -2,34 +2,87 @@ import gradio as gr
 import whisper
 from langchain_openai import ChatOpenAI
 from utils import RefineDataSummarizer
 import os
-def transcript(file_dir, language, model_type):
-    model_dir = os.path.join('models', model_type)
-    model = whisper.load_model(model_dir)
-    result = model.transcribe(file_dir, language=language, task='transcribe')
-    lines = [s['text'] for s in result['segments']]
     text = ''
-    for line in lines:
-        text += f"{line}\n"
-    return text
 def upload_file(file_paths):
     return file_paths
-def summary(text, chunk_num, chunk_overlap, user_api, llm_type):
     if user_api == "Not Provided":
-        api_key = os.getenv("openai_api")
     else:
         api_key = user_api
     api_key = api_key.strip()
     llm = ChatOpenAI(temperature=1, openai_api_key=api_key, model_name=llm_type)
-    rds = RefineDataSummarizer(llm=llm)
     result = rds.get_summarization(text, chunk_num=chunk_num, chunk_overlap=chunk_overlap)
-    return result["output_text"]
 with gr.Blocks() as demo:
     with gr.Row(equal_height=False):
@@ -37,8 +90,6 @@ with gr.Blocks() as demo:
             file_output = gr.File()
             upload_button = gr.UploadButton("Click to Upload a File", file_types=["audio", "video"], file_count="single")
             upload_button.upload(upload_file, upload_button, file_output)
-            language = gr.Dropdown(
-                ["English", "Chinese"], label="Transcript Language", value="English")
             model_type = gr.Dropdown(
                 [
                     "tiny.en.pt",
@@ -50,15 +101,29 @@ with gr.Blocks() as demo:
                     "medium.en.pt",
                     "medium.pt",
                     "large-v1.pt",
-                    "large-v2.pt",], label="Model Type", value="medium.en.pt")
             TranscriptButton = gr.Button("Transcript", variant="primary")
         with gr.Column():
-            transcript_text = gr.Textbox(placeholder="Transcript Result", label="Transcript")
-            with gr.Accordion(open=False, label=["summary settings"]):
                 chunk_num = gr.Number(precision=0, minimum=1, maximum=9999, step=1, label="Chunk Number", value=1)
-                chunk_overlap = gr.Number(precision=0, minimum=1, maximum=9999, step=1, label="Chunk Overlap", value=100)
             with gr.Accordion(open=False, label=["llm settings"]):
                 user_api = gr.Textbox(placeholder="If Empty, Use Default Key", label="Your API Key", value="Not Provided")
@@ -70,16 +135,18 @@ with gr.Blocks() as demo:
                     ], label="LLM Type", value="gpt-4-1106-preview")
             SunmmaryButton = gr.Button("Summary", variant="primary")
             summary_text = gr.Textbox(placeholder="Summary Result", label="Summary")
     TranscriptButton.click(
         fn=transcript,
         inputs=[
             file_output,
-            language,
-            model_type
         ],
-        outputs=[transcript_text]
     )
     SunmmaryButton.click(
         fn=summary,
@@ -88,9 +155,11 @@ with gr.Blocks() as demo:
             chunk_num,
             chunk_overlap,
             user_api,
-            llm_type
         ],
-        outputs=[summary_text]
     )
 demo.launch()

 import whisper
 from langchain_openai import ChatOpenAI
 from utils import RefineDataSummarizer
+from utils import (
+    prompt_template,
+    refine_template,
+    prompt_template_bullet_point,
+    refine_prompt_template_bullet_point
+)
 import os
+def get_prompt_examples():
+    examples=[
+        ["Regular Template: ", prompt_template, refine_template],
+        ["Bullet Point Template: ", prompt_template_bullet_point, refine_prompt_template_bullet_point],
+        ["Empty Template: ", '{text}', '{text}'],
+    ]
+    return examples
+def convert_to_time_format(seconds_float):
+    # Split the input into whole seconds and fractional part (milliseconds)
+    seconds, milliseconds = divmod(seconds_float, 1)
+    milliseconds = round(milliseconds * 1000)  # Convert fractional part to milliseconds
+    # Convert the whole seconds into hours, minutes, and remaining seconds
+    minutes, seconds = divmod(int(seconds), 60)
+    hours, minutes = divmod(minutes, 60)
+    # Format the time components into HH:MM:SS:OO
+    time_format = f"{hours:02d}:{minutes:02d}:{seconds:02d},{milliseconds:03d}"
+    return time_format
+def time_stamped_text(transcript_result):
     text = ''
+    for idx, segment in enumerate(transcript_result['segments']):
+        start_stamp = segment["start"]
+        end_stamp = segment["end"]
+        sentence = segment["text"].strip()
+        text += f"{idx + 1}\n"
+        text += f"{convert_to_time_format(start_stamp)} --> {convert_to_time_format(end_stamp)}\n{sentence}\n\n"
+    return text.strip()
+def transcript(file_dir, model_type, time_stamp):
+    # model_dir = os.path.join('models', model_type)
+    model_dir = "E:\\Whisper\\" + model_type
+    model = whisper.load_model(model_dir)
+    result = model.transcribe(file_dir, language='English', task='transcribe')
+    if time_stamp:
+        text = time_stamped_text(result)
+    else:
+        lines = [s['text'] for s in result['segments']]
+        text = ''
+        for line in lines:
+            text += f"{line}\n"
+    text = text.strip()
+    with open("Transcript.txt", 'w') as file:
+        file.write(text)
+    return [text, "Transcript.txt"]
 def upload_file(file_paths):
     return file_paths
+def summary(text, chunk_num, chunk_overlap, user_api, llm_type, prompt, refine_prompt):
     if user_api == "Not Provided":
+        # api_key = os.getenv("openai_api")
+        api_key = "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"
     else:
         api_key = user_api
     api_key = api_key.strip()
     llm = ChatOpenAI(temperature=1, openai_api_key=api_key, model_name=llm_type)
+    rds = RefineDataSummarizer(llm=llm, prompt_template=prompt, refine_template=refine_prompt)
     result = rds.get_summarization(text, chunk_num=chunk_num, chunk_overlap=chunk_overlap)
+    text = result["output_text"]
+    with open("Summary.txt", 'w') as file:
+        file.write(text)
+    return [text, "Summary.txt"]
 with gr.Blocks() as demo:
     with gr.Row(equal_height=False):
             file_output = gr.File()
             upload_button = gr.UploadButton("Click to Upload a File", file_types=["audio", "video"], file_count="single")
             upload_button.upload(upload_file, upload_button, file_output)
             model_type = gr.Dropdown(
                 [
                     "tiny.en.pt",
                     "medium.en.pt",
                     "medium.pt",
                     "large-v1.pt",
+                    "large-v2.pt",], label="Model Type", value="medium.pt")
+            time_stamp = gr.Checkbox(label="SRT Format", info="SRT format with timestamps")
             TranscriptButton = gr.Button("Transcript", variant="primary")
+            transcript_text = gr.Textbox(placeholder="Transcript Result", label="Transcript")
+            with gr.Accordion(open=False, label=["Download Transcript"]):
+                transcript_file = gr.File()
         with gr.Column():
+            with gr.Accordion(open=True, label=["summary settings"]):
                 chunk_num = gr.Number(precision=0, minimum=1, maximum=9999, step=1, label="Chunk Number", value=1)
+                chunk_overlap = gr.Number(precision=0, minimum=1, maximum=9999, step=1, label="Chunk Overlap", value=100)
+                placeholder = gr.Textbox(visible=False)
+                prompt = gr.Textbox(placeholder="summary prompt", label="Summary Template", lines=5, value=prompt_template)
+                refine_prompt = gr.Textbox(placeholder="refine summary prompt", label="Refine Summary Template", lines=10, value=refine_template)
+                with gr.Accordion(open=False, label=["Templates"]):
+                    gr.Examples(
+                            examples=get_prompt_examples(),
+                            inputs=[placeholder, prompt, refine_prompt],
+                            fn=None,
+                            outputs=None,
+                            cache_examples=False,
+                            label="Prompt Template"
+                    )
             with gr.Accordion(open=False, label=["llm settings"]):
                 user_api = gr.Textbox(placeholder="If Empty, Use Default Key", label="Your API Key", value="Not Provided")
                     ], label="LLM Type", value="gpt-4-1106-preview")
             SunmmaryButton = gr.Button("Summary", variant="primary")
             summary_text = gr.Textbox(placeholder="Summary Result", label="Summary")
+            with gr.Accordion(open=False, label=["Download Summary"]):
+                summary_file = gr.File()
     TranscriptButton.click(
         fn=transcript,
         inputs=[
             file_output,
+            model_type,
+            time_stamp
         ],
+        outputs=[transcript_text, transcript_file]
     )
     SunmmaryButton.click(
         fn=summary,
             chunk_num,
             chunk_overlap,
             user_api,
+            llm_type,
+            prompt,
+            refine_prompt
         ],
+        outputs=[summary_text, summary_file]
     )
 demo.launch()