Spaces:

Sabbah13
/

text_transcribation_diarization_and_summarization

Paused

App Files Files Community

Sabbah13 commited on Jul 12, 2024

Commit

8ac5c0e

verified ·

1 Parent(s): 93ba2b1

Update app.py

Browse files

Files changed (1) hide show

app.py +5 -4

app.py CHANGED Viewed

@@ -17,9 +17,10 @@ if check_password():
     initial_base_prompt = os.getenv('BASE_PROMPT')
     initial_processing_prompt = os.getenv('PROCCESS_PROMPT')
     llm = st.sidebar.selectbox("LLM", ["GigaChat", "Chat GPT"], index=0)
     base_prompt = st.sidebar.text_area("Промпт для резюмирования", value=initial_base_prompt)
-    max_tokens_summary = st.sidebar.number_input("Максимальное количество токенов при резюмировании", min_value=1, value=1024)
     enable_processing = st.sidebar.checkbox("Добавить обработку транскрибации", value=False)
     processing_prompt = st.sidebar.text_area("Промпт для обработки транскрибации", value=initial_processing_prompt)
@@ -63,7 +64,7 @@ if check_password():
                 print('Aligned, now diarizing')
                 diarize_model = whisperx.DiarizationPipeline(use_auth_token=st.secrets["HF_TOKEN"], device=device)
-                diarize_segments = diarize_model(audio)
                 result_diar = whisperx.assign_word_speakers(diarize_segments, result)
             transcript = convert_segments_object_to_text_simple(result_diar)
@@ -93,9 +94,9 @@ if check_password():
         with st.spinner('Резюмируем...'):
             if (llm == 'GigaChat'):
-                summary_answer = get_completion_from_gigachat(base_prompt + transcript, max_tokens_summary, access_token)
             elif (llm == 'Chat GPT'):
-                summary_answer = get_completion_from_openai(base_prompt + transcript, max_tokens_summary)
             st.write("Результат резюмирования:")
             st.text(summary_answer)

     initial_base_prompt = os.getenv('BASE_PROMPT')
     initial_processing_prompt = os.getenv('PROCCESS_PROMPT')
+    min_speakers = st.sidebar.number_input("Минимальное количество спикеров", min_value=1, value=2)
+    max_speakers = st.sidebar.number_input("Максимальное количество спикеров", min_value=1, value=2)
     llm = st.sidebar.selectbox("LLM", ["GigaChat", "Chat GPT"], index=0)
     base_prompt = st.sidebar.text_area("Промпт для резюмирования", value=initial_base_prompt)
     enable_processing = st.sidebar.checkbox("Добавить обработку транскрибации", value=False)
     processing_prompt = st.sidebar.text_area("Промпт для обработки транскрибации", value=initial_processing_prompt)
                 print('Aligned, now diarizing')
                 diarize_model = whisperx.DiarizationPipeline(use_auth_token=st.secrets["HF_TOKEN"], device=device)
+                diarize_segments = diarize_model(audio, min_speakers=min_speakers, max_speakers=max_speakers)
                 result_diar = whisperx.assign_word_speakers(diarize_segments, result)
             transcript = convert_segments_object_to_text_simple(result_diar)
         with st.spinner('Резюмируем...'):
             if (llm == 'GigaChat'):
+                summary_answer = get_completion_from_gigachat(base_prompt + transcript, 1024, access_token)
             elif (llm == 'Chat GPT'):
+                summary_answer = get_completion_from_openai(base_prompt + transcript, 1024)
             st.write("Результат резюмирования:")
             st.text(summary_answer)