Spaces:

ml6team
/

doc-to-slides

Paused

App Files Files Community

com3dian commited on Jun 30, 2024

Commit

48102c5

verified ·

1 Parent(s): 3d2f753

Update app.py

Browse files

Files changed (1) hide show

app.py +13 -10

app.py CHANGED Viewed

@@ -36,12 +36,13 @@ with col2:
     option = st.selectbox(
         'Select parsing method.',
         ('monkey', 'x2d', 'lxml'))
-    range_values = st.slider(
-        'Select a range of values',
-        min_value=0,
-        max_value=100,
-        value=(25, 75)
-        )
 summ_text = None
@@ -73,6 +74,7 @@ if (uploaded_file is not None) and (not 'generation_done' in st.session_state):
     with st.status("Generating slides..."):
         summarizor = pipeline("summarization", model=summ_model_path, device = device)
         summ_text = summarizor(document.segmentation['text'], max_length=100, min_length=10, do_sample=False)
         summ_text = [text['summary_text'] for text in summ_text]
@@ -81,14 +83,15 @@ if (uploaded_file is not None) and (not 'generation_done' in st.session_state):
 if (summ_text is not None) or ('summ_text' in st.session_state):
     # Function to render HTML content
-    def format(text_list):
         format_list = []
-        for text in text_list:
             # Split text by periods
             sentences = text.split('.')
             # Create HTML list items
             list_items = "".join([f"- {sentence.strip()}.\n" for sentence in sentences if sentence.strip()])
-            format_list.append(list_items)
         return format_list
     # Initialize session state for page index and text
@@ -96,7 +99,7 @@ if (summ_text is not None) or ('summ_text' in st.session_state):
         st.session_state.page_index = 0
     if 'summ_text' not in st.session_state:
-        st.session_state.summ_text = format(summ_text)
     if 'current_text' not in st.session_state:
         st.session_state.current_text = st.session_state.summ_text[st.session_state.page_index]

     option = st.selectbox(
         'Select parsing method.',
         ('monkey', 'x2d', 'lxml'))
+range_values = st.slider(
+    'Select a range of values',
+    min_value=0,
+    max_value=100,
+    value=(0, 25)
+    )
 summ_text = None
     with st.status("Generating slides..."):
         summarizor = pipeline("summarization", model=summ_model_path, device = device)
+        title_list = document.segmentation['key']
         summ_text = summarizor(document.segmentation['text'], max_length=100, min_length=10, do_sample=False)
         summ_text = [text['summary_text'] for text in summ_text]
 if (summ_text is not None) or ('summ_text' in st.session_state):
     # Function to render HTML content
+    def format(title_list, text_list):
         format_list = []
+        for index, text in enumerate(text_list):
+            title = "##" + title_list[index] + "\n"
             # Split text by periods
             sentences = text.split('.')
             # Create HTML list items
             list_items = "".join([f"- {sentence.strip()}.\n" for sentence in sentences if sentence.strip()])
+            format_list.append(title + list_items)
         return format_list
     # Initialize session state for page index and text
         st.session_state.page_index = 0
     if 'summ_text' not in st.session_state:
+        st.session_state.summ_text = format(summ_text, title_list)
     if 'current_text' not in st.session_state:
         st.session_state.current_text = st.session_state.summ_text[st.session_state.page_index]