PDF2SLIDE2

Runtime error

newoz commited on Sep 19, 2023

Commit

47e8ef0

1 Parent(s): 078e600

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -5,7 +5,7 @@ import fitz  # Utilisation de PyMuPDF (PdfReader) pour extraire le texte depuis
 def extraire_long_paragraphes(texte, longueur_minimale=200):
     paragraphes = texte.split("\n\n")  # Divise le texte en paragraphes en utilisant des doubles sauts de ligne
     longs_paragraphes = [paragraphe.strip() for paragraphe in paragraphes if len(paragraphe) >= longueur_minimale]
-    return "\n\n".join(longs_paragraphes)
 # Titre de l'application
 st.title("Afficher les longs paragraphes d'un fichier PDF")
@@ -27,12 +27,10 @@ if uploaded_file is not None:
         page_paragraphs = page_text.split("\n\n")  # Divisez en paragraphes
         paragraphs.extend(page_paragraphs)
-    # Concaténez les paragraphes en un seul texte
-    full_text = "\n\n".join(paragraphs)
     # Utilisez la fonction pour extraire les longs paragraphes
-    longs_paragraphes = extraire_long_paragraphes(full_text, longueur_minimale=200)
-    # Affichez les longs paragraphes extraits
     st.subheader("Longs paragraphes du PDF:")
-    st.text(longs_paragraphes)

 def extraire_long_paragraphes(texte, longueur_minimale=200):
     paragraphes = texte.split("\n\n")  # Divise le texte en paragraphes en utilisant des doubles sauts de ligne
     longs_paragraphes = [paragraphe.strip() for paragraphe in paragraphes if len(paragraphe) >= longueur_minimale]
+    return longs_paragraphes
 # Titre de l'application
 st.title("Afficher les longs paragraphes d'un fichier PDF")
         page_paragraphs = page_text.split("\n\n")  # Divisez en paragraphes
         paragraphs.extend(page_paragraphs)
     # Utilisez la fonction pour extraire les longs paragraphes
+    longs_paragraphes = extraire_long_paragraphes("\n\n".join(paragraphs), longueur_minimale=200)
+    # Affichez les longs paragraphes extraits avec des numéros
     st.subheader("Longs paragraphes du PDF:")
+    for i, paragraphe in enumerate(longs_paragraphes, start=1):
+        st.text(f"Paragraphe {i}: {paragraphe}")