Spaces:
Runtime error
Runtime error
Update app.py
Browse files
app.py
CHANGED
|
@@ -5,9 +5,9 @@ from transformers import pipeline
|
|
| 5 |
summarizer = pipeline("summarization", model="facebook/bart-large-cnn")
|
| 6 |
|
| 7 |
# Fonction pour extraire les longs paragraphes à partir du texte
|
| 8 |
-
def extraire_long_paragraphes(texte,
|
| 9 |
paragraphes = texte.split("\n\n") # Divise le texte en paragraphes en utilisant des doubles sauts de ligne
|
| 10 |
-
longs_paragraphes = [paragraphe.strip() for paragraphe in paragraphes if len(paragraphe) >=
|
| 11 |
return longs_paragraphes
|
| 12 |
|
| 13 |
# Titre de l'application
|
|
@@ -31,7 +31,7 @@ if uploaded_file is not None:
|
|
| 31 |
paragraphs.extend(page_paragraphs)
|
| 32 |
|
| 33 |
# Utilisez la fonction pour extraire les longs paragraphes
|
| 34 |
-
longs_paragraphes = extraire_long_paragraphes("\n\n".join(paragraphs),
|
| 35 |
|
| 36 |
# Affichez les longs paragraphes extraits avec des numéros et des résumés
|
| 37 |
st.subheader("Longs paragraphes du PDF avec résumé:")
|
|
|
|
| 5 |
summarizer = pipeline("summarization", model="facebook/bart-large-cnn")
|
| 6 |
|
| 7 |
# Fonction pour extraire les longs paragraphes à partir du texte
|
| 8 |
+
def extraire_long_paragraphes(texte, longueur_maximale=2000):
|
| 9 |
paragraphes = texte.split("\n\n") # Divise le texte en paragraphes en utilisant des doubles sauts de ligne
|
| 10 |
+
longs_paragraphes = [paragraphe.strip() for paragraphe in paragraphes if len(paragraphe) >= longueur_maximale]
|
| 11 |
return longs_paragraphes
|
| 12 |
|
| 13 |
# Titre de l'application
|
|
|
|
| 31 |
paragraphs.extend(page_paragraphs)
|
| 32 |
|
| 33 |
# Utilisez la fonction pour extraire les longs paragraphes
|
| 34 |
+
longs_paragraphes = extraire_long_paragraphes("\n\n".join(paragraphs), longueur_maximale=2000)
|
| 35 |
|
| 36 |
# Affichez les longs paragraphes extraits avec des numéros et des résumés
|
| 37 |
st.subheader("Longs paragraphes du PDF avec résumé:")
|