newoz commited on
Commit
1f8a2a4
·
1 Parent(s): b59663b

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +8 -7
app.py CHANGED
@@ -11,16 +11,17 @@ if uploaded_file is not None:
11
  # Lecture du contenu du fichier PDF
12
  pdf_document = fitz.open(stream=uploaded_file.read(), filetype="pdf")
13
 
14
- # Créez une liste pour stocker le texte de chaque page
15
- pdf_text = []
16
 
17
  # Parcourez toutes les pages et extrayez le texte
18
  for page_number in range(pdf_document.page_count):
19
  page = pdf_document.load_page(page_number)
20
  page_text = page.get_text()
21
- pdf_text.append(page_text)
 
22
 
23
- # Affichez le texte complet du PDF
24
- st.subheader("Texte complet du PDF:")
25
- full_text = "\n".join(pdf_text)
26
- st.text(full_text)
 
11
  # Lecture du contenu du fichier PDF
12
  pdf_document = fitz.open(stream=uploaded_file.read(), filetype="pdf")
13
 
14
+ # Créez une liste pour stocker les paragraphes
15
+ paragraphs = []
16
 
17
  # Parcourez toutes les pages et extrayez le texte
18
  for page_number in range(pdf_document.page_count):
19
  page = pdf_document.load_page(page_number)
20
  page_text = page.get_text()
21
+ page_paragraphs = split_into_paragraphs(page_text)
22
+ paragraphs.extend(page_paragraphs)
23
 
24
+ # Affichez les paragraphes du PDF
25
+ st.subheader("Paragraphes du PDF:")
26
+ for paragraph in paragraphs:
27
+ st.text(paragraph)