File size: 485 Bytes
ed508fd | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 | import PyPDF2
def extract_text_from_pdf(pdf_file):
pdf_reader = PyPDF2.PdfFileReader(pdf_file)
num_pages = pdf_reader.numPages
text = ""
for page_num in range(num_pages):
page = pdf_reader.getPage(page_num)
text += page.extract_text()
return text
def process_text_file(text_file):
text_content = text_file.read().decode('utf-8')
# Führe hier die Verarbeitung des Textdokuments durch und gib das Ergebnis zurück
return text_content
|