Spaces:

adarshninja
/

ai-research-paper-explainer

Sleeping

Upload 20 files

0fda845 verified 2 months ago

334 Bytes

	import fitz
	import pymupdf

	def extract_text_from_pdf(pdf_path: str, max_pages: int = 150):
	doc = fitz.open(pdf_path)
	pages_text = []

	for i, page in enumerate(doc):
	if i >= max_pages:
	break
	text = page.get_text("text")
	pages_text.append(text)
	return pages_text