Spaces:

luminoria
/

AutoScholar

Sleeping

App Files Files Community

AutoScholar / app /agent /nodes /reader.py

Lumiin0us

refactor: move API keys to environment variables, add gitignore

d9d3b1d 2 months ago

history blame contribute delete

526 Bytes

	import httpx
	from bs4 import BeautifulSoup
	from agent.state import ResearchState

	def reader_node(state: ResearchState):
	scraped = []

	for result in state['search_results'][:3]: # top 3 only
	try:
	response = httpx.get(result['url'], timeout=5)
	soup = BeautifulSoup(response.text, 'html.parser')
	text = ' '.join(p.text for p in soup.find_all('p'))
	scraped.append(text[:2000])
	except:
	continue

	return {"scraped_content": scraped}