Final_Assignment_Template

Sleeping

MatteoFalcioni

changed structure fully

9e20032 8 months ago

2.32 kB

	from langchain_core.tools import tool
	from langchain.tools import tool
	import os
	from langchain_community.tools.tavily_search import TavilySearchResults
	from langchain_community.document_loaders import YoutubeLoader
	from langchain_community.document_loaders import ArxivLoader, WikipediaLoader
	from dotenv import load_dotenv


	@tool
	def web_search(query: str) -> str:
	"""Search Tavily for a query and return maximum 3 results.
	Args:
	query: The search query."""
	search_docs = TavilySearchResults(max_results=3).invoke(input=query)
	formatted_search_docs = "\n\n---\n\n".join(
	[
	f'<Document source="{doc["url"]}" />\n{doc["content"]}\n</Document>'
	for doc in search_docs
	]
	)
	return {"web_results": formatted_search_docs}


	@tool
	def youtube_transcription_tool(url: str) -> str:
	"""
	This tool returns transcript of the youtube video.
	Args:
	url: youtube video url
	"""
	loader = YoutubeLoader.from_youtube_url(url,
	add_video_info=False
	)

	return loader.load()[0].page_content


	@tool
	def arxiv_search(query: str) -> str:
	"""Search Arxiv for a query and return maximum 3 result.
	Args:
	query: The search query."""
	search_docs = ArxivLoader(query=query, load_max_docs=3).load()
	formatted_search_docs = "\n\n---\n\n".join(
	[
	f'<Document source="{doc.metadata["Title"]}" page="{doc.metadata.get("page", "")}"/>\n{doc.page_content}\n</Document>'
	for doc in search_docs
	]
	)
	return {"arxiv_results": formatted_search_docs}


	@tool
	def wiki_search(query: str) -> str:
	"""Search Wikipedia for a query and return maximum 2 results.
	Args:
	query: The search query."""
	search_docs = WikipediaLoader(query=query, load_max_docs=2).load()
	formatted_search_docs = "\n\n---\n\n".join(
	[
	f'<Document source="{doc.metadata["source"]}" page="{doc.metadata.get("page", "")}"/>\n{doc.page_content}\n</Document>'
	for doc in search_docs
	]
	)
	return {"wiki_results": formatted_search_docs}


	# Export the tools in a list
	TOOLS = [
	web_search,
	wiki_search,
	arxiv_search,
	youtube_transcription_tool
	]