Spaces:

Agents-MCP-Hackathon
/

YouTwo

Sleeping

Tanuj

Move files to src folder

180024b 8 months ago

1.21 kB

	from smolagents import tool
	from src.schemas import VectaraDocuments
	from src.yt_rag.rag import fetch_documents_from_corpus, retrieve_chunks

	@tool
	def retrieve_tool(query: str, limit: int = 5, filter_by_id: str = None) -> dict[str, list[str] \| str]:
	"""
	Retrieve chunks by relevance to a query

	Args:
	query: The query to retrieve chunks for
	limit: The maximum number of chunks to retrieve (default: 5)
	filter_by_id: A document ID to filter by
	Returns:
	A list of chunks, and a grounded summary
	"""
	chunks, vectara_summary = retrieve_chunks(query, limit, filter_by_id)
	return {
	"chunks": chunks,
	"summary": vectara_summary
	}

	@tool
	def inspect_database_tool() -> str:
	"""
	Inspect the vector database

	Returns:
	A list of documents
	"""
	results = fetch_documents_from_corpus(limit = 50)
	documents = VectaraDocuments(documents = results["documents"])
	id_list = [document["id"] for document in documents["documents"]]
	final_string = "The following documents IDs are in the vector database:\n"
	for i, id in enumerate(id_list):
	final_string += f"{i+1}. {id}\n"
	return final_string