Spaces:

akashe
/

really-deep-research

Sleeping

App Files Files Community

really-deep-research / tools /serper_tool.py

akashe

Initial Deployment

a559920 5 months ago

raw

history blame contribute delete

4.77 kB

	# tools/serper_tool.py
	import os, requests, html
	from this import d
	from typing import Literal, Optional, Dict, Any, List, TypedDict
	from agents import function_tool # from OpenAI Agents SDK (python)
	from dotenv import load_dotenv
	from copy import deepcopy

	load_dotenv(override=True)

	SERPER_API_KEY = os.getenv("SERPER_API_KEY")
	SERPER_BASE = "https://google.serper.dev"

	class SerperItem(TypedDict, total=False):
	title: str
	link: str
	snippet: str
	source: str
	date: str
	position: int

	def _has_quotes(s: str) -> bool:
	return '"' in s

	def _dequote(s: str) -> str:
	return s.replace('"','')

	def _log_empty_debug(query: str, data: Dict[str, Any]) -> None:
	try:
	keys = list(data.keys())
	extras = {k: (len(data.get(k) or []) if isinstance(data.get(k), list)
	else ("obj" if isinstance(data.get(k), dict) else bool(data.get(k))))
	for k in ("organic","news","topStories","answerBox","knowledgeGraph","peopleAlsoAsk")}
	print(f"[serper empty] q={query!r} keys={keys} extras={extras}")
	except Exception:
	pass

	def _http_post(endpoint: str, payload: Dict[str, Any]) -> Dict[str, Any]:
	if not SERPER_API_KEY:
	raise RuntimeError("SERPER_API_KEY not set")
	resp = requests.post(
	f"{SERPER_BASE}/{endpoint}",
	headers={"X-API-KEY": SERPER_API_KEY, "Content-Type": "application/json"},
	json=payload,
	timeout=20,
	)
	resp.raise_for_status()
	return resp.json()

	def _normalize_search(data: Dict[str, Any]) -> List[SerperItem]:
	items: List[SerperItem] = []
	for it in data.get("organic", []) or []:
	items.append({
	"title": it.get("title"),
	"link": it.get("link"),
	"snippet": it.get("snippet"),
	"date": it.get("date"),
	"position": it.get("position"),
	})
	# Include Answer Box / KG as pseudo-items (optional)
	ab = data.get("answerBox")
	if ab and isinstance(ab, dict) and ab.get("title") and ab.get("link"):
	items.insert(0, {"title": ab.get("title"), "link": ab.get("link"), "snippet": ab.get("snippet", "")})
	return items

	def _normalize_news(data: Dict[str, Any]) -> List[SerperItem]:
	items: List[SerperItem] = []
	for it in data.get("news", []) or []:
	items.append({
	"title": it.get("title"),
	"link": it.get("link"),
	"source": it.get("source"),
	"date": it.get("date"),
	"snippet": it.get("snippet"),
	})
	return items

	@function_tool
	def serper_search(
	q: str,
	kind: Literal["search", "news"] = "search",
	num: int = 10,
	page: int = 1,
	gl: str = "us",
	hl: str = "en",
	tbs: Optional[str] = None,
	) -> Dict[str, Any]:
	"""
	Google web/news search via Serper.dev.

	Args:
	q: The search query (use operators like site:, filetype:, OR, -term, "exact").
	kind: "search" (standard web) or "news".
	num: Number of results to return (1–20 typical).
	page: Results page (1-based).
	gl: Country code (e.g., "us","gb","in","de").
	hl: Interface language (e.g., "en","de","ja").
	tbs: Optional Google time filter (e.g., "qdr:d","qdr:w","qdr:m").
	Returns:
	JSON with {"kind","query","items":[{title,link,snippet,source?,date?,position?}], "raw":{...}}
	"""
	payload = {"q": q, "num": num, "page": page, "gl": gl, "hl": hl}
	if tbs:
	payload["tbs"] = tbs

	endpoint = "news" if kind == "news" else "search"
	data = _http_post(endpoint, payload)

	items = _normalize_news(data) if kind == "news" else _normalize_search(data)
	# basic HTML unescape on snippets
	for it in items:
	if "snippet" in it and it["snippet"]:
	it["snippet"] = html.unescape(it["snippet"])

	if not items and _has_quotes(q):
	print(f'Got no results with the serper query {q}, trying a relaxed query.')
	q_relaxed = _dequote(q)
	payload_new = deepcopy(payload)
	payload_new["q"] = q_relaxed
	data2 = _http_post(endpoint, payload_new)
	items2 = _normalize_news(data2) if kind == "news" else _normalize_search(data2)
	if items2:
	for it in items2:
	if "snippet" in it and it["snippet"]:
	it["snippet"] = html.unescape(it["snippet"])
	return {
	"kind": kind,
	"query": q_relaxed,
	"items": items2,
	"raw": {"meta": {k: data2.get(k) for k in ("knowledgeGraph","answerBox","topStories","peopleAlsoAsk")}}
	}

	return {"kind": kind, "query": q, "items": items, "raw": {"meta": {k: data.get(k) for k in ("knowledgeGraph","answerBox","topStories","peopleAlsoAsk")}}}