Spaces:

Lui3ui3ui
/

BookRecommender

Sleeping

App Files Files Community

Lui3ui3ui commited on Jul 3, 2025

Commit

173c019

verified ·

1 Parent(s): 4a804c6

Upload 7 files

Browse files

Files changed (6) hide show

.gitignore +1 -0
README.md +3 -13
agents.py +192 -0
app.py +38 -0
requirements.txt +5 -0
search.py +35 -0

.gitignore ADDED Viewed

	@@ -0,0 +1 @@


1	+ _pycache_/

README.md CHANGED Viewed

@@ -1,13 +1,3 @@
----
-title: BookRecommender
-emoji: 👁
-colorFrom: green
-colorTo: yellow
-sdk: gradio
-sdk_version: 5.35.0
-app_file: app.py
-pinned: false
-short_description: Recommends books by utilising web search.
----
-Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

+A simple book recommendation agent.
+Utilises ollama/llama3 and web search via DuckDuckGo.
+Usage is pretty self explanatory.

agents.py ADDED Viewed

	@@ -0,0 +1,192 @@

+from langgraph.graph import StateGraph, END
+from search import duckduckgo_search
+import ollama
+import asyncio
+import re
+import json
+import asyncio
+import ast
+class AsyncLogger:
+    def __init__(self):
+        self._log = []
+        self._lock = asyncio.Lock()
+    async def log(self, message):
+        async with self._lock:
+            self._log.append(message)
+    async def get_log(self):
+        async with self._lock:
+            return "\n".join(self._log)
+    async def clear(self):
+        async with self._lock:
+            self._log.clear()
+logger = AsyncLogger()
+def extract_json_array(text):
+    # Extract JSON block from anywhere in the text
+    pattern = r"(\[.*?\])"  # non-greedy match to get the smallest bracketed block
+    matches = re.findall(pattern, text, flags=re.DOTALL)
+    for candidate in matches:
+        try:
+            # Attempt to load as JSON
+            return json.loads(candidate)
+        except json.JSONDecodeError as e:
+            print(f"json.loads error: {e}")
+            continue
+    return []
+# Node 1: Extract books from user input
+async def extract_books_node(state):
+    await logger.clear()
+    user_input = state.get("user_input", "")
+    prompt = (
+        "Extract all book titles and authors from the following text. "
+        "If an author is missing, fill it in using your knowledge. "
+        "Output only a JSON list of dicts like this:\n"
+        '[{"title": "...", "author": "..."}, ...]\n\n'
+        f"User input: {user_input}"
+    )
+    response = ollama.chat(model="llama3", messages=[{"role": "user", "content": prompt}])
+    content = response['message']['content']
+    print("[extract_books_node] LLM raw response:", content)
+    await logger.log(f"[extract_books_node] LLM response: {content}")
+    books = extract_json_array(content)
+    if not books:
+        await logger.log("[extract_books_node] Failed to extract valid book list from LLM response.")
+    else:
+        await logger.log(f"[extract_books_node] Extracted books: {books}")
+    print("[extract_books_node] Extracted books:", books)
+    return {"extracted_books": books}
+# Node 2
+async def recommend_books_node(state):
+    extracted_books = state.get("extracted_books", [])
+    reasoning_steps = []
+    recommended_books = []
+    print("[recommend_books_node] Extracted books:", extracted_books)
+    await logger.log(f"[recommend_books_node] Extracted books: {extracted_books}")
+    if not extracted_books:
+        reasoning_steps.append("No books extracted from the input. Check if the extraction failed.")
+        return {"recommendations": [], "reasoning": "\n".join(reasoning_steps)}
+    for book in extracted_books:
+        title = book.get("title", "")
+        author = book.get("author", "")
+        query = f"Books similar to '{title}' by {author}"
+        reasoning_steps.append(f"Searching DuckDuckGo with query: {query}")
+        print(f"[recommend_books_node] Searching with query: {query}")
+        await logger.log(f"Searching DuckDuckGo with query: {query}")
+        search_results = await duckduckgo_search(query)
+        if not search_results:
+            reasoning_steps.append(f"No results found for: {query}")
+            print(f"[recommend_books_node] No results found for query: {query}")
+            await logger.log(f"No results found for query: {query}")
+            continue
+        print(f"[recommend_books_node] Results for query '{query}': {search_results}")
+        await logger.log(f"Results for query '{query}': {search_results}")
+        for res in search_results:
+            recommended_books.append({
+                "title": res.get("title", "No Title"),
+                "link": res.get("link", ""),
+                "snippet": res.get("snippet", "")
+            })
+            reasoning_steps.append(f"✅ Found: {res.get('title', 'No Title')} ({res.get('link', '')})")
+    if not recommended_books:
+        reasoning_steps.append("No recommendations found across all queries.")
+    print("[recommend_books_node] Final recommendations:", recommended_books)
+    await logger.log(f"Final recommendations: {recommended_books}")
+    return {
+        "recommendations": recommended_books,
+        "reasoning": "\n".join(reasoning_steps)
+    }
+# Node 3: Reason about the search results and generate recommendations
+async def reasoning_node(state):
+    recommendations = state.get("recommendations", [])
+    initial_reasoning = state.get("reasoning", "")
+    if not recommendations:
+        final_reasoning = initial_reasoning + "\nNo recommendations found to reason about."
+        return {"final_recommendations": [], "final_reasoning": final_reasoning}
+    # Format recommendations as input for the LLM
+    recommendations_text = "\n".join(
+        [f"Title: {rec['title']}\nLink: {rec['link']}\nSnippet: {rec['snippet']}\n" for rec in recommendations]
+    )
+    prompt = (
+    "You are a helpful book recommendation expert. You are given a web search result. "
+    "Analyze it and select the most relevant book recommendations. Explain why you recommend each book. "
+    "Output only a JSON list like this:\n"
+    '[{"title": "...", "reason": "...", "link": "..."}, ...]\n\n'
+    "Do not add any explanations, comments, or extra text. Only output the JSON list.\n\n"
+    f"Books found from search:\n{recommendations_text}"
+)
+    response = ollama.chat(model="llama3", messages=[{"role": "user", "content": prompt}])
+    content = response['message']['content']
+    print("[reasoning_node] LLM raw response:", content)
+    await logger.log(f"[reasoning_node] LLM response: {content}")
+    # Extract JSON-like structure
+    final_recommendations = extract_json_array(content)
+    if not final_recommendations:
+        await logger.log("[reasoning_node] Failed to extract final recommendations from LLM response.")
+    else:
+        await logger.log(f"[reasoning_node] Final recommendations: {final_recommendations}")
+    # Combine previous reasoning with the final reasoning
+    final_reasoning = initial_reasoning + "\n\nFinal reasoning:\n"
+    for rec in final_recommendations:
+        final_reasoning += f"✅ Recommended: {rec.get('title', 'Unknown')} - {rec.get('reason', 'No reason provided.')}\n"
+    print("[reasoning_node] Final recommendations extracted:", final_recommendations)
+    print("[reasoning_node] Final reasoning:\n", final_reasoning)
+    await logger.log(f"[reasoning_node] Final recommendations extracted: {final_recommendations}")
+    await logger.log(f"[reasoning_node] Final reasoning:\n{final_reasoning}")
+    return {
+        "final_recommendations": final_recommendations,
+        "final_reasoning": final_reasoning
+    }
+# Build the graph
+def build_graph():
+    graph = StateGraph(dict)
+    graph.add_node("extract_books", extract_books_node)
+    graph.add_node("recommend_books", recommend_books_node)
+    graph.add_node("reasoning", reasoning_node)
+    # Define edges
+    graph.add_edge("extract_books", "recommend_books")
+    graph.add_edge("recommend_books", "reasoning")
+    graph.add_edge("reasoning", END)
+    graph.set_entry_point("extract_books")
+    return graph.compile()

app.py ADDED Viewed

	@@ -0,0 +1,38 @@

+import gradio as gr
+from agents import build_graph
+import asyncio
+# Build the LangGraph once
+graph = build_graph()
+async def run_book_recommender(user_input):
+    initial_state = {"user_input": user_input}
+    async for state in graph.astream(initial_state):
+        final_state = state
+    print("[app.py] Final state:", final_state)
+    # Access the nested "reasoning" key
+    reasoning_data = final_state.get("reasoning", {})
+    recommendations = reasoning_data.get("final_recommendations", [])
+    reasoning = reasoning_data.get("final_reasoning", "")
+    recommendations_text = "\n\n".join(
+        [f"📘 {rec['title']}\n🔗 {rec.get('link', '')}\n💡 {rec.get('reason', '')}" for rec in recommendations]
+    ) or "No recommendations found."
+    return recommendations_text, reasoning
+# Gradio UI
+with gr.Blocks() as demo:
+    gr.Markdown("# 📚 AI Book Recommender")
+    user_input = gr.Textbox(label="Tell me some books you like")
+    recommend_btn = gr.Button("Get Recommendations")
+    recommendations_output = gr.Textbox(label="Recommended Books", lines=10)
+    reasoning_output = gr.Textbox(label="Reasoning / Debug Log", lines=15)
+    recommend_btn.click(run_book_recommender, inputs=user_input, outputs=[recommendations_output, reasoning_output])
+if __name__ == "__main__":
+    demo.launch()

requirements.txt ADDED Viewed

	@@ -0,0 +1,5 @@

+langgraph
+ollama
+gradio
+httpx
+selectolax

search.py ADDED Viewed

	@@ -0,0 +1,35 @@

+# search.py (modify to accept logger)
+import httpx
+from selectolax.parser import HTMLParser
+async def duckduckgo_search(query, max_results=5, logger=None):
+    if logger:
+        await logger.log(f"[duckduckgo_search] Searching for query: {query}")
+    url = f"https://html.duckduckgo.com/html/?q={query}"
+    headers = {"User-Agent": "Mozilla/5.0"}
+    async with httpx.AsyncClient() as client:
+        response = await client.get(url, headers=headers, timeout=10)
+    html = HTMLParser(response.text)
+    results = []
+    for result in html.css("div.result")[:max_results]:
+        title_el = result.css_first("a.result__a")
+        snippet_el = result.css_first(".result__snippet")
+        if title_el and snippet_el:
+            title = title_el.text(strip=True)
+            link = title_el.attributes.get("href", "")
+            snippet = snippet_el.text(strip=True)
+            results.append({"title": title, "link": link, "snippet": snippet})
+            if logger:
+                await logger.log(f"[duckduckgo_search] Found result: {title} - {link}")
+        else:
+            if logger:
+                await logger.log("[duckduckgo_search] Skipped a result due to missing title or snippet.")
+    if logger:
+        await logger.log(f"[duckduckgo_search] Total results found: {len(results)}")
+    return results