Spaces:

julesbonnard
/

asknews

Sleeping

App Files Files Community

julesbonnard commited on Sep 26, 2025

Commit

1e22cda

1 Parent(s): d5653aa

works with context

Browse files

Files changed (4) hide show

.gitignore +2 -0
README.md +8 -6
app.py +279 -0
requirements.txt +5 -0

.gitignore ADDED Viewed

	@@ -0,0 +1,2 @@


1	+ env
2	+ .env

README.md CHANGED Viewed

@@ -1,12 +1,14 @@
 ---
 title: Asknews
-emoji: 📉
-colorFrom: green
-colorTo: yellow
 sdk: gradio
-sdk_version: 5.47.1
 app_file: app.py
 pinned: false
 ---
-Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

 ---
 title: Asknews
+emoji: 💬
+colorFrom: yellow
+colorTo: purple
 sdk: gradio
+sdk_version: 5.42.0
 app_file: app.py
 pinned: false
+hf_oauth: true
+hf_oauth_scopes:
+- inference-api
 ---
+An example chatbot using [Gradio](https://gradio.app), [`huggingface_hub`](https://huggingface.co/docs/huggingface_hub/v0.22.2/en/index), and the [Hugging Face Inference API](https://huggingface.co/docs/api-inference/index).

app.py ADDED Viewed

	@@ -0,0 +1,279 @@

+# app.py
+import os
+import datetime
+import logging
+from typing import List, Dict, Optional
+from dotenv import load_dotenv
+load_dotenv()
+import gradio as gr
+from huggingface_hub import InferenceClient, InferenceTimeoutError
+from asknews_sdk import AskNewsSDK
+DEFAULT_MODEL = "openai/gpt-oss-20b"
+LOG_LEVEL = os.getenv("ASKNEWS_LOG_LEVEL", "INFO").upper()
+logging.basicConfig(level=getattr(logging, LOG_LEVEL, logging.INFO))
+logger = logging.getLogger("asknews_app")
+# ---- AskNews setup ----
+def get_asknews_sdk() -> Optional[AskNewsSDK]:
+    """
+    Initialize AskNews SDK using environment variables.
+    Returns None if missing credentials.
+    """
+    client_id = os.getenv("ASKNEWS_CLIENT_ID", "").strip()
+    client_secret = os.getenv("ASKNEWS_CLIENT_SECRET", "").strip()
+    if not client_id or not client_secret:
+        logger.warning("AskNews credentials are missing; skipping SDK init.")
+        return None
+    try:
+        sdk = AskNewsSDK(
+            client_id=client_id,
+            client_secret=client_secret,
+            scopes=["news"]
+          )
+        logger.info("AskNews SDK initialised successfully.")
+        return sdk
+    except Exception as exc:
+        logger.exception("Failed to initialise AskNews SDK: %s", exc)
+        return None
+def safe_iso_date(dt: Optional[str]) -> str:
+    """Format date string safely for display."""
+    if not dt:
+        return ""
+    try:
+        # Attempt parsing common formats; if fails, return as-is
+        # AskNews typically returns ISO timestamps
+        d = datetime.datetime.fromisoformat(dt.replace("Z", "+00:00"))
+        return d.strftime("%Y-%m-%d")
+    except Exception:
+        return dt
+def fetch_asknews_context(
+    sdk: AskNewsSDK,
+    query: str,
+    hours_back: int,
+    n_articles: int,
+    domains: List[str],
+) -> str:
+    """
+    Récupère le contexte texte directement depuis AskNews (return_type="string").
+    Retourne context_text
+    """
+    logger.info(
+        "Fetching AskNews context: query=%s, hours_back=%s, n_articles=%s, domains=%s",
+        query,
+        hours_back,
+        n_articles,
+        domains,
+    )
+    try:
+        response = sdk.news.search_news(
+            query=query,
+            hours_back=hours_back,
+            n_articles=n_articles,
+            historical=True,
+            premium=True,
+            method="nl",
+            domain_url=domains if domains else None,
+            return_type="string",  # Demande le contexte déjà formaté
+        ).as_string
+        # response est une chaîne de caractères contenant le contexte
+        context = response if isinstance(response, str) else ""
+        logger.info("AskNews context received (%s chars)", len(context))
+        return context
+    except Exception:
+        logger.exception("AskNews context fetch failed.")
+        return ""
+# ---- Chat respond function ----
+def respond(
+    message: str,
+    history: List[Dict[str, str]],
+    system_message: str,
+    max_tokens: int,
+    temperature: float,
+    top_p: float,
+    hf_token: gr.OAuthToken,
+    model_name: str = DEFAULT_MODEL,
+    use_asknews: bool = True,
+    asknews_hours_back: int = 24*30,
+    asknews_n_articles: int = 10,
+    asknews_domains_csv: str = "afp.com",
+):
+    """
+    Stream chat responses from HF, enriching with AskNews context when enabled.
+    """
+    # Validate OAuth token for HF
+    if hf_token is None or hf_token.token is None or hf_token.token.strip() == "":
+        yield "Veuillez vous connecter à Hugging Face via le bouton Login dans la barre latérale."
+        return
+    # Prepare AskNews SDK if requested
+    sdk = get_asknews_sdk() if use_asknews else None
+    asknews_context = ""
+    if sdk is not None:
+        domains = [d.strip() for d in asknews_domains_csv.split(",") if d.strip()]
+        logger.info(
+            "AskNews enabled; fetching context with hours_back=%s, n_articles=%s, domains=%s",
+            asknews_hours_back,
+            asknews_n_articles,
+            domains,
+        )
+        asknews_context = fetch_asknews_context(
+            sdk=sdk,
+            query=message,
+            hours_back=asknews_hours_back,
+            n_articles=asknews_n_articles,
+            domains=domains,
+        )
+        if asknews_context:
+            logger.info("AskNews context will be injected (chars=%s)", len(asknews_context))
+        else:
+            logger.warning("AskNews context is empty after fetch.")
+    # Build messages
+    messages: List[Dict[str, str]] = []
+    base_system = system_message.strip() if system_message else "You are a helpful assistant."
+    messages.append({"role": "system", "content": base_system})
+    # If we have AskNews context, inject it as an additional system guidance
+    if asknews_context:
+        messages.append({
+            "role": "system",
+            "content": (
+                "Use the following news context when answering. If the user's query is unrelated, ignore it.\n\n"
+                f"{asknews_context}"
+            ),
+        })
+    # Include history (roles should be valid)
+    for m in history or []:
+        role = m.get("role")
+        content = m.get("content", "")
+        if role in ("user", "assistant", "system") and content is not None:
+            messages.append({"role": role, "content": str(content)})
+    # Current user message
+    if message is None or str(message).strip() == "":
+        yield "Veuillez saisir un message."
+        return
+    messages.append({"role": "user", "content": str(message).strip()})
+    # Initialize HF client
+    try:
+        client = InferenceClient(token=hf_token.token, model=model_name)
+    except Exception as e:
+        yield f"Échec d'initialisation du client d'inférence HF: {e}"
+        return
+    response_accum = ""
+    # Optional prefix informing about context usage (not counted by model, only displayed)
+    if sdk is None and use_asknews:
+        response_accum = "[AskNews non configuré: définissez ASKNEWS_CLIENT_ID et ASKNEWS_CLIENT_SECRET dans l'environnement.]\n"
+        yield response_accum
+    # if sdk is not None:
+    #     context_display = asknews_context.strip()
+    #     if context_display:
+    #         if len(context_display) > 4000:
+    #             context_display = context_display[:4000] + "\n[Contexte AskNews tronqué pour affichage]"
+    #     else:
+    #         context_display = "[Vide]"
+    #     response_accum += "[Contexte AskNews]\n" + context_display + "\n\n"
+    #     yield response_accum
+    try:
+        for chunk in client.chat_completion(
+            messages=messages,
+            max_tokens=max_tokens,
+            stream=True,
+            temperature=temperature,
+            top_p=top_p,
+        ):
+            try:
+                choices = getattr(chunk, "choices", [])
+                token = ""
+                if choices and getattr(choices[0], "delta", None) is not None:
+                    token_piece = getattr(choices[0].delta, "content", None)
+                    if token_piece:
+                        token = token_piece
+                if token:
+                    response_accum += token
+                    yield response_accum
+            except Exception:
+                continue
+    except InferenceTimeoutError:
+        yield response_accum + "\n\n[Temps dépassé. Réessayez ou réduisez 'Max new tokens'.]"
+    except Exception as e:
+        if response_accum:
+            yield response_accum + f"\n\n[Erreur: {e}]"
+        else:
+            yield f"Erreur de l'API d'inférence: {e}"
+# ---- Gradio UI ----
+chatbot = gr.ChatInterface(
+    fn=respond,
+    type="messages",
+    additional_inputs=[
+        gr.Textbox(value="""Tu es un assistant virtuel conçu pour aider des journalistes d’agence (Agence France-Presse) dans leurs recherches d’information.
+Sources :
+- Tu disposes d’un agent de recherche en langage naturel (Asknews) qui interroge en temps réel le flux des dépêches AFP.
+- Tu dois répondre uniquement avec des informations issues de ces dépêches.
+Mission :
+- Comprendre les requêtes d’un journaliste (souvent courtes, imprécises, ou en langage naturel).
+- Transformer ces requêtes en recherches efficaces dans les dépêches AFP, avec Asknews.
+- Résumer les résultats en style journalistique : factuel, concis, hiérarchisé, neutre.
+- Proposer, si pertinent, des angles complémentaires (ex. contexte historique, réactions, comparaisons, chiffres clés).
+- Permettre au journaliste de raffiner la recherche (par période, sujet, acteurs, pays).
+- Citer les dépêches AFP en retour (référence et date/heure).
+Contraintes :
+- Toujours rester factuel, éviter toute spéculation.
+- Si la question est ambiguë, demander des précisions.
+- Si aucun résultat n’est trouvé, proposer des formulations alternatives de recherche.
+- Résumer les informations de manière actionnable (pour rédaction immédiate).
+Style :
+- Réponses brèves et efficaces.
+- Donner un résumé clair d’abord (les 2–3 points clés).
+- Ajouter ensuite plus de détails, ou des pistes pour approfondir.
+- Toujours indiquer les sources/dépêches AFP d’où viennent les infos.
+""", label="System message"),
+        gr.Slider(minimum=1, maximum=4096, value=512, step=1, label="Max new tokens"),
+        gr.Slider(minimum=0.0, maximum=2.0, value=0.7, step=0.1, label="Temperature"),
+        gr.Slider(minimum=0.05, maximum=1.0, value=0.95, step=0.05, label="Top-p"),
+        gr.Textbox(value=DEFAULT_MODEL, label="Model name"),
+        gr.Checkbox(value=True, label="Utiliser AskNews pour le contexte"),
+        gr.Slider(minimum=96, maximum=24*30, value=24*30, step=24, label="AskNews: heures en arrière"),
+        gr.Slider(minimum=1, maximum=10, value=10, step=1, label="AskNews: nombre d'articles"),
+        gr.Textbox(value="afp.com", label="AskNews: domaines (CSV)"),
+    ]
+)
+with gr.Blocks() as demo:
+    gr.Markdown("# Chatbot HF avec contexte AskNews")
+    with gr.Sidebar():
+        gr.LoginButton()
+        gr.Markdown(
+            "Connectez-vous avec votre compte Hugging Face.\n\n"
+            "Pour activer AskNews, définissez les variables d'environnement:\n"
+            "- ASKNEWS_CLIENT_ID\n"
+            "- ASKNEWS_CLIENT_SECRET\n\n"
+            "Ajustez les paramètres pour contrôler le contexte (heures, domaines, nombre d'articles)."
+        )
+    chatbot.render()
+if __name__ == "__main__":
+    demo.launch()

requirements.txt ADDED Viewed

	@@ -0,0 +1,5 @@

+gradio
+gradio[oauth]
+google-genai
+dotenv
+asknews