Spaces:

pareaud
/

SchmidtAI

Sleeping

App Files Files Community

pareaud commited on Jun 16, 2025

Commit

b1abcde

verified ·

1 Parent(s): cef6b45

Update app.py

Browse files

Files changed (1) hide show

app.py +48 -104

app.py CHANGED Viewed

@@ -1,18 +1,12 @@
-"""
-Gradio app utilisant la nouvelle API OpenAI (>=1.0) + tool calls
-----------------------------------------------------------------
-• Le recours à l’outil `extract_user_info` est forcé et relancé au besoin.
-• La clé API est désormais **codée en dur** (non recommandé en production).
-"""
 import json
-from typing import Dict, Any
 import gradio as gr
 from openai import OpenAI
 # ------------------------------------------------------------------
-# 1 — Initialisation du client OpenAI (clé codée en dur)
 # ------------------------------------------------------------------
 client = OpenAI(
@@ -20,108 +14,64 @@ client = OpenAI(
 )
 # ------------------------------------------------------------------
-# 2 — Définition du schéma JSON (outil)
 # ------------------------------------------------------------------
-extraction_schema: Dict[str, Any] = {
-    "name": "extract_user_info",
-    "description": (
-        "Extrait des informations personnelles depuis un texte libre pour "
-        "remplir un formulaire administratif"
-    ),
-    "parameters": {
-        "type": "object",
-        "properties": {
-            "nom": {"type": "string"},
-            "prenom": {"type": "string"},
-            "date_naissance": {
-                "type": "string",
-                "description": "au format YYYY-MM-DD",
-            },
-            "lieu_naissance": {"type": "string"},
-            "nationalite": {"type": "string"},
-            "adresse": {
-                "type": "object",
-                "properties": {
-                    "numero": {"type": "string"},
-                    "rue": {"type": "string"},
-                    "batiment": {"type": "string"},
-                    "appartement": {"type": "string"},
-                    "code_postal": {"type": "string"},
-                    "ville": {"type": "string"},
-                },
-            },
-            "email": {"type": "string"},
-            "telephone": {"type": "string"},
-            "situation_familiale": {"type": "string"},
-            "nombre_enfants": {"type": "integer"},
-            "emploi": {"type": "string"},
-            "nom_employeur": {"type": "string"},
-            "type_piece_identite": {"type": "string"},
-            "numero_piece_identite": {"type": "string"},
-            "date_delivrance_piece": {"type": "string"},
-            "lieu_delivrance_piece": {"type": "string"},
-            "situation_logement": {"type": "string"},
-        },
-        "required": ["nom", "prenom", "date_naissance", "adresse"],
-    },
-}
-TOOLS = [{"type": "function", "function": extraction_schema}]
 SYSTEM_PROMPT = (
     "Tu es un assistant administratif. À partir d’un texte mal rédigé, "
-    "tu dois extraire les informations personnelles sous forme de JSON "
-    "conforme au schéma fourni. Ne réponds JAMAIS hors JSON. "
-    "Utilise IMPÉRATIVEMENT l'outil extract_user_info."
 )
 # ------------------------------------------------------------------
-# 3 — Fonction d'extraction avec relance forcée
 # ------------------------------------------------------------------
 def extraire_infos(texte: str) -> str:
-    """Renvoie le JSON extrait ou une erreur si l’outil n’est jamais appelé."""
-    messages = [
-        {"role": "system", "content": SYSTEM_PROMPT},
-        {"role": "user", "content": texte},
-    ]
-    for attempt in range(2):  # on tente deux fois maximum
-        response = client.chat.completions.create(
-            model="gpt-4o-mini",  # ou gpt-3.5-turbo-0125
             temperature=0,
-            messages=messages,
-            tools=TOOLS,
-            tool_choice={
-                "type": "function",
-                "function": {"name": "extract_user_info"},
-            },
         )
-        choice = response.choices[0]
-        if choice.finish_reason == "tool_calls":
-            args_str = choice.message.tool_calls[0].function.arguments
-            parsed = json.loads(args_str)
-            return json.dumps(parsed, indent=2, ensure_ascii=False)
-        # Pas d'appel d'outil : on renforce l'instruction et on réessaie
-        messages.insert(
-            0,
-            {
-                "role": "system",
-                "content": (
-                    "⚠️ Utilise OBLIGATOIREMENT l'outil extract_user_info et "
-                    "ne renvoie jamais de texte libre."
-                ),
-            },
-        )
-    return (
-        "❌ Erreur : le modèle n'a pas renvoyé d'appel d'outil après deux "
-        "tentatives."
-    )
 # ------------------------------------------------------------------
 # 4 — Interface Gradio
@@ -142,16 +92,10 @@ with gr.Blocks(title="Extracteur intelligent de données CERFA") as demo:
         "L'IA le transforme en JSON prêt pour l'administration."
     )
-    input_box = gr.Textbox(
-        lines=14,
-        label="Texte à corriger et structurer",
-        value=texte_exemple,
-    )
     output_box = gr.Code(label="Résultat JSON structuré")
-    extract_btn = gr.Button("Extraire les données")
-    extract_btn.click(extraire_infos, input_box, output_box)
 # ------------------------------------------------------------------
 # 5 — Lancement

 import json
+from typing import Optional, List
 import gradio as gr
+from pydantic import BaseModel
 from openai import OpenAI
 # ------------------------------------------------------------------
+# 1 — Initialisation OpenAI (clé codée)
 # ------------------------------------------------------------------
 client = OpenAI(
 )
 # ------------------------------------------------------------------
+# 2 — Définition du schéma via Pydantic
 # ------------------------------------------------------------------
+class Adresse(BaseModel):
+    numero: str | None
+    rue: str | None
+    batiment: str | None
+    appartement: str | None
+    code_postal: str | None
+    ville: str | None
+class UserInfo(BaseModel):
+    nom: str
+    prenom: str
+    date_naissance: str  # YYYY-MM-DD
+    lieu_naissance: Optional[str]
+    nationalite: Optional[str]
+    adresse: Adresse
+    email: Optional[str]
+    telephone: Optional[str]
+    situation_familiale: Optional[str]
+    nombre_enfants: Optional[int]
+    emploi: Optional[str]
+    nom_employeur: Optional[str]
+    type_piece_identite: Optional[str]
+    numero_piece_identite: Optional[str]
+    date_delivrance_piece: Optional[str]
+    lieu_delivrance_piece: Optional[str]
+    situation_logement: Optional[str]
 SYSTEM_PROMPT = (
     "Tu es un assistant administratif. À partir d’un texte mal rédigé, "
+    "tu dois extraire les informations personnelles et renvoyer un JSON "
+    "conforme au schéma. N'utilise jamais de prose."
 )
 # ------------------------------------------------------------------
+# 3 — Fonction d'extraction (Structured Outputs)
 # ------------------------------------------------------------------
 def extraire_infos(texte: str) -> str:
+    try:
+        response = client.responses.parse(
+            model="gpt-4o-mini",  # compatible Structured Outputs
+            input=[
+                {"role": "system", "content": SYSTEM_PROMPT},
+                {"role": "user", "content": texte},
+            ],
+            text_format=UserInfo,  # Pydantic -> JSON Schema
+            strict=True,
             temperature=0,
         )
+        parsed = response.output_parsed  # instance de UserInfo
+        return json.dumps(parsed.model_dump(), indent=2, ensure_ascii=False)
+    except Exception as e:
+        return f"❌ Erreur : {e}"
 # ------------------------------------------------------------------
 # 4 — Interface Gradio
         "L'IA le transforme en JSON prêt pour l'administration."
     )
+    input_box = gr.Textbox(lines=14, label="Texte à corriger et structurer", value=texte_exemple)
     output_box = gr.Code(label="Résultat JSON structuré")
+    gr.Button("Extraire les données").click(extraire_infos, input_box, output_box)
 # ------------------------------------------------------------------
 # 5 — Lancement