Spaces:

klydekushy
/

OCR_PROSPECTUS

Sleeping

klydekushy commited on 30 days ago

Commit

5283017

verified ·

1 Parent(s): f3c07b5

Update core/extractor.py

Files changed (1) hide show

core/extractor.py CHANGED Viewed

@@ -73,10 +73,16 @@ class ExtractorEngine:
             et la température réglable depuis l'interface.
             """
             # Utilisation de votre prompt système renforcé pour une fiabilité maximale
-            system_prompt = """Tu es un système d'extraction de graphe de connaissance hautement fiable.
-            Ton objectif est d'extraire toutes les entités et relations pertinentes du texte fourni.
-            Réponds TOUJOURS uniquement en JSON. Le JSON DOIT respecter le schéma spécifié ci-dessous,
-            SANS AUCUNE EXPLICATION SUPPLÉMENTAIRE."""
             # Construction du prompt utilisateur avec le segment de texte
             user_prompt = f"Schéma JSON STRICT à respecter:\n{self.json_schema}\n\nTexte source:\n<<<{text}>>>\n\nRéponse JSON:"

             et la température réglable depuis l'interface.
             """
             # Utilisation de votre prompt système renforcé pour une fiabilité maximale
+            system_prompt = """Tu es un analyste de données expert en extraction d'intelligence documentaire.
+                                Ton objectif est de décomposer le texte en un graphe de connaissances exhaustif.
+                                CONSIGNES DE PRÉCISION :
+                                1. Ne te limite pas aux catégories classiques. Extrais TOUT concept porteur de sens : Montants financiers, Dates, Obligations, Objets, Conditions, Nationalités.
+                                2. Pour chaque entité, crée un ID unique (E1, E2...).
+                                3. Les relations doivent être des VERBES d'action ou des LIENS logiques précis (ex: 'RECONNAIT_DEVOIR', 'ÉCHOIT_LE', 'RÉSIDE_À').
+                                4. Si une entité est mentionnée plusieurs fois, utilise le même nom pour faciliter la fusion.
+                                RÈGLE ABSOLUE : Réponds uniquement au format JSON pur, sans introduction ni conclusion."""
             # Construction du prompt utilisateur avec le segment de texte
             user_prompt = f"Schéma JSON STRICT à respecter:\n{self.json_schema}\n\nTexte source:\n<<<{text}>>>\n\nRéponse JSON:"