Spaces:
Sleeping
Sleeping
Update core/extractor.py
Browse files- core/extractor.py +10 -4
core/extractor.py
CHANGED
|
@@ -73,10 +73,16 @@ class ExtractorEngine:
|
|
| 73 |
et la température réglable depuis l'interface.
|
| 74 |
"""
|
| 75 |
# Utilisation de votre prompt système renforcé pour une fiabilité maximale
|
| 76 |
-
system_prompt = """Tu es un
|
| 77 |
-
|
| 78 |
-
|
| 79 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 80 |
|
| 81 |
# Construction du prompt utilisateur avec le segment de texte
|
| 82 |
user_prompt = f"Schéma JSON STRICT à respecter:\n{self.json_schema}\n\nTexte source:\n<<<{text}>>>\n\nRéponse JSON:"
|
|
|
|
| 73 |
et la température réglable depuis l'interface.
|
| 74 |
"""
|
| 75 |
# Utilisation de votre prompt système renforcé pour une fiabilité maximale
|
| 76 |
+
system_prompt = """Tu es un analyste de données expert en extraction d'intelligence documentaire.
|
| 77 |
+
Ton objectif est de décomposer le texte en un graphe de connaissances exhaustif.
|
| 78 |
+
|
| 79 |
+
CONSIGNES DE PRÉCISION :
|
| 80 |
+
1. Ne te limite pas aux catégories classiques. Extrais TOUT concept porteur de sens : Montants financiers, Dates, Obligations, Objets, Conditions, Nationalités.
|
| 81 |
+
2. Pour chaque entité, crée un ID unique (E1, E2...).
|
| 82 |
+
3. Les relations doivent être des VERBES d'action ou des LIENS logiques précis (ex: 'RECONNAIT_DEVOIR', 'ÉCHOIT_LE', 'RÉSIDE_À').
|
| 83 |
+
4. Si une entité est mentionnée plusieurs fois, utilise le même nom pour faciliter la fusion.
|
| 84 |
+
|
| 85 |
+
RÈGLE ABSOLUE : Réponds uniquement au format JSON pur, sans introduction ni conclusion."""
|
| 86 |
|
| 87 |
# Construction du prompt utilisateur avec le segment de texte
|
| 88 |
user_prompt = f"Schéma JSON STRICT à respecter:\n{self.json_schema}\n\nTexte source:\n<<<{text}>>>\n\nRéponse JSON:"
|