Bachir00 commited on
Commit
20d5dab
·
1 Parent(s): 8a848a5

langGraphe code

Browse files
Files changed (3) hide show
  1. config/prompts.py +466 -0
  2. config/settings.py +127 -0
  3. langgraphe_app.py +219 -0
config/prompts.py ADDED
@@ -0,0 +1,466 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ # Configuration des prompts pour chaque agent du système
2
+
3
+ # Agent Researcher - Prompt de base
4
+ RESEARCHER_PROMPT = """
5
+ Tu es un agent de recherche expert. Ta mission est de trouver des informations pertinentes sur internet
6
+ concernant le sujet suivant: {topic}.
7
+
8
+ Recherche des sources fiables et récentes. Analyse le sujet et décompose-le en sous-sujets pertinents
9
+ si nécessaire. Pour chaque source, récupère les informations suivantes:
10
+ - L'URL complète
11
+ - Le titre
12
+ - Un résumé court du contenu
13
+ - La date de publication (si disponible)
14
+ - L'auteur ou la source (si disponible)
15
+
16
+ Concentre-toi sur les informations factuelles et évite les sources d'opinion non fondée.
17
+ Retourne une liste structurée des meilleures sources que tu trouves.
18
+ """
19
+
20
+ # Prompt pour l'extraction de mots-clés
21
+ KEYWORD_EXTRACTION_PROMPT = """
22
+ Tu es un expert en analyse sémantique. Analyse le sujet de recherche suivant et extrais 3-7 mots-clés pertinents qui amélioreront la recherche web.
23
+
24
+ Sujet: {topic}
25
+
26
+ Règles:
27
+ 1. Extrais des mots-clés spécifiques et techniques liés au sujet
28
+ 2. Évite les mots trop génériques (comme "analyse", "étude", "recherche")
29
+ 3. Privilégie les synonymes et termes alternatifs qui enrichiront la recherche
30
+ 4. Inclus des termes en français et leurs équivalents anglais si pertinents
31
+ 5. Évite de répéter les mots déjà présents dans le sujet principal
32
+
33
+ Format de réponse: Retourne uniquement une liste de mots-clés séparés par des virgules, sans numérotation.
34
+ Exemple: intelligence artificielle, machine learning, automatisation, emploi, marché du travail
35
+
36
+ Mots-clés pour "{topic}":"""
37
+
38
+ # Agent Reader/Summarizer - Prompt de base
39
+ READER_PROMPT = """
40
+ Tu es un expert en analyse et synthèse de documents. Tu dois lire et résumer le contenu suivant:
41
+
42
+ {document_content}
43
+
44
+ Source: {source_url}
45
+ Titre: {title}
46
+ Date: {date}
47
+ Auteur: {author}
48
+
49
+ Crée un résumé structuré qui:
50
+ 1. Identifie les points clés et arguments principaux (max 5)
51
+ 2. Extrait les données et statistiques importantes
52
+ 3. Note les méthodologies utilisées (si pertinent)
53
+ 4. Identifie les limitations ou biais potentiels
54
+ 5. Inclut les citations importantes (avec guillemets)
55
+
56
+ Format ton résumé de manière claire avec des sections et des puces pour faciliter la lecture.
57
+ Limite-toi à l'essentiel, le résumé ne doit pas dépasser 30% de la longueur du texte original.
58
+ """
59
+
60
+ # Agent Writer/Reporter - Prompt de base
61
+ WRITER_PROMPT = """
62
+ Tu es un rédacteur expert. Ta mission est de créer un rapport de recherche structuré et professionnel
63
+ sur le sujet: {topic}.
64
+
65
+ Utilise les résumés de sources suivants pour rédiger ton rapport:
66
+
67
+ {source_summaries}
68
+
69
+ Ton rapport doit:
70
+ 1. Commencer par une introduction claire qui présente le sujet et son importance
71
+ 2. Organiser le contenu en sections logiques avec des titres et sous-titres
72
+ 3. Synthétiser les informations de toutes les sources de manière cohérente
73
+ 4. Présenter différentes perspectives sur le sujet quand elles existent
74
+ 5. Inclure des citations directes importantes (avec guillemets et références)
75
+ 6. Se terminer par une conclusion qui résume les points clés
76
+ 7. Inclure une bibliographie complète des sources utilisées
77
+
78
+ Format du rapport: {format} (Markdown ou PDF)
79
+ Utilise un ton professionnel et objectif. Assure-toi que toutes les informations sont correctement citées.
80
+ """
81
+
82
+ # Prompts pour l'agent Summarizer/Reader
83
+ SUMMARIZER_PROMPTS = {
84
+ "executive_summary": """
85
+ Tu es un expert en synthèse de documents. Crée un résumé exécutif concis et percutant du document suivant.
86
+
87
+ DOCUMENT:
88
+ Titre: {title}
89
+ Auteur: {author}
90
+ URL: {url}
91
+
92
+ CONTENU:
93
+ {content}
94
+
95
+ INSTRUCTIONS:
96
+ 1. Rédige un résumé exécutif de 2-3 phrases maximum
97
+ 2. Capture l'essence et les points les plus importants du document
98
+ 3. Utilise un langage clair et professionnel
99
+ 4. Évite les détails techniques superflus
100
+ 5. Focus sur les conclusions et impacts principaux
101
+
102
+ RÉSUMÉ EXÉCUTIF:""",
103
+
104
+ "detailed_analysis": """
105
+ Tu es un analyste expert. Effectue une analyse détaillée du document suivant.
106
+
107
+ DOCUMENT:
108
+ Titre: {title}
109
+ Auteur: {author}
110
+ URL: {url}
111
+
112
+ CONTENU:
113
+ {content}
114
+
115
+ ANALYSE DEMANDÉE:
116
+ 1. **RÉSUMÉ DÉTAILLÉ** (2-3 paragraphes): Synthèse approfondie du contenu
117
+ 2. **POINTS CLÉS** (3-5 points): Arguments et idées principales (format: - Point clé)
118
+ 3. **ARGUMENTS PRINCIPAUX**: Thèses soutenues par l'auteur
119
+ 4. **DONNÉES ET STATISTIQUES**: Chiffres importants mentionnés
120
+ 5. **MÉTHODOLOGIE**: Approche utilisée (si applicable)
121
+ 6. **LIMITATIONS**: Biais ou limites identifiés
122
+
123
+ Structure ta réponse avec des sections claires et des listes à puces.
124
+
125
+ ANALYSE DÉTAILLÉE:""",
126
+
127
+ "sentiment_analysis": """
128
+ Tu es un expert en analyse de sentiment et crédibilité. Évalue le document suivant.
129
+
130
+ DOCUMENT:
131
+ Titre: {title}
132
+ Contenu: {content}
133
+
134
+ ÉVALUATION DEMANDÉE:
135
+ 1. **SENTIMENT GÉNÉRAL**: Positif, Neutre, ou Négatif (justifie brièvement)
136
+ 2. **CRÉDIBILITÉ**: Score sur 10 (justifie ton évaluation)
137
+ 3. **BIAIS POTENTIELS**: Identifie les biais éventuels
138
+ 4. **QUALITÉ DES SOURCES**: Évalue la fiabilité des références
139
+
140
+ Critères de crédibilité:
141
+ - Qualité des sources citées
142
+ - Objectivité du ton
143
+ - Présence de données factuelles
144
+ - Expertise apparente de l'auteur
145
+ - Cohérence argumentative
146
+
147
+ Format de réponse:
148
+ SENTIMENT: [Positif/Neutre/Négatif] - [Justification]
149
+ CRÉDIBILITÉ: [Score]/10 - [Justification]
150
+ BIAIS: [Description des biais identifiés]
151
+
152
+ ÉVALUATION:""",
153
+
154
+ "key_points_extraction": """
155
+ Tu es un expert en extraction d'informations clés. Identifie les points les plus importants du document.
156
+
157
+ DOCUMENT:
158
+ {content}
159
+
160
+ INSTRUCTIONS:
161
+ 1. Extrais 3-7 points clés maximum
162
+ 2. Chaque point doit être autonome et informatif
163
+ 3. Priorise par ordre d'importance
164
+ 4. Utilise des phrases courtes et claires
165
+ 5. Évite la redondance
166
+
167
+ Format souhaité:
168
+ - Point clé 1 (le plus important)
169
+ - Point clé 2
170
+ - Point clé 3
171
+ etc.
172
+
173
+ POINTS CLÉS:""",
174
+
175
+ "citations_extraction": """
176
+ Tu es un expert en extraction de citations importantes. Identifie les citations les plus significatives du document.
177
+
178
+ DOCUMENT:
179
+ {content}
180
+
181
+ INSTRUCTIONS:
182
+ 1. Extrais 2-5 citations maximum
183
+ 2. Privilégie les citations d'experts ou d'autorités
184
+ 3. Sélectionne les phrases les plus impactantes
185
+ 4. Inclus le contexte si nécessaire
186
+ 5. Évite les citations trop longues
187
+
188
+ Format souhaité:
189
+ "Citation exacte" - [Contexte/Auteur si mentionné]
190
+
191
+ CITATIONS IMPORTANTES:""",
192
+
193
+ "chunked_summary": """
194
+ Tu es un expert en synthèse de texte. Résume le chunk suivant du document.
195
+
196
+ CHUNK {chunk_index}/{total_chunks} du document \"{title}\" :
197
+
198
+ {chunk_content}
199
+
200
+ INSTRUCTIONS:
201
+ 1. Résume ce chunk en 5-7 phrases claires et informatives
202
+ 2. Garde uniquement les informations essentielles
203
+ 3. Ne fais pas de répétition avec les autres chunks
204
+ 4. Utilise un style neutre et professionnel
205
+
206
+ RÉSUMÉ DU CHUNK:
207
+ """,
208
+
209
+ "synthesis": """
210
+ Tu es un expert en synthèse documentaire. Crée un résumé unifié à partir des analyses partielles suivantes.
211
+
212
+ ANALYSES PARTIELLES:
213
+ {partial_summaries}
214
+
215
+ DOCUMENT ORIGINAL:
216
+ Titre: {title}
217
+ URL: {url}
218
+
219
+ INSTRUCTIONS:
220
+ 1. Synthétise toutes les analyses partielles en un résumé cohérent
221
+ 2. Élimine les redondances
222
+ 3. Préserve les informations essentielles
223
+ 4. Maintiens la logique et la continuité
224
+ 5. Assure-toi que le résumé final est compréhensible de manière autonome
225
+
226
+ Structure attendue:
227
+ - Résumé exécutif (2-3 phrases)
228
+ - Analyse détaillée (2-3 paragraphes)
229
+ - Points clés principaux
230
+ - Sentiment et crédibilité globale
231
+
232
+ SYNTHÈSE FINALE:""",
233
+
234
+ "global_analysis": """
235
+ Tu es un expert en analyse comparative de documents. Analyse l'ensemble des résumés suivants pour identifier les patterns globaux.
236
+
237
+ RÉSUMÉS DE DOCUMENTS:
238
+ {all_summaries}
239
+
240
+ ANALYSE GLOBALE DEMANDÉE:
241
+ 1. **THÈMES COMMUNS**: Sujets récurrents dans plusieurs documents
242
+ 2. **POINTS DE CONSENSUS**: Idées sur lesquelles les sources s'accordent
243
+ 3. **POINTS CONFLICTUELS**: Contradictions ou désaccords entre sources
244
+ 4. **TENDANCES**: Évolutions ou patterns identifiés
245
+ 5. **LACUNES**: Aspects peu couverts ou manquants
246
+
247
+ Format ta réponse avec des sections claires et des listes à puces.
248
+ Sois objectif et factuel dans ton analyse.
249
+
250
+ ANALYSE COMPARATIVE:"""
251
+ }
252
+
253
+ # Prompts pour l'agent Global Synthesizer
254
+ GLOBAL_SYNTHESIZER_PROMPTS = {
255
+ "final_synthesis": """
256
+ Tu es un expert en synthèse de recherche et rédaction de rapports. Crée un rapport final complet basé sur les résumés de documents suivants.
257
+
258
+ SUJET DE RECHERCHE: {topic}
259
+
260
+ RÉSUMÉS DE DOCUMENTS ANALYSÉS:
261
+ {document_summaries}
262
+
263
+ ANALYSE GLOBALE EXISTANTE:
264
+ - Thèmes communs: {common_themes}
265
+ - Points de consensus: {consensus_points}
266
+ - Points conflictuels: {conflicting_views}
267
+
268
+ INSTRUCTIONS POUR LE RAPPORT FINAL:
269
+
270
+ 1. **INTRODUCTION** (1-2 paragraphes):
271
+ - Présente le sujet et son importance
272
+ - Contextualise l'analyse menée
273
+ - Annonce la structure du rapport
274
+
275
+ 2. **SYNTHÈSE EXÉCUTIVE** (3-5 points clés):
276
+ - Identifie les 3-5 conclusions principales
277
+ - Présente les insights les plus importants
278
+ - Formule des recommandations concrètes
279
+
280
+ 3. **ANALYSE DÉTAILLÉE** (sections thématiques):
281
+ - Organise le contenu par thèmes principaux
282
+ - Synthétise les informations de manière cohérente
283
+ - Présente différentes perspectives quand elles existent
284
+ - Utilise des données et citations pertinentes
285
+
286
+ 4. **TENDANCES ET IMPLICATIONS**:
287
+ - Identifie les tendances émergentes
288
+ - Analyse les implications futures
289
+ - Discute les défis et opportunités
290
+
291
+ 5. **CONCLUSION**:
292
+ - Résume les points essentiels
293
+ - Propose des pistes d'action ou réflexion
294
+
295
+ STYLE ET FORMAT:
296
+ - Utilise un ton professionnel et objectif
297
+ - Structure claire avec titres et sous-titres
298
+ - Citations avec références aux sources
299
+ - Format Markdown avec mise en forme appropriée
300
+
301
+ RAPPORT FINAL:""",
302
+
303
+ "executive_summary": """
304
+ Tu es un expert en communication exécutive. Crée un résumé ex��cutif percutant basé sur les analyses suivantes.
305
+
306
+ SUJET: {topic}
307
+
308
+ DONNÉES D'ANALYSE:
309
+ {analysis_data}
310
+
311
+ INSTRUCTIONS:
312
+ 1. **CONCLUSIONS PRINCIPALES** (3-5 points maximum):
313
+ - Identifie les découvertes les plus importantes
314
+ - Utilise des données concrètes quand disponibles
315
+ - Sois concis et impactant
316
+
317
+ 2. **INSIGHTS CLÉS**:
318
+ - Révèle les patterns et tendances importantes
319
+ - Connecte les informations de différentes sources
320
+ - Identifie ce qui est nouveau ou surprenant
321
+
322
+ 3. **RECOMMANDATIONS**:
323
+ - Propose 2-4 actions concrètes
324
+ - Base-toi sur l'analyse réalisée
325
+ - Sois pragmatique et réalisable
326
+
327
+ 4. **SYNTHÈSE NARRATIVE** (2-3 paragraphes):
328
+ - Raconte l'histoire principale qui émerge des données
329
+ - Connecte logiquement les différents éléments
330
+ - Termine par l'implication la plus importante
331
+
332
+ Format: Structure claire avec sections distinctes.
333
+ Ton: Professionnel, confiant, basé sur les faits.
334
+
335
+ RÉSUMÉ EXÉCUTIF:""",
336
+
337
+ "thematic_analysis": """
338
+ Tu es un analyste expert. Organise et analyse les informations suivantes par thèmes cohérents.
339
+
340
+ SUJET: {topic}
341
+ RÉSUMÉS: {summaries}
342
+
343
+ INSTRUCTIONS:
344
+ 1. **IDENTIFICATION DES THÈMES**:
345
+ - Identifie 3-6 thèmes principaux qui émergent des résumés
346
+ - Chaque thème doit être substantiel et distinct
347
+ - Nomme chaque thème de manière claire et descriptive
348
+
349
+ 2. **ANALYSE THÉMATIQUE**:
350
+ Pour chaque thème identifié:
351
+ - Synthétise les informations pertinentes de toutes les sources
352
+ - Identifie les points de convergence et divergence
353
+ - Présente les données et exemples les plus significatifs
354
+ - Note les implications et enjeux associés
355
+
356
+ 3. **HIÉRARCHISATION**:
357
+ - Classe les thèmes par ordre d'importance/impact
358
+ - Explique brièvement pourquoi chaque thème est important
359
+ - Identifie les liens entre les différents thèmes
360
+
361
+ FORMAT:
362
+ ```
363
+ ## THÈME 1: [Nom du thème]
364
+ ### Synthèse
365
+ [Analyse détaillée]
366
+ ### Points clés
367
+ - Point 1
368
+ - Point 2
369
+ ### Implications
370
+ [Discussion]
371
+
372
+ ## THÈME 2: [Nom du thème]
373
+ [etc.]
374
+ ```
375
+
376
+ ANALYSE THÉMATIQUE:""",
377
+
378
+ "methodology_description": """
379
+ Tu es un méthodologue expert. Décris la méthodologie utilisée pour cette recherche de manière claire et professionnelle.
380
+
381
+ PARAMÈTRES DE RECHERCHE:
382
+ - Sujet original: {topic}
383
+ - Nombre de sources analysées: {sources_count}
384
+ - Méthodes d'extraction: {extraction_methods}
385
+ - Critères de sélection: {selection_criteria}
386
+
387
+ PROCESSUS D'ANALYSE:
388
+ {analysis_process}
389
+
390
+ INSTRUCTIONS:
391
+ 1. **APPROCHE DE RECHERCHE**:
392
+ - Décris la stratégie de recherche adoptée
393
+ - Explique les critères de sélection des sources
394
+ - Justifie les choix méthodologiques
395
+
396
+ 2. **MÉTHODES D'ANALYSE**:
397
+ - Détaille les techniques d'analyse utilisées
398
+ - Explique le processus de synthèse
399
+ - Décris l'approche d'évaluation de la crédibilité
400
+
401
+ 3. **LIMITATIONS**:
402
+ - Identifie les limites de la méthodologie
403
+ - Reconnaît les biais potentiels
404
+ - Suggère des améliorations possibles
405
+
406
+ 4. **QUALITÉ DES DONNÉES**:
407
+ - Évalue la qualité globale des sources
408
+ - Discute la représentativité de l'échantillon
409
+ - Commente la fiabilité des conclusions
410
+
411
+ Style: Académique mais accessible, précis et honnête.
412
+
413
+ DESCRIPTION MÉTHODOLOGIQUE:""",
414
+
415
+ "quality_assessment": """
416
+ Tu es un expert en évaluation de la qualité de recherche. Évalue la qualité et la fiabilité de cette analyse.
417
+
418
+ DONNÉES D'ÉVALUATION:
419
+ - Résumés analysés: {summaries_count}
420
+ - Sources utilisées: {sources_info}
421
+ - Scores de crédibilité: {credibility_scores}
422
+ - Couverture thématique: {thematic_coverage}
423
+
424
+ CRITÈRES D'ÉVALUATION:
425
+ 1. **COMPLÉTUDE**: L'analyse couvre-t-elle tous les aspects importants du sujet?
426
+ 2. **FIABILITÉ**: Les sources sont-elles crédibles et diversifiées?
427
+ 3. **COHÉRENCE**: Les conclusions sont-elles logiques et bien étayées?
428
+ 4. **OBJECTIVITÉ**: L'analyse évite-t-elle les biais évidents?
429
+ 5. **ACTUALITÉ**: Les informations sont-elles récentes et pertinentes?
430
+
431
+ INSTRUCTIONS:
432
+ - Attribue un score de 0 à 1 pour chaque critère
433
+ - Justifie chaque score avec des éléments concrets
434
+ - Identifie les points forts et les points faibles
435
+ - Calcule un score de confiance global
436
+ - Propose des recommandations d'amélioration
437
+
438
+ Format:
439
+ ```
440
+ ## ÉVALUATION DE QUALITÉ
441
+
442
+ ### Complétude: X.X/1.0
443
+ [Justification]
444
+
445
+ ### Fiabilité: X.X/1.0
446
+ [Justification]
447
+
448
+ [etc.]
449
+
450
+ ### SCORE GLOBAL: X.X/1.0
451
+ ### RECOMMANDATIONS:
452
+ - [Recommandation 1]
453
+ - [Recommandation 2]
454
+ ```
455
+
456
+ ÉVALUATION QUALITÉ:"""
457
+ }
458
+
459
+ # Prompts système pour définir le comportement général des agents
460
+ SYSTEM_PROMPTS = {
461
+ "researcher": "Tu es un agent de recherche IA spécialisé dans la recherche d'information pertinente et fiable.",
462
+ "reader": "Tu es un agent d'analyse IA spécialisé dans la lecture et la synthèse de documents complexes.",
463
+ "writer": "Tu es un agent rédacteur IA spécialisé dans la création de rapports de recherche structurés et professionnels.",
464
+ "summarizer": "Tu es un agent d'analyse IA expert en synthèse de documents, extraction de points clés et évaluation de crédibilité.",
465
+ "global_synthesizer": "Tu es un expert en synthèse de recherche et rédaction de rapports finaux. Tu excelles dans la création de documents structurés, professionnels et basés sur des analyses multiples."
466
+ }
config/settings.py ADDED
@@ -0,0 +1,127 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ """
2
+ Configuration du projet AI Research Assistant.
3
+ Ce fichier contient les configurations par défaut qui peuvent être surchargées
4
+ par les variables d'environnement.
5
+ """
6
+
7
+ from pydantic_settings import BaseSettings
8
+ from typing import Dict, Optional, List
9
+
10
+
11
+ class APIConfig(BaseSettings):
12
+ """Configuration des clés API et des paramètres associés"""
13
+ # LLM API (REQUIS)
14
+ GROQ_API_KEY: str = ""
15
+
16
+ # APIs de Recherche (Au moins une REQUISE)
17
+ SERPER_API_KEY: str = ""
18
+ TAVILY_API_KEY: str = ""
19
+ BRAVE_API_KEY: str = ""
20
+
21
+ # Configuration des modèles
22
+ LLM_MODEL: str = "llama-3.1-8b-instant"
23
+ LLM_TEMPERATURE: float = 0.1
24
+ LLM_MAX_TOKENS: int = 4000
25
+ EMBEDDING_MODEL: str = "all-MiniLM-L6-v2"
26
+
27
+ # Limites de recherche
28
+ MAX_SOURCES: int = 20
29
+ MAX_SUMMARY_LENGTH: int = 500
30
+ SEARCH_TIMEOUT: int = 30
31
+
32
+ # Performance et sécurité
33
+ API_RATE_LIMIT: int = 100
34
+ MAX_CONCURRENT_REQUESTS: int = 10
35
+
36
+ class Config:
37
+ env_file = ".env"
38
+ env_file_encoding = "utf-8"
39
+ extra = "ignore"
40
+
41
+
42
+ class DatabaseConfig(BaseSettings):
43
+ """Configuration de la base de données"""
44
+ DATABASE_URL: str = "sqlite:///data/research.db"
45
+ CHROMA_PERSIST_DIRECTORY: str = "data/chroma"
46
+ CHROMA_COLLECTION_NAME: str = "research_documents"
47
+
48
+ class Config:
49
+ env_file = ".env"
50
+ env_file_encoding = "utf-8"
51
+ extra = "ignore"
52
+
53
+
54
+ class PathConfig(BaseSettings):
55
+ """Configuration des chemins et répertoires"""
56
+ DATA_DIR: str = "data"
57
+ REPORTS_DIR: str = "data/reports"
58
+ CACHE_DIR: str = "data/cache"
59
+ LOGS_DIR: str = "logs"
60
+
61
+ class Config:
62
+ env_file = ".env"
63
+ env_file_encoding = "utf-8"
64
+ extra = "ignore"
65
+
66
+
67
+ class FeatureConfig(BaseSettings):
68
+ """Configuration des fonctionnalités"""
69
+ ENABLE_CACHING: bool = True
70
+ ENABLE_VECTOR_STORE: bool = True
71
+ ENABLE_RATE_LIMITING: bool = True
72
+ CACHE_TTL: int = 3600
73
+
74
+ class Config:
75
+ env_file = ".env"
76
+ env_file_encoding = "utf-8"
77
+ extra = "ignore"
78
+
79
+
80
+ class LoggingConfig(BaseSettings):
81
+ """Configuration du logging"""
82
+ LOG_LEVEL: str = "INFO"
83
+ ENABLE_FILE_LOGGING: bool = True
84
+
85
+ class Config:
86
+ env_file = ".env"
87
+ env_file_encoding = "utf-8"
88
+ extra = "ignore"
89
+
90
+
91
+ class ExportConfig(BaseSettings):
92
+ """Configuration d'export et rapports"""
93
+ DEFAULT_EXPORT_FORMAT: str = "markdown"
94
+ PDF_PAGE_SIZE: str = "A4"
95
+ INCLUDE_CITATIONS: bool = True
96
+
97
+ class Config:
98
+ env_file = ".env"
99
+ env_file_encoding = "utf-8"
100
+ extra = "ignore"
101
+
102
+
103
+ class DevelopmentConfig(BaseSettings):
104
+ """Configuration de développement"""
105
+ DEBUG: bool = False
106
+ DEVELOPMENT_MODE: bool = False
107
+ WORKER_THREADS: int = 4
108
+
109
+ class Config:
110
+ env_file = ".env"
111
+ env_file_encoding = "utf-8"
112
+ extra = "ignore"
113
+
114
+
115
+ # Instanciation des configurations
116
+ try:
117
+ api_config = APIConfig()
118
+ database_config = DatabaseConfig()
119
+ path_config = PathConfig()
120
+ feature_config = FeatureConfig()
121
+ logging_config = LoggingConfig()
122
+ export_config = ExportConfig()
123
+ development_config = DevelopmentConfig()
124
+ except Exception as e:
125
+ print(f"Erreur lors du chargement de la configuration: {e}")
126
+ # Configuration par défaut en cas d'erreur
127
+ api_config = None
langgraphe_app.py ADDED
@@ -0,0 +1,219 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ from langchain_groq import ChatGroq
2
+ from langchain_core.messages import HumanMessage, AIMessage, SystemMessage
3
+ from langgraph.graph import StateGraph, END
4
+ from typing import TypedDict, Sequence, Annotated, Union
5
+ from langchain_core.messages import BaseMessage
6
+ from dotenv import load_dotenv
7
+ from langchain_core.tools import tool
8
+ import os
9
+ from langgraph.graph.message import add_messages
10
+ from langgraph.prebuilt import ToolNode
11
+ import asyncio
12
+
13
+ from src.agents.researcher_agent import ResearcherAgent
14
+ from src.agents.content_extractor_agent import ContentExtractorAgent
15
+ from src.agents.summarizer_agent import SummarizerAgent
16
+ from src.agents.global_synthesizer_agent import GlobalSynthesizerAgent
17
+ from src.models.research_models import ResearchQuery
18
+
19
+ # ============================================================================
20
+ # VOS AGENTS EXISTANTS (ne pas modifier)
21
+ # ============================================================================
22
+ researcher_agent = ResearcherAgent()
23
+ content_extractor_agent = ContentExtractorAgent()
24
+ summarizer_agent = SummarizerAgent()
25
+ global_synthesizer_agent = GlobalSynthesizerAgent()
26
+
27
+ # ============================================================================
28
+ # OUTIL QUI ENCAPSULE VOTRE PIPELINE COMPLET
29
+ # ============================================================================
30
+ @tool
31
+ def research_complete_pipeline(topic: str, max_results: Union[int, str] = 2) -> str:
32
+ """Exécute un pipeline de recherche complet sur un sujet donné.
33
+
34
+ Ce tool encapsule 4 agents qui travaillent ensemble :
35
+ 1. ResearcherAgent : recherche web et extraction de mots-clés
36
+ 2. ContentExtractorAgent : extraction du contenu des pages
37
+ 3. SummarizerAgent : création de résumés détaillés
38
+ 4. GlobalSynthesizerAgent : synthèse globale finale
39
+
40
+ Args:
41
+ topic: Le sujet de recherche (ex: "impact de l'IA sur l'emploi")
42
+ max_results: Nombre de sources à analyser (2-10, défaut: 2)
43
+
44
+ Returns:
45
+ Un rapport complet au format texte avec résumé exécutif et analyse détaillée
46
+ """
47
+ # Conversion et validation
48
+ if isinstance(max_results, str):
49
+ try:
50
+ max_results = int(max_results)
51
+ except ValueError:
52
+ max_results = 2
53
+ max_results = max(2, min(max_results, 10))
54
+
55
+ async def run_pipeline():
56
+ print(f"\n{'='*60}")
57
+ print(f"🚀 DÉMARRAGE DU PIPELINE DE RECHERCHE")
58
+ print(f"📋 Sujet: {topic}")
59
+ print(f"📊 Sources à analyser: {max_results}")
60
+ print(f"{'='*60}\n")
61
+
62
+ # ÉTAPE 1: Recherche
63
+ print("🔍 [1/4] Recherche web en cours...")
64
+ query = ResearchQuery(
65
+ topic=topic,
66
+ keywords=await researcher_agent.extract_keywords_with_llm(topic),
67
+ max_results=max_results,
68
+ search_depth="basic"
69
+ )
70
+ research_data = await researcher_agent.process(query)
71
+ print(f"✅ Trouvé {research_data.total_found} sources")
72
+
73
+ # ÉTAPE 2: Extraction
74
+ print("\n📄 [2/4] Extraction du contenu...")
75
+ extraction_data = await content_extractor_agent.process_from_research_output(
76
+ research_output=research_data
77
+ )
78
+ print(f"✅ Extrait {extraction_data.successful_extractions} documents")
79
+
80
+ # ÉTAPE 3: Résumés
81
+ print("\n📝 [3/4] Création des résumés...")
82
+ summarization_data = await summarizer_agent.process_from_extraction_result(
83
+ extraction_result=extraction_data
84
+ )
85
+ print(f"✅ Généré {summarization_data.total_documents} résumés")
86
+
87
+ # ÉTAPE 4: Synthèse globale
88
+ print("\n🎯 [4/4] Synthèse globale...")
89
+ global_synthesis = await global_synthesizer_agent.process_from_summarization_output(
90
+ summarization_output=summarization_data
91
+ )
92
+ print(f"✅ Rapport final généré ({global_synthesis.final_report.word_count} mots)")
93
+
94
+ print(f"\n{'='*60}")
95
+ print("✨ PIPELINE TERMINÉ AVEC SUCCÈS")
96
+ print(f"{'='*60}\n")
97
+
98
+ # Retourner le rapport en format markdown
99
+ return global_synthesis.formatted_outputs.get('markdown',
100
+ global_synthesis.formatted_outputs.get('text',
101
+ str(global_synthesis))
102
+ )
103
+
104
+ return asyncio.run(run_pipeline())
105
+
106
+ # ============================================================================
107
+ # CONFIGURATION DU LLM ET DU GRAPHE
108
+ # ============================================================================
109
+
110
+ # État du graphe
111
+ class AgentState(TypedDict):
112
+ messages: Annotated[Sequence[BaseMessage], add_messages]
113
+
114
+ # Chargement des variables d'environnement
115
+ load_dotenv()
116
+ api_key = os.getenv("GROQ_API_KEY")
117
+ if not api_key:
118
+ raise ValueError("GROQ_API_KEY non définie dans .env")
119
+
120
+ # Configuration du modèle avec l'outil
121
+ tools = [research_complete_pipeline]
122
+ model = ChatGroq(
123
+ model="llama-3.1-8b-instant",
124
+ temperature=0.3, # Bas pour plus de cohérence
125
+ max_tokens=2048*2,
126
+ api_key=api_key
127
+ ).bind_tools(tools)
128
+
129
+ # ============================================================================
130
+ # NŒUDS DU GRAPHE
131
+ # ============================================================================
132
+
133
+ def model_call(state: AgentState) -> AgentState:
134
+ """Nœud qui appelle le LLM pour décider quoi faire"""
135
+
136
+ system_prompt = SystemMessage(content="""Tu es un assistant de recherche intelligent.
137
+
138
+ 🎯 TON RÔLE:
139
+ Tu aides les utilisateurs à obtenir des résumés et analyses sur n'importe quel sujet.
140
+
141
+ 🔧 TON OUTIL:
142
+ Tu as accès à un outil puissant appelé 'research_complete_pipeline' qui :
143
+ - Effectue des recherches web automatiques
144
+ - Extrait et analyse le contenu
145
+ - Génère des résumés détaillés
146
+ - Produit une synthèse globale complète
147
+
148
+ 📋 QUAND L'UTILISER:
149
+ Utilise cet outil quand l'utilisateur demande :
150
+ - Un résumé sur un sujet
151
+ - Des informations sur un topic
152
+ - Une analyse d'un domaine
153
+ - Une recherche documentée
154
+
155
+ 💡 COMMENT L'UTILISER:
156
+ - Identifie le sujet principal de la demande
157
+ - Appelle research_complete_pipeline avec le sujet en français clair
158
+ - Utilise max_results=2 pour une recherche standard
159
+
160
+ ✅ EXEMPLES:
161
+ User: "Résume l'impact de l'IA sur l'emploi"
162
+ → Appelle: research_complete_pipeline(topic="impact de l'intelligence artificielle sur le marché de l'emploi", max_results=2)
163
+ User: "Fais-moi une analyse complète sur le changement climatique"
164
+ → Appelle: research_complete_pipeline(topic="changement climatique", max_results=3)
165
+
166
+ ⚠️ IMPORTANT:
167
+ - N'essaie PAS de faire la recherche toi-même
168
+ - Utilise TOUJOURS l'outil pour les demandes de recherche
169
+ - Le résultat de l'outil est déjà un rapport complet formaté
170
+ - Tu peux présenter le résultat directement à l'utilisateur
171
+ """
172
+
173
+ )
174
+
175
+ messages = state["messages"]
176
+ response = model.invoke([system_prompt] + messages)
177
+ return {"messages": [response]}
178
+
179
+ def should_continue(state: AgentState) -> str:
180
+ """Décide si on continue avec des outils ou si on termine"""
181
+ messages = state["messages"]
182
+ last_message = messages[-1]
183
+
184
+ # Si le dernier message a des appels d'outils, continuer
185
+ if hasattr(last_message, 'tool_calls') and last_message.tool_calls:
186
+ return "continue"
187
+ else:
188
+ return "end"
189
+
190
+ # ============================================================================
191
+ # CONSTRUCTION DU GRAPHE LANGGRAPH
192
+ # ============================================================================
193
+
194
+ # Créer le graphe
195
+ graph = StateGraph(AgentState)
196
+
197
+ # Ajouter les nœuds
198
+ graph.add_node("llm", model_call)
199
+ tool_node = ToolNode(tools=tools)
200
+ graph.add_node("tools", tool_node)
201
+
202
+ # Définir le point d'entrée
203
+ graph.set_entry_point("llm")
204
+
205
+ # Ajouter les transitions conditionnelles
206
+ graph.add_conditional_edges(
207
+ "llm",
208
+ should_continue,
209
+ {
210
+ "continue": "tools",
211
+ "end": END,
212
+ },
213
+ )
214
+
215
+ # Après l'exécution des outils, retourner au LLM pour présenter les résultats
216
+ graph.add_edge("tools", "llm")
217
+
218
+ # Compiler le graphe
219
+ app = graph.compile()