Spaces:

QuentinL52
/

interview_agents_api

Sleeping

App Files Files Community

QuentinL52 commited on Jul 16, 2025

Commit

57f1508

verified ·

1 Parent(s): 64b7a3c

Update src/crew/tasks.py

Browse files

Files changed (1) hide show

src/crew/tasks.py +70 -56

src/crew/tasks.py CHANGED Viewed

@@ -1,5 +1,5 @@
 from crewai import Task
-from .agents import report_generator_agent, skills_extractor_agent, experience_extractor_agent, project_extractor_agent, education_extractor_agent, ProfileBuilderAgent, informations_personnelle_agent, reconversion_detector_agent
 generate_report_task = Task(
     description=(
@@ -21,22 +21,43 @@ generate_report_task = Task(
     agent=report_generator_agent,
 )
 task_extract_skills = Task(
     description=(
-        "Voici le contenu du CV :\n\n{cv_content}\n\n"
-        "Extraire uniquement les compétences mentionnées explicitement dans le texte du CV. "
-        "Séparer les hard skills (techniques) et les soft skills (comportementales) en analysant les listes ou phrases les contenant. "
-        "Les hards skills doivent comprendre des compétences techniques, outils, langages de programmation, etc. "
         "Ne rien inventer. Ne pas déduire de compétences à partir d'un poste ou d'une expérience implicite. "
-        "Identifie clairement les compétences, et n'en exclue aucune. "
-        "\n\n**CONTRAINTES JSON STRICTES:**\n"
-        "- Utiliser UNIQUEMENT des guillemets doubles (\") pour les chaînes\n"
-        "- Aucune virgule finale dans les listes ou objets\n"
-        "- Vérifier la syntaxe JSON avant de retourner le résultat\n"
-        "- Échapper correctement les caractères spéciaux (\\, \", \\n, etc.)"
     ),
     agent=skills_extractor_agent,
-    input_keys=["cv_content"],
     expected_output=(
         "Un dictionnaire JSON VALIDE 'Compétences' avec deux clés : 'hard_skills' et 'soft_skills', "
         "contenant uniquement des listes de compétences présentes dans le texte. "
@@ -46,22 +67,19 @@ task_extract_skills = Task(
 task_extract_experience = Task(
     description=(
-        "Voici le contenu du CV :\n\n{cv_content}\n\n"
-        """
-        Extrais toutes les expériences professionnelles du CV. Pour chaque expérience, tu DOIS fournir les informations suivantes :
-        - Poste: Le titre du poste.
-        - Entreprise: Le nom de l'entreprise.
-        - start_date: La date de début. Si non trouvée, retourne "Non spécifié".
-        - end_date: La date de fin. Si le poste est actuel, utilise "Aujourd'hui". Si non trouvée, retourne "Non spécifié".
-        - responsabilités: Une liste des tâches et missions.
-        RÈGLES STRICTES :
-        1.  NE JAMAIS laisser un champ vide (""). Si une information est introuvable, utilise la valeur "Non spécifié".
-        2.  Analyse attentivement les dates. "Depuis 2023" signifie que la date de fin est "Aujourd'hui".
-        """
     ),
     agent=experience_extractor_agent,
-    input_keys=["cv_content"],
     expected_output=(
         "Un tableau JSON VALIDE d'objets 'Expérience Professionnelle' avec 5 clés par expérience : "
         "'Poste', 'Entreprise', 'start_date', 'end_date', 'responsabilités'. "
@@ -71,18 +89,16 @@ task_extract_experience = Task(
 task_extract_projects = Task(
     description=(
-        "Voici le contenu du CV :\n\n{cv_content}\n\n"
-        """
-        Identifie et extrais les PROJETS SPÉCIFIQUES mentionnés dans le CV.
-        Un projet est distinct d'une expérience professionnelle générale. Il a un nom ou un objectif clair.
-        RÈGLES STRICTES :
-        1.  NE PAS extraire les responsabilités générales d'un poste en tant que projet. Par exemple, si le CV dit "Alternant chez Enedis où j'ai mené le projet 'Simulateur IA'", alors extrais 'Simulateur IA' comme projet. Ne copie pas toutes les tâches de l'alternance.
-        2.  Si un projet est clairement lié à une expérience professionnelle, essaie de le noter, mais le plus important est de décrire le projet lui-même.
-        """
     ),
     agent=project_extractor_agent,
-    input_keys=["cv_content"],
     expected_output=(
         "Un dictionnaire JSON VALIDE 'Projets' avec deux clés : 'professional' et 'personal'. "
         "Chaque clé contient une liste de dictionnaires, chaque dictionnaire représentant un projet avec les clés 'title', 'role', 'technologies', et 'outcomes'. "
@@ -92,41 +108,39 @@ task_extract_projects = Task(
 task_extract_education = Task(
     description=(
-        "Voici le contenu du CV :\n\n{cv_content}\n\n"
-        """
-        Extrais le parcours de formation et les certifications. Fais une distinction claire entre les types de formation.
-        Pour chaque élément, fournis :
-        - degree: Le nom du diplôme, du titre (ex: 'Titre RNCP niveau 6') ou de la certification (ex: 'Core Designer Certification').
-        - institution: L'école, l'université ou la plateforme (ex: 'WILD CODE SCHOOL', 'DataIku', 'DataCamp').
-        - start_date: La date de début. Si non trouvée, retourne "Non spécifié".
-        - end_date: La date de fin. Si non trouvée, retourne "Non spécifié".
-        RÈGLES STRICTES :
-        1.  Si tu vois une certification comme "DataIku (core designer)", le diplôme est "Core Designer" et l'institution est "DataIku". NE PAS les mélanger.
-        2.  NE PAS extraire une simple compétence (ex: 'Python') comme une formation.
-        """
     ),
     agent=education_extractor_agent,
-    input_keys=["cv_content"],
     expected_output=(
         "Un tableau JSON VALIDE d'objets 'Formation' avec les clés : 'degree', 'institution', 'start_date', 'end_date'. "
-        "FORMAT EXACT: [{\"degree\": \"diplôme\", \"institution\": \"établissement\", \"start_date\": \"année\", \"end_date\": \"année\"]}"
     )
 )
 task_extract_informations = Task(
     description=(
-        "Voici le contenu du CV :\n\n{cv_content}\n\n"
-        "Votre tâche est d'extraire les informations de contact du candidat. Ces informations se trouvent généralement au début ou à la fin du CV, souvent sous une section intitulée 'CONTACT'.\n"
         "Extrayez précisément :\n"
         "- Le **Nom complet**.\n"
         "- L'**Adresse e-mail**.\n"
         "- Le **Numéro de téléphone**.\n"
         "- La **Localisation** (ville ou région).\n"
-        "toutes les informations devront être normalisées, principalement le nom si il est en majuscule en titre. "
     ),
     agent=informations_personnelle_agent,
-    input_keys=["cv_content"],
     expected_output=(
         "Un dictionnaire JSON VALIDE 'informations_personnelles' contenant le nom, l'email, le numéro de téléphone et la localisation du candidat. "
         "FORMAT EXACT: {\"nom\": \"nom\", \"email\": \"email\", \"numero_de_telephone\": \"tel\", \"localisation\": \"lieu\"}"
@@ -181,4 +195,4 @@ task_build_profile = Task(
         "    }\n"
         "}"
     )
-)

 from crewai import Task
+from .agents import report_generator_agent, cv_section_splitter_agent, skills_extractor_agent, experience_extractor_agent, project_extractor_agent, education_extractor_agent, ProfileBuilderAgent, informations_personnelle_agent, reconversion_detector_agent
 generate_report_task = Task(
     description=(
     agent=report_generator_agent,
 )
+task_split_cv_sections = Task(
+    description=(
+        "Voici le contenu complet du CV :\n\n{cv_content}\n\n"
+        "Votre mission est d'analyser ce CV et de l'organiser en sections thématiques claires. "
+        "Identifiez et extrayez le contenu de chaque section, même si les titres ne sont pas explicites. "
+        "Recherchez les patterns typiques d'un CV pour identifier les sections."
+    ),
+    agent=cv_section_splitter_agent,
+    input_keys=["cv_content"],
+    expected_output=(
+        "Un dictionnaire JSON VALIDE avec les sections suivantes :\n"
+        "{\n"
+        '  "contact": "contenu de la section contact/coordonnées",\n'
+        '  "experiences": "contenu de la section expériences professionnelles",\n'
+        '  "projects": "contenu de la section projets",\n'
+        '  "education": "contenu de la section formations/études",\n'
+        '  "skills": "contenu de la section compétences",\n'
+        '  "other": "tout autre contenu pertinent non catégorisé"\n'
+        "}\n"
+        "Chaque section doit contenir le texte exact extrait du CV, même si certaines sections sont vides."
+    )
+)
 task_extract_skills = Task(
     description=(
+        "Voici les sections pertinentes du CV :\n\n"
+        "Section Expériences: {experiences}\n\n"
+        "Section Projets: {projects}\n\n"
+        "Section Compétences: {skills}\n\n"
+        "Extraire uniquement les compétences mentionnées explicitement dans ces sections. "
+        "Séparer les hard skills (techniques) et les soft skills (comportementales). "
+        "Les hard skills doivent comprendre des compétences techniques, outils, langages de programmation, etc. "
         "Ne rien inventer. Ne pas déduire de compétences à partir d'un poste ou d'une expérience implicite. "
+        "Identifie clairement les compétences, et n'en exclue aucune."
     ),
     agent=skills_extractor_agent,
+    context=[task_split_cv_sections],
     expected_output=(
         "Un dictionnaire JSON VALIDE 'Compétences' avec deux clés : 'hard_skills' et 'soft_skills', "
         "contenant uniquement des listes de compétences présentes dans le texte. "
 task_extract_experience = Task(
     description=(
+        "Voici la section expériences professionnelles du CV :\n\n{experiences}\n\n"
+        "Extrais toutes les expériences professionnelles de cette section uniquement. Pour chaque expérience, tu DOIS fournir les informations suivantes :\n"
+        "- Poste: Le titre du poste.\n"
+        "- Entreprise: Le nom de l'entreprise.\n"
+        "- start_date: La date de début. Si non trouvée, retourne \"Non spécifié\".\n"
+        "- end_date: La date de fin. Si le poste est actuel, utilise \"Aujourd'hui\". Si non trouvée, retourne \"Non spécifié\".\n"
+        "- responsabilités: Une liste des tâches et missions.\n\n"
+        "RÈGLES STRICTES :\n"
+        "1. NE JAMAIS laisser un champ vide (\"\"). Si une information est introuvable, utilise la valeur \"Non spécifié\".\n"
+        "2. Analyse attentivement les dates. \"Depuis 2023\" signifie que la date de fin est \"Aujourd'hui\"."
     ),
     agent=experience_extractor_agent,
+    context=[task_split_cv_sections],
     expected_output=(
         "Un tableau JSON VALIDE d'objets 'Expérience Professionnelle' avec 5 clés par expérience : "
         "'Poste', 'Entreprise', 'start_date', 'end_date', 'responsabilités'. "
 task_extract_projects = Task(
     description=(
+        "Voici la section projets du CV :\n\n{projects}\n\n"
+        "Voici également la section expériences pour contexte :\n\n{experiences}\n\n"
+        "Identifie et extrais les PROJETS SPÉCIFIQUES mentionnés dans ces sections. "
+        "Un projet est distinct d'une expérience professionnelle générale. Il a un nom ou un objectif clair.\n\n"
+        "RÈGLES STRICTES :\n"
+        "1. NE PAS extraire les responsabilités générales d'un poste en tant que projet.\n"
+        "2. Si un projet est clairement lié à une expérience professionnelle, essaie de le noter, mais le plus important est de décrire le projet lui-même."
     ),
     agent=project_extractor_agent,
+    context=[task_split_cv_sections],
     expected_output=(
         "Un dictionnaire JSON VALIDE 'Projets' avec deux clés : 'professional' et 'personal'. "
         "Chaque clé contient une liste de dictionnaires, chaque dictionnaire représentant un projet avec les clés 'title', 'role', 'technologies', et 'outcomes'. "
 task_extract_education = Task(
     description=(
+        "Voici la section formations/études du CV :\n\n{education}\n\n"
+        "Extrais le parcours de formation et les certifications de cette section uniquement. "
+        "Fais une distinction claire entre les types de formation.\n"
+        "Pour chaque élément, fournis :\n"
+        "- degree: Le nom du diplôme, du titre (ex: 'Titre RNCP niveau 6') ou de la certification (ex: 'Core Designer Certification').\n"
+        "- institution: L'école, l'université ou la plateforme (ex: 'WILD CODE SCHOOL', 'DataIku', 'DataCamp').\n"
+        "- start_date: La date de début. Si non trouvée, retourne \"Non spécifié\".\n"
+        "- end_date: La date de fin. Si non trouvée, retourne \"Non spécifié\".\n\n"
+        "RÈGLES STRICTES :\n"
+        "1. Si tu vois une certification comme \"DataIku (core designer)\", le diplôme est \"Core Designer\" et l'institution est \"DataIku\". NE PAS les mélanger.\n"
+        "2. NE PAS extraire une simple compétence (ex: 'Python') comme une formation."
     ),
     agent=education_extractor_agent,
+    context=[task_split_cv_sections],
     expected_output=(
         "Un tableau JSON VALIDE d'objets 'Formation' avec les clés : 'degree', 'institution', 'start_date', 'end_date'. "
+        "FORMAT EXACT: [{\"degree\": \"diplôme\", \"institution\": \"établissement\", \"start_date\": \"année\", \"end_date\": \"année\"}]"
     )
 )
 task_extract_informations = Task(
     description=(
+        "Voici la section contact/coordonnées du CV :\n\n{contact}\n\n"
+        "Votre tâche est d'extraire les informations de contact du candidat de cette section.\n"
         "Extrayez précisément :\n"
         "- Le **Nom complet**.\n"
         "- L'**Adresse e-mail**.\n"
         "- Le **Numéro de téléphone**.\n"
         "- La **Localisation** (ville ou région).\n"
+        "Toutes les informations devront être normalisées, principalement le nom si il est en majuscule en titre."
     ),
     agent=informations_personnelle_agent,
+    context=[task_split_cv_sections],
     expected_output=(
         "Un dictionnaire JSON VALIDE 'informations_personnelles' contenant le nom, l'email, le numéro de téléphone et la localisation du candidat. "
         "FORMAT EXACT: {\"nom\": \"nom\", \"email\": \"email\", \"numero_de_telephone\": \"tel\", \"localisation\": \"lieu\"}"
         "    }\n"
         "}"
     )
+)