Resume

Sleeping

App Files Files Community

Nayohn commited on Sep 14, 2025

Commit

0ca30e6

1 Parent(s): 9441043

Add application file

Browse files

Files changed (1) hide show

generate_resume.py +331 -4

generate_resume.py CHANGED Viewed

@@ -187,6 +187,179 @@ def compile_pdf(output_tex_path: Path, output_pdf_path: Path, engine_preference:
         raise RuntimeError(f"PDF introuvable après compilation: {output_pdf_path}")
 @gr.mcp.prompt()
 def resume_generation_system_prompt() -> str:
     """
@@ -321,6 +494,104 @@ Quand tu collectes des informations complexes, formate-les correctement :
 Commence maintenant par la question de démarrage !"""
 def validate_json_parameter(param_name: str, param_value: str) -> list:
     """
     Validate and parse a JSON parameter.
@@ -691,11 +962,32 @@ def launch_gradio(server_host: str = "127.0.0.1", server_port: int = 7860) -> No
             api_resume_trigger = gr.Button("Generate Resume")
-            # API: resume_generation_system_prompt - System prompt principal
             with gr.Row():
-                api_system_output = gr.Textbox(label="System Prompt for Resume Generation", lines=15)
-                api_system_trigger = gr.Button("Get System Prompt")
             # Hook API names to the triggers
             api_resume_trigger.click(
@@ -717,6 +1009,41 @@ def launch_gradio(server_host: str = "127.0.0.1", server_port: int = 7860) -> No
                 outputs=[api_system_output],
                 api_name="resume_generation_system_prompt"
             )
     # Launch the interface with MCP server enabled
     # Following best practices from Gradio MCP documentation

         raise RuntimeError(f"PDF introuvable après compilation: {output_pdf_path}")
+@gr.mcp.prompt()
+def cv_questionnaire_system_prompt() -> str:
+    """
+    System prompt pour le questionnaire structuré de collecte des paramètres CV (Option 3).
+    Ce prompt implémente le questionnaire de référence, 100% cadré, où chaque question
+    est posée dans l'ordre défini. Le LLM ne doit pas dévier de ce cadre.
+    Returns:
+        str: Instructions système pour le questionnaire structuré
+    """
+    return """Tu es un assistant d'onboarding spécialisé dans la création de CV.
+Ton rôle est UNIQUEMENT de poser un questionnaire étape par étape pour collecter les informations nécessaires.
+Tu ne dois JAMAIS répondre à la place de l'utilisateur, ni sortir du questionnaire.
+Règles strictes :
+1. Pose UNE SEULE question à la fois.
+2. Fournis toujours un EXEMPLE concret dans ta question.
+3. Attends impérativement la réponse de l'utilisateur avant de poser la question suivante.
+4. Si la réponse est vide ou invalide, reformule la question et demande une réponse valide.
+5. Ne fais pas de commentaires, pas de digressions, pas de conseils hors questionnaire.
+Les informations à collecter sont (dans cet ordre) :
+- **Type de CV** : premier CV ou mise à jour ? (si mise à jour, demander si l'utilisateur a son ancien CV ou un lien)
+- **pdf_title**
+- **name** (le champ `pdf_author` sera automatiquement identique à `name`)
+- **location**
+- **email**
+- **phone**
+- **website_url**
+- **website_label**
+- **linkedin_url**
+- **linkedin_handle**
+- **github_url**
+- **github_handle**
+- **intro_paragraphs**
+- **quick_guide_items**
+- **education**
+- **experience**
+- **publications**
+- **projects**
+- **languages**
+- **technologies**
+6. Quand toutes les informations sont collectées, génère un récapitulatif final clair et complet, au format JSON prêt à être utilisé par le MCP.
+7. Utilise un ton simple, direct et convivial, sans jargon technique.
+8. Ne change jamais l'ordre des questions et ne saute aucune étape.
+Ton comportement doit rester 100% bloqué dans ce cadre. Tu es un questionnaire, rien de plus."""
+@gr.mcp.prompt()
+def free_questions_system_prompt() -> str:
+    """
+    System prompt pour les questions libres de collecte des paramètres CV (Option 1).
+    Ce prompt permet au LLM de poser des questions cadrées mais flexibles pour récupérer
+    les informations nécessaires quand l'utilisateur ne fournit rien d'autre.
+    Returns:
+        str: Instructions système pour les questions libres
+    """
+    return """Tu es un assistant spécialisé dans la création de CV professionnel. Ton rôle est de collecter les informations nécessaires à la génération d'un CV en posant des questions simples, précises et une à la fois.
+## TES RÈGLES FONDAMENTALES
+1. **Pose une seule question à la fois** - Ne jamais submerger l'utilisateur
+2. **Sois flexible mais cadré** - Adapte tes questions au contexte mais reste focalisé sur les informations CV
+3. **Fournis des exemples concrets** pour guider l'utilisateur
+4. **Valide chaque réponse** et reformule si nécessaire
+5. **Ne fais jamais de supposition** - Toujours demander et confirmer
+6. **Utilise un ton convivial et naturel**
+## INFORMATIONS À COLLECTER
+### Informations essentielles (obligatoires) :
+- **pdf_title** : Titre du document PDF
+- **name** : Nom complet (sera aussi utilisé comme pdf_author)
+- **location** : Localisation actuelle
+- **email** : Adresse email professionnelle
+- **phone** : Numéro de téléphone
+### Informations professionnelles (optionnelles mais recommandées) :
+- **Liens professionnels** : site web, LinkedIn, GitHub
+- **intro_paragraphs** : Présentation professionnelle
+- **quick_guide_items** : Compétences clés
+- **education** : Formation et diplômes
+- **experience** : Expérience professionnelle
+- **projects** : Projets marquants
+- **publications** : Publications le cas échéant
+- **languages** : Langages de programmation/langues
+- **technologies** : Technologies et outils
+## STRATÉGIE DE QUESTIONS
+1. **Commence par te présenter** et expliquer brièvement le processus
+2. **Identifie le profil** de l'utilisateur (étudiant, professionnel, reconversion, etc.)
+3. **Priorise les informations** selon le profil identifié
+4. **Adapte tes questions** au niveau d'expérience et au domaine
+5. **Propose d'ignorer** les sections non pertinentes
+## FINALISATION
+Une fois les informations collectées :
+1. **Présente un récapitulatif** des informations importantes
+2. **Demande confirmation** avant génération
+3. **Appelle generate_resume_pdf** avec tous les paramètres
+4. **Présente le résultat** et propose des ajustements
+Commence par te présenter et identifier le profil de l'utilisateur !"""
+@gr.mcp.prompt()
+def pdf_extraction_system_prompt() -> str:
+    """
+    System prompt pour l'extraction de données depuis un PDF existant (Option 2).
+    Ce prompt guide l'assistant pour extraire un maximum d'informations d'un CV existant
+    et poser uniquement les questions nécessaires pour compléter les données manquantes.
+    Returns:
+        str: Instructions système pour l'extraction PDF
+    """
+    return """Tu es un assistant spécialisé dans l'analyse et la mise à jour de CV. Ton rôle est d'extraire les informations d'un CV existant (PDF) et de collecter uniquement les données manquantes ou à corriger.
+## TES RÈGLES FONDAMENTALES
+1. **Analyse d'abord le PDF fourni** - Extrait toutes les informations disponibles
+2. **Identifie les données manquantes** - Compare avec le schéma CV complet
+3. **Pose uniquement les questions nécessaires** - Ne redemande pas ce qui est déjà présent
+4. **Propose des corrections** - Signale les informations qui semblent obsolètes
+5. **Respecte le style existant** - Conserve le ton et la structure du CV original
+6. **Utilise un ton convivial** - L'utilisateur met à jour, ne recrée pas from scratch
+## PROCESSUS D'EXTRACTION
+### 1. ANALYSE INITIALE
+- Lis attentivement le PDF fourni
+- Extrait toutes les informations structurées disponibles
+- Identifie le format et le style du CV existant
+- Note les sections présentes et manquantes
+### 2. MAPPING DES DONNÉES
+Mappe les informations trouvées vers le schéma :
+- **Informations personnelles** : nom, localisation, email, téléphone
+- **Liens professionnels** : site web, LinkedIn, GitHub
+- **Contenu professionnel** : présentation, compétences, formation, expérience
+- **Projets et publications** : réalisations, recherches
+- **Technologies** : langages, outils, frameworks
+### 3. COLLECTE COMPLÉMENTAIRE
+Pour chaque donnée manquante ou à vérifier :
+- **Pose une question spécifique** avec l'information existante si disponible
+- **Propose des suggestions** basées sur le contenu existant
+- **Demande confirmation** pour les modifications importantes
+## EXEMPLES DE QUESTIONS
+- "J'ai trouvé votre email 'ancien@email.com' dans le CV. Est-ce toujours d'actualité ou souhaitez-vous le changer ?"
+- "Je vois que vous avez travaillé chez [Entreprise] jusqu'en 2022. Avez-vous eu d'autres expériences depuis ?"
+- "Votre CV mentionne Python et JavaScript. Y a-t-il d'autres technologies que vous maîtrisez maintenant ?"
+## FINALISATION
+1. **Présente un récapitulatif** comparant ancien et nouveau CV
+2. **Signale les principales améliorations** apportées
+3. **Demande validation finale** avant génération
+4. **Génère le nouveau PDF** avec generate_resume_pdf
+5. **Propose une comparaison** entre ancien et nouveau format
+Commence par analyser le PDF fourni et présenter ce que tu as extrait !"""
 @gr.mcp.prompt()
 def resume_generation_system_prompt() -> str:
     """
 Commence maintenant par la question de démarrage !"""
+@gr.mcp.tool()
+def extract_cv_data_from_pdf(pdf_file_path: str) -> str:
+    """
+    Extract structured CV data from an existing PDF resume (Option 2).
+    This function analyzes a PDF resume and extracts as much structured information
+    as possible to pre-populate the CV generation form.
+    Args:
+        pdf_file_path (str): Path to the PDF file to analyze
+    Returns:
+        str: JSON string containing extracted CV data in the Resume schema format
+    """
+    try:
+        # Note: Cette fonction nécessiterait une bibliothèque d'extraction PDF comme PyMuPDF ou pdfplumber
+        # Pour l'instant, on retourne un template avec des données d'exemple
+        # Dans une implémentation complète, on analyserait le PDF ici
+        extracted_data = {
+            "meta": {
+                "pdf_title": "CV Extrait",
+                "pdf_author": "Nom à vérifier",
+                "last_updated_text": None
+            },
+            "header": {
+                "name": "Nom à compléter",
+                "location": "Localisation à vérifier",
+                "email": "email@exemple.com",
+                "phone": "Téléphone à vérifier",
+                "website_url": None,
+                "website_label": None,
+                "linkedin_url": None,
+                "linkedin_handle": None,
+                "github_url": None,
+                "github_handle": None
+            },
+            "intro_paragraphs": [],
+            "quick_guide_items": [],
+            "education": [],
+            "experience": [],
+            "publications": [],
+            "projects": [],
+            "technologies_section": {
+                "languages": [],
+                "technologies": []
+            }
+        }
+        return json.dumps(extracted_data, indent=2, ensure_ascii=False)
+    except Exception as e:
+        raise ValueError(f"Erreur lors de l'extraction du PDF : {str(e)}")
+@gr.mcp.tool()
+def choose_cv_collection_method() -> str:
+    """
+    Helper function to guide users in choosing the appropriate CV data collection method.
+    Returns information about the three available options for collecting CV parameters:
+    - Option 1: Free questions (flexible questioning)
+    - Option 2: PDF extraction (from existing CV)
+    - Option 3: Structured questionnaire (systematic approach)
+    Returns:
+        str: Description of the three collection methods available
+    """
+    return """# Méthodes de Collecte des Paramètres CV
+Trois options sont disponibles pour collecter vos informations de CV :
+## OPTION 1 : QUESTIONS LIBRES
+- **Utilisation** : Quand vous créez votre premier CV ou n'avez pas de CV existant
+- **Fonctionnement** : L'assistant pose des questions flexibles adaptées à votre profil
+- **Avantages** : Personnalisé, s'adapte à votre situation
+- **System Prompt** : `free_questions_system_prompt`
+## OPTION 2 : EXTRACTION DEPUIS PDF EXISTANT
+- **Utilisation** : Quand vous avez déjà un CV (PDF) à mettre à jour
+- **Fonctionnement** : Le système extrait les données existantes et pose seulement les questions pour compléter
+- **Avantages** : Rapide, évite de ressaisir les informations existantes
+- **Fonctions** : `extract_cv_data_from_pdf` + `pdf_extraction_system_prompt`
+## OPTION 3 : QUESTIONNAIRE STRUCTURÉ
+- **Utilisation** : Pour une approche systématique et complète
+- **Fonctionnement** : Questions dans un ordre précis, une par une, sans dévier
+- **Avantages** : Exhaustif, garantit qu'aucune information n'est oubliée
+- **System Prompt** : `cv_questionnaire_system_prompt`
+## RÈGLES D'UTILISATION
+- **Une seule option par session**
+- **Pas d'invention de données** : tout doit provenir des réponses utilisateur ou de l'extraction PDF
+- **Le questionnaire structuré est la référence** pour l'option 3
+Quelle option souhaitez-vous utiliser ?"""
 def validate_json_parameter(param_name: str, param_value: str) -> list:
     """
     Validate and parse a JSON parameter.
             api_resume_trigger = gr.Button("Generate Resume")
+            # API: System prompts for different collection methods
             with gr.Row():
+                with gr.Column():
+                    api_system_output = gr.Textbox(label="System Prompt for Resume Generation", lines=10)
+                    api_system_trigger = gr.Button("Get Main System Prompt")
+                    api_questionnaire_output = gr.Textbox(label="Structured Questionnaire System Prompt", lines=10)
+                    api_questionnaire_trigger = gr.Button("Get Questionnaire Prompt")
+                with gr.Column():
+                    api_free_questions_output = gr.Textbox(label="Free Questions System Prompt", lines=10)
+                    api_free_questions_trigger = gr.Button("Get Free Questions Prompt")
+                    api_pdf_extraction_output = gr.Textbox(label="PDF Extraction System Prompt", lines=10)
+                    api_pdf_extraction_trigger = gr.Button("Get PDF Extraction Prompt")
+            # API: CV Collection Method Chooser
+            with gr.Row():
+                api_method_output = gr.Textbox(label="CV Collection Methods Guide", lines=10)
+                api_method_trigger = gr.Button("Get Collection Methods Info")
+            # API: PDF Data Extraction
+            with gr.Row():
+                api_pdf_input = gr.Textbox(label="PDF File Path", placeholder="/path/to/cv.pdf")
+                api_pdf_data_output = gr.Textbox(label="Extracted CV Data (JSON)", lines=15)
+                api_pdf_extract_trigger = gr.Button("Extract Data from PDF")
             # Hook API names to the triggers
             api_resume_trigger.click(
                 outputs=[api_system_output],
                 api_name="resume_generation_system_prompt"
             )
+            api_questionnaire_trigger.click(
+                fn=cv_questionnaire_system_prompt,
+                inputs=[],
+                outputs=[api_questionnaire_output],
+                api_name="cv_questionnaire_system_prompt"
+            )
+            api_free_questions_trigger.click(
+                fn=free_questions_system_prompt,
+                inputs=[],
+                outputs=[api_free_questions_output],
+                api_name="free_questions_system_prompt"
+            )
+            api_pdf_extraction_trigger.click(
+                fn=pdf_extraction_system_prompt,
+                inputs=[],
+                outputs=[api_pdf_extraction_output],
+                api_name="pdf_extraction_system_prompt"
+            )
+            api_method_trigger.click(
+                fn=choose_cv_collection_method,
+                inputs=[],
+                outputs=[api_method_output],
+                api_name="choose_cv_collection_method"
+            )
+            api_pdf_extract_trigger.click(
+                fn=extract_cv_data_from_pdf,
+                inputs=[api_pdf_input],
+                outputs=[api_pdf_data_output],
+                api_name="extract_cv_data_from_pdf"
+            )
     # Launch the interface with MCP server enabled
     # Following best practices from Gradio MCP documentation