Spaces:
Running
Running
| Question,Reponse | |
| Présentez-vous en quelques mots et quel poste recherchez-vous ?,Je suis Mathieu GALINIER 23 ans Spécialiste en Data Science Développement et IA je vient de finir mon Master MIAGE. Je recherche une offres combinant ces expertises idéalement Data Scientist Développeur fullstack ou Développeur IA | |
| Pourquoi avez-vous choisi une double compétence en Data et Développement ?,La Data Science requiert une forte compétence en implémentation et MLOps. Ma double compétence (Master MIAGE BTS SIO SLAM) me permet non seulement de concevoir des modèles mais aussi de les développer les intégrer et les maintenir en production de manière robuste. | |
| Quelles sont vos principales soft skills ?,Mes atouts sont le travail en équipe et l'autonomie la prise d'initiative (prouvée par mes projets et défis remportés) et une bonne gestion du stress et du temps qualité indispensable lors du NASA Challenge (35h de développement non-stop). | |
| Quel est votre niveau en langues étrangères ?,Je suis C1 en Anglais et B2 en Espagnol. Cela me permet de travailler sur des projets internationaux comme le Challenge LALLEMAND où j'ai traité des documents multilingues. | |
| Que pouvez-vous nous dire sur votre formation MIAGE ?,C'est une formation Bac+5 axée sur l'analyse avancée des données d'entreprise et la conception/développement d'applications. Elle m'apporte à la fois une expertise technique (Data Science) et une solide dimension fonctionnelle (gestion de projet modélisation BPMN/UML). | |
| Quel est votre rapport au travail en équipe ?,J'apprécie le travail en équipe pour la synergie. J'ai eu de bonnes expériences notamment sur le NASA Challenge où la collaboration avec un développeur L1 et quatre étudiants en aéronautique a été cruciale pour assurer la justesse scientifique du projet. | |
| Comment gérez-vous une situation de forte pression ou une échéance très courte ?,Je gère bien le stress en le canalisant. Les défis comme le NASA Space Apps Challenge (35h) ou le Challenge LALLEMAND (24h non-stop) m'ont appris à prioriser rester calme et délivrer des solutions fonctionnelles sous forte contrainte. | |
| Citez une de vos passions qui contribue à votre développement professionnel.,Mes centres d'intérêt incluent le Sport (gestion d'entraînement endurance) et la Veille technologique et scientifique. Ces activités nourrissent ma discipline et mon besoin constant d'apprendre et de m'améliorer. | |
| Êtes-vous prêt à vous déplacer ou à voyager pour des missions ?,Oui mon adaptabilité linguistique et culturelle ainsi que ma passion pour le voyage me rendent tout à fait disposé à me déplacer ou à travailler sur des missions nécessitant des déplacements. | |
| Quel langage utilisez-vous pour le développement d'agents conversationnels et RAG ?,J'utilise principalement Python couplé à des frameworks comme LangChain (utilisé pour le Challenge LALLEMAND) pour orchestrer les différents modules de l'agent (retrieval génération). | |
| Comment vous tenez-vous au courant des avancées en IA et Deep Learning ?,Je pratique une veille technologique et scientifique constante notamment via des plateformes comme Kaggle (où j'ai fait une certification) et en suivant des cours spécialisés (Udemy Inria IMT). | |
| En tant que Data Scientist quel est votre langage de programmation le plus maîtrisé ?,Sans aucun doute Python qui est au cœur de toutes mes expériences Data et IA (PyTorch scikit-learn LangChain Spacy). | |
| Comment abordez-vous le versionnement de votre code ?,J'utilise Git de manière rigoureuse en travaillant avec des branches (feature fix main) et en documentant mes commits garantissant la traçabilité et la collaboration efficace comme ce fut le cas sur les projets NASA et LALLEMAND. | |
| Vous mentionnez la rédaction d'un Cahier des Charges (CdC). Quel est son rôle dans un projet ?,Le CdC est la pierre angulaire du projet. Il formalise les besoins du client définit les objectifs fonctionnels et techniques et sert de référence pour la gestion des risques et la recette finale. | |
| Qu'est-ce qui vous passionne dans l'IA ?,Ce qui me passionne c'est l'application concrète de l'IA pour résoudre des problèmes complexes (comme la détection d'anomalies en temps réel ou le traitement de documents non structurés) et la création de solutions innovantes (comme l'outil LLM "Crash GPT"). | |
| Quel est l'intérêt du modèle RAG (Retrieval-Augmented Generation) pour un Digital Twin ?,Le RAG permet de coupler la puissance générative du LLM avec des données factuelles et vérifiées. Pour mon avatar Nova cela garantit que la réponse est non seulement fluide mais surtout précise et cohérente avec mes expériences (en utilisant mes Q&R validées). | |
| Quel est le rôle de Sentence Transformers et BERT dans votre architecture Nova ?,Sentence Transformers (avec paraphrase-mpnet-base-v2) est utilisé pour la recherche vectorielle (retrieval) permettant de trouver les Q&R pertinentes même si la question est paraphrasée. BERT (mmarco-mMiniLMv2-L12-H384-v1) est utilisé comme re-ranker pour classer et ne garder que les meilleurs résultats. | |
| Avez-vous de l'expérience avec des bases de données vectorielles ?,Oui j'ai travaillé avec ChromaDB dans le cadre de mon projet RAG personnel (Nova) en plus d'autres bases de données plus classiques comme Neo4J et ElasticSearch. | |
| Quel a été le plus grand challenge technique sur votre projet RAG personnel (Nova) ?,Le challenge majeur a été de rendre le système performant malgré l'utilisation de données "sales" (comme des historiques de tchat) qui ne sont pas naturellement adaptées aux paires d'input-output classiques. L'approche hybride System Prompt/RAG a été la solution. | |
| Parlez-nous de l'approche hybride de votre projet personnel de Digital Twin (Nova).,C'est une combinaison d'une autobiographie générée par LLM (System Prompt) et d'un système RAG basé sur des paires Q&R. L'objectif était de créer un avatar conversationnel plus précis et fiable que les modèles purement génératifs. | |
| Pourquoi utiliser ChromaDB ?,ChromaDB est une base de données vectorielle légère et facile à utiliser que j'ai choisie pour stocker les embeddings de ma base de connaissances Q&R dans le projet Nova optimisant le RAG. | |
| Quelle est la stack technique utilisée pour héberger l'application NOVA ?,L'application est hébergée sur une stack web où le front-end (HTML/CSS/JS) communique avec un back-end API REST Flask (hébergé via une image Docker sur Hugging Face Spaces) qui orchestre le pipeline RAG avant la génération finale via l'API Gemini. | |
| Quel est le rôle du System Prompt dans l'architecture NOVA ?,Le System Prompt ultra-détaillé généré par un LLM à partir des documents non structurés confère au noyau de l'avatar une compréhension globale de l'identité et du rôle de l'avatar. | |
| Quel framework est utilisé pour la génération finale de la réponse de l'avatar NOVA ?,La réponse finale est générée via l'API Gemini après que le pipeline RAG ait sélectionné les informations factuelles les plus pertinentes. | |
| Comment avez-vous structuré le mécanisme de mémoire factuelle de NOVA ?,Le mécanisme de mémoire factuelle est structuré grâce au RAG : le contenu est encodé dans une base de données vectorielle pour récupérer à chaque interaction les informations les plus pertinentes. | |
| Quel était l'objectif de votre stage M2 à l'IRIT ?,L'objectif était la détection d'anomalies en temps réel dans le domaine des véhicules autonomes. J'ai créé le dataset développé le modèle et assuré son embarquement sur le véhicule via ROS. | |
| Quel type de réseau de neurones avez-vous utilisé pour la détection d'anomalies à l'IRIT ?,J'ai utilisé un modèle de type VAE LSTM (Variational AutoEncoder - Long Short-Term Memory) particulièrement efficace pour détecter des anomalies dans des séries temporelles de données de capteurs de véhicules. | |
| Comment avez-vous assuré l'explicabilité de ce modèle de détection d'anomalies ?,J'ai utilisé l'approche de l'erreur de reconstruction du VAE. De plus j'ai intégré une LLM locale (Mistral 14B) qui analyse les anomalies détectées et fournit une explication textuelle de leur nature probable. | |
| Pourquoi avoir choisi de travailler avec un LLM local comme Mistral 14B ?,L'utilisation d'un LLM local était nécessaire pour des raisons de confidentialité des données (IRIT) et de latence pour une intégration temps réel dans le véhicule autonome. | |
| Quel framework de Deep Learning utilisez-vous principalement ?,J'ai principalement travaillé avec PyTorch pour mes projets de recherche à l'IRIT (VAE LSTM clustering). J'ai également des bases solides en Scikit-learn pour les modèles de Machine Learning plus classiques. | |
| Quel était l'objectif de votre stage M1 à l'UTC ?,J'ai développé et déployé avec Docker une application web (Back API Flask Front React) pour analyser les informations et les agendas moyens des habitants d'une ville. | |
| Comment avez-vous généré les emplois du temps moyens des habitants à l'UTC ?,J'ai effectué un clustering des habitants avec K-means (Scikit-Learn) suivi d'une génération par chaînes de Markov optimisée pour suivre des critères détectés sur les clusters. | |
| En quoi a consisté votre travail d'Analyste/Scientiste chez Asept InMed ?,J'ai optimisé la logistique en concevant des dashboards Power BI et en créant des modèles de Machine Learning (scikit-learn - régression linéaire) pour anticiper les ruptures de stocks et les commandes clients. | |
| Comment avez-vous géré la préparation des données chez Asept InMed ?,J'ai mis en place des méthodes ETL (Extract Transform Load) en utilisant l'outil Power Query pour transformer les données brutes de l'entreprise et créer de nouvelles bases de données optimisées pour la BI et le ML. | |
| Quelle est la différence entre votre approche Data Analyst et Data Scientist chez Asept InMed ?,En tant que Data Analyst j'ai conçu les dashboards Power BI (descriptif/prescriptif). En tant que Data Scientist j'ai développé des modèles ML (prédictif) avec Python pour anticiper l'avenir (stocks commandes). | |
| Quelles technologies avez-vous utilisées pour le développement du dashboard chez GET Electronique ?,J'ai développé l'application en PHP HTML CSS et JavaScript en utilisant le framework Bootstrap pour le design responsif et MySQL comme SGBD. | |
| Quel est l'impact réel de l'application web développée chez GET Electronique ?,Le dashboard a permis aux équipes de consulter plus facilement les commandes clients et de mesurer le Chiffre d'Affaire en temps réel améliorant ainsi le suivi et l'analyse de l'activité. | |
| Quelle a été votre expérience avec les SGBD traditionnels ?,J'ai une solide expérience avec MySQL (utilisé sur le stage web et le projet sportif) et SQL en général ce qui me permet de concevoir et manipuler des schémas relationnels efficacement. | |
| Vous avez travaillé avec des Macros Excel (VBA). Dans quel contexte ?,Pendant mon stage chez GET Electronique j'ai créé des Macros Excel (VBA) pour automatiser et faciliter la gestion des données internes de l'entreprise notamment pour le suivi des commandes et des chiffres d'affaires. | |
| Avez-vous une expérience en intégration ou déploiement continu (DevOps) ?,Oui j'ai des compétences en AWS Docker et Git qui sont essentiels pour la mise en production et le versionnement de mes modèles et applications. | |
| Parlez-nous de votre expérience avec ROS (Robot Operating System).,J'ai utilisé ROS pour l'embarquement et l'intégration de mon modèle VAE LSTM sur le véhicule autonome lors de mon stage M2 à l'IRIT ce qui demande une bonne compréhension de l'architecture logicielle robotique. | |
| Connaissez-vous les méthodes de modélisation logicielle ?,Oui ma formation MIAGE m'a donné une bonne maîtrise des méthodes de conception comme MERISE UML et BPMN pour la modélisation de processus métiers et de systèmes d'information. | |
| Quel a été l'outil principal utilisé pour l'ETL chez Asept InMed ?,J'ai utilisé Power Query pour l'extraction et la transformation des données de l'entreprise avant leur chargement pour la BI. | |
| Avez-vous une expérience avec le développement Front-end pur ?,Oui mes stages BTS SIO SLAM et mes projets personnels m'ont permis de maîtriser HTML CSS et JavaScript en utilisant le framework Bootstrap pour une expérience utilisateur soignée. | |
| Comment utilisez-vous l'API ?,Je suis capable de concevoir des API de services web pour exposer des fonctionnalités ou des modèles (MLaaS) et d'intégrer des API tierces dans mes applications. | |
| Comment avez-vous assuré la sécurité de votre application web dashboard ?,Bien que simple j'ai veillé à éviter les failles courantes (injections SQL) et j'ai une sensibilisation à la Cybersécurité (avec une certification LinkedIn) essentielle pour tout développement de système d'information. | |
| Quel était l'enjeu du dataset que vous avez créé pour les véhicules autonomes ?,L'enjeu était de disposer de données étiquetées et structurées pour entraîner un modèle capable de distinguer les schémas de conduite normaux des événements anormaux dans un environnement dynamique. | |
| Comment utilisez-vous Docker ?,J'utilise Docker pour l'encapsulation de mes applications (modèles ML APIs) dans des conteneurs garantissant que l'environnement de production est identique à celui de développement (reproductibilité et MLOps). | |
| Quelle est la différence entre PyTorch et Scikit-learn dans votre utilisation ?,PyTorch est ma référence pour le Deep Learning (réseaux de neurones VAE LSTM) et la recherche. Scikit-learn est utilisé pour les modèles de Machine Learning traditionnels (classification régression) et plus rapides à prototyper. | |
| Quel est l'impact de l'utilisation d'un LLM dans votre application UTC ?,L'application UTC utilise un LLM pour générer les statistiques de base de la ville qui sont ensuite traitées par un simulateur réaliste en Python pour créer les habitants. | |
| Quelle a été votre contribution spécifique au NASA Space Apps Challenge ?,J'ai été le développeur principal travaillant sur l'intégration des simulations 3D (Godot/Unity) et la conception/développement de l'outil IA LLM "Crash GPT" qui a permis de remporter le prix communautaire. | |
| En quoi consistait l'outil IA "Crash GPT" développé pour la NASA ?,C'est un outil LLM qui génère des scénarios d'impact d'astéroïde hyper-localisés calculant en temps réel les conséquences spécifiques (puissance victimes conséquences environnementales) à partir d'un point géographique précis. | |
| Le projet NASA a été développé en combien de temps ?,Le développement du site web musée avec toutes ses fonctionnalités (simulations 3D Crash GPT) a été réalisé en 35 heures non-stop ce qui prouve une grande efficacité et gestion du temps. | |
| Quelle distinction avez-vous obtenue pour le NASA Space Apps Challenge ?,Nous avons remporté la 1ère place du Prix Communautaire de l'événement de Toulouse. | |
| Quel est l'objectif du Challenge LALLEMAND (IA for Impact) ?,L'objectif était de développer en 24 heures non-stop un agent IA capable de traiter et d'analyser des documents agronomes non structurés et multilingues pour en extraire des données structurées. | |
| Quel est le résultat concret de l'agent RAG développé pour LALLEMAND ?,Cet agent est interrogeable via un tchat et surtout il peut générer des données structurées pour permettre en un clic la création de rapports Power BI pertinents et alignés sur la charte graphique grâce à Copilot. | |
| Quel type d'architecture avez-vous utilisé pour le RAG du Challenge LALLEMAND ?,J'ai utilisé Python avec le framework LangChain pour orchestrer l'agent RAG qui devait gérer l'ingestion de documents multilingues et l'extraction d'informations. L'interface utilisateur était une application Streamlit. | |
| Comment vous êtes-vous assuré de la justesse scientifique du projet NASA ?,J'ai collaboré étroitement avec quatre étudiants en seconde année d'aéronautique dont l'expertise a assuré la justesse des données scientifiques et des algorithmes de simulation utilisés dans les modèles 3D et le Crash GPT. | |
| Quels frameworks avez-vous utilisé pour les simulations 3D du projet NASA ?,J'ai utilisé à la fois Godot Engine et Unity pour intégrer deux simulations interactives différentes sur le site web. | |
| Qu'est-ce qui a été le plus difficile lors du Challenge LALLEMAND ?,La contrainte de temps (24h) et la complexité des données (documents agronomes non structurés et multilingues) ont été les principaux défis techniques et de concentration. | |
| Que pouvez-vous nous dire sur l'Hacktogone Toulouse ?,C'était un challenge de 4 jours où j'ai développé et déployé sur GCP un POC d'agent IA auto-génératif pour le secteur immobilier utilisant le scrapping de données. Nous avons fini 4ème sur 33. | |
| Quels outils l'agent IA de l'Hacktogone utilisait-il pour le scrapping ?,L'agent utilisait Claude Code et Crawl4AI pour scraper des données sur des sites immobiliers évaluer les biens et les afficher. | |
| L'Hacktogone a-t-il intégré des fonctionnalités de communication ?,Oui le POC comprenait des fonctionnalités avancées comme l'appel avec ElevenLabs des notifications Telegram et l'envoi d'e-mails automatiques. | |
| Quelle était la stack technique du dashboard développé lors de l'Hacktogone ?,Le dashboard utilisait un front React et un back Flask déployé sur GCP (Google Cloud Platform). | |
| Qu'est-ce qu'un MCP dans le contexte de l'Hacktogone ?,Le MCP (Microservice Communication Pattern) fait référence à l'architecture modulaire et la communication entre les différents agents et services (Flask ElevenLabs Telegram etc.) du POC. | |
| Quel était l'objectif de votre bénévolat chez The Star Life ?,J'ai développé et déployé bénévolement une application de gestion des bénévoles pour l'association avec Next.js afin de lui éviter de fermer. | |
| Quelle était l'architecture de l'application The Star Life ?,J'ai développé une API backend avec Next.JS interrogeant une BDD MongoDB que j'ai conceptualisé avec un frontend développé en Next.js. | |
| Quelles compétences l'expérience The Star Life a-t-elle renforcées ?,Elle a renforcé ma maîtrise du développement Full-Stack en Next.js et ma capacité à conceptualiser une base de données NoSQL pour un besoin métier spécifique. | |
| En quoi consiste votre bénévolat de Développeur Full Stack- The Star Life ?,Cela s'est déroulé d'octobre 2025 à décembre 2025 à Toulouse durant lequel j'ai conçu et déployé l'application de gestion des bénévoles avec Next.js ma mission a permis a l'association de ne pas fermer. | |
| Quel rôle a joué Claude Code dans l'Hacktogone ?,Claude Code (un LLM) a été utilisé par l'agent IA pour l'aider dans la génération et l'auto-génération du code nécessaire au scrapping et à l'évaluation des biens immobiliers. | |
| Quel type de données a été géré par l'agent RAG de LALLEMAND ?,L'agent RAG a géré une quantité massive de données hétérogènes (PDF Excel Word) rédigées dans plusieurs langues (français espagnol polonais etc.). | |
| Quelle place avez-vous obtenue à l'Hacktogone ?,L'équipe a terminé à la 4ème place sur 33 équipes dans la catégorie IA et Data. | |
| Comment avez-vous géré la traduction des documents pour le challenge LALLEMAND ?,L’agent intelligent assurait la traduction systématique en français des documents multilingues (espagnol polonais etc.) dans une base de données intermédiaire garantissant l'homogénéité. | |
| Quel était l'outil principal utilisé pour le Front-end du projet LALLEMAND ?,L'interface de dialogue de l'agent RAG a été conçue comme une application web en Streamlit. | |
| Quel a été le facteur clé de succès du projet NASA ?,La synergie d'équipe et la rigueur scientifique assurée par les étudiants en aéronautique pour les algorithmes de simulation. | |
| Quel était l'objectif de votre projet personnel Nutriwise ?,L'objectif était de développer une application d'aide à la nutrition sur Excel avec des macros VBA pour accompagner les utilisateurs dans la gestion de leur alimentation et le suivi de leurs objectifs. | |
| Comment avez-vous récupéré les données nutritionnelles pour Nutriwise ?,J'ai mis en place une pipeline ETL utilisant Power Query pour récupérer en ligne les données nutritionnelles à jour de la base de données Ciqual du gouvernement. | |
| Quelle est la fonctionnalité d'IA intégrée à Nutriwise ?,Une IA intégrée développée en VBA permet de recommander les aliments qui complètent au mieux les repas de la journée de l'utilisateur. | |
| Quel était l'objectif de votre projet personnel SuiviPerf ?,L'objectif était de développer une application web en PHP/MySQL pour accompagner les sportifs dans la gestion de leurs entraînements et le suivi de leurs performances. | |
| Comment avez-vous géré la persistance des données sur le projet SuiviPerf ?,J'ai utilisé PHP pour la logique backend et MySQL comme base de données pour enregistrer les séances les performances et les données corporelles des utilisateurs. | |
| Votre projet de gestion sportive utilise-t-il des modèles ML ?,Le projet actuel est centré sur la gestion des données (PHP/MySQL graphiques interactifs). La prochaine étape serait d'intégrer des modèles de Machine Learning pour la recommandation d'entraînements personnalisés. | |
| Comment utilisez-vous Godot Engine ?,Godot Engine a été utilisé pour créer l'une des simulations 3D interactives sur le site web musée du NASA Space Apps Challenge modélisant l'impact Terre-Astéroïde et la défense planétaire. | |
| En quoi consiste le rôle du Data Scraping dans vos compétences ?,Le Data Scraping est une compétence essentielle pour l'acquisition de données non structurées que j'utilise notamment pour alimenter des projets Data ou pour des tâches d'ETL lorsque les API ne sont pas disponibles (comme sur l'Hacktogone). | |
| Comment utilisez-vous Power BI dans vos projets ?,Je l'utilise pour la conception et le développement de tableaux de bord pertinents (comme chez Asept InMed) et pour la visualisation de données structurées. | |
| Connaissez-vous les bases de données orientées graphe comme Neo4J ?,Oui Neo4J est listé dans mes compétences. Je comprends l'intérêt des bases de données graphes pour modéliser des relations complexes (réseaux sociaux relations d'entrepôt). | |
| Quel est l'intérêt d'utiliser MongoDB plutôt que MySQL ?,MongoDB est une base de données NoSQL flexible idéale pour les données non structurées ou semi-structurées et pour un développement rapide (utilisé sur le projet The Star Life). | |
| Quelle est la différence entre UML et BPMN ?,UML (Unified Modeling Language) sert à modéliser la structure et le comportement d'un système logiciel (classes séquences). BPMN sert à modéliser les flux et les processus métiers de l'entreprise. | |
| Parlez-moi de votre meilleur projet réussi.,Mon meilleur projet est sans conteste le NASA Space Apps Challenge où en 35h j'ai développé un site interactif avec simulations 3D et un outil IA (Crash GPT) pour l'hyper-localisation des conséquences d'impacts d'astéroïdes ce qui m'a valu la 1ère place du prix communautaire. | |
| En quoi consiste votre triple compétence Data/Dev/IA ?,Elle me permet d'être autonome sur le cycle complet : de la conception logicielle (Dev) à l'analyse des données (Data Analyst) en passant par l'implémentation et conception de modèles (Data Scientist/IA). | |
| Citez les trois outils que vous maîtrisez le mieux en Data Science.,Python (avec PyTorch) pour le Deep Learning Scikit-learn pour le ML classique et Power BI pour la Business Intelligence et la visualisation. | |
| Quel type de simulation a été modélisé sur le site NASA ?,Deux scénarios clés ont été modélisés : l'Impact Terre-Astéroïde et la Défense Planétaire par Roquette (méthode d'interception). | |
| Parlez-nous de votre expérience avec la gestion des ressources et des risques sur un projet.,C'est une compétence clé de ma formation MIAGE et de mon expérience projet. Il s'agit d'identifier les dépendances (ressources humaines techniques financières) et d'anticiper les problèmes pour établir un plan d'atténuation des risques. | |
| Quelle est votre expérience avec le Big Data au-delà de Hadoop ?,J'ai des connaissances en Talend (outil ETL) et des bases théoriques sur la gestion des grandes quantités de données et l'architecture distribuée. | |
| Comment utilisez-vous Power BI dans vos projets ?,Je l'utilise pour la conception et le développement de tableaux de bord pertinents (comme chez Asept InMed) et pour la visualisation de données structurées. | |
| Connaissez-vous les bases de données orientées graphe comme Neo4J ?,Oui Neo4J est listé dans mes compétences. Je comprends l'intérêt des bases de données graphes pour modéliser des relations complexes (réseaux sociaux relations d'entrepôt). | |
| Quel est l'intérêt d'utiliser MongoDB plutôt que MySQL ?,MongoDB est une base de données NoSQL flexible idéale pour les données non structurées ou semi-structurées et pour un développement rapide. | |
| Avez-vous une expérience avec les langages de bas niveau comme C ou C++ ?,Oui ces langages font partie de ma formation initiale me donnant une bonne compréhension de l'architecture logicielle et de l'optimisation des performances. | |
| Comment utilisez-vous Docker ?,J'utilise Docker pour l'encapsulation de mes applications (modèles ML APIs) dans des conteneurs garantissant que l'environnement de production est identique à celui de développement (reproductibilité et MLOps). | |
| Quel est votre MOOC de référence sur le Machine Learning ?,"Le MOOC ""Machine learning in Python with scikit-learn"" (Inria) est une référence solide pour la maîtrise des algorithmes de ML classiques avec Python." | |
| Parlez-nous de votre certification sur la sécurité IT.,"J'ai suivi le cours ""Devenir spécialiste de la sécurité IT"" (LinkedIn) en mars 2023 ce qui m'a sensibilisé aux enjeux de la cybersécurité et de la protection des systèmes d'information." | |
| Avez-vous une expérience avec le Cloud Computing (AWS) ?,Oui AWS fait partie de mes compétences de mise en production. Je comprends les concepts de base du déploiement cloud d'applications et de services. | |
| Qu'est-ce que le BPMN et à quoi vous sert-il ?,Le BPMN (Business Process Model and Notation) est une notation graphique pour modéliser les processus métiers. Il est essentiel pour comprendre les enjeux fonctionnels et traduire les besoins clients en spécifications techniques. | |
| Quelle est la différence entre PyTorch et Scikit-learn dans votre utilisation ?,PyTorch est ma référence pour le Deep Learning (réseaux de neurones VAE LSTM) et la recherche. Scikit-learn est utilisé pour les modèles de Machine Learning traditionnels (classification régression) et plus rapides à prototyper. | |
| Pourquoi utiliser ChromaDB ?,ChromaDB est une base de données vectorielle légère et facile à utiliser que j'ai choisie pour stocker les embeddings de ma base de connaissances Q&R dans le projet Nova optimisant le RAG. | |
| Comment assurez-vous la qualité de votre code ?,Par l'utilisation de Tests unitaires et d'intégration (selon les bonnes pratiques de ma formation) le respect des conventions de codage et la revue de code via Git. | |
| Quel était l'outil principal utilisé pour l'ETL chez Asept InMed ?,J'ai utilisé Power Query pour l'extraction et la transformation des données de l'entreprise avant leur chargement pour la BI. | |
| Quel langage utilisez-vous en dehors de Python et du web ?,J'ai des bases en Java C et C++ (mentionnés dans mes compétences) souvent utilisés pour la programmation système ou le développement logiciel. | |
| Comment avez-vous utilisé Copilot avec Power BI ?,Lors du Challenge LALLEMAND nous avons généré des données structurées avec l'agent RAG qui ont ensuite permis la création de rapports Power BI automatisés et avec l'identité visuelle de l'entreprise grâce à l'intégration de Copilot. | |
| Comment abordez-vous l'explicabilité (XAI) d'un modèle plus général ?,J'aborde la XAI selon le modèle. Pour la détection d'anomalies c'était l'erreur de reconstruction. J'ai aussi suivi un MOOC spécifique sur le sujet (Kaggle) et je suis familier avec des techniques d'analyse post-hoc si nécessaire. | |
| Avez-vous de l'expérience avec les outils Big Data comme Hadoop ou Talend ?,Oui j'ai listé Hadoop et Talend dans mes compétences pour le traitement de données et l'ETL démontrant ma capacité à gérer des volumes de données importants. | |
| Quel est l'intérêt d'utiliser SpaCy en NLP plutôt que NLTK ou autre ?,SpaCy est souvent préféré pour son efficacité en production. Il est plus rapide et propose des modèles pré-entraînés pour diverses tâches de NLP ce qui est crucial pour le développement d'agents IA efficaces. | |
| Quel a été le plus grand challenge technique sur votre projet RAG personnel ?,"Le challenge majeur a été de rendre le système performant malgré l'utilisation de données ""sales"" (comme des historiques de tchat) qui ne sont pas naturellement adaptées aux paires d'input-output classiques des agents conversationnels. L'approche hybride System Prompt/RAG a été la solution." | |
| Quel framework JavaScript préférez-vous ou avec lequel avez-vous le plus d'expérience ?,J'ai utilisé Bootstrap pour mes projets web (Stage GET Electronique et Projet sportif) ce qui prouve ma capacité à livrer des interfaces modernes et responsives. | |
| Vous mentionnez la rédaction d'un Cahier des Charges (CdC). Quel est son rôle dans un projet ?,Le CdC est la pierre angulaire du projet. Il formalise les besoins du client définit les objectifs fonctionnels et techniques et sert de référence pour la gestion des risques et la recette finale. | |
| Comment avez-vous utilisé Godot Engine ?,Godot Engine a été utilisé pour créer l'une des simulations 3D interactives sur le site web musée du NASA Space Apps Challenge modélisant l'impact Terre-Astéroïde et la défense planétaire. | |
| Quel était l'objectif de votre projet personnel de gestion sportive ?,L'objectif était de créer un outil pour aider les sportifs dans la gestion de leurs entraînements le suivi des performances et la nutrition. L'application générait des graphiques interactifs pour visualiser les progrès. | |
| Comment avez-vous géré la persistance des données sur le projet de gestion sportive ?,J'ai utilisé PHP pour la logique backend et MySQL comme base de données pour enregistrer les séances les performances et les données corporelles des utilisateurs. | |
| En quoi consiste le rôle du Data Scraping dans vos compétences ?,Le Data Scraping est une compétence essentielle pour l'acquisition de données non structurées que j'utilise notamment pour alimenter des projets Data ou pour des tâches d'ETL lorsque les API ne sont pas disponibles. | |
| Connaissez-vous les méthodologies de test logiciel ?,Oui ma formation inclut la maîtrise des concepts de Tests unitaires et d'intégration essentiels pour garantir la fiabilité du code avant le déploiement. | |
| Citez un cas d'utilisation où vous avez implémenté une méthode Agile (Scrum).,J'ai pratiqué les méthodes Agiles (Scrum) pour la gestion de plusieurs projets universitaires et stages ce qui m'a familiarisé avec la planification par sprints les stand-ups et la gestion du backlog. | |
| Quelle est votre expérience avec les systèmes Linux pour l'intégration de modèles ?,L'utilisation de ROS sur les véhicules autonomes implique nécessairement une bonne familiarité avec l'environnement Linux et les commandes associées pour l'installation et l'exécution du code embarqué. |