Spaces:

Cassius1Morbant
/

French_Legal_Chatbot

Sleeping

App Files Files Community

French_Legal_Chatbot / README.md

Cassius1Morbant

Update README.md

726c555 verified 3 months ago

preview code

raw

history blame contribute delete

9.07 kB

A newer version of the Gradio SDK is available: 6.13.0

Upgrade

metadata

title: French Legal Chatbot
emoji: 💬
colorFrom: yellow
colorTo: purple
sdk: gradio
sdk_version: 5.42.0
app_file: app.py
pinned: false
hf_oauth: true
hf_oauth_scopes:
  - inference-api
license: gpl-3.0
short_description: A chatbot made for French Law

An example chatbot using Gradio, huggingface_hub, and the Hugging Face Inference API.

Examples:

--For the output examples, please see this link here

--Pour regarder les exemples, veuillez suivre le lien ci-contre

French Legal Chatbot | Chatbot Juridique Français

Disclaimer (English) | Avertissement (Français)

English: This tool is for informational and educational purposes only. It is not a substitute for professional legal advice.

Français : Cet outil est fourni à titre informatif et éducatif uniquement. Il ne constitue ni ne pretend etre un conseil juridique professionnel.

Purpose | Objectif

English: The chatbot enables the calculation of tax rates including income tax (IR), corporate tax (IS), real estate wealth tax (IFI), and value-added tax (VAT). It also supports the retrieval of case law (jurisprudence) from the Third Civil Chamber of the Court of Cassation as well as from the Commercial Chamber. Furthermore, it accommodates more general legal inquiries. Article lookup across various codes is supported, including the Civil Code, Commercial Code, Labour Code, Intellectual Property Code, General Tax Code, Code of Civil Procedure, Code of Civil Enforcement Procedures, and Consumer Code. The second tab is meant to be used to analyze the K-bis document of a company.Finally, The project allows you to create case briefs for casess that are,as of February 6th 2026, only French ones.

Français : Français : Le chatbot permet de calculer les taux d’impôt sur le revenu (IR), d’impôt sur les sociétés (IS), d’impôt sur la fortune immobilière (IFI) et de TVA. Il offre également la possibilité de rechercher des jurisprudences issues de la troisième chambre civile de la Cour de cassation ainsi que de la chambre commerciale. Il permet en outre de poser des questions plus générales. La recherche d’articles des codes est également prise en charge, notamment pour le Code civil, le Code de commerce, le Code du travail, le Code de la propriété intellectuelle, le Code général des impôts, le Code de procédure civile, le Code des procédures civiles d’exécution et le Code de la consommation. Le second volet est consacré a l'analyse des documents KBis d'entreprises.Enfin, il est possible de réaliser des fiches d’arrêt.

English:
The application is built using Gradio 6.5.0 (latest stable release as of January 2026) for the interactive web interface.
Inference is handled via the Hugging Face Inference API (serverless).
The core language model is Qwen/Qwen2.5-7B-Instruct (7.61 billion parameters, 128K token context length, Apache 2.0 license), a strong multilingual instruction-tuned LLM with good French-language support.
Retrieval-Augmented Generation (RAG) is implemented using a local vector database stored in the legaldex_db folder, enabling grounded responses from indexed French legal documents.
The UI features two tabs:

Tab 1 uses radio buttons to select among various non-OCR based document analysis functions.
Tab 2 is dedicated exclusively to K-bis document analysis.

Français :
L’application est construite avec Gradio 6.5.0 (version stable la plus récente en janvier 2026) pour l’interface web interactive.
L’inférence est réalisée via l’API Inference de Hugging Face (sans serveur local).
Le modèle de langage principal est Qwen/Qwen2.5-7B-Instruct (7,61 milliards de paramètres, contexte de 128K tokens, licence Apache 2.0), un LLM multilingue performant avec un bon support du français.
La génération augmentée par récupération (RAG) est implémentée à l’aide d’une base vectorielle locale contenue dans le dossier legaldex_db, permettant des réponses ancrées dans des documents juridiques français indexés.
L’interface comporte deux onglets :

Onglet 1 : boutons radio pour sélectionner parmi diverses analyses de documents non-OCR, precités.
Onglet 2 : dédié exclusivement à l’analyse de documents K-bis.

Limitations | Limites

English
This chatbot is an experimental prototype and has several important limitations:

Risk of hallucinations and inaccuracies: As with any large language model, responses may contain factual errors, fabricated details, or incorrect interpretations of French law, even when RAG is used.
No real-time legal updates: The underlying model (Qwen2.5-7B-Instruct) and the RAG database (legaldex_db) reflect knowledge only up to their respective training/indexing cutoffs. Recent legislative changes, new case law, or updated administrative interpretations (post-cutoff) will not be reflected unless the database is manually refreshed.
Incomplete coverage of jurisprudence: Retrieval is limited to the documents currently indexed in the legaldex_db folder. Coverage of Cour de cassation decisions (Third Civil Chamber and Commercial Chamber) and other courts is partial and not exhaustive.
Tax and calculation approximations: Tax rate explanations and computations are based on general rules and publicly available formulas; they do not account for individual circumstances, progressive brackets in real time, deductions, credits, or the latest administrative doctrine.
Document analysis constraints: Non-OCR document analysis (Tab 1) and K-bis analysis (Tab 2) depend on the quality and format of uploaded content. Complex layouts, handwritten text, or poorly scanned documents may lead to incomplete or erroneous results.
Not suitable for professional use: Outputs must never be relied upon as legal advice, official interpretation, or basis for legal decisions. Users are strongly advised to consult qualified legal professionals (avocats, notaires, experts-comptables) and verify all information against authoritative sources such as Légifrance.gouv.fr, Infogreffe, or official tax portals.
Language and nuance limitations: While the model performs well in French, subtle legal terminology, regional variations, or highly technical arguments may be imperfectly handled.

Français
Ce chatbot est un prototype expérimental et présente plusieurs limites importantes :

Risque d’hallucinations et d’inexactitudes : Comme tout grand modèle de langage, les réponses peuvent contenir des erreurs factuelles, des informations inventées ou des interprétations erronées du droit français, même avec l’utilisation du RAG.
Absence de mise à jour en temps réel : Le modèle sous-jacent (Qwen2.5-7B-Instruct) et la base RAG (legaldex_db) reflètent uniquement les connaissances jusqu’à leur date de coupure respective d’entraînement ou d’indexation. Les évolutions législatives, jurisprudentielles ou doctrinales récentes ne sont pas prises en compte sans actualisation manuelle de la base.
Couverture partielle de la jurisprudence : La récupération est limitée aux documents actuellement indexés dans le dossier legaldex_db. La couverture des arrêts de la Cour de cassation (troisième chambre civile et chambre commerciale) et des autres juridictions reste partielle et non exhaustive.
Approximations fiscales et calculs : Les explications et calculs de taux d’impôt reposent sur des règles générales et formules publiques ; ils ne tiennent pas compte des situations individuelles, tranches progressives en temps réel, abattements, crédits d’impôt ou doctrine administrative la plus récente.
Contraintes d’analyse documentaire : L’analyse de documents non-OCR (Onglet 1) et l’analyse K-bis (Onglet 2) dépendent de la qualité et du format des fichiers téléversés. Les mises en page complexes, textes manuscrits ou scans de mauvaise qualité peuvent entraîner des résultats incomplets ou erronés.
Non adapté à un usage professionnel : Les réponses ne doivent en aucun cas être considérées comme un conseil juridique, une interprétation officielle ou une base pour des décisions juridiques. Il est impératif de consulter des professionnels qualifiés (avocats, notaires, experts-comptables) et de vérifier toute information auprès de sources officielles telles que Légifrance.gouv.fr, Infogreffe ou les portails fiscaux compétents.
Limites linguistiques et de nuance : Bien que le modèle soit performant en français, les subtilités terminologiques, variantes régionales ou arguments très techniques peuvent être traitées de manière imparfaite.