Spaces:

MohammedMediani
/

darija-aicc-api

Runtime error

App Files Files Community

MohammedMediani commited on Jan 27

Commit

a61a8ff

1 Parent(s): bc84fc0

Professionalize API: Clean code, HF Model Hub integration, new README

Browse files

Files changed (11) hide show

Dockerfile +4 -5
README.md +37 -53
main.py +77 -67
mon_modele_darija_final/config.json +0 -54
mon_modele_darija_final/model.safetensors +0 -3
mon_modele_darija_final/special_tokens_map.json +0 -7
mon_modele_darija_final/tokenizer.json +0 -0
mon_modele_darija_final/tokenizer_config.json +0 -58
mon_modele_darija_final/training_args.bin +0 -3
mon_modele_darija_final/vocab.txt +0 -0
requirements.txt +7 -14

Dockerfile CHANGED Viewed

@@ -16,9 +16,8 @@ RUN pip install --no-cache-dir -r requirements.txt
 # Cela inclut main.py et le dossier de votre modèle (ex: "marbert-darija-nlu-aicc")
 COPY . .
-# Étape 6: Exposer le port que votre API utilise
-EXPOSE 8000
-# Étape 7: La commande pour lancer l'API quand le container démarre
-# Uvicorn est lancé avec host="0.0.0.0" pour être accessible de l'extérieur du container
-CMD ["uvicorn", "main:app", "--host", "0.0.0.0", "--port", "8000"]

 # Cela inclut main.py et le dossier de votre modèle (ex: "marbert-darija-nlu-aicc")
 COPY . .
+# Step 6: Expose the port used by the API (Hugging Face Spaces defaults to 7860)
+EXPOSE 7860
+# Step 7: Launch the API
+CMD ["uvicorn", "main:app", "--host", "0.0.0.0", "--port", "7860"]

README.md CHANGED Viewed

@@ -4,77 +4,61 @@ emoji: 🚀
 colorFrom: indigo
 colorTo: blue
 sdk: docker
-app_port: 8000
 ---
-# API de Classification d'Intention en Darija pour AICC
-Ce projet a été développé dans le cadre d'un Projet de Fin d'Études visant à intégrer le dialecte marocain "Darija" dans la solution **AICC (Artificial Intelligence Contact Center)** de Huawei.
-L'API utilise un modèle **MARBERTv2**, un Transformer pré-entraîné pour l'arabe et ses dialectes, qui a été fine-tuné sur un corpus personnalisé pour classifier les intentions des utilisateurs s'exprimant en Darija.
-[![Hugging Face Spaces](https://img.shields.io/badge/🤗%20Spaces-Live%20Demo%20API-yellow)](https://mediani-darija-aicc-api.hf.space/docs)
----
-## 🚀 API Déployée et Documentation Interactive
-L'API est en ligne et pleinement fonctionnelle. Vous pouvez la tester en direct grâce à l'interface Swagger UI générée automatiquement.
-**➡️ [Tester l'API interactivement ici](https://mediani-darija-aicc-api.hf.space/docs)**
----
-## 🔧 Comment Utiliser l'API
-L'API expose un endpoint principal `/predict` qui accepte les requêtes `POST` pour la classification d'intention.
-### Exemple de Requête avec `curl`
-Voici comment interroger l'API depuis un terminal :
-```bash
-curl -X 'POST' \
-  'https://mediani-darija-aicc-api.hf.space/predict' \
-  -H 'accept: application/json' \
-  -H 'Content-Type: application/json' \
-  -d '{"text": "Salam, la connexion 4G naqsa 3ndi bzaf"}'
 ```
-### Exemple de Réponse Attendue
-L'API retournera un objet JSON avec l'intention (intent) prédite par le modèle et son score de confiance (confidence).
 ```json
 {
-  "intent": "declarer_panne",
-  "confidence": 0.9954321098
 }
 ```
----
-## 📋 Liste des Intentions Reconnues
-Le modèle a été entraîné pour reconnaître et classifier les 9 intentions suivantes, qui sont les plus courantes dans un contexte de service client :
-- **consulter_solde**: Demandes concernant le solde, la recharge ou les données restantes.
-- **reclamer_facture**: Réclamations concernant une facture (montant élevé, erreur...).
-- **declarer_panne**: Signalement d'un problème technique (panne réseau, connexion lente...).
-- **info_forfait**: Demandes d'informations sur les produits, offres et abonnements.
-- **recuperer_mot_de_passe**: Demandes liées à la réinitialisation d'un mot de passe ou d'un code.
-- **salutations**: Salutations et début de conversation.
-- **remerciements**: Expressions de gratitude.
-- **demander_agent_humain**: Demande explicite de parler à un conseiller humain.
-- **hors_scope**: Toute demande hors du périmètre du service client.
-## 🛠️ Stack Technique & Cycle de Vie du Projet
-Ce projet a été réalisé en suivant un cycle de vie complet, du prototypage au déploiement :
-- **Modèle**: UBC-NLP/MARBERTv2 fine-tuné avec la bibliothèque transformers de Hugging Face.
-- **Corpus**: Un corpus personnalisé a été assemblé en combinant la collecte de données (Twitter, YouTube), la génération par IA, et l'annotation manuelle avec Doccano.
-- **Framework API**: FastAPI, pour sa rapidité et sa génération automatique de documentation.
-- **Conteneurisation**: Docker, pour garantir la portabilité et la reproductibilité de l'environnement.
-- **Versionnement**: Git & Git LFS pour gérer les gros fichiers de modèle (plus de 100 Mo).
-- **Déploiement**: L'API est hébergée sur Hugging Face Spaces, fournissant une solution CI/CD (intégration et déploiement continus) à partir d'un dépôt Git.

 colorFrom: indigo
 colorTo: blue
 sdk: docker
+app_port: 7860
 ---
+# Darija NLU API 🚀
+[![API Status](https://img.shields.io/website?url=https%3A%2F%2Fmohammedmediani-darija-aicc-api.hf.space%2Fhealth&label=API%20Status)](https://mohammedmediani-darija-aicc-api.hf.space/docs)
+[![Python](https://img.shields.io/badge/Python-3.9+-3776AB?logo=python&logoColor=white)](https://python.org)
+[![FastAPI](https://img.shields.io/badge/FastAPI-0.68+-009688?logo=fastapi&logoColor=white)](https://fastapi.tiangolo.com)
+[![Model](https://img.shields.io/badge/🤗%20Model-MARBERTv2-orange)](https://huggingface.co/mediani/marbert-fine-tuned-darija-aicc)
+A professional REST API for **Natural Language Understanding (NLU)** in Moroccan Arabic (Darija). Designed to power intelligent contact centers and automated support systems.
+## 🔗 Ecosystem
+| Project | Description | Link |
+|---------|-------------|------|
+| 📺 **Demo App** | Interactive Streamlit UI | [Go to Space](https://huggingface.co/spaces/mediani/darija-nlu-demo) |
+| 🧠 **Model** | Fine-tuned MARBERTv2 | [Go to Model](https://huggingface.co/mediani/marbert-fine-tuned-darija-aicc) |
+| 💻 **Source Code** | GitHub Repository | [Go to GitHub](https://github.com/mohammedmediani/aicc-nlu-api) |
+## 🚀 Quick Usage
+### Endpoint: `/predict` (POST)
+**Request:**
+```json
+{
+  "text": "bghit n3raf solde dyali"
+}
 ```
+**Response:**
 ```json
 {
+  "intent": "consulter_solde",
+  "confidence": 0.985
 }
 ```
+### Try it with cURL
+```bash
+curl -X 'POST' \
+  'https://mohammedmediani-darija-aicc-api.hf.space/predict' \
+  -H 'Content-Type: application/json' \
+  -d '{"text": "llah ykhalik bghit nchof factura"}'
+```
+## 📋 Features
+- **9 Intent Categories**: From balance checks (`consulter_solde`) to technical support (`declarer_panne`).
+- **High Performance**: Fine-tuned MARBERTv2 achieving >92% F1-score.
+- **Production Ready**: Built with FastAPI, utilizing async capabilities and robust error handling.
+- **Code-Switching**: Handles mixed Darija/French input natively.
+## 📄 License
+Apache 2.0

main.py CHANGED Viewed

@@ -1,98 +1,108 @@
-# main.py
-import torch
-from fastapi import FastAPI, HTTPException
-from pydantic import BaseModel
-from transformers import pipeline, AutoModelForSequenceClassification, AutoTokenizer
 from typing import Dict, Any
 # --- Configuration ---
-# Chemin vers votre modèle fine-tuné. Assurez-vous que ce dossier est correct.
-MODEL_PATH = "./mon_modele_darija_final"
-# --- Chargement du modèle (partie critique) ---
-# Cette partie est exécutée une seule fois, au démarrage du serveur.
-# C'est une bonne pratique pour éviter de recharger le modèle à chaque requête.
-try:
-    print("Chargement du tokenizer et du modèle MARBERT fine-tuné...")
-    # On spécifie le device (GPU si disponible, sinon CPU)
-    device = 0 if torch.cuda.is_available() else -1
-    # Création du pipeline de classification de texte de Hugging Face.
-    # C'est la manière la plus simple d'utiliser un modèle pour l'inférence.
-    nlu_pipeline = pipeline(
-        "text-classification",
-        model=MODEL_PATH,
-        tokenizer=MODEL_PATH,
-        device=device  # Utilise le GPU si disponible
-    )
-    print("Modèle chargé avec succès !")
-except Exception as e:
-    # Si le modèle ne peut pas être chargé, on lève une erreur claire.
-    print(f"Erreur critique lors du chargement du modèle: {e}")
     nlu_pipeline = None
-# --- Définition de l'application FastAPI ---
 app = FastAPI(
-    title="API de NLU pour Darija Marocaine",
-    description="Une API pour classifier l'intention d'un texte en Darija, basée sur MARBERT.",
-    version="1.0.0"
 )
-# --- Définition des modèles de données (Pydantic) ---
-# C'est pour la validation automatique des requêtes.
 class TextInput(BaseModel):
-    """Modèle pour le corps de la requête de prédiction."""
-    text: str # Le champ doit s'appeler 'text'
-    # Exemple de requête JSON attendue: {"text": "3afak bghit nchouf lfactura"}
 class PredictionResponse(BaseModel):
-    """Modèle pour la réponse de l'API."""
-    intent: str
-    confidence: float
-# --- Définition des routes de l'API ---
-@app.get("/", tags=["Général"])
 def read_root() -> Dict[str, str]:
-    """Route principale qui retourne un message de bienvenue."""
-    return {"message": "Bienvenue sur l'API de NLU Darija. Utilisez le endpoint /predict pour faire une prédiction."}
-@app.get("/health", tags=["Général"])
 def health_check() -> Dict[str, str]:
-    """Route de 'health check' pour vérifier si le service est en ligne et le modèle chargé."""
     if nlu_pipeline is None:
-        raise HTTPException(status_code=500, detail="Erreur: Le modèle NLP n'a pas pu être chargé.")
     return {"status": "ok", "model_status": "loaded"}
-@app.post("/predict", response_model=PredictionResponse, tags=["Prédiction"])
-def predict_intent(request: TextInput) -> PredictionResponse:
     """
-    Endpoint principal pour la prédiction d'intention.
-    Prend un texte en entrée et retourne l'intention prédite et son score de confiance.
     """
     if nlu_pipeline is None:
-        raise HTTPException(status_code=503, detail="Le service est indisponible car le modèle n'est pas chargé.")
-    if not request.text or not request.text.strip():
-        raise HTTPException(status_code=400, detail="Le champ 'text' ne peut pas être vide.")
     try:
-        # Utilisation du pipeline pour faire la prédiction
         prediction = nlu_pipeline(request.text, top_k=1)[0]
-        # Le pipeline retourne un dictionnaire avec 'label' et 'score'
-        # On renomme pour correspondre à notre modèle de réponse
-        intent = prediction['label']
-        confidence = prediction['score']
-        return PredictionResponse(intent=intent, confidence=confidence)
     except Exception as e:
-        # Gestion d'erreurs inattendues pendant la prédiction
-        raise HTTPException(status_code=500, detail=f"Une erreur interne est survenue: {str(e)}")

+"""
+Darija NLU API - Professional REST API for Moroccan Arabic Sentiment/Intent Classification.
+Powered by MARBERTv2 fine-tuned on Darija.
+"""
+import os
+from contextlib import asynccontextmanager
 from typing import Dict, Any
+from fastapi import FastAPI, HTTPException
+from pydantic import BaseModel, Field
+from transformers import pipeline
 # --- Configuration ---
+MODEL_ID = "mediani/marbert-fine-tuned-darija-aicc"
+# Global pipeline variable
+nlu_pipeline = None
+@asynccontextmanager
+async def lifespan(app: FastAPI):
+    """
+    Lifespan context manager for loading the model on startup.
+    This ensures the model is loaded only once.
+    """
+    global nlu_pipeline
+    try:
+        print(f"Loading model from HuggingFace Hub: {MODEL_ID}...")
+        # device=0 uses GPU if available, -1 uses CPU
+        # We rely on transformers to auto-detect the best available device if not specified,
+        # but explicit integer is often safer for pipelines.
+        import torch
+        device = 0 if torch.cuda.is_available() else -1
+        nlu_pipeline = pipeline(
+            "text-classification",
+            model=MODEL_ID,
+            tokenizer=MODEL_ID,
+            device=device
+        )
+        print("Model loaded successfully!")
+    except Exception as e:
+        print(f"CRITICAL: Failed to load model: {e}")
+        nlu_pipeline = None
+    yield
+    # Cleanup if necessary
     nlu_pipeline = None
+# --- FastAPI App Definition ---
 app = FastAPI(
+    title="Darija NLU API",
+    description="Professional API for intent classification in Moroccan Darija (Arabic Dialect).",
+    version="1.0.0",
+    lifespan=lifespan,
+    docs_url="/docs",
+    redoc_url="/redoc"
 )
+# --- Data Models ---
 class TextInput(BaseModel):
+    """Request model for text classification."""
+    text: str = Field(..., description="The text in Darija to analyze", min_length=1, example="3afak bghit nchouf solde")
 class PredictionResponse(BaseModel):
+    """Response model containing the predicted intent and confidence score."""
+    intent: str = Field(..., description="Predicted intent label")
+    confidence: float = Field(..., description="Confidence score between 0.0 and 1.0")
+# --- Routes ---
+@app.get("/", tags=["General"])
 def read_root() -> Dict[str, str]:
+    """Root endpoint returning welcome message."""
+    return {"message": "Welcome to the Darija NLU API. Use POST /predict to analyze text."}
+@app.get("/health", tags=["General"])
 def health_check() -> Dict[str, str]:
+    """Health check endpoint to verify service status and model loading."""
     if nlu_pipeline is None:
+        raise HTTPException(status_code=503, detail="Service initializing or model failed to load.")
     return {"status": "ok", "model_status": "loaded"}
+@app.post("/predict", response_model=PredictionResponse, tags=["Inference"])
+async def predict_intent(request: TextInput) -> PredictionResponse:
     """
+    Predict the intent of the provided Darija text.
     """
     if nlu_pipeline is None:
+        raise HTTPException(status_code=503, detail="Model not initialized.")
     try:
+        # Pipeline returns a list of dicts: [{'label': 'intent_name', 'score': 0.99}]
+        # We assume top_k=1 by default
         prediction = nlu_pipeline(request.text, top_k=1)[0]
+        return PredictionResponse(
+            intent=prediction['label'],
+            confidence=prediction['score']
+        )
     except Exception as e:
+        # Log the error internally here
+        print(f"Inference error: {e}")
+        raise HTTPException(status_code=500, detail="Internal processing error")
+if __name__ == "__main__":
+    import uvicorn
+    uvicorn.run(app, host="0.0.0.0", port=7860) # 7860 is the default port for HF Spaces

mon_modele_darija_final/config.json DELETED Viewed

@@ -1,54 +0,0 @@
-{
-  "architectures": [
-    "BertForSequenceClassification"
-  ],
-  "attention_probs_dropout_prob": 0.1,
-  "classifier_dropout": null,
-  "directionality": "bidi",
-  "gradient_checkpointing": false,
-  "hidden_act": "gelu",
-  "hidden_dropout_prob": 0.1,
-  "hidden_size": 768,
-  "id2label": {
-    "0": "consulter_solde",
-    "1": "declarer_panne",
-    "2": "demander_agent_humain",
-    "3": "hors_scope",
-    "4": "info_forfait",
-    "5": "reclamer_facture",
-    "6": "recuperer_mot_de_passe",
-    "7": "remerciements",
-    "8": "salutations"
-  },
-  "initializer_range": 0.02,
-  "intermediate_size": 3072,
-  "label2id": {
-    "consulter_solde": 0,
-    "declarer_panne": 1,
-    "demander_agent_humain": 2,
-    "hors_scope": 3,
-    "info_forfait": 4,
-    "reclamer_facture": 5,
-    "recuperer_mot_de_passe": 6,
-    "remerciements": 7,
-    "salutations": 8
-  },
-  "layer_norm_eps": 1e-12,
-  "max_position_embeddings": 512,
-  "model_type": "bert",
-  "num_attention_heads": 12,
-  "num_hidden_layers": 12,
-  "pad_token_id": 0,
-  "pooler_fc_size": 768,
-  "pooler_num_attention_heads": 12,
-  "pooler_num_fc_layers": 3,
-  "pooler_size_per_head": 128,
-  "pooler_type": "first_token_transform",
-  "position_embedding_type": "absolute",
-  "problem_type": "single_label_classification",
-  "torch_dtype": "float32",
-  "transformers_version": "4.52.4",
-  "type_vocab_size": 2,
-  "use_cache": true,
-  "vocab_size": 100000
-}

mon_modele_darija_final/model.safetensors DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:08322d4ab747d8187518d1d649c0bd36e7592fe4224f6b9885c3d2abe821d689
-size 651416604

mon_modele_darija_final/special_tokens_map.json DELETED Viewed

@@ -1,7 +0,0 @@
-{
-  "cls_token": "[CLS]",
-  "mask_token": "[MASK]",
-  "pad_token": "[PAD]",
-  "sep_token": "[SEP]",
-  "unk_token": "[UNK]"
-}

mon_modele_darija_final/tokenizer.json DELETED Viewed

The diff for this file is too large to render. See raw diff

mon_modele_darija_final/tokenizer_config.json DELETED Viewed

@@ -1,58 +0,0 @@
-{
-  "added_tokens_decoder": {
-    "0": {
-      "content": "[PAD]",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "1": {
-      "content": "[UNK]",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "2": {
-      "content": "[CLS]",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "3": {
-      "content": "[SEP]",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "4": {
-      "content": "[MASK]",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    }
-  },
-  "clean_up_tokenization_spaces": true,
-  "cls_token": "[CLS]",
-  "do_basic_tokenize": true,
-  "do_lower_case": true,
-  "extra_special_tokens": {},
-  "mask_token": "[MASK]",
-  "model_max_length": 1000000000000000019884624838656,
-  "never_split": null,
-  "pad_token": "[PAD]",
-  "sep_token": "[SEP]",
-  "strip_accents": null,
-  "tokenize_chinese_chars": true,
-  "tokenizer_class": "BertTokenizer",
-  "unk_token": "[UNK]"
-}

mon_modele_darija_final/training_args.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:1bd13abe00ada94ffbf7c954ed271cc6b814dccf8eb05202ad4977182cdba021
-size 5304

mon_modele_darija_final/vocab.txt DELETED Viewed

The diff for this file is too large to render. See raw diff

requirements.txt CHANGED Viewed

@@ -1,14 +1,7 @@
-# ---- Core API Framework ----
-fastapi
-uvicorn
-# ---- Machine Learning Model & Pipeline ----
-# On ne spécifie pas la version de torch car il est préférable de l'installer séparément
-# ou de laisser pip résoudre la dépendance en fonction de la plateforme (CPU/GPU)
-# mais pour une image Docker déterministe, la figer est une option.
-torch==2.7.1
-transformers==4.52.4
-# ---- FastAPI Specific ----
-# Nécessaire pour gérer les formulaires et le téléversement de fichiers, bonne pratique.
-python-multipart

+fastapi>=0.68.0
+uvicorn>=0.15.0
+torch>=1.9.0
+transformers>=4.10.0
+pydantic>=1.8.0
+sentencepiece
+protobuf