YAML Metadata Warning:empty or missing yaml metadata in repo card

Check out the documentation for more information.

Agricultural Theme Classifier (TF-IDF + Logistic Regression)

French version below

This repository contains a machine learning model trained to classify agricultural questions by theme, such as fertilization, irrigation, pest control, or good farming practices.

Model

  • Algorithm: Logistic Regression
  • Vectorizer: TF-IDF (Term Frequency–Inverse Document Frequency)
  • Language: French
  • Input: A free-form agricultural question (string)
  • Output: A predicted theme label (e.g. "Bonnes pratiques agricoles")

How to Use

import joblib

# Load model and vectorizer
model = joblib.load("model_theme_classifier.joblib")
vectorizer = joblib.load("tfidf_vectorizer_theme.joblib")

# Predict theme
question = "Quels sont les bons gestes à adopter après la récolte du maïs ?"
X = vectorizer.transform([question])
theme_pred = model.predict(X)[0]

print("Predicted theme:", theme_pred)

Training Dataset The model was trained on a corpus of real-world agricultural questions from farmers in West Africa, annotated manually with thematic labels. A small data augmentation was performed for under-represented classes such as "Bonnes pratiques agricoles".

Limitations Model trained on a limited dataset (~300 samples)

Predictions may be less accurate for ambiguous or overly general questions

🇫🇷 Classificateur de Thématiques Agricoles (TF-IDF + Régression Logistique)

Ce dépôt contient un modèle de machine learning entraîné pour classer des questions agricoles selon leur thématique, comme la fertilisation, l’irrigation, la lutte contre les ravageurs ou les bonnes pratiques agricoles.

Modèle

  • Algorithme : Régression logistique
  • Vectorisation : TF-IDF (Term Frequency–Inverse Document Frequency)
  • Langue : Français
  • Entrée : Une question agricole libre (texte)
  • Sortie : Une thématique prédite (ex. : "Bonnes pratiques agricoles")

Utilisation

import joblib

# Charger le modèle et le vectoriseur
model = joblib.load("model_theme_classifier.joblib")
vectorizer = joblib.load("tfidf_vectorizer_theme.joblib")

# Prédire la thématique
question = "Quels sont les bons gestes à adopter après la récolte du maïs ?"
X = vectorizer.transform([question])
theme_pred = model.predict(X)[0]

print("Thématique prédite :", theme_pred)

Jeu de données Le modèle a été entraîné sur un corpus de vraies questions posées par des agriculteurs d’Afrique de l’Ouest, annotées manuellement avec des thématiques. Quelques exemples ont été ajoutés pour les classes peu représentées comme "Bonnes pratiques agricoles".

Limites Le modèle a été entraîné sur un petit jeu de données (~300 questions)

Les prédictions peuvent être moins fiables sur les questions ambiguës ou trop générales

Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support