File size: 6,898 Bytes
92b54f2 0490752 92b54f2 0490752 92b54f2 e3bf775 92b54f2 bcdf035 92b54f2 bb958da |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 |
---
license: mit
language:
- fr
pipeline_tag: text-classification
tags:
- creatif
- Nekolien
- IA nekolienne
- classification de texte
---
## 🌸 Nekoline-classify : Le Classificateur Bilingue (Français/Nekolien) 🐱

### 🎀 Introduction Mignonne 🎀
Bonjour et bienvenue dans l'univers de **Nekoline-classify** \! Je suis **Clemylia** (18 ans), et je suis ravie de partager avec vous mon tout premier modèle de classification de texte basé sur ma propre langue inventée : le **Nekolien** \! 💖 Ce modèle simple, mais efficace, a été entraîné avec **PyTorch** et est prêt à vous aider à distinguer le Nekolien du Français. C'est l'outil parfait pour tous ceux qui souhaitent explorer cette langue unique \! ✨
### 🎯 Objectif et Tâche du Modèle
**Nekoline-classify** est un modèle de **classification binaire de texte**. Sa mission est de déterminer si une phrase donnée est écrite en **Français** ou en **Nekolien** (correcte).
**Tâche :** Identifier la langue d'une phrase.
**Entrée :** Une chaîne de caractères (une phrase).
**Sortie :** Une prédiction binaire (0 ou 1).
| Valeur de Sortie | Langue Identifiée |
| :---: | :---: |
| **0** | 🇫🇷 **Français** |
| **1** | 🐱 **Nekolien** (Correct) |
-----
## 🛠️ Utilisation et Installation Rapide
Ce modèle a été créé avec **PyTorch**, mais il est facilement utilisable via la librairie **`transformers`** de Hugging Face.
### 💻 Installation
Assurez-vous d'avoir les librairies nécessaires installées :
```bash
pip install torch transformers
```
### 🦄 Exemple d'Utilisation
Voici comment vous pouvez rapidement charger et utiliser **Nekoline-classify** :
```python
from transformers import pipeline
# Charger le classificateur
# (Le chemin "Clemylia/Nekoline-classify" est un exemple,
# il faudra le remplacer par votre identifiant réel si c'est différent)
classifier = pipeline("text-classification", model="Clemylia/Nekoline-classify")
# --- Exemples de phrases ---
phrase_fr = "J'aime beaucoup les chats et l'intelligence artificielle."
phrase_nekolien = "Neko-li kyo miwa ai-desu." # Exemple hypothétique en Nekolien
# Prédiction
result_fr = classifier(phrase_fr)
result_nekolien = classifier(phrase_nekolien)
# Affichage des résultats
print(f"Phrase : '{phrase_fr}'\nRésultat : {result_fr}")
print(f"Phrase : '{phrase_nekolien}'\nRésultat : {result_nekolien}")
# 💡 Astuce : Le champ 'label' contiendra 'LABEL_0' (Français) ou 'LABEL_1' (Nekolien).
```
-----
## 🧠 Détails Techniques et Entraînement
### ⚙️ Architecture
* **Type de Modèle :** Classificateur de texte (basé sur une architecture de type *Transformer* ou *RNN/CNN**)
* **Framework :** **PyTorch** 🌟
* **Langue Inventée :** **Le Nekolien** (créée par Clemylia ✍️)
### 📊 Jeu de Données
Le modèle a été entraîné sur un jeu de données contenant des exemples équilibrés de :
1. Phrases en **Français** 🇫🇷
2. Phrases en **Nekolien** (correct et conforme à la grammaire de cette langue) 🐱
<!-- end list -->
* **Taille du Dataset :** *[40]
* **Source :** Données générées par **Clemylia** pour le Nekolien et collectées/synthétisées pour le Français.
-----
## 📜 Limitations et Usage Éthique
### ⚠️ Limitations
* **Langue Spécifique :** Le modèle n'est entraîné que pour le Français et le Nekolien. Il **ne reconnaîtra pas** d'autres langues (Anglais, Espagnol, etc.) et pourrait les classer par erreur comme 0 ou 1.
* **Nekolien Imparfait :** Si une phrase en Nekolien est incorrecte ou grammaticalement fausse, le modèle pourrait la classer comme 'Français' (0) ou une autre classe inattendue.
### 💖 Usage Éthique
Ce modèle est destiné à des fins éducatives, de divertissement et de recherche linguistique. Il n'est pas conçu pour des tâches critiques et ne doit pas être utilisé pour :
* L'identification de l'utilisateur ou la surveillance.
* La classification de contenu sensible ou haineux.
-----
## 👩💻 Qui est la créatrice ?
Bonjour ! Je suis Clemylia, une jeune développeuse d'IA de 18 ans, passionnée par la création de mondes et de modèles. J'ai déjà publié d'autres modèles d'IA, mais Nekoline-classify est mon tout premier modèle axé sur ma langue inventée, le Nekolien ! 🐱 C'est le fruit de mes expérimentations en PyTorch, et j'espère qu'il vous plaira !
## *Merci d'utiliser mon modèle \! N'hésitez pas à laisser un petit cœur \!* 💜
**Exemple de code pour utiliser** :
```
import torch
import torch.nn as nn
from huggingface_hub import hf_hub_download
HF_USERNAME = "Clemylia"
MODEL_NAME = "nekoline-classify"
REPO_ID = f"{HF_USERNAME}/{MODEL_NAME}"
FILE_IN_REPO = "pytorch_model.pth" # Le nomia di le fichieria que niy ave envoyallia
class LanguageClassifier(nn.Module):
"""La memia structureia di modellia que niy ave entrainallia."""
def __init__(self):
super(LanguageClassifier, self).__init__()
# 1 input (longallia) -> 5 neuronia cachia
self.layer_1 = nn.Linear(1, 5)
self.relu = nn.ReLU()
# 5 neuronia cachia -> 2 outputs (Français/Polyien)
self.layer_2 = nn.Linear(5, 2)
def forward(self, x):
x = self.layer_1(x)
x = self.relu(x)
x = self.layer_2(x)
return x
print(f"--- Telechargallia le fichieria '{FILE_IN_REPO}' di {REPO_ID} ---")
model_local_path = hf_hub_download(
repo_id=REPO_ID,
filename=FILE_IN_REPO
)
print(f"✅ Poidsia telechargallia a : {model_local_path}")
loaded_model = LanguageClassifier()
loaded_model.load_state_dict(torch.load(model_local_path))
loaded_model.eval() # Metallia la modellia en mode évaluationia
print("✅ Modellia Nekoline-classify chargallia e prêta par le testia !")
def classify_text_from_hub(text, model_to_test):
"""Teste un texte en utilisant la longallia comme feature."""
# Preparallia l'input (longallia)
input_feature = torch.tensor([len(text)], dtype=torch.float32)
with torch.no_grad():
output = model_to_test(input_feature)
_, predicted = torch.max(output.data, 0)
langue = "Polyien" if predicted.item() == 1 else "Français"
print(f"'{text}' (Longallia: {len(text)}) -> Predictallia: {langue}")
print("\n--- Resultatia di Testia cu Modellia Chargallia depuisia Hugging Face ---")
# Français (Label 0 attendu)
classify_text_from_hub("Je teste le chargement du modèle depuis le hub.", loaded_model)
classify_text_from_hub("Le codage est amusant et éducatif.", loaded_model)
# Polyien (Label 1 attendu)
classify_text_from_hub("Ji testa le chargallia di le modellia depuisia le huba.", loaded_model)
classify_text_from_hub("Le codallia eta amusanta e educativa.", loaded_model)
```
polyiens : autre nom du Nekolien |