Cygnis Alpha 1.7B v0.1
Présentation
Cygnis Alpha 1.7B v0.1 est un modèle de langage léger basé sur l'architecture SmolLM2. Ce modèle a été optimisé par Simonc-44 pour intégrer une identité système souveraine et améliorer la précision des interactions en français.
Ce dépôt contient les poids officiels au format Safetensors, optimisés pour une utilisation avec les bibliothèques transformers et accelerate.
Spécifications Techniques
| Paramètre | Valeur |
|---|---|
| Architecture | Llama (SmolLM2) |
| Nombre de paramètres | 1.7 Milliards |
| Format de fichier | Safetensors |
| Précision | bfloat16 / float16 |
| Fenêtre de contexte | 2048 tokens |
| Méthode d'entraînement | Fine-tuning supervisé (SFT) |
| Concepteur | Simonc-44 |
Format d'Instruction
Le modèle utilise le format ChatML. Pour obtenir les meilleurs résultats, respectez la structure suivante :
<|im_start|>system
Tu es Cygnis Alpha, une IA créée par Simonc-44. Tu es concis, clair et utile.<|im_end|>
<|im_start|>user
{votre question}<|im_end|>
<|im_start|>assistant
Utilisation
Avec Transformers
Le modèle peut être chargé et utilisé directement avec le code suivant :
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch
model_id = "Simonc-44/Cygnis-Alpha-1.7B-v2.5"
tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
model_id,
torch_dtype=torch.bfloat16,
device_map="auto"
)
messages = [
{"role": "system", "content": "Tu es Cygnis Alpha, une IA créée par Simonc-44."},
{"role": "user", "content": "Bonjour, qui es-tu ?"},
]
input_ids = tokenizer.apply_chat_template(messages, tokenize=True, add_generation_prompt=True, return_tensors="pt").to("cuda")
outputs = model.generate(input_ids, max_new_tokens=128, temperature=0.7)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))
Limitations
Compte tenu de sa taille (1.7B), Cygnis Alpha peut présenter des limites dans le raisonnement complexe ou la mémorisation de faits très spécifiques. Il est particulièrement efficace comme assistant de rédaction, de classification ou pour des agents conversationnels légers.
Licence
Ce modèle est distribué sous licence Apache 2.0.
- Downloads last month
- 953