File size: 2,287 Bytes
14e16fe
 
 
 
 
55a1ed0
14e16fe
55a1ed0
 
 
14e16fe
55a1ed0
14e16fe
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
55a1ed0
14e16fe
 
 
 
 
 
 
 
5fe9c3e
 
2ba3fb9
ee7f361
2ba3fb9
 
 
 
 
 
 
 
7c4245a
55343b9
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
---
license: apache-2.0
---

readme_content = """
# 2_PRYMMAL-ECE-2B-SLERP-V2-finetuned

This model has been produced by:
- **LALAIN Youri**, engineering student at French Engineering School ECE
- **RAGE LILIAN**, engineering student at French Engineering School ECE
## Description
Ce modèle, **2_PRYMMAL-ECE-2B-SLERP-V2-finetuned**, est un modèle de langage pré-entraîné et affiné (fine-tuned) pour des tâches spécifiques en compréhension et génération de texte. Il a été optimisé pour fonctionner efficacement sur des données textuelles complexes, telles que des questions-réponses et des descriptions détaillées.

## Détails du modèle
- **Architecture** : Basé sur [Base Model Architecture] (remplace par le nom de l'architecture si applicable, ex. Llama, GPT, etc.).
- **Fine-tuning** : Réalisé sur un jeu de données contenant des questions et réponses techniques liées à des domaines spécifiques.
- **Format** : Enregistré au format `safetensors` pour garantir une utilisation sécurisée et rapide.

## Caractéristiques
- **Nombre de paramètres** : 2B
- **Tâches supportées** :
  - Génération de texte
  - Questions-réponses
  - Résumé de documents
- **Entraînement** :
  - Optimisé sur 3 epochs avec des pertes en diminution constante.
  - Utilisation de `bfloat16` pour une meilleure performance GPU.

## Utilisation
### Chargement du modèle
Pour utiliser ce modèle dans un projet Python avec Hugging Face :

```python
from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "Lil-R/2_PRYMMAL-ECE-2B-SLERP-V2-finetuned"

# Charger le modèle et le tokenizer
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

# Exemple d'utilisation
inputs = tokenizer("Quelle est la mission d'Ariane 5 ?", return_tensors="pt")
outputs = model.generate(**inputs)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))
```


## Téléchargement direct
Le modèle peut être téléchargé directement depuis Hugging Face.

## Performances
- **Training Loss** : Diminue de 2.1653 à 1.1291 sur 3 epochs.
- **Validation Loss** : Diminue de 1.9553 à 1.5075, montrant une bonne généralisation.

## Licence
Ce modèle est distribué sous une licence ouverte.
"Apache 2.0"