Update README.md

Le modèle utilise l'architecture text-to-text de T5, ce qui le rend particulièrement adapté à la tâche de correction grammaticale. Nous avons fine-tuné le modèle en utilisant un taux d'apprentissage de 5e-5 et une taille de batch de 32. L'entraînement a été effectué sur une GPU NVIDIA Tesla V100 pendant 24 heures.

Files changed (1) hide show

README.md +16 -3

README.md CHANGED Viewed

@@ -1,3 +1,16 @@
----
-license: apache-2.0
----

+---
+license: apache-2.0
+datasets:
+- Lots-of-LoRAs/task1557_jfleg_answer_generation
+language:
+- fr
+- ar
+metrics:
+- bleu
+base_model:
+- HuggingFaceH4/zephyr-7b-beta
+new_version: deepseek-ai/DeepSeek-R1
+pipeline_tag: text2text-generation
+tags:
+- education
+---