NOVA 100M Image
Modèle autorégressif texte→image < 100 M paramètres.
Architecture
- Modèle : NOVA Image v3.0 (d=768, 8 couches)
- Vocabulaire : VQGAN LlamaGen (16384 tokens, f=16)
- Encodeur texte :
t5-small(T5, encodeur seul) figé + cross-attn pool - Batch effectif : 32 images
Chargement du tokenizer
from transformers import AutoTokenizer
tok = AutoTokenizer.from_pretrained("ElioChampaney/100m_image_new/tokenizer")
Licences
- Poids NOVA Image (
checkpoints/) : apache-2.0 (ce dépôt) - Tokeniseur image (
vqgan/) : poids tiers re-hébergés depuis FoundationVision/LlamaGen, licence MIT
- Downloads last month
- 936