Llama tokenizer with extended vocab: - 32000 Llama tokens - ~15000 Yoruba tokens