LLaMA3 / README.md

Update README.md

6b702e5 verified about 1 month ago

516 Bytes

language: en
license: mit
library_name: jax
tags:
  - llama
  - text-generation
  - shakespeare
model_name: LLaMA3
base_model: llama

LLaMA3

Architecture: Llama-based Transformer
Parameters: ~31.6M
Training Framework: JAX
Tokenization: GPT-2 Encoding (tiktoken)

custom Llama-based model trained on tiny shakespeare text using JAX.

Model Details

from transformers import AutoModelForCausalLM

model = AutoModelForCausalLM.from_pretrained("parkneurals/LLaMA3")