OpenNLPLab
/

TransNormerLLM-385M

Text Generation

Model card Files Files and versions

OpenNLPLab commited on Oct 15, 2023

Commit

fc689fe

·

1 Parent(s): 8d3a720

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -144,8 +144,8 @@ export use_triton=False
 ```python
 >>> from transformers import AutoModelForCausalLM, AutoTokenizer
->>> tokenizer = AutoTokenizer.from_pretrained("OpenNLPLab/TransNormerLLM-1B", trust_remote_code=True)
->>> model = AutoModelForCausalLM.from_pretrained("OpenNLPLab/TransNormerLLM-1B", device_map="auto", trust_remote_code=True)
 >>> inputs = tokenizer('今天是美好的一天', return_tensors='pt')
 >>> pred = model.generate(**inputs, max_new_tokens=2048, repetition_penalty=1.0)
 >>> print(tokenizer.decode(pred.cpu()[0], skip_special_tokens=True))
@@ -175,7 +175,7 @@ Training Data: `alpaca_data.json`. This sample data was drawn from [alpaca_data.
 torchrun \
     --nproc_per_node=8 \
     train.py \
-    --model_name_or_path OpenNLPLab/TransNormerLLM-1B \
     --data_path ./alpaca_data.json \
     --output_dir output \
     --num_train_epochs 1 \

 ```python
 >>> from transformers import AutoModelForCausalLM, AutoTokenizer
+>>> tokenizer = AutoTokenizer.from_pretrained("OpenNLPLab/TransNormerLLM-385M", trust_remote_code=True)
+>>> model = AutoModelForCausalLM.from_pretrained("OpenNLPLab/TransNormerLLM-385M", device_map="auto", trust_remote_code=True)
 >>> inputs = tokenizer('今天是美好的一天', return_tensors='pt')
 >>> pred = model.generate(**inputs, max_new_tokens=2048, repetition_penalty=1.0)
 >>> print(tokenizer.decode(pred.cpu()[0], skip_special_tokens=True))
 torchrun \
     --nproc_per_node=8 \
     train.py \
+    --model_name_or_path OpenNLPLab/TransNormerLLM-385M \
     --data_path ./alpaca_data.json \
     --output_dir output \
     --num_train_epochs 1 \