nvidia
/

Riva-Translate-4B-Instruct-v1.1

Text Generation

text-generation-inference

Model card Files Files and versions

aishwaryac11 commited on Jan 13

Commit

1fd24ad

·

verified ·

1 Parent(s): 512f596

Update README.md

Files changed (1) hide show

README.md +0 -5

README.md CHANGED Viewed

@@ -88,11 +88,9 @@ To select a language pair for translation, include one of the following tags in
 ```
 from transformers import AutoTokenizer, AutoModelForCausalLM
 tokenizer = AutoTokenizer.from_pretrained("nvidia/Riva-Translate-4B-Instruct-v1.1")
 model = AutoModelForCausalLM.from_pretrained("nvidia/Riva-Translate-4B-Instruct-v1.1").cuda()
 # Use the prompt template (along with chat template)
 messages = [
     {
@@ -101,10 +99,8 @@ messages = [
     },
     {"role": "user", "content": "The GRACE mission is a collaboration between the NASA and German Aerospace Center.?"},
  ]
 tokenized_chat = tokenizer.apply_chat_template(messages, tokenize=True, add_generation_prompt=True, return_tensors="pt").to(model.device)
 outputs = model.generate(tokenized_chat,  max_new_tokens=128, pad_token_id=tokenizer.eos_token_id)
 print(tokenizer.decode(outputs[0]))
 ```
@@ -188,7 +184,6 @@ curl http://localhost:8000/v1/chat/completions \
 ```
 ### Chat Template Structure
 ```
 {%- set language_pairs = {
   'en-zh-cn': {'source': 'English', 'target': 'Simplified Chinese'},

 ```
 from transformers import AutoTokenizer, AutoModelForCausalLM
 tokenizer = AutoTokenizer.from_pretrained("nvidia/Riva-Translate-4B-Instruct-v1.1")
 model = AutoModelForCausalLM.from_pretrained("nvidia/Riva-Translate-4B-Instruct-v1.1").cuda()
 # Use the prompt template (along with chat template)
 messages = [
     {
     },
     {"role": "user", "content": "The GRACE mission is a collaboration between the NASA and German Aerospace Center.?"},
  ]
 tokenized_chat = tokenizer.apply_chat_template(messages, tokenize=True, add_generation_prompt=True, return_tensors="pt").to(model.device)
 outputs = model.generate(tokenized_chat,  max_new_tokens=128, pad_token_id=tokenizer.eos_token_id)
 print(tokenizer.decode(outputs[0]))
 ```
 ```
 ### Chat Template Structure
 ```
 {%- set language_pairs = {
   'en-zh-cn': {'source': 'English', 'target': 'Simplified Chinese'},