TSjB commited on
Commit
d0e7af3
·
verified ·
1 Parent(s): 374cd2b

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +6 -2
README.md CHANGED
@@ -59,7 +59,10 @@ tokenizer = AutoTokenizer.from_pretrained(
59
  )
60
 
61
  # With chat template
62
- messages = [{"role": "user", "content": "Не зат билесе Къарачай юсюнден?"}]
 
 
 
63
  text = tokenizer.apply_chat_template(
64
  messages,
65
  tokenize=False,
@@ -74,11 +77,12 @@ if 'token_type_ids' in inputs:
74
 
75
  outputs = model.generate(
76
  **inputs,
77
- max_new_tokens=200,
78
  temperature=0.7,
79
  top_p=0.9,
80
  do_sample=True,
81
  repetition_penalty=1.2,
 
82
  pad_token_id=tokenizer.pad_token_id,
83
  eos_token_id=tokenizer.eos_token_id,
84
  )
 
59
  )
60
 
61
  # With chat template
62
+ messages = [
63
+ {"role": "system", "content": "Сен къарачай-малкъар тилде болушлукъчуса. Соруўлагъа къысха, тюз эм ачыкъ джуўабла бер. Орусча неда ингилизче сорсала — ол тилде джуўаб бер."},
64
+ {"role": "user", "content": "Не зат билесе Къарачай юсюнден?"}
65
+ ]
66
  text = tokenizer.apply_chat_template(
67
  messages,
68
  tokenize=False,
 
77
 
78
  outputs = model.generate(
79
  **inputs,
80
+ max_new_tokens=100,
81
  temperature=0.7,
82
  top_p=0.9,
83
  do_sample=True,
84
  repetition_penalty=1.2,
85
+ no_repeat_ngram_size=4,
86
  pad_token_id=tokenizer.pad_token_id,
87
  eos_token_id=tokenizer.eos_token_id,
88
  )