LLMlec-FinalAssignment_YAI / README.md

YAI777

Update README.md

0667bc5 verified about 1 year ago

preview code

raw

history blame contribute delete

1.32 kB

metadata

license: cc-by-nc-sa-4.0
base_model:
  - llm-jp/llm-jp-3-13b

モデルのロードと推論

Pythonスクリプト例

from tqdm import tqdm

results = []
for data in tqdm(datasets):

  input = data["input"]

  prompt = f"""### 指示
  {input}
  ### 回答
  """

  tokenized_input = tokenizer.encode(prompt, add_special_tokens=False, return_tensors="pt").to(model.device)
  attention_mask = torch.ones_like(tokenized_input)

  with torch.no_grad():
      outputs = model.generate(
          tokenized_input,
          attention_mask=attention_mask,
          max_new_tokens=100,
          do_sample=False,
          repetition_penalty=1.2,
          pad_token_id=tokenizer.eos_token_id
      )[0]
  output = tokenizer.decode(outputs[tokenized_input.size(1):], skip_special_tokens=True)

  results.append({"task_id": data["task_id"], "input": input, "output": output})

## 引用情報

モデル元データセット:
- 関根聡, 安藤まや, 後藤美知子, 鈴木久美, 河原大輔, 井之上直也, 乾健太郎. 
- "ichikara-instruction: LLMのための日本語インストラクションデータの構築"
- 言語処理学会第30回年次大会 (2024)

## モデルの情報

- 開発者情報: YAI
- ライセンス: cc-by-nc-sa-4.0
- Finetuned from model : llm-jp/llm-jp-3-13b