DataPilot
/

ArrowPro-7B-Nyan

Text Generation

text-generation-inference

Model card Files Files and versions

Holy-fox commited on May 23, 2024

Commit

7dff7b9

·

verified ·

1 Parent(s): 640e1cf

ReadME

Files changed (1) hide show

README.md +64 -3

README.md CHANGED Viewed

@@ -1,3 +1,64 @@
----
-license: apache-2.0
----

+---
+license: apache-2.0
+---
+## 概要
+当モデルはMistral系のArrowPro-7B-KUJIRAをもとに[databricks-dolly-15k-Nyan-ja](https://huggingface.co/datasets/DataPilot/databricks-dolly-15k-Nyan-ja)を用いてloraファインチューニングを実施したモデルとなります。
+## How to use
+```python
+import torch
+from transformers import AutoTokenizer, AutoModelForCausalLM
+tokenizer = AutoTokenizer.from_pretrained("DataPilot/ArrowPro-7B-Nyan")
+model = AutoModelForCausalLM.from_pretrained(
+  "DataPilot/ArrowPro-7B-Nyan",
+  torch_dtype="auto",
+)
+model.eval()
+if torch.cuda.is_available():
+    model = model.to("cuda")
+def build_prompt(user_query):
+    sys_msg = "あなたは日本語を話す優秀なアシスタントです。回答には必ず日本語で答えてください。"
+    template = """[INST] <<SYS>>
+{}
+<</SYS>>
+{}[/INST]"""
+    return template.format(sys_msg,user_query)
+# Infer with prompt without any additional input
+user_inputs = {
+    "user_query": "まどマギで一番かわいいキャラはだれ？",
+}
+prompt = build_prompt(**user_inputs)
+input_ids = tokenizer.encode(
+    prompt,
+    add_special_tokens=True,
+    return_tensors="pt"
+)
+tokens = model.generate(
+    input_ids.to(device=model.device),
+    max_new_tokens=500,
+    temperature=1,
+    top_p=0.95,
+    do_sample=True,
+)
+out = tokenizer.decode(tokens[0][input_ids.shape[1]:], skip_special_tokens=True).strip()
+print(out)
+```
+## 謝辞
+このモデルを作成するために計算資源を貸してくれた[witness氏](https://x.com/i_witnessed_it)と[Meta Data Lab](https://x.com/Metadatalab)に感謝を申し上げます
+## お願い
+このモデルを利用する際は他人に迷惑をかけないように最大限留意してください。