ebisuke/liz-nojaloli-ja-ds
Preview • Updated • 40 • 3
How to use ebisuke/liz-nojaloli-ja with Transformers:
# Use a pipeline as a high-level helper
from transformers import pipeline
pipe = pipeline("text-generation", model="ebisuke/liz-nojaloli-ja") # Load model directly
from transformers import AutoTokenizer, AutoModelForCausalLM
tokenizer = AutoTokenizer.from_pretrained("ebisuke/liz-nojaloli-ja")
model = AutoModelForCausalLM.from_pretrained("ebisuke/liz-nojaloli-ja")How to use ebisuke/liz-nojaloli-ja with vLLM:
# Install vLLM from pip:
pip install vllm
# Start the vLLM server:
vllm serve "ebisuke/liz-nojaloli-ja"
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:8000/v1/completions" \
-H "Content-Type: application/json" \
--data '{
"model": "ebisuke/liz-nojaloli-ja",
"prompt": "Once upon a time,",
"max_tokens": 512,
"temperature": 0.5
}'docker model run hf.co/ebisuke/liz-nojaloli-ja
How to use ebisuke/liz-nojaloli-ja with SGLang:
# Install SGLang from pip:
pip install sglang
# Start the SGLang server:
python3 -m sglang.launch_server \
--model-path "ebisuke/liz-nojaloli-ja" \
--host 0.0.0.0 \
--port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/completions" \
-H "Content-Type: application/json" \
--data '{
"model": "ebisuke/liz-nojaloli-ja",
"prompt": "Once upon a time,",
"max_tokens": 512,
"temperature": 0.5
}'docker run --gpus all \
--shm-size 32g \
-p 30000:30000 \
-v ~/.cache/huggingface:/root/.cache/huggingface \
--env "HF_TOKEN=<secret>" \
--ipc=host \
lmsysorg/sglang:latest \
python3 -m sglang.launch_server \
--model-path "ebisuke/liz-nojaloli-ja" \
--host 0.0.0.0 \
--port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/completions" \
-H "Content-Type: application/json" \
--data '{
"model": "ebisuke/liz-nojaloli-ja",
"prompt": "Once upon a time,",
"max_tokens": 512,
"temperature": 0.5
}'How to use ebisuke/liz-nojaloli-ja with Docker Model Runner:
docker model run hf.co/ebisuke/liz-nojaloli-ja
MIT License
ベースとしてrinna/japanese-gpt-neox-3.6bを使用しています。
のじゃロリ風味チャットモデルです。
rinna/japanese-gpt-neox-3.6bをベースとしてファインチューンしています。
開発者の趣味と個人的な勉強用の為に作成しました。
本モデルは開発中のため、データセットの更新により逐次アップデートされる可能性があります。
ファインチューンでは以下のデータセットのみ使用しています。
ebisuke/liz-nojaloli-ja-ds
ユーザーの入力を"相手は言いました。「(内容)」\n"で括ってください。
モデルは"あなたは言いました。「"以降の文脈を生成します。
それ以降も続く場合があるので必要に応じて"」"の文字までで打ち切ってください。
長文を打つと口調が剥がれるのでご注意ください。
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
tokenizer = AutoTokenizer.from_pretrained("ebisuke/liz-nojaloli-ja", use_fast=False)
model = AutoModelForCausalLM.from_pretrained("ebisuke/liz-nojaloli-ja", load_in_8bit=True, device_map='auto')
text = "相手は言いました。「眠いにゃ・・・」 \nあなたは言いました。「"
token_ids = tokenizer.encode(text, add_special_tokens=False, return_tensors="pt")
with torch.no_grad():
output_ids = model.generate(
input_ids=token_ids.to(model.device),
max_new_tokens=1000,
do_sample=True,
temperature=0.7,
pad_token_id=tokenizer.pad_token_id,
bos_token_id=tokenizer.bos_token_id,
eos_token_id=tokenizer.eos_token_id,
)
output = tokenizer.decode(output_ids.tolist()[0])
print(output)