Instructions to use SurgeGlobal/OpenBezoar-SFT with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

Libraries

How to use SurgeGlobal/OpenBezoar-SFT with Transformers:

# Use a pipeline as a high-level helper
from transformers import pipeline

pipe = pipeline("text-generation", model="SurgeGlobal/OpenBezoar-SFT")

# Load model directly
from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("SurgeGlobal/OpenBezoar-SFT")
model = AutoModelForCausalLM.from_pretrained("SurgeGlobal/OpenBezoar-SFT")

Notebooks
Google Colab
Kaggle
Local Apps

vLLM

How to use SurgeGlobal/OpenBezoar-SFT with vLLM:

Install from pip and serve model

# Install vLLM from pip:
pip install vllm
# Start the vLLM server:
vllm serve "SurgeGlobal/OpenBezoar-SFT"
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:8000/v1/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "SurgeGlobal/OpenBezoar-SFT",
		"prompt": "Once upon a time,",
		"max_tokens": 512,
		"temperature": 0.5
	}'

Use Docker

docker model run hf.co/SurgeGlobal/OpenBezoar-SFT

SGLang

How to use SurgeGlobal/OpenBezoar-SFT with SGLang:

Install from pip and serve model

# Install SGLang from pip:
pip install sglang
# Start the SGLang server:
python3 -m sglang.launch_server \
    --model-path "SurgeGlobal/OpenBezoar-SFT" \
    --host 0.0.0.0 \
    --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "SurgeGlobal/OpenBezoar-SFT",
		"prompt": "Once upon a time,",
		"max_tokens": 512,
		"temperature": 0.5
	}'

Use Docker images

docker run --gpus all \
    --shm-size 32g \
    -p 30000:30000 \
    -v ~/.cache/huggingface:/root/.cache/huggingface \
    --env "HF_TOKEN=<secret>" \
    --ipc=host \
    lmsysorg/sglang:latest \
    python3 -m sglang.launch_server \
        --model-path "SurgeGlobal/OpenBezoar-SFT" \
        --host 0.0.0.0 \
        --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "SurgeGlobal/OpenBezoar-SFT",
		"prompt": "Once upon a time,",
		"max_tokens": 512,
		"temperature": 0.5
	}'

Docker Model Runner
How to use SurgeGlobal/OpenBezoar-SFT with Docker Model Runner:
```
docker model run hf.co/SurgeGlobal/OpenBezoar-SFT
```

OpenBezoar-SFT

Commit History

Update README.md

ffbea97
verified

sachithgunasekara commited on Feb 15, 2025

Adding `safetensors` variant of this model (#1)

0906ddd
verified

sachithgunasekara

SFconvertbot commited on Apr 26, 2024

Update README.md

bdfbd29
verified

sachithgunasekara commited on Apr 20, 2024

Update README.md

5ceea26
verified

sachithgunasekara commited on Apr 19, 2024

Update README.md

2e34f15
verified

chansurgeplus commited on Apr 19, 2024

Update README.md

09e14f0
verified

Sachith Gunasekara commited on Apr 18, 2024

Update README.md

05edc77
verified

Sachith Gunasekara commited on Apr 18, 2024

Update README.md

a92b109
verified

Sachith Gunasekara commited on Apr 18, 2024

Update README.md

797381e
verified

Sachith Gunasekara commited on Apr 18, 2024

Create README.md

b50a4aa
verified

Sachith Gunasekara commited on Apr 18, 2024

Upload tokenizer

6a85696

Sachith Gunasekara commited on Sep 22, 2023

Upload LlamaForCausalLM

0c5523d

Sachith Gunasekara commited on Sep 22, 2023

initial commit

fd76ef3

sachithgunasekara commited on Sep 22, 2023

Commit History

Update README.md ffbea97 verified

Adding `safetensors` variant of this model (#1) 0906ddd verified

Update README.md bdfbd29 verified

Update README.md 5ceea26 verified

Update README.md 2e34f15 verified

Update README.md 09e14f0 verified

Update README.md 05edc77 verified

Update README.md a92b109 verified

Update README.md 797381e verified

Create README.md b50a4aa verified

Upload tokenizer 6a85696

Upload LlamaForCausalLM 0c5523d

initial commit fd76ef3

Update README.md

ffbea97
verified

Adding `safetensors` variant of this model (#1)

0906ddd
verified

Update README.md

bdfbd29
verified

Update README.md

5ceea26
verified

Update README.md

2e34f15
verified

Update README.md

09e14f0
verified

Update README.md

05edc77
verified

Update README.md

a92b109
verified

Update README.md

797381e
verified

Create README.md

b50a4aa
verified

Upload tokenizer

6a85696

Upload LlamaForCausalLM

0c5523d

initial commit

fd76ef3