GGUF
English
Japanese
How to use from the
Use from the
llama-cpp-python library
# !pip install llama-cpp-python

from llama_cpp import Llama

llm = Llama.from_pretrained(
	repo_id="mmnga/codegemma-1.1-2b-gguf",
	filename="",
)
output = llm(
	"Once upon a time,",
	max_tokens=512,
	echo=True
)
print(output)

codegemma-1.1-2b-gguf

googleさんが公開しているcodegemma-1.1-2bのggufフォーマット変換版です。

imatrixのデータは
kunishou/amenokaku-code-instruct
TokenBender/code_instructions_122k_alpaca_style
から1000ずつサンプリングしたデータを使用して作成しました。

他のモデル

mmnga/codegemma-1.1-7b-it-gguf
mmnga/codegemma-1.1-2b-gguf
mmnga/gemma-2b-it-gguf
mmnga/gemma-7b-it-gguf
mmnga/gemma-1.1-7b-it-gguf
mmnga/codegemma-7b-it-gguf

Usage

git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp
make -j
./main -m 'codegemma-1.1-2b-Q4_0.gguf' -n 128 -p 'Write Hello World.'
Downloads last month
238
GGUF
Model size
3B params
Architecture
gemma
Hardware compatibility
Log In to add your hardware

1-bit

2-bit

3-bit

4-bit

5-bit

6-bit

8-bit

Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Datasets used to train mmnga/codegemma-1.1-2b-gguf