How to use from
llama.cpp
Install from brew
brew install llama.cpp
# Start a local OpenAI-compatible server with a web UI:
llama-server -hf shsgrnd/SSAFY_gitcat-local-llm:Q4_K_M
# Run inference directly in the terminal:
llama-cli -hf shsgrnd/SSAFY_gitcat-local-llm:Q4_K_M
Install from WinGet (Windows)
winget install llama.cpp
# Start a local OpenAI-compatible server with a web UI:
llama-server -hf shsgrnd/SSAFY_gitcat-local-llm:Q4_K_M
# Run inference directly in the terminal:
llama-cli -hf shsgrnd/SSAFY_gitcat-local-llm:Q4_K_M
Use pre-built binary
# Download pre-built binary from:
# https://github.com/ggerganov/llama.cpp/releases
# Start a local OpenAI-compatible server with a web UI:
./llama-server -hf shsgrnd/SSAFY_gitcat-local-llm:Q4_K_M
# Run inference directly in the terminal:
./llama-cli -hf shsgrnd/SSAFY_gitcat-local-llm:Q4_K_M
Build from source code
git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp
cmake -B build
cmake --build build -j --target llama-server llama-cli
# Start a local OpenAI-compatible server with a web UI:
./build/bin/llama-server -hf shsgrnd/SSAFY_gitcat-local-llm:Q4_K_M
# Run inference directly in the terminal:
./build/bin/llama-cli -hf shsgrnd/SSAFY_gitcat-local-llm:Q4_K_M
Use Docker
docker model run hf.co/shsgrnd/SSAFY_gitcat-local-llm:Q4_K_M
Quick Links

GitCat Local LLM (GGUF)

GitCat은 생성형 AI 코딩 환경에서 안전한 작업 관리Git workflow 추천 자동화를 돕기 위해 만든 프로젝트입니다.
이 리포지토리는 그중 로컬 추론용 GGUF 모델을 배포하기 위한 공간이며, VS Code Extension 환경에서 아래 작업을 보조하도록 실험한 결과물을 담고 있습니다.

  • 브랜치명 추천
  • 커밋 메시지 추천
  • PR 설명 추천
  • 변경 맥락 기반 요약

이 모델은 외부 API 없이 로컬에서 실행 가능한 개발 보조 모델을 목표로 정리되었습니다.


Files

1. gitcat-v3-sft-merged-Q4_K_M.gguf

  • SFT(Supervised Fine-Tuning) 기반 모델
  • 현재 기준으로 가장 안정적인 추천 품질을 보인 기본 추천 모델

2. gitcat-v3-dpo-merged-Q4_K_M.gguf

  • DPO(Direct Preference Optimization) 기반 모델
  • preference pair를 반영한 추가 정렬 실험 버전

Recommended Model

처음 사용할 때는 아래 순서를 권장합니다.

  1. gitcat-v3-sft-merged-Q4_K_M.gguf
  2. gitcat-v3-dpo-merged-Q4_K_M.gguf

현재 실험 기준에서는 SFT 버전이 더 안정적인 결과를 보였고, DPO 버전은 추가 튜닝 여지가 있는 비교 실험 모델입니다.


Base Model

  • Base model: Qwen/Qwen2.5-Coder-7B-Instruct
  • Format: GGUF
  • Quantization: Q4_K_M

Quick Start

Option 1. llama.cpp로 바로 실행

./llama-cli -m ./gitcat-v3-sft-merged-Q4_K_M.gguf
Downloads last month
102
GGUF
Model size
8B params
Architecture
qwen2
Hardware compatibility
Log In to add your hardware

4-bit

Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for shsgrnd/SSAFY_gitcat-local-llm

Base model

Qwen/Qwen2.5-7B
Quantized
(189)
this model