How to use from
llama.cpp
Install (macOS, Linux)
curl -LsSf https://llama.app/install.sh | sh
# Start a local OpenAI-compatible server with a web UI:
llama serve -hf gptradeinvest/sigmaquant-copilot:Q4_K_M
# Run inference directly in the terminal:
llama cli -hf gptradeinvest/sigmaquant-copilot:Q4_K_M
Install from WinGet (Windows)
winget install llama.cpp
# Start a local OpenAI-compatible server with a web UI:
llama serve -hf gptradeinvest/sigmaquant-copilot:Q4_K_M
# Run inference directly in the terminal:
llama cli -hf gptradeinvest/sigmaquant-copilot:Q4_K_M
Use pre-built binary
# Download pre-built binary from:
# https://github.com/ggerganov/llama.cpp/releases
# Start a local OpenAI-compatible server with a web UI:
./llama-server -hf gptradeinvest/sigmaquant-copilot:Q4_K_M
# Run inference directly in the terminal:
./llama-cli -hf gptradeinvest/sigmaquant-copilot:Q4_K_M
Build from source code
git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp
cmake -B build
cmake --build build -j --target llama-server llama-cli
# Start a local OpenAI-compatible server with a web UI:
./build/bin/llama-server -hf gptradeinvest/sigmaquant-copilot:Q4_K_M
# Run inference directly in the terminal:
./build/bin/llama-cli -hf gptradeinvest/sigmaquant-copilot:Q4_K_M
Use Docker
docker model run hf.co/gptradeinvest/sigmaquant-copilot:Q4_K_M
Quick Links

SigmaQuant Copilot — SQSL 2.0 (GGUF)

Modèle de copilote quantitatif en français (~4 milliards de paramètres), quantifié Q4_K_M pour llama.cpp. Il route chaque question vers la bonne méthode financière et délègue tout calcul exact à un moteur déterministe via un bloc ```engine — il ne fait jamais d'arithmétique lui-même, donc les nombres renvoyés par l'application sont exacts et auditables.

Utilisation (llama.cpp)

hf download gptradeinvest/sigmaquant-copilot sqsl-2.0-Q4_K_M.gguf --local-dir models
llama-server -m models/sqsl-2.0-Q4_K_M.gguf --chat-template chatml -c 4096 -ngl 999

Envoyez toujours le prompt système fourni avec l'application. Le modèle émet un bloc ```engine {module, function, params} que le moteur déterministe exécute pour produire le nombre final.

Modules couverts

  • 01 — Fondations : Black-Scholes, parité put-call, forwards, binomial risque-neutre, rente perpétuelle
  • 02 — Crédit & structure par terme : spread CDS au pair, treillis ZC, crédit amortissable, hasard/survie
  • 03 — Portefeuille & exécution : MEDAF, Sharpe, exécution optimale Almgren-Chriss
  • 04 — Pricing avancé : grecques (delta), densité de Breeden-Litzenberger, perte de tranche CDO
  • 05 — Calcul : pricing FFT Carr-Madan, calibration de modèles, ajustement Vasicek

Licence

Apache 2.0. Ne constitue pas un conseil en investissement. © 2026 SigmaQuantSystems.

Downloads last month
38
GGUF
Model size
4B params
Architecture
qwen35
Hardware compatibility
Log In to add your hardware

4-bit

Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support