Instructions to use PyThaGo/LLMLit with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- llama-cpp-python
How to use PyThaGo/LLMLit with llama-cpp-python:
# !pip install llama-cpp-python from llama_cpp import Llama llm = Llama.from_pretrained( repo_id="PyThaGo/LLMLit", filename="LLMLit-0.2-8B-Instruct.gguf", )
llm.create_chat_completion( messages = "No input example has been defined for this model task." )
- Notebooks
- Google Colab
- Kaggle
- Local Apps
- llama.cpp
How to use PyThaGo/LLMLit with llama.cpp:
Install from brew
brew install llama.cpp # Start a local OpenAI-compatible server with a web UI: llama-server -hf PyThaGo/LLMLit # Run inference directly in the terminal: llama-cli -hf PyThaGo/LLMLit
Install from WinGet (Windows)
winget install llama.cpp # Start a local OpenAI-compatible server with a web UI: llama-server -hf PyThaGo/LLMLit # Run inference directly in the terminal: llama-cli -hf PyThaGo/LLMLit
Use pre-built binary
# Download pre-built binary from: # https://github.com/ggerganov/llama.cpp/releases # Start a local OpenAI-compatible server with a web UI: ./llama-server -hf PyThaGo/LLMLit # Run inference directly in the terminal: ./llama-cli -hf PyThaGo/LLMLit
Build from source code
git clone https://github.com/ggerganov/llama.cpp.git cd llama.cpp cmake -B build cmake --build build -j --target llama-server llama-cli # Start a local OpenAI-compatible server with a web UI: ./build/bin/llama-server -hf PyThaGo/LLMLit # Run inference directly in the terminal: ./build/bin/llama-cli -hf PyThaGo/LLMLit
Use Docker
docker model run hf.co/PyThaGo/LLMLit
- LM Studio
- Jan
- Ollama
How to use PyThaGo/LLMLit with Ollama:
ollama run hf.co/PyThaGo/LLMLit
- Unsloth Studio new
How to use PyThaGo/LLMLit with Unsloth Studio:
Install Unsloth Studio (macOS, Linux, WSL)
curl -fsSL https://unsloth.ai/install.sh | sh # Run unsloth studio unsloth studio -H 0.0.0.0 -p 8888 # Then open http://localhost:8888 in your browser # Search for PyThaGo/LLMLit to start chatting
Install Unsloth Studio (Windows)
irm https://unsloth.ai/install.ps1 | iex # Run unsloth studio unsloth studio -H 0.0.0.0 -p 8888 # Then open http://localhost:8888 in your browser # Search for PyThaGo/LLMLit to start chatting
Using HuggingFace Spaces for Unsloth
# No setup required # Open https://huggingface.co/spaces/unsloth/studio in your browser # Search for PyThaGo/LLMLit to start chatting
- Pi new
How to use PyThaGo/LLMLit with Pi:
Start the llama.cpp server
# Install llama.cpp: brew install llama.cpp # Start a local OpenAI-compatible server: llama-server -hf PyThaGo/LLMLit
Configure the model in Pi
# Install Pi: npm install -g @mariozechner/pi-coding-agent # Add to ~/.pi/agent/models.json: { "providers": { "llama-cpp": { "baseUrl": "http://localhost:8080/v1", "api": "openai-completions", "apiKey": "none", "models": [ { "id": "PyThaGo/LLMLit" } ] } } }Run Pi
# Start Pi in your project directory: pi
- Hermes Agent new
How to use PyThaGo/LLMLit with Hermes Agent:
Start the llama.cpp server
# Install llama.cpp: brew install llama.cpp # Start a local OpenAI-compatible server: llama-server -hf PyThaGo/LLMLit
Configure Hermes
# Install Hermes: curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash hermes setup # Point Hermes at the local server: hermes config set model.provider custom hermes config set model.base_url http://127.0.0.1:8080/v1 hermes config set model.default PyThaGo/LLMLit
Run Hermes
hermes
- Docker Model Runner
How to use PyThaGo/LLMLit with Docker Model Runner:
docker model run hf.co/PyThaGo/LLMLit
- Lemonade
How to use PyThaGo/LLMLit with Lemonade:
Pull the model
# Download Lemonade from https://lemonade-server.ai/ lemonade pull PyThaGo/LLMLit
Run and chat with the model
lemonade run user.LLMLit-{{QUANT_TAG}}List all available models
lemonade list
📌 Ghid de Instalare: LM Studio + LLMLit pe Windows**
📌 Ghid de Instalare: LM Studio + LLMLit pe Windows
🔹 1. Instalarea LM Studio
LM Studio este o aplicație desktop care permite descărcarea și rularea locală a modelelor LLM.
🖥️ Pasul 1: Descarcă și instalează LM Studio
1️⃣ Mergi la site-ul oficial:
🔗 LM Studio Download
2️⃣ Descarcă versiunea pentru Windows și instalează aplicația.
3️⃣ După instalare, deschide LM Studio.
🔹 2. Descărcarea și Instalarea LLMLit
Pentru a folosi LLMLit, trebuie să descarci modelul de pe Hugging Face.
🖥️ Pasul 2: Adăugarea Modelului în LM Studio
1️⃣ Deschide LM Studio și mergi la tab-ul "Model Catalog".
2️⃣ Caută modelul LLMLit manual sau folosește acest link pentru descărcare:
🔗 LLMLit pe Hugging Face
3️⃣ Copiază linkul modelului și introdu-l în LM Studio → "Download Custom Model".
4️⃣ Alege locația unde vrei să salvezi modelul și începe descărcarea.
🔹 3. Configurarea și Rularea LLMLit
După ce ai descărcat modelul, trebuie să-l configurezi și să-l rulezi.
🖥️ Pasul 3: Setarea Modelului
1️⃣ Mergi la "Local Models" în LM Studio.
2️⃣ Selectează LLMLit-0.2-8B-Instruct din listă.
3️⃣ Apasă "Launch" pentru a începe rularea modelului.
🔹 4. Interacțiunea cu LLMLit
După ce modelul este activ, poți începe să-l folosești în LM Studio.
1️⃣ Folosește interfața LM Studio pentru a trimite mesaje direct modelului.
2️⃣ Pentru integrare în Python, instalează ollama și folosește următorul script:
import ollama
response = ollama.chat(model='llmlit/LLMLit-0.2-8B-Instruct',
messages=[{'role': 'user', 'content': 'Salut, cum pot folosi LLMLit?'}])
print(response['message']['content'])
🔹 5. Optimizarea Performanței
Pentru a rula LLMLit mai eficient pe Windows:
✅ Activează GPU Acceleration dacă ai placă video compatibilă.
✅ Folosește modele mai mici, dacă sistemul tău nu are suficient RAM.
✅ Optimizează parametrii modelului din setările LM Studio pentru un echilibru între viteză și precizie.
🎉 Gata! Acum ai LM Studio + LLMLit instalat pe Windows și gata de utilizare! 🚀
