Instructions to use plvictor/Alef-Biblical-1.5B-Base with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- Transformers
How to use plvictor/Alef-Biblical-1.5B-Base with Transformers:
# Use a pipeline as a high-level helper from transformers import pipeline pipe = pipeline("text-generation", model="plvictor/Alef-Biblical-1.5B-Base")# Load model directly from transformers import AutoTokenizer, AutoModelForCausalLM tokenizer = AutoTokenizer.from_pretrained("plvictor/Alef-Biblical-1.5B-Base") model = AutoModelForCausalLM.from_pretrained("plvictor/Alef-Biblical-1.5B-Base") - Notebooks
- Google Colab
- Kaggle
- Local Apps Settings
- vLLM
How to use plvictor/Alef-Biblical-1.5B-Base with vLLM:
Install from pip and serve model
# Install vLLM from pip: pip install vllm # Start the vLLM server: vllm serve "plvictor/Alef-Biblical-1.5B-Base" # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:8000/v1/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "plvictor/Alef-Biblical-1.5B-Base", "prompt": "Once upon a time,", "max_tokens": 512, "temperature": 0.5 }'Use Docker
docker model run hf.co/plvictor/Alef-Biblical-1.5B-Base
- SGLang
How to use plvictor/Alef-Biblical-1.5B-Base with SGLang:
Install from pip and serve model
# Install SGLang from pip: pip install sglang # Start the SGLang server: python3 -m sglang.launch_server \ --model-path "plvictor/Alef-Biblical-1.5B-Base" \ --host 0.0.0.0 \ --port 30000 # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:30000/v1/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "plvictor/Alef-Biblical-1.5B-Base", "prompt": "Once upon a time,", "max_tokens": 512, "temperature": 0.5 }'Use Docker images
docker run --gpus all \ --shm-size 32g \ -p 30000:30000 \ -v ~/.cache/huggingface:/root/.cache/huggingface \ --env "HF_TOKEN=<secret>" \ --ipc=host \ lmsysorg/sglang:latest \ python3 -m sglang.launch_server \ --model-path "plvictor/Alef-Biblical-1.5B-Base" \ --host 0.0.0.0 \ --port 30000 # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:30000/v1/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "plvictor/Alef-Biblical-1.5B-Base", "prompt": "Once upon a time,", "max_tokens": 512, "temperature": 0.5 }' - Docker Model Runner
How to use plvictor/Alef-Biblical-1.5B-Base with Docker Model Runner:
docker model run hf.co/plvictor/Alef-Biblical-1.5B-Base
Alef Biblical 1.5B — Base
Alef é um modelo de linguagem em português especializado em BÃblia, teologia e fé cristã — desenvolvido por um brasileiro, para a comunidade brasileira.
Este é o modelo base (após Continued Pre-Training), que serviu de fundação para o modelo conversacional. Para usar o Alef como assistente, use plvictor/Alef-Biblical-1.5B-Instruct.
Por que o Alef existe?
A maioria dos modelos de IA especializados em BÃblia e teologia é em inglês. A comunidade de IA brasileira ainda tem muito espaço pra crescer nesse nicho — e o Alef nasceu justamente disso: a vontade de construir algo em português, com cuidado, e de compartilhar o processo de forma aberta.
Este projeto foi desenvolvido por um desenvolvedor solo como experimento de fine-tuning especializado em PT-BR. O objetivo não é competir com grandes modelos — é mostrar que dá pra fazer isso com acesso limitado, documentar o caminho, e ajudar a comunidade brasileira de IA a evoluir junto.
Sobre o modelo
| Campo | Valor |
|---|---|
| Arquitetura | Qwen3 |
| Parâmetros | 1.51B |
| Tipo | Base (text completion) |
| Idioma | Português Brasileiro (PT-BR) |
| DomÃnio | BÃblia, teologia, fé cristã |
| Context length | 4096 tokens |
| Dtype | BFloat16 |
Modelo base: Polygl0t/Tucano2-qwen-1.5B-Base — modelo base para português da famÃlia Qwen3.
Treino — Continued Pre-Training (CPT)
O modelo passou por CPT em um corpus bÃblico curado de ~368 milhões de tokens em português, cobrindo devocionais, estudos, planos de leitura, BÃblias em múltiplas traduções e conteúdo de sites teológicos.
Dataset
| Fonte | Documentos | Tokens est. |
|---|---|---|
| Devocionais — app Com Ele | 157.910 | ~102M |
| Planos de leitura — app Com Ele | 35.956 | ~189M |
| Estudos bÃblicos — app Com Ele | 5.000 | ~20M |
| Q&A bÃblico — app Com Ele | 15.843 | ~13M |
| BÃblia em 10 traduções PT — app Com Ele | 11.437 | ~10M |
| Resumos e análises de livros — app Com Ele | 2.378 | ~1M |
| Personagens, mapas, contexto histórico — app Com Ele | ~2.000 | ~0.7M |
| Sintético (GPT-4.1) | 982 | ~2.5M |
| voltemosaoevangelho.com | 5.529 | ~14M |
| bibliotecadopregador.com.br | 4.276 | ~10M |
| estudobiblico.org | 558 | ~4M |
| pt.ligonier.org | 726 | ~2M |
| Total | 241.167 | ~368M |
Configuração
| Parâmetro | Valor |
|---|---|
| Tipo | Full fine-tuning (CPT) |
| Precisão | BFloat16 |
| Attention | SDPA |
| Tokens por step | ~540k |
| GPU | NVIDIA H100 NVL (95GB VRAM) |
| Framework | HuggingFace Transformers |
Uso
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
model_id = "plvictor/Alef-Biblical-1.5B-Base"
tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
model_id,
torch_dtype=torch.bfloat16,
device_map="auto"
)
prompt = "O livro de Jó nos ensina que o sofrimento"
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
output = model.generate(**inputs, max_new_tokens=200, do_sample=True, temperature=0.7)
print(tokenizer.decode(output[0], skip_special_tokens=True))
Para conversa e assistência bÃblica, use
plvictor/Alef-Biblical-1.5B-Instruct.
Limitações
- Modelo pequeno (1.5B): bom pra consultas e conversas bÃblicas, não substitui modelos maiores em raciocÃnio complexo
- Especializado em PT-BR e conteúdo cristão — não adequado para uso genérico
- Pode refletir perspectivas teológicas predominantes no corpus
Sobre o criador
Desenvolvido por Paulo Victor Souza — desenvolvedor brasileiro, construindo projetos de IA em português. Site: plvictor.com
Licença
Apache 2.0
- Downloads last month
- 148