Spaces:

abersbail
/

local-small-llm-python

Sleeping

App Files Files Community

local-small-llm-python / mini_llm /service.py

abersbail

Add local small LLM Python Space

740c342 verified 2 months ago

raw

history blame contribute delete

4.58 kB

	from pathlib import Path
	import shutil

	import torch

	from .config import LLMConfig
	from .trainer import create_model_and_tokenizer, set_seed, train_model
	from .model import TinyTransformerLM
	from .tokenizer import CharTokenizer


	class LocalMiniLLMService:
	def __init__(self, config: LLMConfig):
	self.config = config
	torch.set_num_threads(max(1, self.config.cpu_threads))
	self.model = None
	self.tokenizer = None

	def generate(self, prompt: str, max_new_tokens: int, temperature: float, top_k: int):
	clean_prompt = prompt or "User: hello\nAssistant:"
	self._ensure_ready()
	encoded = self.tokenizer.encode(clean_prompt)
	if not encoded:
	encoded = self.tokenizer.encode("User: hello\nAssistant:")
	idx = torch.tensor(encoded, dtype=torch.long).unsqueeze(0)
	self.model.eval()
	with torch.inference_mode():
	out = self.model.generate(
	idx,
	max_new_tokens=max_new_tokens,
	temperature=temperature,
	top_k=top_k,
	)
	text = self.tokenizer.decode(out[0].tolist())
	status = (
	f"Generated text with local tiny transformer. "
	f"Vocab={self.tokenizer.vocab_size}, Layers={self.config.n_layers}, Hidden={self.config.d_model}."
	)
	return text, status

	def train(self, extra_text: str, steps: int):
	steps = max(1, steps)
	training_text = extra_text or ""
	checkpoint_exists = self.config.checkpoint_path.exists()

	if checkpoint_exists:
	self._load_or_initialize(extra_text="")

	model, tokenizer, encoded = create_model_and_tokenizer(self.config, training_text)
	if checkpoint_exists and self.model is not None and self.tokenizer is not None:
	if tokenizer.stoi == self.tokenizer.stoi:
	model.load_state_dict(self.model.state_dict())

	losses = train_model(model, encoded, self.config, steps)
	self.model = model
	self.tokenizer = tokenizer
	self._save_checkpoint(extra_text=training_text)

	return (
	f"Training finished.\n"
	f"Steps: {steps}\n"
	f"Start Loss: {losses[0]:.4f}\n"
	f"End Loss: {losses[-1]:.4f}\n"
	f"Checkpoint: {self.config.checkpoint_path}"
	)

	def reset(self):
	checkpoint_dir = self.config.checkpoint_path.parent
	if checkpoint_dir.exists():
	shutil.rmtree(checkpoint_dir)
	self.model = None
	self.tokenizer = None
	return "Model reset. Next generate/train call will rebuild from scratch."

	def _ensure_ready(self):
	if self.model is not None and self.tokenizer is not None:
	return
	self._load_or_initialize(extra_text="")

	def _load_or_initialize(self, extra_text: str):
	checkpoint = self.config.checkpoint_path
	if checkpoint.exists():
	state = torch.load(checkpoint, map_location="cpu")
	self.tokenizer = CharTokenizer.from_state_dict(state["tokenizer"])
	self.model = TinyTransformerLM(
	vocab_size=state["config"]["vocab_size"],
	block_size=state["config"]["block_size"],
	d_model=state["config"]["d_model"],
	n_heads=state["config"]["n_heads"],
	n_layers=state["config"]["n_layers"],
	dropout=state["config"]["dropout"],
	)
	self.model.load_state_dict(state["model"])
	self.model.eval()
	return

	set_seed(self.config.seed)
	self.model, self.tokenizer, encoded = create_model_and_tokenizer(self.config, extra_text)
	train_model(self.model, encoded, self.config, self.config.bootstrap_steps)
	self._save_checkpoint(extra_text=extra_text)

	def _save_checkpoint(self, extra_text: str):
	checkpoint = self.config.checkpoint_path
	checkpoint.parent.mkdir(parents=True, exist_ok=True)
	state = {
	"model": self.model.state_dict(),
	"tokenizer": self.tokenizer.state_dict(),
	"config": {
	"vocab_size": self.tokenizer.vocab_size,
	"block_size": self.config.block_size,
	"d_model": self.config.d_model,
	"n_heads": self.config.n_heads,
	"n_layers": self.config.n_layers,
	"dropout": self.config.dropout,
	"extra_text": extra_text,
	},
	}
	torch.save(state, checkpoint)