nameissakthi
/

PebbleLM-117M

Text Generation

small-language-model

edge-deployment

Model card Files Files and versions

PebbleLM-117M / src /data /__init__.py

nameissakthi's picture

Add model architecture code

27871e7 10 days ago

history blame contribute delete

635 Bytes

	# Data loading and tokenizer components

	from .tokenizer import SLMTokenizer
	from .dataset import (
	ConversationalDataset,
	StreamingTextDataset,
	PackedDataset,
	create_train_val_split,
	load_jsonl,
	save_jsonl,
	)
	from .dataloader import (
	DataModule,
	StreamingDataModule,
	create_dataloader,
	estimate_dataset_tokens,
	)

	__all__ = [
	"SLMTokenizer",
	"ConversationalDataset",
	"StreamingTextDataset",
	"PackedDataset",
	"create_train_val_split",
	"load_jsonl",
	"save_jsonl",
	"DataModule",
	"StreamingDataModule",
	"create_dataloader",
	"estimate_dataset_tokens",
	]