Initial release: TheoBERT Base — biblical-domain masked language model

a64c547 8 days ago

803 Bytes

	{
	"architectures": [
	"TheoBertBaseForMaskedLM"
	],
	"model_type": "theo_bert_base",
	"auto_map": {
	"AutoConfig": "configuration_theo_bert_base.TheoBertBaseConfig",
	"AutoModel": "modeling_theo_bert_base.TheoBertBaseModel",
	"AutoModelForMaskedLM": "modeling_theo_bert_base.TheoBertBaseForMaskedLM"
	},
	"tokenizer_name": "google-bert/bert-base-uncased",
	"torch_dtype": "float32",
	"vocab_size": 30522,
	"n_layer": 12,
	"n_head": 8,
	"n_embd": 768,
	"seq_len": 256,
	"rope_base": 10000,
	"rope_cache_factor": 10,
	"hidden_size": 768,
	"num_hidden_layers": 12,
	"num_attention_heads": 8,
	"max_position_embeddings": 256,
	"pad_token_id": 0,
	"unk_token_id": 100,
	"cls_token_id": 101,
	"sep_token_id": 102,
	"mask_token_id": 103,
	"transformers_version": "5.2.0"
	}