Upload 6 files

Browse files

Files changed (6) hide show

chat_template.jinja +5 -0
config.json +41 -0
generation_config.json +10 -0
model.safetensors +3 -0
tokenizer.json +0 -0
tokenizer_config.json +211 -0

chat_template.jinja ADDED Viewed

	@@ -0,0 +1,5 @@

+{% for message in messages %}<|im_start|>{{ message['role'] }}
+{% if message['role'] == 'assistant' %}{% generation %}{{ message['content'] }}<|im_end|>
+{% endgeneration %}{% else %}{{ message['content'] }}<|im_end|>
+{% endif %}{% endfor %}{% if add_generation_prompt %}<|im_start|>assistant
+{% endif %}

config.json ADDED Viewed

	@@ -0,0 +1,41 @@

+{
+  "architectures": [
+    "Qwen3ForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "bos_token_id": 0,
+  "dtype": "bfloat16",
+  "eos_token_id": 2,
+  "head_dim": 64,
+  "hidden_act": "silu",
+  "hidden_size": 512,
+  "initializer_range": 0.02,
+  "intermediate_size": 2048,
+  "layer_types": [
+    "sliding_attention",
+    "full_attention",
+    "sliding_attention",
+    "full_attention",
+    "sliding_attention",
+    "full_attention"
+  ],
+  "max_position_embeddings": 8192,
+  "max_window_layers": 5,
+  "model_type": "qwen3",
+  "num_attention_heads": 8,
+  "num_hidden_layers": 6,
+  "num_key_value_heads": 2,
+  "pad_token_id": 2,
+  "rms_norm_eps": 1e-06,
+  "rope_parameters": {
+    "rope_theta": 500000,
+    "rope_type": "default"
+  },
+  "sliding_window": 512,
+  "tie_word_embeddings": true,
+  "transformers_version": "5.8.0.dev0",
+  "use_cache": false,
+  "use_sliding_window": true,
+  "vocab_size": 16384
+}

generation_config.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+  "_from_model_config": true,
+  "bos_token_id": 0,
+  "eos_token_id": [
+    2
+  ],
+  "pad_token_id": 2,
+  "transformers_version": "5.8.0.dev0",
+  "use_cache": false
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5a3db5166cd9ac9295aac6654169149c685c2381a09a3d352a7b83b9502da536
+size 62412552

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,211 @@

+{
+  "backend": "tokenizers",
+  "bos_token": "<|startoftext|>",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "<|return|>",
+  "falcon_latex_tokens": [
+    "\\blindtext",
+    "\\newpage",
+    "\\boxed",
+    "\\framebox",
+    "\\fbox",
+    "\\tag",
+    "\\nonumber",
+    "\\item",
+    "\\centering",
+    "\\caption",
+    "\\includegraphics",
+    "\\label",
+    "\\multicolumn",
+    "\\cline",
+    "\\hline",
+    "\\end",
+    "\\begin",
+    "\\tableofcontents",
+    "\\maketitle",
+    "\\date",
+    "\\author",
+    "\\title",
+    "\\chapter",
+    "\\subsubsection",
+    "\\subsection",
+    "\\section",
+    "\\noindent",
+    "\\newline",
+    "\\par",
+    "\\ddot",
+    "\\dot",
+    "\\bar",
+    "\\iff",
+    "\\implies",
+    "\\neg",
+    "\\lor",
+    "\\land",
+    "\\qquad",
+    "\\quad",
+    "\\arctan",
+    "\\arccos",
+    "\\arcsin",
+    "\\cot",
+    "\\sec",
+    "\\csc",
+    "\\tan",
+    "\\cos",
+    "\\sin",
+    "\\widetilde",
+    "\\widehat",
+    "\\complement",
+    "\\varnothing",
+    "\\tilde",
+    "\\hat",
+    "\\vec",
+    "\\mathfrak",
+    "\\mathcal",
+    "\\mathbb",
+    "\\emptyset",
+    "\\bot",
+    "\\aleph",
+    "\\Re",
+    "\\Im",
+    "\\ell",
+    "\\hbar",
+    "\\exists",
+    "\\forall",
+    "\\partial",
+    "\\nabla",
+    "\\infty",
+    "\\binom",
+    "\\overline",
+    "\\sqrt",
+    "\\tfrac",
+    "\\dfrac",
+    "\\frac",
+    "\\textsc",
+    "\\textsf",
+    "\\texttt",
+    "\\emph",
+    "\\underline",
+    "\\textit",
+    "\\textbf",
+    "\\bigoplus",
+    "\\bigcap",
+    "\\bigcup",
+    "\\prod",
+    "\\sum",
+    "\\oint",
+    "\\iiint",
+    "\\iint",
+    "\\int",
+    "\\right",
+    "\\left",
+    "\\Bigr",
+    "\\Bigl",
+    "\\bigr",
+    "\\bigl",
+    "\\rceil",
+    "\\lceil",
+    "\\rfloor",
+    "\\lfloor",
+    "\\rangle",
+    "\\langle",
+    "\\overleftarrow",
+    "\\overleftrightarrow",
+    "\\overrightarrow",
+    "\\Longleftrightarrow",
+    "\\longleftrightarrow",
+    "\\longrightarrow",
+    "\\longleftarrow",
+    "\\Longrightarrow",
+    "\\Longleftarrow",
+    "\\gets",
+    "\\to",
+    "\\mapsto",
+    "\\Updownarrow",
+    "\\Downarrow",
+    "\\Uparrow",
+    "\\updownarrow",
+    "\\downarrow",
+    "\\uparrow",
+    "\\Leftrightarrow",
+    "\\Rightarrow",
+    "\\Leftarrow",
+    "\\leftrightarrow",
+    "\\rightarrow",
+    "\\leftarrow",
+    "\\perp",
+    "\\propto",
+    "\\ni",
+    "\\notin",
+    "\\in",
+    "\\supseteq",
+    "\\supset",
+    "\\sqsupseteq",
+    "\\sqsubseteq",
+    "\\subseteq",
+    "\\subset",
+    "\\cong",
+    "\\approx",
+    "\\simeq",
+    "\\sim",
+    "\\equiv",
+    "\\neq",
+    "\\geq",
+    "\\leq",
+    "\\oslash",
+    "\\otimes",
+    "\\ominus",
+    "\\oplus",
+    "\\wedge",
+    "\\vee",
+    "\\sqcup",
+    "\\sqcap",
+    "\\uplus",
+    "\\cup",
+    "\\cap",
+    "\\cdot",
+    "\\bullet",
+    "\\circ",
+    "\\star",
+    "\\ast",
+    "\\div",
+    "\\times",
+    "\\mp",
+    "\\pm",
+    "\\omega",
+    "\\psi",
+    "\\chi",
+    "\\varphi",
+    "\\varsigma",
+    "\\phi",
+    "\\upsilon",
+    "\\tau",
+    "\\sigma",
+    "\\rho",
+    "\\pi",
+    "\\xi",
+    "\\nu",
+    "\\mu",
+    "\\lambda",
+    "\\kappa",
+    "\\iota",
+    "\\theta",
+    "\\eta",
+    "\\zeta",
+    "\\epsilon",
+    "\\delta",
+    "\\gamma",
+    "\\beta",
+    "\\alpha"
+  ],
+  "is_local": true,
+  "latex_token_source": "tiiuae/Falcon-H1-Tiny-90M-Instruct",
+  "local_files_only": false,
+  "model_input_names": [
+    "input_ids",
+    "attention_mask"
+  ],
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "<|return|>",
+  "seed_tokenizer": "openai/gpt-oss-20b",
+  "tokenizer_class": "TokenizersBackend"
+}