Intellexus
/

gemma2-2b-sa-1k-0

@@ -1,4 +1,5 @@
 ---
 language:
 - sa
 - en
@@ -7,6 +8,7 @@ tags:
 - vocabulary-expansion
 - low-resource
 - lora
 ---
 # gemma2-2b-sa-1k-0
@@ -41,9 +43,18 @@ outputs = model.generate(**inputs, max_new_tokens=100)
 print(tokenizer.decode(outputs[0], skip_special_tokens=True))
 ```
-## Dataset Citations
 ```bibtex
 ### CC-100 (Training Data)
 @inproceedings{conneau-etal-2020-unsupervised,

 ---
+license: cc-by-4.0
 language:
 - sa
 - en
 - vocabulary-expansion
 - low-resource
 - lora
+base_model: google/gemma-2-2b
 ---
 # gemma2-2b-sa-1k-0
 print(tokenizer.decode(outputs[0], skip_special_tokens=True))
 ```
+## Citations
 ```bibtex
+### Gemma 2 (Base Model)
+@article{gemma2024,
+    title = "Gemma 2: Improving Open Language Models at a Practical Size",
+    author = "{Gemma Team, Google DeepMind}",
+    journal = "arXiv preprint arXiv:2408.00118",
+    year = "2024",
+    url = "https://arxiv.org/abs/2408.00118",
+}
 ### CC-100 (Training Data)
 @inproceedings{conneau-etal-2020-unsupervised,