sbintuitions
/

tiny-lm

Text Generation

text-generation-inference

Model card Files Files and versions

ryo0634 commited on Jun 27, 2024

Commit

d3e1943

·

verified ·

1 Parent(s): 808a8e8

Update README.md

Files changed (1) hide show

README.md +8 -9

README.md CHANGED Viewed

@@ -1,5 +1,5 @@
 ---
-license: apache-2.0
 datasets:
 - wikipedia
 language:
@@ -15,15 +15,13 @@ Trained on English and Japanese Wikipedia data.
 ## How to use
-```
-import torch
-from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline, set_seed
-model = AutoModelForCausalLM.from_pretrained("sbintuitions/tiny_lm")
-tokenizer = AutoTokenizer.from_pretrained("sbintuitions/tiny_lm", use_fast=False)
 generator = pipeline("text-generation", model=model, tokenizer=tokenizer)
-print(generator("Hello", max_length=30, do_sample=True, top_k=1000))
 ```
 ## Model architecture
@@ -33,4 +31,5 @@ A 4-layer, 512-hidden-size transformer-based language model.
 The model was trained on English Wikipedia and Japanese Wikipedia to optimize a traditional language modelling objective for 25B tokens.
 ## License
-[Apache License, Version 2.0](https://www.apache.org/licenses/LICENSE-2.0)

 ---
+license: mit
 datasets:
 - wikipedia
 language:
 ## How to use
+```python
+from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
+model = AutoModelForCausalLM.from_pretrained("sbintuitions/tiny-lm", torch_dtype="auto")
+tokenizer = AutoTokenizer.from_pretrained("sbintuitions/tiny-lm")
 generator = pipeline("text-generation", model=model, tokenizer=tokenizer)
+print(generator("Hello", max_length=30, do_sample=True, top_k=100))
 ```
 ## Model architecture
 The model was trained on English Wikipedia and Japanese Wikipedia to optimize a traditional language modelling objective for 25B tokens.
 ## License
+[MIT License](https://huggingface.co/sbintuitions/tiny-lm/resolve/main/LICENSE)