Spaces:

pico-lm
/

README

Running

rdiehlmartinez commited on Mar 21

Commit

60f09e9

verified ·

1 Parent(s): 13cc0ba

Fixing typo

Files changed (1) hide show

README.md CHANGED Viewed

@@ -69,7 +69,7 @@ Model Details:
    - 420B tokens of pre-processed, tokenized and shuffled text extraced from the **[DOLMA](https://allenai.org/dolma)** corpus
    - We use this dataset to train our model suite
-2. **[pretokenized-dolma-tiny](https://huggingface.co/datasets/pico-lm/pretokenized-dolma-tinsy)**
    - A smaller version of the **pretokenized-dolma** corpus for quick experiments
 3. **[pretokenized-paloma](https://huggingface.co/datasets/pico-lm/pretokenized-paloma)**

    - 420B tokens of pre-processed, tokenized and shuffled text extraced from the **[DOLMA](https://allenai.org/dolma)** corpus
    - We use this dataset to train our model suite
+2. **[pretokenized-dolma-tinsy](https://huggingface.co/datasets/pico-lm/pretokenized-dolma-tinsy)**
    - A smaller version of the **pretokenized-dolma** corpus for quick experiments
 3. **[pretokenized-paloma](https://huggingface.co/datasets/pico-lm/pretokenized-paloma)**