SlyEcho commited on Sep 1, 2023

Commit

8f516bc

verified ·

1 Parent(s): ab30195

add files

Files changed (20) hide show

.gitattributes CHANGED Viewed

@@ -4,6 +4,7 @@
 *.bz2 filter=lfs diff=lfs merge=lfs -text
 *.ckpt filter=lfs diff=lfs merge=lfs -text
 *.ftz filter=lfs diff=lfs merge=lfs -text
 *.gz filter=lfs diff=lfs merge=lfs -text
 *.h5 filter=lfs diff=lfs merge=lfs -text
 *.joblib filter=lfs diff=lfs merge=lfs -text

 *.bz2 filter=lfs diff=lfs merge=lfs -text
 *.ckpt filter=lfs diff=lfs merge=lfs -text
 *.ftz filter=lfs diff=lfs merge=lfs -text
+*.gguf filter=lfs diff=lfs merge=lfs -text
 *.gz filter=lfs diff=lfs merge=lfs -text
 *.h5 filter=lfs diff=lfs merge=lfs -text
 *.joblib filter=lfs diff=lfs merge=lfs -text

.gitignore ADDED Viewed

+llama.cpp*/
+venv/
+pytorch_model*.bin
+*.sha
+*.tar.gz
+tokenizer.model
+config.json
+tokenizer_config.json

Makefile ADDED Viewed

+MODEL_NAME=	open-llama-13b
+PYTHON?=	python
+LLAMA_BUILD=	1132
+LLAMA_TAR=	b$(LLAMA_BUILD).tar.gz
+LLAMA_DIR=	llama.cpp-b$(LLAMA_BUILD)
+LLAMA_FLAGS=
+HF_REPO=	openlm-research/open_llama_13b
+HF_REF=		main
+HF_FILES=	pytorch_model-00001-of-00003.bin \
+		pytorch_model-00002-of-00003.bin \
+		pytorch_model-00003-of-00003.bin \
+		tokenizer.model \
+		config.json \
+		tokenizer_config.json
+$(HF_FILES): 	SITE=	https://huggingface.co/$(HF_REPO)/resolve/$(HF_REF)
+$(LLAMA_TAR): 	SITE=	https://github.com/ggerganov/llama.cpp/archive/refs/tags
+QUANTS=		f16 q4_0 q4_1 q5_0 q5_1 q8_0 \
+		q2_K \
+		q3_K_S q3_K_M q3_K_L \
+		q4_K_S q4_K_M \
+		q5_K_S q5_K_M \
+		q6_K
+FILES=		$(HF_FILES) $(LLAMA_TAR)
+MODEL_FILES=	$(foreach q,$(QUANTS),$(MODEL_NAME)-$(q).gguf)
+.PHONY: all
+all: $(MODEL_FILES) SHA256SUMS
+$(FILES):
+	curl -L -o $@ --url $(SITE)/$@
+$(LLAMA_DIR): | $(LLAMA_TAR)
+	tar -xf $(LLAMA_TAR)
+$(LLAMA_DIR)/quantize: | $(LLAMA_DIR)
+	$(MAKE) -C $(LLAMA_DIR) $(LLAMA_FLAGS) quantize
+venv:
+	$(PYTHON) -m venv venv
+	venv/bin/pip install -e $(LLAMA_DIR)/gguf-py
+	venv/bin/pip install -r $(LLAMA_DIR)/requirements.txt
+$(MODEL_NAME)-f16.gguf: $(HF_FILES) | $(LLAMA_DIR) venv
+	venv/bin/python $(LLAMA_DIR)/convert.py --outtype f16 --outfile $@ .
+$(MODEL_NAME)-q%.gguf: $(MODEL_NAME)-f16.gguf | $(LLAMA_DIR)/quantize
+	$(LLAMA_DIR)/quantize $< $@ q$*
+%.sha: %
+	sha256sum $< > $@
+SHA256SUMS: $(addsuffix .sha,$(MODEL_FILES))
+	cat $^ > $@

README.md CHANGED Viewed

@@ -1,3 +1,15 @@
 ---
 license: apache-2.0
 ---

 ---
 license: apache-2.0
 ---
+# gguf versions of OpenLLaMa 13B
+- Version: 1000B tokens final release
+- Project: [OpenLLaMA: An Open Reproduction of LLaMA](https://github.com/openlm-research/open_llama)
+- Model: [openlm-research/open_llama_13b](https://huggingface.co/openlm-research/open_llama_13b)
+- [llama.cpp](https://github.com/ggerganov/llama.cpp): build 1012 (6381d4e) or later
+- [ggml version](https://huggingface.co/SlyEcho/open_llama_13b_ggml)
+## Perplexity on wiki.test.406
+Coming soon...

SHA256SUMS ADDED Viewed

+2fe1ca2677c8d44af840d87201e2648357a67e9ebbb40db42fc8d36c82b182ef  open-llama-13b-f16.gguf
+1bd67ba3ad2d34a776a8c2cca336106fbc2ec20428d15c3f7ae35a9d2cc996db  open-llama-13b-q4_0.gguf
+03dcf76d23f34dd0064bf87d0eb3c34cd9c371c4ab80629f5acca0bbbf438dac  open-llama-13b-q4_1.gguf
+0175ae7413f49f8aae62cd070b5456d45ac02bf9f436b99655e3a6df31088108  open-llama-13b-q5_0.gguf
+12791fa6b9409f7b11dd960e9e29da665d3180c83a4d2749c77816dc3bf6ab5e  open-llama-13b-q5_1.gguf
+9afa5144b42c6f8686c2d2e4cddd4716ffce3db173d30c864b0e225c9fb79251  open-llama-13b-q8_0.gguf
+9dc971555a9616fe453cdb47c233f16fc9a4f3645b4519b7603c49d55e1b11b1  open-llama-13b-q2_K.gguf
+010c957b686d1fb8928dcc5af320d20f415faec35edd9ad5bc753c728088311f  open-llama-13b-q3_K_S.gguf
+ac3601bbdb2b08fd1d7a98d13f1ee6bcaa9e3c5d38814e520d1b863e086c6c3e  open-llama-13b-q3_K_M.gguf
+2d377a89d2f223174969b009738afa9343c85d44d8aad900ba3b78be41a2dcda  open-llama-13b-q3_K_L.gguf
+3a59166e77242001175217a00ec5fa75aa4babdb51ec95b0f74bd5843c2b8fe1  open-llama-13b-q4_K_S.gguf
+cf40b5d26f362646f81f9c119dec16331568f4b377f7153d262b173639dd6d1c  open-llama-13b-q4_K_M.gguf
+70495f5db2fa068684f80bda421f5654306ea4c760fd7b86cc2f09059431b92d  open-llama-13b-q5_K_S.gguf
+8a07e7c7b6e8b2d8fc33332c4d4cc3d9454b4b2fdb1ff7d147d3a699e10c4e49  open-llama-13b-q5_K_M.gguf
+e228650322158a84810924066ca4a8fdf88f8df1804d82a509aabcea881297b9  open-llama-13b-q6_K.gguf

open-llama-13b-f16.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:2fe1ca2677c8d44af840d87201e2648357a67e9ebbb40db42fc8d36c82b182ef
+size 26033337888

open-llama-13b-q2_K.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:9dc971555a9616fe453cdb47c233f16fc9a4f3645b4519b7603c49d55e1b11b1
+size 5429382752

open-llama-13b-q3_K_L.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:2d377a89d2f223174969b009738afa9343c85d44d8aad900ba3b78be41a2dcda
+size 6929593952

open-llama-13b-q3_K_M.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:ac3601bbdb2b08fd1d7a98d13f1ee6bcaa9e3c5d38814e520d1b863e086c6c3e
+size 6337803872

open-llama-13b-q3_K_S.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:010c957b686d1fb8928dcc5af320d20f415faec35edd9ad5bc753c728088311f
+size 5659014752

open-llama-13b-q4_0.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:1bd67ba3ad2d34a776a8c2cca336106fbc2ec20428d15c3f7ae35a9d2cc996db
+size 7365869152

open-llama-13b-q4_1.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:03dcf76d23f34dd0064bf87d0eb3c34cd9c371c4ab80629f5acca0bbbf438dac
+size 8169094752

open-llama-13b-q4_K_M.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:cf40b5d26f362646f81f9c119dec16331568f4b377f7153d262b173639dd6d1c
+size 7865990752

open-llama-13b-q4_K_S.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:3a59166e77242001175217a00ec5fa75aa4babdb51ec95b0f74bd5843c2b8fe1
+size 7414365792

open-llama-13b-q5_0.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:0175ae7413f49f8aae62cd070b5456d45ac02bf9f436b99655e3a6df31088108
+size 8972320352

open-llama-13b-q5_1.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:12791fa6b9409f7b11dd960e9e29da665d3180c83a4d2749c77816dc3bf6ab5e
+size 9775545952

open-llama-13b-q5_K_M.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:8a07e7c7b6e8b2d8fc33332c4d4cc3d9454b4b2fdb1ff7d147d3a699e10c4e49
+size 9229958752

open-llama-13b-q5_K_S.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:70495f5db2fa068684f80bda421f5654306ea4c760fd7b86cc2f09059431b92d
+size 8972320352

open-llama-13b-q6_K.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:e228650322158a84810924066ca4a8fdf88f8df1804d82a509aabcea881297b9
+size 10679174752

open-llama-13b-q8_0.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:9afa5144b42c6f8686c2d2e4cddd4716ffce3db173d30c864b0e225c9fb79251
+size 13831353952