petil777
/

srv1_parallel

Transformers

custom_code

Model card Files Files and versions

xet

Community

root commited on Oct 12, 2023

Commit

ae93403

1 Parent(s): 7a4ca68

Add safe tensor converting code

Browse files

Files changed (1) hide show

handle_safetensors.py +66 -0

handle_safetensors.py ADDED Viewed

	@@ -0,0 +1,66 @@

+from safetensors.torch import save_file
+from safetensors.torch import safe_open
+import os
+import torch
+import argparse
+from transformers import AutoModelForCausalLM
+def save_model_at_once(model, save_dir):
+    import pdb
+    pdb.set_trace()
+    tensors = {k:v for k, v in model.state_dict().items()}
+    path = os.path.join(save_dir, "model.safetensors")
+    save_file(tensors, path)
+def save_model_in_distributed_safetensor(model, save_dir, n_file=2):
+    total_params = [torch.numel(model.state_dict()[k]) for k in model.state_dict()]
+    params_per_gpu = float(sum(total_params) / n_file)
+    params = [0]
+    tensors = {}
+    for i, (k, v) in enumerate(model.state_dict().items()):
+        cur_params = torch.numel(model.state_dict()[k])
+        params[-1] += cur_params
+        tensors.update({k:v})
+        if params[-1] > params_per_gpu or i == len(model.state_dict())-1:
+            name = f"model{len(params)-1}.safetensors"
+            path = os.path.join(save_dir, name)
+            save_file(tensors, path)
+            params.append(0)
+            del tensors
+            tensors = {}
+def load_model_test(load_path, model_name="model.safetensors"):
+    tensors = {}
+    path = os.path.join(load_path, model_name)
+    with safe_open(path, framework="pt", device=0) as f:
+        for k in f.keys():
+            tensors[k] = f.get_tensor(k)
+        print(f.keys())
+        print("Success to load.")
+if __name__ == "__main__":
+    parser = argparse.ArgumentParser()
+    parser.add_argument("--model_path", type=str, default=None, help="huggingface .bin file dir")
+    parser.add_argument("--save_dir", type=str, default=None, help="path to save")
+    parser.add_argument("--n_file", type=int, default=1, help="Whether to split weight params when saving safetensors")
+    parser.add_argument("--check_load", action="store_true")
+    args = parser.parse_args()
+    model = AutoModelForCausalLM.from_pretrained(args.model_path)
+    print("Model loaded")
+    if not os.path.exists(args.save_dir):
+        from pathlib import Path
+        Path(args.save_dir).mkdir(parents=True, exist_ok=True)
+    load_path = args.save_dir
+    if args.n_file == 1:
+        save_model_at_once(model, args.save_dir)
+        if args.check_load:
+            load_model_test(load_path)
+    else:
+        assert args.n_file >=2
+        save_model_in_distributed_safetensor(model, args.save_dir, n_file=args.n_file)
+        if args.check_load:
+            load_model_test(load_path, model_name="model0.safetensors")
+            load_model_test(load_path, model_name=f"model{args.n_file-1}.safetensors")