sezginer commited on Nov 3, 2025

Commit

3f5b716

verified ·

1 Parent(s): 590faf3

Upload folder using huggingface_hub

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

encoder-decoder/16_16_8/1st_stage.ckpt +3 -0
encoder-decoder/16_16_8/2nd_stage.ckpt +3 -0
encoder-decoder/16_16_8/3rd_stage.ckpt +3 -0
encoder-decoder/8_8_8/1st_stage.ckpt +3 -0
encoder-decoder/8_8_8/2nd_stage.ckpt +3 -0
encoder-decoder/8_8_8/3rd_stage.ckpt +3 -0
report_generation/16_16_8/checkpoint-38000/README.md +202 -0
report_generation/16_16_8/checkpoint-38000/adapter_config.json +37 -0
report_generation/16_16_8/checkpoint-38000/adapter_model.safetensors +3 -0
report_generation/16_16_8/checkpoint-38000/config.json +56 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_0_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_10_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_11_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_12_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_13_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_14_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_15_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_16_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_17_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_18_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_19_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_1_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_20_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_21_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_22_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_23_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_24_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_25_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_26_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_27_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_28_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_29_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_2_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_30_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_31_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_32_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_33_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_34_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_35_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_36_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_37_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_38_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_39_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_3_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_4_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_5_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_6_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_7_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_8_mp_rank_00_optim_states.pt +3 -0
report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_9_mp_rank_00_optim_states.pt +3 -0

encoder-decoder/16_16_8/1st_stage.ckpt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d24fcc33ad8e39fd5d8c4485ee57f208f5ebe1074645d6a4d9b89c2b43253415
+size 417168514

encoder-decoder/16_16_8/2nd_stage.ckpt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7e25b31a98a0f6c5b2e5859152424651d92b978a88274af6df3a4dd08a5ce937
+size 417168225

encoder-decoder/16_16_8/3rd_stage.ckpt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a3d28cf1c8a17aa30df2c6d6819540744afa397e1b6f22f0a3247320699fd9a5
+size 417168225

encoder-decoder/8_8_8/1st_stage.ckpt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d6aabfb3c675045db59f552d7d4fdc0e7ecfd0ccab047299fe62fcd5a564d161
+size 375316226

encoder-decoder/8_8_8/2nd_stage.ckpt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bfcc0a0cdf0f1bfaa9b01acfea1f6b020926120de1623eddcfd23e2c03fd6cb7
+size 375315993

encoder-decoder/8_8_8/3rd_stage.ckpt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6978a2fcc30ebc4b1313329821ab5288b60409b29684d8adb0e070f9a9fbe46c
+size 375315993

report_generation/16_16_8/checkpoint-38000/README.md ADDED Viewed

	@@ -0,0 +1,202 @@

+---
+base_model: meta-llama/Meta-Llama-3.1-8B-Instruct
+library_name: peft
+---
+# Model Card for Model ID
+<!-- Provide a quick summary of what the model is/does. -->
+## Model Details
+### Model Description
+<!-- Provide a longer summary of what this model is. -->
+- **Developed by:** [More Information Needed]
+- **Funded by [optional]:** [More Information Needed]
+- **Shared by [optional]:** [More Information Needed]
+- **Model type:** [More Information Needed]
+- **Language(s) (NLP):** [More Information Needed]
+- **License:** [More Information Needed]
+- **Finetuned from model [optional]:** [More Information Needed]
+### Model Sources [optional]
+<!-- Provide the basic links for the model. -->
+- **Repository:** [More Information Needed]
+- **Paper [optional]:** [More Information Needed]
+- **Demo [optional]:** [More Information Needed]
+## Uses
+<!-- Address questions around how the model is intended to be used, including the foreseeable users of the model and those affected by the model. -->
+### Direct Use
+<!-- This section is for the model use without fine-tuning or plugging into a larger ecosystem/app. -->
+[More Information Needed]
+### Downstream Use [optional]
+<!-- This section is for the model use when fine-tuned for a task, or when plugged into a larger ecosystem/app -->
+[More Information Needed]
+### Out-of-Scope Use
+<!-- This section addresses misuse, malicious use, and uses that the model will not work well for. -->
+[More Information Needed]
+## Bias, Risks, and Limitations
+<!-- This section is meant to convey both technical and sociotechnical limitations. -->
+[More Information Needed]
+### Recommendations
+<!-- This section is meant to convey recommendations with respect to the bias, risk, and technical limitations. -->
+Users (both direct and downstream) should be made aware of the risks, biases and limitations of the model. More information needed for further recommendations.
+## How to Get Started with the Model
+Use the code below to get started with the model.
+[More Information Needed]
+## Training Details
+### Training Data
+<!-- This should link to a Dataset Card, perhaps with a short stub of information on what the training data is all about as well as documentation related to data pre-processing or additional filtering. -->
+[More Information Needed]
+### Training Procedure
+<!-- This relates heavily to the Technical Specifications. Content here should link to that section when it is relevant to the training procedure. -->
+#### Preprocessing [optional]
+[More Information Needed]
+#### Training Hyperparameters
+- **Training regime:** [More Information Needed] <!--fp32, fp16 mixed precision, bf16 mixed precision, bf16 non-mixed precision, fp16 non-mixed precision, fp8 mixed precision -->
+#### Speeds, Sizes, Times [optional]
+<!-- This section provides information about throughput, start/end time, checkpoint size if relevant, etc. -->
+[More Information Needed]
+## Evaluation
+<!-- This section describes the evaluation protocols and provides the results. -->
+### Testing Data, Factors & Metrics
+#### Testing Data
+<!-- This should link to a Dataset Card if possible. -->
+[More Information Needed]
+#### Factors
+<!-- These are the things the evaluation is disaggregating by, e.g., subpopulations or domains. -->
+[More Information Needed]
+#### Metrics
+<!-- These are the evaluation metrics being used, ideally with a description of why. -->
+[More Information Needed]
+### Results
+[More Information Needed]
+#### Summary
+## Model Examination [optional]
+<!-- Relevant interpretability work for the model goes here -->
+[More Information Needed]
+## Environmental Impact
+<!-- Total emissions (in grams of CO2eq) and additional considerations, such as electricity usage, go here. Edit the suggested text below accordingly -->
+Carbon emissions can be estimated using the [Machine Learning Impact calculator](https://mlco2.github.io/impact#compute) presented in [Lacoste et al. (2019)](https://arxiv.org/abs/1910.09700).
+- **Hardware Type:** [More Information Needed]
+- **Hours used:** [More Information Needed]
+- **Cloud Provider:** [More Information Needed]
+- **Compute Region:** [More Information Needed]
+- **Carbon Emitted:** [More Information Needed]
+## Technical Specifications [optional]
+### Model Architecture and Objective
+[More Information Needed]
+### Compute Infrastructure
+[More Information Needed]
+#### Hardware
+[More Information Needed]
+#### Software
+[More Information Needed]
+## Citation [optional]
+<!-- If there is a paper or blog post introducing the model, the APA and Bibtex information for that should go in this section. -->
+**BibTeX:**
+[More Information Needed]
+**APA:**
+[More Information Needed]
+## Glossary [optional]
+<!-- If relevant, include terms and calculations in this section that can help readers understand the model or model card. -->
+[More Information Needed]
+## More Information [optional]
+[More Information Needed]
+## Model Card Authors [optional]
+[More Information Needed]
+## Model Card Contact
+[More Information Needed]
+### Framework versions
+- PEFT 0.14.0

report_generation/16_16_8/checkpoint-38000/adapter_config.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "alpha_pattern": {},
+  "auto_mapping": null,
+  "base_model_name_or_path": "meta-llama/Meta-Llama-3.1-8B-Instruct",
+  "bias": "none",
+  "eva_config": null,
+  "exclude_modules": null,
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layer_replication": null,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "loftq_config": {},
+  "lora_alpha": 256,
+  "lora_bias": false,
+  "lora_dropout": 0.05,
+  "megatron_config": null,
+  "megatron_core": "megatron.core",
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 128,
+  "rank_pattern": {},
+  "revision": null,
+  "target_modules": [
+    "o_proj",
+    "v_proj",
+    "down_proj",
+    "q_proj",
+    "gate_proj",
+    "k_proj",
+    "up_proj"
+  ],
+  "task_type": "CAUSAL_LM",
+  "use_dora": false,
+  "use_rslora": false
+}

report_generation/16_16_8/checkpoint-38000/adapter_model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4971aab21859c6f6939ff8dc7616101944031729ed001d0569ceaf10403915e7
+size 671150064

report_generation/16_16_8/checkpoint-38000/config.json ADDED Viewed

	@@ -0,0 +1,56 @@

+{
+  "_name_or_path": "meta-llama/Meta-Llama-3.1-8B-Instruct",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "bos_token_id": 128000,
+  "eos_token_id": [
+    128001,
+    128008,
+    128009
+  ],
+  "freeze_mm_mlp_adapter": false,
+  "hidden_act": "silu",
+  "hidden_size": 4096,
+  "image_aspect_ratio": "pad",
+  "initializer_range": 0.02,
+  "intermediate_size": 14336,
+  "max_position_embeddings": 131072,
+  "mlp_bias": false,
+  "mm_context_size": 18,
+  "mm_hidden_size": 18,
+  "mm_patch_merge_type": "flat",
+  "mm_projector_lr": 2e-05,
+  "mm_projector_type": "attn_pool+mlp2x_gelu",
+  "mm_use_im_patch_token": false,
+  "mm_use_im_start_end": false,
+  "mm_vision_select_feature": "patch",
+  "mm_vision_select_layer": -2,
+  "mm_vision_tower": "openai/clip-vit-large-patch14-336",
+  "model_type": "llava_llama",
+  "num_attention_heads": 32,
+  "num_hidden_layers": 32,
+  "num_key_value_heads": 8,
+  "pad_token_id": 128256,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": {
+    "factor": 8.0,
+    "high_freq_factor": 4.0,
+    "low_freq_factor": 1.0,
+    "original_max_position_embeddings": 8192,
+    "rope_type": "llama3"
+  },
+  "rope_theta": 500000.0,
+  "tie_word_embeddings": false,
+  "tokenizer_model_max_length": 128000,
+  "tokenizer_padding_side": "right",
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.44.0",
+  "tune_mm_mlp_adapter": false,
+  "use_cache": false,
+  "use_mm_proj": true,
+  "vocab_size": 128261
+}

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_0_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b9bd7d7c6ea5939377008b543778e5ad76bde1f9ee5a2044377b2425cbf561e4
+size 263338482

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_10_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6dc170a1e68c8b681a98fbb4bd2f53b3a3ad9836ecf7eb392dd3bcd207affe6c
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_11_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:33d52f110e057bd6b5380581d01852242b683020abeb4ff9cfea31d7afa8cbcf
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_12_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:089e976e5d19310250a22fc15b15c1eb35b1df7130544cffdc983ed7b76b8566
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_13_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a69ab33ac46038c9aa83e3b4a2ff79fb87d0bc142158e1bc06e8fc864bb32418
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_14_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bbab51f7135e51044e9dde5a4ab297c2d425a2cebef52b112048a23750e9337c
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_15_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:eb01064e0df46743ac406cd44a88303d5323ecd00904baf2a1f10567ddb7149c
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_16_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:81141a68b25a5ea814c0d6e7b63688cecfcfe3fce5f8606eead85376a37ac3f9
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_17_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fe05a6509d1b6659de693933e20a3e4d523af8048c8ab96802c5519b58ee382f
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_18_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4f160ed2731475e45b91bf0122b9f6c3150d0c63ea08f426b1b08fd9336f9c1a
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_19_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:502b1896fb83180f0231d3248694f520aaa0cff927ef6743d3c4adcc87dadafd
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_1_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:629e892e1d63353322019d3a5e9a5523f14d9ba959815fd22ac9c34fb8d02e8c
+size 263338482

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_20_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0e500fb964304917b11176f99727bbb6b0422efb270a01c9b0afe7c80a72bbe8
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_21_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e44b525d7484c2b0ebfdaacb0d935b1e9adfab8cdd2d7c5dd17e7cda0ecf2884
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_22_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:633d4916220abb89711bcede2bf2b746cf49ea233901671ea6acfcee7b852a3d
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_23_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:93d05dc1b28b1c209e1ca2c5133217d757464f48cf8a204cd88bee63588de7b8
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_24_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:50c398f34656c2d3873738f8f3aab9ae5c337dc2ad96c00cab4f2f68382024b8
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_25_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6d9f050ca8adcff35ef557e175f65222d9fc70ea7bc335453dc8c9fb6636fe6b
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_26_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:98f146bebcdd17f49f2c0963800debd5344955e2d58e661fdc0ac95727e18760
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_27_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:500602c3cdabe49825c612dafd50a4bb1c32f461b88f899b5ff8baac72654462
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_28_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:07403d8fa847ca06dc5d7777d6645f08e7c64c0659ba7baa627a9d1148a7988f
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_29_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:888b09039e41ea3ed8c7010bbd69b7e1b16a15df53d73091ca7c70c069dd0d21
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_2_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0212eaf0e2e597f8c812fee4a09e7aacda727964f960ecffa21fef8eb73f33c2
+size 263338482

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_30_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3355d35ad33360c45f60ea12bda00fa1632639517e3a266723dd5af92acd7906
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_31_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a35c96ec5260c6de131bb9482cf807461231fbd924760854bc60cd72b1397c11
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_32_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c7d3185d670e81d8d983e99ee343d9652aef043fdb020a39450ea9f252318194
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_33_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:00cab5986377357d72d552215251100325c70084cd821a55f64161bb348a4807
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_34_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5fef6932f1e2216bcd8b8294e9eeeee06db04006af5c69a9ffc8ee3c721a72d2
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_35_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e2de5bfa16170bbf66ad8cb89964da9c40c12b13eb4e1898500f638cde4e95d3
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_36_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3fe3d988068afb77a8bd804a4a57c1032c48994549952954b7dbf40deac99430
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_37_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:57aa6014a419a2adad640e9e0bba88ba5597cc3922fb367daa1fdcc4a1cd9930
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_38_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3266602c318db45aee52a5712a1d2069f449d5a79eae2fb9cf323bc86cfc50a5
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_39_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:209872c12b98bfd8ddca026f085299b7a022f53869b82223122af5ea119eba9a
+size 263338562

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_3_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9980952a3be56f2cb5ef1dc941cb1ad47bc015ae60fd062b4c56375a63445243
+size 263338482

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_4_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:86ea03f758040a94595e89fddc3536750b66c2d7383ca5e5ed3d692b152c9843
+size 263338482

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_5_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dc96cf92ff2cf10a75ccb32c5732cc2e6d043eb44f4cc08597080a1da79f2bc3
+size 263338482

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_6_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:439161bfdf5220318f2197fa7891888f97e48f6414c4dd4697062f1f9885c99a
+size 263338482

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_7_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9e77d5b661ce48eae80938448dd8ae1a250165871b3c37e20a360ab7b04c44f8
+size 263338482

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_8_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9d8043aa268b73910d56fd011fcd0e53a0e38941f9ae9c0e86a680e58772d883
+size 263338482

report_generation/16_16_8/checkpoint-38000/global_step38000/bf16_zero_pp_rank_9_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:be22751c986057a4e04a82d87385e2af6ffb97b17f1903e7fd69a838efb68f61
+size 263338482