thkim0305 commited on May 2, 2025

Commit

ff1404c

verified ·

1 Parent(s): ad2c972

Upload folder using huggingface_hub

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/0_client_model_round10.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/0_client_model_round12.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/0_client_model_round15.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/0_client_model_round17.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/0_client_model_round2.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/0_client_model_round20.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/0_client_model_round5.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/0_client_model_round7.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/0_trainer_state.json +392 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/1_client_model_round10.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/1_client_model_round12.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/1_client_model_round15.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/1_client_model_round17.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/1_client_model_round2.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/1_client_model_round20.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/1_client_model_round5.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/1_client_model_round7.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/1_trainer_state.json +392 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/2_client_model_round10.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/2_client_model_round12.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/2_client_model_round15.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/2_client_model_round17.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/2_client_model_round2.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/2_client_model_round20.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/2_client_model_round5.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/2_client_model_round7.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/2_trainer_state.json +392 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/3_client_model_round10.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/3_client_model_round12.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/3_client_model_round15.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/3_client_model_round17.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/3_client_model_round2.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/3_client_model_round20.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/3_client_model_round5.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/3_client_model_round7.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/3_trainer_state.json +392 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/4_client_model_round10.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/4_client_model_round12.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/4_client_model_round15.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/4_client_model_round17.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/4_client_model_round2.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/4_client_model_round20.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/4_client_model_round5.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/4_client_model_round7.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/4_trainer_state.json +392 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/5_client_model_round10.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/5_client_model_round12.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/5_client_model_round15.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/5_client_model_round17.pth +3 -0
client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/5_client_model_round2.pth +3 -0

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/0_client_model_round10.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6fa789cff960ae4ee81fa9ac6a075adcf63e56a3ec6c3ecd5699d4f789f3c213
+size 360880622

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/0_client_model_round12.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:432f8736e99ab8b1e39223df1d48f017f6fd4f4f9643ca359d4b99141e4f4d74
+size 360880622

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/0_client_model_round15.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:41c8fc312b07e6987f1125962ff398f8861f24936ce222a149189568327cac67
+size 360880622

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/0_client_model_round17.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:051032624bbe04510f16be6fdc206a54f23b25aa871002ca00fef79182e7c513
+size 360880622

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/0_client_model_round2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d675c4b87e3db30f58b3688f502ecdfd3b852d0a28b2d067cc72ca763b08cd5a
+size 360880106

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/0_client_model_round20.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:381ce3ba71ec63c166839e10280a43a1e9f31dc4d7fa46bef9e6fa158c302e49
+size 360880622

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/0_client_model_round5.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:01e8733bb21c24aa296509cc99e8f4f9b3259d52e55bf918ee4c9f835985258f
+size 360880106

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/0_client_model_round7.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:89fe3d8b4f7d27dbc7e4251a76c701fd44c4ad0c7fadf149e72d9c82c2e77db3
+size 360880106

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/0_trainer_state.json ADDED Viewed

	@@ -0,0 +1,392 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 1.0,
+  "eval_steps": 500,
+  "global_step": 100,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.02,
+      "grad_norm": 9.423497200012207,
+      "learning_rate": 2e-05,
+      "loss": 0.9426,
+      "step": 2
+    },
+    {
+      "epoch": 0.04,
+      "grad_norm": 6.242947101593018,
+      "learning_rate": 2e-05,
+      "loss": 0.4941,
+      "step": 4
+    },
+    {
+      "epoch": 0.06,
+      "grad_norm": 0.23292511701583862,
+      "learning_rate": 2e-05,
+      "loss": 0.0161,
+      "step": 6
+    },
+    {
+      "epoch": 0.08,
+      "grad_norm": 3.2664003372192383,
+      "learning_rate": 2e-05,
+      "loss": 0.0807,
+      "step": 8
+    },
+    {
+      "epoch": 0.1,
+      "grad_norm": 16.083553314208984,
+      "learning_rate": 2e-05,
+      "loss": 1.5403,
+      "step": 10
+    },
+    {
+      "epoch": 0.12,
+      "grad_norm": 13.203125,
+      "learning_rate": 2e-05,
+      "loss": 1.3032,
+      "step": 12
+    },
+    {
+      "epoch": 0.14,
+      "grad_norm": 9.931619644165039,
+      "learning_rate": 2e-05,
+      "loss": 0.4531,
+      "step": 14
+    },
+    {
+      "epoch": 0.16,
+      "grad_norm": 12.197830200195312,
+      "learning_rate": 2e-05,
+      "loss": 2.0777,
+      "step": 16
+    },
+    {
+      "epoch": 0.18,
+      "grad_norm": 13.418411254882812,
+      "learning_rate": 2e-05,
+      "loss": 2.5869,
+      "step": 18
+    },
+    {
+      "epoch": 0.2,
+      "grad_norm": 7.835398197174072,
+      "learning_rate": 2e-05,
+      "loss": 1.2992,
+      "step": 20
+    },
+    {
+      "epoch": 0.22,
+      "grad_norm": 0.8039246201515198,
+      "learning_rate": 2e-05,
+      "loss": 0.0811,
+      "step": 22
+    },
+    {
+      "epoch": 0.24,
+      "grad_norm": 7.014680862426758,
+      "learning_rate": 2e-05,
+      "loss": 1.1046,
+      "step": 24
+    },
+    {
+      "epoch": 0.26,
+      "grad_norm": 8.817255973815918,
+      "learning_rate": 2e-05,
+      "loss": 0.8185,
+      "step": 26
+    },
+    {
+      "epoch": 0.28,
+      "grad_norm": 2.18149733543396,
+      "learning_rate": 2e-05,
+      "loss": 0.1982,
+      "step": 28
+    },
+    {
+      "epoch": 0.3,
+      "grad_norm": 1.396234154701233,
+      "learning_rate": 2e-05,
+      "loss": 0.7965,
+      "step": 30
+    },
+    {
+      "epoch": 0.32,
+      "grad_norm": 9.15268325805664,
+      "learning_rate": 2e-05,
+      "loss": 0.5244,
+      "step": 32
+    },
+    {
+      "epoch": 0.34,
+      "grad_norm": 5.599765777587891,
+      "learning_rate": 2e-05,
+      "loss": 0.686,
+      "step": 34
+    },
+    {
+      "epoch": 0.36,
+      "grad_norm": 11.052386283874512,
+      "learning_rate": 2e-05,
+      "loss": 1.5529,
+      "step": 36
+    },
+    {
+      "epoch": 0.38,
+      "grad_norm": 2.8186702728271484,
+      "learning_rate": 2e-05,
+      "loss": 0.6692,
+      "step": 38
+    },
+    {
+      "epoch": 0.4,
+      "grad_norm": 4.434682846069336,
+      "learning_rate": 2e-05,
+      "loss": 0.5903,
+      "step": 40
+    },
+    {
+      "epoch": 0.42,
+      "grad_norm": 4.227272033691406,
+      "learning_rate": 2e-05,
+      "loss": 0.2824,
+      "step": 42
+    },
+    {
+      "epoch": 0.44,
+      "grad_norm": 5.939194679260254,
+      "learning_rate": 2e-05,
+      "loss": 1.3968,
+      "step": 44
+    },
+    {
+      "epoch": 0.46,
+      "grad_norm": 0.5867003798484802,
+      "learning_rate": 2e-05,
+      "loss": 0.393,
+      "step": 46
+    },
+    {
+      "epoch": 0.48,
+      "grad_norm": 6.319277763366699,
+      "learning_rate": 2e-05,
+      "loss": 0.6232,
+      "step": 48
+    },
+    {
+      "epoch": 0.5,
+      "grad_norm": 2.46071195602417,
+      "learning_rate": 2e-05,
+      "loss": 0.2416,
+      "step": 50
+    },
+    {
+      "epoch": 0.52,
+      "grad_norm": 3.9734086990356445,
+      "learning_rate": 2e-05,
+      "loss": 0.6859,
+      "step": 52
+    },
+    {
+      "epoch": 0.54,
+      "grad_norm": 1.4034255743026733,
+      "learning_rate": 2e-05,
+      "loss": 0.5754,
+      "step": 54
+    },
+    {
+      "epoch": 0.56,
+      "grad_norm": 1.3656154870986938,
+      "learning_rate": 2e-05,
+      "loss": 0.1789,
+      "step": 56
+    },
+    {
+      "epoch": 0.58,
+      "grad_norm": 4.575096130371094,
+      "learning_rate": 2e-05,
+      "loss": 2.5298,
+      "step": 58
+    },
+    {
+      "epoch": 0.6,
+      "grad_norm": 0.9366658329963684,
+      "learning_rate": 2e-05,
+      "loss": 0.1539,
+      "step": 60
+    },
+    {
+      "epoch": 0.62,
+      "grad_norm": 1.2089002132415771,
+      "learning_rate": 2e-05,
+      "loss": 0.5569,
+      "step": 62
+    },
+    {
+      "epoch": 0.64,
+      "grad_norm": 2.383746862411499,
+      "learning_rate": 2e-05,
+      "loss": 0.3214,
+      "step": 64
+    },
+    {
+      "epoch": 0.66,
+      "grad_norm": 0.41840168833732605,
+      "learning_rate": 2e-05,
+      "loss": 0.2939,
+      "step": 66
+    },
+    {
+      "epoch": 0.68,
+      "grad_norm": 2.619239330291748,
+      "learning_rate": 2e-05,
+      "loss": 0.6163,
+      "step": 68
+    },
+    {
+      "epoch": 0.7,
+      "grad_norm": 3.0113186836242676,
+      "learning_rate": 2e-05,
+      "loss": 0.5063,
+      "step": 70
+    },
+    {
+      "epoch": 0.72,
+      "grad_norm": 1.8169399499893188,
+      "learning_rate": 2e-05,
+      "loss": 0.3002,
+      "step": 72
+    },
+    {
+      "epoch": 0.74,
+      "grad_norm": 4.200991630554199,
+      "learning_rate": 2e-05,
+      "loss": 1.5329,
+      "step": 74
+    },
+    {
+      "epoch": 0.76,
+      "grad_norm": 1.631651520729065,
+      "learning_rate": 2e-05,
+      "loss": 0.6569,
+      "step": 76
+    },
+    {
+      "epoch": 0.78,
+      "grad_norm": 0.40286803245544434,
+      "learning_rate": 2e-05,
+      "loss": 1.0856,
+      "step": 78
+    },
+    {
+      "epoch": 0.8,
+      "grad_norm": 2.7753989696502686,
+      "learning_rate": 2e-05,
+      "loss": 0.9605,
+      "step": 80
+    },
+    {
+      "epoch": 0.82,
+      "grad_norm": 0.5652052164077759,
+      "learning_rate": 2e-05,
+      "loss": 0.3553,
+      "step": 82
+    },
+    {
+      "epoch": 0.84,
+      "grad_norm": 5.572319984436035,
+      "learning_rate": 2e-05,
+      "loss": 1.0,
+      "step": 84
+    },
+    {
+      "epoch": 0.86,
+      "grad_norm": 0.4662155210971832,
+      "learning_rate": 2e-05,
+      "loss": 0.1469,
+      "step": 86
+    },
+    {
+      "epoch": 0.88,
+      "grad_norm": 2.5111005306243896,
+      "learning_rate": 2e-05,
+      "loss": 0.9844,
+      "step": 88
+    },
+    {
+      "epoch": 0.9,
+      "grad_norm": 2.1454522609710693,
+      "learning_rate": 2e-05,
+      "loss": 0.3873,
+      "step": 90
+    },
+    {
+      "epoch": 0.92,
+      "grad_norm": 1.0339059829711914,
+      "learning_rate": 2e-05,
+      "loss": 1.2139,
+      "step": 92
+    },
+    {
+      "epoch": 0.94,
+      "grad_norm": 4.232385158538818,
+      "learning_rate": 2e-05,
+      "loss": 2.1749,
+      "step": 94
+    },
+    {
+      "epoch": 0.96,
+      "grad_norm": 1.8107025623321533,
+      "learning_rate": 2e-05,
+      "loss": 1.4807,
+      "step": 96
+    },
+    {
+      "epoch": 0.98,
+      "grad_norm": 4.099456787109375,
+      "learning_rate": 2e-05,
+      "loss": 1.5927,
+      "step": 98
+    },
+    {
+      "epoch": 1.0,
+      "grad_norm": 0.4381089210510254,
+      "learning_rate": 2e-05,
+      "loss": 0.2756,
+      "step": 100
+    },
+    {
+      "epoch": 1.0,
+      "step": 100,
+      "total_flos": 2185214759534592.0,
+      "train_loss": 0.8263820886611939,
+      "train_runtime": 70.7407,
+      "train_samples_per_second": 5.654,
+      "train_steps_per_second": 1.414
+    }
+  ],
+  "logging_steps": 2,
+  "max_steps": 100,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 1,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": false,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 2185214759534592.0,
+  "train_batch_size": 1,
+  "trial_name": null,
+  "trial_params": null
+}

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/1_client_model_round10.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3ca00ad56c9180596acb64d02ed1c2c93b5167313f4ddacae17fe6151ab9c155
+size 360880622

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/1_client_model_round12.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5292459abad60fd048050fb5779edeaa54e68fd64f6d8f672e54415ffd378568
+size 360880622

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/1_client_model_round15.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8c51878f3c0c54cdc54eb26bf35a2757735003b92f7da1689081ec193e89b87b
+size 360880622

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/1_client_model_round17.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:95a9f87437d27a76a6cac22a0d23d1b90a201e43d7c601b4f2178ea763b5880d
+size 360880622

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/1_client_model_round2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d126b766b20e0cad09d67d67cb29db4c25a011f24be748b251d8b5cf6288b90a
+size 360880106

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/1_client_model_round20.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c0ad85bffca2bf517e6a2294ecc419a949579749fae404a75f6f3de58d5c4be5
+size 360880622

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/1_client_model_round5.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8e1e47d59fb16d75680a1f95491ce48c1a01605d42bde715afab635cd1fd4fc4
+size 360880106

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/1_client_model_round7.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d8eb669eede9faee34f088d7edbeb9c774a119de291ab6f2ebf3c071d1346dc1
+size 360880106

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/1_trainer_state.json ADDED Viewed

	@@ -0,0 +1,392 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 1.0,
+  "eval_steps": 500,
+  "global_step": 100,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.02,
+      "grad_norm": 0.06926380842924118,
+      "learning_rate": 2e-05,
+      "loss": 0.0983,
+      "step": 2
+    },
+    {
+      "epoch": 0.04,
+      "grad_norm": 0.14224855601787567,
+      "learning_rate": 2e-05,
+      "loss": 0.5132,
+      "step": 4
+    },
+    {
+      "epoch": 0.06,
+      "grad_norm": 3.1999995708465576,
+      "learning_rate": 2e-05,
+      "loss": 0.3034,
+      "step": 6
+    },
+    {
+      "epoch": 0.08,
+      "grad_norm": 1.366185188293457,
+      "learning_rate": 2e-05,
+      "loss": 0.0975,
+      "step": 8
+    },
+    {
+      "epoch": 0.1,
+      "grad_norm": 0.047930456697940826,
+      "learning_rate": 2e-05,
+      "loss": 0.0054,
+      "step": 10
+    },
+    {
+      "epoch": 0.12,
+      "grad_norm": 2.5389022827148438,
+      "learning_rate": 2e-05,
+      "loss": 0.1265,
+      "step": 12
+    },
+    {
+      "epoch": 0.14,
+      "grad_norm": 4.9087395668029785,
+      "learning_rate": 2e-05,
+      "loss": 0.3968,
+      "step": 14
+    },
+    {
+      "epoch": 0.16,
+      "grad_norm": 0.5400022864341736,
+      "learning_rate": 2e-05,
+      "loss": 0.2126,
+      "step": 16
+    },
+    {
+      "epoch": 0.18,
+      "grad_norm": 0.17520087957382202,
+      "learning_rate": 2e-05,
+      "loss": 0.0546,
+      "step": 18
+    },
+    {
+      "epoch": 0.2,
+      "grad_norm": 0.15257954597473145,
+      "learning_rate": 2e-05,
+      "loss": 0.0091,
+      "step": 20
+    },
+    {
+      "epoch": 0.22,
+      "grad_norm": 0.7264464497566223,
+      "learning_rate": 2e-05,
+      "loss": 0.1006,
+      "step": 22
+    },
+    {
+      "epoch": 0.24,
+      "grad_norm": 0.2980533242225647,
+      "learning_rate": 2e-05,
+      "loss": 0.0133,
+      "step": 24
+    },
+    {
+      "epoch": 0.26,
+      "grad_norm": 0.862314760684967,
+      "learning_rate": 2e-05,
+      "loss": 0.0667,
+      "step": 26
+    },
+    {
+      "epoch": 0.28,
+      "grad_norm": 0.18892519176006317,
+      "learning_rate": 2e-05,
+      "loss": 0.0091,
+      "step": 28
+    },
+    {
+      "epoch": 0.3,
+      "grad_norm": 0.21099655330181122,
+      "learning_rate": 2e-05,
+      "loss": 0.0126,
+      "step": 30
+    },
+    {
+      "epoch": 0.32,
+      "grad_norm": 0.5386524200439453,
+      "learning_rate": 2e-05,
+      "loss": 0.0495,
+      "step": 32
+    },
+    {
+      "epoch": 0.34,
+      "grad_norm": 4.457860946655273,
+      "learning_rate": 2e-05,
+      "loss": 0.2528,
+      "step": 34
+    },
+    {
+      "epoch": 0.36,
+      "grad_norm": 0.006588024087250233,
+      "learning_rate": 2e-05,
+      "loss": 0.0005,
+      "step": 36
+    },
+    {
+      "epoch": 0.38,
+      "grad_norm": 0.25489550828933716,
+      "learning_rate": 2e-05,
+      "loss": 0.0122,
+      "step": 38
+    },
+    {
+      "epoch": 0.4,
+      "grad_norm": 1.0599042177200317,
+      "learning_rate": 2e-05,
+      "loss": 0.0402,
+      "step": 40
+    },
+    {
+      "epoch": 0.42,
+      "grad_norm": 4.65377950668335,
+      "learning_rate": 2e-05,
+      "loss": 0.1825,
+      "step": 42
+    },
+    {
+      "epoch": 0.44,
+      "grad_norm": 5.81795072555542,
+      "learning_rate": 2e-05,
+      "loss": 0.5606,
+      "step": 44
+    },
+    {
+      "epoch": 0.46,
+      "grad_norm": 0.06573299318552017,
+      "learning_rate": 2e-05,
+      "loss": 0.0047,
+      "step": 46
+    },
+    {
+      "epoch": 0.48,
+      "grad_norm": 0.15902456641197205,
+      "learning_rate": 2e-05,
+      "loss": 0.0069,
+      "step": 48
+    },
+    {
+      "epoch": 0.5,
+      "grad_norm": 0.09095041453838348,
+      "learning_rate": 2e-05,
+      "loss": 0.0076,
+      "step": 50
+    },
+    {
+      "epoch": 0.52,
+      "grad_norm": 0.03288710489869118,
+      "learning_rate": 2e-05,
+      "loss": 0.1018,
+      "step": 52
+    },
+    {
+      "epoch": 0.54,
+      "grad_norm": 0.8101238012313843,
+      "learning_rate": 2e-05,
+      "loss": 0.0885,
+      "step": 54
+    },
+    {
+      "epoch": 0.56,
+      "grad_norm": 0.018732983618974686,
+      "learning_rate": 2e-05,
+      "loss": 0.0025,
+      "step": 56
+    },
+    {
+      "epoch": 0.58,
+      "grad_norm": 0.014856848865747452,
+      "learning_rate": 2e-05,
+      "loss": 0.177,
+      "step": 58
+    },
+    {
+      "epoch": 0.6,
+      "grad_norm": 0.006819794420152903,
+      "learning_rate": 2e-05,
+      "loss": 0.0792,
+      "step": 60
+    },
+    {
+      "epoch": 0.62,
+      "grad_norm": 0.015503552742302418,
+      "learning_rate": 2e-05,
+      "loss": 0.0177,
+      "step": 62
+    },
+    {
+      "epoch": 0.64,
+      "grad_norm": 0.02056262083351612,
+      "learning_rate": 2e-05,
+      "loss": 0.0141,
+      "step": 64
+    },
+    {
+      "epoch": 0.66,
+      "grad_norm": 0.32354819774627686,
+      "learning_rate": 2e-05,
+      "loss": 0.0082,
+      "step": 66
+    },
+    {
+      "epoch": 0.68,
+      "grad_norm": 0.28828832507133484,
+      "learning_rate": 2e-05,
+      "loss": 0.0255,
+      "step": 68
+    },
+    {
+      "epoch": 0.7,
+      "grad_norm": 0.011394195258617401,
+      "learning_rate": 2e-05,
+      "loss": 0.002,
+      "step": 70
+    },
+    {
+      "epoch": 0.72,
+      "grad_norm": 0.08238676935434341,
+      "learning_rate": 2e-05,
+      "loss": 0.004,
+      "step": 72
+    },
+    {
+      "epoch": 0.74,
+      "grad_norm": 1.0231951475143433,
+      "learning_rate": 2e-05,
+      "loss": 0.0829,
+      "step": 74
+    },
+    {
+      "epoch": 0.76,
+      "grad_norm": 0.0049722520634531975,
+      "learning_rate": 2e-05,
+      "loss": 0.0011,
+      "step": 76
+    },
+    {
+      "epoch": 0.78,
+      "grad_norm": 1.5577210187911987,
+      "learning_rate": 2e-05,
+      "loss": 0.1744,
+      "step": 78
+    },
+    {
+      "epoch": 0.8,
+      "grad_norm": 0.060515161603689194,
+      "learning_rate": 2e-05,
+      "loss": 0.0044,
+      "step": 80
+    },
+    {
+      "epoch": 0.82,
+      "grad_norm": 0.24229663610458374,
+      "learning_rate": 2e-05,
+      "loss": 0.0266,
+      "step": 82
+    },
+    {
+      "epoch": 0.84,
+      "grad_norm": 0.003239632351323962,
+      "learning_rate": 2e-05,
+      "loss": 0.0009,
+      "step": 84
+    },
+    {
+      "epoch": 0.86,
+      "grad_norm": 0.019305258989334106,
+      "learning_rate": 2e-05,
+      "loss": 0.5092,
+      "step": 86
+    },
+    {
+      "epoch": 0.88,
+      "grad_norm": 0.03198835998773575,
+      "learning_rate": 2e-05,
+      "loss": 0.0061,
+      "step": 88
+    },
+    {
+      "epoch": 0.9,
+      "grad_norm": 0.4420487582683563,
+      "learning_rate": 2e-05,
+      "loss": 0.0412,
+      "step": 90
+    },
+    {
+      "epoch": 0.92,
+      "grad_norm": 8.323692321777344,
+      "learning_rate": 2e-05,
+      "loss": 0.6126,
+      "step": 92
+    },
+    {
+      "epoch": 0.94,
+      "grad_norm": 0.013138143345713615,
+      "learning_rate": 2e-05,
+      "loss": 0.0034,
+      "step": 94
+    },
+    {
+      "epoch": 0.96,
+      "grad_norm": 0.41053083539009094,
+      "learning_rate": 2e-05,
+      "loss": 0.0296,
+      "step": 96
+    },
+    {
+      "epoch": 0.98,
+      "grad_norm": 0.00738116167485714,
+      "learning_rate": 2e-05,
+      "loss": 0.0008,
+      "step": 98
+    },
+    {
+      "epoch": 1.0,
+      "grad_norm": 0.04163911193609238,
+      "learning_rate": 2e-05,
+      "loss": 0.0028,
+      "step": 100
+    },
+    {
+      "epoch": 1.0,
+      "step": 100,
+      "total_flos": 2202644449853440.0,
+      "train_loss": 0.10307437002658844,
+      "train_runtime": 69.5445,
+      "train_samples_per_second": 5.752,
+      "train_steps_per_second": 1.438
+    }
+  ],
+  "logging_steps": 2,
+  "max_steps": 100,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 1,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": false,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 2202644449853440.0,
+  "train_batch_size": 1,
+  "trial_name": null,
+  "trial_params": null
+}

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/2_client_model_round10.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:475ad4672ec3aaec5117fffb04c560d3ac5d8223d0494c2bc0036bf8aeeb4787
+size 778341886

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/2_client_model_round12.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2073eda13fa87d39360d6fd49065146220dc0190e1004c319eb392aee6a48546
+size 778341886

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/2_client_model_round15.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cd0388c3619655d1858ead432f4146aae463cdfad671f284a6b5fdff3e9e119e
+size 778341886

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/2_client_model_round17.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:57bc54c8c645bd8a7a7d98994d2b745350a66ffc36b63c1b3485be984ab5a62c
+size 778341886

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/2_client_model_round2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:53ef0ae39d317134427d6d59afb8c58f3a573b7b4c9b00a837033c99411b1a27
+size 778341034

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/2_client_model_round20.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:333195ee6334bf482e3581bf003c5a1b2bdfbda17a5bce80a1c5e88263b3d4a6
+size 778341886

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/2_client_model_round5.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:309ab816121588cffe22b87774005c82c50e3940c8226ade89e6c6edc2ed71f9
+size 778341034

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/2_client_model_round7.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4706bf42b3020bbe7065ab079de8559f0a6a271f8b90c7dc1a72ba00aaed5e7e
+size 778341034

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/2_trainer_state.json ADDED Viewed

	@@ -0,0 +1,392 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 1.0,
+  "eval_steps": 500,
+  "global_step": 100,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.02,
+      "grad_norm": 0.42672601342201233,
+      "learning_rate": 2e-05,
+      "loss": 0.1273,
+      "step": 2
+    },
+    {
+      "epoch": 0.04,
+      "grad_norm": 3.3164169788360596,
+      "learning_rate": 2e-05,
+      "loss": 1.0253,
+      "step": 4
+    },
+    {
+      "epoch": 0.06,
+      "grad_norm": 1.0701144933700562,
+      "learning_rate": 2e-05,
+      "loss": 1.1081,
+      "step": 6
+    },
+    {
+      "epoch": 0.08,
+      "grad_norm": 3.5641934871673584,
+      "learning_rate": 2e-05,
+      "loss": 0.917,
+      "step": 8
+    },
+    {
+      "epoch": 0.1,
+      "grad_norm": 2.482414960861206,
+      "learning_rate": 2e-05,
+      "loss": 0.4307,
+      "step": 10
+    },
+    {
+      "epoch": 0.12,
+      "grad_norm": 3.699124336242676,
+      "learning_rate": 2e-05,
+      "loss": 1.2775,
+      "step": 12
+    },
+    {
+      "epoch": 0.14,
+      "grad_norm": 0.19477766752243042,
+      "learning_rate": 2e-05,
+      "loss": 0.2769,
+      "step": 14
+    },
+    {
+      "epoch": 0.16,
+      "grad_norm": 0.49098673462867737,
+      "learning_rate": 2e-05,
+      "loss": 0.227,
+      "step": 16
+    },
+    {
+      "epoch": 0.18,
+      "grad_norm": 4.419643402099609,
+      "learning_rate": 2e-05,
+      "loss": 0.6207,
+      "step": 18
+    },
+    {
+      "epoch": 0.2,
+      "grad_norm": 2.067509412765503,
+      "learning_rate": 2e-05,
+      "loss": 1.6495,
+      "step": 20
+    },
+    {
+      "epoch": 0.22,
+      "grad_norm": 0.7661958336830139,
+      "learning_rate": 2e-05,
+      "loss": 0.1506,
+      "step": 22
+    },
+    {
+      "epoch": 0.24,
+      "grad_norm": 4.098026752471924,
+      "learning_rate": 2e-05,
+      "loss": 0.6787,
+      "step": 24
+    },
+    {
+      "epoch": 0.26,
+      "grad_norm": 3.8598406314849854,
+      "learning_rate": 2e-05,
+      "loss": 1.2822,
+      "step": 26
+    },
+    {
+      "epoch": 0.28,
+      "grad_norm": 2.6059610843658447,
+      "learning_rate": 2e-05,
+      "loss": 0.4346,
+      "step": 28
+    },
+    {
+      "epoch": 0.3,
+      "grad_norm": 0.4412726163864136,
+      "learning_rate": 2e-05,
+      "loss": 0.2262,
+      "step": 30
+    },
+    {
+      "epoch": 0.32,
+      "grad_norm": 1.919790506362915,
+      "learning_rate": 2e-05,
+      "loss": 0.3238,
+      "step": 32
+    },
+    {
+      "epoch": 0.34,
+      "grad_norm": 2.1158552169799805,
+      "learning_rate": 2e-05,
+      "loss": 0.7178,
+      "step": 34
+    },
+    {
+      "epoch": 0.36,
+      "grad_norm": 1.9022879600524902,
+      "learning_rate": 2e-05,
+      "loss": 0.2602,
+      "step": 36
+    },
+    {
+      "epoch": 0.38,
+      "grad_norm": 1.8349590301513672,
+      "learning_rate": 2e-05,
+      "loss": 0.679,
+      "step": 38
+    },
+    {
+      "epoch": 0.4,
+      "grad_norm": 5.065424919128418,
+      "learning_rate": 2e-05,
+      "loss": 1.0498,
+      "step": 40
+    },
+    {
+      "epoch": 0.42,
+      "grad_norm": 2.6241636276245117,
+      "learning_rate": 2e-05,
+      "loss": 0.824,
+      "step": 42
+    },
+    {
+      "epoch": 0.44,
+      "grad_norm": 1.375793218612671,
+      "learning_rate": 2e-05,
+      "loss": 0.1406,
+      "step": 44
+    },
+    {
+      "epoch": 0.46,
+      "grad_norm": 4.631248950958252,
+      "learning_rate": 2e-05,
+      "loss": 0.9059,
+      "step": 46
+    },
+    {
+      "epoch": 0.48,
+      "grad_norm": 0.9230762124061584,
+      "learning_rate": 2e-05,
+      "loss": 0.3381,
+      "step": 48
+    },
+    {
+      "epoch": 0.5,
+      "grad_norm": 3.146935224533081,
+      "learning_rate": 2e-05,
+      "loss": 0.3658,
+      "step": 50
+    },
+    {
+      "epoch": 0.52,
+      "grad_norm": 1.643314242362976,
+      "learning_rate": 2e-05,
+      "loss": 0.4425,
+      "step": 52
+    },
+    {
+      "epoch": 0.54,
+      "grad_norm": 1.577388048171997,
+      "learning_rate": 2e-05,
+      "loss": 0.6525,
+      "step": 54
+    },
+    {
+      "epoch": 0.56,
+      "grad_norm": 1.5418776273727417,
+      "learning_rate": 2e-05,
+      "loss": 0.545,
+      "step": 56
+    },
+    {
+      "epoch": 0.58,
+      "grad_norm": 1.3298715353012085,
+      "learning_rate": 2e-05,
+      "loss": 0.2741,
+      "step": 58
+    },
+    {
+      "epoch": 0.6,
+      "grad_norm": 0.20194341242313385,
+      "learning_rate": 2e-05,
+      "loss": 0.5407,
+      "step": 60
+    },
+    {
+      "epoch": 0.62,
+      "grad_norm": 1.6116507053375244,
+      "learning_rate": 2e-05,
+      "loss": 0.6341,
+      "step": 62
+    },
+    {
+      "epoch": 0.64,
+      "grad_norm": 1.1075984239578247,
+      "learning_rate": 2e-05,
+      "loss": 0.5064,
+      "step": 64
+    },
+    {
+      "epoch": 0.66,
+      "grad_norm": 0.6221591234207153,
+      "learning_rate": 2e-05,
+      "loss": 0.2389,
+      "step": 66
+    },
+    {
+      "epoch": 0.68,
+      "grad_norm": 1.730831503868103,
+      "learning_rate": 2e-05,
+      "loss": 0.353,
+      "step": 68
+    },
+    {
+      "epoch": 0.7,
+      "grad_norm": 1.8647536039352417,
+      "learning_rate": 2e-05,
+      "loss": 0.9568,
+      "step": 70
+    },
+    {
+      "epoch": 0.72,
+      "grad_norm": 0.6666922569274902,
+      "learning_rate": 2e-05,
+      "loss": 0.9053,
+      "step": 72
+    },
+    {
+      "epoch": 0.74,
+      "grad_norm": 0.4998483657836914,
+      "learning_rate": 2e-05,
+      "loss": 0.0881,
+      "step": 74
+    },
+    {
+      "epoch": 0.76,
+      "grad_norm": 0.8337864279747009,
+      "learning_rate": 2e-05,
+      "loss": 0.3308,
+      "step": 76
+    },
+    {
+      "epoch": 0.78,
+      "grad_norm": 0.7664095759391785,
+      "learning_rate": 2e-05,
+      "loss": 0.144,
+      "step": 78
+    },
+    {
+      "epoch": 0.8,
+      "grad_norm": 3.212735176086426,
+      "learning_rate": 2e-05,
+      "loss": 0.9583,
+      "step": 80
+    },
+    {
+      "epoch": 0.82,
+      "grad_norm": 4.194940567016602,
+      "learning_rate": 2e-05,
+      "loss": 2.3249,
+      "step": 82
+    },
+    {
+      "epoch": 0.84,
+      "grad_norm": 0.21294273436069489,
+      "learning_rate": 2e-05,
+      "loss": 0.0391,
+      "step": 84
+    },
+    {
+      "epoch": 0.86,
+      "grad_norm": 1.9137557744979858,
+      "learning_rate": 2e-05,
+      "loss": 0.6782,
+      "step": 86
+    },
+    {
+      "epoch": 0.88,
+      "grad_norm": 1.2017444372177124,
+      "learning_rate": 2e-05,
+      "loss": 0.5466,
+      "step": 88
+    },
+    {
+      "epoch": 0.9,
+      "grad_norm": 3.704470157623291,
+      "learning_rate": 2e-05,
+      "loss": 1.9585,
+      "step": 90
+    },
+    {
+      "epoch": 0.92,
+      "grad_norm": 0.09351445734500885,
+      "learning_rate": 2e-05,
+      "loss": 0.1403,
+      "step": 92
+    },
+    {
+      "epoch": 0.94,
+      "grad_norm": 1.1362736225128174,
+      "learning_rate": 2e-05,
+      "loss": 0.4254,
+      "step": 94
+    },
+    {
+      "epoch": 0.96,
+      "grad_norm": 0.6755289435386658,
+      "learning_rate": 2e-05,
+      "loss": 0.2894,
+      "step": 96
+    },
+    {
+      "epoch": 0.98,
+      "grad_norm": 3.5850534439086914,
+      "learning_rate": 2e-05,
+      "loss": 1.7788,
+      "step": 98
+    },
+    {
+      "epoch": 1.0,
+      "grad_norm": 0.5499467849731445,
+      "learning_rate": 2e-05,
+      "loss": 0.16,
+      "step": 100
+    },
+    {
+      "epoch": 1.0,
+      "step": 100,
+      "total_flos": 5196654105853952.0,
+      "train_loss": 0.6389807415008545,
+      "train_runtime": 132.4801,
+      "train_samples_per_second": 3.019,
+      "train_steps_per_second": 0.755
+    }
+  ],
+  "logging_steps": 2,
+  "max_steps": 100,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 1,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": false,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 5196654105853952.0,
+  "train_batch_size": 1,
+  "trial_name": null,
+  "trial_params": null
+}

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/3_client_model_round10.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3137dc1711718282da550f4845cd36baab7c46bbf11b76105eef0fead3e874c1
+size 360880622

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/3_client_model_round12.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:defed3f7caba8d08a8444293265279252bac754f91960c09be90e83e3f42290f
+size 360880622

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/3_client_model_round15.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:10e379d1ddbbac4869c911e4aa2261e7e062f1759e7a20a5e7ffe738d3b4ece2
+size 360880622

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/3_client_model_round17.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:611b55b9aafd1b4e11c27bcf80a22e33756eef1bb1c1de102cf91676dd074463
+size 360880622

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/3_client_model_round2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5576200561a80efa43148ce2e7831d31afb0e4696dd074723a8f63eea37962a3
+size 360880106

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/3_client_model_round20.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e5b02587ad1dd9f38df651a6f97486fbd2a5654af5e637c8fcaba6350c37ba07
+size 360880622

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/3_client_model_round5.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:594714875d0223582d0341af340f41258ef6b01e6633ed2f1b31835f1fbcb28f
+size 360880106

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/3_client_model_round7.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9acc6f735922a0d67535d40544015c6d4cd1d2d4a9d1702e6bd5541a29358dce
+size 360880106

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/3_trainer_state.json ADDED Viewed

	@@ -0,0 +1,392 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 1.0,
+  "eval_steps": 500,
+  "global_step": 100,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.02,
+      "grad_norm": 11.701602935791016,
+      "learning_rate": 2e-05,
+      "loss": 3.2041,
+      "step": 2
+    },
+    {
+      "epoch": 0.04,
+      "grad_norm": 1.8877856731414795,
+      "learning_rate": 2e-05,
+      "loss": 0.8482,
+      "step": 4
+    },
+    {
+      "epoch": 0.06,
+      "grad_norm": 3.9416866302490234,
+      "learning_rate": 2e-05,
+      "loss": 0.9832,
+      "step": 6
+    },
+    {
+      "epoch": 0.08,
+      "grad_norm": 8.076401710510254,
+      "learning_rate": 2e-05,
+      "loss": 1.7619,
+      "step": 8
+    },
+    {
+      "epoch": 0.1,
+      "grad_norm": 9.02495288848877,
+      "learning_rate": 2e-05,
+      "loss": 1.1751,
+      "step": 10
+    },
+    {
+      "epoch": 0.12,
+      "grad_norm": 6.70341682434082,
+      "learning_rate": 2e-05,
+      "loss": 1.7742,
+      "step": 12
+    },
+    {
+      "epoch": 0.14,
+      "grad_norm": 9.935924530029297,
+      "learning_rate": 2e-05,
+      "loss": 2.1147,
+      "step": 14
+    },
+    {
+      "epoch": 0.16,
+      "grad_norm": 6.356525421142578,
+      "learning_rate": 2e-05,
+      "loss": 0.8387,
+      "step": 16
+    },
+    {
+      "epoch": 0.18,
+      "grad_norm": 4.266024112701416,
+      "learning_rate": 2e-05,
+      "loss": 0.4111,
+      "step": 18
+    },
+    {
+      "epoch": 0.2,
+      "grad_norm": 9.628840446472168,
+      "learning_rate": 2e-05,
+      "loss": 1.1686,
+      "step": 20
+    },
+    {
+      "epoch": 0.22,
+      "grad_norm": 6.305365562438965,
+      "learning_rate": 2e-05,
+      "loss": 0.5419,
+      "step": 22
+    },
+    {
+      "epoch": 0.24,
+      "grad_norm": 3.4979939460754395,
+      "learning_rate": 2e-05,
+      "loss": 1.4611,
+      "step": 24
+    },
+    {
+      "epoch": 0.26,
+      "grad_norm": 1.904814600944519,
+      "learning_rate": 2e-05,
+      "loss": 0.5461,
+      "step": 26
+    },
+    {
+      "epoch": 0.28,
+      "grad_norm": 5.557872772216797,
+      "learning_rate": 2e-05,
+      "loss": 0.4092,
+      "step": 28
+    },
+    {
+      "epoch": 0.3,
+      "grad_norm": 3.297398567199707,
+      "learning_rate": 2e-05,
+      "loss": 0.5477,
+      "step": 30
+    },
+    {
+      "epoch": 0.32,
+      "grad_norm": 14.574881553649902,
+      "learning_rate": 2e-05,
+      "loss": 1.0394,
+      "step": 32
+    },
+    {
+      "epoch": 0.34,
+      "grad_norm": 2.348663806915283,
+      "learning_rate": 2e-05,
+      "loss": 2.8679,
+      "step": 34
+    },
+    {
+      "epoch": 0.36,
+      "grad_norm": 8.440045356750488,
+      "learning_rate": 2e-05,
+      "loss": 2.2365,
+      "step": 36
+    },
+    {
+      "epoch": 0.38,
+      "grad_norm": 6.058783531188965,
+      "learning_rate": 2e-05,
+      "loss": 0.8523,
+      "step": 38
+    },
+    {
+      "epoch": 0.4,
+      "grad_norm": 5.3567728996276855,
+      "learning_rate": 2e-05,
+      "loss": 1.1006,
+      "step": 40
+    },
+    {
+      "epoch": 0.42,
+      "grad_norm": 15.160209655761719,
+      "learning_rate": 2e-05,
+      "loss": 1.5179,
+      "step": 42
+    },
+    {
+      "epoch": 0.44,
+      "grad_norm": 10.718804359436035,
+      "learning_rate": 2e-05,
+      "loss": 1.9688,
+      "step": 44
+    },
+    {
+      "epoch": 0.46,
+      "grad_norm": 3.9706368446350098,
+      "learning_rate": 2e-05,
+      "loss": 0.554,
+      "step": 46
+    },
+    {
+      "epoch": 0.48,
+      "grad_norm": 4.072225093841553,
+      "learning_rate": 2e-05,
+      "loss": 1.1259,
+      "step": 48
+    },
+    {
+      "epoch": 0.5,
+      "grad_norm": 4.832661151885986,
+      "learning_rate": 2e-05,
+      "loss": 1.2787,
+      "step": 50
+    },
+    {
+      "epoch": 0.52,
+      "grad_norm": 4.9963531494140625,
+      "learning_rate": 2e-05,
+      "loss": 2.5343,
+      "step": 52
+    },
+    {
+      "epoch": 0.54,
+      "grad_norm": 0.30591192841529846,
+      "learning_rate": 2e-05,
+      "loss": 0.7795,
+      "step": 54
+    },
+    {
+      "epoch": 0.56,
+      "grad_norm": 3.4619483947753906,
+      "learning_rate": 2e-05,
+      "loss": 0.957,
+      "step": 56
+    },
+    {
+      "epoch": 0.58,
+      "grad_norm": 1.5531309843063354,
+      "learning_rate": 2e-05,
+      "loss": 0.753,
+      "step": 58
+    },
+    {
+      "epoch": 0.6,
+      "grad_norm": 3.0114293098449707,
+      "learning_rate": 2e-05,
+      "loss": 1.3273,
+      "step": 60
+    },
+    {
+      "epoch": 0.62,
+      "grad_norm": 2.4710679054260254,
+      "learning_rate": 2e-05,
+      "loss": 0.9157,
+      "step": 62
+    },
+    {
+      "epoch": 0.64,
+      "grad_norm": 2.4386227130889893,
+      "learning_rate": 2e-05,
+      "loss": 1.0244,
+      "step": 64
+    },
+    {
+      "epoch": 0.66,
+      "grad_norm": 2.135855197906494,
+      "learning_rate": 2e-05,
+      "loss": 0.8826,
+      "step": 66
+    },
+    {
+      "epoch": 0.68,
+      "grad_norm": 2.907819986343384,
+      "learning_rate": 2e-05,
+      "loss": 1.173,
+      "step": 68
+    },
+    {
+      "epoch": 0.7,
+      "grad_norm": 2.032712459564209,
+      "learning_rate": 2e-05,
+      "loss": 0.9032,
+      "step": 70
+    },
+    {
+      "epoch": 0.72,
+      "grad_norm": 2.388005495071411,
+      "learning_rate": 2e-05,
+      "loss": 1.9712,
+      "step": 72
+    },
+    {
+      "epoch": 0.74,
+      "grad_norm": 3.9849488735198975,
+      "learning_rate": 2e-05,
+      "loss": 1.2745,
+      "step": 74
+    },
+    {
+      "epoch": 0.76,
+      "grad_norm": 7.177330493927002,
+      "learning_rate": 2e-05,
+      "loss": 1.5408,
+      "step": 76
+    },
+    {
+      "epoch": 0.78,
+      "grad_norm": 1.1500422954559326,
+      "learning_rate": 2e-05,
+      "loss": 0.589,
+      "step": 78
+    },
+    {
+      "epoch": 0.8,
+      "grad_norm": 3.8292155265808105,
+      "learning_rate": 2e-05,
+      "loss": 0.8088,
+      "step": 80
+    },
+    {
+      "epoch": 0.82,
+      "grad_norm": 0.9888606667518616,
+      "learning_rate": 2e-05,
+      "loss": 0.1827,
+      "step": 82
+    },
+    {
+      "epoch": 0.84,
+      "grad_norm": 2.494753122329712,
+      "learning_rate": 2e-05,
+      "loss": 1.0098,
+      "step": 84
+    },
+    {
+      "epoch": 0.86,
+      "grad_norm": 1.3061927556991577,
+      "learning_rate": 2e-05,
+      "loss": 1.1736,
+      "step": 86
+    },
+    {
+      "epoch": 0.88,
+      "grad_norm": 1.5556581020355225,
+      "learning_rate": 2e-05,
+      "loss": 0.6252,
+      "step": 88
+    },
+    {
+      "epoch": 0.9,
+      "grad_norm": 1.5772370100021362,
+      "learning_rate": 2e-05,
+      "loss": 0.7691,
+      "step": 90
+    },
+    {
+      "epoch": 0.92,
+      "grad_norm": 4.533968448638916,
+      "learning_rate": 2e-05,
+      "loss": 0.5719,
+      "step": 92
+    },
+    {
+      "epoch": 0.94,
+      "grad_norm": 2.4935195446014404,
+      "learning_rate": 2e-05,
+      "loss": 0.7637,
+      "step": 94
+    },
+    {
+      "epoch": 0.96,
+      "grad_norm": 2.4782304763793945,
+      "learning_rate": 2e-05,
+      "loss": 0.3888,
+      "step": 96
+    },
+    {
+      "epoch": 0.98,
+      "grad_norm": 2.847276210784912,
+      "learning_rate": 2e-05,
+      "loss": 1.1708,
+      "step": 98
+    },
+    {
+      "epoch": 1.0,
+      "grad_norm": 3.366889715194702,
+      "learning_rate": 2e-05,
+      "loss": 1.3215,
+      "step": 100
+    },
+    {
+      "epoch": 1.0,
+      "step": 100,
+      "total_flos": 2232466265866240.0,
+      "train_loss": 1.15478422164917,
+      "train_runtime": 72.3437,
+      "train_samples_per_second": 5.529,
+      "train_steps_per_second": 1.382
+    }
+  ],
+  "logging_steps": 2,
+  "max_steps": 100,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 1,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": false,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 2232466265866240.0,
+  "train_batch_size": 1,
+  "trial_name": null,
+  "trial_params": null
+}

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/4_client_model_round10.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:93f65beb7bbd25136510c6187fc11e9ca55eaedcabba3b14033692495c02899c
+size 778341886

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/4_client_model_round12.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:eaeba29721fb62a98ac7f919a031d53e300c961e5a7541ddce722693348166e5
+size 778341886

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/4_client_model_round15.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ec7698a9fcb5af2885504255c07c54acce127c28f1a81ddf7f9850673e0719ef
+size 778341886

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/4_client_model_round17.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7d090f3e1e20b1615cc8945e72b93472544277b7189ef83362446f27ba8a0c30
+size 778341886

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/4_client_model_round2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:591958c16e67ee2f5bf6f1fd0f51c4455c7585e8e45468af114daff5756e3268
+size 778341034

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/4_client_model_round20.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f300b973c4d938700cfca9fae9a52cf471ee38d054e0060f6d88b1dc551cfa20
+size 778341886

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/4_client_model_round5.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1db0a6df166d5e9f5df8f18244a5ccc530772bebf1d2da9d366e863e05f2618d
+size 778341034

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/4_client_model_round7.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f8104378821d6474f3a6c351716ffb4f1db29be362a71d37564a8be300b60419
+size 778341034

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/4_trainer_state.json ADDED Viewed

	@@ -0,0 +1,392 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 1.0,
+  "eval_steps": 500,
+  "global_step": 100,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.02,
+      "grad_norm": 0.5440601110458374,
+      "learning_rate": 2e-05,
+      "loss": 0.3859,
+      "step": 2
+    },
+    {
+      "epoch": 0.04,
+      "grad_norm": 2.486060380935669,
+      "learning_rate": 2e-05,
+      "loss": 0.8744,
+      "step": 4
+    },
+    {
+      "epoch": 0.06,
+      "grad_norm": 1.5172414779663086,
+      "learning_rate": 2e-05,
+      "loss": 1.0364,
+      "step": 6
+    },
+    {
+      "epoch": 0.08,
+      "grad_norm": 1.87302565574646,
+      "learning_rate": 2e-05,
+      "loss": 0.6833,
+      "step": 8
+    },
+    {
+      "epoch": 0.1,
+      "grad_norm": 1.2508922815322876,
+      "learning_rate": 2e-05,
+      "loss": 0.5988,
+      "step": 10
+    },
+    {
+      "epoch": 0.12,
+      "grad_norm": 2.049877643585205,
+      "learning_rate": 2e-05,
+      "loss": 0.2546,
+      "step": 12
+    },
+    {
+      "epoch": 0.14,
+      "grad_norm": 3.000075101852417,
+      "learning_rate": 2e-05,
+      "loss": 1.0645,
+      "step": 14
+    },
+    {
+      "epoch": 0.16,
+      "grad_norm": 4.159180641174316,
+      "learning_rate": 2e-05,
+      "loss": 1.0189,
+      "step": 16
+    },
+    {
+      "epoch": 0.18,
+      "grad_norm": 1.9412723779678345,
+      "learning_rate": 2e-05,
+      "loss": 0.5621,
+      "step": 18
+    },
+    {
+      "epoch": 0.2,
+      "grad_norm": 2.991361141204834,
+      "learning_rate": 2e-05,
+      "loss": 0.406,
+      "step": 20
+    },
+    {
+      "epoch": 0.22,
+      "grad_norm": 1.989998698234558,
+      "learning_rate": 2e-05,
+      "loss": 2.1827,
+      "step": 22
+    },
+    {
+      "epoch": 0.24,
+      "grad_norm": 1.5404460430145264,
+      "learning_rate": 2e-05,
+      "loss": 0.9485,
+      "step": 24
+    },
+    {
+      "epoch": 0.26,
+      "grad_norm": 1.243625521659851,
+      "learning_rate": 2e-05,
+      "loss": 0.4014,
+      "step": 26
+    },
+    {
+      "epoch": 0.28,
+      "grad_norm": 2.017669200897217,
+      "learning_rate": 2e-05,
+      "loss": 1.1306,
+      "step": 28
+    },
+    {
+      "epoch": 0.3,
+      "grad_norm": 2.773820638656616,
+      "learning_rate": 2e-05,
+      "loss": 0.9518,
+      "step": 30
+    },
+    {
+      "epoch": 0.32,
+      "grad_norm": 3.3499462604522705,
+      "learning_rate": 2e-05,
+      "loss": 0.8406,
+      "step": 32
+    },
+    {
+      "epoch": 0.34,
+      "grad_norm": 1.1517057418823242,
+      "learning_rate": 2e-05,
+      "loss": 0.5119,
+      "step": 34
+    },
+    {
+      "epoch": 0.36,
+      "grad_norm": 3.779822826385498,
+      "learning_rate": 2e-05,
+      "loss": 1.2535,
+      "step": 36
+    },
+    {
+      "epoch": 0.38,
+      "grad_norm": 1.4071242809295654,
+      "learning_rate": 2e-05,
+      "loss": 0.6125,
+      "step": 38
+    },
+    {
+      "epoch": 0.4,
+      "grad_norm": 2.478247880935669,
+      "learning_rate": 2e-05,
+      "loss": 1.1099,
+      "step": 40
+    },
+    {
+      "epoch": 0.42,
+      "grad_norm": 2.338315725326538,
+      "learning_rate": 2e-05,
+      "loss": 1.0911,
+      "step": 42
+    },
+    {
+      "epoch": 0.44,
+      "grad_norm": 1.6824209690093994,
+      "learning_rate": 2e-05,
+      "loss": 0.7209,
+      "step": 44
+    },
+    {
+      "epoch": 0.46,
+      "grad_norm": 3.2349324226379395,
+      "learning_rate": 2e-05,
+      "loss": 0.9425,
+      "step": 46
+    },
+    {
+      "epoch": 0.48,
+      "grad_norm": 2.572331666946411,
+      "learning_rate": 2e-05,
+      "loss": 0.6688,
+      "step": 48
+    },
+    {
+      "epoch": 0.5,
+      "grad_norm": 2.569999933242798,
+      "learning_rate": 2e-05,
+      "loss": 0.6548,
+      "step": 50
+    },
+    {
+      "epoch": 0.52,
+      "grad_norm": 0.5937522053718567,
+      "learning_rate": 2e-05,
+      "loss": 1.0816,
+      "step": 52
+    },
+    {
+      "epoch": 0.54,
+      "grad_norm": 0.9653764367103577,
+      "learning_rate": 2e-05,
+      "loss": 0.4465,
+      "step": 54
+    },
+    {
+      "epoch": 0.56,
+      "grad_norm": 0.6579816937446594,
+      "learning_rate": 2e-05,
+      "loss": 0.2058,
+      "step": 56
+    },
+    {
+      "epoch": 0.58,
+      "grad_norm": 1.3638180494308472,
+      "learning_rate": 2e-05,
+      "loss": 0.7284,
+      "step": 58
+    },
+    {
+      "epoch": 0.6,
+      "grad_norm": 1.4289367198944092,
+      "learning_rate": 2e-05,
+      "loss": 0.8351,
+      "step": 60
+    },
+    {
+      "epoch": 0.62,
+      "grad_norm": 0.7946614027023315,
+      "learning_rate": 2e-05,
+      "loss": 0.6298,
+      "step": 62
+    },
+    {
+      "epoch": 0.64,
+      "grad_norm": 1.661765694618225,
+      "learning_rate": 2e-05,
+      "loss": 0.8354,
+      "step": 64
+    },
+    {
+      "epoch": 0.66,
+      "grad_norm": 2.3677399158477783,
+      "learning_rate": 2e-05,
+      "loss": 1.0779,
+      "step": 66
+    },
+    {
+      "epoch": 0.68,
+      "grad_norm": 0.8689314723014832,
+      "learning_rate": 2e-05,
+      "loss": 0.532,
+      "step": 68
+    },
+    {
+      "epoch": 0.7,
+      "grad_norm": 1.7545336484909058,
+      "learning_rate": 2e-05,
+      "loss": 0.8644,
+      "step": 70
+    },
+    {
+      "epoch": 0.72,
+      "grad_norm": 1.1046079397201538,
+      "learning_rate": 2e-05,
+      "loss": 0.4699,
+      "step": 72
+    },
+    {
+      "epoch": 0.74,
+      "grad_norm": 0.21095605194568634,
+      "learning_rate": 2e-05,
+      "loss": 0.593,
+      "step": 74
+    },
+    {
+      "epoch": 0.76,
+      "grad_norm": 1.4656115770339966,
+      "learning_rate": 2e-05,
+      "loss": 1.3938,
+      "step": 76
+    },
+    {
+      "epoch": 0.78,
+      "grad_norm": 1.224704384803772,
+      "learning_rate": 2e-05,
+      "loss": 0.7324,
+      "step": 78
+    },
+    {
+      "epoch": 0.8,
+      "grad_norm": 1.486828088760376,
+      "learning_rate": 2e-05,
+      "loss": 0.5396,
+      "step": 80
+    },
+    {
+      "epoch": 0.82,
+      "grad_norm": 0.9084728956222534,
+      "learning_rate": 2e-05,
+      "loss": 0.554,
+      "step": 82
+    },
+    {
+      "epoch": 0.84,
+      "grad_norm": 0.9191360473632812,
+      "learning_rate": 2e-05,
+      "loss": 0.6183,
+      "step": 84
+    },
+    {
+      "epoch": 0.86,
+      "grad_norm": 0.7869934439659119,
+      "learning_rate": 2e-05,
+      "loss": 0.3396,
+      "step": 86
+    },
+    {
+      "epoch": 0.88,
+      "grad_norm": 0.42631539702415466,
+      "learning_rate": 2e-05,
+      "loss": 0.401,
+      "step": 88
+    },
+    {
+      "epoch": 0.9,
+      "grad_norm": 1.4716026782989502,
+      "learning_rate": 2e-05,
+      "loss": 0.8724,
+      "step": 90
+    },
+    {
+      "epoch": 0.92,
+      "grad_norm": 1.6058681011199951,
+      "learning_rate": 2e-05,
+      "loss": 0.5681,
+      "step": 92
+    },
+    {
+      "epoch": 0.94,
+      "grad_norm": 1.3189148902893066,
+      "learning_rate": 2e-05,
+      "loss": 0.7323,
+      "step": 94
+    },
+    {
+      "epoch": 0.96,
+      "grad_norm": 0.9830902814865112,
+      "learning_rate": 2e-05,
+      "loss": 0.6886,
+      "step": 96
+    },
+    {
+      "epoch": 0.98,
+      "grad_norm": 0.8136429190635681,
+      "learning_rate": 2e-05,
+      "loss": 0.2411,
+      "step": 98
+    },
+    {
+      "epoch": 1.0,
+      "grad_norm": 3.1793293952941895,
+      "learning_rate": 2e-05,
+      "loss": 1.0366,
+      "step": 100
+    },
+    {
+      "epoch": 1.0,
+      "step": 100,
+      "total_flos": 6021565481222144.0,
+      "train_loss": 0.7584884357452393,
+      "train_runtime": 150.4749,
+      "train_samples_per_second": 2.658,
+      "train_steps_per_second": 0.665
+    }
+  ],
+  "logging_steps": 2,
+  "max_steps": 100,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 1,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": false,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 6021565481222144.0,
+  "train_batch_size": 1,
+  "trial_name": null,
+  "trial_params": null
+}

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/5_client_model_round10.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0b224a628b3734d5758dbf6796aed6dd04a1b1d0d81b99063131a5f87f032729
+size 778341886

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/5_client_model_round12.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:aa0b171c9c908292b73b092761beef17fde357b8526a9689a4c1a431bef82d5b
+size 778341886

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/5_client_model_round15.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ef71ba45a93d892d931909dd81bac80459da02b0bf561f2c594f640c6c01992a
+size 778341886

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/5_client_model_round17.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:78b990fbebb884361e12c185520abbd6ce9ae62e5e4f4903c4863f11b8a265cc
+size 778341886

client_states_feddpa_bs4_saveoptim_lr2e-5_5e-5_sc315_4tasks_5rounds_fixitr100_T0125_decay099/5_client_model_round2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cc9b6db8edd59dbbd02b347056aa744f332dd711a32e98dd04fd3259d4cf4c56
+size 778341034