Upload LoRA adapters

Browse files

Files changed (15) hide show

.gitattributes +1 -0
adapters/adapter_config.json +45 -0
adapters/adapters.safetensors +3 -0
adapters/train_config.yaml +17 -0
adapters/wandb/debug-internal.log +11 -0
adapters/wandb/debug.log +21 -0
adapters/wandb/run-20260203_224646-so9y0g75/files/config.yaml +120 -0
adapters/wandb/run-20260203_224646-so9y0g75/files/output.log +13 -0
adapters/wandb/run-20260203_224646-so9y0g75/files/requirements.txt +102 -0
adapters/wandb/run-20260203_224646-so9y0g75/files/wandb-metadata.json +43 -0
adapters/wandb/run-20260203_224646-so9y0g75/files/wandb-summary.json +1 -0
adapters/wandb/run-20260203_224646-so9y0g75/logs/debug-core.log +15 -0
adapters/wandb/run-20260203_224646-so9y0g75/logs/debug-internal.log +11 -0
adapters/wandb/run-20260203_224646-so9y0g75/logs/debug.log +21 -0
adapters/wandb/run-20260203_224646-so9y0g75/run-so9y0g75.wandb +3 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+adapters/wandb/run-20260203_224646-so9y0g75/run-so9y0g75.wandb filter=lfs diff=lfs merge=lfs -text

adapters/adapter_config.json ADDED Viewed

	@@ -0,0 +1,45 @@

+{
+    "adapter_path": "adapters_mlx",
+    "batch_size": 2,
+    "config": "adapters_mlx/train_config.yaml",
+    "data": "data/processed",
+    "fine_tune_type": "lora",
+    "grad_accumulation_steps": 1,
+    "grad_checkpoint": true,
+    "iters": 20,
+    "learning_rate": 1e-05,
+    "lora": {
+        "alpha": 16,
+        "dropout": 0.0,
+        "r": 16
+    },
+    "lora_parameters": {
+        "rank": 8,
+        "dropout": 0.0,
+        "scale": 20.0
+    },
+    "lr_schedule": null,
+    "mask_prompt": false,
+    "max_seq_length": 2048,
+    "model": "mlx-community/Qwen2.5-14B-Instruct-4bit",
+    "num_layers": 16,
+    "optimizer": "adam",
+    "optimizer_config": {
+        "adam": {},
+        "adamw": {},
+        "muon": {},
+        "sgd": {},
+        "adafactor": {}
+    },
+    "project_name": "planus-llm",
+    "report_to": "wandb",
+    "resume_adapter_file": null,
+    "save_every": 100,
+    "seed": 3407,
+    "steps_per_eval": 100,
+    "steps_per_report": 10,
+    "test": false,
+    "test_batches": 500,
+    "train": true,
+    "val_batches": 25
+}

adapters/adapters.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e78777f05e602bc21b4c87430df0e83c3304c734ca04dca85f9d94d36f2f08c0
+size 45899454

adapters/train_config.yaml ADDED Viewed

	@@ -0,0 +1,17 @@

+adapter_path: adapters_mlx
+batch_size: 2
+data: data/processed
+grad_checkpoint: true
+iters: 20
+learning_rate: 1.0e-05
+lora:
+  alpha: 16
+  dropout: 0.0
+  r: 16
+max_seq_length: 2048
+model: mlx-community/Qwen2.5-14B-Instruct-4bit
+save_every: 100
+seed: 3407
+steps_per_eval: 100
+train: true
+val_batches: 25

adapters/wandb/debug-internal.log ADDED Viewed

	@@ -0,0 +1,11 @@

+{"time":"2026-02-03T22:46:46.649174-03:00","level":"INFO","msg":"stream: starting","core version":"0.24.1"}
+{"time":"2026-02-03T22:46:46.978134-03:00","level":"INFO","msg":"stream: created new stream","id":"so9y0g75"}
+{"time":"2026-02-03T22:46:46.978191-03:00","level":"INFO","msg":"handler: started","stream_id":"so9y0g75"}
+{"time":"2026-02-03T22:46:46.978488-03:00","level":"INFO","msg":"stream: started","id":"so9y0g75"}
+{"time":"2026-02-03T22:46:46.978504-03:00","level":"INFO","msg":"writer: started","stream_id":"so9y0g75"}
+{"time":"2026-02-03T22:46:46.978504-03:00","level":"INFO","msg":"sender: started","stream_id":"so9y0g75"}
+{"time":"2026-02-03T23:05:33.65201-03:00","level":"INFO","msg":"stream: closing","id":"so9y0g75"}
+{"time":"2026-02-03T23:05:35.080416-03:00","level":"INFO","msg":"fileTransfer: Close: file transfer manager closed"}
+{"time":"2026-02-03T23:05:35.538389-03:00","level":"INFO","msg":"handler: closed","stream_id":"so9y0g75"}
+{"time":"2026-02-03T23:05:35.538562-03:00","level":"INFO","msg":"sender: closed","stream_id":"so9y0g75"}
+{"time":"2026-02-03T23:05:35.538598-03:00","level":"INFO","msg":"stream: closed","id":"so9y0g75"}

adapters/wandb/debug.log ADDED Viewed

	@@ -0,0 +1,21 @@

+2026-02-03 22:46:46,390 INFO    MainThread:48222 [wandb_setup.py:_flush():81] Current SDK version is 0.24.1
+2026-02-03 22:46:46,390 INFO    MainThread:48222 [wandb_setup.py:_flush():81] Configure stats pid to 48222
+2026-02-03 22:46:46,390 INFO    MainThread:48222 [wandb_setup.py:_flush():81] Loading settings from environment variables
+2026-02-03 22:46:46,390 INFO    MainThread:48222 [wandb_init.py:setup_run_log_directory():717] Logging user logs to adapters_mlx/wandb/run-20260203_224646-so9y0g75/logs/debug.log
+2026-02-03 22:46:46,390 INFO    MainThread:48222 [wandb_init.py:setup_run_log_directory():718] Logging internal logs to adapters_mlx/wandb/run-20260203_224646-so9y0g75/logs/debug-internal.log
+2026-02-03 22:46:46,390 INFO    MainThread:48222 [wandb_init.py:init():844] calling init triggers
+2026-02-03 22:46:46,390 INFO    MainThread:48222 [wandb_init.py:init():849] wandb.init called with sweep_config: {}
+config: {'model': 'mlx-community/Qwen2.5-14B-Instruct-4bit', 'train': True, 'data': 'data/processed', 'fine_tune_type': 'lora', 'optimizer': 'adam', 'mask_prompt': False, 'num_layers': 16, 'batch_size': 2, 'iters': 20, 'val_batches': 25, 'learning_rate': 1e-05, 'steps_per_report': 10, 'steps_per_eval': 100, 'grad_accumulation_steps': 1, 'resume_adapter_file': None, 'adapter_path': 'adapters_mlx', 'save_every': 100, 'test': False, 'test_batches': 500, 'max_seq_length': 2048, 'config': 'adapters_mlx/train_config.yaml', 'grad_checkpoint': True, 'report_to': 'wandb', 'project_name': 'planus-llm', 'seed': 3407, 'lora': {'alpha': 16, 'dropout': 0.0, 'r': 16}, 'optimizer_config': {'adam': {}, 'adamw': {}, 'muon': {}, 'sgd': {}, 'adafactor': {}}, 'lr_schedule': None, 'lora_parameters': {'rank': 8, 'dropout': 0.0, 'scale': 20.0}, '_wandb': {}}
+2026-02-03 22:46:46,390 INFO    MainThread:48222 [wandb_init.py:init():892] starting backend
+2026-02-03 22:46:46,636 INFO    MainThread:48222 [wandb_init.py:init():895] sending inform_init request
+2026-02-03 22:46:46,648 INFO    MainThread:48222 [wandb_init.py:init():903] backend started and connected
+2026-02-03 22:46:46,650 INFO    MainThread:48222 [wandb_init.py:init():973] updated telemetry
+2026-02-03 22:46:46,667 INFO    MainThread:48222 [wandb_init.py:init():997] communicating run to backend with 90.0 second timeout
+2026-02-03 22:46:47,484 INFO    MainThread:48222 [wandb_init.py:init():1042] starting run threads in backend
+2026-02-03 22:46:47,538 INFO    MainThread:48222 [wandb_run.py:_console_start():2529] atexit reg
+2026-02-03 22:46:47,538 INFO    MainThread:48222 [wandb_run.py:_redirect():2377] redirect: wrap_raw
+2026-02-03 22:46:47,538 INFO    MainThread:48222 [wandb_run.py:_redirect():2446] Wrapping output streams.
+2026-02-03 22:46:47,538 INFO    MainThread:48222 [wandb_run.py:_redirect():2469] Redirects installed.
+2026-02-03 22:46:47,540 INFO    MainThread:48222 [wandb_init.py:init():1082] run started, returning control to user process
+2026-02-03 23:05:33,649 INFO    wandb-AsyncioManager-main:48222 [service_client.py:_forward_responses():94] Reached EOF.
+2026-02-03 23:05:33,650 INFO    wandb-AsyncioManager-main:48222 [mailbox.py:close():154] Closing mailbox, abandoning 1 handles.

adapters/wandb/run-20260203_224646-so9y0g75/files/config.yaml ADDED Viewed

	@@ -0,0 +1,120 @@

+_wandb:
+    value:
+        cli_version: 0.24.1
+        e:
+            9wwcluo2ck30v81k0w3kns8xd71az26r:
+                apple:
+                    ecpuCores: 2
+                    gpuCores: 32
+                    memoryGb: 32
+                    name: Apple M1 Max
+                    pcpuCores: 8
+                    ramTotalBytes: "34359738368"
+                    swapTotalBytes: "5368709120"
+                args:
+                    - --config
+                    - adapters_mlx/train_config.yaml
+                    - --report-to
+                    - wandb
+                    - --project-name
+                    - planus-llm
+                cpu_count: 10
+                cpu_count_logical: 10
+                disk:
+                    /:
+                        total: "994662584320"
+                        used: "867762769920"
+                email: planuze@gmail.com
+                executable: /Users/rezende/Desktop/Planuze/planuze-llm/.venv/bin/python
+                git:
+                    commit: 2180d8de1a20f6becde1d28262c43677022a9fbb
+                    remote: https://github.com/Sr-Igor/planuze-llm.git
+                host: Igors-MacBook-Pro.local
+                memory:
+                    total: "34359738368"
+                os: macOS-15.6-arm64-arm-64bit
+                program: -m mlx_lm.lora
+                python: CPython 3.9.6
+                root: adapters_mlx
+                startedAt: "2026-02-04T01:46:46.387687Z"
+                writerId: 9wwcluo2ck30v81k0w3kns8xd71az26r
+        m: []
+        python_version: 3.9.6
+        t:
+            "1":
+                - 11
+                - 49
+            "2":
+                - 11
+                - 49
+            "3":
+                - 13
+                - 16
+                - 61
+            "4": 3.9.6
+            "5": 0.24.1
+            "6": 4.57.6
+            "12": 0.24.1
+            "13": darwin-arm64
+adapter_path:
+    value: adapters_mlx
+batch_size:
+    value: 2
+config:
+    value: adapters_mlx/train_config.yaml
+data:
+    value: data/processed
+fine_tune_type:
+    value: lora
+grad_accumulation_steps:
+    value: 1
+grad_checkpoint:
+    value: true
+iters:
+    value: 20
+learning_rate:
+    value: 1e-05
+lora:
+    value:
+        alpha: 16
+        dropout: 0
+        r: 16
+lora_parameters:
+    value:
+        dropout: 0
+        rank: 8
+        scale: 20
+lr_schedule:
+    value: null
+mask_prompt:
+    value: false
+max_seq_length:
+    value: 2048
+model:
+    value: mlx-community/Qwen2.5-14B-Instruct-4bit
+num_layers:
+    value: 16
+optimizer:
+    value: adam
+project_name:
+    value: planus-llm
+report_to:
+    value: wandb
+resume_adapter_file:
+    value: null
+save_every:
+    value: 100
+seed:
+    value: 3407
+steps_per_eval:
+    value: 100
+steps_per_report:
+    value: 10
+test:
+    value: false
+test_batches:
+    value: 500
+train:
+    value: true
+val_batches:
+    value: 25

adapters/wandb/run-20260203_224646-so9y0g75/files/output.log ADDED Viewed

	@@ -0,0 +1,13 @@

+Loading pretrained model
+Fetching 10 files: 100%|██████████| 10/10 [00:00<00:00, 28493.91it/s]
+Loading datasets
+Training
+Trainable parameters: 0.078% (11.469M/14770.034M)
+Starting training..., iters: 20
+Calculating loss...: 100%|██████████| 22/22 [04:57<00:00, 13.51s/it]
+Iter 1: Val loss 1.780, Val took 297.162s
+Iter 10: Train loss 1.393, Learning Rate 1.000e-05, It/sec 0.041, Tokens/sec 133.910, Trained Tokens 32580, Peak mem 15.545 GB
+Calculating loss...: 100%|██████████| 22/22 [05:26<00:00, 14.85s/it]
+Iter 20: Val loss 0.170, Val took 326.722s
+Iter 20: Train loss 0.430, Learning Rate 1.000e-05, It/sec 0.039, Tokens/sec 125.126, Trained Tokens 64586, Peak mem 15.545 GB
+Saved final weights to adapters_mlx/adapters.safetensors.

adapters/wandb/run-20260203_224646-so9y0g75/files/requirements.txt ADDED Viewed

	@@ -0,0 +1,102 @@

+anyio==4.12.1
+cint==1.0.0
+groq==1.0.0
+kaitaistruct==0.11
+anthropic==0.77.1
+mlx-metal==0.29.3
+threadpoolctl==3.6.0
+docstring_parser==0.17.0
+async-timeout==5.0.1
+requests==2.32.5
+aiohttp==3.13.3
+intervaltree==3.2.1
+exceptiongroup==1.3.1
+multidict==6.7.1
+pyarrow==21.0.0
+polyfile-weave==0.5.9
+diskcache==5.6.3
+tzdata==2025.3
+rich==14.3.2
+pytz==2025.2
+scipy==1.13.1
+sentry-sdk==2.51.0
+certifi==2026.1.4
+urllib3==1.26.20
+platformdirs==4.4.0
+pydantic==2.12.5
+pypdf==6.6.2
+datasets==4.5.0
+propcache==0.4.1
+mlx-lm==0.29.1
+wandb==0.24.1
+protobuf==6.33.5
+python-dotenv==1.2.1
+tenacity==9.1.2
+markdown-it-py==3.0.0
+filelock==3.19.1
+ruff==0.15.0
+idna==3.11
+openai==2.16.0
+scikit-learn==1.6.1
+click==8.1.8
+httpcore==1.0.9
+rpds-py==0.27.1
+numpy==2.0.2
+fsspec==2025.10.0
+stdlib-list==0.11.1
+charset-normalizer==3.4.4
+graphql-core==3.2.7
+eval_type_backport==0.3.1
+referencing==0.36.2
+h11==0.16.0
+gitdb==4.0.12
+sniffio==1.3.1
+sentencepiece==0.2.1
+regex==2026.1.15
+mdurl==0.1.2
+python-dateutil==2.9.0.post0
+PyYAML==6.0.3
+mlx==0.29.3
+sortedcontainers==2.4.0
+abnf==2.2.0
+multiprocess==0.70.18
+transformers==4.57.6
+chardet==5.2.0
+pydantic_core==2.41.5
+frozenlist==1.8.0
+typing_extensions==4.15.0
+aiosignal==1.4.0
+joblib==1.5.3
+huggingface_hub==0.36.1
+hf-xet==1.2.0
+Jinja2==3.1.6
+fickling==0.1.7
+pandas==2.3.3
+jiter==0.13.0
+MarkupSafe==3.0.3
+dill==0.4.0
+distro==1.9.0
+GitPython==3.1.46
+graphviz==0.21
+Pygments==2.19.2
+aiohappyeyeballs==2.6.1
+ollama==0.6.1
+attrs==25.4.0
+requests-toolbelt==1.0.0
+networkx==3.2.1
+packaging==26.0
+httpx==0.28.1
+smmap==5.0.2
+tqdm==4.67.3
+pillow==11.3.0
+backoff==2.2.1
+safetensors==0.7.0
+tokenizers==0.22.2
+psutil==7.2.2
+typing-inspection==0.4.2
+annotated-types==0.7.0
+setuptools==58.0.4
+six==1.17.0
+yarl==1.22.0
+xxhash==3.6.0
+pip==26.0

adapters/wandb/run-20260203_224646-so9y0g75/files/wandb-metadata.json ADDED Viewed

	@@ -0,0 +1,43 @@

+{
+  "os":  "macOS-15.6-arm64-arm-64bit",
+  "python":  "CPython 3.9.6",
+  "startedAt":  "2026-02-04T01:46:46.387687Z",
+  "args":  [
+    "--config",
+    "adapters_mlx/train_config.yaml",
+    "--report-to",
+    "wandb",
+    "--project-name",
+    "planus-llm"
+  ],
+  "program":  "-m mlx_lm.lora",
+  "git":  {
+    "remote":  "https://github.com/Sr-Igor/planuze-llm.git",
+    "commit":  "2180d8de1a20f6becde1d28262c43677022a9fbb"
+  },
+  "email":  "planuze@gmail.com",
+  "root":  "adapters_mlx",
+  "host":  "Igors-MacBook-Pro.local",
+  "executable":  "/Users/rezende/Desktop/Planuze/planuze-llm/.venv/bin/python",
+  "cpu_count":  10,
+  "cpu_count_logical":  10,
+  "disk":  {
+    "/":  {
+      "total":  "994662584320",
+      "used":  "867762769920"
+    }
+  },
+  "memory":  {
+    "total":  "34359738368"
+  },
+  "apple":  {
+    "name":  "Apple M1 Max",
+    "ecpuCores":  2,
+    "pcpuCores":  8,
+    "gpuCores":  32,
+    "memoryGb":  32,
+    "swapTotalBytes":  "5368709120",
+    "ramTotalBytes":  "34359738368"
+  },
+  "writerId":  "9wwcluo2ck30v81k0w3kns8xd71az26r"
+}

adapters/wandb/run-20260203_224646-so9y0g75/files/wandb-summary.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"learning_rate":9.999999747378752e-06,"iterations_per_second":0.039094455657632525,"_wandb":{"runtime":1126},"_timestamp":1.770170733439965e+09,"train_loss":0.429797887802124,"trained_tokens":64586,"iteration":20,"peak_memory":15.544893248,"_runtime":1126.162495084,"val_time":326.7221642909999,"tokens_per_second":125.12571477781867,"_step":20,"val_loss":0.16993679106235504}

adapters/wandb/run-20260203_224646-so9y0g75/logs/debug-core.log ADDED Viewed

	@@ -0,0 +1,15 @@

+{"time":"2026-02-03T22:46:46.441996-03:00","level":"INFO","msg":"main: starting server","port-filename":"/var/folders/k1/wm7466x54kj00f5pydt0yc0h0000gn/T/tmpnp1tq4le/port-48222.txt","pid":48222,"log-level":0,"disable-analytics":false,"shutdown-on-parent-exit":false,"enable-dcgm-profiling":false}
+{"time":"2026-02-03T22:46:46.44254-03:00","level":"INFO","msg":"server: will exit if parent process dies","ppid":48222}
+{"time":"2026-02-03T22:46:46.442511-03:00","level":"INFO","msg":"server: accepting connections","addr":{"Name":"/var/folders/k1/wm7466x54kj00f5pydt0yc0h0000gn/T/wandb-48222-48231-4091335480/socket","Net":"unix"}}
+{"time":"2026-02-03T22:46:46.635222-03:00","level":"INFO","msg":"connection: ManageConnectionData: new connection created","id":"1"}
+{"time":"2026-02-03T22:46:46.649041-03:00","level":"INFO","msg":"handleInformInit: received","streamId":"so9y0g75","id":"1"}
+{"time":"2026-02-03T22:46:46.978502-03:00","level":"INFO","msg":"handleInformInit: stream started","streamId":"so9y0g75","id":"1"}
+{"time":"2026-02-03T22:46:52.540246-03:00","level":"INFO","msg":"connection: cancelling request","id":"1","requestId":"x28rnn36al4u"}
+{"time":"2026-02-03T23:05:33.651135-03:00","level":"INFO","msg":"handleInformTeardown: server teardown initiated","id":"1"}
+{"time":"2026-02-03T23:05:33.651572-03:00","level":"INFO","msg":"server is shutting down"}
+{"time":"2026-02-03T23:05:33.651559-03:00","level":"INFO","msg":"connection: closing","id":"1"}
+{"time":"2026-02-03T23:05:33.651839-03:00","level":"INFO","msg":"connection: closed successfully","id":"1"}
+{"time":"2026-02-03T23:05:33.652386-03:00","level":"INFO","msg":"server: listener closed","addr":{"Name":"/var/folders/k1/wm7466x54kj00f5pydt0yc0h0000gn/T/wandb-48222-48231-4091335480/socket","Net":"unix"}}
+{"time":"2026-02-03T23:05:35.543824-03:00","level":"INFO","msg":"handleInformTeardown: server shutdown complete","id":"1"}
+{"time":"2026-02-03T23:05:35.543884-03:00","level":"INFO","msg":"connection: ManageConnectionData: connection closed","id":"1"}
+{"time":"2026-02-03T23:05:35.544193-03:00","level":"INFO","msg":"server is closed"}

adapters/wandb/run-20260203_224646-so9y0g75/logs/debug-internal.log ADDED Viewed

	@@ -0,0 +1,11 @@

+{"time":"2026-02-03T22:46:46.649174-03:00","level":"INFO","msg":"stream: starting","core version":"0.24.1"}
+{"time":"2026-02-03T22:46:46.978134-03:00","level":"INFO","msg":"stream: created new stream","id":"so9y0g75"}
+{"time":"2026-02-03T22:46:46.978191-03:00","level":"INFO","msg":"handler: started","stream_id":"so9y0g75"}
+{"time":"2026-02-03T22:46:46.978488-03:00","level":"INFO","msg":"stream: started","id":"so9y0g75"}
+{"time":"2026-02-03T22:46:46.978504-03:00","level":"INFO","msg":"writer: started","stream_id":"so9y0g75"}
+{"time":"2026-02-03T22:46:46.978504-03:00","level":"INFO","msg":"sender: started","stream_id":"so9y0g75"}
+{"time":"2026-02-03T23:05:33.65201-03:00","level":"INFO","msg":"stream: closing","id":"so9y0g75"}
+{"time":"2026-02-03T23:05:35.080416-03:00","level":"INFO","msg":"fileTransfer: Close: file transfer manager closed"}
+{"time":"2026-02-03T23:05:35.538389-03:00","level":"INFO","msg":"handler: closed","stream_id":"so9y0g75"}
+{"time":"2026-02-03T23:05:35.538562-03:00","level":"INFO","msg":"sender: closed","stream_id":"so9y0g75"}
+{"time":"2026-02-03T23:05:35.538598-03:00","level":"INFO","msg":"stream: closed","id":"so9y0g75"}

adapters/wandb/run-20260203_224646-so9y0g75/logs/debug.log ADDED Viewed

	@@ -0,0 +1,21 @@

+2026-02-03 22:46:46,390 INFO    MainThread:48222 [wandb_setup.py:_flush():81] Current SDK version is 0.24.1
+2026-02-03 22:46:46,390 INFO    MainThread:48222 [wandb_setup.py:_flush():81] Configure stats pid to 48222
+2026-02-03 22:46:46,390 INFO    MainThread:48222 [wandb_setup.py:_flush():81] Loading settings from environment variables
+2026-02-03 22:46:46,390 INFO    MainThread:48222 [wandb_init.py:setup_run_log_directory():717] Logging user logs to adapters_mlx/wandb/run-20260203_224646-so9y0g75/logs/debug.log
+2026-02-03 22:46:46,390 INFO    MainThread:48222 [wandb_init.py:setup_run_log_directory():718] Logging internal logs to adapters_mlx/wandb/run-20260203_224646-so9y0g75/logs/debug-internal.log
+2026-02-03 22:46:46,390 INFO    MainThread:48222 [wandb_init.py:init():844] calling init triggers
+2026-02-03 22:46:46,390 INFO    MainThread:48222 [wandb_init.py:init():849] wandb.init called with sweep_config: {}
+config: {'model': 'mlx-community/Qwen2.5-14B-Instruct-4bit', 'train': True, 'data': 'data/processed', 'fine_tune_type': 'lora', 'optimizer': 'adam', 'mask_prompt': False, 'num_layers': 16, 'batch_size': 2, 'iters': 20, 'val_batches': 25, 'learning_rate': 1e-05, 'steps_per_report': 10, 'steps_per_eval': 100, 'grad_accumulation_steps': 1, 'resume_adapter_file': None, 'adapter_path': 'adapters_mlx', 'save_every': 100, 'test': False, 'test_batches': 500, 'max_seq_length': 2048, 'config': 'adapters_mlx/train_config.yaml', 'grad_checkpoint': True, 'report_to': 'wandb', 'project_name': 'planus-llm', 'seed': 3407, 'lora': {'alpha': 16, 'dropout': 0.0, 'r': 16}, 'optimizer_config': {'adam': {}, 'adamw': {}, 'muon': {}, 'sgd': {}, 'adafactor': {}}, 'lr_schedule': None, 'lora_parameters': {'rank': 8, 'dropout': 0.0, 'scale': 20.0}, '_wandb': {}}
+2026-02-03 22:46:46,390 INFO    MainThread:48222 [wandb_init.py:init():892] starting backend
+2026-02-03 22:46:46,636 INFO    MainThread:48222 [wandb_init.py:init():895] sending inform_init request
+2026-02-03 22:46:46,648 INFO    MainThread:48222 [wandb_init.py:init():903] backend started and connected
+2026-02-03 22:46:46,650 INFO    MainThread:48222 [wandb_init.py:init():973] updated telemetry
+2026-02-03 22:46:46,667 INFO    MainThread:48222 [wandb_init.py:init():997] communicating run to backend with 90.0 second timeout
+2026-02-03 22:46:47,484 INFO    MainThread:48222 [wandb_init.py:init():1042] starting run threads in backend
+2026-02-03 22:46:47,538 INFO    MainThread:48222 [wandb_run.py:_console_start():2529] atexit reg
+2026-02-03 22:46:47,538 INFO    MainThread:48222 [wandb_run.py:_redirect():2377] redirect: wrap_raw
+2026-02-03 22:46:47,538 INFO    MainThread:48222 [wandb_run.py:_redirect():2446] Wrapping output streams.
+2026-02-03 22:46:47,538 INFO    MainThread:48222 [wandb_run.py:_redirect():2469] Redirects installed.
+2026-02-03 22:46:47,540 INFO    MainThread:48222 [wandb_init.py:init():1082] run started, returning control to user process
+2026-02-03 23:05:33,649 INFO    wandb-AsyncioManager-main:48222 [service_client.py:_forward_responses():94] Reached EOF.
+2026-02-03 23:05:33,650 INFO    wandb-AsyncioManager-main:48222 [mailbox.py:close():154] Closing mailbox, abandoning 1 handles.

adapters/wandb/run-20260203_224646-so9y0g75/run-so9y0g75.wandb ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:717e62690fdece0fd8978bd029896c9ae156d1c0d63a5256e104f64d9b77f708
+size 110846