natmin322
/

Continual

Model card Files Files and versions

Commit History

v11

657ef85

natmin322 commited on Mar 30

rls t5 large

9f858c3

natmin322 commited on Mar 28

rls t5 large

2c4cffd

natmin322 commited on Mar 28

rls

f666767

natmin322 commited on Mar 28

rls

7517d8c

natmin322 commited on Mar 28

rls

9be56eb

natmin322 commited on Mar 27

new v3

9de5c3c

natmin322 commited on Mar 27

new v2

bd400be

natmin322 commited on Mar 26

v10a

a555ead

natmin322 commited on Mar 25

v10a

ddb0466

natmin322 commited on Mar 24

v10a

2200936

natmin322 commited on Mar 24

v10a

f90d880

natmin322 commited on Mar 24

v10a

454979d

natmin322 commited on Mar 24

v10a

5e23c54

natmin322 commited on Mar 24

v10a

f4e252d

natmin322 commited on Mar 24

v10a

3443fa9

natmin322 commited on Mar 24

V10a

6ebc983

natmin322 commited on Mar 24

V10

6a66a76

natmin322 commited on Mar 24

v10

17127c5

natmin322 commited on Mar 24

v10

60ae8d5

natmin322 commited on Mar 24

v10

d6f2636

natmin322 commited on Mar 24

v10

a3a510d

natmin322 commited on Mar 24

v10

dbf9735

natmin322 commited on Mar 23

v10

3c81e8e

natmin322 commited on Mar 23

v9

6c25d90

natmin322 commited on Mar 23

v9-fix: oracle training routing, calibrated inference, update docs

5a14212

natmin322 commited on Mar 23

v9

7cb06b4

natmin322 commited on Mar 23

v8

2d2ef83

natmin322 commited on Mar 22

v7

bc95dae

natmin322 commited on Mar 22

v7-fix: enable C5 for task 2+ (add --run_single False, --n_batches_c5 100)

060b67d

natmin322 commited on Mar 22

v7

b569de3

natmin322 commited on Mar 21

v7

acc4df8

natmin322 commited on Mar 21

v7: C5 Data-Informed Subspace Init + restructure contributions to 2 core claims

aeb2d78

natmin322 commited on Mar 21

v7

2dea138

natmin322 commited on Mar 20

v5

a4f8971

natmin322 commited on Mar 20

v5

9d05f4a

natmin322 commited on Mar 19

fix: reduce CPU RAM to prevent OOM SIGKILL - gc.collect, del temps, eval_accumulation_steps, cache cleanup

c03ffe2

natmin322 commited on Mar 18

Revert "fix: reduce OOM in V2 script - fp16+gradient_ckpt for T4, EVAL_BSZ 128->32"

46044f0

natmin322 commited on Mar 18

fix: reduce OOM in V2 script - fp16+gradient_ckpt for T4, EVAL_BSZ 128->32

33d5e3a

natmin322 commited on Mar 18

fix: add trust_remote_code=True to second load_dataset call in run_llama.py

e9acf77

natmin322 commited on Mar 18

dataset: allow custom dataset code by setting trust_remote_code=True in run_llama.py

55f7d25

natmin322 commited on Mar 18

C4: Spectrally-Conditioned LoRA Training — preconditioned gradient + spectral entropy regularization

2d42b51

natmin322 commited on Mar 17

SpecRoute V3: adaptive bias, symmetric inference, threshold 0.995, batch size optimization

9ea634d

natmin322 commited on Mar 17

fix: eval_strategy epoch (was steps=10, causing 437 evals/task → Kaggle session kill)

dd291ef

natmin322 commited on Mar 16

fixbug

6a35c4d

natmin322 commited on Mar 16

fixbug

64fec92

natmin322 commited on Mar 16

fixbug

cc6f149

natmin322 commited on Mar 16

fixbug

69f9c93

natmin322 commited on Mar 16

fix llama

1c30686

natmin322 commited on Mar 16

fix llama

99e2af7

natmin322 commited on Mar 16