natmin322
/

Continual

Model card Files Files and versions

Continual / improve_gainlora /src

Commit History

v11

657ef85

natmin322 commited on Mar 30

rls t5 large

9f858c3

natmin322 commited on Mar 28

rls t5 large

2c4cffd

natmin322 commited on Mar 28

rls

f666767

natmin322 commited on Mar 28

rls

7517d8c

natmin322 commited on Mar 28

rls

9be56eb

natmin322 commited on Mar 27

new v3

9de5c3c

natmin322 commited on Mar 27

new v2

bd400be

natmin322 commited on Mar 26

v10a

a555ead

natmin322 commited on Mar 25

v10a

ddb0466

natmin322 commited on Mar 24

v10a

2200936

natmin322 commited on Mar 24

v10a

f90d880

natmin322 commited on Mar 24

v10a

454979d

natmin322 commited on Mar 24

v10a

5e23c54

natmin322 commited on Mar 24

v10a

f4e252d

natmin322 commited on Mar 24

V10a

6ebc983

natmin322 commited on Mar 24

V10

6a66a76

natmin322 commited on Mar 24

v10

17127c5

natmin322 commited on Mar 24

v10

60ae8d5

natmin322 commited on Mar 24

v10

d6f2636

natmin322 commited on Mar 24

v10

a3a510d

natmin322 commited on Mar 24

v10

dbf9735

natmin322 commited on Mar 23

v10

3c81e8e

natmin322 commited on Mar 23

v9-fix: oracle training routing, calibrated inference, update docs

5a14212

natmin322 commited on Mar 23

v9

7cb06b4

natmin322 commited on Mar 23

v8

2d2ef83

natmin322 commited on Mar 22

v7

bc95dae

natmin322 commited on Mar 22

v7

acc4df8

natmin322 commited on Mar 21

v7: C5 Data-Informed Subspace Init + restructure contributions to 2 core claims

aeb2d78

natmin322 commited on Mar 21

v5

a4f8971

natmin322 commited on Mar 20

v5

9d05f4a

natmin322 commited on Mar 19

fix: reduce CPU RAM to prevent OOM SIGKILL - gc.collect, del temps, eval_accumulation_steps, cache cleanup

c03ffe2

natmin322 commited on Mar 18

fix: add trust_remote_code=True to second load_dataset call in run_llama.py

e9acf77

natmin322 commited on Mar 18

dataset: allow custom dataset code by setting trust_remote_code=True in run_llama.py

55f7d25

natmin322 commited on Mar 18

C4: Spectrally-Conditioned LoRA Training — preconditioned gradient + spectral entropy regularization

2d42b51

natmin322 commited on Mar 17

SpecRoute V3: adaptive bias, symmetric inference, threshold 0.995, batch size optimization

9ea634d

natmin322 commited on Mar 17

fixbug

6a35c4d

natmin322 commited on Mar 16

fixbug

64fec92

natmin322 commited on Mar 16

fix llama

99e2af7

natmin322 commited on Mar 16

improve v2

aca5a60

natmin322 commited on Mar 16

fix bug

0aeac35

natmin322 commited on Mar 15

fix bug

9dc2b5d

natmin322 commited on Mar 15

v2

8b682f9

natmin322 commited on Mar 14

v2

d1be546

natmin322 commited on Mar 14

fix: pass attention_mask directly to model.generate(), not via GenerationConfig

915a112

natmin322 commited on Mar 12

fix: override _save to disable safetensors for T5 shared embedding weights

bb4c9d9

natmin322 commited on Mar 12

fix: denumpify_detensorize moved to trainer_utils in transformers 4.40+

a57a027

natmin322 commited on Mar 12

fix: add explicit trainer_pt_utils imports (nested_truncate etc.) removed from trainer.* in 4.40+

e4e078c

natmin322 commited on Mar 12

fix: comprehensive transformers 4.40 compat across all trainer files

2e720a9

natmin322 commited on Mar 12

fix: replace removed _pad_across_processes with accelerator API

164f658

natmin322 commited on Mar 12