Soon_Merger_Toolkit

Sleeping

App Files Files Community

AlekseyCalvin commited on Jan 4

Commit

50b030f

verified ·

1 Parent(s): db16e05

Update app.py

Browse files

Files changed (1) hide show

app.py +11 -25

app.py CHANGED Viewed

@@ -661,9 +661,6 @@ def task_mergekit_weighted(hf_token, models_text, method, dtype, base_model, wei
     except Exception as e:
         return f"Error: {e}"
-# =================================================================================
-# TAB 6: INTERPOLATION (Slerp, Task Arithmetic)
-# =================================================================================
 def task_mergekit_interp(hf_token, model_a, model_b, base_model, method, t_val, dtype, out_repo, private):
     cleanup_temp()
@@ -721,10 +718,6 @@ def task_mergekit_interp(hf_token, model_a, model_b, base_model, method, t_val,
     except Exception as e:
         return f"Error: {e}"
-# =================================================================================
-# TAB 7: MOE (Mixture of Experts)
-# =================================================================================
 def task_mergekit_moe(hf_token, base_model, experts_text, gate_mode, dtype, out_repo, private):
     cleanup_temp()
     if not hf_token: return "Error: Token required"
@@ -785,10 +778,6 @@ def task_raw_merge(hf_token, models_text, method, dtype, out_repo, private):
     except Exception as e:
         return f"Error: {e}"
-# =================================================================================
-# TAB 9: DARE SOONR (Custom Python Implementation)
-# =================================================================================
 def task_dare_soonr(hf_token, base_model, ft_model, ratio, mask_rate, out_repo, private):
     # Ported from the requested DARE-MERGE-SOONR implementation
     cleanup_temp()
@@ -866,8 +855,7 @@ with gr.Blocks() as demo:
     gr.Markdown("# 🧰Training-Free CPU-run Model Creation Toolkit")
     with gr.Tabs():
-        # --- ORIGINAL TABS 1-4 (PRESERVED EXACTLY) ---
-        with gr.Tab("Merge to Base Model + Reshard Output"):
             with gr.Row():
                 t1_token = gr.Textbox(label="Token", type="password")
             with gr.Row():
@@ -939,11 +927,9 @@ with gr.Blocks() as demo:
             t4_btn = gr.Button("Resize")
             t4_res = gr.Textbox(label="Result")
             t4_btn.click(task_resize, [t4_token, t4_in, t4_rank, t4_method, t4_param, t4_out], t4_res)
-        # --- NEW TABS (5-9) USING CLI & IN-LINED LOGIC ---
-        with gr.Tab("Tab 5: Weighted & Sparsified"):
-            gr.Markdown("### Linear, Ties, Dare-Ties, Model Stock")
             t5_token = gr.Textbox(label="HF Token", type="password")
             with gr.Row():
                 t5_method = gr.Dropdown(["linear", "ties", "dare_ties", "dare_linear", "model_stock"], value="linear", label="Method")
@@ -961,7 +947,7 @@ with gr.Blocks() as demo:
             t5_res = gr.Textbox(label="Result")
             t5_btn.click(task_mergekit_weighted, [t5_token, t5_models, t5_method, t5_dtype, t5_base, t5_weights, t5_density, t5_norm, t5_out, t5_priv], t5_res)
-        with gr.Tab("Tab 6: Interpolation"):
             gr.Markdown("### Slerp, Task Arithmetic, NuSlerp")
             t6_token = gr.Textbox(label="HF Token", type="password")
             with gr.Row():
@@ -978,7 +964,7 @@ with gr.Blocks() as demo:
             t6_res = gr.Textbox(label="Result")
             t6_btn.click(task_mergekit_interp, [t6_token, t6_model_a, t6_model_b, t6_base, t6_method, t6_t, t6_dtype, t6_out, t6_priv], t6_res)
-        with gr.Tab("Tab 7: MoE"):
             gr.Markdown("### Mixture of Experts Construction")
             t7_token = gr.Textbox(label="HF Token", type="password")
             t7_base = gr.Textbox(label="Base Model")
@@ -992,20 +978,20 @@ with gr.Blocks() as demo:
             t7_res = gr.Textbox(label="Result")
             t7_btn.click(task_mergekit_moe, [t7_token, t7_base, t7_experts, t7_gate, t7_dtype, t7_out, t7_priv], t7_res)
-        with gr.Tab("Tab 8: Raw PyTorch"):
-            gr.Markdown("### Non-Transformer / Raw Weights")
             t8_token = gr.Textbox(label="HF Token", type="password")
             t8_models = gr.TextArea(label="Models (one per line)")
             t8_method = gr.Dropdown(["linear", "passthrough"], value="linear", label="Method")
-            t8_dtype = gr.Dropdown(["float32", "float16", "bfloat16"], value="float32", label="Dtype")
             t8_out = gr.Textbox(label="Output Repo")
             t8_priv = gr.Checkbox(label="Private", value=True)
-            t8_btn = gr.Button("Merge Raw (CLI)")
             t8_res = gr.Textbox(label="Result")
             t8_btn.click(task_raw_merge, [t8_token, t8_models, t8_method, t8_dtype, t8_out, t8_priv], t8_res)
-        with gr.Tab("Tab 9: DARE SOONR (Custom)"):
-            gr.Markdown("### Custom DARE Implementation (No MergeKit)")
             t9_token = gr.Textbox(label="HF Token", type="password")
             with gr.Row():
                 t9_base = gr.Textbox(label="Base Model")

     except Exception as e:
         return f"Error: {e}"
 def task_mergekit_interp(hf_token, model_a, model_b, base_model, method, t_val, dtype, out_repo, private):
     cleanup_temp()
     except Exception as e:
         return f"Error: {e}"
 def task_mergekit_moe(hf_token, base_model, experts_text, gate_mode, dtype, out_repo, private):
     cleanup_temp()
     if not hf_token: return "Error: Token required"
     except Exception as e:
         return f"Error: {e}"
 def task_dare_soonr(hf_token, base_model, ft_model, ratio, mask_rate, out_repo, private):
     # Ported from the requested DARE-MERGE-SOONR implementation
     cleanup_temp()
     gr.Markdown("# 🧰Training-Free CPU-run Model Creation Toolkit")
     with gr.Tabs():
+        with gr.Tab("Merge into Base Model"):
             with gr.Row():
                 t1_token = gr.Textbox(label="Token", type="password")
             with gr.Row():
             t4_btn = gr.Button("Resize")
             t4_res = gr.Textbox(label="Result")
             t4_btn.click(task_resize, [t4_token, t4_in, t4_rank, t4_method, t4_param, t4_out], t4_res)
+        with gr.Tab("Stir/Tie Bases"):
+            gr.Markdown("### Linear, TIES, dare-TIES, Model Stock")
             t5_token = gr.Textbox(label="HF Token", type="password")
             with gr.Row():
                 t5_method = gr.Dropdown(["linear", "ties", "dare_ties", "dare_linear", "model_stock"], value="linear", label="Method")
             t5_res = gr.Textbox(label="Result")
             t5_btn.click(task_mergekit_weighted, [t5_token, t5_models, t5_method, t5_dtype, t5_base, t5_weights, t5_density, t5_norm, t5_out, t5_priv], t5_res)
+        with gr.Tab("Amphinterpolative"):
             gr.Markdown("### Slerp, Task Arithmetic, NuSlerp")
             t6_token = gr.Textbox(label="HF Token", type="password")
             with gr.Row():
             t6_res = gr.Textbox(label="Result")
             t6_btn.click(task_mergekit_interp, [t6_token, t6_model_a, t6_model_b, t6_base, t6_method, t6_t, t6_dtype, t6_out, t6_priv], t6_res)
+        with gr.Tab("MoEr"):
             gr.Markdown("### Mixture of Experts Construction")
             t7_token = gr.Textbox(label="HF Token", type="password")
             t7_base = gr.Textbox(label="Base Model")
             t7_res = gr.Textbox(label="Result")
             t7_btn.click(task_mergekit_moe, [t7_token, t7_base, t7_experts, t7_gate, t7_dtype, t7_out, t7_priv], t7_res)
+        with gr.Tab("Rawer"):
+            gr.Markdown("### Raw PyTorch MergeKit / Non-pipeline-classed")
             t8_token = gr.Textbox(label="HF Token", type="password")
             t8_models = gr.TextArea(label="Models (one per line)")
             t8_method = gr.Dropdown(["linear", "passthrough"], value="linear", label="Method")
+            t8_dtype = gr.Dropdown(["float32", "float16", "bfloat16"], value="float32", label="dtype")
             t8_out = gr.Textbox(label="Output Repo")
             t8_priv = gr.Checkbox(label="Private", value=True)
+            t8_btn = gr.Button("Merge")
             t8_res = gr.Textbox(label="Result")
             t8_btn.click(task_raw_merge, [t8_token, t8_models, t8_method, t8_dtype, t8_out, t8_priv], t8_res)
+        with gr.Tab("Mario,DARE!"):
+            gr.Markdown("### From sft-merger by [Martyn Garcia](https://github.com/martyn)")
             t9_token = gr.Textbox(label="HF Token", type="password")
             with gr.Row():
                 t9_base = gr.Textbox(label="Base Model")