convaiinnovations
/

flux-test-time-training

Reinforcement Learning

test-time-training

dynamic-adapters

flux-architecture

Model card Files Files and versions

convaiinnovations commited on Feb 2

Commit

e91b2cb

·

verified ·

1 Parent(s): efaf053

Upload interactive_inference.py

Files changed (1) hide show

interactive_inference.py +14 -6

interactive_inference.py CHANGED Viewed

@@ -65,7 +65,10 @@ def interactive_session():
             # We enable modulation to see the effect of the trained controller
             # The controller predicts modulation based on the input prompt
-            inputs = model.tokenizer(user_input, return_tensors="pt").to(device)
             with torch.no_grad():
                 # 1. Predict Modulation
@@ -78,17 +81,22 @@ def interactive_session():
                     **inputs,
                     max_new_tokens=128,
                     do_sample=True,
-                    temperature=0.7,
-                    repetition_penalty=1.1,
                     pad_token_id=model.tokenizer.eos_token_id
                 )
                 model.clear_modulation()
             response = model.tokenizer.decode(out_ids[0], skip_special_tokens=True)
-            # Strip prompt if included (Gemma usually includes it)
-            if response.startswith(user_input):
-                response = response[len(user_input):].strip()
             print(f"MODEL: {response}")
             print(f"   [Modulation Norm: {torch.norm(modulation).item():.2f}]")

             # We enable modulation to see the effect of the trained controller
             # The controller predicts modulation based on the input prompt
+            # Format the prompt to match training distribution
+            prompt = f"User: {user_input}\nModel: "
+            inputs = model.tokenizer(prompt, return_tensors="pt").to(device)
             with torch.no_grad():
                 # 1. Predict Modulation
                     **inputs,
                     max_new_tokens=128,
                     do_sample=True,
+                    temperature=0.6,
+                    top_p=0.9,
+                    repetition_penalty=1.2,
                     pad_token_id=model.tokenizer.eos_token_id
                 )
                 model.clear_modulation()
             response = model.tokenizer.decode(out_ids[0], skip_special_tokens=True)
+            # Clean up response (Remove the prompt part)
+            if response.startswith(prompt):
+                response = response[len(prompt):].strip()
+            elif "Model:" in response:
+                response = response.split("Model:")[-1].strip()
             print(f"MODEL: {response}")
             print(f"   [Modulation Norm: {torch.norm(modulation).item():.2f}]")