convaiinnovations
/

flux-test-time-training

Reinforcement Learning

test-time-training

dynamic-adapters

flux-architecture

Model card Files Files and versions

convaiinnovations commited on 28 days ago

Commit

8b2e77d

·

verified ·

1 Parent(s): 17ba477

Upload continuous_learning_session.py

Files changed (1) hide show

continuous_learning_session.py +12 -2

continuous_learning_session.py CHANGED Viewed

@@ -181,7 +181,7 @@ class ContinuousLearningSession:
             # max_length=Config.MAX_LENGTH, # Removed as per diff
             do_sample=True,
             temperature=0.7, # Changed from 0.6 to 0.7
-            repetition_penalty=1.2, # Prevent "India. India. India." loops
             pad_token_id=self.model.tokenizer.eos_token_id
         )
@@ -237,10 +237,20 @@ class ContinuousLearningSession:
                 current_q = line.split(":", 1)[1].strip()
             elif line.startswith("A") and ":" in line and current_q:
                 current_a = line.split(":", 1)[1].strip()
-                variations.append({"q": current_q, "a": current_a})
                 current_q = None
         print(f"   ✨ Generated {len(variations)-1} synthetic variations.")
         return variations
     def learn(self, user_input: str, correct_answer: str, concept_id: str = "general"):

             # max_length=Config.MAX_LENGTH, # Removed as per diff
             do_sample=True,
             temperature=0.7, # Changed from 0.6 to 0.7
+            repetition_penalty=1.0, # Reset to default (was 1.2) to fix silence
             pad_token_id=self.model.tokenizer.eos_token_id
         )
                 current_q = line.split(":", 1)[1].strip()
             elif line.startswith("A") and ":" in line and current_q:
                 current_a = line.split(":", 1)[1].strip()
+                # Validation: Ensure neither Q nor A is empty
+                if current_q and current_a:
+                    variations.append({"q": current_q, "a": current_a})
                 current_q = None
+        # Fallback: If synthetic generation failed, duplicate original
+        if len(variations) == 1:
+             print("   ⚠️ Synthetic generation failed to produce valid format. Duplicating original.")
+             variations.append({"q": question, "a": answer})
         print(f"   ✨ Generated {len(variations)-1} synthetic variations.")
+        for i, v in enumerate(variations):
+            print(f"      [{i}] Q: {v['q'][:30]}... A: {v['a'][:30]}...")
         return variations
     def learn(self, user_input: str, correct_answer: str, concept_id: str = "general"):