sigmoidneuron123
/

NeoChess

Reinforcement Learning

ChessAI-Community

Model card Files Files and versions

sigmoidneuron123 commited on Jul 29, 2025

Commit

b18f040

·

verified ·

1 Parent(s): 272f597

Update selfchess.py

Files changed (1) hide show

selfchess.py +6 -3

selfchess.py CHANGED Viewed

@@ -16,7 +16,7 @@ CONFIG = {
     "num_games": 3000,
     "stockfish_time_limit": 1.0,
     "search_depth": 1,
-    "epsilon": 0.2
 }
 device = CONFIG["device"]
@@ -157,8 +157,11 @@ def game_gen(engine_side):
             keys = list(evaling.keys())
             logits = torch.tensor(list(evaling.values())).to(device)
             probs = torch.softmax(logits,dim=0)
-            idx = torch.multinomial(probs,num_samples=1)
-            move = keys[idx]
         else:
             result = engine.play(board, lim)
             move = result.move

     "num_games": 3000,
     "stockfish_time_limit": 1.0,
     "search_depth": 1,
+    "epsilon": 4
 }
 device = CONFIG["device"]
             keys = list(evaling.keys())
             logits = torch.tensor(list(evaling.values())).to(device)
             probs = torch.softmax(logits,dim=0)
+            bests = torch.multinomial(probs,num_samples=CONFIG["epsilon"])
+            bestl = []
+            for idx in bests:
+                bestl += [logits[idx].item()]
+            move = keys[torch.argmax(bestl).item()]
         else:
             result = engine.play(board, lim)
             move = result.move