Kiss Mihaly commited on
Commit
e14e2f0
·
verified ·
1 Parent(s): 13076ef

Upload folder using huggingface_hub

Browse files
Files changed (3) hide show
  1. Sokoban-A2C-CNN.zip +3 -0
  2. Sokoban-A2C-CNN2.zip +3 -0
  3. agent.py +33 -0
Sokoban-A2C-CNN.zip ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:857cab92fca1ad4e7b8d22d0cff7ea32e42cfce8788eeb8c4dc661f0543e0d3a
3
+ size 15274916
Sokoban-A2C-CNN2.zip ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:39ea55b4446af9e93d09b417efbfc55cecf0fae88d4908905ba46f8d8703e782
3
+ size 15275609
agent.py ADDED
@@ -0,0 +1,33 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ from stable_baselines3 import PPO
2
+ from sokoban_gym.wrappers.observation import ImageObservationWrapper
3
+
4
+ class Agent:
5
+ """
6
+ A kötelező programként beadandó ágens leírása.
7
+ """
8
+
9
+ def __init__(self, env) -> None:
10
+ """
11
+ A konsztruktorban van lehetőség például a modell betöltésére
12
+ vagy a környezet wrapper-ekkel való kiterjesztésére.
13
+ """
14
+
15
+ self.model = PPO.load("agent/Sokoban-A2C-CNN")
16
+
17
+ # A környezetet kiterjeszthetjük wrapper-ek segítségével.
18
+ # Ha tanításkor modosítottuk a megfigyeléseket,
19
+ # akkor azt a módosítást kiértékeléskor is meg kell adnunk.
20
+ self.observation_wrapper = ImageObservationWrapper(env)
21
+
22
+ def act(self, observation):
23
+ """
24
+ A megfigyelés alapján visszaadja a következő lépést.
25
+ Ez a függvény fogja megadni az ágens működését.
26
+ """
27
+
28
+ # Ha tanításkor modosítottuk a megfigyeléseket,
29
+ # akkor azt a módosítást kiértékeléskor is meg kell adnunk.
30
+ extended_obsetvation = self.observation_wrapper.observation(observation)
31
+
32
+ return self.model.predict(extended_obsetvation, deterministic=True)
33
+