Spaces:

saiteja-coder
/

email-triage-env-final

Sleeping

Update env.py

f75feca verified about 1 month ago

228 Bytes

	def step(self, action):
	reward = 0.1 # base reward (avoid 0)

	if action["label"] == self.current["label"]:
	reward += 0.4

	if action["reply"] == self.current["reply"]:
	reward += 0.4

	return reward