Pierizvi
/

infused-reasoning-phi2

Text Generation

reinforcement-learning

mathematical-reasoning

Model card Files Files and versions

infused-reasoning-phi2 / training_info.json

Pierizvi's picture

epoch-639

c9d92fa verified 11 months ago

history blame contribute delete

91 Bytes

	{
	"step": 639,
	"best_reward": 1.008333444595337,
	"timestamp": "2025-05-06 19:35:56"
	}