Spaces:

benzweijia
/

Adv-GRPO_DINO

Sleeping

Adv-GRPO_DINO / adv_grpo /imagereward_scorer.py

Upload 61 files

9294bc7 verified about 1 month ago

1.12 kB

	from transformers import AutoProcessor, AutoModel
	from PIL import Image
	import torch
	import ImageReward as RM

	class ImageRewardScorer(torch.nn.Module):
	def __init__(self, device="cuda", dtype=torch.float32):
	super().__init__()
	self.model_path = "ImageReward-v1.0"
	self.device = device
	self.dtype = dtype
	self.model = RM.load(self.model_path, device=device).eval().to(dtype=dtype)
	self.model.requires_grad_(False)

	@torch.no_grad()
	def __call__(self, prompts, images):
	rewards = []
	for prompt,image in zip(prompts, images):
	_, reward = self.model.inference_rank(prompt, [image])
	rewards.append(reward)
	return rewards

	# Usage example
	def main():
	scorer = ImageRewardScorer(
	device="cuda",
	dtype=torch.float32
	)

	images=[
	"astronaut.jpg",
	]
	pil_images = [Image.open(img) for img in images]
	prompts=[
	'A astronaut’s glove floating in zero-g with "NASA 2049" on the wrist',
	]
	print(scorer(prompts, pil_images))

	if __name__ == "__main__":
	main()