Spaces:

Sanj12
/

curato

Sleeping

curato / src /tagger.py

Upload 14 files

5e90518 verified 8 months ago

1.03 kB

	from transformers import CLIPProcessor, CLIPModel
	from PIL import Image
	import torch

	# Load model + processor
	model = CLIPModel.from_pretrained("openai/clip-vit-base-patch32")
	processor = CLIPProcessor.from_pretrained("openai/clip-vit-base-patch32")

	# Candidate tags
	CANDIDATE_TAGS = [
	"portrait", "landscape", "abstract", "surreal", "dark", "bright",
	"melancholy", "joyful", "blue tones", "warm colors", "minimalist", "detailed"
	]

	def generate_tags(image_path):
	image = Image.open(image_path).convert("RGB")
	inputs = processor(text=CANDIDATE_TAGS, images=image, return_tensors="pt", padding=True)
	outputs = model(**inputs)

	logits_per_image = outputs.logits_per_image
	probs = logits_per_image.softmax(dim=1)

	top_probs, indices = probs.topk(5)
	tags = [CANDIDATE_TAGS[i] for i in indices[0]]

	return tags

	def generate_caption(image_path):
	# Placeholder caption - replace this with real captioning logic
	return "This is a placeholder caption."