G01_Computer_Vision_Vision-Language_App

Sleeping

Upload 5 files

73d7797 verified about 1 year ago

489 Bytes

	from transformers import AutoProcessor, BlipForConditionalGeneration

	caption_id = "Salesforce/blip-image-captioning-base"
	caption_model = BlipForConditionalGeneration.from_pretrained(caption_id)
	caption_processor = AutoProcessor.from_pretrained(caption_id)

	def image_captioning(image):
	inputs = caption_processor(image, "a photograph of", return_tensors="pt")
	out = caption_model.generate(**inputs)
	return caption_processor.decode(out[0], skip_special_tokens=True)