lsnu
/

VLAarchTestsBench

Model card Files Files and versions

VLAarchTestsBench / third_party /3d_flowmatch_actor /modeling /encoder /text /clip.py

lsnu's picture

Add files using upload-large-folder tool

5ce8761 verified about 2 months ago

history blame contribute delete

751 Bytes

	import torch
	from torch import nn
	import transformers


	class ClipTokenizer:

	def __init__(self):
	super().__init__()
	self.tokenizer = transformers.CLIPTokenizer.from_pretrained(
	"openai/clip-vit-base-patch32"
	)

	@torch.inference_mode()
	def __call__(self, instructions):
	return self.tokenizer(
	instructions,
	padding="longest",
	return_tensors="pt"
	)["input_ids"]


	class ClipTextEncoder(nn.Module):

	def __init__(self):
	super().__init__()
	self.model = transformers.CLIPTextModel.from_pretrained(
	"openai/clip-vit-base-patch32"
	)

	def forward(self, tokens):
	return self.model(tokens).last_hidden_state