Christian2903
/

amazon-review-sentiment-analysis_large

Text Classification

Generated from Trainer

text-embeddings-inference

Model card Files Files and versions

Metrics Training metrics Community

amazon-review-sentiment-analysis_large / handler.py

Christian2903's picture

Upload handler.py

e13b04a over 3 years ago

history blame contribute delete

1.81 kB

	from typing import Dict, List, Any
	from transformers import AutoTokenizer, AutoModelForSequenceClassification
	import torch


	class EndpointHandler():
	def __init__(self, path=""):
	self.device = "cuda:0" if torch.cuda.is_available() else "cpu"

	self.tokenizer = AutoTokenizer.from_pretrained("distilbert-base-uncased")
	self.sentiment_model = AutoModelForSequenceClassification.from_pretrained("Christian2903/amazon-review-sentiment-analysis_large").to(self.device)


	def __call__(self, data: Dict[str, List[str]]) -> Dict[str, List[int]]:
	"""
	data args:
	reviews (:obj: `str`)
	Return:
	A `dict`: will be serialized and returned
	"""

	reviews = data.pop("reviews", data)

	# inputs = self.tokenizer(reviews, return_tensors="pt", truncation=True, padding="max_length", max_length=256).to(self.device)
	# outputs = self.sentiment_model(**inputs)
	# logits = outputs.logits.detach()
	# predicted_scores = [max(min(int(score + 0.5),5),1) for score in logits]

	batch_size = 32
	predictions = []
	for i in range(0, len(reviews), batch_size):
	batch = reviews[i:i+batch_size]
	# inputs = tokenizer(batch, truncation=True, padding="max_length", max_length=256, return_tensors="pt")
	inputs = self.tokenizer(batch, return_tensors="pt", truncation=True, padding="max_length", max_length=256).to(self.device)
	outputs = self.sentiment_model(**inputs)
	logits = outputs[0]
	predictions.extend(logits.detach().cpu().numpy())


	predicted_scores = [max(min(int(score + 0.5),5),1) for score in predictions]

	response = {
	'scores': predicted_scores
	}

	return response