Spaces:

arianasutanto
/

patentability

Runtime error

patentability / app.py

ariana sutanto

message

86f5bbf over 2 years ago

1.83 kB

	import streamlit as st
	from datasets import load_dataset
	from transformers import AutoTokenizer, AutoModelForSequenceClassification, pipeline
	import torch.nn.functional as F
	import torch
	import numpy as np

	dataset_dict = load_dataset('HUPD/hupd',
	name='sample',
	data_files="https://huggingface.co/datasets/HUPD/hupd/blob/main/hupd_metadata_2022-02-22.feather",
	icpr_label=None,
	train_filing_start_date='2016-01-01',
	train_filing_end_date='2016-01-21',
	val_filing_start_date='2016-01-22',
	val_filing_end_date='2016-01-31',
	)

	st.title("Patentability Score")

	abstracts={}
	claims={}


	dataset = dataset_dict["train"].shuffle(seed=42).select(range(20))


	for i in range(0, 20):

	abstracts[dataset['patent_number'][i]] = dataset['abstract'][i]
	claims[dataset['patent_number'][i]] = dataset['claims'][i]


	def get_score(abstract):

	model = AutoModelForSequenceClassification.from_pretrained("arianasutanto/finetuned-distilbert")
	tokenizer = AutoTokenizer.from_pretrained("arianasutanto/finetuned-distilbert", pad_to_max_length=True)

	inputs = tokenizer(abstract, padding='max_length', truncation=True, return_tensors='pt')

	with torch.no_grad():
	logits = model(**inputs).logits

	predictions = F.softmax(logits, dim=1) #will get the probabilities of each label 0 and 1
	predictions = predictions.numpy()
	score = predictions[0][1] #get the probability of the label being 1 (patent accepted)

	return score




	patent_num = st.selectbox("Choose a patent number", options=abstracts.keys())
	if st.button("Submit"):
	abstract = st.text_area(label="Abstract",value=abstracts[patent_num])
	claim = st.text_area(label="Claims",value=claims[patent_num])
	patentability= get_score(abstract)
	st.write(f"The patentability score is: {patentability}")