Spaces:

ElPremOoO
/

CodeMateReadability

Sleeping

App Files Files Community

CodeMateReadability / main.py

ElPremOoO

Create main.py

c0be552 verified 9 months ago

raw

history blame

1.91 kB

	from flask import Flask, request, jsonify
	import torch
	from transformers import RobertaTokenizer
	import os
	from transformers import RobertaForSequenceClassification
	import torch.serialization
	import torch
	from transformers import RobertaTokenizer, RobertaForSequenceClassification, Trainer, TrainingArguments
	from torch.utils.data import Dataset
	import pandas as pd
	from sklearn.model_selection import train_test_split
	import numpy as np
	# Initialize Flask app
	app = Flask(__name__)

	# Load the trained model and tokenizer
	tokenizer = RobertaTokenizer.from_pretrained("microsoft/codebert-base")
	torch.serialization.add_safe_globals([RobertaForSequenceClassification])

	model = torch.load("model.pth", map_location=torch.device('cpu'), weights_only=False) # Load the trained model

	# Ensure the model is in evaluation mode
	model.eval()


	@app.route("/")
	def home():
	return request.url


	# @app.route("/predict", methods=["POST"])
	@app.route("/predict")
	def predict():
	print("Received code:", request.get_json()["code"])
	code = request.get_json()["code"]
	# Load saved weights and config
	checkpoint = torch.load("codebert_vulnerability_scorer.pth")
	config = RobertaConfig.from_dict(checkpoint['config'])

	# Rebuild the model with correct architecture
	model = RobertaForSequenceClassification(config)
	model.load_state_dict(checkpoint['model_state_dict'])
	model.eval()

	# Load tokenizer
	tokenizer = RobertaTokenizer.from_pretrained('./tokenizer')

	# Prepare input
	inputs = tokenizer(
	code,
	truncation=True,
	padding='max_length',
	max_length=512,
	return_tensors='pt'
	)

	# Make prediction
	with torch.no_grad():
	outputs = model(**inputs)

	score = torch.sigmoid(outputs.logits).item()
	return score




	# Run the Flask app
	if __name__ == "__main__":
	app.run(host="0.0.0.0", port=7860)