Rakesh12345
/

Credit_Card_Fraud_Detection

Model card Files Files and versions

Credit_Card_Fraud_Detection / README.md

Rakesh12345's picture

Create README.md

55018bb about 3 years ago

|

history blame contribute delete

2.83 kB

	# -- coding: utf-8 --
	"""Final_project_of_Credit_Card_Fraud_Detection(1).ipynb

	Automatically generated by Colaboratory.

	Original file is located at
	https://colab.research.google.com/drive/1PSHcV_bp0wcT0Kl_f2n5QwtlOZj3M5BV
	"""

	import pandas as pd
	import seaborn as sns
	import matplotlib.pyplot as plt

	data=pd.read_csv('/content/data4.csv')

	data.head()

	data.shape

	data.isnull().sum().sum()

	data.keys()

	data.info()

	data=data.drop(['Unnamed: 0','nameOrig','nameDest'],axis=1)

	data.shape

	data['isFraud'].value_counts()

	plt.pie(data['isFraud'].value_counts(),labels=['Not_Fraud','Fraud'],autopct='%0.2f%%')
	plt.show()

	#sns.countplot('isFraud',data=data)
	sns.countplot(data=data, x="type", hue="isFraud")
	plt.show()

	plt.figure(figsize=(6,8))
	sns.countplot(data=data, x="isFraud", hue="type")
	plt.show()

	data.tail()

	data['type'].value_counts()



	dict1={'CASH_OUT':0,'TRANSFER':1,'PAYMENT':2,'CASH_IN':3,'DEBIT':4}

	data['type']=data['type'].map(dict1)

	data.head()

	X=data.drop('isFraud',axis=1)

	X

	y=data['isFraud']

	y

	from sklearn.model_selection import train_test_split

	X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.30,random_state=0)

	print(X_train.shape)
	print(X_test.shape)
	print(y_train.shape)
	print(y_test.shape)

	from sklearn.preprocessing import StandardScaler

	sc=StandardScaler()

	X_train_sc=sc.fit_transform(X_train)
	X_test_sc=sc.transform(X_test)

	X_train_sc

	X_test_sc

	from sklearn.linear_model import LogisticRegression

	model1=LogisticRegression()

	model1.fit(X_train_sc,y_train)

	y_pred1=model1.predict(X_test_sc)

	from sklearn.metrics import classification_report

	print(classification_report(y_test,y_pred1))

	from sklearn.naive_bayes import GaussianNB

	model2=GaussianNB()

	model2.fit(X_train_sc,y_train)

	y_pred2=model2.predict(X_test_sc)

	print(classification_report(y_test,y_pred2))

	from sklearn.neighbors import KNeighborsClassifier

	model3=KNeighborsClassifier()

	model3.fit(X_train_sc,y_train)

	y_pred3=model3.predict(X_test_sc)

	print(classification_report(y_test,y_pred3))

	from sklearn.tree import DecisionTreeClassifier

	model4=DecisionTreeClassifier()

	model4.fit(X_train_sc,y_train)

	y_pred4=model4.predict(X_test_sc)

	print(classification_report(y_test,y_pred4))

	from sklearn import tree

	plt.figure(figsize=(10,10))
	tree.plot_tree(model4,filled=True)
	plt.show()

	from sklearn.ensemble import RandomForestClassifier,AdaBoostClassifier

	model5=RandomForestClassifier()

	model5.fit(X_train_sc,y_train)

	y_pred5=model5.predict(X_test_sc)

	print(classification_report(y_test,y_pred5))

	model6=AdaBoostClassifier()

	model6.fit(X_train_sc,y_train)

	y_pred6=model6.predict(X_test_sc)

	print(classification_report(y_test,y_pred6))

	model5.predict([[239,2,5178.72,400705.00,395526.28,0.00,0.00]])

	model5.predict([[369,0,89596.79,89596.79,0.0,0.00,89596.79]])