File size: 623 Bytes
2cc7f91
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
import pandas as pd

df1 = pd.read_csv('data/raw/phishing.csv')
df2 = pd.read_csv('data/raw/legitimate.csv')

df2.columns = df2.columns.str.lower()

combined_df = pd.concat([df1, df2], ignore_index=True)

combined_df = combined_df.drop_duplicates()

combined_df.to_csv('data/processed/clean_dataset.csv', index=False)

print(f"Datasety boli úspešne spojené")
print(f"Počet záznamov v prvom súbore: {len(df1)}")
print(f"Počet záznamov v druhom súbore: {len(df2)}")
print(f"Celkový počet záznamov: {len(combined_df)}")
print(f"\nPrvých 5 riadkov spojeného datasetu:")
print(combined_df.head())