Spaces:
Runtime error
Runtime error
File size: 623 Bytes
2cc7f91 | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 | import pandas as pd
df1 = pd.read_csv('data/raw/phishing.csv')
df2 = pd.read_csv('data/raw/legitimate.csv')
df2.columns = df2.columns.str.lower()
combined_df = pd.concat([df1, df2], ignore_index=True)
combined_df = combined_df.drop_duplicates()
combined_df.to_csv('data/processed/clean_dataset.csv', index=False)
print(f"Datasety boli úspešne spojené")
print(f"Počet záznamov v prvom súbore: {len(df1)}")
print(f"Počet záznamov v druhom súbore: {len(df2)}")
print(f"Celkový počet záznamov: {len(combined_df)}")
print(f"\nPrvých 5 riadkov spojeného datasetu:")
print(combined_df.head()) |