Spaces:

m0ksh
/

PeptideAI

Sleeping

Sync from GitHub (preserve manual model files)

ea61d54 verified about 1 month ago

393 Bytes

	# Post-process a combined CSV: drop index noise and duplicate sequences.
	import pandas as pd

	# Load data
	df = pd.read_csv("cleaned_amp_data.csv")

	# Drop index column if it exists
	if 'Unnamed: 0' in df.columns:
	df = df.drop(columns=['Unnamed: 0'])

	# Drop duplicate sequences
	df = df.drop_duplicates(subset='sequence')

	# Save cleaned data
	df.to_csv("2cleaned_amp_data.csv", index=False)