vuln-code-analysis / scripts /prep_database.py
lilbool's picture
Upload 212 files
497f2f3 verified
import json
import pandas as pd
def load_json_to_dataframe(json_file, label):
"""Carrega um JSON de c贸digos e adiciona a coluna de r贸tulo (label)."""
with open(json_file, 'r', encoding='utf-8') as f:
data = json.load(f)
df = pd.DataFrame(data)
df['label'] = label # Adiciona o r贸tulo: 1 para vulner谩vel, 0 para seguro
return df
if __name__ == "__main__":
# Caminhos dos arquivos JSON
safe_json = "safe-code-analyzer/compiled_safe_codes.json"
vuln_json = "exploit-analyzer/compiled_exploits.json"
# Carregar os dados
safe_df = load_json_to_dataframe(safe_json, label=0)
vuln_df = load_json_to_dataframe(vuln_json, label=1)
# Combinar os dados
dataset_df = pd.concat([safe_df, vuln_df], ignore_index=True)
# Salvar como CSV para treinamento
dataset_df.to_csv("code_analysis_dataset.csv", index=False)
print("[SUCCESS] Dataset saved to code_analysis_dataset.csv")