ia-nechaev
/

sbic-method2

Text Classification

Model card Files Files and versions

ia-nechaev commited on Apr 1, 2025

Commit

bc78cab

·

verified ·

1 Parent(s): 0d0afb0

Update prediction_multilabel.py

Files changed (1) hide show

prediction_multilabel.py +4 -4

prediction_multilabel.py CHANGED Viewed

@@ -10,15 +10,15 @@ from sentence_transformers import util
 torch.manual_seed(1)
 # Load datasets
-df_inmemory = pd.read_csv('labeled.csv') # labeled text extracted from 230 CSR GRI reports, 150 International companies, 2017-2021 period
-df_paragraph = pd.read_csv('prediction_demo.csv') # paragraphs to predict the label, extracted from 1.2k CSR reports, 150 German PLC companies, 2010-2021 period, 645k paragraphs)
 # Load stored embeddings
-with open('embeddings_prediction.pkl', "rb") as f:
     stored_data = pickle.load(f)
     pred_embeddings = stored_data['parg_embeddings']
-with open('embeddings_labeled.pkl', "rb") as f:
     stored_data = pickle.load(f)
     embeddings = stored_data['sent_embeddings']

 torch.manual_seed(1)
 # Load datasets
+df_inmemory = pd.read_csv('raw_data/labeled.csv') # labeled text extracted from 230 CSR GRI reports, 150 International companies, 2017-2021 period
+df_paragraph = pd.read_csv('raw_data/prediction_demo.csv') # paragraphs to predict the label, extracted from 1.2k CSR reports, 150 German PLC companies, 2010-2021 period, 645k paragraphs)
 # Load stored embeddings
+with open('embeddings/embeddings_prediction.pkl', "rb") as f:
     stored_data = pickle.load(f)
     pred_embeddings = stored_data['parg_embeddings']
+with open('embeddings/embeddings_labeled.pkl', "rb") as f:
     stored_data = pickle.load(f)
     embeddings = stored_data['sent_embeddings']