Spaces:

hanz245
/

whspr

Runtime error

whspr / ml_classifier.py

Hanz Pillerva

deploy whspr fastapi backend

ac02020 27 days ago

27.3 kB

	"""
	//ml_classifier.py
	CSR Call Recording - ML Classifier Module
	Emotion classification using SVM, Random Forest, and KNN
	"""

	import os
	import sys
	import json
	import pickle
	import warnings
	import numpy as np
	import pandas as pd
	from pathlib import Path
	from datetime import datetime

	# Machine Learning
	from sklearn.model_selection import train_test_split, cross_val_score, GridSearchCV
	from sklearn.preprocessing import StandardScaler, LabelEncoder
	from sklearn.svm import SVC
	from sklearn.ensemble import RandomForestClassifier
	from sklearn.neighbors import KNeighborsClassifier
	from sklearn.metrics import (
	classification_report,
	confusion_matrix,
	accuracy_score,
	precision_recall_fscore_support,
	roc_auc_score
	)

	try:
	import matplotlib.pyplot as plt
	import seaborn as sns
	import matplotlib
	matplotlib.use('Agg')
	MATPLOTLIB_AVAILABLE = True
	except ImportError:
	MATPLOTLIB_AVAILABLE = False
	print("Warning: matplotlib/seaborn not available. Visualization disabled.")

	warnings.filterwarnings('ignore')


	class EmotionClassifier:
	"""
	ML Classifier for Emotional State Classification
	Supports: SVM, Random Forest, KNN
	"""

	# Emotion labels
	EMOTIONS = ['angry', 'happy', 'sad', 'neutral', 'frustrated', 'satisfied']

	# Available classifiers
	CLASSIFIERS = {
	'svm': 'Support Vector Machine',
	'rf': 'Random Forest',
	'knn': 'K-Nearest Neighbors'
	}

	def __init__(self, classifier_type='svm', random_state=42):
	"""
	Initialize Emotion Classifier

	Args:
	classifier_type (str): 'svm', 'rf', or 'knn'
	random_state (int): Random seed for reproducibility
	"""
	self.classifier_type = classifier_type.lower()
	self.random_state = random_state

	if self.classifier_type not in self.CLASSIFIERS:
	raise ValueError(
	f"Classifier must be one of: {list(self.CLASSIFIERS.keys())}")

	# Initialize components
	self.scaler = StandardScaler()
	self.label_encoder = LabelEncoder()
	self.model = None
	self.is_trained = False

	# Training history
	self.training_history = {
	'classifier_type': classifier_type,
	'trained_at': None,
	'training_samples': 0,
	'test_accuracy': 0.0,
	'feature_count': 0,
	'emotions': []
	}

	print(f"{'='*70}")
	print(f"ML Emotion Classifier Initialized")
	print(f"{'='*70}")
	print(f"Classifier: {self.CLASSIFIERS[self.classifier_type]}")
	print(f"Random State: {random_state}")
	print(f"{'='*70}\n")

	def _mock_predict(self, X, return_probabilities=True):
	"""
	TEMPORARY: Return mock predictions for testing
	This should be replaced with real trained model predictions
	"""
	import random

	# Ensure X is 2D
	if len(X.shape) == 1:
	X = X.reshape(1, -1)

	n_samples = X.shape[0]

	# Generate mock predictions
	mock_emotions = random.choices(self.EMOTIONS, k=n_samples)

	results = {
	'predictions': mock_emotions,
	'num_samples': n_samples
	}

	if return_probabilities:
	probabilities = []
	for emotion in mock_emotions:
	# Generate realistic-looking probabilities
	base_prob = random.uniform(0.55, 0.85) # Confidence for predicted emotion
	remaining = 1.0 - base_prob

	# Distribute remaining probability among other emotions
	other_emotions = [e for e in self.EMOTIONS if e != emotion]
	other_probs = np.random.dirichlet(np.ones(len(other_emotions)))
	other_probs = other_probs * remaining

	# Create probability dict
	prob_dict = {emotion: float(base_prob)}
	for other_emotion, prob in zip(other_emotions, other_probs):
	prob_dict[other_emotion] = float(prob)

	# Sort by probability
	prob_dict = dict(sorted(prob_dict.items(), key=lambda x: x[1], reverse=True))

	probabilities.append({
	'predicted_emotion': emotion,
	'confidence': float(base_prob),
	'all_probabilities': prob_dict
	})

	results['probabilities'] = probabilities

	return results

	def _create_classifier(self, **kwargs):
	"""
	Create classifier instance based on type

	Args:
	**kwargs: Classifier-specific parameters

	Returns:
	Classifier instance
	"""
	if self.classifier_type == 'svm':
	return SVC(
	kernel=kwargs.get('kernel', 'rbf'),
	C=kwargs.get('C', 1.0),
	gamma=kwargs.get('gamma', 'scale'),
	probability=True,
	random_state=self.random_state
	)

	elif self.classifier_type == 'rf':
	return RandomForestClassifier(
	n_estimators=kwargs.get('n_estimators', 100),
	max_depth=kwargs.get('max_depth', None),
	min_samples_split=kwargs.get('min_samples_split', 2),
	min_samples_leaf=kwargs.get('min_samples_leaf', 1),
	random_state=self.random_state
	)

	elif self.classifier_type == 'knn':
	return KNeighborsClassifier(
	n_neighbors=kwargs.get('n_neighbors', 5),
	weights=kwargs.get('weights', 'uniform'),
	metric=kwargs.get('metric', 'minkowski')
	)

	def train(self, X, y, test_size=0.2, **classifier_params):
	"""
	Train the classifier

	Args:
	X (np.array): Feature matrix (n_samples, n_features)
	y (np.array): Labels (n_samples,)
	test_size (float): Proportion of test set
	**classifier_params: Classifier-specific parameters

	Returns:
	dict: Training results
	"""
	print(f"\n{'='*70}")
	print(f"TRAINING {self.CLASSIFIERS[self.classifier_type].upper()}")
	print(f"{'='*70}\n")

	# Validate input
	if len(X) != len(y):
	raise ValueError(
	f"X and y must have same length. Got X:{len(X)}, y:{len(y)}")

	print(f"[Data] Total samples: {len(X)}")
	print(f"[Data] Features per sample: {X.shape[1]}")
	print(f"[Data] Unique emotions: {np.unique(y)}")
	print(f"[Data] Test size: {test_size * 100}%\n")

	# Encode labels
	y_encoded = self.label_encoder.fit_transform(y)

	# Split data
	X_train, X_test, y_train, y_test = train_test_split(
	X, y_encoded,
	test_size=test_size,
	random_state=self.random_state,
	stratify=y_encoded
	)

	print(f"[Split] Training samples: {len(X_train)}")
	print(f"[Split] Test samples: {len(X_test)}\n")

	# Scale features
	print("[Preprocessing] Scaling features...")
	X_train_scaled = self.scaler.fit_transform(X_train)
	X_test_scaled = self.scaler.transform(X_test)
	print("✓ Features scaled\n")

	# Create and train classifier
	print(
	f"[Training] Training {self.CLASSIFIERS[self.classifier_type]}...")
	self.model = self._create_classifier(**classifier_params)
	self.model.fit(X_train_scaled, y_train)
	print("✓ Training complete\n")

	# Evaluate on test set
	print("[Evaluation] Testing model...")
	y_pred = self.model.predict(X_test_scaled)
	y_pred_proba = self.model.predict_proba(X_test_scaled)

	# Calculate metrics
	accuracy = accuracy_score(y_test, y_pred)
	precision, recall, f1, support = precision_recall_fscore_support(
	y_test, y_pred, average='weighted'
	)

	# Confusion matrix
	cm = confusion_matrix(y_test, y_pred)

	# Cross-validation
	print("[Cross-Validation] Running 5-fold CV...")
	cv_scores = cross_val_score(
	self.model, X_train_scaled, y_train, cv=5, scoring='accuracy'
	)

	# Update training history
	self.is_trained = True
	self.training_history.update({
	'trained_at': datetime.now().isoformat(),
	'training_samples': len(X_train),
	'test_samples': len(X_test),
	'test_accuracy': float(accuracy),
	'precision': float(precision),
	'recall': float(recall),
	'f1_score': float(f1),
	'cv_scores': cv_scores.tolist(),
	'cv_mean': float(cv_scores.mean()),
	'cv_std': float(cv_scores.std()),
	'feature_count': X.shape[1],
	'emotions': self.label_encoder.classes_.tolist(),
	'confusion_matrix': cm.tolist()
	})

	# Display results
	print(f"\n{'='*70}")
	print(f"TRAINING RESULTS")
	print(f"{'='*70}")
	print(f"Test Accuracy: {accuracy:.4f} ({accuracy*100:.2f}%)")
	print(f"Precision: {precision:.4f}")
	print(f"Recall: {recall:.4f}")
	print(f"F1-Score: {f1:.4f}")
	print(f"\nCross-Validation (5-fold):")
	print(
	f" Mean CV Accuracy: {cv_scores.mean():.4f} (+/- {cv_scores.std():.4f})")
	print(f" CV Scores: {cv_scores}")
	print(f"{'='*70}\n")

	# Detailed classification report
	print("Classification Report:")
	print(classification_report(
	y_test, y_pred,
	target_names=self.label_encoder.classes_
	))

	results = {
	'accuracy': accuracy,
	'precision': precision,
	'recall': recall,
	'f1_score': f1,
	'cv_scores': cv_scores,
	'cv_mean': cv_scores.mean(),
	'cv_std': cv_scores.std(),
	'confusion_matrix': cm,
	'classification_report': classification_report(
	y_test, y_pred,
	target_names=self.label_encoder.classes_,
	output_dict=True
	),
	'predictions': y_pred,
	'true_labels': y_test,
	'predicted_probabilities': y_pred_proba
	}

	return results

	def predict(self, X, return_probabilities=True):
	"""
	Predict emotions for new samples

	Args:
	X (np.array): Feature matrix (n_samples, n_features)
	return_probabilities (bool): Return probability scores

	Returns:
	dict: Predictions with labels and probabilities
	"""
	if not self.is_trained:
	# TEMPORARY: Return mock predictions for testing
	print("⚠️ WARNING: Using MOCK predictions - model not trained yet!")
	return self._mock_predict(X, return_probabilities)

	# Ensure X is 2D
	if len(X.shape) == 1:
	X = X.reshape(1, -1)

	# Scale features
	X_scaled = self.scaler.transform(X)

	# Predict
	y_pred_encoded = self.model.predict(X_scaled)
	y_pred_labels = self.label_encoder.inverse_transform(y_pred_encoded)

	results = {
	'predictions': y_pred_labels.tolist(),
	'num_samples': len(X)
	}

	if return_probabilities:
	y_pred_proba = self.model.predict_proba(X_scaled)

	# Get probabilities for each emotion
	probabilities = []
	for i, probs in enumerate(y_pred_proba):
	prob_dict = {
	emotion: float(prob)
	for emotion, prob in zip(self.label_encoder.classes_, probs)
	}
	# Sort by probability
	prob_dict = dict(
	sorted(prob_dict.items(), key=lambda x: x[1], reverse=True))
	probabilities.append({
	'predicted_emotion': y_pred_labels[i],
	'confidence': float(max(probs)),
	'all_probabilities': prob_dict
	})

	results['probabilities'] = probabilities

	return results

	def predict_single(self, feature_vector):
	"""
	Predict emotion for a single call recording

	Args:
	feature_vector (np.array or list): Single feature vector

	Returns:
	dict: Prediction result
	"""
	try:
	if isinstance(feature_vector, list):
	feature_vector = np.array(feature_vector)

	# Ensure it's a 1D array before reshaping
	if len(feature_vector.shape) > 1:
	feature_vector = feature_vector.flatten()

	result = self.predict(feature_vector.reshape(1, -1))

	prediction = {
	'emotion': result['predictions'][0],
	'confidence': result['probabilities'][0]['confidence'],
	'all_probabilities': result['probabilities'][0]['all_probabilities']
	}

	return prediction

	except Exception as e:
	print(f"Error in predict_single: {e}")
	return {
	'error': str(e),
	'emotion': 'neutral',
	'confidence': 0.0,
	'all_probabilities': {emotion: 0.0 for emotion in self.EMOTIONS}
	}

	def optimize_hyperparameters(self, X, y, cv=5):
	"""
	Optimize classifier hyperparameters using GridSearchCV

	Args:
	X (np.array): Feature matrix
	y (np.array): Labels
	cv (int): Number of cross-validation folds

	Returns:
	dict: Best parameters and scores
	"""
	print(f"\n{'='*70}")
	print(f"HYPERPARAMETER OPTIMIZATION")
	print(f"{'='*70}\n")

	# Encode labels and scale features
	y_encoded = self.label_encoder.fit_transform(y)
	X_scaled = self.scaler.fit_transform(X)

	# Define parameter grids
	param_grids = {
	'svm': {
	'kernel': ['rbf', 'linear', 'poly'],
	'C': [0.1, 1, 10, 100],
	'gamma': ['scale', 'auto', 0.001, 0.01]
	},
	'rf': {
	'n_estimators': [50, 100, 200, 300],
	'max_depth': [None, 10, 20, 30],
	'min_samples_split': [2, 5, 10],
	'min_samples_leaf': [1, 2, 4]
	},
	'knn': {
	'n_neighbors': [3, 5, 7, 9, 11],
	'weights': ['uniform', 'distance'],
	'metric': ['euclidean', 'manhattan', 'minkowski']
	}
	}

	param_grid = param_grids[self.classifier_type]

	print(f"[Optimization] Searching parameter space...")
	print(f"[Optimization] Parameter grid: {param_grid}\n")

	# Create base classifier
	base_model = self._create_classifier()

	# Grid search
	grid_search = GridSearchCV(
	base_model,
	param_grid,
	cv=cv,
	scoring='accuracy',
	n_jobs=-1,
	verbose=1
	)

	grid_search.fit(X_scaled, y_encoded)

	print(f"\n{'='*70}")
	print(f"OPTIMIZATION RESULTS")
	print(f"{'='*70}")
	print(f"Best Score: {grid_search.best_score_:.4f}")
	print(f"Best Parameters: {grid_search.best_params_}")
	print(f"{'='*70}\n")

	# Update model with best parameters
	self.model = grid_search.best_estimator_
	self.is_trained = True

	return {
	'best_score': grid_search.best_score_,
	'best_params': grid_search.best_params_,
	'cv_results': grid_search.cv_results_
	}

	def save_model(self, filepath='emotion_classifier_model.pkl'):
	"""
	Save trained model to file

	Args:
	filepath (str): Path to save model
	"""
	if not self.is_trained:
	raise RuntimeError("Cannot save untrained model")

	model_data = {
	'model': self.model,
	'scaler': self.scaler,
	'label_encoder': self.label_encoder,
	'classifier_type': self.classifier_type,
	'training_history': self.training_history,
	'is_trained': self.is_trained
	}

	with open(filepath, 'wb') as f:
	pickle.dump(model_data, f)

	print(f"✓ Model saved to: {filepath}")
	return filepath

	def load_model(self, filepath):
	"""
	Load trained model from file

	Args:
	filepath (str): Path to saved model
	"""
	if not os.path.exists(filepath):
	raise FileNotFoundError(f"Model file not found: {filepath}")

	with open(filepath, 'rb') as f:
	model_data = pickle.load(f)

	self.model = model_data['model']
	self.scaler = model_data['scaler']
	self.label_encoder = model_data['label_encoder']
	self.classifier_type = model_data['classifier_type']
	self.training_history = model_data['training_history']
	self.is_trained = model_data['is_trained']

	print(f"✓ Model loaded from: {filepath}")
	print(f" Classifier: {self.CLASSIFIERS[self.classifier_type]}")
	print(f" Trained at: {self.training_history['trained_at']}")
	print(
	f" Training accuracy: {self.training_history['test_accuracy']:.4f}")

	def visualize_results(self, results, output_dir='visualizations'):
	"""
	Create visualizations of training results

	Args:
	results (dict): Training results from train()
	output_dir (str): Directory to save plots

	Returns:
	dict: Paths to saved visualizations
	"""
	if not MATPLOTLIB_AVAILABLE:
	print("Matplotlib not available. Skipping visualization.")
	return {}

	output_path = Path(output_dir)
	output_path.mkdir(parents=True, exist_ok=True)

	saved_plots = {}

	# 1. Confusion Matrix
	plt.figure(figsize=(10, 8))
	sns.heatmap(
	results['confusion_matrix'],
	annot=True,
	fmt='d',
	cmap='Blues',
	xticklabels=self.label_encoder.classes_,
	yticklabels=self.label_encoder.classes_
	)
	plt.title(
	f'Confusion Matrix - {self.CLASSIFIERS[self.classifier_type]}')
	plt.ylabel('True Label')
	plt.xlabel('Predicted Label')
	plt.tight_layout()
	cm_path = output_path / f'{self.classifier_type}_confusion_matrix.png'
	plt.savefig(cm_path, dpi=150)
	plt.close()
	saved_plots['confusion_matrix'] = str(cm_path)

	# 2. Classification Report Heatmap
	report_dict = results['classification_report']
	report_data = []
	emotions = [e for e in report_dict.keys() if e not in [
	'accuracy', 'macro avg', 'weighted avg']]

	for emotion in emotions:
	report_data.append([
	report_dict[emotion]['precision'],
	report_dict[emotion]['recall'],
	report_dict[emotion]['f1-score']
	])

	plt.figure(figsize=(8, 6))
	sns.heatmap(
	report_data,
	annot=True,
	fmt='.3f',
	cmap='YlGnBu',
	xticklabels=['Precision', 'Recall', 'F1-Score'],
	yticklabels=emotions
	)
	plt.title(
	f'Classification Metrics - {self.CLASSIFIERS[self.classifier_type]}')
	plt.tight_layout()
	metrics_path = output_path / f'{self.classifier_type}_metrics.png'
	plt.savefig(metrics_path, dpi=150)
	plt.close()
	saved_plots['metrics'] = str(metrics_path)

	# 3. Cross-Validation Scores
	plt.figure(figsize=(10, 6))
	cv_scores = results['cv_scores']
	folds = range(1, len(cv_scores) + 1)
	plt.bar(folds, cv_scores, color='skyblue', alpha=0.7)
	plt.axhline(y=cv_scores.mean(), color='r', linestyle='--',
	label=f'Mean: {cv_scores.mean():.4f}')
	plt.xlabel('Fold')
	plt.ylabel('Accuracy')
	plt.title(
	f'Cross-Validation Scores - {self.CLASSIFIERS[self.classifier_type]}')
	plt.legend()
	plt.grid(axis='y', alpha=0.3)
	plt.tight_layout()
	cv_path = output_path / f'{self.classifier_type}_cv_scores.png'
	plt.savefig(cv_path, dpi=150)
	plt.close()
	saved_plots['cv_scores'] = str(cv_path)

	# 4. Feature Importance (Random Forest only)
	if self.classifier_type == 'rf' and hasattr(self.model, 'feature_importances_'):
	importances = self.model.feature_importances_
	indices = np.argsort(importances)[::-1][:20] # Top 20 features

	plt.figure(figsize=(12, 6))
	plt.bar(range(len(indices)), importances[indices])
	plt.title('Top 20 Feature Importances - Random Forest')
	plt.xlabel('Feature Index')
	plt.ylabel('Importance')
	plt.tight_layout()
	fi_path = output_path / 'rf_feature_importance.png'
	plt.savefig(fi_path, dpi=150)
	plt.close()
	saved_plots['feature_importance'] = str(fi_path)

	print(f"✓ Visualizations saved to: {output_dir}/\n")

	return saved_plots

	def compare_classifiers(self, X, y, test_size=0.2):
	"""
	Compare all three classifiers on the same dataset

	Args:
	X (np.array): Feature matrix
	y (np.array): Labels
	test_size (float): Test set proportion

	Returns:
	dict: Comparison results
	"""
	print(f"\n{'='*70}")
	print(f"COMPARING ALL CLASSIFIERS")
	print(f"{'='*70}\n")

	results = {}

	for clf_type in ['svm', 'rf', 'knn']:
	print(f"\nTraining {self.CLASSIFIERS[clf_type]}...")
	print(f"{'-'*70}")

	classifier = EmotionClassifier(
	classifier_type=clf_type, random_state=self.random_state)
	clf_results = classifier.train(X, y, test_size=test_size)

	results[clf_type] = {
	'accuracy': clf_results['accuracy'],
	'precision': clf_results['precision'],
	'recall': clf_results['recall'],
	'f1_score': clf_results['f1_score'],
	'cv_mean': clf_results['cv_mean'],
	'cv_std': clf_results['cv_std']
	}

	# Display comparison
	print(f"\n{'='*70}")
	print(f"COMPARISON RESULTS")
	print(f"{'='*70}\n")

	comparison_df = pd.DataFrame(results).T
	comparison_df.index = [self.CLASSIFIERS[idx]
	for idx in comparison_df.index]
	print(comparison_df.to_string())
	print(f"\n{'='*70}\n")

	# Find best classifier
	best_clf = max(results.items(), key=lambda x: x[1]['accuracy'])
	print(f"Best Classifier: {self.CLASSIFIERS[best_clf[0]]}")
	print(f"Accuracy: {best_clf[1]['accuracy']:.4f}\n")

	return results


	def main():
	"""Main function for command-line usage"""
	import argparse

	parser = argparse.ArgumentParser(
	description='CSR Call Recording - ML Emotion Classifier',
	formatter_class=argparse.RawDescriptionHelpFormatter,
	epilog="""
	Examples:
	# Train SVM classifier
	python ml_classifier.py --features features.npy --labels labels.npy --classifier svm

	# Train and compare all classifiers
	python ml_classifier.py --features features.npy --labels labels.npy --compare

	# Train with optimization
	python ml_classifier.py --features features.npy --labels labels.npy --classifier rf --optimize

	# Predict emotions
	python ml_classifier.py --predict feature_vector.npy --model saved_model.pkl
	"""
	)

	parser.add_argument(
	'--features',
	help='Path to feature matrix (.npy file)'
	)

	parser.add_argument(
	'--labels',
	help='Path to labels (.npy file)'
	)

	parser.add_argument(
	'--classifier',
	choices=['svm', 'rf', 'knn'],
	default='svm',
	help='Classifier type (default: svm)'
	)

	parser.add_argument(
	'--test-size',
	type=float,
	default=0.2,
	help='Test set proportion (default: 0.2)'
	)

	parser.add_argument(
	'--optimize',
	action='store_true',
	help='Optimize hyperparameters'
	)

	parser.add_argument(
	'--compare',
	action='store_true',
	help='Compare all classifiers'
	)

	parser.add_argument(
	'--save-model',
	help='Path to save trained model'
	)

	parser.add_argument(
	'--predict',
	help='Path to feature vector for prediction'
	)

	parser.add_argument(
	'--model',
	help='Path to saved model for prediction'
	)

	parser.add_argument(
	'--visualize',
	action='store_true',
	help='Create visualization plots'
	)

	args = parser.parse_args()

	# Prediction mode
	if args.predict:
	if not args.model:
	print("Error: --model required for prediction")
	sys.exit(1)

	classifier = EmotionClassifier()
	classifier.load_model(args.model)

	features = np.load(args.predict)
	result = classifier.predict(features)

	print(f"\n{'='*70}")
	print(f"PREDICTION RESULTS")
	print(f"{'='*70}")
	for i, pred in enumerate(result['probabilities']):
	print(f"\nSample {i+1}:")
	print(f" Emotion: {pred['predicted_emotion']}")
	print(f" Confidence: {pred['confidence']:.4f}")
	print(f" All probabilities:")
	for emotion, prob in pred['all_probabilities'].items():
	print(f" {emotion}: {prob:.4f}")
	print(f"{'='*70}\n")

	sys.exit(0)

	# Training mode
	if not args.features or not args.labels:
	print("Error: --features and --labels required for training")
	sys.exit(1)

	# Load data
	X = np.load(args.features)
	y = np.load(args.labels)

	print(f"Loaded data: {X.shape[0]} samples, {X.shape[1]} features")

	# Compare mode
	if args.compare:
	classifier = EmotionClassifier()
	results = classifier.compare_classifiers(
	X, y, test_size=args.test_size)
	sys.exit(0)

	# Single classifier mode
	classifier = EmotionClassifier(classifier_type=args.classifier)

	if args.optimize:
	classifier.optimize_hyperparameters(X, y)
	results = classifier.train(X, y, test_size=args.test_size)
	else:
	results = classifier.train(X, y, test_size=args.test_size)

	# Visualize
	if args.visualize:
	classifier.visualize_results(results)

	# Save model
	if args.save_model:
	classifier.save_model(args.save_model)
	else:
	# Default save path
	default_path = f'{args.classifier}_emotion_classifier.pkl'
	classifier.save_model(default_path)

	print(f"\n✓ Training complete!")


	if __name__ == '__main__':
	main()