Spaces:

megamind22
/

ddi

Running

ddi / src /validation /integration_test.py

github-actions[bot]

Deploy from GitHub Actions (fb28c05c54cf19184fc3f14f1bf3297ba5749ea2)

d29b763 9 days ago

11.2 kB

	#!/usr/bin/env python3
	"""Comprehensive production integration test and validation suite.

	Tests:
	1. Backend API startup and health checks
	2. Model inference on known and unknown pairs
	3. Frontend API contract compliance
	4. Healthcare safety features
	5. Confidence calibration
	6. Error handling
	"""
	from __future__ import annotations

	import asyncio
	import json
	import logging
	import subprocess
	import sys
	import time
	from pathlib import Path
	from typing import Any, Dict

	logging.basicConfig(
	level=logging.INFO,
	format='%(asctime)s [%(levelname)s] %(name)s: %(message)s',
	)
	logger = logging.getLogger('medcare_ddi.integration_test')


	class IntegrationTest:
	"""Complete integration test suite."""

	def __init__(self):
	self.results = {}
	self.base_url = 'http://localhost:8000'

	def log_test(self, name: str, passed: bool, details: str = '') -> None:
	"""Log test result."""
	status = '✓ PASS' if passed else '✗ FAIL'
	logger.info(f'{status} - {name}')
	if details:
	logger.info(f' {details}')
	self.results[name] = passed

	def test_health_endpoint(self) -> bool:
	"""Test /health endpoint."""
	try:
	import requests

	response = requests.get(f'{self.base_url}/health', timeout=5)

	if response.status_code != 200:
	self.log_test('Health Endpoint', False, f'Status {response.status_code}')
	return False

	data = response.json()
	checks = [
	('status' in data, 'status field'),
	('model_loaded' in data, 'model_loaded field'),
	('pairs_loaded' in data, 'pairs_loaded field'),
	(data.get('model_loaded') is True, 'model_loaded is True'),
	(data.get('pairs_loaded', 0) > 0, f'pairs_loaded > 0 (got {data.get("pairs_loaded")})'),
	]

	all_passed = all(check[0] for check in checks)
	details = ', '.join(check[1] for check in checks if check[0])
	self.log_test('Health Endpoint', all_passed, details)
	return all_passed

	except Exception as e:
	self.log_test('Health Endpoint', False, str(e))
	return False

	def test_known_interactions(self) -> bool:
	"""Test predictions on known DDI pairs."""
	try:
	import requests

	test_pairs = [
	('Aspirin', 'Warfarin', 'major'),
	('Metformin', 'Insulin', 'moderate'),
	]

	all_passed = True
	for drug_a, drug_b, expected_severity in test_pairs:
	try:
	response = requests.post(
	f'{self.base_url}/predict',
	json={'drug_a': drug_a, 'drug_b': drug_b},
	timeout=10,
	)

	if response.status_code != 200:
	self.log_test(
	f'Known DDI: {drug_a} + {drug_b}',
	False,
	f'Status {response.status_code}',
	)
	all_passed = False
	continue

	data = response.json()

	# Check response schema
	required_fields = [
	'drug_a',
	'drug_b',
	'severity',
	'confidence',
	'confidence_band',
	'source',
	'explanation',
	'clinical_advice',
	'latency_ms',
	]

	missing_fields = [f for f in required_fields if f not in data]

	if missing_fields:
	self.log_test(
	f'Known DDI: {drug_a} + {drug_b}',
	False,
	f'Missing fields: {missing_fields}',
	)
	all_passed = False
	continue

	# Check values
	severity = data.get('severity')
	confidence = data.get('confidence', 0)
	source = data.get('source')

	self.log_test(
	f'Known DDI: {drug_a} + {drug_b}',
	True,
	f'{severity} (conf={confidence:.2f}, src={source})',
	)

	except Exception as e:
	self.log_test(f'Known DDI: {drug_a} + {drug_b}', False, str(e))
	all_passed = False

	return all_passed

	except Exception as e:
	self.log_test('Known Interactions Test', False, str(e))
	return False

	def test_unseen_pairs(self) -> bool:
	"""Test ML fallback on unseen pairs."""
	try:
	import requests

	test_pairs = [
	('UnknownDrugA', 'UnknownDrugB'),
	('TestDrug1', 'TestDrug2'),
	]

	all_passed = True
	for drug_a, drug_b in test_pairs:
	try:
	response = requests.post(
	f'{self.base_url}/predict',
	json={'drug_a': drug_a, 'drug_b': drug_b},
	timeout=10,
	)

	if response.status_code != 200:
	self.log_test(
	f'Unseen pair: {drug_a} + {drug_b}',
	False,
	f'Status {response.status_code}',
	)
	all_passed = False
	continue

	data = response.json()
	severity = data.get('severity')
	source = data.get('source')

	self.log_test(
	f'Unseen pair: {drug_a} + {drug_b}',
	True,
	f'{severity} (source={source})',
	)

	except Exception as e:
	self.log_test(f'Unseen pair: {drug_a} + {drug_b}', False, str(e))
	all_passed = False

	return all_passed

	except Exception as e:
	self.log_test('Unseen Pairs Test', False, str(e))
	return False

	def test_error_handling(self) -> bool:
	"""Test error handling for invalid inputs."""
	try:
	import requests

	test_cases = [
	({}, 'Missing both drugs'),
	({'drug_a': ''}, 'Empty drug names'),
	({'drug_a': None, 'drug_b': None}, 'None drugs'),
	]

	all_passed = True
	for payload, desc in test_cases:
	try:
	response = requests.post(
	f'{self.base_url}/predict',
	json=payload,
	timeout=5,
	)

	if response.status_code >= 400:
	self.log_test(f'Error Handling: {desc}', True, f'Status {response.status_code}')
	else:
	self.log_test(f'Error Handling: {desc}', False, 'Should have failed')
	all_passed = False

	except Exception as e:
	self.log_test(f'Error Handling: {desc}', False, str(e))
	all_passed = False

	return all_passed

	except Exception as e:
	self.log_test('Error Handling Test', False, str(e))
	return False

	def test_confidence_bands(self) -> bool:
	"""Test confidence band classification."""
	try:
	import requests

	response = requests.get(f'{self.base_url}/health', timeout=5)
	if response.status_code != 200:
	self.log_test('Confidence Bands', False, 'Could not get health info')
	return False

	# Make several predictions and check confidence_band values
	test_pairs = [('Aspirin', 'Warfarin'), ('Drug1', 'Drug2'), ('Drug3', 'Drug4')]

	bands_found = set()
	for drug_a, drug_b in test_pairs:
	try:
	response = requests.post(
	f'{self.base_url}/predict',
	json={'drug_a': drug_a, 'drug_b': drug_b},
	timeout=10,
	)

	if response.status_code == 200:
	data = response.json()
	band = data.get('confidence_band')
	if band in ['high', 'medium', 'low']:
	bands_found.add(band)
	except:
	pass

	valid_bands = len(bands_found) > 0
	details = f'Bands found: {bands_found}' if bands_found else 'No valid bands found'
	self.log_test('Confidence Bands', valid_bands, details)
	return valid_bands

	except Exception as e:
	self.log_test('Confidence Bands Test', False, str(e))
	return False

	def run_all(self) -> bool:
	"""Run all tests."""
	logger.info('')
	logger.info('╔' + '═'*68 + '╗')
	logger.info('║ MEDCARE-DDI INTEGRATION TEST SUITE' + ' '*33 + '║')
	logger.info('╚' + '═'*68 + '╝')
	logger.info('')

	tests = [
	self.test_health_endpoint,
	self.test_known_interactions,
	self.test_unseen_pairs,
	self.test_error_handling,
	self.test_confidence_bands,
	]

	for test in tests:
	try:
	test()
	except Exception as e:
	logger.error(f'Test {test.__name__} crashed: {e}', exc_info=True)

	# Summary
	logger.info('')
	logger.info('='*70)
	logger.info('TEST SUMMARY')
	logger.info('='*70)

	passed = sum(1 for v in self.results.values() if v)
	total = len(self.results)
	pass_rate = (passed / total * 100) if total > 0 else 0

	logger.info(f'Passed: {passed}/{total} ({pass_rate:.0f}%)')

	for test_name, passed in self.results.items():
	status = '✓' if passed else '✗'
	logger.info(f'{status} {test_name}')

	logger.info('')
	all_passed = all(self.results.values())
	status = 'READY FOR DEPLOYMENT' if all_passed else 'NEEDS_ATTENTION'
	logger.info(f'Overall: {status}')
	logger.info('')

	return all_passed


	def main():
	"""Run integration tests."""
	# Try to import requests
	try:
	import requests
	except ImportError:
	logger.error('requests module not found. Install with: pip install requests')
	return False

	# Run tests
	test_suite = IntegrationTest()
	return test_suite.run_all()


	if __name__ == '__main__':
	success = main()
	sys.exit(0 if success else 1)