AIResAgTeam
/

Quantum-ScalingRL

Model card Files Files and versions

xet

Community

Nurcholish commited on Oct 21, 2025

Commit

3eb5c38

verified ·

1 Parent(s): 2f19517

Update README.md

Browse files

Files changed (1) hide show

README.md +174 -3

README.md CHANGED Viewed

@@ -1,3 +1,174 @@
----
-license: mit
----

+---
+license: mit
+---
+# Quantum-Scaling RL Hybrid Agent
+A self-improving hybrid agent that integrates quantum optimization with reinforcement learning for multilingual semantic graph editing.
+## Quick Start
+```python
+from quantum_scaling_rl_hybrid import QuantumScalingRLHybrid, QuantumRLConfig
+# Initialize agent
+config = QuantumRLConfig(backends=['ibm', 'russian'])
+agent = QuantumScalingRLHybrid(config)
+# Run edit cycle
+result = agent.run_edit_cycle(edit, corpus)
+print(f"Performance: {result.performance_delta:.3f}")
+```
+## Run Demo
+```bash
+# Simple demo (no quantum dependencies)
+python agent/demo_quantum_scaling_rl_simple.py
+# Full demo (requires qiskit)
+pip install qiskit qiskit-machine-learning
+python agent/demo_quantum_scaling_rl.py
+# Visualization demo
+python agent/visualizations/demo_all_visualizations.py
+```
+## Architecture: 5-Stage Pipeline
+1. **Quantum Optimization** - QAOA traversal, QSVM hallucination detection, QEC correction
+2. **RLHF Adaptation** - KL-regularized PPO, backend selection learning
+3. **ScalingRL Budgeting** - Batch sizing (∝ √model_size), reward shaping, compute tracking
+4. **Feedback Loop** - Reflector, curator, RL retraining
+5. **Benchmarking & Visualization** - Performance metrics and visual analytics
+## Key Features
+- ✅ Self-improving: Learns optimal backends per language
+- ✅ Multilingual: Adapts strategies for each language (ru, zh, es, fr, en)
+- ✅ Compute-efficient: Optimizes batch sizes and resources
+- ✅ Benchmarking: Tracks IBM vs Russian backend performance
+- ✅ **NEW**: Comprehensive visualization suite (4 modules, 11 charts)
+## Visualization Modules
+**Location**: `agent/visualizations/`
+1. **Backend Performance Comparison** - IBM vs Russian backend analysis
+2. **Reward vs Batch Size Scaling** - Validates batch_size ∝ √(model_size)
+3. **Cross-Lingual Backend Preference** - Language-specific backend preferences
+4. **Performance Trend Over Edit Cycles** - Learning curves and improvement tracking
+```bash
+# Generate all visualizations
+cd agent/visualizations
+python demo_all_visualizations.py
+# Output: 11 high-resolution PNG charts in output/ directory
+```
+## Files
+### Core Implementation
+- `quantum_scaling_rl_hybrid.py` - Main implementation (450+ lines)
+- `demo_quantum_scaling_rl_simple.py` - Simple demo (tested & working)
+- `demo_quantum_scaling_rl.py` - Full demo (requires qiskit)
+- `test_quantum_scaling_rl.py` - Test suite (13 tests)
+### Visualization Modules
+- `visualizations/Backend_Performance_Comparison.py`
+- `visualizations/Reward_vs_BatchSize_Scaling.py`
+- `visualizations/Cross_Lingual_Backend_Preference.py`
+- `visualizations/Performance_Trend_Over_Edit_Cycles.py`
+- `visualizations/demo_all_visualizations.py`
+### Documentation
+- `QUANTUM_SCALING_RL_ARCHITECTURE.md` - Complete 5-stage architecture
+- `QUANTUM_SCALING_RL_HYBRID_DOCUMENTATION.md` - Full technical docs
+- `QUANTUM_SCALING_RL_QUICK_REFERENCE.md` - Quick reference
+- `QUANTUM_SCALING_RL_IMPLEMENTATION_SUMMARY.md` - Implementation summary
+## Demo Results
+```
+Total Edits: 15
+Performance Trend: improving
+Backend Performance:
+  ibm:     Mean Reward: 0.807 ± 0.022
+  russian: Mean Reward: 0.825 ± 0.024
+Learned Heuristics:
+  ru: Preferred Backend: ibm (0.807)
+  zh: Preferred Backend: russian (0.814)
+  es: Preferred Backend: russian (0.853)
+  fr: Preferred Backend: russian (0.842)
+  en: Preferred Backend: russian (0.803)
+```
+## Performance Metrics
+### Quantum Metrics
+- QAOA Coherence: 0.6-0.9
+- QEC Logical Error: 0.001-0.01
+- QSVM Valid Prob: 0.7-0.95
+### RL Metrics
+- Final Reward: 0.75-0.88
+- Edit Reliability: 0.99-1.0
+- KL Penalty: 0.0-0.01
+### Scaling Metrics
+- Compute Efficiency: 6-11 reward/sec
+- Optimal Batch Size: 8-16
+- Performance Trend: Improving
+## Dependencies
+```bash
+# Core (required)
+pip install numpy
+# Visualization (required for charts)
+pip install matplotlib
+# Quantum (optional, for full functionality)
+pip install qiskit qiskit-machine-learning torch transformers
+```
+## Integration
+### With Quantum Modules
+- `qaoa_traversal.py` - Semantic graph optimization
+- `qsvm_hallucination.py` - Hallucination detection
+- `repair_qec_extension.py` - Error correction
+### With RLHF System
+- `rlhf/reward_model.py` - Reward model manager
+- `rlhf/rl_trainer.py` - RL training config
+### With Scaling Laws
+- `scaling_laws/scaling_measurement_framework.py` - Scaling analysis
+## Usage with Visualizations
+```python
+from quantum_scaling_rl_hybrid import QuantumScalingRLHybrid
+from visualizations.Backend_Performance_Comparison import plot_backend_performance_comparison
+# Run agent
+agent = QuantumScalingRLHybrid()
+for i in range(30):
+    result = agent.run_edit_cycle(edit, corpus)
+# Get statistics
+stats = agent.get_statistics()
+# Visualize results
+plot_backend_performance_comparison(
+    stats['backend_performance'],
+    'backend_comparison.png'
+)
+```
+## License
+MIT License