chessecon

Runtime error

App Files Files Community

chessecon / doc.md

suvasis

code add

e4d7d50 2 days ago

preview code

raw

history blame contribute delete

20.1 kB

	# ChessEcon: A Visual Guide to the Autonomous Chess Economy

	Author: Adaboost AI
	Date: March 03, 2026

	---

	## Introduction

	This document provides a comprehensive visual overview of the ChessEcon system, a multi-agent reinforcement learning platform where AI agents operate as autonomous businesses. The following diagrams and charts illustrate the system's architecture, the flow of information and money, the agent decision-making process, and the dynamics of the training loop. These visualizations are designed to clarify the inter-workings of the agents and the training pipeline, from a single move to a full self-play and training cycle.

	---

	## 1. System Architecture & Information Flow

	The ChessEcon system is composed of several interconnected layers, each with a distinct responsibility. The following diagrams illustrate the high-level architecture and the sequence of events during a typical training loop.

	### 1.1. Full Training Loop Sequence

	This sequence diagram shows the end-to-end flow of a single game, from setup and move-by-move execution to payout and the triggering of a training step. It highlights the interactions between the agents, the environment server, the economic layer, and the training pipeline.

	![Full Training Loop Sequence](https://private-us-east-1.manuscdn.com/sessionFile/ELP96X8OiHqgxiSAuWbFms/sandbox/SsYEQ33FqlWJCy9d2U9OKk-images_1772600757694_na1fn_L2hvbWUvdWJ1bnR1L2NoZXNzZWNvbl92aXovMDFfcmVuZGVyZWQ.png?Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cHM6Ly9wcml2YXRlLXVzLWVhc3QtMS5tYW51c2Nkbi5jb20vc2Vzc2lvbkZpbGUvRUxQOTZYOE9pSHFneGlTQXVXYkZtcy9zYW5kYm94L1NzWUVRMzNGcWxXSkN5OWQyVTlPS2staW1hZ2VzXzE3NzI2MDA3NTc2OTRfbmExZm5fTDJodmJXVXZkV0oxYm5SMUwyTm9aWE56WldOdmJsOTJhWG92TURGZmNtVnVaR1Z5WldRLnBuZyIsIkNvbmRpdGlvbiI6eyJEYXRlTGVzc1RoYW4iOnsiQVdTOkVwb2NoVGltZSI6MTc5ODc2MTYwMH19fV19&Key-Pair-Id=K2HSFNDJXOU9YS&Signature=eGAwcqstJAJbwXEo5Rs~dlA7FwgmA8cVOq1n7iyvl3d0SI2Tf7K6ubUmEzi80lKZEKIIomkfvzayiMb7wkvTOtLvyE2ueAcK3mJUKiZa8yh5IrjSHmFrBb0iZBkTXyjwM2h442LtxnT6kE0HB7KiQGWaG8-KLSSwED6MHlO-2H918dmy-T0iNOjfZS~Ov8Uh-T3L7KW3YxUt~w-u1ZUyEvBdDGHEwYQQYRpEosJPMqNp2sz6iODECFS-sf87Gf7QwaPk8oadMhDE41LGjhTdjq2ayab6gcbtxeDvA5HcyDSlAQFJerDTih1LD29LpV11s6S2VqHCTaI9VNsGeh0XYw__)

	### 1.2. Agent Decision-Making Flowchart

	At the heart of ChessEcon is the agent's ability to make both chess and economic decisions. This flowchart details the step-by-step process an agent follows each turn, including the critical decision of whether to purchase expert coaching from Claude claude-opus-4-5.

	![Agent Decision-Making Flowchart](https://private-us-east-1.manuscdn.com/sessionFile/ELP96X8OiHqgxiSAuWbFms/sandbox/SsYEQ33FqlWJCy9d2U9OKk-images_1772600757694_na1fn_L2hvbWUvdWJ1bnR1L2NoZXNzZWNvbl92aXovMDJfcmVuZGVyZWQ.png?Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cHM6Ly9wcml2YXRlLXVzLWVhc3QtMS5tYW51c2Nkbi5jb20vc2Vzc2lvbkZpbGUvRUxQOTZYOE9pSHFneGlTQXVXYkZtcy9zYW5kYm94L1NzWUVRMzNGcWxXSkN5OWQyVTlPS2staW1hZ2VzXzE3NzI2MDA3NTc2OTRfbmExZm5fTDJodmJXVXZkV0oxYm5SMUwyTm9aWE56WldOdmJsOTJhWG92TURKZmNtVnVaR1Z5WldRLnBuZyIsIkNvbmRpdGlvbiI6eyJEYXRlTGVzc1RoYW4iOnsiQVdTOkVwb2NoVGltZSI6MTc5ODc2MTYwMH19fV19&Key-Pair-Id=K2HSFNDJXOU9YS&Signature=Q2-uM4Wo~3~-14vDVIUFgEA5fk~zHrNLGxwhe7uFqNqgglNsDW5K~eNiSR3zcU39D8adxCsjlEumO9LLhsppoX2R~-2J3qwO~SKB6LFrgtk83Wg5T4pfAE~upZUk7Iy8vfVhnh3SPx4EITIdzxxBuKOAwlH3IWIk6cTWun6FcLglJf0fjJecjHjJDsp5cvSP0uC7pfk2XkK6V2IDo4JntiJBOxX-Fsxt6X4rDVZ40B4jiJSd-QFHbbHvJ0RHCwadQqerJ55RlRobqqKR-CJC5SFnYFlx6i9xNtzz7o1fh6O1VbojDbQuXFQHdq3YaVFZHa0KvmjIcVLm1Cpij8508w__)

	### 1.3. Economic Flow

	Money is the lifeblood of the ChessEcon system. This diagram illustrates how money flows between agents and the tournament organizer, from entry fees and coaching payments to prize payouts. It also breaks down the net profit for various game outcomes.

	![Economic Flow Diagram](https://private-us-east-1.manuscdn.com/sessionFile/ELP96X8OiHqgxiSAuWbFms/sandbox/SsYEQ33FqlWJCy9d2U9OKk-images_1772600757694_na1fn_L2hvbWUvdWJ1bnR1L2NoZXNzZWNvbl92aXovMDNfcmVuZGVyZWQ.png?Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cHM6Ly9wcml2YXRlLXVzLWVhc3QtMS5tYW51c2Nkbi5jb20vc2Vzc2lvbkZpbGUvRUxQOTZYOE9pSHFneGlTQXVXYkZtcy9zYW5kYm94L1NzWUVRMzNGcWxXSkN5OWQyVTlPS2staW1hZ2VzXzE3NzI2MDA3NTc2OTRfbmExZm5fTDJodmJXVXZkV0oxYm5SMUwyTm9aWE56WldOdmJsOTJhWG92TUROZmNtVnVaR1Z5WldRLnBuZyIsIkNvbmRpdGlvbiI6eyJEYXRlTGVzc1RoYW4iOnsiQVdTOkVwb2NoVGltZSI6MTc5ODc2MTYwMH19fV19&Key-Pair-Id=K2HSFNDJXOU9YS&Signature=b~VH4HoyD0uXy64t0SdDvYTkI9cCBTt0DVB3PMSPCAhOiEnDFxH2Oc9dLAVw~5uZmsfAupI~DtNl7VGY3vCrnhbaqeVu8p-SNN-eOxyBJUvIR~gwHAJWrvdP0DcjtPTGsSbCSXagQ2~khsUMVZESvvLfNV1W-TMuEE0UI39NCjpS4ZPVXA26-evIPgMaWJn2cfTeOL9iFCT9nRd36cxdFaFhMP~-Uz56fohCbtHSI7y~h0Fus7lzzuyx0MO8BLkefpqyRWFJf8a~H7LClHt30GIxeryB275d-1I1A8747fm2mUX3uE8C13n6mOtIO3es46v4~Wk6YOaHwuSHp2nmGA__)

	### 1.4. GRPO Training Internals

	The training pipeline uses Group Relative Policy Optimization (GRPO). This flowchart breaks down the four phases of the GRPO process: data collection, reward assignment, advantage computation, and the final loss calculation and model update.

	![GRPO Training Internals](https://private-us-east-1.manuscdn.com/sessionFile/ELP96X8OiHqgxiSAuWbFms/sandbox/SsYEQ33FqlWJCy9d2U9OKk-images_1772600757694_na1fn_L2hvbWUvdWJ1bnR1L2NoZXNzZWNvbl92aXovMDRfcmVuZGVyZWQ.png?Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cHM6Ly9wcml2YXRlLXVzLWVhc3QtMS5tYW51c2Nkbi5jb20vc2Vzc2lvbkZpbGUvRUxQOTZYOE9pSHFneGlTQXVXYkZtcy9zYW5kYm94L1NzWUVRMzNGcWxXSkN5OWQyVTlPS2staW1hZ2VzXzE3NzI2MDA3NTc2OTRfbmExZm5fTDJodmJXVXZkV0oxYm5SMUwyTm9aWE56WldOdmJsOTJhWG92TURSZmNtVnVaR1Z5WldRLnBuZyIsIkNvbmRpdGlvbiI6eyJEYXRlTGVzc1RoYW4iOnsiQVdTOkVwb2NoVGltZSI6MTc5ODc2MTYwMH19fV19&Key-Pair-Id=K2HSFNDJXOU9YS&Signature=gXYxpV6xGg~CBHhfEds~kkb-fOt5VPf1F4Qr7DT8LJivp2FDEGHZ5SzHl13WjA8MogHZT-vwm1I973l3NaBdk0YGBLWFnQttUU5fpB31-pVL9Hbtq3-EBUEhBpp9i8tGwX98n7DY0yoAIJz3~v5Q7XJKRxyFC1Ld6OJdlbcNMnglOQ4eTjmVm-tuSXpJKh6C-3VOJPEvW7QFRNDX1pzxkJwDQk3gyKGsOvzOg~VvtmgWgMustsiOob3lRezCzPKCR0dUogLcKCTSPm7HDzLNJoueER43qWSpAf2gah8x2eJx80e98JEsPRf9qFmhjKNXsnJy~TzqT-FMNBNEERbANA__)

	---

	## 2. Training & Economic Performance

	The following charts are generated from a simulated 80-game self-play run, illustrating how the system's performance evolves over the course of training.

	### 2.1. Training Metrics Dashboard

	This 2x2 dashboard provides a high-level view of the key training metrics. It shows the GRPO training loss decreasing, the combined policy reward increasing, the KL divergence remaining stable (indicating controlled training), and the agent's win rate improving over time.

	![Training Metrics Dashboard](https://private-us-east-1.manuscdn.com/sessionFile/ELP96X8OiHqgxiSAuWbFms/sandbox/SsYEQ33FqlWJCy9d2U9OKk-images_1772600757694_na1fn_L2hvbWUvdWJ1bnR1L2NoZXNzZWNvbl92aXovMDVfdHJhaW5pbmdfbWV0cmljcw.png?Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cHM6Ly9wcml2YXRlLXVzLWVhc3QtMS5tYW51c2Nkbi5jb20vc2Vzc2lvbkZpbGUvRUxQOTZYOE9pSHFneGlTQXVXYkZtcy9zYW5kYm94L1NzWUVRMzNGcWxXSkN5OWQyVTlPS2staW1hZ2VzXzE3NzI2MDA3NTc2OTRfbmExZm5fTDJodmJXVXZkV0oxYm5SMUwyTm9aWE56WldOdmJsOTJhWG92TURWZmRISmhhVzVwYm1kZmJXVjBjbWxqY3cucG5nIiwiQ29uZGl0aW9uIjp7IkRhdGVMZXNzVGhhbiI6eyJBV1M6RXBvY2hUaW1lIjoxNzk4NzYxNjAwfX19XX0_&Key-Pair-Id=K2HSFNDJXOU9YS&Signature=BCPFjCwipKz6hXnELqk2-QEBKmlOeAM8Dm6iPCqezHF2f0gL6KNgi85vs3l2bN8eR7JGj1OywWZ76IPvsOCIC15wRIpnmqL3vP3kTS92av6ZePqbrV0il~6DrNaJL1ABNBJ~RR8DZGFF578CJehWittrqv5zgPo5hUmRhaMUN1SK7qlHT61N0D31P8SVsCxpZbxAQBEBB~oQn34yaFErmeOOjI~jBj2gqcBVMIQuETuINe4x8S6RwHA0qoig7BH--LtTDhKBtJATMVL0ttPcASRqkHOzrtwcV5BN-6Z~K2XRP-xYpn0hVz6-fDVnD2ZOA4JvkdZgmhj~30kyFYggsg__)

	### 2.2. Economic Performance Over Time

	This chart tracks the wallet balances of the White and Black agents over the 80-game simulation. It clearly shows the White agent, which is the primary agent being trained, learning to become profitable, while the less-trained Black agent's balance stagnates or declines. The bottom panel shows the rolling average of net profit per game, reinforcing the trend of improving economic performance.

	![Economic Performance Over Time](https://private-us-east-1.manuscdn.com/sessionFile/ELP96X8OiHqgxiSAuWbFms/sandbox/SsYEQ33FqlWJCy9d2U9OKk-images_1772600757694_na1fn_L2hvbWUvdWJ1bnR1L2NoZXNzZWNvbl92aXovMDZfZWNvbm9taWNfcGVyZm9ybWFuY2U.png?Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cHM6Ly9wcml2YXRlLXVzLWVhc3QtMS5tYW51c2Nkbi5jb20vc2Vzc2lvbkZpbGUvRUxQOTZYOE9pSHFneGlTQXVXYkZtcy9zYW5kYm94L1NzWUVRMzNGcWxXSkN5OWQyVTlPS2staW1hZ2VzXzE3NzI2MDA3NTc2OTRfbmExZm5fTDJodmJXVXZkV0oxYm5SMUwyTm9aWE56WldOdmJsOTJhWG92TURaZlpXTnZibTl0YVdOZmNHVnlabTl5YldGdVkyVS5wbmciLCJDb25kaXRpb24iOnsiRGF0ZUxlc3NUaGFuIjp7IkFXUzpFcG9jaFRpbWUiOjE3OTg3NjE2MDB9fX1dfQ__&Key-Pair-Id=K2HSFNDJXOU9YS&Signature=NRGJRzzs9RbOggZjFdGTC3gPLAuDd9Fx8JgcizZf9wkf57ydgb~zV3i5uYNKiXHHfq97IO4X1G-ZZCvWfwy~CpZpTYnPjoisxWs-gXXz-8p~TQ515aqmZIx4qleCrAL0FnN0pnQTSsRpLxRcqHvNB22JxoD4er-jGREgBhbgMSf2O12MZfqk9e1qF24RPSBhN5yAE-LmxHRWKJPIBWeBhcpS9Dm7YBq2BRM784xmpsWQ5KR8pY4ewaL9KJ4ivmsZtK3C77RZlMuFCzbUI-fg3PQQe8mVATJfijj7i2zXMgBZtQumHqxaMoJlUPgL9tJmgCS8F8YIDuOVrzW978OA5A__)

	---

	## 3. Agent Behavior & Interaction Analysis

	These visualizations dive deeper into the specific behaviors of the agents, particularly the decision to use the premium Claude Coach agent.

	### 3.1. Claude Coaching Usage Analysis

	This set of charts analyzes when and why the Claude Coach is used. It shows that as agents become more skilled, their reliance on coaching decreases. It also demonstrates a clear positive correlation between buying coaching and winning the game, validating its role as a valuable but costly resource.

	![Claude Coaching Usage Analysis](https://private-us-east-1.manuscdn.com/sessionFile/ELP96X8OiHqgxiSAuWbFms/sandbox/SsYEQ33FqlWJCy9d2U9OKk-images_1772600757694_na1fn_L2hvbWUvdWJ1bnR1L2NoZXNzZWNvbl92aXovMDdfY29hY2hpbmdfYW5hbHlzaXM.png?Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cHM6Ly9wcml2YXRlLXVzLWVhc3QtMS5tYW51c2Nkbi5jb20vc2Vzc2lvbkZpbGUvRUxQOTZYOE9pSHFneGlTQXVXYkZtcy9zYW5kYm94L1NzWUVRMzNGcWxXSkN5OWQyVTlPS2staW1hZ2VzXzE3NzI2MDA3NTc2OTRfbmExZm5fTDJodmJXVXZkV0oxYm5SMUwyTm9aWE56WldOdmJsOTJhWG92TURkZlkyOWhZMmhwYm1kZllXNWhiSGx6YVhNLnBuZyIsIkNvbmRpdGlvbiI6eyJEYXRlTGVzc1RoYW4iOnsiQVdTOkVwb2NoVGltZSI6MTc5ODc2MTYwMH19fV19&Key-Pair-Id=K2HSFNDJXOU9YS&Signature=FAhX4iVXS4pFhMSovGXgDGQAUMeu7pIzebURdjN3zHEt4BbH4yXiHSb3LFhm8gOyRlOoUE5ZH3pQ70gcrsE4ZV8m30fzgoB~hmN16jUtexO~eF4NlwDvfS7QRTPxW9jey-IJcdxxHgZDL~ZVdOzSy1-sXcOWK0IfvEGy8d45G~QNMgUf57YpCUebX-zoVJTJhEv2WfeOa0gzVlwa9wqa3ZAm5sb-6k9~SqxN7IoAquFOh1XJpQbmuqy9JmZeIydCYjDv4o7wfeM1wxkNRN3CUkOG9IAYuBKn2RONtBKnSENSJJ31GkW0Tk1LIGOPzomAmqPa0DKJk7wNLMqSUaHTMw__)

	### 3.2. Game Statistics Over Training

	This dashboard shows how game outcomes and length change as the agents train. The pie chart gives an overall distribution, while the line chart shows the White agent's win rate steadily climbing. The histogram of game lengths reveals that games tend to become shorter and more decisive as the agents improve.

	![Game Statistics Over Training](https://private-us-east-1.manuscdn.com/sessionFile/ELP96X8OiHqgxiSAuWbFms/sandbox/SsYEQ33FqlWJCy9d2U9OKk-images_1772600757694_na1fn_L2hvbWUvdWJ1bnR1L2NoZXNzZWNvbl92aXovMDhfZ2FtZV9zdGF0aXN0aWNz.png?Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cHM6Ly9wcml2YXRlLXVzLWVhc3QtMS5tYW51c2Nkbi5jb20vc2Vzc2lvbkZpbGUvRUxQOTZYOE9pSHFneGlTQXVXYkZtcy9zYW5kYm94L1NzWUVRMzNGcWxXSkN5OWQyVTlPS2staW1hZ2VzXzE3NzI2MDA3NTc2OTRfbmExZm5fTDJodmJXVXZkV0oxYm5SMUwyTm9aWE56WldOdmJsOTJhWG92TURoZloyRnRaVjl6ZEdGMGFYTjBhV056LnBuZyIsIkNvbmRpdGlvbiI6eyJEYXRlTGVzc1RoYW4iOnsiQVdTOkVwb2NoVGltZSI6MTc5ODc2MTYwMH19fV19&Key-Pair-Id=K2HSFNDJXOU9YS&Signature=gUdb3ZCb-VNO2Ew1Y4hVXVFOVDUBxdMDdPw-SABMI6-kr9V8o6C2XqG8hvP4yDqw8TIzvS8~YLAHESWbcWDxOTZFkCUI2L590YVeqrBlDhOihV8U9xfHKCDMTX8YKhWSczEgKmlE6ZpW248RFKcZY4y35RmIEIXIK73BDH~XuSCKy6c7FyFwlshXO2UpfJCVeQE3jbut9rvdkChjc1gcLekuztdSdtiB3sDSj9KZLUZKQuW1KozhBE2a2tucAhC0-bYu4p00kDwLgZeEO3rrpXUODpfnnHrTvtn5ZmQEStgWQmoruYHYKW606PLDT~FnwnJ2Dz5ic17YvuxFRzqf0Q__)

	### 3.3. Reward Function Decomposition

	The core of the economic training is the combined reward function. This chart decomposes the reward, showing the relationship between the game outcome (win/loss/draw) and the economic outcome (net profit). It illustrates how the final reward is a blend of both factors, encouraging agents to be both strong players and shrewd business operators.

	![Reward Function Decomposition](https://private-us-east-1.manuscdn.com/sessionFile/ELP96X8OiHqgxiSAuWbFms/sandbox/SsYEQ33FqlWJCy9d2U9OKk-images_1772600757694_na1fn_L2hvbWUvdWJ1bnR1L2NoZXNzZWNvbl92aXovMDlfcmV3YXJkX2RlY29tcG9zaXRpb24.png?Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cHM6Ly9wcml2YXRlLXVzLWVhc3QtMS5tYW51c2Nkbi5jb20vc2Vzc2lvbkZpbGUvRUxQOTZYOE9pSHFneGlTQXVXYkZtcy9zYW5kYm94L1NzWUVRMzNGcWxXSkN5OWQyVTlPS2staW1hZ2VzXzE3NzI2MDA3NTc2OTRfbmExZm5fTDJodmJXVXZkV0oxYm5SMUwyTm9aWE56WldOdmJsOTJhWG92TURsZmNtVjNZWEprWDJSbFkyOXRjRzl6YVhScGIyNC5wbmciLCJDb25kaXRpb24iOnsiRGF0ZUxlc3NUaGFuIjp7IkFXUzpFcG9jaFRpbWUiOjE3OTg3NjE2MDB9fX1dfQ__&Key-Pair-Id=K2HSFNDJXOU9YS&Signature=ANyhIOTVBjmJ31aDD9S1QYcWeZ7sNAB6RCV-eKlYL9OiamGGLm1ZrI3PFf7yG~s0igz27okUQZqn4qVOFU3-yMOHv2IV4ukbmFZVN2V5AV-h~prWZCTmyhHloGOemtQS9HzBaYhvZ4~zL~1h0z5SEDvJS83D8XVqtSufNJt6~V7EY07B1OnMKX031fThxsb9a4veROrpbgN7XcDLAx~DKHm8H0qJuOtCdz~29wuhAsiQBMiuxlUxF6x9uKAPclBeWoON~VCMkrMWgwfdBsXat9lY-Aaawdn6IlY47YXstB6CkqVbSokDlFSdqQWuMfcWXgqbjR4qYKjSr9ZpL3IxhQ__)

	### 3.4. Position Complexity & Claude Trigger Analysis

	Claude is only triggered in complex positions. This chart shows how our heuristic complexity score evolves over a typical game, peaking in the middlegame. The bar chart confirms that the vast majority of Claude coaching calls occur during the strategically rich middlegame phases.

	![Position Complexity & Claude Trigger Analysis](https://private-us-east-1.manuscdn.com/sessionFile/ELP96X8OiHqgxiSAuWbFms/sandbox/SsYEQ33FqlWJCy9d2U9OKk-images_1772600757694_na1fn_L2hvbWUvdWJ1bnR1L2NoZXNzZWNvbl92aXovMTBfY29tcGxleGl0eV9hbmFseXNpcw.png?Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cHM6Ly9wcml2YXRlLXVzLWVhc3QtMS5tYW51c2Nkbi5jb20vc2Vzc2lvbkZpbGUvRUxQOTZYOE9pSHFneGlTQXVXYkZtcy9zYW5kYm94L1NzWUVRMzNGcWxXSkN5OWQyVTlPS2staW1hZ2VzXzE3NzI2MDA3NTc2OTRfbmExZm5fTDJodmJXVXZkV0oxYm5SMUwyTm9aWE56WldOdmJsOTJhWG92TVRCZlkyOXRjR3hsZUdsMGVWOWhibUZzZVhOcGN3LnBuZyIsIkNvbmRpdGlvbiI6eyJEYXRlTGVzc1RoYW4iOnsiQVdTOkVwb2NoVGltZSI6MTc5ODc2MTYwMH19fV19&Key-Pair-Id=K2HSFNDJXOU9YS&Signature=FT4u0A~isN0innd6oMmNiu2ivh9NLyTOiwgClA6GF1kHElKvNDkNGJnD23N25ofdE4LzjdbKy7ewYoXGfiUt65qP~m2f8LJVU7WElkL0i4VejjyRav~tPUKWuPFKCh5YLnKiyiPh9UPUY~tGMciuncMQO2~YxhhK~UiE~E4zX9BO5SuaNVRqwH1ySVIl~RhceOCqi~W6xzKurgzcVUj0pEXsLXT8txJ6WHfCfPG90O21pjWcDYsLTL8D75g6fdTg~JHal6uTRWrhFLPSwX-~JYWlVfSuI~eWaVQliBsyMtWQr3bvXyZ1hkTT3mEKhQ7kFaQN8xuXvwNGZFjzcSZWZw__)

	---

	## 4. Detailed Interaction Visualizations

	Finally, these visualizations provide a granular look at the system's inner workings.

	### 4.1. Single-Game Agent Interaction Timeline

	This Gantt-style chart provides a step-by-step timeline of all agent and system interactions during a single, representative game. It clearly shows the sequence of API calls, decisions, and data flows.

	![Single-Game Agent Interaction Timeline](https://private-us-east-1.manuscdn.com/sessionFile/ELP96X8OiHqgxiSAuWbFms/sandbox/SsYEQ33FqlWJCy9d2U9OKk-images_1772600757694_na1fn_L2hvbWUvdWJ1bnR1L2NoZXNzZWNvbl92aXovMTFfaW50ZXJhY3Rpb25fdGltZWxpbmU.png?Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cHM6Ly9wcml2YXRlLXVzLWVhc3QtMS5tYW51c2Nkbi5jb20vc2Vzc2lvbkZpbGUvRUxQOTZYOE9pSHFneGlTQXVXYkZtcy9zYW5kYm94L1NzWUVRMzNGcWxXSkN5OWQyVTlPS2staW1hZ2VzXzE3NzI2MDA3NTc2OTRfbmExZm5fTDJodmJXVXZkV0oxYm5SMUwyTm9aWE56WldOdmJsOTJhWG92TVRGZmFXNTBaWEpoWTNScGIyNWZkR2x0Wld4cGJtVS5wbmciLCJDb25kaXRpb24iOnsiRGF0ZUxlc3NUaGFuIjp7IkFXUzpFcG9jaFRpbWUiOjE3OTg3NjE2MDB9fX1dfQ__&Key-Pair-Id=K2HSFNDJXOU9YS&Signature=awdawO~8OoLoBXuZk4TAsiUWSJerJfQHuHhhnOysVQtPFPaIOe9m7LzkBuHgLvnEfqnX0PVesjp~33yK5Q6~Dj9fHe~DRELJyTNEu9Ok8Lk8FPmQvHSX9S0hUbWsWoBj6kbMS6hlF6niGiOXsrN0FPG2ekIaVgYbVhQyHLyCaX509HucACzRBprpgN5IvXinbb8AUHbL-n0AR-Oni2Vlw3ORLXQ3Tob20N0czLPAnlAJ9SKL-ox4q6rB6cIXYTX45alJWJPtMNi9nUWlecfGHKSbadmI0g-CLpd5iQYCyTEvEZg0BAnD~siMrJRWbRiZcUFns1dStzD2Q2BVWMu5mQ__)

	### 4.2. Money Flow Sankey Diagram

	This diagram visualizes the aggregate flow of money across a simulated 10-game tournament, providing a clear picture of the overall economy.

	![Money Flow Sankey Diagram](https://private-us-east-1.manuscdn.com/sessionFile/ELP96X8OiHqgxiSAuWbFms/sandbox/SsYEQ33FqlWJCy9d2U9OKk-images_1772600757694_na1fn_L2hvbWUvdWJ1bnR1L2NoZXNzZWNvbl92aXovMTJfbW9uZXlfZmxvdw.png?Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cHM6Ly9wcml2YXRlLXVzLWVhc3QtMS5tYW51c2Nkbi5jb20vc2Vzc2lvbkZpbGUvRUxQOTZYOE9pSHFneGlTQXVXYkZtcy9zYW5kYm94L1NzWUVRMzNGcWxXSkN5OWQyVTlPS2staW1hZ2VzXzE3NzI2MDA3NTc2OTRfbmExZm5fTDJodmJXVXZkV0oxYm5SMUwyTm9aWE56WldOdmJsOTJhWG92TVRKZmJXOXVaWGxmWm14dmR3LnBuZyIsIkNvbmRpdGlvbiI6eyJEYXRlTGVzc1RoYW4iOnsiQVdTOkVwb2NoVGltZSI6MTc5ODc2MTYwMH19fV19&Key-Pair-Id=K2HSFNDJXOU9YS&Signature=NFIrwUUsVxNfrhwL68E7Y7hpBmjQNxPoBpPJTj-gW3Umo-43HIgvpcAC9rqwp04HHhft56JvBU3GAjhy-TSiJyFy91aL4RsmLWYbNZ8b9MZYSSAxGTm7XAMHAukHyvEsPbjFShYmw4TZ6fgwe0TBQ6SfL1dO~Fea4WgV3S-EdIEabiPadqNnfGY5X4IdxNpwg-MnfgANGkzcNTC7dMfwS2BBlfNmG5ndYpG5AmPfbLJ-5hRllpEBU9AYY0Pn0Y35SNdfvJO2dBPxitPEiTaAfWyC79VTqLnVOV5bfRor26jxqN~v5dVeJynJllOquree0WugOoE0W1Y6I4M4ZdxNNQ__)

	### 4.3. LLM Prompt Structure

	The behavior of the agents is driven by carefully crafted prompts. This visualization shows the exact structure of the prompts sent to both the trainable Player Agent (Qwen/Llama) and the premium Claude Coach Agent.

	![LLM Prompt Structure](https://private-us-east-1.manuscdn.com/sessionFile/ELP96X8OiHqgxiSAuWbFms/sandbox/SsYEQ33FqlWJCy9d2U9OKk-images_1772600757694_na1fn_L2hvbWUvdWJ1bnR1L2NoZXNzZWNvbl92aXovMTNfcHJvbXB0X3N0cnVjdHVyZQ.png?Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cHM6Ly9wcml2YXRlLXVzLWVhc3QtMS5tYW51c2Nkbi5jb20vc2Vzc2lvbkZpbGUvRUxQOTZYOE9pSHFneGlTQXVXYkZtcy9zYW5kYm94L1NzWUVRMzNGcWxXSkN5OWQyVTlPS2staW1hZ2VzXzE3NzI2MDA3NTc2OTRfbmExZm5fTDJodmJXVXZkV0oxYm5SMUwyTm9aWE56WldOdmJsOTJhWG92TVROZmNISnZiWEIwWDNOMGNuVmpkSFZ5WlEucG5nIiwiQ29uZGl0aW9uIjp7IkRhdGVMZXNzVGhhbiI6eyJBV1M6RXBvY2hUaW1lIjoxNzk4NzYxNjAwfX19XX0_&Key-Pair-Id=K2HSFNDJXOU9YS&Signature=WetJozFy20bllcTD6aod9dtE6rdk-8mrKAi9Hej~RzMt92vRbNOn2hvBrtxDMCtIXFX1NHyQiPEctrjDJ6SwubhHZZJlVuPCXWaYQVJvPpp1uvqAIcPOBJhrn40Yo8rVoi9uTam0z1VrYUsm7Z0jGN8ewl8OvxIhmglrAbqq1Ri9e6Sj2isvVNPSF5JzSNmKQ14IDJyHYxsXezLfQ0YftMsODBWdbigJpWjIQNkD0sYeJvwAUuBR4LOtSLHwPWv4-ZcmNJuI4fUkhFHuMT7VCLd0mpOIAsBiNsN~hBOx2txRAgFVrCfIpZqKsDtrc9QWUoUwZTQ2XQWysgue1~hBXw__)

	### 4.4. Summary Dashboard

	This final dashboard provides a one-glance summary of the entire training process, combining key performance indicators (KPIs) with trend lines for win rate, profit, and coaching usage.

	![Summary Dashboard](https://private-us-east-1.manuscdn.com/sessionFile/ELP96X8OiHqgxiSAuWbFms/sandbox/SsYEQ33FqlWJCy9d2U9OKk-images_1772600757694_na1fn_L2hvbWUvdWJ1bnR1L2NoZXNzZWNvbl92aXovMTRfc3VtbWFyeV9kYXNoYm9hcmQ.png?Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cHM6Ly9wcml2YXRlLXVzLWVhc3QtMS5tYW51c2Nkbi5jb20vc2Vzc2lvbkZpbGUvRUxQOTZYOE9pSHFneGlTQXVXYkZtcy9zYW5kYm94L1NzWUVRMzNGcWxXSkN5OWQyVTlPS2staW1hZ2VzXzE3NzI2MDA3NTc2OTRfbmExZm5fTDJodmJXVXZkV0oxYm5SMUwyTm9aWE56WldOdmJsOTJhWG92TVRSZmMzVnRiV0Z5ZVY5a1lYTm9ZbTloY21RLnBuZyIsIkNvbmRpdGlvbiI6eyJEYXRlTGVzc1RoYW4iOnsiQVdTOkVwb2NoVGltZSI6MTc5ODc2MTYwMH19fV19&Key-Pair-Id=K2HSFNDJXOU9YS&Signature=Y6YI5LtCBwodv4T-P-XqOWgxcVfIjfzH7Kc7iggFpyDuJsTc7LR3C9UhOSK9zihh9BTzPPriKUGyuoHmgZuq5kqp1ggCMOIVXwBQ0VjLJ2d3885RpRrnpAoG3ZeWk8iBtCUF0HpZw9~dvE8aWCG2DLpW9ly-~8ETsbV9GUBkuC777gDAF64EuKBN2WgMtf4K5es1R~7Sv5zhBBTWBYHgbGvcZwpnLO5Cpj5BKKkTZYnh-qEcBbN1R3M~QJCAz5Bjz3uT87zitUYQMwaopdyyTEyF8MHKOab2cNH1IZa-q30TsokkRUmSrC9ot7WL~Sp9gF2f8OyNE6oY7RT54TMoXw__)

	---

	## Conclusion

	These visualizations collectively demonstrate a robust and well-defined system where AI agents learn to navigate a competitive environment with real economic constraints. The data shows clear evidence of learning, both in terms of chess-playing ability and economic decision-making, validating the core principles of the ChessEcon project.