Muqeeth commited on Nov 29, 2025

Commit

7684194

verified ·

1 Parent(s): 560c41c

Add files using upload-large-folder tool

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

src_code_for_reproducibility/docs/source/environments.rst +35 -0
src_code_for_reproducibility/docs/source/index.rst +22 -0
src_code_for_reproducibility/docs/source/installation.rst +10 -0
src_code_for_reproducibility/docs/source/src.environments.dond.dond_agent.rst +7 -0
src_code_for_reproducibility/docs/source/src.environments.dond.dond_game.rst +7 -0
src_code_for_reproducibility/docs/source/src.environments.dond.dond_log_funcs.rst +7 -0
src_code_for_reproducibility/docs/source/src.environments.dond.dond_player.rst +7 -0
src_code_for_reproducibility/docs/source/src.environments.dond.dond_return_funcs.rst +7 -0
src_code_for_reproducibility/docs/source/src.environments.dond.dond_training_data_funcs.rst +7 -0
src_code_for_reproducibility/docs/source/src.environments.dond.rst +19 -0
src_code_for_reproducibility/docs/source/src.environments.env_imports.rst +7 -0
src_code_for_reproducibility/docs/source/src.environments.environment_imports.rst +7 -0
src_code_for_reproducibility/docs/source/src.environments.ipd.ipd_agent.rst +7 -0
src_code_for_reproducibility/docs/source/src.environments.ipd.ipd_game.rst +7 -0
src_code_for_reproducibility/docs/source/src.environments.ipd.ipd_log_funcs.rst +7 -0
src_code_for_reproducibility/docs/source/src.environments.ipd.ipd_training_data_funcs.rst +7 -0
src_code_for_reproducibility/docs/source/src.environments.ipd.rst +19 -0
src_code_for_reproducibility/docs/source/src.environments.rst +25 -0
src_code_for_reproducibility/docs/source/src.experiments.arithmetic_test.rst +7 -0
src_code_for_reproducibility/docs/source/src.experiments.dond_run_train.rst +7 -0
src_code_for_reproducibility/docs/source/src.experiments.generate_and_train.rst +7 -0
src_code_for_reproducibility/docs/source/src.experiments.last_completion.rst +7 -0
src_code_for_reproducibility/docs/source/src.generation.rst +15 -0
src_code_for_reproducibility/docs/source/src.generation.run_games.rst +7 -0
src_code_for_reproducibility/docs/source/src.models.dummy_hf_agent.rst +7 -0
src_code_for_reproducibility/docs/source/src.models.dummy_local_llm.rst +7 -0
src_code_for_reproducibility/docs/source/src.models.new_local_llm.rst +7 -0
src_code_for_reproducibility/docs/source/src.models.rst +20 -0
src_code_for_reproducibility/docs/source/src.models.updatable_worker.rst +7 -0
src_code_for_reproducibility/docs/source/src.models.vllm_worker_wrap.rst +7 -0
src_code_for_reproducibility/docs/source/src.training.ppo_train_value_head.rst +7 -0
src_code_for_reproducibility/docs/source/src.training.reinforce_training.rst +7 -0
src_code_for_reproducibility/docs/source/src.training.rl_convs_processing.rst +7 -0
src_code_for_reproducibility/docs/source/src.training.rst +19 -0
src_code_for_reproducibility/docs/source/src.training.train_main.rst +7 -0
src_code_for_reproducibility/docs/source/src.utils.common_imports.rst +7 -0
src_code_for_reproducibility/docs/source/src.utils.export_ppo_training_set.rst +7 -0
src_code_for_reproducibility/docs/source/src.utils.log_statistics.rst +7 -0
src_code_for_reproducibility/docs/source/src.utils.parallel_shuffle.rst +7 -0
src_code_for_reproducibility/docs/source/src.utils.rst +24 -0
src_code_for_reproducibility/docs/source/src.utils.update_start_epoch.rst +7 -0
src_code_for_reproducibility/markov_games/__pycache__/__init__.cpython-312.pyc +0 -0
src_code_for_reproducibility/markov_games/__pycache__/agent.cpython-312.pyc +0 -0
src_code_for_reproducibility/markov_games/__pycache__/alternative_actions_runner.cpython-312.pyc +0 -0
src_code_for_reproducibility/markov_games/__pycache__/gather_and_export_utils.cpython-312.pyc +0 -0
src_code_for_reproducibility/markov_games/__pycache__/group_timesteps.cpython-312.pyc +0 -0
src_code_for_reproducibility/markov_games/__pycache__/linear_runner.cpython-312.pyc +0 -0
src_code_for_reproducibility/markov_games/__pycache__/markov_game.cpython-312.pyc +0 -0
src_code_for_reproducibility/markov_games/__pycache__/mg_utils.cpython-312.pyc +0 -0
src_code_for_reproducibility/markov_games/__pycache__/rollout_tree.cpython-312.pyc +0 -0

src_code_for_reproducibility/docs/source/environments.rst ADDED Viewed

	@@ -0,0 +1,35 @@

+=================
+MARL Environments
+=================
+This section provides detailed documentation for the multi-agent negotiation environments included in the library.
+Each environment follows the standard interface described in :doc:`../environments` but has its own unique game rules,
+dynamics, and implementation details.
+.. toctree::
+   :maxdepth: 2
+   :caption: Available Environments:
+   environments/ipd
+   environments/diplomacy
+   environments/dond
+Overview
+--------
+The library currently includes the following environments:
+1. **Iterated Prisoner's Dilemma (IPD)**: A classic game theory problem where two agents repeatedly decide whether to cooperate or defect, with different payoffs based on their joint actions.
+2. **Diplomacy**: An adaptation of the board game Diplomacy, where seven European powers compete for control of supply centers through strategic moves and alliances.
+3. **Deal or No Deal (DOND)**: A negotiation environment based on `the paper Deal or No Deal? End-to-End Learning for Negotiation Dialogues <https://arxiv.org/pdf/1706.05125>`_ in which agents negotiate over the distribution of a set of prizes.
+Each environment documentation includes:
+- Game rules and background
+- Implementation details
+- API reference
+- Example usage
+- Advanced features and customization options

src_code_for_reproducibility/docs/source/index.rst ADDED Viewed

	@@ -0,0 +1,22 @@

+Welcome to LLM Negotiation's documentation!
+===========================================
+This library is a collection of tools for training and evaluating LLM-based agents in multi-agent environments. It is designed to be easy to use and extend.
+.. toctree::
+   :maxdepth: 3
+   :caption: Contents:
+   installation
+   marl_standard
+   environments
+   launch
+   usage
+   modules
+   contributing
+Indices and tables
+==================
+* :ref:`genindex`
+* :ref:`modindex`
+* :ref:`search`

src_code_for_reproducibility/docs/source/installation.rst ADDED Viewed

	@@ -0,0 +1,10 @@

+Installation
+===========
+To install the package, run:
+.. code-block:: bash
+   git clone https://github.com/yourusername/llm_negotiation.git
+   cd llm_negotiation
+   pip install -e .

src_code_for_reproducibility/docs/source/src.environments.dond.dond_agent.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.environments.dond.dond\_agent module
+========================================
+.. automodule:: src.environments.dond.dond_agent
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.environments.dond.dond_game.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.environments.dond.dond\_game module
+=======================================
+.. automodule:: src.environments.dond.dond_game
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.environments.dond.dond_log_funcs.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.environments.dond.dond\_log\_funcs module
+=============================================
+.. automodule:: src.environments.dond.dond_log_funcs
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.environments.dond.dond_player.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.environments.dond.dond\_agent module
+=========================================
+.. automodule:: src.environments.dond.dond_agent
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.environments.dond.dond_return_funcs.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.environments.dond.dond\_return\_funcs module
+================================================
+.. automodule:: src.environments.dond.dond_return_funcs
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.environments.dond.dond_training_data_funcs.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.environments.dond.dond\_training\_data\_funcs module
+========================================================
+.. automodule:: src.environments.dond.dond_training_data_funcs
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.environments.dond.rst ADDED Viewed

	@@ -0,0 +1,19 @@

+src.environments.dond package
+=============================
+.. automodule:: src.environments.dond
+   :members:
+   :undoc-members:
+   :show-inheritance:
+Submodules
+----------
+.. toctree::
+   :maxdepth: 4
+   src.environments.dond.dond_agent
+   src.environments.dond.dond_game
+   src.environments.dond.dond_log_funcs
+   src.environments.dond.dond_statistics_funcs
+   src.environments.dond.dond_training_data_funcs

src_code_for_reproducibility/docs/source/src.environments.env_imports.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.environments.env\_imports module
+====================================
+.. automodule:: src.environments.env_imports
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.environments.environment_imports.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.environments.environment\_imports module
+============================================
+.. automodule:: src.environments.environment_imports
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.environments.ipd.ipd_agent.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.environments.ipd.ipd\_agent module
+======================================
+.. automodule:: src.environments.ipd.ipd_agent
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.environments.ipd.ipd_game.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.environments.ipd.ipd\_game module
+=====================================
+.. automodule:: src.environments.ipd.ipd_game
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.environments.ipd.ipd_log_funcs.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.environments.ipd.ipd\_log\_funcs module
+===========================================
+.. automodule:: src.environments.ipd.ipd_log_funcs
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.environments.ipd.ipd_training_data_funcs.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.environments.ipd.ipd\_training\_data\_funcs module
+======================================================
+.. automodule:: src.environments.ipd.ipd_training_data_funcs
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.environments.ipd.rst ADDED Viewed

	@@ -0,0 +1,19 @@

+src.environments.ipd package
+============================
+.. automodule:: src.environments.ipd
+   :members:
+   :undoc-members:
+   :show-inheritance:
+Submodules
+----------
+.. toctree::
+   :maxdepth: 4
+   src.environments.ipd.ipd_agent
+   src.environments.ipd.ipd_game
+   src.environments.ipd.ipd_log_funcs
+   src.environments.ipd.ipd_statistics_funcs
+   src.environments.ipd.ipd_training_data_funcs

src_code_for_reproducibility/docs/source/src.environments.rst ADDED Viewed

	@@ -0,0 +1,25 @@

+src.environments package
+========================
+.. automodule:: src.environments
+   :members:
+   :undoc-members:
+   :show-inheritance:
+Subpackages
+-----------
+.. toctree::
+   :maxdepth: 4
+   src.environments.dond
+   src.environments.ipd
+Submodules
+----------
+.. toctree::
+   :maxdepth: 4
+   src.environments.env_imports
+   src.environments.environment_imports

src_code_for_reproducibility/docs/source/src.experiments.arithmetic_test.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.experiments.arithmetic\_test module
+=======================================
+.. automodule:: src.experiments.arithmetic_test
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.experiments.dond_run_train.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.experiments.dond\_run\_train module
+=======================================
+.. automodule:: src.experiments.dond_run_train
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.experiments.generate_and_train.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.experiments.generate\_and\_train module
+===========================================
+.. automodule:: src.experiments.generate_and_train
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.experiments.last_completion.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.experiments.last\_completion module
+=======================================
+.. automodule:: src.experiments.last_completion
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.generation.rst ADDED Viewed

	@@ -0,0 +1,15 @@

+src.generation package
+======================
+.. automodule:: src.generation
+   :members:
+   :undoc-members:
+   :show-inheritance:
+Submodules
+----------
+.. toctree::
+   :maxdepth: 4
+   src.generation.run_games

src_code_for_reproducibility/docs/source/src.generation.run_games.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.generation.run\_games module
+================================
+.. automodule:: src.generation.run_games
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.models.dummy_hf_agent.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.models.dummy\_hf\_agent module
+==================================
+.. automodule:: src.models.dummy_llm_agent
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.models.dummy_local_llm.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.models.dummy\_local\_llm module
+===================================
+.. automodule:: src.models.dummy_local_llm
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.models.new_local_llm.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.models.new\_local\_llm module
+=================================
+.. automodule:: src.models.new_local_llm
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.models.rst ADDED Viewed

	@@ -0,0 +1,20 @@

+src.models package
+==================
+.. automodule:: src.models
+   :members:
+   :undoc-members:
+   :show-inheritance:
+Submodules
+----------
+.. toctree::
+   :maxdepth: 4
+   src.models.dummy_local_llm
+   src.models.local_llm
+   src.models.new_local_llm
+   src.models.server_llm
+   src.models.updatable_worker
+   src.models.vllm_worker_wrap

src_code_for_reproducibility/docs/source/src.models.updatable_worker.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.models.updatable\_worker module
+===================================
+.. automodule:: src.models.updatable_worker
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.models.vllm_worker_wrap.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.models.vllm\_worker\_wrap module
+====================================
+.. automodule:: src.models.vllm_worker_wrap
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.training.ppo_train_value_head.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.training.ppo\_train\_value\_head module
+===========================================
+.. automodule:: src.training.ppo_train_value_head
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.training.reinforce_training.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.training.reinforce\_training module
+=======================================
+.. automodule:: src.training.reinforce_training
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.training.rl_convs_processing.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.training.rl\_convs\_processing module
+=========================================
+.. automodule:: src.training.rl_convs_processing
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.training.rst ADDED Viewed

	@@ -0,0 +1,19 @@

+src.training package
+====================
+.. automodule:: src.training
+   :members:
+   :undoc-members:
+   :show-inheritance:
+Submodules
+----------
+.. toctree::
+   :maxdepth: 4
+   src.training.ppo_train
+   src.training.ppo_train_value_head
+   src.training.reinforce_training
+   src.training.rl_convs_processing
+   src.training.train_main

src_code_for_reproducibility/docs/source/src.training.train_main.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.training.train\_main module
+===============================
+.. automodule:: src.training.train_main
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.utils.common_imports.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.utils.common\_imports module
+================================
+.. automodule:: src.utils.common_imports
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.utils.export_ppo_training_set.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.utils.export\_ppo\_training\_set module
+===========================================
+.. automodule:: src.utils.export_ppo_training_set
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.utils.log_statistics.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.utils.log\_statistics module
+================================
+.. automodule:: src.utils.log_statistics
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.utils.parallel_shuffle.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.utils.parallel\_shuffle module
+==================================
+.. automodule:: src.utils.parallel_shuffle
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/docs/source/src.utils.rst ADDED Viewed

	@@ -0,0 +1,24 @@

+src.utils package
+=================
+.. automodule:: src.utils
+   :members:
+   :undoc-members:
+   :show-inheritance:
+Submodules
+----------
+.. toctree::
+   :maxdepth: 4
+   src.utils.common_imports
+   src.utils.export_ppo_training_set
+   src.utils.extra_stats
+   src.utils.inherit_args
+   src.utils.log_gpu_usage
+   src.utils.log_statistics
+   src.utils.model_to_cpu
+   src.utils.parallel_shuffle
+   src.utils.quick_stats
+   src.utils.update_start_epoch

src_code_for_reproducibility/docs/source/src.utils.update_start_epoch.rst ADDED Viewed

	@@ -0,0 +1,7 @@

+src.utils.update\_start\_epoch module
+=====================================
+.. automodule:: src.utils.update_start_epoch
+   :members:
+   :undoc-members:
+   :show-inheritance:

src_code_for_reproducibility/markov_games/__pycache__/__init__.cpython-312.pyc ADDED Viewed

Binary file (159 Bytes). View file

src_code_for_reproducibility/markov_games/__pycache__/agent.cpython-312.pyc ADDED Viewed

Binary file (3.2 kB). View file

src_code_for_reproducibility/markov_games/__pycache__/alternative_actions_runner.cpython-312.pyc ADDED Viewed

Binary file (4.95 kB). View file

src_code_for_reproducibility/markov_games/__pycache__/gather_and_export_utils.cpython-312.pyc ADDED Viewed

Binary file (46.5 kB). View file

src_code_for_reproducibility/markov_games/__pycache__/group_timesteps.cpython-312.pyc ADDED Viewed

Binary file (6.17 kB). View file

src_code_for_reproducibility/markov_games/__pycache__/linear_runner.cpython-312.pyc ADDED Viewed

Binary file (1.25 kB). View file

src_code_for_reproducibility/markov_games/__pycache__/markov_game.cpython-312.pyc ADDED Viewed

Binary file (9.72 kB). View file

src_code_for_reproducibility/markov_games/__pycache__/mg_utils.cpython-312.pyc ADDED Viewed

Binary file (3.98 kB). View file

src_code_for_reproducibility/markov_games/__pycache__/rollout_tree.cpython-312.pyc ADDED Viewed

Binary file (3.67 kB). View file