diff --git "a/logs/20250526_191827/train.log" "b/logs/20250526_191827/train.log"
new file mode 100644--- /dev/null
+++ "b/logs/20250526_191827/train.log"
@@ -0,0 +1,2057 @@
+2025-05-26 19:18:47,642	INFO dashboard_sdk.py:338 -- Uploading package gcs://_ray_pkg_321e0871e56ca1df.zip.
+2025-05-26 19:18:47,643	INFO packaging.py:575 -- Creating a file package for local module '/mnt/petrelfs/luyiting/MultiAgentEval/lmm-r1'.
+2025-05-26 19:18:46,714	INFO cli.py:39 -- [37mJob submission server address[39m: [1mhttp://127.0.0.1:2983[22m
+2025-05-26 19:18:53,403	SUCC cli.py:63 -- [32m-------------------------------------------------------[39m
+2025-05-26 19:18:53,403	SUCC cli.py:64 -- [32mJob 'raysubmit_YRVyrdpJQsux5E4C' submitted successfully[39m
+2025-05-26 19:18:53,403	SUCC cli.py:65 -- [32m-------------------------------------------------------[39m
+2025-05-26 19:18:53,403	INFO cli.py:289 -- [36mNext steps[39m
+2025-05-26 19:18:53,403	INFO cli.py:290 -- Query the logs of the job:
+2025-05-26 19:18:53,403	INFO cli.py:292 -- [1mray job logs raysubmit_YRVyrdpJQsux5E4C[22m
+2025-05-26 19:18:53,403	INFO cli.py:294 -- Query the status of the job:
+2025-05-26 19:18:53,403	INFO cli.py:296 -- [1mray job status raysubmit_YRVyrdpJQsux5E4C[22m
+2025-05-26 19:18:53,403	INFO cli.py:298 -- Request the job to be stopped:
+2025-05-26 19:18:53,404	INFO cli.py:300 -- [1mray job stop raysubmit_YRVyrdpJQsux5E4C[22m
+2025-05-26 19:18:53,406	INFO cli.py:307 -- Tailing logs until the job exits (disable with --no-wait):
+2025-05-26 19:18:52,847	INFO job_manager.py:531 -- Runtime env is setting up.
+[2025-05-26 19:19:13,190] [INFO] [real_accelerator.py:222:get_accelerator] Setting ds_accelerator to cuda (auto detect)
+INFO 05-26 19:19:17 [__init__.py:239] Automatically detected platform cuda.
+2025-05-26 19:19:18,557	INFO worker.py:1520 -- Using address 10.140.1.87:6231 set in the environment variable RAY_ADDRESS
+2025-05-26 19:19:18,559	INFO worker.py:1660 -- Connecting to existing Ray cluster at address: 10.140.1.87:6231...
+2025-05-26 19:19:18,580	INFO worker.py:1843 -- Connected to Ray cluster. View the dashboard at [1m[32m10.140.1.87:2983 [39m[22m
+[36m(pid=89991)[0m INFO 05-26 19:19:38 [__init__.py:239] Automatically detected platform cuda.
+[36m(LLMRayActor pid=89992)[0m INFO 05-26 19:20:05 [config.py:585] This model supports multiple tasks: {'score', 'reward', 'classify', 'embed', 'generate'}. Defaulting to 'generate'.
+[36m(pid=89985)[0m INFO 05-26 19:19:38 [__init__.py:239] Automatically detected platform cuda.[32m [repeated 7x across cluster] (Ray deduplicates logs by default. Set RAY_DEDUP_LOGS=0 to disable log deduplication, or see https://docs.ray.io/en/master/ray-observability/user-guides/configure-logging.html#log-deduplication for more options.)[0m
+[36m(LLMRayActor pid=89991)[0m INFO 05-26 19:20:05 [config.py:585] This model supports multiple tasks: {'reward', 'generate', 'embed', 'classify', 'score'}. Defaulting to 'generate'.
+[36m(LLMRayActor pid=89991)[0m WARNING 05-26 19:20:05 [arg_utils.py:1846] VLLM_ATTENTION_BACKEND=triton is not supported by the V1 Engine. Falling back to V0. We recommend to remove VLLM_ATTENTION_BACKEND=triton from your config in favor of the V1 Engine.
+[36m(LLMRayActor pid=89991)[0m WARNING 05-26 19:20:05 [arg_utils.py:1745] --enable-prefix-caching is not supported for multimodal models in V0 and has been disabled.
+[36m(LLMRayActor pid=89991)[0m INFO 05-26 19:20:05 [llm_engine.py:241] Initializing a V0 LLM engine (v0.8.2.dev76+gf68cce8) with config: model='/mnt/petrelfs/luyiting/ckt/Qwen2.5-VL-7B-Instruct/Qwen2.5-VL-7B-Instruct/', speculative_config=None, tokenizer='/mnt/petrelfs/luyiting/ckt/Qwen2.5-VL-7B-Instruct/Qwen2.5-VL-7B-Instruct/', skip_tokenizer_init=False, tokenizer_mode=auto, revision=None, override_neuron_config=None, tokenizer_revision=None, trust_remote_code=True, dtype=torch.bfloat16, max_seq_len=8192, download_dir=None, load_format=auto, tensor_parallel_size=1, pipeline_parallel_size=1, disable_custom_all_reduce=False, quantization=None, enforce_eager=False, kv_cache_dtype=auto,  device_config=cuda, decoding_config=DecodingConfig(guided_decoding_backend='xgrammar', reasoning_backend=None), observability_config=ObservabilityConfig(show_hidden_metrics=False, otlp_traces_endpoint=None, collect_model_forward_time=False, collect_model_execute_time=False), seed=42, served_model_name=/mnt/petrelfs/luyiting/ckt/Qwen2.5-VL-7B-Instruct/Qwen2.5-VL-7B-Instruct/, num_scheduler_steps=1, multi_step_stream_outputs=True, enable_prefix_caching=False, chunked_prefill_enabled=False, use_async_output_proc=True, disable_mm_preprocessor_cache=False, mm_processor_kwargs=None, pooler_config=None, compilation_config={"splitting_ops":[],"compile_sizes":[],"cudagraph_capture_sizes":[256,248,240,232,224,216,208,200,192,184,176,168,160,152,144,136,128,120,112,104,96,88,80,72,64,56,48,40,32,24,16,8,4,2,1],"max_capture_size":256}, use_cached_outputs=False, 
+[36m(LLMRayActor pid=89988)[0m INFO 05-26 19:20:05 [config.py:585] This model supports multiple tasks: {'embed', 'generate', 'classify', 'reward', 'score'}. Defaulting to 'generate'.
+[36m(LLMRayActor pid=89993)[0m INFO 05-26 19:20:05 [config.py:585] This model supports multiple tasks: {'score', 'reward', 'embed', 'classify', 'generate'}. Defaulting to 'generate'.
+[36m(LLMRayActor pid=89986)[0m INFO 05-26 19:20:05 [config.py:585] This model supports multiple tasks: {'classify', 'generate', 'score', 'embed', 'reward'}. Defaulting to 'generate'.
+[36m(LLMRayActor pid=89989)[0m INFO 05-26 19:20:05 [config.py:585] This model supports multiple tasks: {'generate', 'reward', 'score', 'embed', 'classify'}. Defaulting to 'generate'.
+[36m(LLMRayActor pid=89990)[0m INFO 05-26 19:20:05 [config.py:585] This model supports multiple tasks: {'reward', 'classify', 'embed', 'generate', 'score'}. Defaulting to 'generate'.
+[36m(LLMRayActor pid=89985)[0m INFO 05-26 19:20:05 [config.py:585] This model supports multiple tasks: {'classify', 'embed', 'reward', 'score', 'generate'}. Defaulting to 'generate'.
+[36m(LLMRayActor pid=89991)[0m [2025-05-26 19:20:08,722] [INFO] [real_accelerator.py:222:get_accelerator] Setting ds_accelerator to cuda (auto detect)
+[36m(LLMRayActor pid=89991)[0m INFO 05-26 19:20:13 [cuda.py:293] Using Flash Attention backend.
+[36m(LLMRayActor pid=89985)[0m WARNING 05-26 19:20:05 [arg_utils.py:1846] VLLM_ATTENTION_BACKEND=triton is not supported by the V1 Engine. Falling back to V0. We recommend to remove VLLM_ATTENTION_BACKEND=triton from your config in favor of the V1 Engine.[32m [repeated 7x across cluster][0m
+[36m(LLMRayActor pid=89985)[0m WARNING 05-26 19:20:05 [arg_utils.py:1745] --enable-prefix-caching is not supported for multimodal models in V0 and has been disabled.[32m [repeated 7x across cluster][0m
+[36m(LLMRayActor pid=89985)[0m INFO 05-26 19:20:05 [llm_engine.py:241] Initializing a V0 LLM engine (v0.8.2.dev76+gf68cce8) with config: model='/mnt/petrelfs/luyiting/ckt/Qwen2.5-VL-7B-Instruct/Qwen2.5-VL-7B-Instruct/', speculative_config=None, tokenizer='/mnt/petrelfs/luyiting/ckt/Qwen2.5-VL-7B-Instruct/Qwen2.5-VL-7B-Instruct/', skip_tokenizer_init=False, tokenizer_mode=auto, revision=None, override_neuron_config=None, tokenizer_revision=None, trust_remote_code=True, dtype=torch.bfloat16, max_seq_len=8192, download_dir=None, load_format=auto, tensor_parallel_size=1, pipeline_parallel_size=1, disable_custom_all_reduce=False, quantization=None, enforce_eager=False, kv_cache_dtype=auto,  device_config=cuda, decoding_config=DecodingConfig(guided_decoding_backend='xgrammar', reasoning_backend=None), observability_config=ObservabilityConfig(show_hidden_metrics=False, otlp_traces_endpoint=None, collect_model_forward_time=False, collect_model_execute_time=False), seed=49, served_model_name=/mnt/petrelfs/luyiting/ckt/Qwen2.5-VL-7B-Instruct/Qwen2.5-VL-7B-Instruct/, num_scheduler_steps=1, multi_step_stream_outputs=True, enable_prefix_caching=False, chunked_prefill_enabled=False, use_async_output_proc=True, disable_mm_preprocessor_cache=False, mm_processor_kwargs=None, pooler_config=None, compilation_config={"splitting_ops":[],"compile_sizes":[],"cudagraph_capture_sizes":[256,248,240,232,224,216,208,200,192,184,176,168,160,152,144,136,128,120,112,104,96,88,80,72,64,56,48,40,32,24,16,8,4,2,1],"max_capture_size":256}, use_cached_outputs=False, [32m [repeated 7x across cluster][0m
+[36m(LLMRayActor pid=89988)[0m INFO 05-26 19:20:16 [parallel_state.py:967] rank 0 in world size 1 is assigned as DP rank 0, PP rank 0, TP rank 0
+[36m(LLMRayActor pid=89988)[0m INFO 05-26 19:20:16 [model_runner.py:1110] Starting to load model /mnt/petrelfs/luyiting/ckt/Qwen2.5-VL-7B-Instruct/Qwen2.5-VL-7B-Instruct/...
+[36m(LLMRayActor pid=89985)[0m [2025-05-26 19:20:08,723] [INFO] [real_accelerator.py:222:get_accelerator] Setting ds_accelerator to cuda (auto detect)[32m [repeated 7x across cluster][0m
+[36m(LLMRayActor pid=89988)[0m INFO 05-26 19:20:16 [config.py:3229] cudagraph sizes specified by model runner [1, 2, 4, 8, 16, 24, 32, 40, 48, 56, 64, 72, 80, 88, 96, 104, 112, 120, 128, 136, 144, 152, 160, 168, 176, 184, 192, 200, 208, 216, 224, 232, 240, 248, 256] is overridden by config [256, 128, 2, 1, 4, 136, 8, 144, 16, 152, 24, 160, 32, 168, 40, 176, 48, 184, 56, 192, 64, 200, 72, 208, 80, 216, 88, 120, 224, 96, 232, 104, 240, 112, 248]
+[36m(LLMRayActor pid=89990)[0m 
+Loading safetensors checkpoint shards:   0% Completed | 0/5 [00:00<?, ?it/s]
+[36m(LLMRayActor pid=89990)[0m 
+Loading safetensors checkpoint shards:  20% Completed | 1/5 [00:01<00:04,  1.11s/it]
+[36m(LLMRayActor pid=89985)[0m 
+Loading safetensors checkpoint shards:   0% Completed | 0/5 [00:00<?, ?it/s][32m [repeated 7x across cluster][0m
+[36m(LLMRayActor pid=89990)[0m 
+Loading safetensors checkpoint shards:  60% Completed | 3/5 [00:08<00:06,  3.26s/it][32m [repeated 16x across cluster][0m
+[36m(LLMRayActor pid=89990)[0m 
+[36m(LLMRayActor pid=89990)[0m 
+Loading safetensors checkpoint shards: 100% Completed | 5/5 [00:16<00:00,  3.28s/it][32m [repeated 17x across cluster][0m
+[36m(LLMRayActor pid=89992)[0m 
+[36m(LLMRayActor pid=89989)[0m 
+[36m(LLMRayActor pid=89988)[0m 
+[36m(LLMRayActor pid=89991)[0m 
+[36m(LLMRayActor pid=89993)[0m 
+[36m(LLMRayActor pid=89986)[0m 
+[36m(LLMRayActor pid=89985)[0m 
+[36m(LLMRayActor pid=89991)[0m INFO 05-26 19:20:33 [loader.py:429] Loading weights took 16.49 seconds
+[36m(LLMRayActor pid=89985)[0m INFO 05-26 19:20:13 [cuda.py:293] Using Flash Attention backend.[32m [repeated 7x across cluster][0m
+[36m(LLMRayActor pid=89991)[0m INFO 05-26 19:20:16 [parallel_state.py:967] rank 0 in world size 1 is assigned as DP rank 0, PP rank 0, TP rank 0[32m [repeated 7x across cluster][0m
+[36m(LLMRayActor pid=89991)[0m INFO 05-26 19:20:16 [model_runner.py:1110] Starting to load model /mnt/petrelfs/luyiting/ckt/Qwen2.5-VL-7B-Instruct/Qwen2.5-VL-7B-Instruct/...[32m [repeated 7x across cluster][0m
+[36m(LLMRayActor pid=89991)[0m INFO 05-26 19:20:17 [config.py:3229] cudagraph sizes specified by model runner [1, 2, 4, 8, 16, 24, 32, 40, 48, 56, 64, 72, 80, 88, 96, 104, 112, 120, 128, 136, 144, 152, 160, 168, 176, 184, 192, 200, 208, 216, 224, 232, 240, 248, 256] is overridden by config [256, 128, 2, 1, 4, 136, 8, 144, 16, 152, 24, 160, 32, 168, 40, 176, 48, 184, 56, 192, 64, 200, 72, 208, 80, 216, 88, 120, 224, 96, 232, 104, 240, 112, 248][32m [repeated 7x across cluster][0m
+[36m(LLMRayActor pid=89988)[0m INFO 05-26 19:20:33 [model_runner.py:1146] Model loading took 15.6271 GB and 16.944523 seconds
+[36m(LLMRayActor pid=89988)[0m WARNING 05-26 19:20:34 [model_runner.py:1296] Computed max_num_seqs (min(256, 8192 // 32768)) to be less than 1. Setting it to the minimum value of 1.
+[36m(LLMRayActor pid=89988)[0m Using a slow image processor as `use_fast` is unset and a slow processor was saved with this model. `use_fast=True` will be the default behavior in v4.52, even if the model was saved with a slow processor. This will result in minor differences in outputs. You'll still be able to use a slow processor with `use_fast=False`.
+[36m(LLMRayActor pid=89988)[0m WARNING 05-26 19:20:40 [profiling.py:222] The sequence length used for profiling (max_num_batched_tokens / max_num_seqs = 8192) is too short to hold the multi-modal embeddings in the worst case (32768 tokens in total, out of which {'image': 16384, 'video': 16384} are reserved for multi-modal embeddings). This may cause certain multi-modal inputs to fail during inference, even when the input text is short. To avoid this, you should increase `max_model_len`, reduce `max_num_seqs`, and/or reduce `mm_counts`.
+[36m(LLMRayActor pid=89985)[0m INFO 05-26 19:20:33 [loader.py:429] Loading weights took 16.60 seconds[32m [repeated 7x across cluster][0m
+[36m(LLMRayActor pid=89985)[0m INFO 05-26 19:20:33 [model_runner.py:1146] Model loading took 15.6271 GB and 17.079389 seconds[32m [repeated 7x across cluster][0m
+[36m(LLMRayActor pid=89985)[0m WARNING 05-26 19:20:34 [model_runner.py:1296] Computed max_num_seqs (min(256, 8192 // 32768)) to be less than 1. Setting it to the minimum value of 1.[32m [repeated 7x across cluster][0m
+[36m(LLMRayActor pid=89988)[0m INFO 05-26 19:20:42 [worker.py:267] Memory profiling takes 8.29 seconds
+[36m(LLMRayActor pid=89988)[0m INFO 05-26 19:20:42 [worker.py:267] the current vLLM instance can use total_gpu_memory (79.32GiB) x gpu_memory_utilization (0.50) = 39.66GiB
+[36m(LLMRayActor pid=89988)[0m INFO 05-26 19:20:42 [worker.py:267] model weights take 15.63GiB; non_torch_memory takes 0.21GiB; PyTorch activation peak memory takes 1.09GiB; the rest of the memory reserved for KV Cache is 22.73GiB.
+[36m(LLMRayActor pid=89988)[0m INFO 05-26 19:20:42 [executor_base.py:111] # cuda blocks: 26598, # CPU blocks: 4681
+[36m(LLMRayActor pid=89988)[0m INFO 05-26 19:20:42 [executor_base.py:116] Maximum concurrency for 8192 tokens per request: 51.95x
+[36m(LLMRayActor pid=89990)[0m 
+Capturing CUDA graph shapes:   0%|          | 0/35 [00:00<?, ?it/s]
+[36m(LLMRayActor pid=89985)[0m 
+Loading safetensors checkpoint shards: 100% Completed | 5/5 [00:16<00:00,  3.28s/it][32m [repeated 14x across cluster][0m
+[36m(LLMRayActor pid=89985)[0m Using a slow image processor as `use_fast` is unset and a slow processor was saved with this model. `use_fast=True` will be the default behavior in v4.52, even if the model was saved with a slow processor. This will result in minor differences in outputs. You'll still be able to use a slow processor with `use_fast=False`.[32m [repeated 7x across cluster][0m
+[36m(LLMRayActor pid=89991)[0m INFO 05-26 19:20:46 [model_runner.py:1442] Capturing cudagraphs for decoding. This may lead to unexpected consequences if the model is not static. To run the model in eager mode, set 'enforce_eager=True' or use '--enforce-eager' in the CLI. If out-of-memory error occurs during cudagraph capture, consider decreasing `gpu_memory_utilization` or switching to eager mode. You can also reduce the `max_num_seqs` as needed to decrease memory usage.
+[36m(LLMRayActor pid=89985)[0m WARNING 05-26 19:20:40 [profiling.py:222] The sequence length used for profiling (max_num_batched_tokens / max_num_seqs = 8192) is too short to hold the multi-modal embeddings in the worst case (32768 tokens in total, out of which {'image': 16384, 'video': 16384} are reserved for multi-modal embeddings). This may cause certain multi-modal inputs to fail during inference, even when the input text is short. To avoid this, you should increase `max_model_len`, reduce `max_num_seqs`, and/or reduce `mm_counts`.[32m [repeated 7x across cluster][0m
+[36m(LLMRayActor pid=89990)[0m 
+Capturing CUDA graph shapes:   3%|▎         | 1/35 [00:00<00:17,  1.91it/s]
+[36m(LLMRayActor pid=89985)[0m 
+Capturing CUDA graph shapes:   0%|          | 0/35 [00:00<?, ?it/s][32m [repeated 7x across cluster][0m
+[36m(LLMRayActor pid=89991)[0m 
+Capturing CUDA graph shapes:  31%|███▏      | 11/35 [00:05<00:12,  1.96it/s][32m [repeated 85x across cluster][0m
+[36m(LLMRayActor pid=89991)[0m 
+Capturing CUDA graph shapes:  60%|██████    | 21/35 [00:10<00:07,  2.00it/s][32m [repeated 80x across cluster][0m
+[36m(LLMRayActor pid=89990)[0m 
+Capturing CUDA graph shapes:  91%|█████████▏| 32/35 [00:15<00:01,  2.03it/s]
+[36m(LLMRayActor pid=89985)[0m 
+Capturing CUDA graph shapes:  89%|████████▊ | 31/35 [00:15<00:01,  2.02it/s][32m [repeated 79x across cluster][0m
+[36m(LLMRayActor pid=89990)[0m 
+Capturing CUDA graph shapes: 100%|██████████| 35/35 [00:17<00:00,  2.01it/s]
+Capturing CUDA graph shapes: 100%|██████████| 35/35 [00:17<00:00,  2.00it/s]
+[36m(LLMRayActor pid=89988)[0m INFO 05-26 19:21:03 [model_runner.py:1570] Graph capturing finished in 18 secs, took 1.91 GiB
+[36m(LLMRayActor pid=89988)[0m INFO 05-26 19:21:03 [llm_engine.py:447] init engine (profile, create kv cache, warmup model) took 29.74 seconds
+[36m(LLMRayActor pid=89991)[0m INFO 05-26 19:20:42 [worker.py:267] Memory profiling takes 8.32 seconds[32m [repeated 7x across cluster][0m
+[36m(LLMRayActor pid=89991)[0m INFO 05-26 19:20:42 [worker.py:267] the current vLLM instance can use total_gpu_memory (79.32GiB) x gpu_memory_utilization (0.50) = 39.66GiB[32m [repeated 7x across cluster][0m
+[36m(LLMRayActor pid=89991)[0m INFO 05-26 19:20:42 [worker.py:267] model weights take 15.63GiB; non_torch_memory takes 0.21GiB; PyTorch activation peak memory takes 1.09GiB; the rest of the memory reserved for KV Cache is 22.73GiB.[32m [repeated 7x across cluster][0m
+[36m(LLMRayActor pid=89989)[0m INFO 05-26 19:20:42 [executor_base.py:111] # cuda blocks: 26598, # CPU blocks: 4681[32m [repeated 7x across cluster][0m
+[36m(LLMRayActor pid=89989)[0m INFO 05-26 19:20:42 [executor_base.py:116] Maximum concurrency for 8192 tokens per request: 51.95x[32m [repeated 7x across cluster][0m
+[36m(LLMRayActor pid=89985)[0m INFO 05-26 19:20:45 [model_runner.py:1442] Capturing cudagraphs for decoding. This may lead to unexpected consequences if the model is not static. To run the model in eager mode, set 'enforce_eager=True' or use '--enforce-eager' in the CLI. If out-of-memory error occurs during cudagraph capture, consider decreasing `gpu_memory_utilization` or switching to eager mode. You can also reduce the `max_num_seqs` as needed to decrease memory usage.[32m [repeated 7x across cluster][0m
+[36m(LLMRayActor pid=89988)[0m INFO 05-26 19:21:15 [worker.py:133] Sleep mode freed 38.48 GiB memory, 3.87 GiB memory is still in use.
+[36m(LLMRayActor pid=89988)[0m INFO 05-26 19:21:15 [executor_base.py:208] It took 11.253237 seconds to fall asleep.
+[36m(LLMRayActor pid=89989)[0m INFO 05-26 19:21:04 [model_runner.py:1570] Graph capturing finished in 18 secs, took 1.91 GiB[32m [repeated 7x across cluster][0m
+[36m(LLMRayActor pid=89989)[0m INFO 05-26 19:21:04 [llm_engine.py:447] init engine (profile, create kv cache, warmup model) took 30.30 seconds[32m [repeated 7x across cluster][0m
+[36m(pid=100959)[0m [2025-05-26 19:21:33,573] [INFO] [real_accelerator.py:222:get_accelerator] Setting ds_accelerator to cuda (auto detect)
+[36m(LLMRayActor pid=89989)[0m INFO 05-26 19:21:16 [worker.py:133] Sleep mode freed 38.48 GiB memory, 3.87 GiB memory is still in use.[32m [repeated 7x across cluster][0m
+[36m(LLMRayActor pid=89989)[0m INFO 05-26 19:21:16 [executor_base.py:208] It took 11.265799 seconds to fall asleep.[32m [repeated 7x across cluster][0m
+[36m(pid=100959)[0m INFO 05-26 19:21:37 [__init__.py:239] Automatically detected platform cuda.
+[36m(pid=101498)[0m [2025-05-26 19:22:05,002] [INFO] [real_accelerator.py:222:get_accelerator] Setting ds_accelerator to cuda (auto detect)
+[36m(pid=101501)[0m [2025-05-26 19:22:05,005] [INFO] [real_accelerator.py:222:get_accelerator] Setting ds_accelerator to cuda (auto detect)
+[36m(pid=101494)[0m INFO 05-26 19:22:12 [__init__.py:239] Automatically detected platform cuda.
+[36m(pid=101497)[0m [2025-05-26 19:22:05,966] [INFO] [real_accelerator.py:222:get_accelerator] Setting ds_accelerator to cuda (auto detect)[32m [repeated 6x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:22:14,738] [INFO] [comm.py:658:init_distributed] cdb=None
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:22:14,738] [INFO] [comm.py:689:init_distributed] Initializing TorchBackend in DeepSpeed with backend nccl
+[36m(ActorModelRayActor pid=101498)[0m You are attempting to use Flash Attention 2.0 with a model not initialized on GPU. Make sure to move the model to GPU after initializing it on CPU with `model.to('cuda')`.
+[36m(LLMRayActor pid=89986)[0m 
+Capturing CUDA graph shapes:  97%|█████████▋| 34/35 [00:17<00:00,  1.92it/s][32m [repeated 23x across cluster][0m
+[36m(LLMRayActor pid=89989)[0m 
+Capturing CUDA graph shapes:  89%|████████▊ | 31/35 [00:15<00:02,  1.98it/s][32m [repeated 3x across cluster][0m
+[36m(LLMRayActor pid=89986)[0m 
+Capturing CUDA graph shapes: 100%|██████████| 35/35 [00:18<00:00,  1.77it/s]
+Capturing CUDA graph shapes: 100%|██████████| 35/35 [00:18<00:00,  1.93it/s][32m [repeated 7x across cluster][0m
+[36m(ActorModelRayActor pid=101499)[0m [2025-05-26 19:22:14,845] [INFO] [config.py:734:__init__] Config mesh_device None world_size = 8
+[36m(ActorModelRayActor pid=100959)[0m 
+Loading checkpoint shards:   0%|          | 0/5 [00:00<?, ?it/s]
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:22:19,763] [INFO] [partition_parameters.py:348:__exit__] finished initializing model - num_params = 729, num_elems = 8.29B
+[36m(pid=101495)[0m INFO 05-26 19:22:12 [__init__.py:239] Automatically detected platform cuda.[32m [repeated 7x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m 
+Loading checkpoint shards:  20%|██        | 1/5 [00:05<00:23,  5.96s/it]
+[36m(ActorModelRayActor pid=101500)[0m You are attempting to use Flash Attention 2.0 with a model not initialized on GPU. Make sure to move the model to GPU after initializing it on CPU with `model.to('cuda')`.[32m [repeated 7x across cluster][0m
+[36m(ActorModelRayActor pid=101499)[0m 
+Loading checkpoint shards:   0%|          | 0/5 [00:00<?, ?it/s][32m [repeated 7x across cluster][0m
+[36m(ActorModelRayActor pid=101496)[0m 
+Loading checkpoint shards:  40%|████      | 2/5 [00:11<00:17,  5.67s/it][32m [repeated 8x across cluster][0m
+[36m(ActorModelRayActor pid=101496)[0m 
+Loading checkpoint shards:  60%|██████    | 3/5 [00:17<00:11,  5.64s/it][32m [repeated 8x across cluster][0m
+[36m(ActorModelRayActor pid=101496)[0m 
+Loading checkpoint shards: 100%|██████████| 5/5 [00:22<00:00,  3.52s/it]
+Loading checkpoint shards: 100%|██████████| 5/5 [00:22<00:00,  4.44s/it]
+[36m(ActorModelRayActor pid=101499)[0m 
+Loading checkpoint shards:  80%|████████  | 4/5 [00:21<00:05,  5.36s/it][32m [repeated 14x across cluster][0m
+[36m(ActorModelRayActor pid=101494)[0m INFO 05-26 19:22:42 visual_utils.py:42] set VIDEO_TOTAL_PIXELS: 90316800
+[36m(ActorModelRayActor pid=101497)[0m [2025-05-26 19:22:14,745] [INFO] [comm.py:658:init_distributed] cdb=None[32m [repeated 8x across cluster][0m
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:22:14,738] [INFO] [comm.py:689:init_distributed] Initializing TorchBackend in DeepSpeed with backend nccl
+[36m(ActorModelRayActor pid=101496)[0m [2025-05-26 19:22:15,437] [INFO] [config.py:734:__init__] Config mesh_device None world_size = 8[32m [repeated 7x across cluster][0m
+[36m(pid=103677)[0m [2025-05-26 19:22:42,798] [INFO] [real_accelerator.py:222:get_accelerator] Setting ds_accelerator to cuda (auto detect)
+[36m(ActorModelRayActor pid=100959)[0m Actor(
+[36m(ActorModelRayActor pid=100959)[0m   (model): Qwen2_5_VLForConditionalGeneration(
+[36m(ActorModelRayActor pid=100959)[0m     (visual): Qwen2_5_VisionTransformerPretrainedModel(
+[36m(ActorModelRayActor pid=100959)[0m       (patch_embed): Qwen2_5_VisionPatchEmbed(
+[36m(ActorModelRayActor pid=100959)[0m         (proj): Conv3d(3, 1280, kernel_size=(2, 14, 14), stride=(2, 14, 14), bias=False)
+[36m(ActorModelRayActor pid=100959)[0m       )
+[36m(ActorModelRayActor pid=100959)[0m       (rotary_pos_emb): Qwen2_5_VisionRotaryEmbedding()
+[36m(ActorModelRayActor pid=100959)[0m       (blocks): ModuleList(
+[36m(ActorModelRayActor pid=100959)[0m         (0-31): 32 x Qwen2_5_VLVisionBlock(
+[36m(ActorModelRayActor pid=100959)[0m           (norm1): Qwen2RMSNorm((0,), eps=1e-06)
+[36m(ActorModelRayActor pid=100959)[0m           (norm2): Qwen2RMSNorm((0,), eps=1e-06)
+[36m(ActorModelRayActor pid=100959)[0m           (attn): Qwen2_5_VLVisionFlashAttention2(
+[36m(ActorModelRayActor pid=100959)[0m             (qkv): Linear(in_features=1280, out_features=3840, bias=True)
+[36m(ActorModelRayActor pid=100959)[0m             (proj): Linear(in_features=1280, out_features=1280, bias=True)
+[36m(ActorModelRayActor pid=100959)[0m           )
+[36m(ActorModelRayActor pid=100959)[0m           (mlp): Qwen2_5_VLMLP(
+[36m(ActorModelRayActor pid=100959)[0m             (gate_proj): Linear(in_features=1280, out_features=3420, bias=True)
+[36m(ActorModelRayActor pid=100959)[0m             (up_proj): Linear(in_features=1280, out_features=3420, bias=True)
+[36m(ActorModelRayActor pid=100959)[0m             (down_proj): Linear(in_features=3420, out_features=1280, bias=True)
+[36m(ActorModelRayActor pid=100959)[0m             (act_fn): SiLU()
+[36m(ActorModelRayActor pid=100959)[0m           )
+[36m(ActorModelRayActor pid=100959)[0m         )
+[36m(ActorModelRayActor pid=100959)[0m       )
+[36m(ActorModelRayActor pid=100959)[0m       (merger): Qwen2_5_VLPatchMerger(
+[36m(ActorModelRayActor pid=100959)[0m         (ln_q): Qwen2RMSNorm((0,), eps=1e-06)
+[36m(ActorModelRayActor pid=100959)[0m         (mlp): Sequential(
+[36m(ActorModelRayActor pid=100959)[0m           (0): Linear(in_features=5120, out_features=5120, bias=True)
+[36m(ActorModelRayActor pid=100959)[0m           (1): GELU(approximate='none')
+[36m(ActorModelRayActor pid=100959)[0m           (2): Linear(in_features=5120, out_features=3584, bias=True)
+[36m(ActorModelRayActor pid=100959)[0m         )
+[36m(ActorModelRayActor pid=100959)[0m       )
+[36m(ActorModelRayActor pid=100959)[0m     )
+[36m(ActorModelRayActor pid=100959)[0m     (model): Qwen2_5_VLModel(
+[36m(ActorModelRayActor pid=100959)[0m       (embed_tokens): Embedding(152064, 3584)
+[36m(ActorModelRayActor pid=100959)[0m       (layers): ModuleList(
+[36m(ActorModelRayActor pid=100959)[0m         (0-27): 28 x Qwen2_5_VLDecoderLayer(
+[36m(ActorModelRayActor pid=100959)[0m           (self_attn): Qwen2_5_VLFlashAttention2(
+[36m(ActorModelRayActor pid=100959)[0m             (q_proj): Linear(in_features=3584, out_features=3584, bias=True)
+[36m(ActorModelRayActor pid=100959)[0m             (k_proj): Linear(in_features=3584, out_features=512, bias=True)
+[36m(ActorModelRayActor pid=100959)[0m             (v_proj): Linear(in_features=3584, out_features=512, bias=True)
+[36m(ActorModelRayActor pid=100959)[0m             (o_proj): Linear(in_features=3584, out_features=3584, bias=False)
+[36m(ActorModelRayActor pid=100959)[0m             (rotary_emb): Qwen2_5_VLRotaryEmbedding()
+[36m(ActorModelRayActor pid=100959)[0m           )
+[36m(ActorModelRayActor pid=100959)[0m           (mlp): Qwen2MLP(
+[36m(ActorModelRayActor pid=100959)[0m             (gate_proj): Linear(in_features=3584, out_features=18944, bias=False)
+[36m(ActorModelRayActor pid=100959)[0m             (up_proj): Linear(in_features=3584, out_features=18944, bias=False)
+[36m(ActorModelRayActor pid=100959)[0m             (down_proj): Linear(in_features=18944, out_features=3584, bias=False)
+[36m(ActorModelRayActor pid=100959)[0m             (act_fn): SiLU()
+[36m(ActorModelRayActor pid=100959)[0m           )
+[36m(ActorModelRayActor pid=100959)[0m           (input_layernorm): Qwen2RMSNorm((0,), eps=1e-06)
+[36m(ActorModelRayActor pid=100959)[0m           (post_attention_layernorm): Qwen2RMSNorm((0,), eps=1e-06)
+[36m(ActorModelRayActor pid=100959)[0m         )
+[36m(ActorModelRayActor pid=100959)[0m       )
+[36m(ActorModelRayActor pid=100959)[0m       (norm): Qwen2RMSNorm((0,), eps=1e-06)
+[36m(ActorModelRayActor pid=100959)[0m       (rotary_emb): Qwen2_5_VLRotaryEmbedding()
+[36m(ActorModelRayActor pid=100959)[0m     )
+[36m(ActorModelRayActor pid=100959)[0m     (lm_head): Linear(in_features=3584, out_features=152064, bias=False)
+[36m(ActorModelRayActor pid=100959)[0m   )
+[36m(ActorModelRayActor pid=100959)[0m )
+[36m(ActorModelRayActor pid=101498)[0m Using /mnt/petrelfs/luyiting/.cache/torch_extensions/py310_cu124 as PyTorch extensions root...
+[36m(ActorModelRayActor pid=101498)[0m Loading extension module cpu_adam...
+[36m(ActorModelRayActor pid=101494)[0m Installed CUDA version 12.1 does not match the version torch was compiled with 12.4 but since the APIs are compatible, accepting this combination
+[36m(ActorModelRayActor pid=101494)[0m ninja: no work to do.
+[36m(ActorModelRayActor pid=101494)[0m Time to load cpu_adam op: 2.7277626991271973 seconds
+[36m(ActorModelRayActor pid=101494)[0m Adam Optimizer #0 is created with AVX512 arithmetic capability.
+[36m(ActorModelRayActor pid=101494)[0m Config: alpha=0.000001, betas=(0.900000, 0.950000), weight_decay=0.000000, adam_w=1
+[36m(ActorModelRayActor pid=101494)[0m Emitting ninja build file /mnt/petrelfs/luyiting/.cache/torch_extensions/py310_cu124/cpu_adam/build.ninja...
+[36m(ActorModelRayActor pid=101494)[0m Building extension module cpu_adam...
+[36m(ActorModelRayActor pid=101494)[0m Allowing ninja to set a default number of workers... (overridable by setting the environment variable MAX_JOBS=N)
+[36m(ActorModelRayActor pid=100959)[0m 
+Loading checkpoint shards: 100%|██████████| 5/5 [00:23<00:00,  3.96s/it]
+Loading checkpoint shards: 100%|██████████| 5/5 [00:23<00:00,  4.75s/it][32m [repeated 7x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m 
+Loading checkpoint shards:  80%|████████  | 4/5 [00:22<00:05,  5.53s/it]
+[36m(ActorModelRayActor pid=100959)[0m INFO 05-26 19:22:43 visual_utils.py:42] set VIDEO_TOTAL_PIXELS: 90316800[32m [repeated 7x across cluster][0m
+[36m(pid=103676)[0m [2025-05-26 19:22:42,847] [INFO] [real_accelerator.py:222:get_accelerator] Setting ds_accelerator to cuda (auto detect)[32m [repeated 6x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m dataset: /mnt/petrelfs/luyiting/MultiAgentEval/data_process_v1/train_ava_mini_evalmuse_koniq_llavastyle_openrlhf_merged.jsonl
+[36m(pid=103677)[0m INFO 05-26 19:22:51 [__init__.py:239] Automatically detected platform cuda.
+[36m(ReferenceModelRayActor pid=101495)[0m You are attempting to use Flash Attention 2.0 with a model not initialized on GPU. Make sure to move the model to GPU after initializing it on CPU with `model.to('cuda')`.
+[36m(ActorModelRayActor pid=100959)[0m Using /mnt/petrelfs/luyiting/.cache/torch_extensions/py310_cu124 as PyTorch extensions root...[32m [repeated 7x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m Loading extension module cpu_adam...[32m [repeated 7x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m Emitting ninja build file /mnt/petrelfs/luyiting/.cache/torch_extensions/py310_cu124/cpu_adam/build.ninja...[32m [repeated 2x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m Building extension module cpu_adam...[32m [repeated 2x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m Allowing ninja to set a default number of workers... (overridable by setting the environment variable MAX_JOBS=N)[32m [repeated 2x across cluster][0m
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:22:54,092] [INFO] [config.py:734:__init__] Config mesh_device None world_size = 8
+[36m(ActorModelRayActor pid=100959)[0m Installed CUDA version 12.1 does not match the version torch was compiled with 12.4 but since the APIs are compatible, accepting this combination[32m [repeated 7x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m ninja: no work to do.[32m [repeated 2x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m Time to load cpu_adam op: 2.0036792755126953 seconds[32m [repeated 7x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m Adam Optimizer #0 is created with AVX512 arithmetic capability.[32m [repeated 7x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m Config: alpha=0.000001, betas=(0.900000, 0.950000), weight_decay=0.000000, adam_w=1[32m [repeated 7x across cluster][0m
+[36m(ReferenceModelRayActor pid=103677)[0m [2025-05-26 19:22:53,910] [INFO] [comm.py:658:init_distributed] cdb=None
+[36m(ReferenceModelRayActor pid=101495)[0m 
+Loading checkpoint shards:   0%|          | 0/5 [00:00<?, ?it/s]
+[36m(ReferenceModelRayActor pid=103676)[0m You are attempting to use Flash Attention 2.0 with a model not initialized on GPU. Make sure to move the model to GPU after initializing it on CPU with `model.to('cuda')`.[32m [repeated 7x across cluster][0m
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:22:59,072] [INFO] [partition_parameters.py:348:__exit__] finished initializing model - num_params = 729, num_elems = 8.29B
+[36m(pid=103676)[0m INFO 05-26 19:22:51 [__init__.py:239] Automatically detected platform cuda.[32m [repeated 6x across cluster][0m
+[36m(ReferenceModelRayActor pid=103676)[0m [2025-05-26 19:22:54,094] [INFO] [config.py:734:__init__] Config mesh_device None world_size = 8[32m [repeated 7x across cluster][0m
+[36m(ReferenceModelRayActor pid=103676)[0m [2025-05-26 19:22:53,986] [INFO] [comm.py:658:init_distributed] cdb=None[32m [repeated 6x across cluster][0m
+[36m(ReferenceModelRayActor pid=103677)[0m 
+Loading checkpoint shards:  20%|██        | 1/5 [00:08<00:35,  8.95s/it]
+[36m(ReferenceModelRayActor pid=103676)[0m 
+Loading checkpoint shards:   0%|          | 0/5 [00:00<?, ?it/s][32m [repeated 7x across cluster][0m
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=101494)[0m in preprocess_data None False
+[36m(ActorModelRayActor pid=100959)[0m loaded /mnt/petrelfs/luyiting/MultiAgentEval/data_process_v1/train_ava_mini_evalmuse_koniq_llavastyle_openrlhf_merged.jsonl with data_files=/mnt/petrelfs/luyiting/MultiAgentEval/data_process_v1/train_ava_mini_evalmuse_koniq_llavastyle_openrlhf_merged.jsonl
+[36m(ActorModelRayActor pid=100959)[0m [Dataset({
+[36m(ActorModelRayActor pid=100959)[0m     features: ['message', 'answer'],
+[36m(ActorModelRayActor pid=100959)[0m     num_rows: 24000
+[36m(ActorModelRayActor pid=100959)[0m })]
+[36m(ActorModelRayActor pid=100959)[0m 
+Preprocessing data:   0%|          | 0/24000 [00:00<?, ?it/s]
+[36m(ReferenceModelRayActor pid=101495)[0m 
+Loading checkpoint shards:  20%|██        | 1/5 [00:09<00:36,  9.09s/it][32m [repeated 7x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m 
+Preprocessing data:  11%|█▏        | 2710/24000 [00:00<00:00, 27093.05it/s]
+Preprocessing data:  23%|██▎       | 5420/24000 [00:00<00:00, 23511.88it/s]
+[36m(ActorModelRayActor pid=100959)[0m 
+Preprocessing data:  34%|███▍      | 8198/24000 [00:00<00:00, 25310.45it/s]
+Preprocessing data:  45%|████▌     | 10896/24000 [00:00<00:00, 25937.48it/s]
+Preprocessing data:  56%|█████▋    | 13512/24000 [00:00<00:00, 24602.98it/s]
+[36m(ActorModelRayActor pid=100959)[0m 
+Preprocessing data:  67%|██████▋   | 16097/24000 [00:00<00:00, 25000.22it/s]
+Preprocessing data:  78%|███████▊  | 18703/24000 [00:00<00:00, 25330.64it/s]
+[36m(ActorModelRayActor pid=100959)[0m 
+Preprocessing data:  89%|████████▉ | 21400/24000 [00:00<00:00, 25837.84it/s]
+Preprocessing data: 100%|█████████▉| 23995/24000 [00:00<00:00, 25641.24it/s]
+Preprocessing data: 100%|██████████| 24000/24000 [00:00<00:00, 25374.95it/s]
+[36m(ActorModelRayActor pid=100959)[0m in preprocess_data None False[32m [repeated 165000x across cluster][0m
+[36m(ActorModelRayActor pid=101494)[0m [2025-05-26 19:23:13,002] [INFO] [config.py:734:__init__] Config mesh_device None world_size = 8
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:14,317] [INFO] [logging.py:128:log_dist] [Rank 0] DeepSpeed info: version=0.16.4, git-hash=unknown, git-branch=unknown
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:14,318] [INFO] [comm.py:683:init_distributed] Distributed backend already initialized
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:14,332] [INFO] [logging.py:128:log_dist] [Rank 0] DeepSpeed Flops Profiler Enabled: False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:14,334] [INFO] [logging.py:128:log_dist] [Rank 0] Using client Optimizer as basic optimizer
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:14,334] [INFO] [logging.py:128:log_dist] [Rank 0] Removing param_group that has no 'params' in the basic Optimizer
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:14,377] [INFO] [logging.py:128:log_dist] [Rank 0] DeepSpeed Basic Optimizer = DeepSpeedCPUAdam
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:14,377] [INFO] [utils.py:59:is_zero_supported_optimizer] Checking ZeRO support for optimizer=DeepSpeedCPUAdam type=<class 'deepspeed.ops.adam.cpu_adam.DeepSpeedCPUAdam'>
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:14,377] [INFO] [logging.py:128:log_dist] [Rank 0] Creating fp16 ZeRO stage 3 optimizer, MiCS is enabled False, Hierarchical params gather False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:14,377] [INFO] [logging.py:128:log_dist] [Rank 0] Creating torch.bfloat16 ZeRO stage 3 optimizer
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:14,607] [INFO] [utils.py:781:see_memory_usage] Stage 3 initialize beginning
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:14,607] [INFO] [utils.py:782:see_memory_usage] MA 1.94 GB         Max_MA 3.98 GB         CA 4.04 GB         Max_CA 4 GB 
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:14,608] [INFO] [utils.py:789:see_memory_usage] CPU Virtual Memory:  used = 469.96 GB, percent = 46.7%
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:14,611] [INFO] [stage3.py:170:__init__] Reduce bucket size 500000000
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:14,611] [INFO] [stage3.py:171:__init__] Prefetch bucket size 50000000
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:14,839] [INFO] [utils.py:781:see_memory_usage] DeepSpeedZeRoOffload initialize [begin]
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:14,840] [INFO] [utils.py:782:see_memory_usage] MA 1.94 GB         Max_MA 1.94 GB         CA 4.04 GB         Max_CA 4 GB 
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:14,841] [INFO] [utils.py:789:see_memory_usage] CPU Virtual Memory:  used = 469.95 GB, percent = 46.7%
+[36m(ActorModelRayActor pid=100959)[0m Parameter Offload: Total persistent parameters: 848896 in 368 params
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:15,090] [INFO] [utils.py:781:see_memory_usage] DeepSpeedZeRoOffload initialize [end]
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:15,090] [INFO] [utils.py:782:see_memory_usage] MA 1.94 GB         Max_MA 1.94 GB         CA 4.04 GB         Max_CA 4 GB 
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:15,091] [INFO] [utils.py:789:see_memory_usage] CPU Virtual Memory:  used = 469.96 GB, percent = 46.7%
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:15,310] [INFO] [utils.py:781:see_memory_usage] Before creating fp16 partitions
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:15,311] [INFO] [utils.py:782:see_memory_usage] MA 1.94 GB         Max_MA 1.94 GB         CA 4.04 GB         Max_CA 4 GB 
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:15,312] [INFO] [utils.py:789:see_memory_usage] CPU Virtual Memory:  used = 469.96 GB, percent = 46.7%
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:17,718] [INFO] [utils.py:781:see_memory_usage] After creating fp16 partitions: 2
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:17,719] [INFO] [utils.py:782:see_memory_usage] MA 1.93 GB         Max_MA 1.94 GB         CA 1.94 GB         Max_CA 4 GB 
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:17,719] [INFO] [utils.py:789:see_memory_usage] CPU Virtual Memory:  used = 473.35 GB, percent = 47.0%
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:17,939] [INFO] [utils.py:781:see_memory_usage] Before creating fp32 partitions
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:17,940] [INFO] [utils.py:782:see_memory_usage] MA 1.93 GB         Max_MA 1.93 GB         CA 1.94 GB         Max_CA 2 GB 
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:17,941] [INFO] [utils.py:789:see_memory_usage] CPU Virtual Memory:  used = 476.15 GB, percent = 47.3%
+[36m(ReferenceModelRayActor pid=101495)[0m 
+Loading checkpoint shards:  60%|██████    | 3/5 [00:20<00:12,  6.39s/it][32m [repeated 16x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:22,363] [INFO] [utils.py:781:see_memory_usage] After creating fp32 partitions
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:22,364] [INFO] [utils.py:782:see_memory_usage] MA 1.93 GB         Max_MA 1.93 GB         CA 1.94 GB         Max_CA 2 GB 
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:22,364] [INFO] [utils.py:789:see_memory_usage] CPU Virtual Memory:  used = 500.86 GB, percent = 49.7%
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:22,595] [INFO] [utils.py:781:see_memory_usage] Before initializing optimizer states
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:22,596] [INFO] [utils.py:782:see_memory_usage] MA 1.93 GB         Max_MA 1.93 GB         CA 1.94 GB         Max_CA 2 GB 
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:22,597] [INFO] [utils.py:789:see_memory_usage] CPU Virtual Memory:  used = 505.19 GB, percent = 50.2%
+[36m(ActorModelRayActor pid=100959)[0m in preprocess_data None False[32m [repeated 26000x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:14,318] [INFO] [config.py:734:__init__] Config mesh_device None world_size = 8[32m [repeated 7x across cluster][0m
+[36m(ReferenceModelRayActor pid=103677)[0m 
+Loading checkpoint shards:  80%|████████  | 4/5 [00:25<00:06,  6.04s/it]
+[36m(ReferenceModelRayActor pid=103679)[0m 
+Loading checkpoint shards:  80%|████████  | 4/5 [00:25<00:06,  6.04s/it]
+[36m(ReferenceModelRayActor pid=103677)[0m 
+Loading checkpoint shards: 100%|██████████| 5/5 [00:25<00:00,  3.96s/it]
+Loading checkpoint shards: 100%|██████████| 5/5 [00:25<00:00,  5.16s/it]
+[36m(ReferenceModelRayActor pid=101495)[0m Actor(
+[36m(ReferenceModelRayActor pid=101495)[0m   (model): Qwen2_5_VLForConditionalGeneration(
+[36m(ReferenceModelRayActor pid=101495)[0m     (visual): Qwen2_5_VisionTransformerPretrainedModel(
+[36m(ReferenceModelRayActor pid=101495)[0m       (patch_embed): Qwen2_5_VisionPatchEmbed(
+[36m(ReferenceModelRayActor pid=101495)[0m         (proj): Conv3d(3, 1280, kernel_size=(2, 14, 14), stride=(2, 14, 14), bias=False)
+[36m(ReferenceModelRayActor pid=101495)[0m       )
+[36m(ReferenceModelRayActor pid=101495)[0m       (rotary_pos_emb): Qwen2_5_VisionRotaryEmbedding()
+[36m(ReferenceModelRayActor pid=101495)[0m       (blocks): ModuleList(
+[36m(ReferenceModelRayActor pid=101495)[0m         (0-31): 32 x Qwen2_5_VLVisionBlock(
+[36m(ReferenceModelRayActor pid=101495)[0m           (norm1): Qwen2RMSNorm((0,), eps=1e-06)
+[36m(ReferenceModelRayActor pid=101495)[0m           (norm2): Qwen2RMSNorm((0,), eps=1e-06)
+[36m(ReferenceModelRayActor pid=101495)[0m           (attn): Qwen2_5_VLVisionFlashAttention2(
+[36m(ReferenceModelRayActor pid=101495)[0m             (qkv): Linear(in_features=1280, out_features=3840, bias=True)
+[36m(ReferenceModelRayActor pid=101495)[0m             (proj): Linear(in_features=1280, out_features=1280, bias=True)
+[36m(ReferenceModelRayActor pid=101495)[0m           )
+[36m(ReferenceModelRayActor pid=101495)[0m           (mlp): Qwen2_5_VLMLP(
+[36m(ReferenceModelRayActor pid=101495)[0m             (gate_proj): Linear(in_features=1280, out_features=3420, bias=True)
+[36m(ReferenceModelRayActor pid=101495)[0m             (up_proj): Linear(in_features=1280, out_features=3420, bias=True)
+[36m(ReferenceModelRayActor pid=101495)[0m             (down_proj): Linear(in_features=3420, out_features=1280, bias=True)
+[36m(ReferenceModelRayActor pid=101495)[0m             (act_fn): SiLU()
+[36m(ReferenceModelRayActor pid=101495)[0m           )
+[36m(ReferenceModelRayActor pid=101495)[0m         )
+[36m(ReferenceModelRayActor pid=101495)[0m       )
+[36m(ReferenceModelRayActor pid=101495)[0m       (merger): Qwen2_5_VLPatchMerger(
+[36m(ReferenceModelRayActor pid=101495)[0m         (ln_q): Qwen2RMSNorm((0,), eps=1e-06)
+[36m(ReferenceModelRayActor pid=101495)[0m         (mlp): Sequential(
+[36m(ReferenceModelRayActor pid=101495)[0m           (0): Linear(in_features=5120, out_features=5120, bias=True)
+[36m(ReferenceModelRayActor pid=101495)[0m           (1): GELU(approximate='none')
+[36m(ReferenceModelRayActor pid=101495)[0m           (2): Linear(in_features=5120, out_features=3584, bias=True)
+[36m(ReferenceModelRayActor pid=101495)[0m         )
+[36m(ReferenceModelRayActor pid=101495)[0m       )
+[36m(ReferenceModelRayActor pid=101495)[0m     )
+[36m(ReferenceModelRayActor pid=101495)[0m     (model): Qwen2_5_VLModel(
+[36m(ReferenceModelRayActor pid=101495)[0m       (embed_tokens): Embedding(152064, 3584)
+[36m(ReferenceModelRayActor pid=101495)[0m       (layers): ModuleList(
+[36m(ReferenceModelRayActor pid=101495)[0m         (0-27): 28 x Qwen2_5_VLDecoderLayer(
+[36m(ReferenceModelRayActor pid=101495)[0m           (self_attn): Qwen2_5_VLFlashAttention2(
+[36m(ReferenceModelRayActor pid=101495)[0m             (q_proj): Linear(in_features=3584, out_features=3584, bias=True)
+[36m(ReferenceModelRayActor pid=101495)[0m             (k_proj): Linear(in_features=3584, out_features=512, bias=True)
+[36m(ReferenceModelRayActor pid=101495)[0m             (v_proj): Linear(in_features=3584, out_features=512, bias=True)
+[36m(ReferenceModelRayActor pid=101495)[0m             (o_proj): Linear(in_features=3584, out_features=3584, bias=False)
+[36m(ReferenceModelRayActor pid=101495)[0m             (rotary_emb): Qwen2_5_VLRotaryEmbedding()
+[36m(ReferenceModelRayActor pid=101495)[0m           )
+[36m(ReferenceModelRayActor pid=101495)[0m           (mlp): Qwen2MLP(
+[36m(ReferenceModelRayActor pid=101495)[0m             (gate_proj): Linear(in_features=3584, out_features=18944, bias=False)
+[36m(ReferenceModelRayActor pid=101495)[0m             (up_proj): Linear(in_features=3584, out_features=18944, bias=False)
+[36m(ReferenceModelRayActor pid=101495)[0m             (down_proj): Linear(in_features=18944, out_features=3584, bias=False)
+[36m(ReferenceModelRayActor pid=101495)[0m             (act_fn): SiLU()
+[36m(ReferenceModelRayActor pid=101495)[0m           )
+[36m(ReferenceModelRayActor pid=101495)[0m           (input_layernorm): Qwen2RMSNorm((0,), eps=1e-06)
+[36m(ReferenceModelRayActor pid=101495)[0m           (post_attention_layernorm): Qwen2RMSNorm((0,), eps=1e-06)
+[36m(ReferenceModelRayActor pid=101495)[0m         )
+[36m(ReferenceModelRayActor pid=101495)[0m       )
+[36m(ReferenceModelRayActor pid=101495)[0m       (norm): Qwen2RMSNorm((0,), eps=1e-06)
+[36m(ReferenceModelRayActor pid=101495)[0m       (rotary_emb): Qwen2_5_VLRotaryEmbedding()
+[36m(ReferenceModelRayActor pid=101495)[0m     )
+[36m(ReferenceModelRayActor pid=101495)[0m     (lm_head): Linear(in_features=3584, out_features=152064, bias=False)
+[36m(ReferenceModelRayActor pid=101495)[0m   )
+[36m(ReferenceModelRayActor pid=101495)[0m )
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:26,658] [INFO] [logging.py:128:log_dist] [Rank 0] DeepSpeed info: version=0.16.4, git-hash=unknown, git-branch=unknown
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:26,658] [INFO] [comm.py:683:init_distributed] Distributed backend already initialized
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:26,677] [INFO] [logging.py:128:log_dist] [Rank 0] DeepSpeed Flops Profiler Enabled: False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:26,679] [INFO] [logging.py:128:log_dist] [Rank 0] Creating ZeRO Offload
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:26,901] [INFO] [utils.py:781:see_memory_usage] DeepSpeedZeRoOffload initialize [begin]
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:26,902] [INFO] [utils.py:782:see_memory_usage] MA 1.94 GB         Max_MA 3.98 GB         CA 4.04 GB         Max_CA 4 GB 
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:26,903] [INFO] [utils.py:789:see_memory_usage] CPU Virtual Memory:  used = 582.59 GB, percent = 57.8%
+[36m(ReferenceModelRayActor pid=101495)[0m Parameter Offload: Total persistent parameters: 848896 in 368 params
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,125] [INFO] [utils.py:781:see_memory_usage] DeepSpeedZeRoOffload initialize [end]
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,125] [INFO] [utils.py:782:see_memory_usage] MA 1.94 GB         Max_MA 1.94 GB         CA 4.04 GB         Max_CA 4 GB 
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,126] [INFO] [utils.py:789:see_memory_usage] CPU Virtual Memory:  used = 586.3 GB, percent = 58.2%
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,128] [INFO] [config.py:1001:print] DeepSpeedEngine configuration:
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,129] [INFO] [config.py:1005:print]   activation_checkpointing_config  {
+[36m(ReferenceModelRayActor pid=101495)[0m     "partition_activations": false, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "contiguous_memory_optimization": false, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "cpu_checkpointing": false, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "number_checkpoints": null, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "synchronize_checkpoint_boundary": false, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "profile": false
+[36m(ReferenceModelRayActor pid=101495)[0m }
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,129] [INFO] [config.py:1005:print]   aio_config ................... {'block_size': 1048576, 'queue_depth': 8, 'intra_op_parallelism': 1, 'single_submit': False, 'overlap_events': True, 'use_gds': False}
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,129] [INFO] [config.py:1005:print]   amp_enabled .................. False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,129] [INFO] [config.py:1005:print]   amp_params ................... False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,129] [INFO] [config.py:1005:print]   autotuning_config ............ {
+[36m(ReferenceModelRayActor pid=101495)[0m     "enabled": false, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "start_step": null, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "end_step": null, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "metric_path": null, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "arg_mappings": null, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "metric": "throughput", 
+[36m(ReferenceModelRayActor pid=101495)[0m     "model_info": null, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "results_dir": "autotuning_results", 
+[36m(ReferenceModelRayActor pid=101495)[0m     "exps_dir": "autotuning_exps", 
+[36m(ReferenceModelRayActor pid=101495)[0m     "overwrite": true, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "fast": true, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "start_profile_step": 3, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "end_profile_step": 5, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "tuner_type": "gridsearch", 
+[36m(ReferenceModelRayActor pid=101495)[0m     "tuner_early_stopping": 5, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "tuner_num_trials": 50, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "model_info_path": null, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "mp_size": 1, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "max_train_batch_size": null, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "min_train_batch_size": 1, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "max_train_micro_batch_size_per_gpu": 1.024000e+03, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "min_train_micro_batch_size_per_gpu": 1, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "num_tuning_micro_batch_sizes": 3
+[36m(ReferenceModelRayActor pid=101495)[0m }
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,129] [INFO] [config.py:1005:print]   bfloat16_enabled ............. True
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,129] [INFO] [config.py:1005:print]   bfloat16_immediate_grad_update  False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,129] [INFO] [config.py:1005:print]   checkpoint_parallel_write_pipeline  False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,129] [INFO] [config.py:1005:print]   checkpoint_tag_validation_enabled  True
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,129] [INFO] [config.py:1005:print]   checkpoint_tag_validation_fail  False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,129] [INFO] [config.py:1005:print]   comms_config ................. <deepspeed.comm.config.DeepSpeedCommsConfig object at 0x7eee1436dcc0>
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,129] [INFO] [config.py:1005:print]   communication_data_type ...... None
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,129] [INFO] [config.py:1005:print]   compression_config ........... {'weight_quantization': {'shared_parameters': {'enabled': False, 'quantizer_kernel': False, 'schedule_offset': 0, 'quantize_groups': 1, 'quantize_verbose': False, 'quantization_type': 'symmetric', 'quantize_weight_in_forward': False, 'rounding': 'nearest', 'fp16_mixed_quantize': False, 'quantize_change_ratio': 0.001}, 'different_groups': {}}, 'activation_quantization': {'shared_parameters': {'enabled': False, 'quantization_type': 'symmetric', 'range_calibration': 'dynamic', 'schedule_offset': 1000}, 'different_groups': {}}, 'sparse_pruning': {'shared_parameters': {'enabled': False, 'method': 'l1', 'schedule_offset': 1000}, 'different_groups': {}}, 'row_pruning': {'shared_parameters': {'enabled': False, 'method': 'l1', 'schedule_offset': 1000}, 'different_groups': {}}, 'head_pruning': {'shared_parameters': {'enabled': False, 'method': 'topk', 'schedule_offset': 1000}, 'different_groups': {}}, 'channel_pruning': {'shared_parameters': {'enabled': False, 'method': 'l1', 'schedule_offset': 1000}, 'different_groups': {}}, 'layer_reduction': {'enabled': False}}
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,129] [INFO] [config.py:1005:print]   curriculum_enabled_legacy .... False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,129] [INFO] [config.py:1005:print]   curriculum_params_legacy ..... False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,129] [INFO] [config.py:1005:print]   data_efficiency_config ....... {'enabled': False, 'seed': 1234, 'data_sampling': {'enabled': False, 'num_epochs': 1000, 'num_workers': 0, 'curriculum_learning': {'enabled': False}}, 'data_routing': {'enabled': False, 'random_ltd': {'enabled': False, 'layer_token_lr_schedule': {'enabled': False}}}}
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,129] [INFO] [config.py:1005:print]   data_efficiency_enabled ...... False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,130] [INFO] [config.py:1005:print]   dataloader_drop_last ......... False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,130] [INFO] [config.py:1005:print]   disable_allgather ............ False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,130] [INFO] [config.py:1005:print]   dump_state ................... False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,130] [INFO] [config.py:1005:print]   dynamic_loss_scale_args ...... None
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,130] [INFO] [config.py:1005:print]   eigenvalue_enabled ........... False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,130] [INFO] [config.py:1005:print]   eigenvalue_gas_boundary_resolution  1
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,130] [INFO] [config.py:1005:print]   eigenvalue_layer_name ........ bert.encoder.layer
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,130] [INFO] [config.py:1005:print]   eigenvalue_layer_num ......... 0
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,130] [INFO] [config.py:1005:print]   eigenvalue_max_iter .......... 100
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,130] [INFO] [config.py:1005:print]   eigenvalue_stability ......... 1e-06
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,130] [INFO] [config.py:1005:print]   eigenvalue_tol ............... 0.01
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,130] [INFO] [config.py:1005:print]   eigenvalue_verbose ........... False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,130] [INFO] [config.py:1005:print]   elasticity_enabled ........... False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,130] [INFO] [config.py:1005:print]   flops_profiler_config ........ {
+[36m(ReferenceModelRayActor pid=101495)[0m     "enabled": false, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "recompute_fwd_factor": 0.0, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "profile_step": 1, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "module_depth": -1, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "top_modules": 1, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "detailed": true, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "output_file": null
+[36m(ReferenceModelRayActor pid=101495)[0m }
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,130] [INFO] [config.py:1005:print]   fp16_auto_cast ............... None
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,130] [INFO] [config.py:1005:print]   fp16_enabled ................. False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,130] [INFO] [config.py:1005:print]   fp16_master_weights_and_gradients  False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,130] [INFO] [config.py:1005:print]   global_rank .................. 0
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,130] [INFO] [config.py:1005:print]   grad_accum_dtype ............. None
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,130] [INFO] [config.py:1005:print]   gradient_accumulation_steps .. 8
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,130] [INFO] [config.py:1005:print]   gradient_clipping ............ 1.0
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,130] [INFO] [config.py:1005:print]   gradient_predivide_factor .... 1.0
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,131] [INFO] [config.py:1005:print]   graph_harvesting ............. False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,131] [INFO] [config.py:1005:print]   hybrid_engine ................ enabled=False max_out_tokens=512 inference_tp_size=1 release_inference_cache=False pin_parameters=True tp_gather_partition_size=8
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,131] [INFO] [config.py:1005:print]   initial_dynamic_scale ........ 1
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,131] [INFO] [config.py:1005:print]   load_universal_checkpoint .... False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,131] [INFO] [config.py:1005:print]   loss_scale ................... 1.0
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,131] [INFO] [config.py:1005:print]   memory_breakdown ............. False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,131] [INFO] [config.py:1005:print]   mics_hierarchial_params_gather  False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,131] [INFO] [config.py:1005:print]   mics_shard_size .............. -1
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,131] [INFO] [config.py:1005:print]   monitor_config ............... tensorboard=TensorBoardConfig(enabled=False, output_path='', job_name='DeepSpeedJobName') comet=CometConfig(enabled=False, samples_log_interval=100, project=None, workspace=None, api_key=None, experiment_name=None, experiment_key=None, online=None, mode=None) wandb=WandbConfig(enabled=False, group=None, team=None, project='deepspeed') csv_monitor=CSVConfig(enabled=False, output_path='', job_name='DeepSpeedJobName')
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,131] [INFO] [config.py:1005:print]   nebula_config ................ {
+[36m(ReferenceModelRayActor pid=101495)[0m     "enabled": false, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "persistent_storage_path": null, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "persistent_time_interval": 100, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "num_of_version_in_retention": 2, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "enable_nebula_load": true, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "load_path": null
+[36m(ReferenceModelRayActor pid=101495)[0m }
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,131] [INFO] [config.py:1005:print]   optimizer_legacy_fusion ...... False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,131] [INFO] [config.py:1005:print]   optimizer_name ............... None
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,131] [INFO] [config.py:1005:print]   optimizer_params ............. None
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,131] [INFO] [config.py:1005:print]   pipeline ..................... {'stages': 'auto', 'partition': 'best', 'seed_layers': False, 'activation_checkpoint_interval': 0, 'pipe_partitioned': True, 'grad_partitioned': True}
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,131] [INFO] [config.py:1005:print]   pld_enabled .................. False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,131] [INFO] [config.py:1005:print]   pld_params ................... False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,131] [INFO] [config.py:1005:print]   prescale_gradients ........... False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,131] [INFO] [config.py:1005:print]   scheduler_name ............... None
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,131] [INFO] [config.py:1005:print]   scheduler_params ............. None
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,131] [INFO] [config.py:1005:print]   seq_parallel_communication_data_type  torch.float32
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,131] [INFO] [config.py:1005:print]   sparse_attention ............. None
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,132] [INFO] [config.py:1005:print]   sparse_gradients_enabled ..... False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,132] [INFO] [config.py:1005:print]   steps_per_print .............. 100
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,132] [INFO] [config.py:1005:print]   tensor_parallel_config ....... dtype=torch.float16 autotp_size=0 tensor_parallel=TPConfig(tp_size=1, tp_grain_size=1, mpu=None, tp_group=None) injection_policy_tuple=None keep_module_on_host=False replace_with_kernel_inject=False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,132] [INFO] [config.py:1005:print]   timers_config ................ enabled=True synchronized=True
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,132] [INFO] [config.py:1005:print]   train_batch_size ............. 128
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,132] [INFO] [config.py:1005:print]   train_micro_batch_size_per_gpu  2
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,132] [INFO] [config.py:1005:print]   use_data_before_expert_parallel_  False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,132] [INFO] [config.py:1005:print]   use_node_local_storage ....... False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,132] [INFO] [config.py:1005:print]   wall_clock_breakdown ......... False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,132] [INFO] [config.py:1005:print]   weight_quantization_config ... None
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,132] [INFO] [config.py:1005:print]   world_size ................... 8
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,132] [INFO] [config.py:1005:print]   zero_allow_untested_optimizer  False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,132] [INFO] [config.py:1005:print]   zero_config .................. stage=3 contiguous_gradients=True reduce_scatter=True reduce_bucket_size=500000000 use_multi_rank_bucket_allreduce=True allgather_partitions=True allgather_bucket_size=500000000 overlap_comm=True load_from_fp32_weights=True elastic_checkpoint=False offload_param=DeepSpeedZeroOffloadParamConfig(device='none', nvme_path=None, buffer_count=5, buffer_size=100000000, max_in_cpu=1000000000, pin_memory=True) offload_optimizer=None sub_group_size=1000000000 cpu_offload_param=None cpu_offload_use_pin_memory=None cpu_offload=None prefetch_bucket_size=50000000 param_persistence_threshold=100000 model_persistence_threshold=9223372036854775807 max_live_parameters=1000000000 max_reuse_distance=1000000000 gather_16bit_weights_on_model_save=False module_granularity_threshold=0 use_all_reduce_for_fetch_params=False stage3_gather_fp16_weights_on_model_save=False ignore_unused_parameters=True legacy_stage1=False round_robin_gradients=False zero_hpz_partition_size=1 zero_quantized_weights=False zero_quantized_nontrainable_weights=False zero_quantized_gradients=False zeropp_loco_param=None mics_shard_size=-1 mics_hierarchical_params_gather=False memory_efficient_linear=True pipeline_loading_checkpoint=False override_module_apply=True log_trace_cache_warnings=False
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,132] [INFO] [config.py:1005:print]   zero_enabled ................. True
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,132] [INFO] [config.py:1005:print]   zero_force_ds_cpu_optimizer .. True
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,132] [INFO] [config.py:1005:print]   zero_optimization_stage ...... 3
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:27,132] [INFO] [config.py:991:print_user_config]   json = {
+[36m(ReferenceModelRayActor pid=101495)[0m     "steps_per_print": 100, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "zero_optimization": {
+[36m(ReferenceModelRayActor pid=101495)[0m         "stage": 3, 
+[36m(ReferenceModelRayActor pid=101495)[0m         "stage3_max_live_parameters": "auto", 
+[36m(ReferenceModelRayActor pid=101495)[0m         "stage3_max_reuse_distance": "auto", 
+[36m(ReferenceModelRayActor pid=101495)[0m         "stage3_param_persistence_threshold": "auto", 
+[36m(ReferenceModelRayActor pid=101495)[0m         "stage3_prefetch_bucket_size": "auto", 
+[36m(ReferenceModelRayActor pid=101495)[0m         "offload_param": {
+[36m(ReferenceModelRayActor pid=101495)[0m             "device": "none", 
+[36m(ReferenceModelRayActor pid=101495)[0m             "pin_memory": true
+[36m(ReferenceModelRayActor pid=101495)[0m         }
+[36m(ReferenceModelRayActor pid=101495)[0m     }, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "bf16": {
+[36m(ReferenceModelRayActor pid=101495)[0m         "enabled": true
+[36m(ReferenceModelRayActor pid=101495)[0m     }, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "gradient_clipping": 1.0, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "prescale_gradients": false, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "wall_clock_breakdown": false, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "train_micro_batch_size_per_gpu": 2, 
+[36m(ReferenceModelRayActor pid=101495)[0m     "train_batch_size": 128
+[36m(ReferenceModelRayActor pid=101495)[0m }
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:30,762] [INFO] [utils.py:781:see_memory_usage] After initializing optimizer states
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:30,764] [INFO] [stage3.py:534:_setup_for_real_optimizer] optimizer state initialized
+[36m(ReferenceModelRayActor pid=101495)[0m [2025-05-26 19:23:26,658] [INFO] [config.py:734:__init__] Config mesh_device None world_size = 8[32m [repeated 8x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,511] [INFO] [utils.py:781:see_memory_usage] After initializing ZeRO optimizer
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,513] [INFO] [logging.py:128:log_dist] [Rank 0] DeepSpeed Final Optimizer = DeepSpeedZeroOptimizer_Stage3
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,513] [INFO] [logging.py:128:log_dist] [Rank 0] DeepSpeed using client LR scheduler
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,513] [INFO] [logging.py:128:log_dist] [Rank 0] DeepSpeed LR Scheduler = <torch.optim.lr_scheduler.LambdaLR object at 0x7fa70ed8b610>
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,513] [INFO] [logging.py:128:log_dist] [Rank 0] step=0, skipped=0, lr=[0.0, 0.0], mom=[(0.9, 0.95), (0.9, 0.95)]
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,519] [INFO] [config.py:1005:print]   zero_config .................. stage=3 contiguous_gradients=True reduce_scatter=True reduce_bucket_size=500000000 use_multi_rank_bucket_allreduce=True allgather_partitions=True allgather_bucket_size=500000000 overlap_comm=True load_from_fp32_weights=True elastic_checkpoint=False offload_param=DeepSpeedZeroOffloadParamConfig(device='none', nvme_path=None, buffer_count=5, buffer_size=100000000, max_in_cpu=1000000000, pin_memory=False) offload_optimizer=DeepSpeedZeroOffloadOptimizerConfig(device='cpu', nvme_path=None, buffer_count=4, pin_memory=True, pipeline_read=False, pipeline_write=False, fast_init=False, ratio=1.0) sub_group_size=1000000000 cpu_offload_param=None cpu_offload_use_pin_memory=None cpu_offload=None prefetch_bucket_size=50000000 param_persistence_threshold=100000 model_persistence_threshold=9223372036854775807 max_live_parameters=1000000000 max_reuse_distance=1000000000 gather_16bit_weights_on_model_save=False module_granularity_threshold=0 use_all_reduce_for_fetch_params=False stage3_gather_fp16_weights_on_model_save=False ignore_unused_parameters=True legacy_stage1=False round_robin_gradients=False zero_hpz_partition_size=1 zero_quantized_weights=False zero_quantized_nontrainable_weights=False zero_quantized_gradients=False zeropp_loco_param=None mics_shard_size=-1 mics_hierarchical_params_gather=False memory_efficient_linear=True pipeline_loading_checkpoint=False override_module_apply=True log_trace_cache_warnings=False
+[36m(ActorModelRayActor pid=100959)[0m             "device": "none"
+[36m(ActorModelRayActor pid=100959)[0m         "offload_optimizer": {
+[36m(ActorModelRayActor pid=100959)[0m             "device": "cpu", 
+[36m(ActorModelRayActor pid=100959)[0m         "sub_group_size": "auto", 
+[36m(ActorModelRayActor pid=100959)[0m         "reduce_bucket_size": "auto", 
+[36m(ActorModelRayActor pid=100959)[0m         "zero_hpz_partition_size": 1, 
+[36m(ActorModelRayActor pid=100959)[0m         "zero_quantized_weights": false, 
+[36m(ActorModelRayActor pid=100959)[0m         "zero_quantized_gradients": false, 
+[36m(ActorModelRayActor pid=100959)[0m         "reduce_scatter": true
+[36m(ActorModelRayActor pid=100959)[0m     "data_types": {
+[36m(ActorModelRayActor pid=100959)[0m         "grad_accum_dtype": null
+[36m(ActorModelRayActor pid=100959)[0m     "checkpoint": {
+[36m(ActorModelRayActor pid=100959)[0m         "load_universal": false
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,512] [INFO] [utils.py:782:see_memory_usage] MA 2.86 GB         Max_MA 4.89 GB         CA 5.02 GB         Max_CA 5 GB [32m [repeated 2x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,513] [INFO] [utils.py:789:see_memory_usage] CPU Virtual Memory:  used = 549.69 GB, percent = 54.6%[32m [repeated 2x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,515] [INFO] [config.py:1001:print] DeepSpeedEngine configuration:
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,515] [INFO] [config.py:1005:print]   activation_checkpointing_config  {
+[36m(ActorModelRayActor pid=100959)[0m     "partition_activations": false, 
+[36m(ActorModelRayActor pid=100959)[0m     "contiguous_memory_optimization": false, 
+[36m(ActorModelRayActor pid=100959)[0m     "cpu_checkpointing": false, 
+[36m(ActorModelRayActor pid=100959)[0m     "number_checkpoints": null, 
+[36m(ActorModelRayActor pid=100959)[0m     "synchronize_checkpoint_boundary": false, 
+[36m(ActorModelRayActor pid=100959)[0m     "profile": false
+[36m(ActorModelRayActor pid=100959)[0m }[32m [repeated 5x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,515] [INFO] [config.py:1005:print]   aio_config ................... {'block_size': 1048576, 'queue_depth': 8, 'intra_op_parallelism': 1, 'single_submit': False, 'overlap_events': True, 'use_gds': False}
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,515] [INFO] [config.py:1005:print]   amp_enabled .................. False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,515] [INFO] [config.py:1005:print]   amp_params ................... False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,515] [INFO] [config.py:1005:print]   autotuning_config ............ {
+[36m(ActorModelRayActor pid=100959)[0m     "enabled": false, [32m [repeated 3x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m     "start_step": null, 
+[36m(ActorModelRayActor pid=100959)[0m     "end_step": null, 
+[36m(ActorModelRayActor pid=100959)[0m     "metric_path": null, 
+[36m(ActorModelRayActor pid=100959)[0m     "arg_mappings": null, 
+[36m(ActorModelRayActor pid=100959)[0m     "metric": "throughput", 
+[36m(ActorModelRayActor pid=100959)[0m     "model_info": null, 
+[36m(ActorModelRayActor pid=100959)[0m     "results_dir": "autotuning_results", 
+[36m(ActorModelRayActor pid=100959)[0m     "exps_dir": "autotuning_exps", 
+[36m(ActorModelRayActor pid=100959)[0m     "overwrite": true, 
+[36m(ActorModelRayActor pid=100959)[0m     "fast": true, 
+[36m(ActorModelRayActor pid=100959)[0m     "start_profile_step": 3, 
+[36m(ActorModelRayActor pid=100959)[0m     "end_profile_step": 5, 
+[36m(ActorModelRayActor pid=100959)[0m     "tuner_type": "gridsearch", 
+[36m(ActorModelRayActor pid=100959)[0m     "tuner_early_stopping": 5, 
+[36m(ActorModelRayActor pid=100959)[0m     "tuner_num_trials": 50, 
+[36m(ActorModelRayActor pid=100959)[0m     "model_info_path": null, 
+[36m(ActorModelRayActor pid=100959)[0m     "mp_size": 1, 
+[36m(ActorModelRayActor pid=100959)[0m     "max_train_batch_size": null, 
+[36m(ActorModelRayActor pid=100959)[0m     "min_train_batch_size": 1, 
+[36m(ActorModelRayActor pid=100959)[0m     "max_train_micro_batch_size_per_gpu": 1.024000e+03, 
+[36m(ActorModelRayActor pid=100959)[0m     "min_train_micro_batch_size_per_gpu": 1, 
+[36m(ActorModelRayActor pid=100959)[0m     "num_tuning_micro_batch_sizes": 3
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,515] [INFO] [config.py:1005:print]   bfloat16_enabled ............. True
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,517] [INFO] [config.py:1005:print]   fp16_master_weights_and_gradients  False[32m [repeated 2x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,516] [INFO] [config.py:1005:print]   checkpoint_parallel_write_pipeline  False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,516] [INFO] [config.py:1005:print]   checkpoint_tag_validation_enabled  True
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,516] [INFO] [config.py:1005:print]   checkpoint_tag_validation_fail  False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,516] [INFO] [config.py:1005:print]   comms_config ................. <deepspeed.comm.config.DeepSpeedCommsConfig object at 0x7fa70ed8b580>
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,516] [INFO] [config.py:1005:print]   communication_data_type ...... None
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,516] [INFO] [config.py:1005:print]   compression_config ........... {'weight_quantization': {'shared_parameters': {'enabled': False, 'quantizer_kernel': False, 'schedule_offset': 0, 'quantize_groups': 1, 'quantize_verbose': False, 'quantization_type': 'symmetric', 'quantize_weight_in_forward': False, 'rounding': 'nearest', 'fp16_mixed_quantize': False, 'quantize_change_ratio': 0.001}, 'different_groups': {}}, 'activation_quantization': {'shared_parameters': {'enabled': False, 'quantization_type': 'symmetric', 'range_calibration': 'dynamic', 'schedule_offset': 1000}, 'different_groups': {}}, 'sparse_pruning': {'shared_parameters': {'enabled': False, 'method': 'l1', 'schedule_offset': 1000}, 'different_groups': {}}, 'row_pruning': {'shared_parameters': {'enabled': False, 'method': 'l1', 'schedule_offset': 1000}, 'different_groups': {}}, 'head_pruning': {'shared_parameters': {'enabled': False, 'method': 'topk', 'schedule_offset': 1000}, 'different_groups': {}}, 'channel_pruning': {'shared_parameters': {'enabled': False, 'method': 'l1', 'schedule_offset': 1000}, 'different_groups': {}}, 'layer_reduction': {'enabled': False}}
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,516] [INFO] [config.py:1005:print]   curriculum_enabled_legacy .... False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,516] [INFO] [config.py:1005:print]   curriculum_params_legacy ..... False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,516] [INFO] [config.py:1005:print]   data_efficiency_config ....... {'enabled': False, 'seed': 1234, 'data_sampling': {'enabled': False, 'num_epochs': 1000, 'num_workers': 0, 'curriculum_learning': {'enabled': False}}, 'data_routing': {'enabled': False, 'random_ltd': {'enabled': False, 'layer_token_lr_schedule': {'enabled': False}}}}
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,516] [INFO] [config.py:1005:print]   data_efficiency_enabled ...... False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,516] [INFO] [config.py:1005:print]   dataloader_drop_last ......... False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,516] [INFO] [config.py:1005:print]   disable_allgather ............ False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,516] [INFO] [config.py:1005:print]   dump_state ................... False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,516] [INFO] [config.py:1005:print]   dynamic_loss_scale_args ...... None
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,516] [INFO] [config.py:1005:print]   eigenvalue_enabled ........... False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,516] [INFO] [config.py:1005:print]   eigenvalue_gas_boundary_resolution  1
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,516] [INFO] [config.py:1005:print]   eigenvalue_layer_name ........ bert.encoder.layer
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,516] [INFO] [config.py:1005:print]   eigenvalue_layer_num ......... 0
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,516] [INFO] [config.py:1005:print]   eigenvalue_max_iter .......... 100
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,516] [INFO] [config.py:1005:print]   eigenvalue_stability ......... 1e-06
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,517] [INFO] [config.py:1005:print]   eigenvalue_tol ............... 0.01
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,517] [INFO] [config.py:1005:print]   eigenvalue_verbose ........... False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,517] [INFO] [config.py:1005:print]   elasticity_enabled ........... False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,517] [INFO] [config.py:1005:print]   flops_profiler_config ........ {
+[36m(ActorModelRayActor pid=100959)[0m     "recompute_fwd_factor": 0.0, 
+[36m(ActorModelRayActor pid=100959)[0m     "profile_step": 1, 
+[36m(ActorModelRayActor pid=100959)[0m     "module_depth": -1, 
+[36m(ActorModelRayActor pid=100959)[0m     "top_modules": 1, 
+[36m(ActorModelRayActor pid=100959)[0m     "detailed": true, 
+[36m(ActorModelRayActor pid=100959)[0m     "output_file": null
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,517] [INFO] [config.py:1005:print]   fp16_auto_cast ............... None
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,517] [INFO] [config.py:1005:print]   fp16_enabled ................. False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,517] [INFO] [config.py:1005:print]   global_rank .................. 0
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,517] [INFO] [config.py:1005:print]   grad_accum_dtype ............. None
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,517] [INFO] [config.py:1005:print]   gradient_accumulation_steps .. 8
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,517] [INFO] [config.py:1005:print]   gradient_clipping ............ 1.0
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,517] [INFO] [config.py:1005:print]   gradient_predivide_factor .... 1.0
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,517] [INFO] [config.py:1005:print]   graph_harvesting ............. False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,517] [INFO] [config.py:1005:print]   hybrid_engine ................ enabled=False max_out_tokens=512 inference_tp_size=1 release_inference_cache=False pin_parameters=True tp_gather_partition_size=8
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,517] [INFO] [config.py:1005:print]   initial_dynamic_scale ........ 1
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,517] [INFO] [config.py:1005:print]   load_universal_checkpoint .... False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,517] [INFO] [config.py:1005:print]   loss_scale ................... 1.0
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,517] [INFO] [config.py:1005:print]   memory_breakdown ............. False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,517] [INFO] [config.py:1005:print]   mics_hierarchial_params_gather  False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,517] [INFO] [config.py:1005:print]   mics_shard_size .............. -1
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,517] [INFO] [config.py:1005:print]   monitor_config ............... tensorboard=TensorBoardConfig(enabled=False, output_path='', job_name='DeepSpeedJobName') comet=CometConfig(enabled=False, samples_log_interval=100, project=None, workspace=None, api_key=None, experiment_name=None, experiment_key=None, online=None, mode=None) wandb=WandbConfig(enabled=False, group=None, team=None, project='deepspeed') csv_monitor=CSVConfig(enabled=False, output_path='', job_name='DeepSpeedJobName')
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,518] [INFO] [config.py:1005:print]   nebula_config ................ {
+[36m(ActorModelRayActor pid=100959)[0m     "persistent_storage_path": null, 
+[36m(ActorModelRayActor pid=100959)[0m     "persistent_time_interval": 100, 
+[36m(ActorModelRayActor pid=100959)[0m     "num_of_version_in_retention": 2, 
+[36m(ActorModelRayActor pid=100959)[0m     "enable_nebula_load": true, 
+[36m(ActorModelRayActor pid=100959)[0m     "load_path": null
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,518] [INFO] [config.py:1005:print]   optimizer_legacy_fusion ...... False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,518] [INFO] [config.py:1005:print]   optimizer_name ............... None
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,518] [INFO] [config.py:1005:print]   optimizer_params ............. None
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,518] [INFO] [config.py:1005:print]   pipeline ..................... {'stages': 'auto', 'partition': 'best', 'seed_layers': False, 'activation_checkpoint_interval': 0, 'pipe_partitioned': True, 'grad_partitioned': True}
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,518] [INFO] [config.py:1005:print]   pld_enabled .................. False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,518] [INFO] [config.py:1005:print]   pld_params ................... False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,518] [INFO] [config.py:1005:print]   prescale_gradients ........... False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,518] [INFO] [config.py:1005:print]   scheduler_name ............... None
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,518] [INFO] [config.py:1005:print]   scheduler_params ............. None
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,518] [INFO] [config.py:1005:print]   seq_parallel_communication_data_type  torch.float32
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,518] [INFO] [config.py:1005:print]   sparse_attention ............. None
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,518] [INFO] [config.py:1005:print]   sparse_gradients_enabled ..... False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,518] [INFO] [config.py:1005:print]   steps_per_print .............. 100
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,518] [INFO] [config.py:1005:print]   tensor_parallel_config ....... dtype=torch.float16 autotp_size=0 tensor_parallel=TPConfig(tp_size=1, tp_grain_size=1, mpu=None, tp_group=None) injection_policy_tuple=None keep_module_on_host=False replace_with_kernel_inject=False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,518] [INFO] [config.py:1005:print]   timers_config ................ enabled=True synchronized=True
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,518] [INFO] [config.py:1005:print]   train_batch_size ............. 128
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,518] [INFO] [config.py:1005:print]   train_micro_batch_size_per_gpu  2
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,518] [INFO] [config.py:1005:print]   use_data_before_expert_parallel_  False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,518] [INFO] [config.py:1005:print]   use_node_local_storage ....... False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,518] [INFO] [config.py:1005:print]   wall_clock_breakdown ......... False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,518] [INFO] [config.py:1005:print]   weight_quantization_config ... None
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,519] [INFO] [config.py:1005:print]   world_size ................... 8
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,519] [INFO] [config.py:1005:print]   zero_allow_untested_optimizer  False
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,519] [INFO] [config.py:1005:print]   zero_enabled ................. True
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,519] [INFO] [config.py:1005:print]   zero_force_ds_cpu_optimizer .. True
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,519] [INFO] [config.py:1005:print]   zero_optimization_stage ...... 3
+[36m(ActorModelRayActor pid=100959)[0m [2025-05-26 19:23:33,519] [INFO] [config.py:991:print_user_config]   json = {
+[36m(ActorModelRayActor pid=100959)[0m     "steps_per_print": 100, 
+[36m(ActorModelRayActor pid=100959)[0m     "zero_optimization": {
+[36m(ActorModelRayActor pid=100959)[0m         "stage": 3, 
+[36m(ActorModelRayActor pid=100959)[0m         "stage3_prefetch_bucket_size": "auto", [32m [repeated 4x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m         "offload_param": {
+[36m(ActorModelRayActor pid=100959)[0m             "pin_memory": true
+[36m(ActorModelRayActor pid=100959)[0m     }, [32m [repeated 6x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m     "bf16": {
+[36m(ActorModelRayActor pid=100959)[0m         "enabled": true
+[36m(ActorModelRayActor pid=100959)[0m     "gradient_clipping": 1.0, 
+[36m(ActorModelRayActor pid=100959)[0m     "prescale_gradients": false, 
+[36m(ActorModelRayActor pid=100959)[0m     "wall_clock_breakdown": false, 
+[36m(ActorModelRayActor pid=100959)[0m     "train_micro_batch_size_per_gpu": 2, 
+[36m(ActorModelRayActor pid=100959)[0m     "train_batch_size": 128
+[36m(ActorModelRayActor pid=100959)[0m wandb: Using wandb-core as the SDK backend.  Please refer to https://wandb.me/wandb-core for more information.
+[36m(ReferenceModelRayActor pid=101495)[0m 
+Loading checkpoint shards:  80%|████████  | 4/5 [00:26<00:06,  6.26s/it][32m [repeated 6x across cluster][0m
+[36m(ReferenceModelRayActor pid=101495)[0m 
+Loading checkpoint shards: 100%|██████████| 5/5 [00:27<00:00,  4.45s/it]
+Loading checkpoint shards: 100%|██████████| 5/5 [00:27<00:00,  5.51s/it][32m [repeated 7x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m wandb: Tracking run with wandb version 0.19.8
+[36m(ActorModelRayActor pid=100959)[0m wandb: W&B syncing is set to `offline` in this directory.  
+[36m(ActorModelRayActor pid=100959)[0m wandb: Run `wandb online` or set WANDB_MODE=online to enable cloud syncing.
+[36m(LLMRayActor pid=89986)[0m init_process_group: master_address=10.140.1.87, master_port=1652,  rank=6, world_size=9, group_name=openrlhf
+[36m(ActorModelRayActor pid=100959)[0m 
+Episode [1/2]:   0%|          | 0/187 [00:00<?, ?it/s]
+[36m(LLMRayActor pid=89991)[0m INFO 05-26 19:23:39 [executor_base.py:219] It took 1.506233 seconds to wake up.
+[36m(LLMRayActor pid=89989)[0m 
+Processed prompts:   0%|          | 0/256 [00:00<?, ?it/s, est. speed input: 0.00 toks/s, output: 0.00 toks/s]
+[36m(LLMRayActor pid=89988)[0m 
+Processed prompts:   0%|          | 0/256 [00:00<?, ?it/s, est. speed input: 0.00 toks/s, output: 0.00 toks/s][32m [repeated 3x across cluster][0m
+[36m(LLMRayActor pid=89989)[0m 
+Processed prompts:   0%|          | 1/256 [00:18<1:16:50, 18.08s/it, est. speed input: 26.82 toks/s, output: 1.11 toks/s]
+[36m(LLMRayActor pid=89991)[0m 
+Processed prompts:   0%|          | 0/256 [00:00<?, ?it/s, est. speed input: 0.00 toks/s, output: 0.00 toks/s][32m [repeated 4x across cluster][0m
+[36m(LLMRayActor pid=89989)[0m 
+Processed prompts:   1%|          | 2/256 [00:18<32:33,  7.69s/it, est. speed input: 47.68 toks/s, output: 2.70 toks/s]  
+[36m(LLMRayActor pid=89989)[0m 
+Processed prompts:   1%|          | 3/256 [00:19<20:17,  4.81s/it, est. speed input: 72.75 toks/s, output: 5.68 toks/s]
+[36m(LLMRayActor pid=89989)[0m 
+Processed prompts:   2%|▏         | 5/256 [00:20<08:56,  2.14s/it, est. speed input: 111.62 toks/s, output: 12.21 toks/s]
+[36m(LLMRayActor pid=89989)[0m 
+Processed prompts:   3%|▎         | 7/256 [00:20<05:08,  1.24s/it, est. speed input: 149.01 toks/s, output: 19.00 toks/s]
+[36m(LLMRayActor pid=89989)[0m 
+Processed prompts:   3%|▎         | 8/256 [00:20<04:00,  1.03it/s, est. speed input: 223.97 toks/s, output: 22.60 toks/s]
+[36m(LLMRayActor pid=89989)[0m 
+Processed prompts:   4%|▍         | 10/256 [00:20<02:33,  1.60it/s, est. speed input: 259.33 toks/s, output: 30.01 toks/s]
+Processed prompts:   4%|▍         | 11/256 [00:20<02:07,  1.92it/s, est. speed input: 276.24 toks/s, output: 33.89 toks/s]
+[36m(LLMRayActor pid=89989)[0m 
+Processed prompts:   5%|▌         | 13/256 [00:20<01:23,  2.93it/s, est. speed input: 312.04 toks/s, output: 42.02 toks/s]
+Processed prompts:   9%|▊         | 22/256 [00:21<00:25,  9.35it/s, est. speed input: 545.07 toks/s, output: 80.42 toks/s]
+[36m(LLMRayActor pid=89989)[0m 
+Processed prompts:  14%|█▍        | 36/256 [00:21<00:13, 16.75it/s, est. speed input: 811.15 toks/s, output: 141.86 toks/s]
+Processed prompts:  17%|█▋        | 43/256 [00:21<00:09, 23.51it/s, est. speed input: 942.97 toks/s, output: 175.40 toks/s]
+[36m(LLMRayActor pid=89990)[0m 
+Processed prompts:   7%|▋         | 17/256 [00:21<00:49,  4.79it/s, est. speed input: 340.49 toks/s, output: 55.48 toks/s][32m [repeated 9x across cluster][0m
+[36m(LLMRayActor pid=89990)[0m 
+Processed prompts:  37%|███▋      | 94/256 [00:24<00:04, 35.15it/s, est. speed input: 1896.40 toks/s, output: 454.41 toks/s]
+Processed prompts:  40%|████      | 103/256 [00:24<00:03, 48.83it/s, est. speed input: 2049.87 toks/s, output: 511.26 toks/s][32m [repeated 22x across cluster][0m
+[36m(LLMRayActor pid=89989)[0m 
+Processed prompts:  92%|█████████▏| 236/256 [00:26<00:00, 31.66it/s, est. speed input: 4721.76 toks/s, output: 1498.53 toks/s]
+[36m(LLMRayActor pid=89989)[0m 
+Processed prompts:  94%|█████████▍| 240/256 [00:27<00:00, 27.80it/s, est. speed input: 4759.26 toks/s, output: 1534.53 toks/s]
+[36m(LLMRayActor pid=89989)[0m 
+Processed prompts:  95%|█████████▌| 244/256 [00:27<00:00, 26.40it/s, est. speed input: 4802.16 toks/s, output: 1572.79 toks/s]
+[36m(LLMRayActor pid=89989)[0m 
+Processed prompts:  96%|█████████▋| 247/256 [00:27<00:00, 19.49it/s, est. speed input: 4806.72 toks/s, output: 1593.31 toks/s]
+[36m(LLMRayActor pid=89989)[0m 
+Processed prompts:  98%|█████████▊| 251/256 [00:27<00:00, 16.88it/s, est. speed input: 4829.45 toks/s, output: 1627.28 toks/s]
+[36m(LLMRayActor pid=89990)[0m 
+Processed prompts:  74%|███████▍  | 190/256 [00:26<00:01, 54.37it/s, est. speed input: 3559.94 toks/s, output: 1119.40 toks/s][32m [repeated 14x across cluster][0m
+[36m(LLMRayActor pid=89990)[0m 
+Processed prompts:  93%|█████████▎| 237/256 [00:27<00:00, 39.03it/s, est. speed input: 4686.60 toks/s, output: 1510.85 toks/s]
+Processed prompts:  95%|█████████▍| 242/256 [00:28<00:00, 41.14it/s, est. speed input: 4744.06 toks/s, output: 1559.37 toks/s]
+[36m(LLMRayActor pid=89990)[0m 
+Processed prompts:  87%|████████▋ | 222/256 [00:27<00:01, 33.86it/s, est. speed input: 4290.41 toks/s, output: 1373.60 toks/s]
+Processed prompts:  88%|████████▊ | 226/256 [00:27<00:00, 32.74it/s, est. speed input: 4462.19 toks/s, output: 1407.57 toks/s][32m [repeated 8x across cluster][0m
+[36m(LLMRayActor pid=89990)[0m 
+Processed prompts: 100%|██████████| 256/256 [00:29<00:00,  8.59it/s, est. speed input: 4843.49 toks/s, output: 1632.80 toks/s][32m [repeated 7x across cluster][0m
+[36m(LLMRayActor pid=89986)[0m 
+Processed prompts:  14%|█▍        | 37/256 [00:28<00:14, 15.27it/s, est. speed input: 714.35 toks/s, output: 148.48 toks/s][32m [repeated 13x across cluster][0m
+[36m(LLMRayActor pid=89986)[0m 
+Processed prompts:  68%|██████▊   | 174/256 [00:31<00:01, 46.30it/s, est. speed input: 3610.88 toks/s, output: 899.10 toks/s]
+Processed prompts:  70%|██████▉   | 179/256 [00:31<00:01, 45.35it/s, est. speed input: 3720.61 toks/s, output: 931.80 toks/s][32m [repeated 13x across cluster][0m
+[36m(LLMRayActor pid=89986)[0m 
+Processed prompts:  88%|████████▊ | 224/256 [00:32<00:01, 22.81it/s, est. speed input: 4478.96 toks/s, output: 1243.53 toks/s]
+Processed prompts:  89%|████████▉ | 228/256 [00:33<00:01, 26.25it/s, est. speed input: 4587.87 toks/s, output: 1277.24 toks/s]
+Processed prompts:  91%|█████████ | 233/256 [00:33<00:00, 30.63it/s, est. speed input: 4645.70 toks/s, output: 1320.61 toks/s]
+[36m(LLMRayActor pid=89986)[0m 
+Processed prompts:  93%|█████████▎| 237/256 [00:33<00:00, 30.98it/s, est. speed input: 4759.81 toks/s, output: 1354.70 toks/s]
+[36m(LLMRayActor pid=89986)[0m 
+Processed prompts:  94%|█████████▍| 241/256 [00:33<00:00, 32.50it/s, est. speed input: 4841.74 toks/s, output: 1389.95 toks/s]
+[36m(LLMRayActor pid=89992)[0m 
+Processed prompts:  30%|███       | 77/256 [00:32<00:05, 31.61it/s, est. speed input: 2109.45 toks/s, output: 281.15 toks/s][32m [repeated 34x across cluster][0m
+[36m(LLMRayActor pid=89986)[0m 
+Processed prompts:  96%|█████████▌| 245/256 [00:33<00:00, 20.14it/s, est. speed input: 4880.62 toks/s, output: 1415.47 toks/s]
+[36m(LLMRayActor pid=89986)[0m 
+Processed prompts:  97%|█████████▋| 248/256 [00:33<00:00, 20.35it/s, est. speed input: 4967.70 toks/s, output: 1441.97 toks/s]
+[36m(LLMRayActor pid=89986)[0m 
+Processed prompts:  98%|█████████▊| 251/256 [00:34<00:00, 20.21it/s, est. speed input: 5084.91 toks/s, output: 1468.96 toks/s]
+[36m(LLMRayActor pid=89986)[0m 
+Processed prompts:  99%|█████████▉| 254/256 [00:34<00:00, 14.36it/s, est. speed input: 5136.88 toks/s, output: 1487.77 toks/s]
+[36m(LLMRayActor pid=89988)[0m 
+Processed prompts:  93%|█████████▎| 237/256 [00:34<00:00, 30.74it/s, est. speed input: 5747.85 toks/s, output: 989.05 toks/s]
+Processed prompts:  94%|█████████▍| 241/256 [00:35<00:00, 32.07it/s, est. speed input: 5793.29 toks/s, output: 1015.92 toks/s]
+[36m(LLMRayActor pid=89992)[0m 
+Processed prompts:  86%|████████▋ | 221/256 [00:35<00:00, 49.41it/s, est. speed input: 5238.45 toks/s, output: 1047.95 toks/s]
+Processed prompts:  89%|████████▊ | 227/256 [00:35<00:00, 44.64it/s, est. speed input: 5352.28 toks/s, output: 1087.47 toks/s][32m [repeated 37x across cluster][0m
+[36m(LLMRayActor pid=89993)[0m 
+Processed prompts:  98%|█████████▊| 252/256 [00:36<00:00, 26.33it/s, est. speed input: 5868.51 toks/s, output: 1112.04 toks/s][32m [repeated 11x across cluster][0m
+[36m(LLMRayActor pid=89991)[0m 
+Processed prompts:   4%|▍         | 10/256 [00:34<06:14,  1.52s/it, est. speed input: 289.69 toks/s, output: 25.06 toks/s][32m [repeated 29x across cluster][0m
+[36m(LLMRayActor pid=89993)[0m 
+Processed prompts: 100%|██████████| 256/256 [00:37<00:00,  9.63it/s, est. speed input: 5739.06 toks/s, output: 1112.37 toks/s]
+Processed prompts: 100%|██████████| 256/256 [00:37<00:00,  6.78it/s, est. speed input: 5739.06 toks/s, output: 1112.37 toks/s][32m [repeated 4x across cluster][0m
+[36m(LLMRayActor pid=89991)[0m 
+Processed prompts:  42%|████▏     | 108/256 [00:37<00:03, 41.35it/s, est. speed input: 3005.00 toks/s, output: 368.70 toks/s]
+Processed prompts:  44%|████▍     | 113/256 [00:37<00:03, 37.40it/s, est. speed input: 3136.89 toks/s, output: 389.15 toks/s][32m [repeated 17x across cluster][0m
+[36m(LLMRayActor pid=89992)[0m 
+Processed prompts: 100%|██████████| 256/256 [00:37<00:00,  6.74it/s, est. speed input: 5478.16 toks/s, output: 1263.78 toks/s]
+[36m(LLMRayActor pid=89985)[0m 
+Processed prompts:  92%|█████████▏| 236/256 [00:40<00:00, 41.15it/s, est. speed input: 5636.07 toks/s, output: 947.58 toks/s]
+[36m(LLMRayActor pid=89991)[0m 
+Processed prompts:  89%|████████▉ | 229/256 [00:39<00:00, 50.04it/s, est. speed input: 5692.57 toks/s, output: 985.96 toks/s]
+Processed prompts:  93%|█████████▎| 237/256 [00:39<00:00, 52.52it/s, est. speed input: 5793.90 toks/s, output: 1036.97 toks/s]
+[36m(LLMRayActor pid=89985)[0m 
+Processed prompts:  90%|█████████ | 231/256 [00:40<00:00, 43.55it/s, est. speed input: 5489.68 toks/s, output: 917.90 toks/s][32m [repeated 25x across cluster][0m
+[36m(LLMRayActor pid=89985)[0m 
+Processed prompts: 100%|██████████| 256/256 [00:42<00:00, 11.48it/s, est. speed input: 5835.79 toks/s, output: 1054.40 toks/s]
+Processed prompts: 100%|██████████| 256/256 [00:42<00:00,  6.03it/s, est. speed input: 5835.79 toks/s, output: 1054.40 toks/s][32m [repeated 3x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m ele.get("min_pixels" 3136
+[36m(ActorModelRayActor pid=100959)[0m ele.get("max_pixels" 1254400
+[36m(ActorModelRayActor pid=100959)[0m ele.get("min_pixels" 3136
+[36m(ActorModelRayActor pid=100959)[0m ele.get("max_pixels" 1254400
+[36m(LLMRayActor pid=89992)[0m init_process_group: master_address=10.140.1.87, master_port=1652,  rank=7, world_size=9, group_name=openrlhf[32m [repeated 7x across cluster][0m
+[36m(LLMRayActor pid=89985)[0m INFO 05-26 19:23:39 [executor_base.py:219] It took 1.396430 seconds to wake up.[32m [repeated 7x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=101494)[0m ele.get("min_pixels" 3136[32m [repeated 822x across cluster][0m
+[36m(ActorModelRayActor pid=101494)[0m ele.get("max_pixels" 1254400[32m [repeated 822x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m ele.get("min_pixels" 3136[32m [repeated 640x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m ele.get("max_pixels" 1254400[32m [repeated 640x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m ele.get("min_pixels" 3136[32m [repeated 404x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m ele.get("max_pixels" 1254400[32m [repeated 404x across cluster][0m
+[36m(LLMRayActor pid=89991)[0m INFO 05-26 19:25:36 [worker.py:133] Sleep mode freed 38.53 GiB memory, 22.51 GiB memory is still in use.
+[36m(LLMRayActor pid=89991)[0m INFO 05-26 19:25:36 [executor_base.py:208] It took 1.628275 seconds to fall asleep.
+[36m(ActorModelRayActor pid=100959)[0m ele.get("min_pixels" 3136[32m [repeated 180x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m ele.get("max_pixels" 1254400[32m [repeated 180x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:   0%|          | 0/128 [00:00<?, ?it/s][A
+[36m(LLMRayActor pid=89991)[0m 
+Processed prompts:  85%|████████▍ | 217/256 [00:39<00:00, 46.94it/s, est. speed input: 5546.07 toks/s, output: 911.97 toks/s]
+Processed prompts:  87%|████████▋ | 223/256 [00:39<00:00, 49.04it/s, est. speed input: 5637.97 toks/s, output: 948.65 toks/s][32m [repeated 10x across cluster][0m
+[36m(LLMRayActor pid=89991)[0m 
+Processed prompts: 100%|██████████| 256/256 [00:41<00:00,  6.10it/s, est. speed input: 5716.82 toks/s, output: 1128.18 toks/s][32m [repeated 4x across cluster][0m
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:   1%|          | 1/128 [00:31<1:07:06, 31.71s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:   2%|▏         | 2/128 [00:33<29:51, 14.22s/it]  [A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:   2%|▏         | 3/128 [00:36<18:37,  8.94s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:   3%|▎         | 4/128 [00:37<12:23,  6.00s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:   4%|▍         | 5/128 [00:39<08:58,  4.38s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:   5%|▍         | 6/128 [00:40<07:00,  3.44s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:   5%|▌         | 7/128 [00:42<05:40,  2.81s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:   6%|▋         | 8/128 [00:43<04:46,  2.39s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:   7%|▋         | 9/128 [00:45<03:59,  2.01s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:   8%|▊         | 10/128 [00:46<03:22,  1.71s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:   9%|▊         | 11/128 [00:47<02:57,  1.51s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:   9%|▉         | 12/128 [00:48<02:38,  1.37s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  10%|█         | 13/128 [00:49<02:25,  1.27s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  11%|█         | 14/128 [00:50<02:18,  1.21s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  12%|█▏        | 15/128 [00:51<02:09,  1.15s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  12%|█▎        | 16/128 [00:52<02:04,  1.11s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  13%|█▎        | 17/128 [00:53<02:16,  1.23s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  14%|█▍        | 18/128 [00:55<02:24,  1.31s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  15%|█▍        | 19/128 [00:56<02:29,  1.37s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  16%|█▌        | 20/128 [00:58<02:33,  1.42s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  16%|█▋        | 21/128 [01:00<02:35,  1.45s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  17%|█▋        | 22/128 [01:01<02:36,  1.48s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  18%|█▊        | 23/128 [01:03<02:35,  1.48s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  19%|█▉        | 24/128 [01:04<02:35,  1.50s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  20%|█▉        | 25/128 [01:06<02:38,  1.54s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  20%|██        | 26/128 [01:07<02:36,  1.54s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  21%|██        | 27/128 [01:09<02:37,  1.56s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  22%|██▏       | 28/128 [01:10<02:38,  1.58s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  23%|██▎       | 29/128 [01:12<02:35,  1.57s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  23%|██▎       | 30/128 [01:14<02:35,  1.59s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  24%|██▍       | 31/128 [01:15<02:39,  1.64s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  25%|██▌       | 32/128 [01:17<02:35,  1.62s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  26%|██▌       | 33/128 [01:18<02:28,  1.56s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  27%|██▋       | 34/128 [01:20<02:26,  1.56s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  27%|██▋       | 35/128 [01:21<02:24,  1.55s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  28%|██▊       | 36/128 [01:23<02:23,  1.56s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  29%|██▉       | 37/128 [01:25<02:21,  1.55s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  30%|██▉       | 38/128 [01:26<02:20,  1.56s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  30%|███       | 39/128 [01:28<02:20,  1.57s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  31%|███▏      | 40/128 [01:29<02:19,  1.58s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  32%|███▏      | 41/128 [01:31<02:14,  1.54s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  33%|███▎      | 42/128 [01:32<02:11,  1.53s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  34%|███▎      | 43/128 [01:34<02:08,  1.51s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  34%|██��▍      | 44/128 [01:35<02:07,  1.51s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  35%|███▌      | 45/128 [01:37<02:03,  1.49s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  36%|███▌      | 46/128 [01:38<02:01,  1.48s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  37%|███▋      | 47/128 [01:40<01:59,  1.47s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  38%|███▊      | 48/128 [01:41<01:57,  1.46s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  38%|███▊      | 49/128 [01:43<01:55,  1.46s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  39%|███▉      | 50/128 [01:44<01:53,  1.46s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  40%|███▉      | 51/128 [01:45<01:51,  1.45s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  41%|████      | 52/128 [01:47<01:51,  1.47s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  41%|████▏     | 53/128 [01:48<01:50,  1.48s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  42%|████▏     | 54/128 [01:50<01:48,  1.47s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  43%|████▎     | 55/128 [01:51<01:45,  1.45s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  44%|████▍     | 56/128 [01:53<01:45,  1.46s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  45%|████▍     | 57/128 [01:54<01:46,  1.49s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  45%|████▌     | 58/128 [01:56<01:44,  1.50s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  46%|████▌     | 59/128 [01:57<01:43,  1.51s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  47%|████▋     | 60/128 [01:59<01:43,  1.52s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  48%|████▊     | 61/128 [02:01<01:43,  1.54s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  48%|████▊     | 62/128 [02:02<01:40,  1.52s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  49%|████▉     | 63/128 [02:04<01:39,  1.53s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  50%|█████     | 64/128 [02:05<01:36,  1.51s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  51%|█████     | 65/128 [02:07<01:35,  1.52s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  52%|█████▏    | 66/128 [02:08<01:35,  1.54s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  52%|█████▏    | 67/128 [02:10<01:34,  1.55s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  53%|█████▎    | 68/128 [02:11<01:33,  1.56s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  54%|█████▍    | 69/128 [02:13<01:31,  1.56s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  55%|█████▍    | 70/128 [02:14<01:29,  1.55s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  55%|█████▌    | 71/128 [02:16<01:28,  1.55s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  56%|█████▋    | 72/128 [02:18<01:26,  1.55s/it][A
+[36m(ActorModelRayActor pid=100959)[0m 
+[36m(ActorModelRayActor pid=100959)[0m 
+make_experience:  57%|█████▋    | 73/128 [02:19<01:23,  1.52s/it][A