Spaces:

cdpearlman
/

LLMVis

Sleeping

@@ -2,6 +2,7 @@
 ## Recent Fixes
 - [X] Fixed callback error: Changed Output from non-existent 'status-message' to existing 'model-status' component
 ## PHASE 1: Backend Infrastructure Changes

 ## Recent Fixes
 - [X] Fixed callback error: Changed Output from non-existent 'status-message' to existing 'model-status' component
+- [X] Fixed token predictions not being collected: Changed condition in extract_layer_data to check for block_outputs and norm_parameters instead of logit_lens_parameter
 ## PHASE 1: Backend Infrastructure Changes

utils/__pycache__/model_patterns.cpython-311.pyc CHANGED Viewed

Binary files a/utils/__pycache__/model_patterns.cpython-311.pyc and b/utils/__pycache__/model_patterns.cpython-311.pyc differ

utils/model_patterns.py CHANGED Viewed

@@ -1051,7 +1051,13 @@ def extract_layer_data(activation_data: Dict[str, Any], model, tokenizer) -> Lis
          for name in layer_modules if re.findall(r'\d+', name)]
     )
-    logit_lens_enabled = activation_data.get('logit_lens_parameter') is not None
     # Get global top 5 tokens from final output
     global_top5_tokens = activation_data.get('global_top5_tokens', [])
@@ -1062,7 +1068,7 @@ def extract_layer_data(activation_data: Dict[str, Any], model, tokenizer) -> Lis
     prev_global_probs = {}  # Track previous layer's global top 5 probabilities
     for layer_num, module_name in layer_info:
-        top_tokens = _get_top_tokens(activation_data, module_name, model, tokenizer, top_k=5) if logit_lens_enabled else None
         # Get top-3 attended tokens for this layer
         top_attended = _get_top_attended_tokens(activation_data, layer_num, tokenizer, top_k=3)
@@ -1070,7 +1076,7 @@ def extract_layer_data(activation_data: Dict[str, Any], model, tokenizer) -> Lis
         # Get probabilities for global top 5 tokens at this layer
         global_top5_probs = {}
         global_top5_deltas = {}
-        if logit_lens_enabled and global_top5_token_names:
             global_top5_probs = _get_token_probabilities_for_layer(
                 activation_data, module_name, model, tokenizer, global_top5_token_names
             )

          for name in layer_modules if re.findall(r'\d+', name)]
     )
+    # Check if we can compute token predictions (requires block_outputs and norm_parameters)
+    # Note: Previously, this checked for logit_lens_parameter, but that parameter is not actually
+    # needed for computing predictions. The _get_top_tokens function only needs block_outputs
+    # and norm_parameters to work correctly.
+    has_block_outputs = bool(activation_data.get('block_outputs', {}))
+    has_norm_params = bool(activation_data.get('norm_parameters', []))
+    can_compute_predictions = has_block_outputs and has_norm_params
     # Get global top 5 tokens from final output
     global_top5_tokens = activation_data.get('global_top5_tokens', [])
     prev_global_probs = {}  # Track previous layer's global top 5 probabilities
     for layer_num, module_name in layer_info:
+        top_tokens = _get_top_tokens(activation_data, module_name, model, tokenizer, top_k=5) if can_compute_predictions else None
         # Get top-3 attended tokens for this layer
         top_attended = _get_top_attended_tokens(activation_data, layer_num, tokenizer, top_k=3)
         # Get probabilities for global top 5 tokens at this layer
         global_top5_probs = {}
         global_top5_deltas = {}
+        if can_compute_predictions and global_top5_token_names:
             global_top5_probs = _get_token_probabilities_for_layer(
                 activation_data, module_name, model, tokenizer, global_top5_token_names
             )