Spaces:

SWE-Arena
/

SWE-Issue

Sleeping

App Files Files Community

zhimin-z commited on Jan 22

Commit

7f2e001

1 Parent(s): c931f22

add

Browse files

Files changed (1) hide show

msr.py +98 -6

msr.py CHANGED Viewed

@@ -901,7 +901,7 @@ def calculate_issue_stats_from_metadata(metadata_list):
     }
-def calculate_monthly_metrics_by_agent(all_metadata_dict, assistants):
     """Calculate monthly metrics for all assistants for visualization."""
     identifier_to_name = {assistant.get('github_identifier'): assistant.get('name') for assistant in assistants if assistant.get('github_identifier')}
@@ -985,7 +985,7 @@ def calculate_discussion_stats_from_metadata(metadata_list):
     }
-def calculate_monthly_metrics_by_agent_discussions(all_discussions_dict, assistants):
     """Calculate monthly metrics for discussions for all assistants for visualization."""
     identifier_to_name = {assistant.get('github_identifier'): assistant.get('name') for assistant in assistants if assistant.get('github_identifier')}
@@ -1050,6 +1050,94 @@ def calculate_monthly_metrics_by_agent_discussions(all_discussions_dict, assista
     }
 def construct_leaderboard_from_metadata(all_metadata_dict, assistants, wanted_resolved_dict=None, wanted_in_progress_dict=None, discussions_dict=None):
     """Construct leaderboard from in-memory issue metadata and discussion metadata.
@@ -1106,7 +1194,7 @@ def construct_leaderboard_from_metadata(all_metadata_dict, assistants, wanted_re
     return cache_dict
-def save_leaderboard_data_to_hf(leaderboard_dict, issue_monthly_metrics, wanted_issues=None, discussion_monthly_metrics=None):
     """Save leaderboard data, monthly metrics, wanted issues, and discussion metrics to HuggingFace dataset."""
     try:
         token = get_hf_token()
@@ -1129,6 +1217,7 @@ def save_leaderboard_data_to_hf(leaderboard_dict, issue_monthly_metrics, wanted_
             'leaderboard': leaderboard_dict,
             'issue_monthly_metrics': issue_monthly_metrics,
             'wanted_issues': wanted_issues,
             'discussion_monthly_metrics': discussion_monthly_metrics
         }
@@ -1216,12 +1305,15 @@ def mine_all_agents():
         leaderboard_dict = construct_leaderboard_from_metadata(
             agent_issues, assistants, wanted_resolved, wanted_in_progress, agent_discussions
         )
-        issue_monthly_metrics = calculate_monthly_metrics_by_agent(agent_issues, assistants)
-        discussion_monthly_metrics = calculate_monthly_metrics_by_agent_discussions(
             agent_discussions, assistants
         )
         save_leaderboard_data_to_hf(
-            leaderboard_dict, issue_monthly_metrics, wanted_open, discussion_monthly_metrics
         )
     except Exception as e:
         print(f"Error saving leaderboard: {str(e)}")

     }
+def calculate_monthly_metrics_by_issues(all_metadata_dict, assistants):
     """Calculate monthly metrics for all assistants for visualization."""
     identifier_to_name = {assistant.get('github_identifier'): assistant.get('name') for assistant in assistants if assistant.get('github_identifier')}
     }
+def calculate_monthly_metrics_by_discussions(all_discussions_dict, assistants):
     """Calculate monthly metrics for discussions for all assistants for visualization."""
     identifier_to_name = {assistant.get('github_identifier'): assistant.get('name') for assistant in assistants if assistant.get('github_identifier')}
     }
+def calculate_monthly_metrics_by_wanted_issues(wanted_resolved_dict, wanted_in_progress_dict, assistants):
+    """Calculate monthly metrics for wanted issues for all assistants for visualization."""
+    identifier_to_name = {assistant.get('github_identifier'): assistant.get('name') for assistant in assistants if assistant.get('github_identifier')}
+    if not wanted_resolved_dict and not wanted_in_progress_dict:
+        return {'assistants': [], 'months': [], 'data': {}}
+    agent_month_data = defaultdict(lambda: defaultdict(lambda: {'resolved': [], 'in_progress': []}))
+    # Process resolved wanted issues
+    for agent_identifier, metadata_list in (wanted_resolved_dict or {}).items():
+        for issue_meta in metadata_list:
+            closed_at = issue_meta.get('closed_at')
+            if not closed_at or closed_at == 'N/A':
+                continue
+            agent_name = identifier_to_name.get(agent_identifier, agent_identifier)
+            try:
+                dt = datetime.fromisoformat(closed_at.replace('Z', '+00:00'))
+                month_key = f"{dt.year}-{dt.month:02d}"
+                agent_month_data[agent_name][month_key]['resolved'].append(issue_meta)
+            except Exception as e:
+                print(f"Warning: Could not parse wanted issue date '{closed_at}': {e}")
+                continue
+    # Process in-progress wanted issues
+    for agent_identifier, metadata_list in (wanted_in_progress_dict or {}).items():
+        for issue_meta in metadata_list:
+            created_at = issue_meta.get('created_at')
+            if not created_at or created_at == 'N/A':
+                continue
+            agent_name = identifier_to_name.get(agent_identifier, agent_identifier)
+            try:
+                dt = datetime.fromisoformat(created_at.replace('Z', '+00:00'))
+                month_key = f"{dt.year}-{dt.month:02d}"
+                agent_month_data[agent_name][month_key]['in_progress'].append(issue_meta)
+            except Exception as e:
+                print(f"Warning: Could not parse wanted issue date '{created_at}': {e}")
+                continue
+    all_months = set()
+    for agent_data in agent_month_data.values():
+        all_months.update(agent_data.keys())
+    months = sorted(list(all_months))
+    result_data = {}
+    for agent_name, month_dict in agent_month_data.items():
+        resolved_rates = []
+        total_wanted_list = []
+        resolved_wanted_list = []
+        in_progress_wanted_list = []
+        for month in months:
+            month_data = month_dict.get(month, {'resolved': [], 'in_progress': []})
+            resolved_count = len(month_data['resolved'])
+            in_progress_count = len(month_data['in_progress'])
+            total_count = resolved_count + in_progress_count
+            # Resolved rate = resolved / total * 100
+            resolved_rate = (resolved_count / total_count * 100) if total_count > 0 else None
+            resolved_rates.append(resolved_rate)
+            total_wanted_list.append(total_count)
+            resolved_wanted_list.append(resolved_count)
+            in_progress_wanted_list.append(in_progress_count)
+        result_data[agent_name] = {
+            'resolved_rates': resolved_rates,
+            'total_wanted': total_wanted_list,
+            'resolved_wanted': resolved_wanted_list,
+            'in_progress_wanted': in_progress_wanted_list
+        }
+    agents_list = sorted(list(agent_month_data.keys()))
+    return {
+        'assistants': agents_list,
+        'months': months,
+        'data': result_data
+    }
 def construct_leaderboard_from_metadata(all_metadata_dict, assistants, wanted_resolved_dict=None, wanted_in_progress_dict=None, discussions_dict=None):
     """Construct leaderboard from in-memory issue metadata and discussion metadata.
     return cache_dict
+def save_leaderboard_data_to_hf(leaderboard_dict, issue_monthly_metrics, wanted_issues=None, discussion_monthly_metrics=None, wanted_monthly_metrics=None):
     """Save leaderboard data, monthly metrics, wanted issues, and discussion metrics to HuggingFace dataset."""
     try:
         token = get_hf_token()
             'leaderboard': leaderboard_dict,
             'issue_monthly_metrics': issue_monthly_metrics,
             'wanted_issues': wanted_issues,
+            'wanted_monthly_metrics': wanted_monthly_metrics,
             'discussion_monthly_metrics': discussion_monthly_metrics
         }
         leaderboard_dict = construct_leaderboard_from_metadata(
             agent_issues, assistants, wanted_resolved, wanted_in_progress, agent_discussions
         )
+        issue_monthly_metrics = calculate_monthly_metrics_by_issues(agent_issues, assistants)
+        discussion_monthly_metrics = calculate_monthly_metrics_by_discussions(
             agent_discussions, assistants
         )
+        wanted_monthly_metrics = calculate_monthly_metrics_by_wanted_issues(
+            wanted_resolved, wanted_in_progress, assistants
+        )
         save_leaderboard_data_to_hf(
+            leaderboard_dict, issue_monthly_metrics, wanted_open, discussion_monthly_metrics, wanted_monthly_metrics
         )
     except Exception as e:
         print(f"Error saving leaderboard: {str(e)}")