File size: 25,463 Bytes

import os
import sys
import json
import math
import argparse
from typing import Dict, List, Tuple

from clickhouse_driver import Client as ClickHouseClient

# Add parent to path
sys.path.append(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))

from models.vocabulary import RETURN_THRESHOLDS

CLICKHOUSE_HOST = os.getenv("CLICKHOUSE_HOST", "localhost")
CLICKHOUSE_PORT = int(os.getenv("CLICKHOUSE_PORT", 9000))
CLICKHOUSE_USER = os.getenv("CLICKHOUSE_USER", "default")
CLICKHOUSE_PASSWORD = os.getenv("CLICKHOUSE_PASSWORD", "")
CLICKHOUSE_DATABASE = os.getenv("CLICKHOUSE_DATABASE", "default")

LAUNCH_PRICE_USD = 0.000004
EPS = 1e-9


def get_client():
    return ClickHouseClient(
        host=CLICKHOUSE_HOST,
        port=CLICKHOUSE_PORT,
        user=CLICKHOUSE_USER,
        password=CLICKHOUSE_PASSWORD,
        database=CLICKHOUSE_DATABASE,
    )


def _midrank_percentiles(items: List[Tuple[str, float]]) -> Dict[str, float]:
    """
    Compute midrank percentiles for a list of (token, value).
    Returns p in (0,1) via (rank - 0.5) / n. Ties get the same midrank.
    """
    if not items:
        return {}
    items_sorted = sorted(items, key=lambda x: x[1])
    n = len(items_sorted)
    out = {}
    i = 0
    while i < n:
        j = i
        v = items_sorted[i][1]
        while j + 1 < n and items_sorted[j + 1][1] == v:
            j += 1
        # midrank is average of ranks i..j (1-based)
        rank_lo = i + 1
        rank_hi = j + 1
        midrank = 0.5 * (rank_lo + rank_hi)
        p = (midrank - 0.5) / n
        for k in range(i, j + 1):
            out[items_sorted[k][0]] = p
        i = j + 1
    return out


def _bucket_id(ret_val: float) -> int:
    for i in range(len(RETURN_THRESHOLDS) - 1):
        lower = RETURN_THRESHOLDS[i]
        upper = RETURN_THRESHOLDS[i + 1]
        if ret_val >= lower and ret_val < upper:
            return i
    return -1


def fetch_token_metrics(client) -> List[dict]:
    """
    Fetches lifetime metrics needed for quality scoring.
    Returns a list of dicts keyed by token_address.
    """
    query = f"""
    WITH
        -- 1. Aggregated trade stats (unchanged)
        trade_agg AS (
            SELECT
                base_address,
                sum(priority_fee + coin_creator_fee) AS fees_sol,
                sum(total_usd) AS volume_usd,
                count() AS n_trades,
                min(timestamp) AS t0,
                argMax(timestamp, price_usd) AS t_ath
            FROM trades
            GROUP BY base_address
        ),
        -- 2. "Token list derived MINTS.
        token_meta_raw AS (
            SELECT
                mint_address AS token_address,
                argMax(creator_address, timestamp) AS creator_address,
                argMax(total_supply, timestamp) AS total_supply,
                argMax(token_decimals, timestamp) AS decimals
            FROM mints
            GROUP BY mint_address
        ),
        token_meta AS (
            SELECT
                token_address,
                creator_address,
                total_supply,
                decimals,
                -- Derived adjusted supply for percentage calcs
                (total_supply / pow(10, decimals)) AS adj_supply
            FROM token_meta_raw
            WHERE adj_supply > 0
        ),
        -- 3. Token lifetimes metrics (returns, holders)
        ret_agg AS (
            SELECT
                token_address,
                (argMax(ath_price_usd, updated_at) / {LAUNCH_PRICE_USD}) AS ret,
                argMax(unique_holders, updated_at) AS unique_holders
            FROM token_metrics
            GROUP BY token_address
        ),
        -- 4. WALLET PEAKS: Pre-calculate the Peak Balance (max current_balance) for every wallet
        --    This handles the "User Sold" case by taking their highest ever balance.
        wallet_peaks AS (
            SELECT
                mint_address,
                wallet_address,
                max(current_balance) AS peak_balance,
                max(history_transfer_in) AS max_transfer_in
            FROM wallet_holdings
            GROUP BY mint_address, wallet_address
        ),
        
        -- 5. SNIPERS: Identify sniper addresses (rank <= 70), then sum their PEAK balances
        snipers_list AS (
             SELECT
                 base_address,
                 maker
             FROM (
                 SELECT
                     base_address,
                     maker,
                     dense_rank() OVER (PARTITION BY base_address ORDER BY min_slot, min_idx) AS buyer_rank
                 FROM (
                     SELECT
                         base_address,
                         maker,
                         min(slot) AS min_slot,
                         min(transaction_index) AS min_idx
                     FROM trades
                     WHERE trade_type = 0 -- buy
                     GROUP BY base_address, maker
                 )
             )
             WHERE buyer_rank <= 70
        ),
        snipers_agg AS (
            SELECT
                s.base_address AS token_address,
                sum(wp.peak_balance) AS snipers_total_peak
            FROM snipers_list s
            JOIN wallet_peaks wp ON s.base_address = wp.mint_address AND s.maker = wp.wallet_address
            GROUP BY s.base_address
        ),

        -- 6. BUNDLED: Sum the base_amount of ALL trades that happened in a slot with multiple buys
        bundled_agg AS (
            SELECT
                t.base_address AS token_address,
                sum(t.base_amount) AS bundled_total_peak
            FROM trades t
            WHERE (t.base_address, t.slot) IN (
                 SELECT base_address, slot
                 FROM trades
                 WHERE trade_type = 0 -- buy
                 GROUP BY base_address, slot
                 HAVING count() > 1
            )
            AND t.trade_type = 0 -- buy
            GROUP BY t.base_address
        ),

        -- 7. DEV HOLD: Creator's Peak Balance
        dev_hold_agg AS (
            SELECT
                t.token_address,
                max(wp.peak_balance) AS dev_peak -- max in case of dupe, but should be 1:1
            FROM token_meta t
            JOIN wallet_peaks wp ON t.token_address = wp.mint_address AND t.creator_address = wp.wallet_address
            GROUP BY t.token_address
        )

    SELECT
        t.token_address,
        r.ret,
        r.unique_holders,
        f.fees_sol,
        f.volume_usd,
        f.n_trades,
        (f.t_ath - f.t0) AS time_to_ath_sec,
        -- Calculate Percentages using Peak Sums / Total Supply
        (COALESCE(s.snipers_total_peak, 0) / t.adj_supply * 100) AS snipers_pct,
        (COALESCE(b.bundled_total_peak, 0) / t.total_supply * 100) AS bundled_pct,
        (COALESCE(d.dev_peak, 0)           / t.adj_supply * 100) AS dev_hold_pct
    FROM token_meta t
    LEFT JOIN ret_agg r ON t.token_address = r.token_address
    LEFT JOIN trade_agg f ON t.token_address = f.base_address
    LEFT JOIN snipers_agg s ON t.token_address = s.token_address
    LEFT JOIN bundled_agg b ON t.token_address = b.token_address
    LEFT JOIN dev_hold_agg d ON t.token_address = d.token_address
    """
    rows = client.execute(query)
    cols = [
        "token_address",
        "ret",
        "unique_holders",
        "fees_sol",
        "volume_usd",
        "n_trades",
        "time_to_ath_sec",
        "snipers_pct",
        "bundled_pct",
        "dev_hold_pct",
    ]
    out = []
    for r in rows:
        out.append(dict(zip(cols, r)))
    return out


def compute_quality_scores(
    client,
    max_ret: float = 10000.0,
    rerank: bool = True,
    with_debug: bool = False,
):
    data = fetch_token_metrics(client)

    # feature spec: (name, getter, positive_when_high)
    feature_defs = [
        ("fees_log", lambda d: math.log1p(d["fees_sol"]) if d["fees_sol"] is not None else None, True),
        ("volume_log", lambda d: math.log1p(d["volume_usd"]) if d["volume_usd"] is not None else None, True),
        ("holders_log", lambda d: math.log1p(d["unique_holders"]) if d["unique_holders"] is not None else None, True),
        ("time_to_ath_log", lambda d: math.log1p(d["time_to_ath_sec"]) if d["time_to_ath_sec"] is not None else None, True),
        ("fees_per_volume", lambda d: (d["fees_sol"] / (d["volume_usd"] + EPS)) if d["fees_sol"] is not None and d["volume_usd"] is not None else None, True),
        ("fees_per_trade", lambda d: (d["fees_sol"] / (d["n_trades"] + EPS)) if d["fees_sol"] is not None and d["n_trades"] is not None else None, True),
        ("holders_per_trade", lambda d: (d["unique_holders"] / (d["n_trades"] + EPS)) if d["unique_holders"] is not None and d["n_trades"] is not None else None, True),
        ("holders_per_volume", lambda d: (d["unique_holders"] / (d["volume_usd"] + EPS)) if d["unique_holders"] is not None and d["volume_usd"] is not None else None, True),
        ("snipers_pct", lambda d: d["snipers_pct"], True),
        ("bundled_pct", lambda d: d["bundled_pct"], True),
        ("dev_hold_pct", lambda d: d["dev_hold_pct"], True),
    ]

    raw_metrics = ["snipers_pct", "bundled_pct", "dev_hold_pct", "fees_sol"] # Added fees_sol for diagnostic logging

    debug = None
    if with_debug:
        debug = {
            "q_raw": [],
            "feature_pairs": {f[0]: [] for f in feature_defs},
            "raw_pairs": {m: [] for m in raw_metrics},
            # For checking assumptions like "higher return buckets have lower bundled_pct".
            # Store raw metric distributions per return bucket and (ret, metric) pairs overall.
            "bucket_raw": {},  # bucket_id -> metric -> [raw vals]
            "ret_pairs": {m: [] for m in raw_metrics},  # metric -> [(ret, raw_val)]
        }

    # Build bucket mapping
    buckets: Dict[int, List[dict]] = {}
    for d in data:
        ret_val = d.get("ret")
        if ret_val is None or ret_val <= 0 or ret_val > max_ret:
            continue
        b = _bucket_id(ret_val)
        if b == -1:
            continue
        d["bucket_id"] = b
        buckets.setdefault(b, []).append(d)

    # Compute percentiles per bucket + feature
    token_scores = []
    for b, items in buckets.items():
        if with_debug:
            debug["bucket_raw"].setdefault(b, {m: [] for m in raw_metrics})
            for d in items:
                ret_val = d.get("ret")
                for metric in raw_metrics:
                    raw_val = d.get(metric)
                    if raw_val is None:
                        continue
                    debug["bucket_raw"][b][metric].append(raw_val)
                    if ret_val is not None:
                        debug["ret_pairs"][metric].append((ret_val, raw_val))

        # Precompute percentiles per feature
        feature_percentiles: Dict[str, Dict[str, float]] = {}
        for fname, fget, _pos in feature_defs:
            vals = []
            for d in items:
                v = fget(d)
                if v is None or (isinstance(v, float) and (math.isnan(v) or math.isinf(v))):
                    continue
                vals.append((d["token_address"], v))
            feature_percentiles[fname] = _midrank_percentiles(vals)

        # Compute q_raw for each token
        q_raw_map = {}
        for d in items:
            s_vals = []
            s_map = {}
            for fname, _fget, pos in feature_defs:
                p = feature_percentiles[fname].get(d["token_address"])
                if p is None:
                    continue
                s = 2.0 * p - 1.0
                if not pos:
                    s = -s
                # clip
                if s > 0.99:
                    s = 0.99
                elif s < -0.99:
                    s = -0.99
                s_vals.append(s)
                s_map[fname] = s
            if not s_vals:
                continue
            q_raw = sum(s_vals) / len(s_vals)
            q_raw_map[d["token_address"]] = q_raw
            if with_debug:
                debug["q_raw"].append(q_raw)
                for fname, s in s_map.items():
                    debug["feature_pairs"][fname].append((q_raw, s))
                for metric in raw_metrics:
                    raw_val = d.get(metric)
                    if raw_val is None:
                        continue
                    debug["raw_pairs"][metric].append((q_raw, raw_val))

        # Optional re-rank within bucket
        if rerank:
            q_items = [(t, q) for t, q in q_raw_map.items()]
            q_p = _midrank_percentiles(q_items)
            for d in items:
                t = d["token_address"]
                if t not in q_raw_map:
                    continue
                q_final = 2.0 * q_p[t] - 1.0
                token_scores.append(
                    {
                        "token_address": t,
                        "bucket_id": b,
                        "ret": d["ret"],
                        "q_raw": q_raw_map[t],
                        "q": q_final,
                        # Pass through raw metrics for analysis
                        "bundled_pct": d.get("bundled_pct"),
                        "snipers_pct": d.get("snipers_pct"),
                        "fees_sol": d.get("fees_sol"),
                    }
                )
        else:
            for d in items:
                t = d["token_address"]
                if t not in q_raw_map:
                    continue
                token_scores.append(
                    {
                        "token_address": t,
                        "bucket_id": b,
                        "ret": d["ret"],
                        "q_raw": q_raw_map[t],
                        "q": q_raw_map[t],
                        # Pass through raw metrics for analysis
                        "bundled_pct": d.get("bundled_pct"),
                        "snipers_pct": d.get("snipers_pct"),
                        "fees_sol": d.get("fees_sol"),
                    }
                )

    if with_debug:
        return token_scores, debug
    return token_scores





def write_jsonl(path: str, rows: List[dict]) -> None:
    os.makedirs(os.path.dirname(path), exist_ok=True)
    with open(path, "w", encoding="utf-8") as f:
        for r in rows:
            f.write(json.dumps(r) + "\n")


def _percentile(sorted_vals: List[float], p: float) -> float:
    if not sorted_vals:
        return float("nan")
    n = len(sorted_vals)
    if n == 1:
        return sorted_vals[0]
    pos = p * (n - 1)
    lo = int(math.floor(pos))
    hi = int(math.ceil(pos))
    if lo == hi:
        return sorted_vals[lo]
    frac = pos - lo
    return sorted_vals[lo] * (1 - frac) + sorted_vals[hi] * frac


def _summary_stats(vals: List[float]) -> Dict[str, float]:
    if not vals:
        return {}
    vals_sorted = sorted(vals)
    return {
        "mean": sum(vals_sorted) / len(vals_sorted),
        "min": vals_sorted[0],
        "max": vals_sorted[-1],
        "p10": _percentile(vals_sorted, 0.10),
        "p50": _percentile(vals_sorted, 0.50),
        "p90": _percentile(vals_sorted, 0.90),
        "p99": _percentile(vals_sorted, 0.99),
    }


def _pearson_corr(xs: List[float], ys: List[float]) -> float:
    if not xs or not ys or len(xs) != len(ys) or len(xs) < 2:
        return float("nan")
    n = len(xs)
    mean_x = sum(xs) / n
    mean_y = sum(ys) / n
    num = 0.0
    den_x = 0.0
    den_y = 0.0
    for i in range(n):
        dx = xs[i] - mean_x
        dy = ys[i] - mean_y
        num += dx * dy
        den_x += dx * dx
        den_y += dy * dy
    denom = math.sqrt(den_x * den_y)
    if denom == 0.0:
        return float("nan")
    return num / denom


def _bucket_label(b: int) -> str:
    lower = RETURN_THRESHOLDS[b]
    upper = RETURN_THRESHOLDS[b + 1] if b + 1 < len(RETURN_THRESHOLDS) else None
    if upper is None:
        return f">= {lower}x"
    return f"{lower}x - {upper}x"


def print_summary(scores: List[dict]) -> None:
    print("=== QUALITY SCORE SUMMARY ===")
    print(f"Total tokens scored: {len(scores)}")
    if not scores:
        return

    overall_q = [s["q"] for s in scores if "q" in s]
    overall_q_raw = [s["q_raw"] for s in scores if "q_raw" in s]
    for name, series in [("q", overall_q), ("q_raw", overall_q_raw)]:
        stats = _summary_stats(series)
        if not stats:
            continue
        print(f"\nOverall {name}:")
        print(f"  Mean: {stats['mean']:.4f} | Min: {stats['min']:.4f} | Max: {stats['max']:.4f}")
        print(f"  Q: p10={stats['p10']:.2f} p50={stats['p50']:.2f} p90={stats['p90']:.2f} p99={stats['p99']:.2f}")

    # Per-bucket summaries
    buckets: Dict[int, List[dict]] = {}
    for s in scores:
        buckets.setdefault(s["bucket_id"], []).append(s)

    for b in sorted(buckets.keys()):
        items = buckets[b]
        q_vals = [i["q"] for i in items if "q" in i]
        q_raw_vals = [i["q_raw"] for i in items if "q_raw" in i]
        print(f"\nSEGMENT: {b}. {_bucket_label(b)}")
        print(f"Tokens in segment: {len(items)}")
        stats_q = _summary_stats(q_vals)
        stats_q_raw = _summary_stats(q_raw_vals)
        if stats_q:
            print("  q:")
            print(f"    Mean: {stats_q['mean']:.4f} | Min: {stats_q['min']:.4f} | Max: {stats_q['max']:.4f}")
            print(f"    Q: p10={stats_q['p10']:.2f} p50={stats_q['p50']:.2f} p90={stats_q['p90']:.2f} p99={stats_q['p99']:.2f}")
        if stats_q_raw:
            print("  q_raw:")
            print(f"    Mean: {stats_q_raw['mean']:.4f} | Min: {stats_q_raw['min']:.4f} | Max: {stats_q_raw['max']:.4f}")
            print(f"    Q: p10={stats_q_raw['p10']:.2f} p50={stats_q_raw['p50']:.2f} p90={stats_q_raw['p90']:.2f} p99={stats_q_raw['p99']:.2f}")

        # --- NEW: Print 3 Examples (Min, Mid, Max) ---
        if items:
            # Sort items by 'q' to find min/mid/max easily
            items_sorted = sorted(items, key=lambda x: x.get("q", 0))
            
            ex_min = items_sorted[0]
            ex_max = items_sorted[-1]
            
            # Find mid (closest to 0.0, or just median index? Request said "mean quality" which is 0.0)
            # finding item with q closest to 0.0
            ex_mid = min(items_sorted, key=lambda x: abs(x.get("q", 0) - 0.0))
            
            print("  Examples:")
            print(f"    Low  (-1.0): {ex_min['token_address']} (q={ex_min.get('q',0):.4f}, ret={ex_min.get('ret',0):.2f}x)")
            print(f"    Mid  (~0.0): {ex_mid['token_address']} (q={ex_mid.get('q',0):.4f}, ret={ex_mid.get('ret',0):.2f}x)")
            print(f"    High ( 1.0): {ex_max['token_address']} (q={ex_max.get('q',0):.4f}, ret={ex_max.get('ret',0):.2f}x)")


def print_diagnostics(debug: dict) -> None:
    if not debug:
        return
    q_raw_vals = debug.get("q_raw", [])
    if not q_raw_vals:
        return
    print("\n=== QUALITY SCORE DIAGNOSTICS ===")

    feature_pairs = debug.get("feature_pairs", {})
    if feature_pairs:
        print("Correlation with q_raw (signed features):")
        for fname in sorted(feature_pairs.keys()):
            pairs = feature_pairs[fname]
            xs = [p[0] for p in pairs]
            ys = [p[1] for p in pairs]
            corr = _pearson_corr(xs, ys)
            print(f"  {fname}: {corr:.4f} (n={len(pairs)})")

    raw_pairs = debug.get("raw_pairs", {})
    if raw_pairs:
        q_sorted = sorted(q_raw_vals)
        p10 = _percentile(q_sorted, 0.10)
        p90 = _percentile(q_sorted, 0.90)
        print("\nTop/bottom decile raw means (by q_raw):")
        for metric in sorted(raw_pairs.keys()):
            pairs = raw_pairs[metric]
            lows = [v for q, v in pairs if q <= p10]
            highs = [v for q, v in pairs if q >= p90]
            if not lows or not highs:
                continue
            low_mean = sum(lows) / len(lows)
            high_mean = sum(highs) / len(highs)
            print(f"  {metric}: bottom_mean={low_mean:.4f} top_mean={high_mean:.4f} (n_low={len(lows)}, n_high={len(highs)})")

    # Return bucket -> raw metric distributions (answers questions like "do higher-return tokens bundle less?")
    bucket_raw = debug.get("bucket_raw", {})
    if bucket_raw:
        print("\n=== RETURN BUCKET RAW METRICS ===")
        for b in sorted(bucket_raw.keys()):
            print(f"\nSEGMENT: {b}. {_bucket_label(b)}")
            for metric in sorted(bucket_raw[b].keys()):
                vals = [v for v in bucket_raw[b][metric] if v is not None]
                if not vals:
                    continue
                stats = _summary_stats(vals)
                # Also report how often the metric is > 0 (useful since many pct metrics are 0).
                nz = sum(1 for v in vals if v > 0)
                nz_rate = nz / len(vals)
                print(
                    f"  {metric}: mean={stats['mean']:.4f} p50={stats['p50']:.4f} "
                    f"p90={stats['p90']:.4f} p99={stats['p99']:.4f} nonzero_rate={nz_rate:.3f} (n={len(vals)})"
                )

    # Overall return-vs-metric correlation (not bucketed). Use log(ret) to reduce tail leverage.
    ret_pairs = debug.get("ret_pairs", {})
    if ret_pairs:
        print("\n=== RETURN VS RAW METRICS (GLOBAL) ===")
        for metric in sorted(ret_pairs.keys()):
            pairs = ret_pairs[metric]
            xs = []
            ys = []
            for r, v in pairs:
                if r is None or r <= 0:
                    continue
                xs.append(math.log(r))
                ys.append(v)
            if len(xs) < 3:
                continue
            corr = _pearson_corr(xs, ys)
            print(f"  log(ret) vs {metric}: {corr:.4f} (n={len(xs)})")

    # Removed placeholder
    pass


def print_high_ret_analysis(scores: List[dict]) -> None:
    print("\n=== MID-HIGH RETURN SPLIT ANALYSIS (10x - 20x) ===")
    
    # 1. Filter for Mid-High Return Cohort (10x - 20x)
    cohort = [s for s in scores if s.get("ret") is not None and s["ret"] >= 10.0 and s["ret"] < 20.0]
    if not cohort:
        print("No tokens 10x-20x found.")
        return

    print(f"Total tokens 10x-20x: {len(cohort)}")

    # 2. Extract Bundled Pct
    bundled_vals = [s.get("bundled_pct", 0) for s in cohort if s.get("bundled_pct") is not None]
    if not bundled_vals:
        print("No bundled_pct data found.")
        return
    
    median_bundled = _percentile(sorted(bundled_vals), 0.50)
    print(f"Median Bundled% for Cohort: {median_bundled:.2f}%")

    # 3. Split
    low_group = [s for s in cohort if (s.get("bundled_pct") or 0) <= median_bundled]
    high_group = [s for s in cohort if (s.get("bundled_pct") or 0) > median_bundled]

    # 4. Analyze Fees
    def get_mean_fees(group):
        fees = [s.get("fees_sol", 0) for s in group if s.get("fees_sol") is not None]
        if not fees: return 0.0
        return sum(fees) / len(fees)

    mean_fees_low = get_mean_fees(low_group)
    mean_fees_high = get_mean_fees(high_group)

    print(f"\nGroup 1: LOW Bundled (<= {median_bundled:.2f}%)")
    print(f"  Count: {len(low_group)}")
    print(f"  Mean Fees: {mean_fees_low:.4f} SOL")

    print(f"\nGroup 2: HIGH Bundled (> {median_bundled:.2f}%)")
    print(f"  Count: {len(high_group)}")
    print(f"  Mean Fees: {mean_fees_high:.4f} SOL")
    
    # Extra: Check returns too
    def get_mean_ret(group):
        rets = [s["ret"] for s in group]
        if not rets: return 0.0
        return sum(rets) / len(rets)
        
    print(f"  Mean Ret:  {get_mean_ret(high_group):.2f}x (vs Low: {get_mean_ret(low_group):.2f}x)")


def get_token_quality_scores(client):
    """
    Returns a dictionary mapping token_address -> q (quality score)
    """
    # Force rerank=True to get final scores
    results = compute_quality_scores(client, max_ret=1e9, rerank=True)
    
    # Return mapping
    # If compute_quality_scores returns (scores, debug) tuple (when with_debug=True), handle it.
    # Default call rerank=True returns 'scores' list if with_debug=False?
    # No, looking at main, it returns 'scores' if no_diagnostics.
    # But get_token_quality_scores uses default args. 
    # Let's check compute_quality_score signature... it has with_debug=False default.
    # So it returns 'scores'.
    
    return {r["token_address"]: r.get("q", 0.0) for r in results}


def main():
    parser = argparse.ArgumentParser(description="Compute token quality/health score.")
    parser.add_argument("--max-ret", type=float, default=10000.0, help="Max return to include")
    parser.add_argument("--no-rerank", action="store_true", help="Disable final rerank within bucket")
    parser.add_argument("--no-summary", action="store_true", help="Disable summary logging")
    parser.add_argument("--no-diagnostics", action="store_true", help="Disable diagnostics logging")
    args = parser.parse_args()

    client = get_client()
    if args.no_diagnostics:
        scores = compute_quality_scores(client, max_ret=args.max_ret, rerank=not args.no_rerank)
        debug = None
    else:
        scores, debug = compute_quality_scores(
            client,
            max_ret=args.max_ret,
            rerank=not args.no_rerank,
            with_debug=True,
        )
    if not args.no_summary:
        print_summary(scores)
    if not args.no_diagnostics:
        print_diagnostics(debug)
        print_high_ret_analysis(scores) # Call the new analysis


if __name__ == "__main__":
    main()