Spaces:

Corin1998
/

AdCopy_MAB_OptimizerPro

Sleeping

App Files Files Community

Corin1998 commited on Sep 18, 2025

Commit

c547356

verified ·

1 Parent(s): 1f951ea

Update data.py

Browse files

Files changed (1) hide show

data.py +34 -21

data.py CHANGED Viewed

@@ -5,36 +5,47 @@ from typing import Optional, Dict, Any
 from datetime import datetime
 import pandas as pd
-DATA_DIR = os.environ.get("DATA_DIR", "./data")
 LOG_PATH = os.path.join(DATA_DIR, "events.csv")
 META_PATH = os.path.join(DATA_DIR, "meta.json")
 SCHEMA = [
-    "ts",           # ISO timestamp
-    "data",         # YYYY-MM-DD(便宜)
-    "medium",       # 媒体名(例:FB,GDN)
-    "creative",     # クリエイティブID/名前(例:A1)
-    "is_control"    # 0/1(コントロール群)
-    "impressions",  # 表示数
-    "clicks",       # クリック数(または目的コンバージョン)
-    "conversions",  # 追加のCV(任意:0でもOK)
-    "cost",         # コスト(任意)
-    "features_json" # クリエイティブ特徴量(dictをJSON文字列で)
 ]
-os.makedirs(DATA_DIR, exist_ok=True)
-if not os.path.exists(LOG_PATH):
-    pd.DataFrame(columns=SCHEMA).to_csv(LOG_PATH, index=False)
-if not os.path.exists(META_PATH):
-    with open(META_PATH, "w" , encoding="utf-8") as f:
-        json.dump({"created_at": datetime.utcnow().isoformat()}, f)
 def read_events() -> pd.DataFrame:
     df = pd.read_csv(LOG_PATH)
     if df.empty:
         return df
     # 型整備
-    df["data"] = pd.to_datetime(df["date"]).dt.date.astype(str)
     df["is_control"] = df["is_control"].fillna(0).astype(int)
     for col in ["impressions", "clicks", "conversions"]:
         df[col] = df[col].fillna(0).astype(int)
@@ -43,7 +54,8 @@ def read_events() -> pd.DataFrame:
     return df
 def append_events(rows: pd.DataFrame) -> None:
-    # 必須列チェック& 補完
     for c in SCHEMA:
         if c not in rows.columns:
             if c == "features_json":
@@ -62,13 +74,14 @@ def append_events(rows: pd.DataFrame) -> None:
     rows.to_csv(LOG_PATH, mode="a", header=False, index=False)
 def aggregate(levels=("medium", "creative")) -> pd.DataFrame:
     df = read_events()
     if df.empty:
-        return pd.DataFrame(columns=[*levels, "is_control" , "impressions", "clicks", "conversions", "cost"])
     g = df.groupby([*levels, "is_control"], dropna=False).agg(
         impressions=("impressions", "sum"),
         clicks=("clicks", "sum"),
         conversions=("conversions", "sum"),
         cost=("cost", "sum"),
     ).reset_index()
-    return g

 from datetime import datetime
 import pandas as pd
+# ✅ 書き込み可能な場所をデフォルトにする
+#   - 既定: /tmp/adcopy_data（ephemeral）
+#   - 環境変数 DATA_DIR を設定すると、例: /data/adcopy_mab（HF Spaces の Persistent Storage）
+DEFAULT_WRITABLE_DIR = "/tmp/adcopy_data"
+DATA_DIR = os.environ.get("DATA_DIR", DEFAULT_WRITABLE_DIR)
 LOG_PATH = os.path.join(DATA_DIR, "events.csv")
 META_PATH = os.path.join(DATA_DIR, "meta.json")
 SCHEMA = [
+    "ts",            # ISO timestamp
+    "date",          # YYYY-MM-DD (便宜)
+    "medium",        # 媒体名 (例: FB, GDN)
+    "creative",      # クリエイティブID/名前 (例: A1)
+    "is_control",    # 0/1（コントロール群）
+    "impressions",   # 表示数
+    "clicks",        # クリック数（または目的コンバージョン）
+    "conversions",   # 追加のCV（任意: 0 でもOK）
+    "cost",          # コスト（任意）
+    "features_json"  # クリエイティブ特徴量（dict をJSON文字列で）
 ]
+def _ensure_storage():
+    """初回起動時に保存先と空ファイルを準備。"""
+    os.makedirs(DATA_DIR, exist_ok=True)
+    if not os.path.exists(LOG_PATH):
+        pd.DataFrame(columns=SCHEMA).to_csv(LOG_PATH, index=False)
+    if not os.path.exists(META_PATH):
+        with open(META_PATH, "w", encoding="utf-8") as f:
+            json.dump({"created_at": datetime.utcnow().isoformat()}, f)
+# インポート時に準備（書き込み可能ディレクトリなのでOK）
+_ensure_storage()
 def read_events() -> pd.DataFrame:
+    _ensure_storage()
     df = pd.read_csv(LOG_PATH)
     if df.empty:
         return df
     # 型整備
+    df["date"] = pd.to_datetime(df["date"]).dt.date.astype(str)
     df["is_control"] = df["is_control"].fillna(0).astype(int)
     for col in ["impressions", "clicks", "conversions"]:
         df[col] = df[col].fillna(0).astype(int)
     return df
 def append_events(rows: pd.DataFrame) -> None:
+    _ensure_storage()
+    # 必須列チェック & 補完
     for c in SCHEMA:
         if c not in rows.columns:
             if c == "features_json":
     rows.to_csv(LOG_PATH, mode="a", header=False, index=False)
 def aggregate(levels=("medium", "creative")) -> pd.DataFrame:
+    _ensure_storage()
     df = read_events()
     if df.empty:
+        return pd.DataFrame(columns=[*levels, "is_control", "impressions", "clicks", "conversions", "cost"])
     g = df.groupby([*levels, "is_control"], dropna=False).agg(
         impressions=("impressions", "sum"),
         clicks=("clicks", "sum"),
         conversions=("conversions", "sum"),
         cost=("cost", "sum"),
     ).reset_index()
+    return g