Spaces:

AgraResearchLab
/

encrypted_audit_opinion

Runtime error

App Files Files Community

buraktrk commited on Jul 10, 2025

Commit

dfc7b05

verified ·

1 Parent(s): 24a5f78

Update app.py

Browse files

Files changed (1) hide show

app.py +73 -44

app.py CHANGED Viewed

@@ -1,16 +1,10 @@
-# ---------------------------------------------------------------------------
-# app.py – Denetçi Görüşü Tahmin Uygulaması (pipe + LabelEncoder)
-# ---------------------------------------------------------------------------
-# 1. Excel yüklenir → 24 finansal oran hesaplanır.
-# 2. (pipeline, LabelEncoder) ikilisi joblib'den yüklenir.
-# 3. pipe.predict → enc.inverse_transform → sonuç tabloya basılır.
-# ---------------------------------------------------------------------------
-from _future_ import annotations
-import pandas as pd, numpy as np, joblib, gradio as gr
-FHE_MODEL_PATH = "fhe_xgb.joblib"          # (pipe, enc) tuple'ı
-pipe, enc = joblib.load(FHE_MODEL_PATH)    # ✔️ tek dosyadan yükle
 SELECTED_FEATS = [
     "Finansal Kaldıraç", "Zmijewski Skoru", "Cari Oran", "Asit Test Oranı",
@@ -24,14 +18,10 @@ SELECTED_FEATS = [
     "Özsermaye / Maddi Duran Varlıklar",
 ]
-# ---------------------------------------------------------------------------
-# Yardımcılar
-# ---------------------------------------------------------------------------
 def safe_div(a: pd.Series, b: pd.Series) -> pd.Series:
     return (a / b.replace(0, np.nan)).fillna(0)
 def compute_ratios(df: pd.DataFrame) -> pd.DataFrame:
-    # 0️⃣  Sayısal sütunları güvenli şekilde numeriğe çevir
     for col in [c for c in df.columns if c != "Periyot"]:
         df[col] = pd.to_numeric(df[col], errors="coerce").fillna(0)
@@ -43,27 +33,22 @@ def compute_ratios(df: pd.DataFrame) -> pd.DataFrame:
         df["Dönen Varlıklar"] - df["Stoklar"] - df["Diğer Dönen Varlıklar"],
         df["Kısa Vadeli Yükümlülükler"])
     df["Nakit Oranı"] = safe_div(df["Nakit ve Nakit Benzerleri"], df["Kısa Vadeli Yükümlülükler"])
     df["Faaliyet Kar Marjı"] = safe_div(df["FAALİYET KARI (ZARARI)"]*100, df["Satış Gelirleri"])
     df["Brüt Kar Marjı (%)"] = safe_div(df["Ticari Faaliyetlerden Brüt Kar (Zarar)"]*100,
                                         df["Satış Gelirleri"])
-    df["Net Kar Marjı"]      = safe_div(df["Dönem Net Kar/Zararı"]*100, df["Satış Gelirleri"])
     df["Aktif Karlılık (%)"] = safe_div(df["Dönem Net Kar/Zararı"]*100, ta)
-    df["Aktif Devir Hızı"]           = safe_div(df["Satış Gelirleri"], ta)
     df["Dönen Varlıklar Devir Hızı"] = safe_div(df["Dönen Varlıklar"], df["Satış Gelirleri"])
-    df["Stok Devir Hızı"]            = -safe_div(df["Satışların Maliyeti (-)"], df["Stoklar"])
-    df["Finansal Kaldıraç"]            = safe_div(tl, ta)*100
-    df["Kısa Vade Borç / Aktif"]       = safe_div(df["Kısa Vadeli Yükümlülükler"], ta)
-    df["Kısa Vade Borç / Özsermaye"]   = safe_div(df["Kısa Vadeli Yükümlülükler"], df["Özkaynaklar"])
     df["Kısa Vade Borç / Toplam Borç"] = safe_div(df["Kısa Vadeli Yükümlülükler"], tl)
-    df["Özsermaye / Aktif"]            = safe_div(df["Özkaynaklar"], ta)
-    df["Duran Varlıklar / Aktif "]      = safe_div(df["Duran Varlıklar"]*100, ta)
-    df["Dönen Varlıklar / Aktif (%)"]   = safe_div(df["Dönen Varlıklar"]*100, ta)
     df["Özsermaye / Maddi Duran Varlıklar"] = safe_div(df["Özkaynaklar"], df["Maddi Duran Varlıklar"])
     df["Finansman Gider / Net Satış"] = safe_div(df["Finansman Giderleri"], df["Satış Gelirleri"])
     df["Esas Faaliyet Karı / Kısa Vadeli Borç"] = safe_div(
         df["Net Faaliyet Kar/Zararı"], df["Kısa Vadeli Yükümlülükler"])
@@ -87,9 +72,55 @@ def compute_ratios(df: pd.DataFrame) -> pd.DataFrame:
                            0.011*X5 + 0.729*L6 - 0.639*L7)
     return df
-# ---------------------------------------------------------------------------
-# Tahmin
-# ---------------------------------------------------------------------------
 def predict_opinion(excel_file: gr.File):
     if excel_file is None:
         raise gr.Error("Excel dosyası yükleyin.")
@@ -98,30 +129,28 @@ def predict_opinion(excel_file: gr.File):
         pd.read_excel(excel_file.name, header=None, sheet_name=0)
         .set_index(0).T.reset_index(drop=True)
     )
     raw_df.columns = raw_df.columns.str.strip()
     raw_df = raw_df.loc[:, ~raw_df.columns.duplicated()]
     raw_df.rename(columns={"Desc": "Periyot"}, inplace=True)
     raw_df["Periyot"] = raw_df["Periyot"].astype(str).str.replace(r"\s+", " ", regex=True).str.strip()
     enriched = compute_ratios(raw_df)
-    X = enriched[SELECTED_FEATS].dropna()
-    if X.empty:
         raise gr.Error("Oran hesaplanamadı – eksik sütunlar olabilir.")
-    labels = enc.inverse_transform(pipe.predict(X))
     return pd.DataFrame({"Tahmin Görüş Tipi": labels})
-# ---------------------------------------------------------------------------
-# Gradio UI
-# ---------------------------------------------------------------------------
 with gr.Blocks(theme=gr.themes.Default(primary_hue="blue")) as demo:
     gr.Markdown("# Denetçi Görüşü Tahmin Uygulaması")
     file_in = gr.File(file_types=[".xlsx", ".xls", ".xlsm"], label="Excel Yükleyin")
     btn     = gr.Button("Tahmin Et", variant="primary")
     out_df  = gr.Dataframe(wrap=True, show_label=False)
     btn.click(predict_opinion, file_in, out_df)
-if _name_ == "_main_":
-    demo.launch()

+# app.py – HuggingFace Spaces için sıfırdan eğitim ve tahmin
+import pandas as pd, numpy as np, gradio as gr
+from sklearn.model_selection import train_test_split, GridSearchCV
+from sklearn.preprocessing import MinMaxScaler, LabelEncoder
+from sklearn.metrics import accuracy_score
+from concrete.ml.sklearn import XGBClassifier as ConcreteXGBClassifier
 SELECTED_FEATS = [
     "Finansal Kaldıraç", "Zmijewski Skoru", "Cari Oran", "Asit Test Oranı",
     "Özsermaye / Maddi Duran Varlıklar",
 ]
 def safe_div(a: pd.Series, b: pd.Series) -> pd.Series:
     return (a / b.replace(0, np.nan)).fillna(0)
 def compute_ratios(df: pd.DataFrame) -> pd.DataFrame:
     for col in [c for c in df.columns if c != "Periyot"]:
         df[col] = pd.to_numeric(df[col], errors="coerce").fillna(0)
         df["Dönen Varlıklar"] - df["Stoklar"] - df["Diğer Dönen Varlıklar"],
         df["Kısa Vadeli Yükümlülükler"])
     df["Nakit Oranı"] = safe_div(df["Nakit ve Nakit Benzerleri"], df["Kısa Vadeli Yükümlülükler"])
     df["Faaliyet Kar Marjı"] = safe_div(df["FAALİYET KARI (ZARARI)"]*100, df["Satış Gelirleri"])
     df["Brüt Kar Marjı (%)"] = safe_div(df["Ticari Faaliyetlerden Brüt Kar (Zarar)"]*100,
                                         df["Satış Gelirleri"])
+    df["Net Kar Marjı"] = safe_div(df["Dönem Net Kar/Zararı"]*100, df["Satış Gelirleri"])
     df["Aktif Karlılık (%)"] = safe_div(df["Dönem Net Kar/Zararı"]*100, ta)
+    df["Aktif Devir Hızı"] = safe_div(df["Satış Gelirleri"], ta)
     df["Dönen Varlıklar Devir Hızı"] = safe_div(df["Dönen Varlıklar"], df["Satış Gelirleri"])
+    df["Stok Devir Hızı"] = -safe_div(df["Satışların Maliyeti (-)"], df["Stoklar"])
+    df["Finansal Kaldıraç"] = safe_div(tl, ta)*100
+    df["Kısa Vade Borç / Aktif"] = safe_div(df["Kısa Vadeli Yükümlülükler"], ta)
+    df["Kısa Vade Borç / Özsermaye"] = safe_div(df["Kısa Vadeli Yükümlülükler"], df["Özkaynaklar"])
     df["Kısa Vade Borç / Toplam Borç"] = safe_div(df["Kısa Vadeli Yükümlülükler"], tl)
+    df["Özsermaye / Aktif"] = safe_div(df["Özkaynaklar"], ta)
+    df["Duran Varlıklar / Aktif "] = safe_div(df["Duran Varlıklar"]*100, ta)
+    df["Dönen Varlıklar / Aktif (%)"] = safe_div(df["Dönen Varlıklar"]*100, ta)
     df["Özsermaye / Maddi Duran Varlıklar"] = safe_div(df["Özkaynaklar"], df["Maddi Duran Varlıklar"])
     df["Finansman Gider / Net Satış"] = safe_div(df["Finansman Giderleri"], df["Satış Gelirleri"])
     df["Esas Faaliyet Karı / Kısa Vadeli Borç"] = safe_div(
         df["Net Faaliyet Kar/Zararı"], df["Kısa Vadeli Yükümlülükler"])
                            0.011*X5 + 0.729*L6 - 0.639*L7)
     return df
+# ------------------------ MODEL EĞİTİMİ ------------------------
+df = pd.read_csv("refined_data.csv")
+df["Görüs Tipi"] = df["Görüs Tipi"].apply(
+    lambda x: "Olumlu" if "olumlu" in str(x).lower() else x)
+DROP = [
+    "Şirket Adı", "Şirketin Kodu", "Periyot", "Yıl",
+    "Dönen Varlıklar", "Duran Varlıklar", "Toplam Varlıklar",
+    "Kısa Vadeli Yükümlülükler", "Uzun Vadeli Yükümlülükler", "Toplam Yükümlülükler",
+    "Toplam Özkaynaklar", "Ana Ortaklığa Ait Özkaynaklar",
+    "Kontrol Gücü Olmayan Kaynaklar", "Toplam Kaynaklar"
+]
+df = df.drop(columns=DROP).dropna()
+X, y = df.drop(columns="Görüs Tipi"), df["Görüs Tipi"]
+X_tr, X_te, y_tr, y_te = train_test_split(X, y, test_size=0.2, stratify=y, random_state=42)
+scaler = MinMaxScaler().fit(X_tr)
+Xtr_s = scaler.transform(X_tr)
+Xte_s = scaler.transform(X_te)
+encoder = LabelEncoder()
+ytr_e = encoder.fit_transform(y_tr)
+yte_e = encoder.transform(y_te)
+grid = GridSearchCV(
+    ConcreteXGBClassifier(n_bits=8, random_state=42),
+    {"n_estimators": [20, 30, 50], "max_depth": [3, 4, 5], "learning_rate": [0.1, 0.2]},
+    cv=3, scoring="accuracy", verbose=0
+)
+grid.fit(Xtr_s, ytr_e)
+best_params = grid.best_params_
+full_plain = ConcreteXGBClassifier(n_bits=8, **best_params, random_state=42)
+full_plain.fit(Xtr_s, ytr_e)
+imp_df = pd.DataFrame({"col": X.columns, "imp": full_plain.feature_importances_})
+imp_df["cum"] = imp_df["imp"].cumsum()
+COLS = imp_df.loc[imp_df["cum"] <= 0.95, "col"].tolist()
+scaler_sel = MinMaxScaler().fit(X_tr[COLS])
+Xtr_sel = scaler_sel.transform(X_tr[COLS])
+Xte_sel = scaler_sel.transform(X_te[COLS])
+final_model = ConcreteXGBClassifier(n_bits=8, **best_params, random_state=42)
+final_model.fit(Xtr_sel, ytr_e)
+final_model.compile(Xtr_sel)
+# ------------------------ Tahmin Fonksiyonu ------------------------
 def predict_opinion(excel_file: gr.File):
     if excel_file is None:
         raise gr.Error("Excel dosyası yükleyin.")
         pd.read_excel(excel_file.name, header=None, sheet_name=0)
         .set_index(0).T.reset_index(drop=True)
     )
     raw_df.columns = raw_df.columns.str.strip()
     raw_df = raw_df.loc[:, ~raw_df.columns.duplicated()]
     raw_df.rename(columns={"Desc": "Periyot"}, inplace=True)
     raw_df["Periyot"] = raw_df["Periyot"].astype(str).str.replace(r"\s+", " ", regex=True).str.strip()
     enriched = compute_ratios(raw_df)
+    X_input = enriched[COLS].dropna()
+    if X_input.empty:
         raise gr.Error("Oran hesaplanamadı – eksik sütunlar olabilir.")
+    X_input_scaled = scaler_sel.transform(X_input)
+    y_pred = final_model.predict(X_input_scaled, fhe="simulate")
+    labels = encoder.inverse_transform(y_pred)
     return pd.DataFrame({"Tahmin Görüş Tipi": labels})
+# ------------------------ Gradio UI ------------------------
 with gr.Blocks(theme=gr.themes.Default(primary_hue="blue")) as demo:
     gr.Markdown("# Denetçi Görüşü Tahmin Uygulaması")
     file_in = gr.File(file_types=[".xlsx", ".xls", ".xlsm"], label="Excel Yükleyin")
     btn     = gr.Button("Tahmin Et", variant="primary")
     out_df  = gr.Dataframe(wrap=True, show_label=False)
     btn.click(predict_opinion, file_in, out_df)
+if __name__ == "__main__":
+    demo.launch()