Upload 2 files

56ac446 verified 19 days ago

20.1 kB

	import pandas as pd
	import numpy as np
	import requests
	import time
	import os
	import warnings
	import sys
	import re
	import matplotlib.pyplot as plt
	import matplotlib.dates as mdates
	import seaborn as sns
	from datetime import datetime, timedelta
	from tqdm import tqdm

	# --- GEREKLİ KÜTÜPHANELER ---
	from sklearn.model_selection import train_test_split
	from sklearn.preprocessing import StandardScaler
	from sklearn.metrics import f1_score
	from sklearn.ensemble import RandomForestClassifier, ExtraTreesClassifier, HistGradientBoostingClassifier, \
	AdaBoostClassifier
	from sklearn.neighbors import KNeighborsClassifier
	from sklearn.linear_model import SGDClassifier
	from sklearn.neural_network import MLPClassifier
	from sklearn.naive_bayes import GaussianNB
	import xgboost as xgb
	import lightgbm as lgb
	import catboost as cb

	# --- AYARLAR ---
	pd.set_option('display.max_columns', None)
	pd.set_option('display.width', 1000)
	warnings.filterwarnings("ignore")
	requests.packages.urllib3.disable_warnings()

	# --- AKADEMİK RENK PALETİ TANIMI ---
	# Bilimsel yayınlara uygun, ciddi ve net ayrım sağlayan renkler
	ACADEMIC_COLORS = {
	'dusuk': '#2E7D32', # Koyu Yeşil (Orman Yeşili)
	'orta': '#F9A825', # Koyu Hardal Sarısı
	'riskli': '#EF6C00', # Koyu Turuncu (Kiremit)
	'yuksek': '#C62828', # Koyu Bordo
	'tehlikeli': '#37474F' # Koyu Antrasit Mavi/Siyah
	}

	# DOSYA VE KLASÖR
	MGM_DATA_FILE = "mgm.csv"
	FAULT_FILE = "faults.csv"
	MAIN_FOLDER = "ariza_grafikleri"
	SUB_FOLDER = "TANZER_PROHIBRIT_RESULTS"
	OUTPUT_DIR = os.path.join(MAIN_FOLDER, SUB_FOLDER)

	if not os.path.exists(OUTPUT_DIR): os.makedirs(OUTPUT_DIR)
	OUTPUT_EXCEL = os.path.join(OUTPUT_DIR, "PROHIBRIT_RISK_RAPORU.xlsx")
	PLOT_BAR = os.path.join(OUTPUT_DIR, "PROHIBRIT_BAR_CHART.png")
	PLOT_LINE = os.path.join(OUTPUT_DIR, "PROHIBRIT_LINE_CHART.png")

	MGM_MAPPING = {
	"Tarih": "Zaman",
	"Sicaklik": "Sıcaklık",
	"Nem": "Nispi Nem",
	"Yagis": "Toplam Yağış OMGI mm",
	"Ruzgar_Hizi": "Rüzgar Yönü ve Hızı",
	"Basinc": "Deniz Seviyesine İndirgenmiş Basınç hPa"
	}

	print("========================================================================")
	print(" TANZER PROHİBRİT MODEL (AKADEMİK SÜRÜM)")
	print(" (11 Model Ensemble + Gelişmiş Bilimsel Görselleştirme)")
	print("========================================================================\n")


	# ---------------------------------------------------------
	# 1. VERİ İŞLEME
	# ---------------------------------------------------------
	def clean_number(val):
	if pd.isna(val) or val == "": return 0.0
	try:
	s = str(val).replace(',', '.').strip()
	nums = re.findall(r"[-+]?\d*\.\d+\|\d+", s)
	if nums: return float(nums[0])
	return 0.0
	except:
	return 0.0


	def convert_excel_date(val):
	if pd.isna(val) or val == "": return pd.NaT
	try:
	s = str(val).replace(',', '.').strip()
	if re.match(r'^\d+(\.\d+)?$', s):
	serial = float(s)
	if 30000 < serial < 60000:
	return pd.Timestamp('1899-12-30') + pd.to_timedelta(serial, unit='D')
	except:
	pass
	try:
	return pd.to_datetime(val, dayfirst=True)
	except:
	pass
	try:
	return pd.to_datetime(val)
	except:
	return pd.NaT


	def clean_coord(val):
	try:
	s = str(val).replace(',', '.')
	s = re.sub(r"[^0-9\.\-]", "", s)
	f = float(s)
	if -90 <= f <= 90: return f
	except:
	return None


	def calculate_features(df):
	if 'Tarih' in df.columns: df = df.set_index('Tarih')
	if not isinstance(df.index, pd.DatetimeIndex): df.index = pd.to_datetime(df.index, dayfirst=True, errors='coerce')
	df = df[df.index.notnull()].sort_index()

	if 'Yagis' in df.columns:
	df['Yagis_7G'] = df['Yagis'].rolling('7d').sum().fillna(0)
	else:
	df['Yagis_7G'] = 0

	if 'Basinc' in df.columns:
	df['Basinc_Trend'] = df['Basinc'].diff(24).fillna(0)
	df['Basinc_Stabilite'] = df['Basinc'].rolling('3d').std().fillna(0)
	else:
	df['Basinc_Trend'] = 0
	df['Basinc_Stabilite'] = 0

	if 'Sicaklik' in df.columns:
	df['Sicaklik_Soku'] = df['Sicaklik'].diff(6).abs().fillna(0)
	df['Donma_Indeksi'] = (df['Sicaklik'] < 0).astype(int) * df['Yagis_7G']
	else:
	df['Sicaklik_Soku'] = 0
	df['Donma_Indeksi'] = 0

	if 'Ruzgar_Hizi' in df.columns:
	df['Ruzgar_Enerjisi'] = df['Ruzgar_Hizi'] ** 2
	df['Firtina_Gucu'] = df['Ruzgar_Enerjisi'] * (df['Yagis_7G'] + 1).apply(np.log)
	else:
	df['Ruzgar_Enerjisi'] = 0
	df['Firtina_Gucu'] = 0

	return df.dropna()


	def get_risk_cat(score):
	if score < 40:
	return "Düşük Risk"
	elif 40 <= score < 60:
	return "Orta Risk"
	elif 60 <= score < 70:
	return "RİSKLİ"
	elif 70 <= score < 80:
	return "YÜKSEK RİSKLİ"
	else:
	return "TEHLİKELİ"


	# ---------------------------------------------------------
	# 2. TANZER PROHİBRİT MODEL (MEGA ENSEMBLE)
	# ---------------------------------------------------------
	class TanzerProhibitModel:
	def __init__(self):
	self.models = {}
	self.weights = {}
	self.model_performance = []
	self.scaler = StandardScaler()

	def train(self, X, y):
	X_scaled = self.scaler.fit_transform(X)
	X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42, stratify=y)

	print("\n--- PROHİBRİT MODEL EĞİTİM SÜRECİ ---")

	models_to_train = {
	"RandomForest": RandomForestClassifier(n_estimators=150, max_depth=12, class_weight='balanced', n_jobs=-1,
	random_state=42),
	"ExtraTrees": ExtraTreesClassifier(n_estimators=150, max_depth=12, class_weight='balanced', n_jobs=-1,
	random_state=42),
	"XGBoost": xgb.XGBClassifier(n_estimators=150, max_depth=6, learning_rate=0.1, n_jobs=-1,
	eval_metric='logloss'),
	"LightGBM": lgb.LGBMClassifier(n_estimators=150, learning_rate=0.1, class_weight='balanced', verbose=-1,
	n_jobs=-1),
	"CatBoost": cb.CatBoostClassifier(iterations=150, depth=6, learning_rate=0.1, auto_class_weights='Balanced',
	verbose=0, thread_count=-1),
	"HistGradient": HistGradientBoostingClassifier(learning_rate=0.1, max_iter=150, random_state=42),
	"AdaBoost": AdaBoostClassifier(n_estimators=100, random_state=42),
	"KNN": KNeighborsClassifier(n_neighbors=5, weights='distance', algorithm='kd_tree', leaf_size=40,
	n_jobs=-1),
	"FastSVM": SGDClassifier(loss='hinge', penalty='l2', alpha=0.0001, max_iter=1000, class_weight='balanced',
	n_jobs=-1, random_state=42),
	"NeuralNet": MLPClassifier(hidden_layer_sizes=(100, 50), max_iter=300, activation='relu', solver='adam',
	early_stopping=True, random_state=42),
	"NaiveBayes": GaussianNB()
	}

	pbar = tqdm(models_to_train.items(), desc="Model Eğitimi", unit="model", ncols=100,
	bar_format="{l_bar}{bar}\| {n_fmt}/{total_fmt}")

	for name, model in pbar:
	try:
	model.fit(X_train, y_train)
	y_pred = model.predict(X_test)
	score = f1_score(y_test, y_pred)

	tqdm.write(f" 🔹 {name:<15}: {score:.4f} (F1 Score)")

	status = "✅ Aktif" if score > 0.35 else "❌ Elendi"
	self.model_performance.append({"Model": name, "F1 Score": score, "Durum": status})

	if score > 0.35:
	self.models[name] = model
	self.weights[name] = score
	except Exception as e:
	tqdm.write(f" ❌ {name} Hatası: {e}")
	self.model_performance.append({"Model": name, "F1 Score": 0.0, "Durum": "HATA"})

	total = sum(self.weights.values())
	if total > 0:
	for k in self.weights: self.weights[k] /= total
	else:
	rf = RandomForestClassifier()
	rf.fit(X_train, y_train)
	self.models['RF'] = rf
	self.weights['RF'] = 1.0

	print("\n" + "=" * 50)
	print(" 🏆 TANZER PROHİBRİT - PERFORMANS KARNESİ 🏆")
	print("=" * 50)
	df_perf = pd.DataFrame(self.model_performance).sort_values("F1 Score", ascending=False)
	print(df_perf.to_string(index=False, formatters={'F1 Score': '{:.4f}'.format}))
	print("=" * 50 + "\n")

	def predict(self, df_features):
	X = self.scaler.transform(df_features)
	final_prob = np.zeros(len(X))
	for name, model in self.models.items():
	try:
	if hasattr(model, "predict_proba"):
	prob = model.predict_proba(X)[:, 1]
	elif hasattr(model, "decision_function"):
	d = model.decision_function(X)
	prob = 1 / (1 + np.exp(-d))
	else:
	prob = model.predict(X)
	final_prob += prob * self.weights[name]
	except:
	pass
	return final_prob * 100


	# ---------------------------------------------------------
	# 3. ANA AKIŞ
	# ---------------------------------------------------------
	def main():
	print("⏳ Veri Tabanı Yükleniyor...")
	if not os.path.exists(MGM_DATA_FILE): return
	try:
	use_cols = list(MGM_MAPPING.values())
	df_mgm = pd.read_csv(MGM_DATA_FILE, sep=None, engine='python', encoding='utf-8-sig',
	usecols=lambda c: c.strip() in use_cols)
	df_mgm.columns = df_mgm.columns.str.strip()
	clean_df = pd.DataFrame()
	target_date_col = MGM_MAPPING["Tarih"]
	if target_date_col in df_mgm.columns:
	clean_df["Tarih"] = pd.to_datetime(df_mgm[target_date_col], dayfirst=True, errors='coerce')
	for kod, dosya in MGM_MAPPING.items():
	if kod == "Tarih": continue
	if dosya in df_mgm.columns:
	clean_df[kod] = pd.to_numeric(df_mgm[dosya].astype(str).str.replace(',', '.'), errors='coerce').fillna(
	0)
	else:
	clean_df[kod] = 0.0
	clean_df = clean_df.dropna(subset=['Tarih']).sort_values('Tarih').reset_index(drop=True)
	except:
	return

	if not os.path.exists(FAULT_FILE): return
	try:
	df_fault = pd.read_csv(FAULT_FILE, sep=None, engine='python')
	target_col = [c for c in df_fault.columns if 'tarih' in c.lower() or 'date' in c.lower()][0]
	df_fault['Tarih'] = df_fault[target_col].apply(convert_excel_date)
	if 'Enlem' in df_fault.columns:
	df_fault['Enlem'] = df_fault['Enlem'].apply(clean_coord)
	df_fault['Boylam'] = df_fault['Boylam'].apply(clean_coord)
	df_fault = df_fault.dropna(subset=['Tarih'])
	except:
	return

	print("⏳ Veri Seti İşleniyor (Pencere: -7 / +5 Saat)...")
	full_data = calculate_features(clean_df)
	full_data['Ariza_Durumu'] = 0

	for f_date in df_fault['Tarih']:
	try:
	start_risk = f_date - timedelta(days=7)
	end_risk = f_date + timedelta(hours=5)
	if start_risk < full_data.index.max() and end_risk > full_data.index.min():
	full_data.loc[start_risk:end_risk, 'Ariza_Durumu'] = 1
	except:
	continue

	pos = full_data[full_data['Ariza_Durumu'] == 1]
	neg_pool = full_data[full_data['Ariza_Durumu'] == 0]
	n_neg = min(len(pos) * 5, len(neg_pool))

	if n_neg > 0:
	neg = neg_pool.sample(n=n_neg, random_state=42)
	train_set = pd.concat([pos, neg])
	else:
	return

	features = ['Sicaklik', 'Nem', 'Yagis', 'Ruzgar_Hizi', 'Basinc',
	'Yagis_7G', 'Basinc_Trend', 'Basinc_Stabilite',
	'Sicaklik_Soku', 'Donma_Indeksi', 'Ruzgar_Enerjisi', 'Firtina_Gucu']

	# EĞİTİM
	print("🚀 TANZER PROHİBRİT MODEL EĞİTİLİYOR...")
	ensemble = TanzerProhibitModel()
	ensemble.train(train_set[features], train_set['Ariza_Durumu'])
	print("✅ Eğitim Tamamlandı.")

	# TAHMİN
	print("\n⏳ 14 Hat İçin Analiz Başlıyor (Lütfen Bekleyiniz)...")
	possible_names = ["Hat_Adı_2", "Hat Adı", "Hat_Adi", "HAT_ADI", "HAT ADI"]
	hat_col = next((c for c in df_fault.columns if c in possible_names), df_fault.columns[0])
	unique_lines = df_fault[[hat_col, 'Enlem', 'Boylam']].drop_duplicates(subset=[hat_col]).dropna().head(14)

	results = []
	line_data = []
	session = requests.Session()

	pbar = tqdm(unique_lines.iterrows(), total=len(unique_lines), unit="hat",
	bar_format="{l_bar}{bar}\| {n_fmt}/{total_fmt} [{elapsed}<{remaining}]")

	for _, row in pbar:
	hat_adi = row[hat_col]
	lat, lon = row['Enlem'], row['Boylam']
	pbar.set_description(f"Analiz: {str(hat_adi)[:20]}")

	try:
	url = "https://api.open-meteo.com/v1/forecast"
	params = {
	"latitude": lat, "longitude": lon,
	"hourly": "temperature_2m,relative_humidity_2m,rain,wind_speed_10m,surface_pressure",
	"past_days": 7, "forecast_days": 3, "timezone": "auto"
	}
	r = session.get(url, params=params, timeout=10, verify=False)
	if r.status_code == 200:
	data = r.json()
	df_api = pd.DataFrame(data['hourly'])
	df_api['time'] = pd.to_datetime(df_api['time'])
	df_api = df_api.rename(
	columns={'time': 'Tarih', 'temperature_2m': 'Sicaklik', 'relative_humidity_2m': 'Nem',
	'rain': 'Yagis', 'wind_speed_10m': 'Ruzgar_Hizi', 'surface_pressure': 'Basinc'})

	df_proc = calculate_features(df_api)
	df_proc.index = df_proc.index.tz_localize(None)
	now = datetime.now()
	future_df = df_proc[df_proc.index >= now].copy()

	if not future_df.empty:
	for c in features:
	if c not in future_df.columns: future_df[c] = 0

	risk = ensemble.predict(future_df[features])
	future_df['Risk'] = risk

	max_idx = future_df['Risk'].idxmax()
	max_risk = future_df.loc[max_idx, 'Risk']
	cat = get_risk_cat(max_risk)

	tqdm.write(f"✅ {str(hat_adi)[:30]:<30} : %{max_risk:.1f} ({cat})")

	results.append({"Hat": hat_adi, "Risk (%)": max_risk, "Kategori": cat, "Zaman": max_idx})
	p_data = future_df[['Risk']].reset_index()
	p_data['Hat'] = hat_adi
	line_data.append(p_data)
	else:
	tqdm.write(f"❌ {str(hat_adi)[:30]} : API Hatası")
	except:
	tqdm.write(f"❌ {str(hat_adi)[:30]} : Bağlantı Hatası")

	# --- AKADEMİK RAPORLAMA VE GÖRSELLEŞTİRME ---
	if results:
	df_res = pd.DataFrame(results).sort_values("Risk (%)", ascending=False)
	df_res.to_excel(OUTPUT_EXCEL, index=False)

	# Seaborn Akademik Tema Ayarı
	sns.set_theme(style="whitegrid", font_scale=1.1, rc={"grid.linewidth": 0.6, "axes.linewidth": 1})

	# --- GRAFİK 1: ÇUBUK (BAR) GRAFİĞİ ---
	plt.figure(figsize=(14, 10))

	# Renkleri skora göre akademik paletten seç
	colors = [ACADEMIC_COLORS['dusuk'] if x < 40 else
	ACADEMIC_COLORS['orta'] if x < 60 else
	ACADEMIC_COLORS['riskli'] if x < 70 else
	ACADEMIC_COLORS['yuksek'] if x < 80 else
	ACADEMIC_COLORS['tehlikeli'] for x in df_res['Risk (%)']]

	ax = sns.barplot(x='Risk (%)', y='Hat', data=df_res, palette=colors, edgecolor='.2', linewidth=0.8)

	# Kritik Eşik Çizgisi (Daha belirgin)
	plt.axvline(75, color=ACADEMIC_COLORS['yuksek'], linestyle='--', linewidth=2.5, label='Kritik Risk Eşiği (%75)')

	# Değerleri çubukların ucuna yaz
	for i, v in enumerate(df_res['Risk (%)']):
	ax.text(v + 0.5, i, f"%{v:.1f}", fontweight='bold', va='center', fontsize=12, color='black')

	plt.title('Enerji İletim Hatlarında Maksimum Risk Analizi\n(TANZER PROHİBRİT MODEL SONUÇLARI)',
	fontweight='bold', fontsize=16, pad=20)
	plt.xlabel('Hesaplanan Risk Skoru (%)', fontweight='bold', fontsize=12)
	plt.ylabel('Hat Adı', fontweight='bold', fontsize=12)
	plt.legend(loc='lower right', frameon=True)
	plt.tight_layout()
	plt.savefig(PLOT_BAR, dpi=300) # Yüksek çözünürlük

	# --- GRAFİK 2: ÇİZGİ (LINE) GRAFİĞİ ---
	if line_data:
	all_lines = pd.concat(line_data)
	plt.figure(figsize=(16, 10))

	# Ana Çizgiler (Daha kalın ve profesyonel palet)
	sns.lineplot(data=all_lines, x='Tarih', y='Risk', hue='Hat', palette='tab10', linewidth=3, alpha=0.9)

	# Maksimum Noktaları İşaretle
	for hat_name in df_res['Hat']:
	hat_df = all_lines[all_lines['Hat'] == hat_name]
	if not hat_df.empty:
	max_row = hat_df.loc[hat_df['Risk'].idxmax()]
	# Kırmızı nokta ve belirgin beyaz çerçeve
	plt.scatter(max_row['Tarih'], max_row['Risk'], color=ACADEMIC_COLORS['yuksek'], s=120, zorder=5,
	edgecolor='white', linewidth=2)
	# Etiket kutusu
	plt.annotate(f"%{max_row['Risk']:.0f}",
	(max_row['Tarih'], max_row['Risk']),
	textcoords="offset points", xytext=(0, 12), ha='center',
	bbox=dict(boxstyle="round,pad=0.4", fc="white", ec=ACADEMIC_COLORS['yuksek'], lw=1.5),
	fontsize=10, fontweight='bold')

	# --- ARKA PLAN RİSK BÖLGELERİ (ÇOK DAHA BELİRGİN) ---
	# Alpha değerleri 0.08'den 0.20-0.25 seviyesine çıkarıldı
	plt.axhspan(0, 40, color=ACADEMIC_COLORS['dusuk'], alpha=0.20, label='Düşük Risk Bölgesi')
	plt.axhspan(40, 60, color=ACADEMIC_COLORS['orta'], alpha=0.20, label='Orta Risk Bölgesi')
	plt.axhspan(60, 70, color=ACADEMIC_COLORS['riskli'], alpha=0.25, label='Riskli Bölge')
	plt.axhspan(70, 80, color=ACADEMIC_COLORS['yuksek'], alpha=0.25, label='Yüksek Risk Bölgesi')
	plt.axhspan(80, 105, color=ACADEMIC_COLORS['tehlikeli'], alpha=0.30, label='Tehlikeli Bölge')

	plt.ylim(0, 105)
	plt.title('72 Saatlik Detaylı Zamansal Risk Değişimi', fontweight='bold', fontsize=18, pad=20)
	plt.xlabel('Zaman (Gün/Saat)', fontweight='bold', fontsize=12)
	plt.ylabel('Risk Yüzdesi (%)', fontweight='bold', fontsize=12)

	# Tarih formatını iyileştir
	plt.gca().xaxis.set_major_formatter(mdates.DateFormatter('%d-%m %H:%M'))
	plt.xticks(rotation=45)

	# Lejantı dışarı al ve düzenle
	plt.legend(bbox_to_anchor=(1.02, 1), loc='upper left', title="Hatlar ve Risk Bölgeleri",
	frameon=True, shadow=True, title_fontsize='12', fontsize='11')

	plt.grid(True, linestyle='-', linewidth=0.8, alpha=0.7) # Gridleri belirginleştir
	plt.tight_layout()
	plt.savefig(PLOT_LINE, dpi=300) # Yüksek çözünürlük

	print(f"\n✅ BAŞARILI! Akademik Rapor ve Yüksek Çözünürlüklü Grafikler Oluşturuldu.")
	print(f" Çıktı Klasörü: {OUTPUT_DIR}")
	else:
	print("\n❌ Sonuç üretilemedi.")


	if __name__ == "__main__":
	main()