Spaces:

HugoNeres
/

Prova_Final_Credifast

Sleeping

App Files Files Community

Prova_Final_Credifast / app.py

HugoNeres

Update app.py

44500e6 verified 25 days ago

raw

history blame contribute delete

30.4 kB

	import streamlit as st
	import pandas as pd
	import joblib
	import matplotlib.pyplot as plt
	import seaborn as sns
	import shap
	import numpy as np
	import plotly.express as px
	import io
	from sklearn.metrics import confusion_matrix, roc_curve, auc
	from sklearn.decomposition import PCA
	from sklearn.preprocessing import StandardScaler
	from sklearn.cluster import KMeans

	# --- CONFIGURAÇÃO ---
	st.set_page_config(page_title="CrediFast Risk System", layout="wide")
	st.title("🏦 CrediFast: Sistema Integrado de Análise de Risco")

	# --- CARREGAMENTO OTIMIZADO ---
	@st.cache_resource
	def load_system():
	return joblib.load("sistema_risco_completo.pkl")

	@st.cache_data
	def load_data():
	return pd.read_csv("dados_credito_clean.csv")

	# --- CARREGAMENTO DO SISTEMA ---
	try:
	# 1. Carrega dados e sistema
	df = load_data()
	sistema = load_system()

	# 2. Recupera o scaler de dentro do sistema (conforme sua atualização)
	# Se der erro aqui, é porque você não gerou o novo .pkl no notebook ainda
	scaler = sistema["scaler"]

	# 3. Recupera os modelos
	dict_modelos = sistema["modelos"]

	# 4. Recupera dados de teste para validação
	y_test_real = sistema["y_test_real"]
	feature_names = sistema["X_test_sample"].columns.tolist()

	except FileNotFoundError:
	st.error("⚠️ Arquivo 'sistema_risco_completo.pkl' não encontrado. Faça o upload dele no Hugging Face.")
	st.stop()
	except KeyError:
	st.error("⚠️ O arquivo .pkl é antigo e não tem o 'scaler'. Gere o arquivo novamente no Notebook.")
	st.stop()
	except Exception as e:
	st.error(f"Erro crítico ao carregar o sistema: {e}")
	st.stop()

	# --- TABS ---
	tab1, tab2, tab3, tab4 = st.tabs(["I. Diagnóstico", "II & III. Construção e Avaliação dos Modelos & Explicabilidade", "IV. Clusterização", "V. Recomendações"])

	# =========================================================
	# ABA I: DIAGNÓSTICO E TRATAMENTO (O que você pediu)
	# =========================================================
	with tab1:
	st.header("I. Diagnóstico Inicial e Tratamento de Dados")

	col_kpi1, col_kpi2, col_kpi3 = st.columns(3)
	col_kpi1.metric("Total de Registros", f"{df.shape[0]:,}")
	col_kpi2.metric("Variáveis (Colunas)", df.shape[1])
	col_kpi3.metric("Taxa Global de Calote", f"{df['loan_status'].mean():.1%}")

	st.divider()

	# 1. Visualização dos Dados
	st.subheader("1. Visualização da Base de Dados (Processada)")
	st.dataframe(df.head(10), use_container_width=True)
	with st.expander("Ver Estatísticas Descritivas (Describe)"):
	st.dataframe(df.describe())

	# 2. Relatório de Tratamento
	st.subheader("2. Relatório de Tratamento de Dados")
	st.info("""
	Processos de Limpeza e Imputação Realizados no Código:

	1. Tratamento de Nulos (`Missing Values`):
	* `person_emp_length`: Preenchido com a Mediana (devido à presença de outliers que distorciam a média).
	* `loan_int_rate`: Preenchido com a função KNN Imputer para minimizar impacto nos parâmetros da coluna.

	2. Remoção de Outliers e Inconsistências:
	* Foram removidos registros com Idade > 100 anos.
	* Foram removidos casos biologicamente impossíveis onde Tempo de Emprego > Idade.

	3. Engenharia de Features:
	* Criação de variáveis Dummy para colunas categóricas.
	* Aplicação de SMOTE (Synthetic Minority Over-sampling Technique) nos dados de treino para corrigir o desbalanceamento da classe 'Default'.
	""")

	st.divider()

	# 3. Gráfico Interativo de Distribuição
	st.subheader("3. Análise Exploratória Interativa")
	st.markdown("Selecione qualquer variável para visualizar sua distribuição em relação ao Risco de Crédito.")

	# Seletor de Variáveis
	# Filtramos para mostrar primeiro as colunas mais interessantes
	colunas_pri = ['person_age', 'person_income', 'loan_amnt', 'loan_int_rate', 'loan_percent_income', 'loan_grade', 'person_home_ownership']
	# Adiciona o resto das colunas que não estão na lista prioritária
	outras_cols = [c for c in df.columns if c not in colunas_pri and c != 'loan_status']
	opcoes = colunas_pri + outras_cols

	var_selected = st.selectbox("Escolha a Variável para Análise:", opcoes)

	# Lógica de Plotagem Inteligente (Plotly)
	try:
	# Se for numérica com muitos valores únicos -> Histograma
	if pd.api.types.is_numeric_dtype(df[var_selected]) and df[var_selected].nunique() > 10:
	fig = px.histogram(
	df,
	x=var_selected,
	color="loan_status",
	marginal="box", # Adiciona boxplot no topo
	nbins=50,
	title=f"Distribuição de '{var_selected}' por Status do Empréstimo",
	labels={"loan_status": "Calote (0=Não, 1=Sim)"},
	color_discrete_sequence=["#1f77b4", "#d62728"], # Azul (Bom), Vermelho (Ruim)
	opacity=0.7,
	barmode="overlay"
	)
	# Se for categórica ou numérica discreta (ex: Grade) -> Gráfico de Barras
	else:
	# Conta a frequência
	df_count = df.groupby([var_selected, 'loan_status']).size().reset_index(name='Contagem')
	fig = px.bar(
	df_count,
	x=var_selected,
	y='Contagem',
	color='loan_status',
	barmode='group',
	title=f"Frequência de '{var_selected}' por Status",
	color_discrete_sequence=["#1f77b4", "#d62728"]
	)

	st.plotly_chart(fig, use_container_width=True)

	except Exception as e:
	st.warning(f"Não foi possível gerar o gráfico para esta variável. Erro: {e}")

	# =========================================================
	# ABA II: AVALIAÇÃO + SIMULADOR (CORRIGIDA E UNIFICADA)
	# =========================================================
	with tab2:
	st.header("II & III. Construção e Avaliação dos Modelos & Explicabilidade")

	# --- FUNÇÃO CALLBACK ---
	def reset_simulacao():
	st.session_state['simulacao_resultado'] = None

	# --- 1. SELEÇÃO DO MODELO ---
	col_sel1, col_sel2 = st.columns([1, 3])

	with col_sel1:
	st.markdown("##### Configuração")
	# Filtros de Categoria para facilitar a busca
	cats = ["Todos", "Boosting", "Árvores", "Outros"]
	cat_filter = st.radio(
	"Filtrar Família:",
	cats,
	horizontal=False,
	on_change=reset_simulacao # <--- Limpa ao mudar de categoria
	)
	with col_sel2:
	model_names = list(sistema["modelos"].keys())

	if cat_filter == "Boosting":
	model_names = [m for m in model_names if any(x in m for x in ['Light', 'XGB', 'Gradient', 'Ada'])]
	elif cat_filter == "Árvores":
	model_names = [m for m in model_names if 'Tree' in m or 'Forest' in m]
	elif cat_filter == "Outros":
	model_names = [m for m in model_names if any(x in m for x in ['KNN', 'SVM', 'MLP', 'Rede'])]

	selected_model_name = st.selectbox(
	"Selecione o Modelo para Análise:",
	model_names,
	on_change=reset_simulacao
	)

	# Recuperação dos dados do modelo escolhido
	dados_modelo = sistema["modelos"][selected_model_name]
	metrics = dados_modelo["metrics"]
	y_pred_saved = dados_modelo["y_pred"]
	y_proba_saved = dados_modelo["y_proba"]
	current_model_obj = dados_modelo["modelo"]

	st.divider()

	# --- 2. DASHBOARD DE PERFORMANCE (Estático) ---
	c1, c2, c3 = st.columns([1, 1, 1.5])

	with c1:
	st.subheader("Matriz de Confusão")
	cm = confusion_matrix(sistema["y_test_real"], y_pred_saved)
	fig_cm = plt.figure(figsize=(4, 3))
	sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', cbar=False,
	xticklabels=['Bom', 'Ruim'], yticklabels=['Bom', 'Ruim'])
	plt.xlabel('Predito')
	plt.ylabel('Real')
	st.pyplot(fig_cm)

	with c2:
	st.subheader("Curva ROC")
	if len(np.unique(sistema["y_test_real"])) > 1:
	fpr, tpr, _ = roc_curve(sistema["y_test_real"], y_proba_saved)
	fig_roc = plt.figure(figsize=(4, 3))
	plt.plot(fpr, tpr, color='#ff7f0e', lw=2, label=f'AUC = {metrics["AUC"]:.3f}')
	plt.plot([0, 1], [0, 1], color='navy', linestyle='--')
	plt.legend(loc="lower right")
	plt.grid(alpha=0.3)
	st.pyplot(fig_roc)
	else:
	st.info("ROC indisponível.")

	with c3:
	st.subheader("Métricas Gerais")
	k1, k2 = st.columns(2)
	k1.metric("Recall (Sensibilidade)", f"{metrics['Recall']:.1%}", help="Capacidade de detectar maus pagadores.")
	k2.metric("AUC Global", f"{metrics['AUC']:.3f}")

	k3, k4 = st.columns(2)
	k3.metric("Acurácia", f"{metrics['Acurácia']:.1%}")
	k4.metric("F1-Score", f"{metrics['F1-Score']:.1%}")

	st.divider()

	# --- BLOCO COLAPSÁVEL: INTERPRETABILIDADE GLOBAL ---
	# O 'expanded=False' faz ele começar fechado. Mude para True se quiser aberto.
	with st.expander(f"🧩 Ver Impacto das Variáveis (Global) - {selected_model_name}", expanded=False):

	# 1. Recupera o dicionário de Imagens
	shap_imgs = sistema.get("shap_images_dict", {})

	# 2. Verifica se existe imagem para o modelo selecionado
	if selected_model_name in shap_imgs:
	st.markdown(f"Visão Macro: O que o modelo {selected_model_name} considera mais arriscado?")

	# Exibe a imagem estática (Instantâneo)
	st.image(shap_imgs[selected_model_name], use_container_width=True)

	# Legenda compacta dentro de uma caixinha informativa
	st.info("""
	Como ler este gráfico:
	* ⬆️ Topo: Variáveis mais importantes.
	* 🔴 Vermelho: Valor Alto (Ex: Renda Alta) \| 🔵 Azul: Valor Baixo.
	* ➡️ Eixo X (Direita): Empurra o risco para cima (Calote).
	* ⬅️ Eixo X (Esquerda): Empurra o risco para baixo (Pagamento).
	""")

	else:
	st.warning(f"⚠️ Gráfico de impacto não disponível para '{selected_model_name}' (Disponível apenas para modelos baseados em árvore).")

	st.divider()

	# --- 3. SIMULADOR DE RISCO (COM ST.FORM E SESSION STATE) ---
	st.subheader(f"🔮 Simulador de Crédito ({selected_model_name})")

	col_input, col_res = st.columns([1, 1.2])

	# Inicializa estado se não existir
	if 'simulacao_resultado' not in st.session_state:
	st.session_state['simulacao_resultado'] = None

	# --- LADO ESQUERDO: FORMULÁRIO ---
	with col_input:
	with st.form("form_simulador"):
	st.markdown("Perfil do Cliente")

	c_in1, c_in2 = st.columns(2)
	with c_in1:
	income = st.number_input("Renda Anual (R$)", 4000, 5000000, 65000, step=1000)
	loan_amnt = st.number_input("Valor Solicitado (R$)", 1000, 100000, 15000, step=500)
	age = st.number_input("Idade", 18, 100, 25)
	emp_length = st.number_input("Anos de Emprego", 0.0, 70.0, 2.0)

	with c_in2:
	int_rate = st.slider("Taxa de Juros (%)", 4.0, 25.0, 10.0, step=0.1)
	grade = st.selectbox("Classificação (Grade)", ["A", "B", "C", "D", "E", "F", "G"])
	home = st.selectbox("Tipo de Moradia", ["ALUGUEL", "PRÓPRIA", "FINANCIADA", "OUTROS"])
	intent = st.selectbox("Motivo", ["PESSOAL", "EDUCAÇÃO", "MÉDICO", "VENTURE", "REFORMA", "DÍVIDA"])
	default_hist = st.selectbox("Já teve Calote (Histórico)?", ["Não", "Sim"])

	# Botão de Envio (DENTRO do form)
	submit_button = st.form_submit_button("Calcular Risco 🚀", type="primary")

	# --- LÓGICA DE CÁLCULO (Executa apenas ao clicar) ---
	if submit_button:
	try:
	with st.spinner("Calculando risco e gerando explicação..."): # Feedback visual para o usuário
	# 1. Feature Engineering
	percent_income = loan_amnt / income if income > 0 else 0
	cred_hist_len = max(2, int(age - 20))

	# 2. Cria DataFrame base
	df_input = pd.DataFrame(0, index=[0], columns=feature_names)

	# 3. Preenchimento Numérico
	cols_numericas = ['person_age', 'person_income', 'person_emp_length',
	'loan_amnt', 'loan_int_rate', 'loan_percent_income',
	'cb_person_cred_hist_length']

	df_input['person_age'] = age
	df_input['person_income'] = income
	df_input['person_emp_length'] = emp_length
	df_input['loan_amnt'] = loan_amnt
	df_input['loan_int_rate'] = int_rate
	df_input['loan_percent_income'] = percent_income
	df_input['cb_person_cred_hist_length'] = cred_hist_len

	# 4. Preenchimento Categórico
	map_home = {'ALUGUEL': 'RENT', 'PRÓPRIA': 'OWN', 'FINANCIADA': 'MORTGAGE', 'OUTROS': 'OTHER'}
	col_home = f"person_home_ownership_{map_home.get(home.split()[0], 'OTHER')}"
	if col_home in df_input.columns: df_input[col_home] = 1

	map_intent = {"PESSOAL": "PERSONAL", "EDUCAÇÃO": "EDUCATION", "MÉDICO": "MEDICAL",
	"VENTURE": "VENTURE", "REFORMA": "HOMEIMPROVEMENT", "DÍVIDA": "DEBTCONSOLIDATION"}
	col_intent = f"loan_intent_{map_intent.get(intent, 'PERSONAL')}"
	if col_intent in df_input.columns: df_input[col_intent] = 1

	col_grade = f"loan_grade_{grade}"
	if col_grade in df_input.columns: df_input[col_grade] = 1

	if default_hist == 'Sim' and 'cb_person_default_on_file_Y' in df_input.columns:
	df_input['cb_person_default_on_file_Y'] = 1

	# 5. Scaling
	df_input = df_input.reindex(columns=feature_names, fill_value=0)
	# Guarda input bruto para o SHAP (antes do scaler)
	df_input_shap = df_input.copy()

	try:
	df_input[cols_numericas] = scaler.transform(df_input[cols_numericas])
	except ValueError:
	df_input = scaler.transform(df_input)

	# 6. Predição
	try:
	proba = current_model_obj.predict_proba(df_input)[0][1]
	except:
	pred = current_model_obj.predict(df_input)[0]
	proba = 1.0 if pred == 1 else 0.0

	# 7. GERA O GRÁFICO SHAP E CONVERTE PARA IMAGEM ESTÁTICA
	shap_image_buffer = None # Variável para guardar a imagem
	modelos_arvore = ['LightGBM', 'XGBoost', 'Random Forest', 'Decision Tree', 'Gradient']

	if any(m in selected_model_name for m in modelos_arvore):
	try:
	explainer = shap.TreeExplainer(current_model_obj)
	shap_values = explainer(df_input_shap)

	if len(shap_values.shape) == 3:
	shap_val_plot = shap_values[:, :, 1]
	else:
	shap_val_plot = shap_values

	# Cria a figura
	fig = plt.figure(figsize=(8, 4))
	shap.plots.waterfall(shap_val_plot[0], show=False, max_display=7)

	# --- O TRUQUE ANTI-VIBRAÇÃO ---
	# Salva o plot em um buffer de memória (como se fosse um arquivo PNG invisível)
	buf = io.BytesIO()
	fig.savefig(buf, format="png", bbox_inches='tight', dpi=150)
	buf.seek(0) # Volta para o início do arquivo
	shap_image_buffer = buf # Guarda os dados da imagem

	plt.close(fig) # Limpa a memória do Matplotlib imediatamente

	except Exception as e:
	print(f"Erro ao gerar SHAP: {e}")

	# 8. Salva TUDO no Session State
	st.session_state['simulacao_resultado'] = {
	'proba': proba,
	'model_name': selected_model_name,
	'shap_image': shap_image_buffer # <--- Agora salvamos a IMAGEM, não a figura
	}

	except Exception as e:
	st.error(f"Erro no cálculo: {e}")
	st.error(f"Erro no cálculo: {e}")
	# --- LADO DIREITO: EXIBIÇÃO DO RESULTADO ---
	with col_res:
	if st.session_state['simulacao_resultado']:
	res = st.session_state['simulacao_resultado']
	proba = res['proba']

	# Definição de Cores e Textos
	if proba < 0.20:
	status, icon, bg_color, text_color, border_color = "APROVADO AUTOMATICAMENTE", "✅", "#d4edda", "#155724", "#c3e6cb"
	msg = "Cliente apresenta baixíssimo risco."
	elif proba < 0.60:
	status, icon, bg_color, text_color, border_color = "ANÁLISE MANUAL RECOMENDADA", "⚠️", "#fff3cd", "#856404", "#ffeeba"
	msg = "Cliente na zona cinzenta. Verificar documentos."
	else:
	status, icon, bg_color, text_color, border_color = "REPROVADO / ALTO RISCO", "❌", "#f8d7da", "#721c24", "#f5c6cb"
	msg = "Alta probabilidade de inadimplência detectada."

	# Card HTML
	st.markdown(f"""
	<div style="background-color: {bg_color}; color: {text_color}; padding: 20px; border-radius: 10px; border: 1px solid {border_color}; box-shadow: 0 4px 6px rgba(0,0,0,0.1); margin-bottom: 20px;">
	<h3 style="color: {text_color}; margin:0; font-size: 20px;">{icon} {status}</h3>
	<hr style="border-top: 1px solid {border_color}; margin: 10px 0;">
	<h1 style="margin:0; font-size: 50px; font-weight: bold;">{proba:.1%}</h1>
	<p style="margin-top: 5px; opacity: 0.8;">Probabilidade de Calote</p>
	<p style="font-style: italic; margin-top: 10px;">Note: {msg}</p>
	</div>
	""", unsafe_allow_html=True)

	# EXIBIÇÃO DO SHAP (Instantânea com st.image)
	# Verifica se existe uma imagem salva no dicionário
	if res.get('shap_image'):
	with st.expander("🔎 Entender Motivos (SHAP)"):
	st.caption("Fatores que mais impactaram esta decisão:")
	# st.image não processa nada, só exibe. Zero vibração.
	st.image(res['shap_image'], use_container_width=True)

	else:
	# Estado inicial (sem simulação feita)
	st.info("👈 Preencha os dados ao lado e clique em 'Calcular Risco' para ver o resultado.")

	# =========================================================
	# ABA III: CLUSTERIZAÇÃO COM PCA (Visualização Avançada)
	# =========================================================
	with tab3:
	st.header("IV. Segmentação de Clientes (Clusterização)")

	st.markdown("""
	Abaixo, utilizamos K-Means para agrupar clientes semelhantes e PCA (Análise de Componentes Principais) para reduzir todas as dimensões (Renda, Idade, Juros, etc.) em um mapa 2D.
	""")

	# 1. Definição das Colunas Numéricas para Clusterização
	# (Removendo colunas categóricas e alvo)
	cols_cluster = ['person_age', 'person_income', 'person_emp_length',
	'loan_amnt', 'loan_int_rate', 'loan_percent_income',
	'cb_person_cred_hist_length']

	# 2. Verifica/Gera Clusters (Caso o CSV não tenha a coluna 'Cluster')
	if 'Cluster' not in df.columns:
	with st.spinner("Identificando grupos de clientes (Clusterização)..."):
	# Prepara dados (Inputa médidas se houver nulos para não quebrar)
	X_clus = df[cols_cluster].fillna(df[cols_cluster].mean())

	# Escala específica para o Cluster (importante ser fresco)
	scaler_clus = StandardScaler()
	X_clus_scaled = scaler_clus.fit_transform(X_clus)

	# Aplica K-Means (Ex: 4 grupos)
	kmeans = KMeans(n_clusters=4, random_state=42, n_init=10)
	df['Cluster'] = kmeans.fit_predict(X_clus_scaled)

	# Garante que Cluster seja tratado como texto (Categoria) para cores discretas
	df['Cluster'] = df['Cluster'].astype(str)

	# 3. Aplicação do PCA para Visualização
	try:
	# Prepara dados para PCA
	X_pca_input = df[cols_cluster].fillna(df[cols_cluster].mean())
	scaler_pca = StandardScaler()
	X_scaled = scaler_pca.fit_transform(X_pca_input)

	# Calcula PCA (Reduz para 2 componentes)
	pca = PCA(n_components=2)
	components = pca.fit_transform(X_scaled)

	# Cria DataFrame temporário para o gráfico
	df_pca = pd.DataFrame(data=components, columns=['PC1', 'PC2'])
	df_pca['Cluster'] = df['Cluster'].values

	# Adiciona dados originais para o Tooltip (Hover)
	df_pca['Renda'] = df['person_income'].values
	df_pca['Empréstimo'] = df['loan_amnt'].values
	df_pca['Risco'] = df['loan_status'].apply(lambda x: 'Calote' if x==1 else 'Bom Pagador').values

	# 4. Gráfico Interativo
	col_graph, col_stats = st.columns([2, 1])

	with col_graph:
	var_explicada = pca.explained_variance_ratio_.sum()
	st.caption(f"Visualização PCA (Explica {var_explicada:.1%} da variação dos dados)")

	fig_pca = px.scatter(
	df_pca,
	x='PC1',
	y='PC2',
	color='Cluster',
	symbol='Risco', # Diferencia caloteiros por formato (opcional)
	hover_data=['Renda', 'Empréstimo', 'Risco'],
	title="Mapa de Clusters (PCA)",
	color_discrete_sequence=px.colors.qualitative.Bold,
	height=500
	)
	fig_pca.update_traces(marker=dict(size=8, opacity=0.7), selector=dict(mode='markers'))
	st.plotly_chart(fig_pca, use_container_width=True)

	# 5. Estatísticas dos Perfis
	with col_stats:
	st.subheader("Perfil dos Grupos")
	# Agrupa e calcula médias
	resumo = df.groupby('Cluster')[['person_income', 'loan_amnt', 'person_age', 'loan_status']].mean()

	# Formatação bonita
	st.dataframe(
	resumo.style.format({
	'person_income': 'R$ {:,.0f}',
	'loan_amnt': 'R$ {:,.0f}',
	'person_age': '{:.0f} anos',
	'loan_status': '{:.1%}'
	}).background_gradient(cmap='Blues', subset=['loan_status']),
	use_container_width=True
	)

	except Exception as e:
	st.error(f"Erro ao gerar PCA: {e}")
	# =========================================================
	# ABA V: RECOMENDAÇÕES E CONCLUSÃO
	# =========================================================
	with tab4:
	st.header("V. Recomendações Estratégicas e Conclusões")

	# --- 1. INSIGHTS DE MODELAGEM ---
	with st.container():
	st.subheader("🔍 1. Insights de Explicabilidade do Modelo")

	# Cria duas colunas para comparar Baixo vs Alto risco lado a lado
	col_insight1, col_insight2 = st.columns(2)

	with col_insight1:
	st.info("Caso de Baixo Risco (Aprovado)")
	st.markdown("""
	Ao analisarmos clientes seguros, identificamos padrões além do óbvio:
	* Fatores Ocultos: A posse de imóvel (Home Ownership) atua como um forte redutor de risco ("colchão de segurança").
	* Variáveis Dummy: O modelo identificou implicitamente que os melhores pagadores pertencem à Classe A (Loan Grade A), mesmo com essa variável omitida no treino para evitar colinearidade.
	""")

	with col_insight2:
	st.warning("Caso de Alto Risco (Reprovado)")
	st.markdown("""
	Nas observações de risco de inadimplência, o modelo valida a lógica financeira tradicional:
	* Tríade do Risco: A decisão foi severamente impactada pela combinação de Baixa Receita, alta Relação Empréstimo/Receita (alavancagem excessiva) e a Nota (Grade) atribuída pelo sistema.
	* Conclusão: O modelo penaliza agressivamente o comprometimento de renda. Quando a nota do sistema é baixa e a dívida é alta proporcionalmente à renda, a reprovação é quase imediata.
	""")

	# --- 2. POLÍTICAS DE CRÉDITO SUGERIDAS ---
	st.subheader("🛡️ 2. Políticas de Mitigação de Risco")

	col_pol1, col_pol2, col_pol3 = st.columns(3)

	with col_pol1:
	st.info("Evolução de Crédito (Ramp-up)")
	st.markdown("""
	Criar uma trava de comprometimento de renda progressiva:
	* Novos Clientes: Máximo de 20% da renda comprometida.
	* Clientes Recorrentes: Aumento gradual conforme histórico de pagamentos e uso de outros serviços da Fintech.
	* Objetivo: Evitar inadimplência por superendividamento inicial.
	""")

	with col_pol2:
	st.warning("Retenção de Perfil Intermediário")
	st.markdown("""
	Para clientes de risco médio (zona cinzenta):
	* Ação: Ofertar redução de taxas ou prazos mais longos.
	* Objetivo: Diluir o valor da parcela no tempo, facilitando o pagamento e mantendo o cliente no ecossistema, evitando que ele busque crédito predatório fora.
	""")

	with col_pol3:
	st.success("Esteira de Aprovação Inteligente")
	st.markdown("""
	Implementar triagem automática baseada na probabilidade do modelo:
	* Baixo Risco (Prob < 20%): Fast-track (aprovação automática) e ofertas agressivas de aumento de limite.
	* Objetivo: Reduzir CAC (Custo de Aquisição) e melhorar a experiência do usuário (UX) para os melhores clientes.
	""")

	st.divider()

	# --- 3. ESTRATÉGIA POR CLUSTER (Grupos Focais) ---
	st.subheader("🎯 3. Ações Táticas por Segmento (Clusters)")

	# Organizando os clusters em 2 colunas para melhor leitura
	c_clus1, c_clus2 = st.columns(2)

	with c_clus1:
	# CLUSTER 2 - ALTO RISCO
	st.markdown("""
	<div style="border: 1px solid #ffcccc; padding: 15px; border-radius: 10px; margin-bottom: 20px;">
	<h4 style="color: #cc0000;">🔴 Cluster 2: Alto Risco (Jovens Endividados)</h4>
	<p><strong>Perfil:</strong> Jovens com altos níveis de dívida (média de 30% da renda), renda média, mas pagando juros altos.</p>
	<p><strong>Ação Recomendada:</strong></p>
	<ul>
	<li>Análise manual rigorosa obrigatória.</li>
	<li>Exigência de garantias reais.</li>
	<li>Restrição de novos créditos até a regularização do <i>loan_percent_income</i>.</li>
	</ul>
	</div>
	""", unsafe_allow_html=True)

	# CLUSTER 3 - EM ASCENSÃO
	st.markdown("""
	<div style="border: 1px solid #fff3cd; padding: 15px; border-radius: 10px;">
	<h4 style="color: #856404;">🟡 Cluster 3: Potencial (Novos Entrantes)</h4>
	<p><strong>Perfil:</strong> Jovens mais novos na fintech, com menor apetite ao risco que o Cluster 2.</p>
	<p><strong>Ação Recomendada:</strong></p>
	<ul>
	<li>Foco em fidelização e educação financeira.</li>
	<li>Aumento gradual de limites (Política de Ramp-up).</li>
	<li>Candidatos a se tornarem "Premium" no futuro.</li>
	</ul>
	</div>
	""", unsafe_allow_html=True)

	with c_clus2:
	# CLUSTER 1 - PREMIUM
	st.markdown("""
	<div style="border: 1px solid #d4edda; padding: 15px; border-radius: 10px; margin-bottom: 20px;">
	<h4 style="color: #155724;">🟢 Cluster 1: Clientes Premium (Alta Renda)</h4>
	<p><strong>Perfil:</strong> Receita alta. Valores absolutos de empréstimo altos, mas percentualmente controlados.</p>
	<p><strong>Ação Recomendada:</strong></p>
	<ul>
	<li>Oferta de taxas de juros preferenciais (menores).</li>
	<li>Aumento proativo de limite.</li>
	<li>Atendimento prioritário para aumentar o <i>Share of Wallet</i>.</li>
	</ul>
	</div>
	""", unsafe_allow_html=True)

	# CLUSTER 0 - PADRÃO
	st.markdown("""
	<div style="border: 1px solid #e2e3e5; padding: 15px; border-radius: 10px;">
	<h4 style="color: #383d41;">🔵 Cluster 0: Cliente Padrão</h4>
	<p><strong>Perfil:</strong> Receita média, histórico de operações estável e dívidas controladas.</p>
	<p><strong>Ação Recomendada:</strong></p>
	<ul>
	<li>Manutenção das políticas padrão de crédito.</li>
	<li>Monitoramento automatizado de rotina.</li>
	<li>Ofertas padrão de mercado.</li>
	</ul>
	</div>
	""", unsafe_allow_html=True)

	st.divider()
	st.caption("Relatório gerado pelo Sistema Integrado de Análise de Risco (CrediFast).")