Spaces:

252106862eder
/

churn

Sleeping

App Files Files Community

252106862eder commited on Oct 27, 2025

Commit

5e29983

verified ·

1 Parent(s): f79e124

Update model_utils.py

Browse files

"Fixed SyntaxError by separating f-string and raw string parts for LaTeX percentage formatting; logo diagnostic check."

Files changed (1) hide show

model_utils.py +56 -74

model_utils.py CHANGED Viewed

@@ -276,10 +276,10 @@ class ChurnModelPipeline:
             latex_story.append(NoEscape(sample_display_df.to_latex(index=False, caption='Características do Cliente Simulado', label='tab:sim_customer', longtable=False)))
             markdown_story.append(f"**Resultado da Simulação:** O cliente **{churn_status_sample}** (Probabilidade de Churn: **{prob_sample:.2%}**)\n")
-            latex_story.append(fr'\textbf{{Resultado da Simulação:}} O cliente \textbf{{{churn_status_sample}}} (Probabilidade de Churn: \textbf{{{prob_sample:.2f}\%}})\n\n')
         else:
             markdown_story.append("Não foi possível realizar uma simulação pois o DataFrame de teste ou dados interativos não estão disponíveis.\n")
-            latex_story.append(r'Não foi possível realizar uma simulação pois o DataFrame de teste ou dados interativos não estão disponíveis.\n\n')
         # --- 2. Detalhes do Processo de Treinamento ---
         markdown_story.append("## 2. Detalhes do Processo de Treinamento")
@@ -320,7 +320,7 @@ class ChurnModelPipeline:
             latex_story.append(NoEscape(training_details_latex))
         else:
             markdown_story.append("Nenhum detalhe de treinamento disponível.\n")
-            latex_story.append(r'Nenhum detalhe de treinamento disponível.\n\n')
         # --- 3. Descrição do Modelo e Metodologia ---
@@ -328,22 +328,22 @@ class ChurnModelPipeline:
         latex_story.append(Section(NoEscape(r'Descrição do Modelo e Metodologia'), False))
         markdown_story.append("O modelo utiliza **Regressão Logística** para classificar a probabilidade de um cliente sair (churn). Foram aplicadas as seguintes etapas para garantir robustez e tratar as características dos dados:\n")
-        latex_story.append(r'O modelo utiliza \textbf{Regressão Logística} para classificar a probabilidade de um cliente sair (churn). Foram aplicadas as seguintes etapas para garantir robustez e tratar as características dos dados:\n\n')
         markdown_story.append("- **Pré-processamento de Dados:**\n    - **Features Numéricas:** Imputação de valores ausentes (mediana) e escalonamento (`StandardScaler`) para padronização.\n    - **Features Categóricas:** Imputação de valores ausentes (moda) e codificação One-Hot (`OneHotEncoder`) para transformar categorias em formato numérico.\n")
-        latex_story.append(r'\begin{itemize}' + '\n')
-        latex_story.append(r'\item \textbf{Pré-processamento de Dados:}' + '\n')
-        latex_story.append(r'\begin{itemize}' + '\n')
-        latex_story.append(r'\item \textbf{Features Numéricas:} Imputação de valores ausentes (mediana) e escalonamento (\texttt{StandardScaler}) para padronização.' + '\n')
-        latex_story.append(r'\item \textbf{Features Categóricas:} Imputação de valores ausentes (moda) e codificação One-Hot (\texttt{OneHotEncoder}) para transformar categorias em formato numérico.' + '\n')
-        latex_story.append(r'\end{itemize}' + '\n')
         markdown_story.append("- **Balanceamento de Classes (SMOTE):** O conjunto de dados original apresentava desbalanceamento significativo na variável alvo (`Exited`). O algoritmo SMOTE (Synthetic Minority Over-sampling Technique) foi aplicado para gerar amostras sintéticas da classe minoritária (clientes que saem), garantindo que o modelo não seja viesado para a classe majoritária (clientes que permanecem).\n")
-        latex_story.append(r'\item \textbf{Balanceamento de Classes (SMOTE):} O conjunto de dados original apresentava desbalanceamento significativo na variável alvo (\texttt{Exited}). O algoritmo SMOTE (Synthetic Minority Over-sampling Technique) foi aplicado para gerar amostras sintéticas da classe minoritária (clientes que saem), garantindo que o modelo não seja viesado para a classe majoritária (clientes que permanecem).' + '\n')
         markdown_story.append("- **Regularização (L2):** A Regressão Logística foi configurada com um parâmetro `C=0.1` (inverso da força de regularização), que aplica regularização L2. Isso ajuda a prevenir o overfitting, penalizando coeficientes grandes e promovendo um modelo mais generalizável.\n")
-        latex_story.append(r'\item \textbf{Regularização (L2):} A Regressão Logística foi configurada com um parâmetro \texttt{C=0.1} (inverso da força de regularização), que aplica regularização L2. Isso ajuda a prevenir o overfitting, penalizando coeficientes grandes e promovendo um modelo mais generalizável.' + '\n')
-        latex_story.append(r'\end{itemize}' + '\n\n')
         # --- 4. Como a Probabilidade de Churn é Calculada ---
@@ -351,17 +351,17 @@ class ChurnModelPipeline:
         latex_story.append(Section(NoEscape(r'Como a Probabilidade de Churn é Calculada'), False))
         markdown_story.append("A Regressão Logística é um modelo de classificação que estima a probabilidade de um evento (neste caso, o churn do cliente) ocorrer. Ao contrário da regressão linear, que prevê um valor contínuo, a regressão logística utiliza a **função sigmoide** para mapear qualquer valor real para um valor entre 0 e 1, que pode ser interpretado como probabilidade.\n")
-        latex_story.append(r'A Regressão Logística é um modelo de classificação que estima a probabilidade de um evento (neste caso, o churn do cliente) ocorrer. Ao contrário da regressão linear, que prevê um valor contínuo, a regressão logística utiliza a \textbf{função sigmoide} para mapear qualquer valor real para um valor entre 0 e 1, que pode ser interpretado como probabilidade.\n\n')
         markdown_story.append("A equação básica de um modelo linear (`L`) é:\n`L = β₀ + β₁X₁ + β₂X₂ + ... + βₙXₙ`\nOnde `β` são os coeficientes (pesos) das features (`X`).\n")
         latex_story.append(Math(data=[NoEscape(r'L = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \dots + \beta_n X_n')]))
-        latex_story.append(r'\nOnde $\beta$ são os coeficientes (pesos) das features ($X$).\n\n')
         markdown_story.append("A probabilidade (`P`) de churn é então calculada aplicando-se a função sigmoide (σ) a `L`:\n`P(Churn) = σ(L) = 1 / (1 + e⁻ᴸ)`\n")
         latex_story.append(Math(data=[NoEscape(r'P(\text{Churn}) = \sigma(L) = \frac{1}{1 + e^{-L}}')]))
         markdown_story.append("Esta função garante que a saída esteja sempre entre 0 e 1, representando a probabilidade de o cliente pertencer à classe 'Churn' (ou seja, `Exited = 1`). Se `P(Churn)` for maior que um determinado limiar (geralmente 0.5), o cliente é classificado como provável churn.\n")
-        latex_story.append(r'\nEsta função garante que a saída esteja sempre entre 0 e 1, representando a probabilidade de o cliente pertencer à classe `Churn` (ou seja, \texttt{Exited = 1}). Se $P(\text{Churn})$ for maior que um determinado limiar (geralmente 0.5), o cliente é classificado como provável churn.\n\n')
         # --- Subseção: Exemplo de Simulação Numérica (AGORA COM DADOS REAIS DA SIMULAÇÃO) ---
         markdown_story.append("### Exemplo de Simulação Numérica com Cliente Simulado")
@@ -370,7 +370,7 @@ class ChurnModelPipeline:
         if sample_customer_df is not None:
             # Reutilizamos os valores de logit_sample e prob_sample calculados anteriormente para o cliente simulado
             markdown_story.append("Para ilustrar o cálculo, vamos usar as características do cliente simulado acima (ou o último cliente da Previsão Interativa) e os coeficientes do modelo treinado. Note que as características numéricas são **escalonadas** e as categóricas **one-hot encoded** antes de serem multiplicadas pelos coeficientes. \n")
-            latex_story.append(r'Para ilustrar o cálculo, vamos usar as características do cliente simulado acima (ou o último cliente da Previsão Interativa) e os coeficientes do modelo treinado. Note que as características numéricas são \textbf{escalonadas} e as categóricas \textbf{one-hot encoded} antes de serem multiplicadas pelos coeficientes. \n\n')
             markdown_story.append(f"**Características do Cliente 'Simulado':**\n" + sample_display_df.to_markdown(index=False) + "\n")
             latex_story.append(NoEscape(sample_display_df.to_latex(index=False, caption='Características do Cliente Simulado', label='tab:sim_customer_example', longtable=False)))
@@ -384,33 +384,31 @@ class ChurnModelPipeline:
             markdown_story.append(f"1.  **Calcular o Logit (L):** O Logit é a soma ponderada de todas as características do cliente (já processadas pelo pré-processador do modelo) multiplicadas por seus respectivos coeficientes, mais o intercepto do modelo. Para o cliente simulado, o modelo calculou um Logit de:\n`L = {logit_sample_formatted}`\n")
             # LaTeX for Logit calculation
-            latex_story.append(r'\textbf{Passos do Cálculo para o Cliente "Simulado":}\n')
-            latex_story.append(r'\begin{enumerate}')
-            latex_story.append(fr'\item \textbf{{Calcular o Logit (L):}} O Logit é a soma ponderada de todas as características do cliente (já processadas pelo pré-processador do modelo) multiplicadas por seus respectivos coeficientes, mais o intercepto do modelo. Para o cliente simulado, o modelo calculou um Logit de:')
             latex_story.append(Math(data=[NoEscape(fr'L = {logit_sample_formatted}')]))
             markdown_story.append(f"2.  **Calcular a Probabilidade de Churn (P) usando a função Sigmoide:** A probabilidade é obtida aplicando-se a função sigmoide ao valor de `L`:\n`P(Churn) = 1 / (1 + e^(-L))`\n`P(Churn) = 1 / (1 + e^(-({logit_sample_formatted})))`\n`P(Churn) = 1 / (1 + e^{{-{logit_sample_formatted}}})`\n`P(Churn) ≈ {prob_sample_formatted}`\n")
             # LaTeX for Probability calculation
-            latex_story.append(r'\item \textbf{Calcular a Probabilidade de Churn (P) usando a função Sigmoide:} A probabilidade é obtida aplicando-se a função sigmoide ao valor de $L$:')
             latex_story.append(Math(data=[NoEscape(r'P(\text{Churn}) = \frac{1}{1 + e^{-L}}')]))
-            # LINHA 403 CORRIGIDA: Removido os parênteses extras do expoente.
-            latex_story.append(Math(data=[NoEscape(fr'P(\text{Churn}) = \frac{{1}}{{1 + e^{{-{logit_sample_formatted}}}}}')]))
-            # LINHA 405 CORRIGIDA: Idem.
-            latex_story.append(Math(data=[NoEscape(fr'P(\text{Churn}) = \frac{{1}}{{1 + e^{{-{logit_sample_formatted}}}}}')]))
             latex_story.append(Math(data=[NoEscape(fr'P(\text{Churn}) \approx {prob_sample_formatted}')]))
-            latex_story.append(r'\end{enumerate}\n')
             markdown_story.append(f"**Resultado da Simulação para o Cliente 'Simulado':**\n")
             markdown_story.append(f"A probabilidade de Churn para este cliente específico é de **{prob_sample_formatted}**, ou seja, **{prob_sample_percent_formatted}**.\n")
             markdown_story.append(f"Este resultado indica que o cliente possui uma probabilidade de churn de {prob_sample_percent_formatted}, guiando a interpretação do risco.\n")
-            latex_story.append(r'\textbf{Resultado da Simulação para o Cliente "Simulado":}\n')
-            latex_story.append(fr'A probabilidade de Churn para este cliente específico é de \textbf{{{prob_sample_formatted}}}, ou seja, \textbf{{{prob_sample_percent_formatted}}}. ')
-            latex_story.append(fr'Este resultado indica que o cliente possui uma probabilidade de churn de {prob_sample_percent_formatted}, guiando a interpretação do risco.\n\n')
         else:
             markdown_story.append("Não foi possível gerar o exemplo de simulação numérica, pois nenhum cliente simulado foi fornecido.\n")
-            latex_story.append(r'Não foi possível gerar o exemplo de simulação numérica, pois nenhum cliente simulado foi fornecido.\n\n')
         # --- Fim da Subseção de Exemplo ---
@@ -419,64 +417,48 @@ class ChurnModelPipeline:
         latex_story.append(Section(NoEscape(r'Importância das Variáveis (Coeficientes e Odds Ratio)'), False))
         markdown_story.append("A análise dos coeficientes do modelo de Regressão Logística, transformados em Odds Ratios, nos permite entender a influência de cada característica na probabilidade de Churn. Um Odds Ratio maior que 1 indica que o aumento daquela feature (ou pertencer àquela categoria) aumenta as chances de Churn, enquanto um valor menor que 1 diminui.\n")
-        latex_story.append(r'A análise dos coeficientes do modelo de Regressão Logística, transformados em Odds Ratios, nos permite entender a influência de cada característica na probabilidade de Churn. Um Odds Ratio maior que 1 indica que o aumento daquela feature (ou pertencer àquela categoria) aumenta as chances de Churn, enquanto um valor menor que 1 diminui.\n\n')
         if not self.coefficients_df.empty:
             markdown_story.append(self.coefficients_df.to_markdown(index=False) + "\n")
             latex_story.append(NoEscape(self.coefficients_df.to_latex(index=False, caption='Coeficientes e Odds Ratios das Variáveis', label='tab:coefficients', longtable=False)))
-            markdown_story.append("### **Interpretação Estratégica:**\n- **Odds Ratio > 1:** Features como `Age`, `NumOfProducts`, `Balance`, ou certas categorias de `Geography` ou `Gender` (dependendo dos valores) que possuem um Odds Ratio alto, indicam que o cliente tem **maior chance de churn** à medida que essas características aumentam ou são verdadeiras. O banco pode focar em clientes com essas características para ações proativas de retenção.\n- **Odds Ratio < 1:** Features como `IsActiveMember` (se for 1 para ativo) ou `CreditScore` (se um score mais alto diminuir o churn) que possuem Odds Ratio baixo, indicam que a característica está associada a uma **menor chance de churn**.\n")
-            latex_story.append(r'\textbf{Interpretação Estratégica:}\n\n')
-            latex_story.append(r'\begin{itemize}' + '\n')
-            latex_story.append(r'\item \textbf{Odds Ratio > 1:} Features como \texttt{Age}, \texttt{NumOfProducts}, \texttt{Balance}, ou certas categorias de \texttt{Geography} ou \texttt{Gender} (dependendo dos valores) que possuem um Odds Ratio alto, indicam que o cliente tem \textbf{maior chance de churn} à medida que essas características aumentam ou são verdadeiras. O banco pode focar em clientes com essas características para ações proativas de retenção.' + '\n')
-            latex_story.append(r'\item \textbf{Odds Ratio < 1:} Features como \texttt{IsActiveMember} (se for 1 para ativo) ou \texttt{CreditScore} (se um score mais alto diminuir o churn) que possuem Odds Ratio baixo, indicam que a característica está associada a uma \textbf{menor chance de churn}.' + '\n')
-            latex_story.append(r'\end{itemize}' + '\n\n')
-        else:
-            markdown_story.append("Nenhum coeficiente disponível. O modelo pode não ter sido treinado ou não possui coeficientes acessíveis.\n")
-            latex_story.append(r'Nenhum coeficiente disponível. O modelo pode não ter sido treinado ou não possui coeficientes acessíveis.\n\n')
-        # --- 6. Avaliação de Desempenho do Modelo (Conjunto de Teste) ---
-        markdown_story.append("## 6. Avaliação de Desempenho do Modelo (Conjunto de Teste)")
-        latex_story.append(Section(NoEscape(r'Avaliação de Desempenho do Modelo (Conjunto de Teste)'), False))
-        markdown_story.append("O desempenho do modelo foi avaliado em um conjunto de dados de teste (20% dos dados originais) para garantir sua capacidade de generalização em dados não vistos. As métricas são as seguintes:\n")
-        latex_story.append(r'O desempenho do modelo foi avaliado em um conjunto de dados de teste (20\% dos dados originais) para garantir sua capacidade de generalização em dados não vistos. As métricas são as seguintes:\n\n')
-        if self.metrics_dict:
-            metrics_table = pd.DataFrame(self.metrics_dict.items(), columns=['Métrica', 'Valor'])
-            markdown_story.append(metrics_table.to_markdown(index=False) + "\n")
-            latex_story.append(NoEscape(metrics_table.to_latex(index=False, caption='Métricas de Avaliação do Modelo', label='tab:metrics', longtable=False)))
-            markdown_story.append("### **Interpretação das Métricas:**\n")
-            latex_story.append(r'\textbf{Interpretação das Métricas:}\n\n')
-            latex_story.append(r'\begin{itemize}' + '\n')
-            markdown_story.append(f"- **Acurácia ({self.metrics_dict.get('Acurácia', 0):.2%}):** Proporção de previsões corretas (tanto churn quanto não-churn) em relação ao total. Indica a precisão geral do modelo. Um valor de {self.metrics_dict.get('Acurácia', 0):.2%} significa que o modelo acertou essa porcentagem das vezes no conjunto de teste.\n")
-            latex_story.append(fr'\item \textbf{{Acurácia ({self.metrics_dict.get("Acurácia", 0):.2f}\%)}}: Proporção de previsões corretas (tanto churn quanto não-churn) em relação ao total. Indica a precisão geral do modelo. Um valor de {self.metrics_dict.get("Acurácia", 0):.2f}\% significa que o modelo acertou essa porcentagem das vezes no conjunto de teste.' + '\n')
-            markdown_story.append(f"- **AUC ROC ({self.metrics_dict.get('AUC ROC', 0):.4f}):** A Área sob a Curva Característica de Operação do Receptor mede a capacidade do modelo de distinguir entre as classes. Um valor de 0.5 indica desempenho aleatório, enquanto 1.0 indica um classificador perfeito. Seu modelo obteve um AUC de \textbf{{{self.metrics_dict.get("AUC ROC", 0):.4f}}}.\n")
-            latex_story.append(fr'\item \textbf{{AUC ROC ({self.metrics_dict.get("AUC ROC", 0):.4f})}}: A Área sob a Curva Característica de Operação do Receptor mede a capacidade do modelo de distinguir entre as classes. Um valor de 0.5 indica desempenho aleatório, enquanto 1.0 indica um classificador perfeito. Seu modelo obteve um AUC de \textbf{{{self.metrics_dict.get("AUC ROC", 0):.4f}}}.' + '\n')
-            markdown_story.append(f"- **Precisão ({self.metrics_dict.get('Precisão', 0):.2%}):** Das previsões de churn (`1`), quantos realmente foram churn. É importante para o banco não abordar clientes que não iriam dar churn (reduzir falsos positivos). Um valor de {self.metrics_dict.get('Precisão', 0):.2%} significa que das vezes que o modelo previu churn, essa porcentagem estava correta.\n")
-            latex_story.append(fr'\item \textbf{{Precisão ({self.metrics_dict.get("Precisão", 0):.2f}\%)}}: Das previsões de churn (\texttt{1}), quantos realmente foram churn. É importante para o banco não abordar clientes que não iriam dar churn (reduzir falsos positivos). Um valor de {self.metrics_dict.get("Precisão", 0):.2f}\% significa que das vezes que o modelo previu churn, essa porcentagem estava correta.' + '\n')
-            markdown_story.append(f"- **Recall (Sensibilidade) ({self.metrics_dict.get('Recall (Sensibilidade)', 0):.2%}):** Dos clientes que realmente deram churn (`1`), quantos o modelo identificou. É crucial para o banco identificar o máximo de clientes em risco (reduzir falsos negativos). Um valor de {self.metrics_dict.get('Recall (Sensibilidade)', 0):.2%} significa que essa porcentagem de clientes que de fato deram churn foi corretamente identificada pelo modelo.\n")
-            latex_story.append(fr'\item \textbf{{Recall (Sensibilidade) ({self.metrics_dict.get("Recall (Sensibilidade)", 0):.2f}\%)}}: Dos clientes que realmente deram churn (\texttt{1}), quantos o modelo identificou. É crucial para o banco identificar o máximo de clientes em risco (reduzir falsos negativos). Um valor de {self.metrics_dict.get("Recall (Sensibilidade)", 0):.2f}\% significa que essa porcentagem de clientes que de fato deram churn foi corretamente identificada pelo modelo.' + '\n'))
             markdown_story.append(f"- **F1-Score ({self.metrics_dict.get('F1-Score', 0):.4f}):** É a média harmônica entre Precisão e Recall, útil quando há um desequilíbrio de classes e você precisa de um balanço entre identificar corretamente e não levantar falsos alarmes.\n")
-            latex_story.append(fr'\item \textbf{{F1-Score ({self.metrics_dict.get("F1-Score", 0):.4f})}}: É a média harmônica entre Precisão e Recall, útil quando há um desequilíbrio de classes e você precisa de um balanço entre identificar corretamente e não levantar falsos alarmes.' + '\n'))
-            latex_story.append(r'\end{itemize}' + '\n\n')
         else:
-            markdown_story.append("Nenhuma métrica de avaliação disponível. O modelo pode não ter sido treinado ou avaliado.\n")
-            latex_story.append(r'Nenhum dado de avaliação disponível. O modelo pode não ter sido treinado ou avaliado.\n\n')
         # --- 7. Conclusão e Próximos Passos ---
         markdown_story.append("## 7. Conclusão e Próximos Passos")
         latex_story.append(Section(NoEscape(r'Conclusão e Próximos Passos'), False))
         markdown_story.append("O modelo de Regressão Logística provê uma base sólida para a previsão de churn. As variáveis identificadas como mais influentes (pelos Odds Ratios) devem ser o foco para o planejamento estratégico de retenção. Por exemplo, campanhas de marketing direcionadas a grupos de maior risco ou ofertas personalizadas podem ser desenvolvidas com base nas características que aumentam a probabilidade de churn.\nPara aprimoramento contínuo, sugere-se a exploração de outros modelos, engenharia de novas features, e reavaliação periódica do modelo com dados mais recentes.")
-        latex_story.append(r'O modelo de Regressão Logística provê uma base sólida para a previsão de churn. As variáveis identificadas como mais influentes (pelos Odds Ratios) devem ser o foco para o planejamento estratégico de retenção. Por exemplo, campanhas de marketing direcionadas a grupos de maior risco ou ofertas personalizadas podem ser desenvolvidas com base nas características que aumentam a probabilidade de churn.\n\nPara aprimoramento contínuo, sugere-se a exploração de outros modelos, engenharia de novas features, e reavaliação periódica do modelo com dados mais recentes.')
         return "\n".join(markdown_story), latex_story, self.plot_paths
@@ -518,7 +500,7 @@ class ChurnModelPipeline:
                 shutil.copy2(logo_filename, logo_target_path) # Copia o logo para o diretório temporário do LaTeX
                 with doc.create(Figure(position='h!')) as logo_fig:
                     # Referencia pelo nome do arquivo, pois está no mesmo diretório do .tex
-                    logo_fig.add_image(os.path.basename(logo_target_path), width='0.25\textwidth')
                     logo_fig.add_caption(NoEscape(r'\vspace{-0.5cm}'))
             else:
                 doc.append(Command('textbf', 'AVISO: Logo da UnB não encontrado! Certifique-se de que "MARCADOR.png" esteja na raiz do seu Hugging Face Space.'))

             latex_story.append(NoEscape(sample_display_df.to_latex(index=False, caption='Características do Cliente Simulado', label='tab:sim_customer', longtable=False)))
             markdown_story.append(f"**Resultado da Simulação:** O cliente **{churn_status_sample}** (Probabilidade de Churn: **{prob_sample:.2%}**)\n")
+            latex_story.append(NoEscape(fr'\textbf{{Resultado da Simulação:}} O cliente \textbf{{{churn_status_sample}}} (Probabilidade de Churn: \textbf{{{prob_sample:.2f}\%}})\n\n'))
         else:
             markdown_story.append("Não foi possível realizar uma simulação pois o DataFrame de teste ou dados interativos não estão disponíveis.\n")
+            latex_story.append(NoEscape(r'Não foi possível realizar uma simulação pois o DataFrame de teste ou dados interativos não estão disponíveis.\n\n'))
         # --- 2. Detalhes do Processo de Treinamento ---
         markdown_story.append("## 2. Detalhes do Processo de Treinamento")
             latex_story.append(NoEscape(training_details_latex))
         else:
             markdown_story.append("Nenhum detalhe de treinamento disponível.\n")
+            latex_story.append(NoEscape(r'Nenhum detalhe de treinamento disponível.\n\n'))
         # --- 3. Descrição do Modelo e Metodologia ---
         latex_story.append(Section(NoEscape(r'Descrição do Modelo e Metodologia'), False))
         markdown_story.append("O modelo utiliza **Regressão Logística** para classificar a probabilidade de um cliente sair (churn). Foram aplicadas as seguintes etapas para garantir robustez e tratar as características dos dados:\n")
+        latex_story.append(NoEscape(r'O modelo utiliza \textbf{Regressão Logística} para classificar a probabilidade de um cliente sair (churn). Foram aplicadas as seguintes etapas para garantir robustez e tratar as características dos dados:\n\n'))
         markdown_story.append("- **Pré-processamento de Dados:**\n    - **Features Numéricas:** Imputação de valores ausentes (mediana) e escalonamento (`StandardScaler`) para padronização.\n    - **Features Categóricas:** Imputação de valores ausentes (moda) e codificação One-Hot (`OneHotEncoder`) para transformar categorias em formato numérico.\n")
+        latex_story.append(NoEscape(r'\begin{itemize}' + '\n'))
+        latex_story.append(NoEscape(r'\item \textbf{Pré-processamento de Dados:}' + '\n'))
+        latex_story.append(NoEscape(r'\begin{itemize}' + '\n'))
+        latex_story.append(NoEscape(r'\item \textbf{Features Numéricas:} Imputação de valores ausentes (mediana) e escalonamento (\texttt{StandardScaler}) para padronização.' + '\n'))
+        latex_story.append(NoEscape(r'\item \textbf{Features Categóricas:} Imputação de valores ausentes (moda) e codificação One-Hot (\texttt{OneHotEncoder}) para transformar categorias em formato numérico.' + '\n'))
+        latex_story.append(NoEscape(r'\end{itemize}' + '\n'))
         markdown_story.append("- **Balanceamento de Classes (SMOTE):** O conjunto de dados original apresentava desbalanceamento significativo na variável alvo (`Exited`). O algoritmo SMOTE (Synthetic Minority Over-sampling Technique) foi aplicado para gerar amostras sintéticas da classe minoritária (clientes que saem), garantindo que o modelo não seja viesado para a classe majoritária (clientes que permanecem).\n")
+        latex_story.append(NoEscape(r'\item \textbf{Balanceamento de Classes (SMOTE):} O conjunto de dados original apresentava desbalanceamento significativo na variável alvo (\texttt{Exited}). O algoritmo SMOTE (Synthetic Minority Over-sampling Technique) foi aplicado para gerar amostras sintéticas da classe minoritária (clientes que saem), garantindo que o modelo não seja viesado para a classe majoritária (clientes que permanecem).' + '\n'))
         markdown_story.append("- **Regularização (L2):** A Regressão Logística foi configurada com um parâmetro `C=0.1` (inverso da força de regularização), que aplica regularização L2. Isso ajuda a prevenir o overfitting, penalizando coeficientes grandes e promovendo um modelo mais generalizável.\n")
+        latex_story.append(NoEscape(r'\item \textbf{Regularização (L2):} A Regressão Logística foi configurada com um parâmetro \texttt{C=0.1} (inverso da força de regularização), que aplica regularização L2. Isso ajuda a prevenir o overfitting, penalizando coeficientes grandes e promovendo um modelo mais generalizável.' + '\n'))
+        latex_story.append(NoEscape(r'\end{itemize}' + '\n\n'))
         # --- 4. Como a Probabilidade de Churn é Calculada ---
         latex_story.append(Section(NoEscape(r'Como a Probabilidade de Churn é Calculada'), False))
         markdown_story.append("A Regressão Logística é um modelo de classificação que estima a probabilidade de um evento (neste caso, o churn do cliente) ocorrer. Ao contrário da regressão linear, que prevê um valor contínuo, a regressão logística utiliza a **função sigmoide** para mapear qualquer valor real para um valor entre 0 e 1, que pode ser interpretado como probabilidade.\n")
+        latex_story.append(NoEscape(r'A Regressão Logística é um modelo de classificação que estima a probabilidade de um evento (neste caso, o churn do cliente) ocorrer. Ao contrário da regressão linear, que prevê um valor contínuo, a regressão logística utiliza a \textbf{função sigmoide} para mapear qualquer valor real para um valor entre 0 e 1, que pode ser interpretado como probabilidade.\n\n'))
         markdown_story.append("A equação básica de um modelo linear (`L`) é:\n`L = β₀ + β₁X₁ + β₂X₂ + ... + βₙXₙ`\nOnde `β` são os coeficientes (pesos) das features (`X`).\n")
         latex_story.append(Math(data=[NoEscape(r'L = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \dots + \beta_n X_n')]))
+        latex_story.append(NoEscape(r'\nOnde $\beta$ são os coeficientes (pesos) das features ($X$).\n\n'))
         markdown_story.append("A probabilidade (`P`) de churn é então calculada aplicando-se a função sigmoide (σ) a `L`:\n`P(Churn) = σ(L) = 1 / (1 + e⁻ᴸ)`\n")
         latex_story.append(Math(data=[NoEscape(r'P(\text{Churn}) = \sigma(L) = \frac{1}{1 + e^{-L}}')]))
         markdown_story.append("Esta função garante que a saída esteja sempre entre 0 e 1, representando a probabilidade de o cliente pertencer à classe 'Churn' (ou seja, `Exited = 1`). Se `P(Churn)` for maior que um determinado limiar (geralmente 0.5), o cliente é classificado como provável churn.\n")
+        latex_story.append(NoEscape(r'\nEsta função garante que a saída esteja sempre entre 0 e 1, representando a probabilidade de o cliente pertencer à classe `Churn` (ou seja, \texttt{Exited = 1}). Se $P(\text{Churn})$ for maior que um determinado limiar (geralmente 0.5), o cliente é classificado como provável churn.\n\n'))
         # --- Subseção: Exemplo de Simulação Numérica (AGORA COM DADOS REAIS DA SIMULAÇÃO) ---
         markdown_story.append("### Exemplo de Simulação Numérica com Cliente Simulado")
         if sample_customer_df is not None:
             # Reutilizamos os valores de logit_sample e prob_sample calculados anteriormente para o cliente simulado
             markdown_story.append("Para ilustrar o cálculo, vamos usar as características do cliente simulado acima (ou o último cliente da Previsão Interativa) e os coeficientes do modelo treinado. Note que as características numéricas são **escalonadas** e as categóricas **one-hot encoded** antes de serem multiplicadas pelos coeficientes. \n")
+            latex_story.append(NoEscape(r'Para ilustrar o cálculo, vamos usar as características do cliente simulado acima (ou o último cliente da Previsão Interativa) e os coeficientes do modelo treinado. Note que as características numéricas são \textbf{escalonadas} e as categóricas \textbf{one-hot encoded} antes de serem multiplicadas pelos coeficientes. \n\n'))
             markdown_story.append(f"**Características do Cliente 'Simulado':**\n" + sample_display_df.to_markdown(index=False) + "\n")
             latex_story.append(NoEscape(sample_display_df.to_latex(index=False, caption='Características do Cliente Simulado', label='tab:sim_customer_example', longtable=False)))
             markdown_story.append(f"1.  **Calcular o Logit (L):** O Logit é a soma ponderada de todas as características do cliente (já processadas pelo pré-processador do modelo) multiplicadas por seus respectivos coeficientes, mais o intercepto do modelo. Para o cliente simulado, o modelo calculou um Logit de:\n`L = {logit_sample_formatted}`\n")
             # LaTeX for Logit calculation
+            latex_story.append(NoEscape(r'\textbf{Passos do Cálculo para o Cliente "Simulado":}\n'))
+            latex_story.append(NoEscape(r'\begin{enumerate}'))
+            latex_story.append(NoEscape(fr'\item \textbf{{Calcular o Logit (L):}} O Logit é a soma ponderada de todas as características do cliente (já processadas pelo pré-processador do modelo) multiplicadas por seus respectivos coeficientes, mais o intercepto do modelo. Para o cliente simulado, o modelo calculou um Logit de:'))
             latex_story.append(Math(data=[NoEscape(fr'L = {logit_sample_formatted}')]))
             markdown_story.append(f"2.  **Calcular a Probabilidade de Churn (P) usando a função Sigmoide:** A probabilidade é obtida aplicando-se a função sigmoide ao valor de `L`:\n`P(Churn) = 1 / (1 + e^(-L))`\n`P(Churn) = 1 / (1 + e^(-({logit_sample_formatted})))`\n`P(Churn) = 1 / (1 + e^{{-{logit_sample_formatted}}})`\n`P(Churn) ≈ {prob_sample_formatted}`\n")
             # LaTeX for Probability calculation
+            latex_story.append(NoEscape(r'\item \textbf{Calcular a Probabilidade de Churn (P) usando a função Sigmoide:} A probabilidade é obtida aplicando-se a função sigmoide ao valor de $L$:'))
             latex_story.append(Math(data=[NoEscape(r'P(\text{Churn}) = \frac{1}{1 + e^{-L}}')]))
+            latex_story.append(Math(data=[NoEscape(fr'P(\text{Churn}) = \frac{{1}}{{1 + e^{{-({logit_sample_formatted})}}}}')]))
+            latex_story.append(Math(data=[NoEscape(fr'P(\text{Churn}) = \frac{{1}}{{1 + e^{{-{logit_sample_formatted}}}}}}')]))
             latex_story.append(Math(data=[NoEscape(fr'P(\text{Churn}) \approx {prob_sample_formatted}')]))
+            latex_story.append(NoEscape(r'\end{enumerate}\n'))
             markdown_story.append(f"**Resultado da Simulação para o Cliente 'Simulado':**\n")
             markdown_story.append(f"A probabilidade de Churn para este cliente específico é de **{prob_sample_formatted}**, ou seja, **{prob_sample_percent_formatted}**.\n")
             markdown_story.append(f"Este resultado indica que o cliente possui uma probabilidade de churn de {prob_sample_percent_formatted}, guiando a interpretação do risco.\n")
+            latex_story.append(NoEscape(r'\textbf{Resultado da Simulação para o Cliente "Simulado":}\n'))
+            latex_story.append(NoEscape(fr'A probabilidade de Churn para este cliente específico é de \textbf{{{prob_sample_formatted}}}, ou seja, \textbf{{{prob_sample_percent_formatted}}}. '))
+            latex_story.append(NoEscape(fr'Este resultado indica que o cliente possui uma probabilidade de churn de {prob_sample_percent_formatted}, guiando a interpretação do risco.\n\n'))
         else:
             markdown_story.append("Não foi possível gerar o exemplo de simulação numérica, pois nenhum cliente simulado foi fornecido.\n")
+            latex_story.append(NoEscape(r'Não foi possível gerar o exemplo de simulação numérica, pois nenhum cliente simulado foi fornecido.\n\n'))
         # --- Fim da Subseção de Exemplo ---
         latex_story.append(Section(NoEscape(r'Importância das Variáveis (Coeficientes e Odds Ratio)'), False))
         markdown_story.append("A análise dos coeficientes do modelo de Regressão Logística, transformados em Odds Ratios, nos permite entender a influência de cada característica na probabilidade de Churn. Um Odds Ratio maior que 1 indica que o aumento daquela feature (ou pertencer àquela categoria) aumenta as chances de Churn, enquanto um valor menor que 1 diminui.\n")
+        latex_story.append(NoEscape(r'A análise dos coeficientes do modelo de Regressão Logística, transformados em Odds Ratios, nos permite entender a influência de cada característica na probabilidade de Churn. Um Odds Ratio maior que 1 indica que o aumento daquela feature (ou pertencer àquela categoria) aumenta as chances de Churn, enquanto um valor menor que 1 diminui.\n\n'))
         if not self.coefficients_df.empty:
             markdown_story.append(self.coefficients_df.to_markdown(index=False) + "\n")
             latex_story.append(NoEscape(self.coefficients_df.to_latex(index=False, caption='Coeficientes e Odds Ratios das Variáveis', label='tab:coefficients', longtable=False)))
+            # Início das correções para `SyntaxError: f-string: single '}' is not allowed`
+            # Linha original de Precisão (equivalente a ~458)
+            precision_value = self.metrics_dict.get('Precisão', 0)
+            precision_text_latex = (
+                f'\item \textbf{{Precisão ({precision_value:.2f}\%):}} ' # Usando f-string para formatar valor e \%
+                + r'Das previsões de churn (\texttt{1}), quantos realmente foram churn. '
+                r'É importante para o banco não abordar clientes que não iriam dar churn (reduzir falsos positivos). '
+                f'Um valor de {precision_value:.2f}\% significa que das vezes que o modelo previu churn, essa porcentagem estava correta.'
+            )
+            latex_story.append(NoEscape(precision_text_latex + '\n'))
+            # Linha original de Recall (equivalente a ~464)
+            recall_value = self.metrics_dict.get('Recall (Sensibilidade)', 0)
+            recall_text_latex = (
+                f'\item \textbf{{Recall (Sensibilidade) ({recall_value:.2f}\%):}} ' # Usando f-string para formatar valor e \%
+                + r'Dos clientes que realmente deram churn (\texttt{1}), quantos o modelo identificou. '
+                r'É crucial para o banco identificar o máximo de clientes em risco (reduzir falsos negativos). '
+                f'Um valor de {recall_value:.2f}\% significa que essa porcentagem de clientes que de fato deram churn foi corretamente identificada pelo modelo.'
+            )
+            latex_story.append(NoEscape(recall_text_latex + '\n'))
+            # Fim das correções
             markdown_story.append(f"- **F1-Score ({self.metrics_dict.get('F1-Score', 0):.4f}):** É a média harmônica entre Precisão e Recall, útil quando há um desequilíbrio de classes e você precisa de um balanço entre identificar corretamente e não levantar falsos alarmes.\n")
+            latex_story.append(NoEscape(fr'\item \textbf{{F1-Score ({self.metrics_dict.get("F1-Score", 0):.4f})}}: É a média harmônica entre Precisão e Recall, útil quando há um desequilíbrio de classes e você precisa de um balanço entre identificar corretamente e não levantar falsos alarmes.' + '\n'))
+            latex_story.append(NoEscape(r'\end{itemize}' + '\n\n'))
         else:
+            markdown_story.append("Nenhum coeficiente disponível. O modelo pode não ter sido treinado ou não possui coeficientes acessíveis.\n")
+            latex_story.append(NoEscape(r'Nenhum dado de avaliação disponível. O modelo pode não ter sido treinado ou avaliado.\n\n'))
         # --- 7. Conclusão e Próximos Passos ---
         markdown_story.append("## 7. Conclusão e Próximos Passos")
         latex_story.append(Section(NoEscape(r'Conclusão e Próximos Passos'), False))
         markdown_story.append("O modelo de Regressão Logística provê uma base sólida para a previsão de churn. As variáveis identificadas como mais influentes (pelos Odds Ratios) devem ser o foco para o planejamento estratégico de retenção. Por exemplo, campanhas de marketing direcionadas a grupos de maior risco ou ofertas personalizadas podem ser desenvolvidas com base nas características que aumentam a probabilidade de churn.\nPara aprimoramento contínuo, sugere-se a exploração de outros modelos, engenharia de novas features, e reavaliação periódica do modelo com dados mais recentes.")
+        latex_story.append(NoEscape(r'O modelo de Regressão Logística provê uma base sólida para a previsão de churn. As variáveis identificadas como mais influentes ( pelos Odds Ratios) devem ser o foco para o planejamento estratégico de retenção. Por exemplo, campanhas de marketing direcionadas a grupos de maior risco ou ofertas personalizadas podem ser desenvolvidas com base nas características que aumentam a probabilidade de churn.\n\nPara aprimoramento contínuo, sugere-se a exploração de outros modelos, engenharia de novas features, e reavaliação periódica do modelo com dados mais recentes.'))
         return "\n".join(markdown_story), latex_story, self.plot_paths
                 shutil.copy2(logo_filename, logo_target_path) # Copia o logo para o diretório temporário do LaTeX
                 with doc.create(Figure(position='h!')) as logo_fig:
                     # Referencia pelo nome do arquivo, pois está no mesmo diretório do .tex
+                    logo_fig.add_image(os.path.basename(logo_target_path), width='0.25\\textwidth')
                     logo_fig.add_caption(NoEscape(r'\vspace{-0.5cm}'))
             else:
                 doc.append(Command('textbf', 'AVISO: Logo da UnB não encontrado! Certifique-se de que "MARCADOR.png" esteja na raiz do seu Hugging Face Space.'))