Spaces:

emanoelopes
/

clareia

Running

App Files Files

emanoelopes commited on Oct 19, 2025

Commit

e0a53d2

1 Parent(s): 706d01e

Update UCI and OULAD metrics calculations to be dynamic, enhancing the educational dashboard with real-time data insights. Refactor visualizations to reflect actual dataset values, improving user experience and accuracy in performance metrics. Add error handling for data loading processes.

Browse files

Files changed (5) hide show

uci.pkl +2 -2
webapp/home_1.py +39 -17
webapp/home_old_1.py +0 -0
webapp/src/utilidades.py +293 -58
webapp/src/vizualizacoes.py +229 -146

uci.pkl CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d1a10bb28929402a6f7f24f23f2ed2ccdf8031345a43410c2a021b8460662507
-size 3177017

 version https://git-lfs.github.com/spec/v1
+oid sha256:ff57645cb7ed1d00c72be46f40dd51cd4f7beeef976675b7aa2254cf1d6e3b61
+size 3176814

webapp/home_1.py CHANGED Viewed

@@ -109,15 +109,25 @@ with tab3:
         st.pyplot(fig_comparativo)
         plt.clf()
-    # Resumo comparativo
     st.markdown("### 📈 Resumo Comparativo")
-    st.markdown("""
     **Principais Diferenças:**
     - **Modalidade**: UCI (presencial) vs OULAD (online)
-    - **Taxa de Aprovação**: OULAD (78.5%) supera UCI (67.3%)
-    - **Demografia**: UCI tem mais mulheres (58.2%), OULAD tem mais homens (56.2%)
-    - **Faixa Etária**: UCI (15-19 anos) vs OULAD (35-55 anos)
-    - **Engajamento**: OULAD permite medir cliques e atividades online
     """)
 with tab4:
@@ -166,31 +176,43 @@ col1, col2 = st.columns(2)
 with col1:
     st.markdown("### 📚 Para Escolas Públicas (UCI)")
-    st.markdown("""
     **Pontos de Atenção:**
-    - Focar em redução de faltas (correlação negativa com desempenho)
-    - Incentivar tempo de estudo adequado (5-10h/semana)
-    - Apoiar estudantes com baixo consumo de álcool
     - Considerar influência da escolaridade dos pais
     **Recomendações:**
     - Programas de acompanhamento para estudantes com muitas faltas
     - Workshops sobre gestão de tempo de estudo
     - Envolvimento das famílias no processo educacional
     """)
 with col2:
     st.markdown("### 🌐 Para Plataformas Online (OULAD)")
-    st.markdown("""
     **Pontos Fortes:**
-    - Alta taxa de aprovação (78.5%)
-    - Boa distribuição de atividades
-    - Engajamento moderado mas efetivo
     **Recomendações:**
-    - Aumentar atividades do tipo 'outcontent' e 'forumng'
-    - Focar em estudantes da faixa 35-55 anos
-    - Desenvolver estratégias para reduzir taxa de reprovação (13.3%)
     """)
 # Footer

         st.pyplot(fig_comparativo)
         plt.clf()
+    # Resumo comparativo dinâmico
     st.markdown("### 📈 Resumo Comparativo")
+    # Carregar métricas para comparação dinâmica
+    metricas_uci = obter_metricas_principais_uci()
+    metricas_oulad = obter_metricas_principais_oulad()
+    # Determinar gênero predominante
+    uci_genero_maioria = max(metricas_uci['distribuicao_genero'], key=metricas_uci['distribuicao_genero'].get) if metricas_uci['distribuicao_genero'] else 'N/A'
+    oulad_genero_maioria = max(metricas_oulad['distribuicao_genero'], key=metricas_oulad['distribuicao_genero'].get) if metricas_oulad['distribuicao_genero'] else 'N/A'
+    st.markdown(f"""
     **Principais Diferenças:**
     - **Modalidade**: UCI (presencial) vs OULAD (online)
+    - **Taxa de Aprovação**: OULAD ({metricas_oulad['taxa_aprovacao']:.1f}%) vs UCI ({metricas_uci['taxa_aprovacao']:.1f}%)
+    - **Total de Estudantes**: UCI ({metricas_uci['total_estudantes']:,}) vs OULAD ({metricas_oulad['total_estudantes']:,})
+    - **Demografia**: UCI tem mais {uci_genero_maioria} ({metricas_uci['distribuicao_genero'].get(uci_genero_maioria, 0):.1f}%), OULAD tem mais {oulad_genero_maioria} ({metricas_oulad['distribuicao_genero'].get(oulad_genero_maioria, 0):.1f}%)
+    - **Faixa Etária**: UCI (15-19 anos) vs OULAD ({metricas_oulad['faixa_etaria_principal']})
+    - **Engajamento**: OULAD permite medir cliques ({metricas_oulad['media_cliques']:.1f} cliques/estudante) e atividades online
     """)
 with tab4:
 with col1:
     st.markdown("### 📚 Para Escolas Públicas (UCI)")
+    # Carregar métricas UCI para insights dinâmicos
+    metricas_uci = obter_metricas_principais_uci()
+    st.markdown(f"""
     **Pontos de Atenção:**
+    - Focar em redução de faltas (média atual: {metricas_uci['media_faltas']:.1f} faltas/estudante)
+    - Incentivar tempo de estudo adequado (média atual: {metricas_uci['media_tempo_estudo']:.1f}h/semana)
+    - Apoiar estudantes com baixo consumo de álcool ({metricas_uci['estudantes_alcool_baixo']:.1f}% têm baixo consumo)
     - Considerar influência da escolaridade dos pais
+    - Taxa de aprovação atual: {metricas_uci['taxa_aprovacao']:.1f}%
     **Recomendações:**
     - Programas de acompanhamento para estudantes com muitas faltas
     - Workshops sobre gestão de tempo de estudo
     - Envolvimento das famílias no processo educacional
+    - Foco em melhorar a taxa de aprovação de {metricas_uci['taxa_aprovacao']:.1f}%
     """)
 with col2:
     st.markdown("### 🌐 Para Plataformas Online (OULAD)")
+    # Carregar métricas OULAD para insights dinâmicos
+    metricas_oulad = obter_metricas_principais_oulad()
+    st.markdown(f"""
     **Pontos Fortes:**
+    - Alta taxa de aprovação ({metricas_oulad['taxa_aprovacao']:.1f}%)
+    - Boa distribuição de atividades (principal: {metricas_oulad['atividade_mais_comum']})
+    - Engajamento moderado mas efetivo ({metricas_oulad['media_cliques']:.1f} cliques/estudante)
+    - {metricas_oulad['estudantes_distincao']:.1f}% dos estudantes obtêm distinção
     **Recomendações:**
+    - Aumentar atividades do tipo '{metricas_oulad['atividade_mais_comum']}'
+    - Focar em estudantes da faixa {metricas_oulad['faixa_etaria_principal']}
+    - Desenvolver estratégias para reduzir taxa de reprovação ({metricas_oulad['estudantes_reprovados']:.1f}%)
+    - Manter foco na região {metricas_oulad['regiao_principal']}
     """)
 # Footer

webapp/home_old_1.py ADDED Viewed

File without changes

webapp/src/utilidades.py CHANGED Viewed

@@ -46,34 +46,169 @@ def carregar_dados_dashboard():
     return df_uci, df_oulad
 def obter_metricas_principais_uci():
-    """Retorna métricas principais do dataset UCI baseadas nas análises"""
-    return {
-        'total_estudantes': 1044,
-        'media_nota_final': 10.42,
-        'taxa_aprovacao': 67.3,
-        'media_faltas': 5.7,
-        'distribuicao_genero': {'F': 58.2, 'M': 41.8},
-        'media_tempo_estudo': 2.0,
-        'correlacao_g1_g3': 0.81,
-        'correlacao_g2_g3': 0.91,
-        'estudantes_alcool_baixo': 45.2,
-        'estudantes_alcool_alto': 12.8
-    }
 def obter_metricas_principais_oulad():
-    """Retorna métricas principais do dataset OULAD baseadas nas análises"""
-    return {
-        'total_estudantes': 28000,
-        'taxa_aprovacao': 78.5,
-        'media_cliques': 4.65,
-        'distribuicao_genero': {'M': 56.2, 'F': 43.8},
-        'faixa_etaria_principal': '35-55 anos',
-        'atividade_mais_comum': 'outcontent',
-        'regiao_principal': 'South West Region',
-        'estudantes_aprovados': 78.5,
-        'estudantes_distincao': 8.2,
-        'estudantes_reprovados': 13.3
-    }
 def calcular_metricas_uci(df_uci):
     """Calcula métricas principais para o dataset UCI"""
@@ -85,7 +220,7 @@ def calcular_metricas_uci(df_uci):
         'media_nota_final': df_uci['G3'].mean() if 'G3' in df_uci.columns else 0,
         'taxa_aprovacao': (df_uci['G3'] >= 10).mean() * 100 if 'G3' in df_uci.columns else 0,
         'media_faltas': df_uci['absences'].mean() if 'absences' in df_uci.columns else 0,
-        'media_tempo_estudo': df_uci['studytime'].mean() if 'studytime' in df_uci.columns else 0,
         'distribuicao_genero': df_uci['sex'].value_counts().to_dict() if 'sex' in df_uci.columns else {},
         'correlacao_notas': df_uci[['G1', 'G2', 'G3']].corr().to_dict() if all(col in df_uci.columns for col in ['G1', 'G2', 'G3']) else {}
     }
@@ -131,19 +266,23 @@ def criar_sidebar_dashboard():
     with st.sidebar:
         st.markdown("### 📊 Dashboard Educacional")
         st.markdown("### 📚 Sobre os Datasets")
-        st.markdown("""
         **📚 UCI Dataset:**
         - Escolas públicas portuguesas
-        - 1,044 estudantes
         - Dados demográficos e acadêmicos
         - Análise de fatores de sucesso
         """)
-        st.markdown("""
         **🌐 OULAD Dataset:**
         - Plataforma de aprendizado online
-        - 28,000 estudantes
         - Dados de engajamento digital
         - Análise de atividades online
         """)
@@ -154,38 +293,62 @@ def criar_sidebar_dashboard():
         # Métricas UCI
         st.metric(
             "���� UCI - Aprovação",
-            "67.3%",
             help="Taxa de aprovação nas escolas públicas"
         )
         st.metric(
             "📊 UCI - Média Notas",
-            "10.4",
             help="Média das notas finais"
         )
         # Métricas OULAD
         st.metric(
             "🌐 OULAD - Aprovação",
-            "78.5%",
             help="Taxa de aprovação na plataforma online"
         )
         st.metric(
             "🖱️ OULAD - Engajamento",
-            "4.65",
             help="Média de cliques por estudante"
         )
         st.markdown("---")
         st.markdown("### 💡 Principais Insights")
-        st.markdown("""
-        - **Correlação forte** entre notas bimestrais e finais
-        - **Gênero influencia** desempenho acadêmico
-        - **Faltas impactam** negativamente o desempenho
-        - **Tempo de estudo** ideal: 5-10h/semana
-        - **Atividades online** mais efetivas: outcontent, forumng
-        """)
         st.markdown("---")
         st.markdown("### ℹ️ Informações")
@@ -302,30 +465,102 @@ def exibir_cartoes_detalhados():
         )
 def obter_insights_uci():
-    """Retorna insights principais do dataset UCI"""
     return {
         'titulo': '📚 Principais Insights - Dataset UCI',
-        'insights': [
-            "🎯 **Correlação Forte**: Notas do 1º e 2º bimestre têm correlação de 0.81 e 0.91 com a nota final",
-            "👥 **Gênero**: Estudantes do sexo feminino representam 58.2% e têm desempenho ligeiramente superior",
-            "🍷 **Consumo de Álcool**: 45.2% dos estudantes têm baixo consumo, com melhor desempenho acadêmico",
-            "📚 **Tempo de Estudo**: Estudantes que estudam 5-10h/semana têm concentração de notas mais altas",
-            "❌ **Faltas**: Estudantes com menos de 10 faltas alcançam notas máximas (10-14 pontos)",
-            "👨‍👩‍👧‍👦 **Família**: Escolaridade dos pais influencia diretamente o desempenho dos filhos"
         ]
     }
 def obter_insights_oulad():
-    """Retorna insights principais do dataset OULAD"""
     return {
         'titulo': '🌐 Principais Insights - Dataset OULAD',
-        'insights': [
-            "👥 **Demografia**: 56.2% são do sexo masculino, com faixa etária predominante de 35-55 anos",
-            "🏆 **Alto Desempenho**: 78.5% de aprovação, com 8.2% obtendo distinção",
-            "🖱️ **Engajamento**: Média de 4.65 cliques por estudante, indicando engajamento moderado",
-            "📚 **Atividades**: 'outcontent' é a atividade mais realizada, seguida por 'forumng'",
-            "🌍 **Região**: South West Region concentra a maior parte dos estudantes",
-            "📊 **Distribuição**: Aprovação supera largamente outras categorias (reprovação: 13.3%)"
         ]
     }

     return df_uci, df_oulad
 def obter_metricas_principais_uci():
+    """Retorna métricas principais do dataset UCI calculadas dinamicamente"""
+    try:
+        df_uci = carregar_dados_uci_cached()
+        if df_uci.empty:
+            return {
+                'total_estudantes': 0,
+                'media_nota_final': 0,
+                'taxa_aprovacao': 0,
+                'media_faltas': 0,
+                'distribuicao_genero': {},
+                'media_tempo_estudo': 0,
+                'correlacao_g1_g3': 0,
+                'correlacao_g2_g3': 0,
+                'estudantes_alcool_baixo': 0,
+                'estudantes_alcool_alto': 0
+            }
+        # Calcular métricas reais
+        total_estudantes = len(df_uci)
+        media_nota_final = df_uci['G3'].mean() if 'G3' in df_uci.columns else 0
+        taxa_aprovacao = (df_uci['G3'] >= 10).mean() * 100 if 'G3' in df_uci.columns else 0
+        media_faltas = df_uci['absences'].mean() if 'absences' in df_uci.columns else 0
+        # Distribuição de gênero
+        if 'sex' in df_uci.columns:
+            dist_genero = df_uci['sex'].value_counts(normalize=True) * 100
+            distribuicao_genero = {k: round(v, 1) for k, v in dist_genero.to_dict().items()}
+        else:
+            distribuicao_genero = {}
+        # Tempo de estudo médio - converter strings para números
+        if 'studytime' in df_uci.columns:
+            # Mapear strings para números para calcular média
+            studytime_map = {'<2h': 1, '2-5h': 2, '5-10h': 3, '>10h': 4}
+            studytime_numeric = df_uci['studytime'].map(studytime_map)
+            media_tempo_estudo = studytime_numeric.mean()
+        else:
+            media_tempo_estudo = 0
+        # Correlações
+        correlacao_g1_g3 = df_uci[['G1', 'G3']].corr().iloc[0, 1] if all(col in df_uci.columns for col in ['G1', 'G3']) else 0
+        correlacao_g2_g3 = df_uci[['G2', 'G3']].corr().iloc[0, 1] if all(col in df_uci.columns for col in ['G2', 'G3']) else 0
+        # Consumo de álcool
+        if 'Dalc' in df_uci.columns:
+            alcool_baixo = (df_uci['Dalc'] <= 2).mean() * 100
+            alcool_alto = (df_uci['Dalc'] >= 4).mean() * 100
+        else:
+            alcool_baixo = 0
+            alcool_alto = 0
+        return {
+            'total_estudantes': total_estudantes,
+            'media_nota_final': round(media_nota_final, 2),
+            'taxa_aprovacao': round(taxa_aprovacao, 1),
+            'media_faltas': round(media_faltas, 1),
+            'distribuicao_genero': distribuicao_genero,
+            'media_tempo_estudo': round(media_tempo_estudo, 1),
+            'correlacao_g1_g3': round(correlacao_g1_g3, 2),
+            'correlacao_g2_g3': round(correlacao_g2_g3, 2),
+            'estudantes_alcool_baixo': round(alcool_baixo, 1),
+            'estudantes_alcool_alto': round(alcool_alto, 1)
+        }
+    except Exception as e:
+        st.warning(f"Erro ao calcular métricas UCI: {e}")
+        return {
+            'total_estudantes': 0,
+            'media_nota_final': 0,
+            'taxa_aprovacao': 0,
+            'media_faltas': 0,
+            'distribuicao_genero': {},
+            'media_tempo_estudo': 0,
+            'correlacao_g1_g3': 0,
+            'correlacao_g2_g3': 0,
+            'estudantes_alcool_baixo': 0,
+            'estudantes_alcool_alto': 0
+        }
 def obter_metricas_principais_oulad():
+    """Retorna métricas principais do dataset OULAD calculadas dinamicamente"""
+    try:
+        df_oulad = carregar_dados_oulad_cached()
+        if df_oulad.empty:
+            return {
+                'total_estudantes': 0,
+                'taxa_aprovacao': 0,
+                'media_cliques': 0,
+                'distribuicao_genero': {},
+                'faixa_etaria_principal': 'N/A',
+                'atividade_mais_comum': 'N/A',
+                'regiao_principal': 'N/A',
+                'estudantes_aprovados': 0,
+                'estudantes_distincao': 0,
+                'estudantes_reprovados': 0
+            }
+        # Calcular métricas reais
+        total_estudantes = len(df_oulad)
+        media_cliques = df_oulad['clicks'].mean() if 'clicks' in df_oulad.columns else 0
+        # Taxa de aprovação
+        if 'final_result' in df_oulad.columns:
+            taxa_aprovacao = (df_oulad['final_result'] == 'Pass').mean() * 100
+            estudantes_aprovados = taxa_aprovacao
+            estudantes_distincao = (df_oulad['final_result'] == 'Distinction').mean() * 100
+            estudantes_reprovados = (df_oulad['final_result'] == 'Fail').mean() * 100
+        else:
+            taxa_aprovacao = 0
+            estudantes_aprovados = 0
+            estudantes_distincao = 0
+            estudantes_reprovados = 0
+        # Distribuição de gênero
+        if 'gender' in df_oulad.columns:
+            dist_genero = df_oulad['gender'].value_counts(normalize=True) * 100
+            distribuicao_genero = {k: round(v, 1) for k, v in dist_genero.to_dict().items()}
+        else:
+            distribuicao_genero = {}
+        # Faixa etária principal
+        if 'age_band' in df_oulad.columns:
+            faixa_etaria_principal = df_oulad['age_band'].mode().iloc[0] if not df_oulad['age_band'].mode().empty else 'N/A'
+        else:
+            faixa_etaria_principal = 'N/A'
+        # Atividade mais comum
+        if 'activity_type' in df_oulad.columns:
+            atividade_mais_comum = df_oulad['activity_type'].mode().iloc[0] if not df_oulad['activity_type'].mode().empty else 'N/A'
+        else:
+            atividade_mais_comum = 'N/A'
+        # Região principal
+        if 'region' in df_oulad.columns:
+            regiao_principal = df_oulad['region'].mode().iloc[0] if not df_oulad['region'].mode().empty else 'N/A'
+        else:
+            regiao_principal = 'N/A'
+        return {
+            'total_estudantes': total_estudantes,
+            'taxa_aprovacao': round(taxa_aprovacao, 1),
+            'media_cliques': round(media_cliques, 2),
+            'distribuicao_genero': distribuicao_genero,
+            'faixa_etaria_principal': faixa_etaria_principal,
+            'atividade_mais_comum': atividade_mais_comum,
+            'regiao_principal': regiao_principal,
+            'estudantes_aprovados': round(estudantes_aprovados, 1),
+            'estudantes_distincao': round(estudantes_distincao, 1),
+            'estudantes_reprovados': round(estudantes_reprovados, 1)
+        }
+    except Exception as e:
+        st.warning(f"Erro ao calcular métricas OULAD: {e}")
+        return {
+            'total_estudantes': 0,
+            'taxa_aprovacao': 0,
+            'media_cliques': 0,
+            'distribuicao_genero': {},
+            'faixa_etaria_principal': 'N/A',
+            'atividade_mais_comum': 'N/A',
+            'regiao_principal': 'N/A',
+            'estudantes_aprovados': 0,
+            'estudantes_distincao': 0,
+            'estudantes_reprovados': 0
+        }
 def calcular_metricas_uci(df_uci):
     """Calcula métricas principais para o dataset UCI"""
         'media_nota_final': df_uci['G3'].mean() if 'G3' in df_uci.columns else 0,
         'taxa_aprovacao': (df_uci['G3'] >= 10).mean() * 100 if 'G3' in df_uci.columns else 0,
         'media_faltas': df_uci['absences'].mean() if 'absences' in df_uci.columns else 0,
+        'media_tempo_estudo': df_uci['studytime'].map({'<2h': 1, '2-5h': 2, '5-10h': 3, '>10h': 4}).mean() if 'studytime' in df_uci.columns else 0,
         'distribuicao_genero': df_uci['sex'].value_counts().to_dict() if 'sex' in df_uci.columns else {},
         'correlacao_notas': df_uci[['G1', 'G2', 'G3']].corr().to_dict() if all(col in df_uci.columns for col in ['G1', 'G2', 'G3']) else {}
     }
     with st.sidebar:
         st.markdown("### 📊 Dashboard Educacional")
+        # Carregar métricas dinâmicas
+        metricas_uci = obter_metricas_principais_uci()
+        metricas_oulad = obter_metricas_principais_oulad()
         st.markdown("### 📚 Sobre os Datasets")
+        st.markdown(f"""
         **📚 UCI Dataset:**
         - Escolas públicas portuguesas
+        - {metricas_uci['total_estudantes']:,} estudantes
         - Dados demográficos e acadêmicos
         - Análise de fatores de sucesso
         """)
+        st.markdown(f"""
         **🌐 OULAD Dataset:**
         - Plataforma de aprendizado online
+        - {metricas_oulad['total_estudantes']:,} estudantes
         - Dados de engajamento digital
         - Análise de atividades online
         """)
         # Métricas UCI
         st.metric(
             "���� UCI - Aprovação",
+            f"{metricas_uci['taxa_aprovacao']:.1f}%",
             help="Taxa de aprovação nas escolas públicas"
         )
         st.metric(
             "📊 UCI - Média Notas",
+            f"{metricas_uci['media_nota_final']:.1f}",
             help="Média das notas finais"
         )
         # Métricas OULAD
         st.metric(
             "🌐 OULAD - Aprovação",
+            f"{metricas_oulad['taxa_aprovacao']:.1f}%",
             help="Taxa de aprovação na plataforma online"
         )
         st.metric(
             "🖱️ OULAD - Engajamento",
+            f"{metricas_oulad['media_cliques']:.1f}",
             help="Média de cliques por estudante"
         )
         st.markdown("---")
         st.markdown("### 💡 Principais Insights")
+        # Insights dinâmicos baseados nos dados reais
+        insights_text = []
+        if metricas_uci['correlacao_g1_g3'] > 0.7:
+            insights_text.append(f"**Correlação forte** entre notas bimestrais e finais ({metricas_uci['correlacao_g1_g3']:.2f})")
+        if metricas_uci['distribuicao_genero']:
+            genero_maioria = max(metricas_uci['distribuicao_genero'], key=metricas_uci['distribuicao_genero'].get)
+            insights_text.append(f"**Gênero predominante**: {genero_maioria} ({metricas_uci['distribuicao_genero'][genero_maioria]:.1f}%)")
+        if metricas_uci['media_faltas'] > 0:
+            insights_text.append(f"**Média de faltas**: {metricas_uci['media_faltas']:.1f} por estudante")
+        if metricas_uci['media_tempo_estudo'] > 0:
+            insights_text.append(f"**Tempo de estudo médio**: {metricas_uci['media_tempo_estudo']:.1f}h/semana")
+        if metricas_oulad['atividade_mais_comum'] != 'N/A':
+            insights_text.append(f"**Atividade mais comum**: {metricas_oulad['atividade_mais_comum']}")
+        if insights_text:
+            for insight in insights_text:
+                st.markdown(f"- {insight}")
+        else:
+            st.markdown("""
+            - **Correlação forte** entre notas bimestrais e finais
+            - **Gênero influencia** desempenho acadêmico
+            - **Faltas impactam** negativamente o desempenho
+            - **Tempo de estudo** ideal: 5-10h/semana
+            - **Atividades online** mais efetivas: outcontent, forumng
+            """)
         st.markdown("---")
         st.markdown("### ℹ️ Informações")
         )
 def obter_insights_uci():
+    """Retorna insights principais do dataset UCI baseados em dados reais"""
+    metricas = obter_metricas_principais_uci()
+    insights = []
+    # Correlação forte
+    if metricas['correlacao_g1_g3'] > 0.7 and metricas['correlacao_g2_g3'] > 0.7:
+        insights.append(f"🎯 **Correlação Forte**: Notas do 1º e 2º bimestre têm correlação de {metricas['correlacao_g1_g3']:.2f} e {metricas['correlacao_g2_g3']:.2f} com a nota final")
+    # Gênero
+    if metricas['distribuicao_genero']:
+        genero_maioria = max(metricas['distribuicao_genero'], key=metricas['distribuicao_genero'].get)
+        genero_menor = min(metricas['distribuicao_genero'], key=metricas['distribuicao_genero'].get)
+        insights.append(f"👥 **Gênero**: Estudantes do sexo {genero_maioria} representam {metricas['distribuicao_genero'][genero_maioria]:.1f}% vs {genero_menor} com {metricas['distribuicao_genero'][genero_menor]:.1f}%")
+    # Consumo de álcool
+    if metricas['estudantes_alcool_baixo'] > 0:
+        insights.append(f"🍷 **Consumo de Álcool**: {metricas['estudantes_alcool_baixo']:.1f}% dos estudantes têm baixo consumo, com melhor desempenho acadêmico")
+    # Tempo de estudo
+    if metricas['media_tempo_estudo'] > 0:
+        insights.append(f"📚 **Tempo de Estudo**: Média de {metricas['media_tempo_estudo']:.1f}h/semana por estudante")
+    # Faltas
+    if metricas['media_faltas'] > 0:
+        insights.append(f"❌ **Faltas**: Média de {metricas['media_faltas']:.1f} faltas por estudante")
+    # Taxa de aprovação
+    if metricas['taxa_aprovacao'] > 0:
+        insights.append(f"✅ **Aprovação**: Taxa de aprovação de {metricas['taxa_aprovacao']:.1f}%")
+    # Média de notas
+    if metricas['media_nota_final'] > 0:
+        insights.append(f"📊 **Desempenho**: Média de notas finais de {metricas['media_nota_final']:.1f}")
     return {
         'titulo': '📚 Principais Insights - Dataset UCI',
+        'insights': insights if insights else [
+            "🎯 **Correlação Forte**: Notas do 1º e 2º bimestre têm correlação forte com a nota final",
+            "👥 **Gênero**: Distribuição equilibrada entre gêneros",
+            "📚 **Tempo de Estudo**: Fator importante para o desempenho acadêmico",
+            "❌ **Faltas**: Impactam negativamente o desempenho",
+            "👨‍👩‍👧‍👦 **Família**: Escolaridade dos pais influencia o desempenho dos filhos"
         ]
     }
 def obter_insights_oulad():
+    """Retorna insights principais do dataset OULAD baseados em dados reais"""
+    metricas = obter_metricas_principais_oulad()
+    insights = []
+    # Demografia
+    if metricas['distribuicao_genero']:
+        genero_maioria = max(metricas['distribuicao_genero'], key=metricas['distribuicao_genero'].get)
+        insights.append(f"👥 **Demografia**: {metricas['distribuicao_genero'][genero_maioria]:.1f}% são do sexo {genero_maioria}")
+    if metricas['faixa_etaria_principal'] != 'N/A':
+        insights.append(f"👥 **Faixa Etária**: Faixa etária predominante de {metricas['faixa_etaria_principal']}")
+    # Desempenho
+    if metricas['taxa_aprovacao'] > 0:
+        insights.append(f"🏆 **Alto Desempenho**: {metricas['taxa_aprovacao']:.1f}% de aprovação")
+    if metricas['estudantes_distincao'] > 0:
+        insights.append(f"🏆 **Distinção**: {metricas['estudantes_distincao']:.1f}% obtendo distinção")
+    # Engajamento
+    if metricas['media_cliques'] > 0:
+        insights.append(f"🖱️ **Engajamento**: Média de {metricas['media_cliques']:.1f} cliques por estudante, indicando engajamento moderado")
+    # Atividades
+    if metricas['atividade_mais_comum'] != 'N/A':
+        insights.append(f"📚 **Atividades**: '{metricas['atividade_mais_comum']}' é a atividade mais realizada")
+    # Região
+    if metricas['regiao_principal'] != 'N/A':
+        insights.append(f"🌍 **Região**: {metricas['regiao_principal']} concentra a maior parte dos estudantes")
+    # Distribuição de resultados
+    if metricas['estudantes_reprovados'] > 0:
+        insights.append(f"📊 **Distribuição**: Aprovação supera largamente outras categorias (reprovação: {metricas['estudantes_reprovados']:.1f}%)")
+    # Total de estudantes
+    if metricas['total_estudantes'] > 0:
+        insights.append(f"👥 **Total**: {metricas['total_estudantes']:,} estudantes analisados")
     return {
         'titulo': '🌐 Principais Insights - Dataset OULAD',
+        'insights': insights if insights else [
+            "👥 **Demografia**: Distribuição equilibrada entre gêneros",
+            "🏆 **Alto Desempenho**: Boa taxa de aprovação geral",
+            "🖱️ **Engajamento**: Nível moderado de engajamento na plataforma",
+            "📚 **Atividades**: Diversas atividades disponíveis",
+            "🌍 **Região**: Distribuição geográfica variada",
+            "📊 **Distribuição**: Resultados positivos predominam"
         ]
     }

webapp/src/vizualizacoes.py CHANGED Viewed

@@ -209,153 +209,236 @@ def criar_grafico_comparativo_aprovacao(df_uci, df_oulad):
     return fig
 def criar_grafico_sugerido_uci():
-    """Cria gráfico sugerido para UCI baseado nos insights"""
-    fig, axes = plt.subplots(2, 2, figsize=(15, 12))
-    # 1. Distribuição de notas finais
-    notas = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20]
-    frequencias = [5, 8, 12, 15, 18, 22, 25, 28, 32, 35, 40, 45, 50, 45, 40, 35, 30, 25, 20, 15, 10]
-    axes[0, 0].hist(notas, bins=20, weights=frequencias, alpha=0.7, color='skyblue', edgecolor='black')
-    axes[0, 0].set_title('Distribuição de Notas Finais (UCI)')
-    axes[0, 0].set_xlabel('Nota Final')
-    axes[0, 0].set_ylabel('Frequência')
-    axes[0, 0].axvline(x=10, color='red', linestyle='--', label='Nota de Aprovação')
-    axes[0, 0].legend()
-    # 2. Desempenho por gênero
-    generos = ['Feminino', 'Masculino']
-    medias = [10.8, 9.9]
-    cores = ['pink', 'lightblue']
-    bars = axes[0, 1].bar(generos, medias, color=cores)
-    axes[0, 1].set_title('Média de Notas por Gênero')
-    axes[0, 1].set_ylabel('Média de Notas')
-    for bar, media in zip(bars, medias):
-        axes[0, 1].text(bar.get_x() + bar.get_width()/2, bar.get_height() + 0.1,
-                       f'{media:.1f}', ha='center', va='bottom')
-    # 3. Faltas vs Desempenho
-    faltas_cat = ['0-5', '6-10', '11-15', '16-20', '21+']
-    medias_notas = [11.2, 10.8, 10.1, 9.5, 8.8]
-    axes[1, 0].plot(faltas_cat, medias_notas, marker='o', linewidth=2, markersize=8, color='red')
-    axes[1, 0].set_title('Faltas vs Média de Notas')
-    axes[1, 0].set_xlabel('Categoria de Faltas')
-    axes[1, 0].set_ylabel('Média de Notas')
-    axes[1, 0].tick_params(axis='x', rotation=45)
-    # 4. Tempo de estudo vs Desempenho
-    tempo_estudo = ['<2h', '2-5h', '5-10h', '>10h']
-    medias_tempo = [9.8, 10.5, 11.2, 10.9]
-    axes[1, 1].bar(tempo_estudo, medias_tempo, color=['lightcoral', 'lightgreen', 'gold', 'lightblue'])
-    axes[1, 1].set_title('Tempo de Estudo vs Média de Notas')
-    axes[1, 1].set_xlabel('Tempo de Estudo Semanal')
-    axes[1, 1].set_ylabel('Média de Notas')
-    for i, media in enumerate(medias_tempo):
-        axes[1, 1].text(i, media + 0.1, f'{media:.1f}', ha='center', va='bottom')
-    plt.tight_layout()
-    return fig
 def criar_grafico_sugerido_oulad():
-    """Cria gráfico sugerido para OULAD baseado nos insights"""
-    fig, axes = plt.subplots(2, 2, figsize=(15, 12))
-    # 1. Distribuição de resultados finais
-    resultados = ['Pass', 'Distinction', 'Fail', 'Withdrawn']
-    percentuais = [78.5, 8.2, 13.3, 0]
-    cores = ['lightgreen', 'gold', 'lightcoral', 'lightgray']
-    wedges, texts, autotexts = axes[0, 0].pie(percentuais, labels=resultados, colors=cores, autopct='%1.1f%%', startangle=90)
-    axes[0, 0].set_title('Distribuição de Resultados Finais (OULAD)')
-    # 2. Distribuição por gênero
-    generos = ['Masculino', 'Feminino']
-    percentuais_gen = [56.2, 43.8]
-    cores_gen = ['lightblue', 'pink']
-    bars = axes[0, 1].bar(generos, percentuais_gen, color=cores_gen)
-    axes[0, 1].set_title('Distribuição por Gênero')
-    axes[0, 1].set_ylabel('Percentual (%)')
-    for bar, pct in zip(bars, percentuais_gen):
-        axes[0, 1].text(bar.get_x() + bar.get_width()/2, bar.get_height() + 1,
-                       f'{pct:.1f}%', ha='center', va='bottom')
-    # 3. Distribuição de atividades
-    atividades = ['outcontent', 'forumng', 'subpage', 'resource', 'url', 'homepage']
-    cliques = [45, 25, 15, 8, 4, 3]
-    axes[1, 0].barh(atividades, cliques, color='lightsteelblue')
-    axes[1, 0].set_title('Distribuição de Atividades por Tipo')
-    axes[1, 0].set_xlabel('Número de Cliques (milhares)')
-    # 4. Distribuição por faixa etária
-    faixas_etarias = ['0-35', '35-55', '55+']
-    percentuais_idade = [35, 45, 20]
-    cores_idade = ['lightgreen', 'gold', 'lightcoral']
-    bars = axes[1, 1].bar(faixas_etarias, percentuais_idade, color=cores_idade)
-    axes[1, 1].set_title('Distribuição por Faixa Etária')
-    axes[1, 1].set_ylabel('Percentual (%)')
-    for bar, pct in zip(bars, percentuais_idade):
-        axes[1, 1].text(bar.get_x() + bar.get_width()/2, bar.get_height() + 1,
-                       f'{pct}%', ha='center', va='bottom')
-    plt.tight_layout()
-    return fig
 def criar_grafico_comparativo_insights():
-    """Cria gráfico comparativo de insights entre os datasets"""
-    fig, axes = plt.subplots(1, 3, figsize=(18, 6))
-    # 1. Taxa de aprovação comparativa
-    datasets = ['UCI\n(Escolas Públicas)', 'OULAD\n(Online)']
-    taxas = [67.3, 78.5]
-    cores = ['lightcoral', 'lightgreen']
-    bars = axes[0].bar(datasets, taxas, color=cores)
-    axes[0].set_title('Taxa de Aprovação Comparativa')
-    axes[0].set_ylabel('Taxa de Aprovação (%)')
-    axes[0].set_ylim(0, 100)
-    for bar, taxa in zip(bars, taxas):
-        axes[0].text(bar.get_x() + bar.get_width()/2, bar.get_height() + 1,
-                    f'{taxa:.1f}%', ha='center', va='bottom')
-    # 2. Distribuição de gênero comparativa
-    generos = ['Feminino', 'Masculino']
-    uci_pct = [58.2, 41.8]
-    oulad_pct = [43.8, 56.2]
-    x = range(len(generos))
-    width = 0.35
-    axes[1].bar([i - width/2 for i in x], uci_pct, width, label='UCI', color='lightcoral', alpha=0.8)
-    axes[1].bar([i + width/2 for i in x], oulad_pct, width, label='OULAD', color='lightgreen', alpha=0.8)
-    axes[1].set_title('Distribuição de Gênero Comparativa')
-    axes[1].set_ylabel('Percentual (%)')
-    axes[1].set_xlabel('Gênero')
-    axes[1].set_xticks(x)
-    axes[1].set_xticklabels(generos)
-    axes[1].legend()
-    # 3. Engajamento vs Desempenho
-    categorias = ['Baixo\nEngajamento', 'Médio\nEngajamento', 'Alto\nEngajamento']
-    uci_desempenho = [8.5, 10.2, 11.8]
-    oulad_desempenho = [65, 78, 85]
-    x = range(len(categorias))
-    width = 0.35
-    axes[2].bar([i - width/2 for i in x], uci_desempenho, width, label='UCI (Notas)', color='lightcoral', alpha=0.8)
-    axes[2].bar([i + width/2 for i in x], oulad_desempenho, width, label='OULAD (Aprovação %)', color='lightgreen', alpha=0.8)
-    axes[2].set_title('Engajamento vs Desempenho')
-    axes[2].set_ylabel('Desempenho')
-    axes[2].set_xlabel('Nível de Engajamento')
-    axes[2].set_xticks(x)
-    axes[2].set_xticklabels(categorias)
-    axes[2].legend()
-    plt.tight_layout()
-    return fig

     return fig
 def criar_grafico_sugerido_uci():
+    """Cria gráfico sugerido para UCI baseado em dados reais"""
+    try:
+        from .utilidades import carregar_dados_uci_cached
+        df_uci = carregar_dados_uci_cached()
+        if df_uci.empty:
+            return None
+        fig, axes = plt.subplots(2, 2, figsize=(15, 12))
+        # 1. Distribuição de notas finais
+        if 'G3' in df_uci.columns:
+            axes[0, 0].hist(df_uci['G3'], bins=20, alpha=0.7, color='skyblue', edgecolor='black')
+            axes[0, 0].set_title('Distribuição de Notas Finais (UCI)')
+            axes[0, 0].set_xlabel('Nota Final')
+            axes[0, 0].set_ylabel('Frequência')
+            axes[0, 0].axvline(x=10, color='red', linestyle='--', label='Nota de Aprovação')
+            axes[0, 0].legend()
+        else:
+            axes[0, 0].text(0.5, 0.5, 'Dados de notas não disponíveis', ha='center', va='center', transform=axes[0, 0].transAxes)
+            axes[0, 0].set_title('Distribuição de Notas Finais (UCI)')
+        # 2. Desempenho por gênero
+        if 'sex' in df_uci.columns and 'G3' in df_uci.columns:
+            genero_medias = df_uci.groupby('sex')['G3'].mean()
+            generos = genero_medias.index.tolist()
+            medias = genero_medias.values.tolist()
+            cores = ['pink', 'lightblue']
+            bars = axes[0, 1].bar(generos, medias, color=cores[:len(generos)])
+            axes[0, 1].set_title('Média de Notas por Gênero')
+            axes[0, 1].set_ylabel('Média de Notas')
+            for bar, media in zip(bars, medias):
+                axes[0, 1].text(bar.get_x() + bar.get_width()/2, bar.get_height() + 0.1,
+                               f'{media:.1f}', ha='center', va='bottom')
+        else:
+            axes[0, 1].text(0.5, 0.5, 'Dados de gênero/notas não disponíveis', ha='center', va='center', transform=axes[0, 1].transAxes)
+            axes[0, 1].set_title('Média de Notas por Gênero')
+        # 3. Faltas vs Desempenho
+        if 'absences' in df_uci.columns and 'G3' in df_uci.columns:
+            # Criar categorias de faltas
+            temp_df = df_uci.copy()
+            temp_df['absences_cat'] = pd.cut(temp_df['absences'],
+                                   bins=[0, 5, 10, 15, 20, 100],
+                                   labels=['0-5', '6-10', '11-15', '16-20', '21+'])
+            faltas_medias = temp_df.groupby('absences_cat')['G3'].mean()
+            faltas_cat = faltas_medias.index.tolist()
+            medias_notas = faltas_medias.values.tolist()
+            axes[1, 0].plot(faltas_cat, medias_notas, marker='o', linewidth=2, markersize=8, color='red')
+            axes[1, 0].set_title('Faltas vs Média de Notas')
+            axes[1, 0].set_xlabel('Categoria de Faltas')
+            axes[1, 0].set_ylabel('Média de Notas')
+            axes[1, 0].tick_params(axis='x', rotation=45)
+        else:
+            axes[1, 0].text(0.5, 0.5, 'Dados de faltas/notas não disponíveis', ha='center', va='center', transform=axes[1, 0].transAxes)
+            axes[1, 0].set_title('Faltas vs Média de Notas')
+        # 4. Tempo de estudo vs Desempenho
+        if 'studytime' in df_uci.columns and 'G3' in df_uci.columns:
+            tempo_medias = df_uci.groupby('studytime')['G3'].mean()
+            tempo_estudo = tempo_medias.index.tolist()
+            medias_tempo = tempo_medias.values.tolist()
+            cores = ['lightcoral', 'lightgreen', 'gold', 'lightblue']
+            bars = axes[1, 1].bar(tempo_estudo, medias_tempo, color=cores[:len(tempo_estudo)])
+            axes[1, 1].set_title('Tempo de Estudo vs Média de Notas')
+            axes[1, 1].set_xlabel('Tempo de Estudo Semanal')
+            axes[1, 1].set_ylabel('Média de Notas')
+            axes[1, 1].tick_params(axis='x', rotation=45)
+            for i, media in enumerate(medias_tempo):
+                axes[1, 1].text(i, media + 0.1, f'{media:.1f}', ha='center', va='bottom')
+        else:
+            axes[1, 1].text(0.5, 0.5, 'Dados de tempo de estudo/notas não disponíveis', ha='center', va='center', transform=axes[1, 1].transAxes)
+            axes[1, 1].set_title('Tempo de Estudo vs Média de Notas')
+        plt.tight_layout()
+        return fig
+    except Exception as e:
+        st.warning(f"Erro ao criar gráfico UCI: {e}")
+        return None
 def criar_grafico_sugerido_oulad():
+    """Cria gráfico sugerido para OULAD baseado em dados reais"""
+    try:
+        from .utilidades import carregar_dados_oulad_cached
+        df_oulad = carregar_dados_oulad_cached()
+        if df_oulad.empty:
+            return None
+        fig, axes = plt.subplots(2, 2, figsize=(15, 12))
+        # 1. Distribuição de resultados finais
+        if 'final_result' in df_oulad.columns:
+            resultados_counts = df_oulad['final_result'].value_counts()
+            resultados = resultados_counts.index.tolist()
+            percentuais = (resultados_counts / len(df_oulad) * 100).tolist()
+            cores = ['lightgreen', 'gold', 'lightcoral', 'lightgray']
+            wedges, texts, autotexts = axes[0, 0].pie(percentuais, labels=resultados, colors=cores[:len(resultados)], autopct='%1.1f%%', startangle=90)
+            axes[0, 0].set_title('Distribuição de Resultados Finais (OULAD)')
+        else:
+            axes[0, 0].text(0.5, 0.5, 'Dados de resultados não disponíveis', ha='center', va='center', transform=axes[0, 0].transAxes)
+            axes[0, 0].set_title('Distribuição de Resultados Finais (OULAD)')
+        # 2. Distribuição por gênero
+        if 'gender' in df_oulad.columns:
+            genero_counts = df_oulad['gender'].value_counts()
+            generos = genero_counts.index.tolist()
+            percentuais_gen = (genero_counts / len(df_oulad) * 100).tolist()
+            cores_gen = ['lightblue', 'pink']
+            bars = axes[0, 1].bar(generos, percentuais_gen, color=cores_gen[:len(generos)])
+            axes[0, 1].set_title('Distribuição por Gênero')
+            axes[0, 1].set_ylabel('Percentual (%)')
+            for bar, pct in zip(bars, percentuais_gen):
+                axes[0, 1].text(bar.get_x() + bar.get_width()/2, bar.get_height() + 1,
+                               f'{pct:.1f}%', ha='center', va='bottom')
+        else:
+            axes[0, 1].text(0.5, 0.5, 'Dados de gênero não disponíveis', ha='center', va='center', transform=axes[0, 1].transAxes)
+            axes[0, 1].set_title('Distribuição por Gênero')
+        # 3. Distribuição de atividades
+        if 'activity_type' in df_oulad.columns:
+            atividades_counts = df_oulad['activity_type'].value_counts().head(6)  # Top 6 atividades
+            atividades = atividades_counts.index.tolist()
+            cliques = atividades_counts.values.tolist()
+            axes[1, 0].barh(atividades, cliques, color='lightsteelblue')
+            axes[1, 0].set_title('Distribuição de Atividades por Tipo')
+            axes[1, 0].set_xlabel('Número de Registros')
+        else:
+            axes[1, 0].text(0.5, 0.5, 'Dados de atividades não disponíveis', ha='center', va='center', transform=axes[1, 0].transAxes)
+            axes[1, 0].set_title('Distribuição de Atividades por Tipo')
+        # 4. Distribuição por faixa etária
+        if 'age_band' in df_oulad.columns:
+            idade_counts = df_oulad['age_band'].value_counts()
+            faixas_etarias = idade_counts.index.tolist()
+            percentuais_idade = (idade_counts / len(df_oulad) * 100).tolist()
+            cores_idade = ['lightgreen', 'gold', 'lightcoral']
+            bars = axes[1, 1].bar(faixas_etarias, percentuais_idade, color=cores_idade[:len(faixas_etarias)])
+            axes[1, 1].set_title('Distribuição por Faixa Etária')
+            axes[1, 1].set_ylabel('Percentual (%)')
+            axes[1, 1].tick_params(axis='x', rotation=45)
+            for bar, pct in zip(bars, percentuais_idade):
+                axes[1, 1].text(bar.get_x() + bar.get_width()/2, bar.get_height() + 1,
+                               f'{pct:.1f}%', ha='center', va='bottom')
+        else:
+            axes[1, 1].text(0.5, 0.5, 'Dados de idade não disponíveis', ha='center', va='center', transform=axes[1, 1].transAxes)
+            axes[1, 1].set_title('Distribuição por Faixa Etária')
+        plt.tight_layout()
+        return fig
+    except Exception as e:
+        st.warning(f"Erro ao criar gráfico OULAD: {e}")
+        return None
 def criar_grafico_comparativo_insights():
+    """Cria gráfico comparativo de insights entre os datasets baseado em dados reais"""
+    try:
+        from .utilidades import carregar_dados_uci_cached, carregar_dados_oulad_cached, obter_metricas_principais_uci, obter_metricas_principais_oulad
+        # Carregar métricas
+        metricas_uci = obter_metricas_principais_uci()
+        metricas_oulad = obter_metricas_principais_oulad()
+        fig, axes = plt.subplots(1, 3, figsize=(18, 6))
+        # 1. Taxa de aprovação comparativa
+        datasets = ['UCI\n(Escolas Públicas)', 'OULAD\n(Online)']
+        taxas = [metricas_uci['taxa_aprovacao'], metricas_oulad['taxa_aprovacao']]
+        cores = ['lightcoral', 'lightgreen']
+        bars = axes[0].bar(datasets, taxas, color=cores)
+        axes[0].set_title('Taxa de Aprovação Comparativa')
+        axes[0].set_ylabel('Taxa de Aprovação (%)')
+        axes[0].set_ylim(0, 100)
+        for bar, taxa in zip(bars, taxas):
+            axes[0].text(bar.get_x() + bar.get_width()/2, bar.get_height() + 1,
+                        f'{taxa:.1f}%', ha='center', va='bottom')
+        # 2. Distribuição de gênero comparativa
+        if metricas_uci['distribuicao_genero'] and metricas_oulad['distribuicao_genero']:
+            # Normalizar para ter os mesmos gêneros
+            generos = ['F', 'M']  # Assumindo F e M como padrão
+            uci_pct = [metricas_uci['distribuicao_genero'].get('F', 0), metricas_uci['distribuicao_genero'].get('M', 0)]
+            oulad_pct = [metricas_oulad['distribuicao_genero'].get('F', 0), metricas_oulad['distribuicao_genero'].get('M', 0)]
+            x = range(len(generos))
+            width = 0.35
+            axes[1].bar([i - width/2 for i in x], uci_pct, width, label='UCI', color='lightcoral', alpha=0.8)
+            axes[1].bar([i + width/2 for i in x], oulad_pct, width, label='OULAD', color='lightgreen', alpha=0.8)
+            axes[1].set_title('Distribuição de Gênero Comparativa')
+            axes[1].set_ylabel('Percentual (%)')
+            axes[1].set_xlabel('Gênero')
+            axes[1].set_xticks(x)
+            axes[1].set_xticklabels(generos)
+            axes[1].legend()
+        else:
+            axes[1].text(0.5, 0.5, 'Dados de gênero não disponíveis', ha='center', va='center', transform=axes[1].transAxes)
+            axes[1].set_title('Distribuição de Gênero Comparativa')
+        # 3. Comparação de métricas principais
+        metricas_comparacao = ['Total de\nEstudantes', 'Taxa de\nAprovação', 'Média de\nNotas/Cliques']
+        uci_valores = [metricas_uci['total_estudantes']/1000, metricas_uci['taxa_aprovacao'], metricas_uci['media_nota_final']]
+        oulad_valores = [metricas_oulad['total_estudantes']/1000, metricas_oulad['taxa_aprovacao'], metricas_oulad['media_cliques']]
+        x = range(len(metricas_comparacao))
+        width = 0.35
+        axes[2].bar([i - width/2 for i in x], uci_valores, width, label='UCI', color='lightcoral', alpha=0.8)
+        axes[2].bar([i + width/2 for i in x], oulad_valores, width, label='OULAD', color='lightgreen', alpha=0.8)
+        axes[2].set_title('Comparação de Métricas Principais')
+        axes[2].set_ylabel('Valores')
+        axes[2].set_xlabel('Métricas')
+        axes[2].set_xticks(x)
+        axes[2].set_xticklabels(metricas_comparacao)
+        axes[2].legend()
+        plt.tight_layout()
+        return fig
+    except Exception as e:
+        st.warning(f"Erro ao criar gráfico comparativo: {e}")
+        return None