File size: 8,900 Bytes
f5eb34f
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
"""
Aba de Monitoramento e Métricas
Visualiza estatísticas de uso e performance do sistema
"""
import gradio as gr
from src.database import DatabaseManager


def create_monitoring_tab(db_manager: DatabaseManager):
    """Cria aba de monitoramento e métricas"""

    with gr.Tab(" Monitoramento"):
        gr.Markdown("""
        ## Dashboard de Monitoramento

        Acompanhe estatísticas de uso e performance:
        - **Métricas de Query**: Latências e throughput
        - **Uso da Base**: Documentos e chats
        - **Performance**: Análise de tempos de resposta
        """)

        refresh_all_btn = gr.Button(" Atualizar Todas as Métricas", variant="primary", size="lg")

        with gr.Row():
            with gr.Column():
                gr.Markdown("### Estatísticas Gerais")

                general_stats = gr.JSON(label="Resumo Geral")

            with gr.Column():
                gr.Markdown("### Performance de Queries")

                query_performance = gr.JSON(label="Métricas de Latência")

        with gr.Row():
            gr.Markdown("###  Distribuição de Scores de Similaridade")

        score_distribution = gr.Markdown("Sem dados disponíveis")

        with gr.Row():
            gr.Markdown("###  Últimas Queries")

        with gr.Row():
            recent_queries_limit = gr.Slider(
                minimum=5,
                maximum=50,
                value=10,
                step=5,
                label="Quantidade de queries recentes"
            )

        recent_queries_table = gr.Dataframe(
            headers=["ID", "Query", "Resultados", "Tempo Total (ms)", "Top K", "Data"],
            label="Histórico de Queries",
            wrap=True
        )

        # Função para buscar estatísticas gerais
        def get_general_stats():
            conn = db_manager.connect()
            if not conn:
                return {"erro": "Não foi possível conectar ao banco"}

            try:
                stats = {}

                with conn.cursor() as cur:
                    # Total de documentos
                    cur.execute("SELECT COUNT(*) FROM documents")
                    stats['total_documentos'] = cur.fetchone()[0]

                    # Total de chats
                    cur.execute("SELECT COUNT(*) FROM chats")
                    stats['total_chats'] = cur.fetchone()[0]

                    # Total de mensagens
                    cur.execute("SELECT COUNT(*) FROM messages")
                    stats['total_mensagens'] = cur.fetchone()[0]

                    # Total de queries registradas
                    cur.execute("SELECT COUNT(*) FROM query_metrics")
                    stats['total_queries'] = cur.fetchone()[0]

                    # Média de mensagens por chat
                    cur.execute("""
                        SELECT AVG(msg_count)
                        FROM (
                            SELECT COUNT(*) as msg_count
                            FROM messages
                            GROUP BY chat_id
                        ) as counts
                    """)
                    result = cur.fetchone()
                    stats['media_mensagens_por_chat'] = round(result[0], 2) if result[0] else 0

                return stats
            except Exception as e:
                return {"erro": str(e)}

        # Função para calcular métricas de performance
        def get_query_performance():
            conn = db_manager.connect()
            if not conn:
                return {"erro": "Não foi possível conectar ao banco"}

            try:
                metrics = {}

                with conn.cursor() as cur:
                    # Latências médias
                    cur.execute("""
                        SELECT
                            AVG(retrieval_time_ms) as avg_retrieval,
                            AVG(generation_time_ms) as avg_generation,
                            AVG(total_time_ms) as avg_total,
                            MIN(total_time_ms) as min_total,
                            MAX(total_time_ms) as max_total
                        FROM query_metrics
                    """)
                    row = cur.fetchone()

                    if row and row[0] is not None:
                        metrics['latencia_media_retrieval_ms'] = round(row[0], 2)
                        metrics['latencia_media_generation_ms'] = round(row[1], 2)
                        metrics['latencia_media_total_ms'] = round(row[2], 2)
                        metrics['latencia_min_total_ms'] = round(row[3], 2)
                        metrics['latencia_max_total_ms'] = round(row[4], 2)
                    else:
                        metrics['info'] = "Nenhuma query registrada ainda"

                    # Média de resultados por query
                    cur.execute("SELECT AVG(num_results) FROM query_metrics")
                    result = cur.fetchone()
                    metrics['media_resultados_por_query'] = round(result[0], 2) if result[0] else 0

                    # Top K mais usado
                    cur.execute("""
                        SELECT top_k, COUNT(*) as count
                        FROM query_metrics
                        GROUP BY top_k
                        ORDER BY count DESC
                        LIMIT 1
                    """)
                    result = cur.fetchone()
                    if result:
                        metrics['top_k_mais_usado'] = result[0]
                        metrics['top_k_frequency'] = result[1]

                return metrics
            except Exception as e:
                return {"erro": str(e)}

        # Função para calcular distribuição de scores
        def get_score_distribution():
            conn = db_manager.connect()
            if not conn:
                return " Não foi possível conectar ao banco"

            try:
                with conn.cursor() as cur:
                    # Busca scores recentes (precisaríamos salvar isso nas métricas)
                    # Por enquanto, retorna mensagem
                    cur.execute("SELECT COUNT(*) FROM query_metrics")
                    count = cur.fetchone()[0]

                    if count == 0:
                        return " Nenhuma query registrada ainda. Execute algumas queries no Chat RAG para ver a distribuição de scores."

                    return f"""
                     **Distribuição de Scores**

                    Total de queries registradas: {count}

                    _Nota: Para visualização completa de scores, seriam necessários gráficos._
                    _Scores indicam similaridade entre query e documentos (0.0 a 1.0)_
                    """
            except Exception as e:
                return f" Erro: {str(e)}"

        # Função para buscar queries recentes
        def get_recent_queries(limit):
            conn = db_manager.connect()
            if not conn:
                return []

            try:
                with conn.cursor() as cur:
                    cur.execute("""
                        SELECT
                            id,
                            query,
                            num_results,
                            total_time_ms,
                            top_k,
                            created_at
                        FROM query_metrics
                        ORDER BY created_at DESC
                        LIMIT %s
                    """, (int(limit),))

                    rows = cur.fetchall()

                    table_data = []
                    for row in rows:
                        query_preview = row[1][:50] + "..." if len(row[1]) > 50 else row[1]
                        table_data.append([
                            row[0],
                            query_preview,
                            row[2],
                            f"{row[3]:.0f}",
                            row[4],
                            str(row[5])
                        ])

                    return table_data
            except Exception as e:
                return []

        # Função para atualizar tudo
        def refresh_all(limit):
            gen_stats = get_general_stats()
            perf_stats = get_query_performance()
            score_dist = get_score_distribution()
            recent = get_recent_queries(limit)

            return gen_stats, perf_stats, score_dist, recent

        # Conecta eventos
        refresh_all_btn.click(
            fn=refresh_all,
            inputs=[recent_queries_limit],
            outputs=[general_stats, query_performance, score_distribution, recent_queries_table]
        )

        recent_queries_limit.change(
            fn=get_recent_queries,
            inputs=[recent_queries_limit],
            outputs=[recent_queries_table]
        )

    return {
        "refresh_btn": refresh_all_btn
    }