File size: 15,508 Bytes
d55ae9b
dbeac69
 
 
 
d55ae9b
dbeac69
 
 
d55ae9b
dbeac69
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
d55ae9b
dbeac69
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
d55ae9b
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
# database.py — V24 — COMPLETO COM salvar_embedding() + NUMPY + MIGRAÇÕES
import sqlite3
import time
import os
import json
import numpy as np
from typing import List, Dict, Any, Tuple
from loguru import logger


class Database:
    def __init__(self, db_path: str = "/app/akira.db"):
        self.db_path = db_path
        self.max_retries = 5
        self.retry_delay = 0.1
        os.makedirs(os.path.dirname(db_path), exist_ok=True)
        self._init_db()
        self._ensure_all_columns_and_indexes()

    def _get_connection(self) -> sqlite3.Connection:
        for attempt in range(self.max_retries):
            try:
                conn = sqlite3.connect(self.db_path, timeout=30.0, check_same_thread=False)
                conn.execute('PRAGMA journal_mode=WAL')
                conn.execute('PRAGMA synchronous=NORMAL')
                conn.execute('PRAGMA busy_timeout=30000')
                conn.execute('PRAGMA foreign_keys=ON')
                return conn
            except sqlite3.OperationalError as e:
                if "database is locked" in str(e) and attempt < self.max_retries - 1:
                    time.sleep(self.retry_delay * (2 ** attempt))
                    continue
                logger.error(f"Falha ao conectar: {e}")
                raise

    def _execute(self, query: str, params: tuple = (), commit: bool = False):
        for attempt in range(self.max_retries):
            try:
                with self._get_connection() as conn:
                    c = conn.cursor()
                    c.execute(query, params)
                    result = c.fetchall() if query.strip().upper().startswith('SELECT') else None
                    if commit:
                        conn.commit()
                    return result
            except sqlite3.OperationalError as e:
                if "database is locked" in str(e) and attempt < self.max_retries - 1:
                    time.sleep(self.retry_delay * (2 ** attempt))
                    continue
                logger.error(f"Erro SQL: {e}")
                raise

    # ================================================================
    # INICIALIZAÇÃO — TODAS AS TABELAS DO V18 + NOVAS
    # ================================================================
    def _init_db(self):
        with self._get_connection() as conn:
            c = conn.cursor()
            c.executescript('''
                -- TABELAS ORIGINAIS (V18)
                CREATE TABLE IF NOT EXISTS aprendizado (
                    id INTEGER PRIMARY KEY AUTOINCREMENT,
                    usuario TEXT,
                    dado TEXT,
                    valor TEXT
                );
                CREATE TABLE IF NOT EXISTS exemplos (
                    id INTEGER PRIMARY KEY AUTOINCREMENT,
                    tipo TEXT NOT NULL,
                    entrada TEXT NOT NULL,
                    resposta TEXT NOT NULL
                );
                CREATE TABLE IF NOT EXISTS info_geral (
                    chave TEXT PRIMARY KEY,
                    valor TEXT NOT NULL
                );
                CREATE TABLE IF NOT EXISTS estilos (
                    numero_usuario TEXT PRIMARY KEY,
                    estilo TEXT NOT NULL
                );
                CREATE TABLE IF NOT EXISTS preferencias_tom (
                    numero_usuario TEXT PRIMARY KEY,
                    tom TEXT NOT NULL
                );
                CREATE TABLE IF NOT EXISTS afinidades (
                    numero_usuario TEXT PRIMARY KEY,
                    afinidade REAL NOT NULL
                );
                CREATE TABLE IF NOT EXISTS termos (
                    id INTEGER PRIMARY KEY AUTOINCREMENT,
                    numero_usuario TEXT NOT NULL,
                    termo TEXT NOT NULL,
                    created_at DATETIME DEFAULT CURRENT_TIMESTAMP
                );
                CREATE TABLE IF NOT EXISTS aprendizados (
                    id INTEGER PRIMARY KEY AUTOINCREMENT,
                    numero_usuario TEXT NOT NULL,
                    chave TEXT NOT NULL,
                    valor TEXT NOT NULL,
                    created_at DATETIME DEFAULT CURRENT_TIMESTAMP
                );
                CREATE TABLE IF NOT EXISTS aprendizado_detalhado (
                    id INTEGER PRIMARY KEY AUTOINCREMENT,
                    numero_usuario TEXT NOT NULL,
                    tipo TEXT NOT NULL,
                    chave TEXT NOT NULL,
                    valor TEXT NOT NULL,
                    fonte TEXT,
                    confianca REAL DEFAULT 1.0,
                    contexto TEXT,
                    criado_em DATETIME DEFAULT CURRENT_TIMESTAMP,
                    atualizado_em DATETIME DEFAULT CURRENT_TIMESTAMP
                );
                CREATE TABLE IF NOT EXISTS vocabulario_patenteado (
                    termo TEXT PRIMARY KEY,
                    definicao TEXT NOT NULL,
                    uso TEXT NOT NULL,
                    exemplo TEXT NOT NULL
                );
                CREATE TABLE IF NOT EXISTS usuarios_privilegiados (
                    numero_usuario TEXT PRIMARY KEY,
                    nome TEXT NOT NULL
                );
                CREATE TABLE IF NOT EXISTS whatsapp_ids (
                    id INTEGER PRIMARY KEY AUTOINCREMENT,
                    whatsapp_id TEXT NOT NULL,
                    sender_number TEXT NOT NULL,
                    UNIQUE (whatsapp_id, sender_number)
                );
                CREATE TABLE IF NOT EXISTS embeddings (
                    id INTEGER PRIMARY KEY AUTOINCREMENT,
                    numero_usuario TEXT,
                    source_type TEXT,
                    texto TEXT,
                    embedding BLOB NOT NULL
                );
                CREATE TABLE IF NOT EXISTS mensagens (
                    id INTEGER PRIMARY KEY AUTOINCREMENT,
                    usuario TEXT NOT NULL,
                    mensagem TEXT NOT NULL,
                    resposta TEXT NOT NULL,
                    numero TEXT,
                    is_reply BOOLEAN DEFAULT 0,
                    mensagem_original TEXT,
                    created_at DATETIME DEFAULT CURRENT_TIMESTAMP
                );
                CREATE TABLE IF NOT EXISTS emocao_exemplos (
                    id INTEGER PRIMARY KEY AUTOINCREMENT,
                    emocao TEXT NOT NULL,
                    entrada TEXT NOT NULL,
                    resposta TEXT NOT NULL,
                    tom TEXT NOT NULL,
                    created_at DATETIME DEFAULT CURRENT_TIMESTAMP
                );
                CREATE TABLE IF NOT EXISTS girias_aprendidas (
                    id INTEGER PRIMARY KEY AUTOINCREMENT,
                    numero_usuario TEXT NOT NULL,
                    giria TEXT NOT NULL,
                    significado TEXT NOT NULL,
                    contexto TEXT,
                    frequencia INTEGER DEFAULT 1,
                    created_at DATETIME DEFAULT CURRENT_TIMESTAMP,
                    updated_at DATETIME DEFAULT CURRENT_TIMESTAMP
                );
                CREATE TABLE IF NOT EXISTS tom_usuario (
                    id INTEGER PRIMARY KEY AUTOINCREMENT,
                    numero_usuario TEXT NOT NULL,
                    tom_detectado TEXT NOT NULL,
                    intensidade REAL DEFAULT 0.5,
                    contexto TEXT,
                    created_at DATETIME DEFAULT CURRENT_TIMESTAMP
                );
                CREATE TABLE IF NOT EXISTS adaptacao_dinamica (
                    id INTEGER PRIMARY KEY AUTOINCREMENT,
                    numero_usuario TEXT NOT NULL,
                    tipo_adaptacao TEXT NOT NULL,
                    valor_anterior TEXT,
                    valor_novo TEXT,
                    razao TEXT,
                    created_at DATETIME DEFAULT CURRENT_TIMESTAMP
                );
                CREATE TABLE IF NOT EXISTS pronomes_por_tom (
                    tom TEXT PRIMARY KEY,
                    pronomes TEXT NOT NULL
                );
                CREATE TABLE IF NOT EXISTS contexto (
                    user_key TEXT PRIMARY KEY,
                    historico TEXT,
                    emocao_atual TEXT,
                    termos TEXT,
                    girias TEXT,
                    tom TEXT
                );
                -- TABELAS NOVAS (V22/V23)
                CREATE TABLE IF NOT EXISTS abrev_usuarios (
                    id INTEGER PRIMARY KEY AUTOINCREMENT,
                    numero_usuario TEXT NOT NULL,
                    abreviacao TEXT NOT NULL,
                    palavra_completa TEXT,
                    frequencia INTEGER DEFAULT 1
                );
                -- DADOS INICIAIS
                INSERT OR IGNORE INTO pronomes_por_tom (tom, pronomes) VALUES
                ('formal', 'Sr., ilustre, boss, maior, homem'),
                ('rude', 'parvo, estúpido, burro, analfabeto, desperdício de esperma'),
                ('casual', 'mano, puto, cota, mwangolé, kota'),
                ('neutro', 'amigo, parceiro, camarada');
            ''')
            conn.commit()
        logger.info(f"Banco V24 inicializado: {self.db_path}")

    # ================================================================
    # MIGRAÇÃO AUTOMÁTICA — GARANTE COLUNAS + ÍNDICES
    # ================================================================
    def _ensure_all_columns_and_indexes(self):
        with self._get_connection() as conn:
            c = conn.cursor()
            # Migrações para embeddings
            c.execute("PRAGMA table_info(embeddings)")
            cols = {row[1] for row in c.fetchall()}
            if 'numero_usuario' not in cols:
                c.execute("ALTER TABLE embeddings ADD COLUMN numero_usuario TEXT")
            if 'source_type' not in cols:
                c.execute("ALTER TABLE embeddings ADD COLUMN source_type TEXT DEFAULT 'conversa'")
            if 'texto' not in cols:
                c.execute("ALTER TABLE embeddings ADD COLUMN texto TEXT DEFAULT ''")
            # Índices
            c.executescript('''
                CREATE INDEX IF NOT EXISTS idx_mensagens_numero ON mensagens(numero);
                CREATE INDEX IF NOT EXISTS idx_girias_usuario ON girias_aprendidas(numero_usuario);
                CREATE INDEX IF NOT EXISTS idx_abrev_usuario ON abrev_usuarios(numero_usuario);
                CREATE INDEX IF NOT EXISTS idx_aprendizados_usuario ON aprendizados(numero_usuario);
                CREATE INDEX IF NOT EXISTS idx_aprendizado_detalhado_usuario ON aprendizado_detalhado(numero_usuario);
            ''')
            conn.commit()

    # ================================================================
    # MÉTODOS PRINCIPAIS (para app.py)
    # ================================================================
    def salvar_mensagem(self, usuario, mensagem, resposta, numero=None, is_reply=False, mensagem_original=None):
        cols = ['usuario', 'mensagem', 'resposta']
        vals = [usuario, mensagem, resposta]
        if numero: cols.append('numero'); vals.append(numero)
        if is_reply is not None: cols.append('is_reply'); vals.append(int(is_reply))
        if mensagem_original: cols.append('mensagem_original'); vals.append(mensagem_original)
        placeholders = ', '.join(['?' for _ in cols])
        query = f"INSERT INTO mensagens ({', '.join(cols)}) VALUES ({placeholders})"
        self._execute(query, tuple(vals), commit=True)

    def carregar_contexto(self, numero: str) -> Dict[str, Any]:
        row = self._execute("SELECT historico, girias, tom FROM contexto WHERE user_key=?", (numero,))
        if row:
            return {
                "historico": json.loads(row[0][0] or "[]")[-8:],
                "girias": json.loads(row[0][1] or "[]"),
                "tom": row[0][2] or "neutro"
            }
        return {"historico": [], "girias": [], "tom": "neutro"}

    def salvar_contexto(self, numero: str, historico: List, girias: List, tom: str):
        self._execute(
            "INSERT OR REPLACE INTO contexto (user_key, historico, girias, tom) VALUES (?, ?, ?, ?)",
            (numero, json.dumps(historico), json.dumps(girias), tom), commit=True
        )

    def recuperar_girias_usuario(self, numero_usuario: str) -> List[str]:
        rows = self._execute("SELECT giria FROM girias_aprendidas WHERE numero_usuario=?", (numero_usuario,))
        return [r[0] for r in rows] if rows else []

    def recuperar_abreviacoes_usuario(self, numero_usuario: str) -> Dict[str, str]:
        rows = self._execute("SELECT abreviacao, palavra_completa FROM abrev_usuarios WHERE numero_usuario=?", (numero_usuario,))
        return {r[0]: r[1] for r in rows} if rows else {}

    def aprender_giria(self, numero: str, giria: str, significado: str = None):
        row = self._execute("SELECT frequencia FROM girias_aprendidas WHERE numero_usuario=? AND giria=?", (numero, giria))
        if row:
            self._execute("UPDATE girias_aprendidas SET frequencia = frequencia + 1, updated_at = CURRENT_TIMESTAMP WHERE numero_usuario=? AND giria=?", (numero, giria), commit=True)
        else:
            self._execute("INSERT INTO girias_aprendidas (numero_usuario, giria, significado) VALUES (?, ?, ?)", (numero, giria, significado or ""), commit=True)

    def aprender_abreviacao(self, numero: str, abrev: str, completa: str):
        row = self._execute("SELECT frequencia FROM abrev_usuarios WHERE numero_usuario=? AND abreviacao=?", (numero, abrev))
        if row:
            self._execute("UPDATE abrev_usuarios SET frequencia = frequencia + 1 WHERE numero_usuario=? AND abreviacao=?", (numero, abrev), commit=True)
        else:
            self._execute("INSERT INTO abrev_usuarios (numero_usuario, abreviacao, palavra_completa) VALUES (?, ?, ?)", (numero, abrev, completa), commit=True)

    def detectar_tom(self, numero: str, mensagem: str) -> str:
        rude = any(w in mensagem.lower() for w in ["parvo", "burro", "merda"])
        casual = any(w in mensagem.lower() for w in ["epá", "kandando", "bué", "kota"])
        if rude: return "rude"
        if casual: return "casual"
        return "neutro"

    # ================================================================
    # NOVO MÉTODO: salvar_embedding() — COM NUMPY
    # ================================================================
    def salvar_embedding(self, numero_usuario: str, mensagem: str, resposta: str, embedding: list, texto: str = ""):
        """
        Salva embedding no banco (tabela 'embeddings').
        """
        try:
            embedding_blob = np.array(embedding, dtype=np.float32).tobytes()
            
            self._execute(
                """INSERT INTO embeddings 
                (numero_usuario, source_type, texto, embedding) 
                VALUES (?, ?, ?, ?)""",
                (numero_usuario, 'conversa', texto or f"{mensagem} {resposta}", embedding_blob),
                commit=True
            )
            logger.debug(f"Embedding salvo para {numero_usuario}")
        except Exception as e:
            logger.error(f"Erro ao salvar embedding: {e}")


# ================================================================
# TESTE RÁPIDO (OPCIONAL)
# ================================================================
if __name__ == "__main__":
    db = Database()
    db.salvar_mensagem("Zé", "Oi", "Epá!", "244999123456")
    print("Banco V24 pronto!")