File size: 1,911 Bytes
f5eb34f
 
 
 
 
 
 
 
 
 
 
 
 
 
1b447de
 
 
 
f5eb34f
1b447de
 
 
 
 
 
 
 
 
 
 
 
 
f5eb34f
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1b447de
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
"""
Configurações centralizadas do aplicativo
"""
import os
from dotenv import load_dotenv

load_dotenv()

# Configurações de banco de dados
DATABASE_URL = os.environ.get(
    "DATABASE_URL",
    "postgresql://postgres:postgres@localhost:5433/ragdb"
)

# Configurações de LLM
LLM_PROVIDER = os.environ.get("LLM_PROVIDER", "huggingface")

# Hugging Face
HF_TOKEN = os.environ.get("HF_TOKEN", "")
HF_MODEL_ID = os.environ.get("HF_MODEL_ID", "mistralai/Mistral-7B-Instruct-v0.2")

# OpenAI
OPENAI_API_KEY = os.environ.get("OPENAI_API_KEY", "")
OPENAI_MODEL_ID = os.environ.get("OPENAI_MODEL_ID", "gpt-3.5-turbo")

# Anthropic
ANTHROPIC_API_KEY = os.environ.get("ANTHROPIC_API_KEY", "")
ANTHROPIC_MODEL_ID = os.environ.get("ANTHROPIC_MODEL_ID", "claude-3-haiku-20240307")

# Ollama
OLLAMA_BASE_URL = os.environ.get("OLLAMA_BASE_URL", "http://localhost:11434")
OLLAMA_MODEL_ID = os.environ.get("OLLAMA_MODEL_ID", "llama2")

# Configurações de embeddings
EMBEDDING_MODEL_ID = os.environ.get(
    "EMBEDDING_MODEL_ID",
    "sentence-transformers/all-MiniLM-L6-v2"
)
EMBEDDING_DIM = int(os.environ.get("EMBEDDING_DIM", "384"))

# Configurações de retrieval
TOP_K = int(os.environ.get("TOP_K", "4"))
IVFFLAT_LISTS = int(os.environ.get("IVFFLAT_LISTS", "100"))

# Configurações de chunking
DEFAULT_CHUNK_SIZE = int(os.environ.get("CHUNK_SIZE", "1000"))
CHUNK_OVERLAP = int(os.environ.get("CHUNK_OVERLAP", "200"))

# Configurações de geração
DEFAULT_TEMPERATURE = float(os.environ.get("TEMPERATURE", "0.3"))
DEFAULT_MAX_TOKENS = int(os.environ.get("MAX_TOKENS", "512"))

# Configurações da aplicação
APP_PORT = int(os.environ.get("PORT", "7860"))

# Reranking
RERANKER_MODEL_ID = os.environ.get(
    "RERANKER_MODEL_ID",
    "cross-encoder/ms-marco-MiniLM-L-6-v2"
)
USE_RERANKING = os.environ.get("USE_RERANKING", "true").lower() == "true"
RERANKING_TOP_K = int(os.environ.get("RERANKING_TOP_K", "4"))