File size: 12,921 Bytes
# Agent OS - Documentacao Tecnica

## Visao Geral

Agent OS e um sistema operacional de agentes IA. Uma interface desktop-like (macOS-style) que orquestra multiplos modelos de IA especializados atraves de um modelo gestor central. Cada agente e um "slot" plugavel que pode ser trocado, adicionado ou removido facilmente.

## Arquitetura

```
┌──────────────────────────────────────────────────────────────┐
│                    AGENT OS (Frontend React)                  │
│  ┌─────────┬──────────┬──────────┬────────┬────────┬───────┐ │
│  │ Browser │ Terminal │  Inbox   │Mission │ Agents │Finder │ │
│  │         │          │          │Control │        │       │ │
│  └─────────┴──────────┴──────────┴────────┴────────┴───────┘ │
├──────────────────────────────────────────────────────────────┤
│                    SERVER (Node.js + Express)                 │
│  ┌──────────┬──────────┬──────────┬──────────┬─────────────┐ │
│  │ Browser  │ PM2      │ Supabase │ GitHub   │ SmolAgent   │ │
│  │ Manager  │ API      │ API      │ CLI      │ Daemon      │ │
│  └──────────┴──────────┴──────────┴──────────┴─────────────┘ │
├──────────────────────────────────────────────────────────────┤
│                    CAMADA DE ORQUESTRACAO                     │
│  ┌──────────────────────────────────────────────────────────┐ │
│  │              MODELO GESTOR (Orchestrator)                 │ │
│  │    Recebe tarefa → Classifica → Roteia → Retorna         │ │
│  │    Llama 3.3 70B via HF Inference API (gratis, Pro)      │ │
│  └─────────────┬────────────┬───────────────┬───────────────┘ │
│                │            │               │                 │
│  ┌─────────────┴┐  ┌───────┴──────┐  ┌─────┴──────────────┐ │
│  │ Agent Slot 1 │  │ Agent Slot 2 │  │ Agent Slot N       │ │
│  │ Coding       │  │ SQL/Data     │  │ (plugavel)         │ │
│  │ Opus 4.6 API │  │ 1.5B local   │  │ qualquer modelo    │ │
│  └──────────────┘  └──────────────┘  └────────────────────┘ │
├──────────────────────────────────────────────────────────────┤
│                    MEMORIA CENTRAL                            │
│  ┌──────────────────────────────────────────────────────────┐ │
│  │              Basic Memory (MCP Server)                    │ │
│  │    Markdown files + SQLite + Vector Embeddings            │ │
│  │    Persistente entre sessoes e agentes                    │ │
│  └──────────────────────────────────────────────────────────┘ │
└──────────────────────────────────────────────────────────────┘
```

## Stack Atual

### Frontend (React + TypeScript + Vite)
- **Desktop**: Interface macOS-style com janelas arrastáveis, dock, menu bar
- **Window Manager**: Zustand store (`useAppStore`) com persist
- **Apps**: Registry plugavel (`appRegistry.ts`)
- **Componentes**: Desktop, Dock, MenuBar, WindowFrame

### Backend (Node.js + Express)
- **Porta**: 3000
- **APIs implementadas**:
  - `/api/browsers/*` - Browser automation via Playwright (criar, navegar, clicar, digitar, screenshot)
  - `/api/pm2/*` - Process manager (listar, restart, stop, logs)
  - `/api/supabase/*` - Supabase CLI proxy (auth, projetos, tabelas, SQL)
  - `/api/github/*` - GitHub CLI proxy (auth, repos, issues, PRs, notificacoes)
  - `/api/smol/chat` - SmolAgent daemon proxy (porta 8082)
  - `/api/launcher/*` - Proxy pro claude-launcher-web (porta 3002)
  - `/ws` - WebSocket para terminal, browser streaming, file watching

### Infra (Vultr - 207.246.65.100)
- **OS**: Ubuntu, 4 CPU, 8GB RAM, sem GPU
- **Processos ativos**:
  - `server.js` (porta 3000) - Frontend + API
  - `smol-daemon.py` (porta 8082) - SmolAgent backend
  - `llama-server` (porta 8080) - Modelo 1.5B local CPU
  - `launcher/server.js` (porta 3002) - Claude launcher
  - `agent-bot` (porta 9090) - Bot auxiliar

## App Registry

O sistema de apps e plugavel. Cada app registrado no `appRegistry.ts`:

| App | ID | Status | Descricao |
|-----|----|--------|-----------|
| Browser | `browser` | Funcional | Web browser com Playwright |
| Terminal | `terminal` | Funcional | Terminal session via launcher |
| Inbox | `inbox` | Placeholder | Task inbox com comments |
| Mission Control | `mission-control` | Placeholder | Kanban board de tarefas |
| Agents | `agents` | Placeholder | Org chart de agentes |
| Finder | `finder` | Placeholder | File browser de workspaces |
| Settings | `settings` | Placeholder | Configuracoes do sistema |

### Interface de um App
```typescript
interface AppRegistryEntry {
  id: string;           // ID unico
  name: string;         // Nome exibido
  icon: string;         // Icone do dock
  description: string;  // Descricao
  component: React.LazyExoticComponent;  // Componente React
  defaultSize: { width, height };
  minSize?: { width, height };
  allowMultiple?: boolean;    // Multiplas instancias
  dockPinned?: boolean;       // Fixado no dock
}
```

## Agent Registry (A IMPLEMENTAR)

Sistema de registro de agentes especializados. Cada agente e um slot plugavel:

```typescript
interface AgentSlot {
  id: string;                  // "coder", "sql", "text", "frontend"
  name: string;                // "Coding Agent"
  description: string;         // "Especializado em..."
  provider: "anthropic" | "openai" | "openrouter" | "huggingface" | "local";
  config: {
    model: string;             // "claude-opus-4-6" ou "agent-os-1b5"
    endpoint?: string;         // URL do endpoint (local ou API)
    apiKey?: string;           // Chave da API
    temperature?: number;
    maxTokens?: number;
  };
  capabilities: string[];     // ["code", "sql", "text", "reasoning"]
  active: boolean;             // Ativado/desativado
}
```

### Agentes Planejados

| Slot | Modelo | Provider | Funcao |
|------|--------|----------|--------|
| **Gestor/Orquestrador** | Llama 3.3 70B | HF Inference API (gratis Pro) | Roteia tarefas, classifica intencao, coordena agentes |
| **Coding** | Claude Opus 4.6 | Anthropic API | Escreve/refatora codigo |
| **SQL/Data** | agent-os-1b5 (custom) | Local llama-server | Queries SQL, Supabase, information_schema |
| **Frontend** | (a definir) | (a definir) | UI/UX, componentes React |
| **Texto** | (a definir) | (a definir) | Criacao de conteudo, copywriting |
| **Pesquisa** | (a definir) | (a definir) | Web search, analise de dados |

### Fluxo de Orquestracao

```
1. Usuario digita mensagem no chat
2. Gestor (Llama 70B) analisa a intencao:
   - "escreve uma funcao que..." → routing: coder
   - "quantas vms ativas..." → routing: sql
   - "cria um texto sobre..." → routing: text
3. Gestor envia pra o agente especializado
4. Agente processa e retorna resultado
5. Gestor formata e entrega ao usuario
6. Memoria Central registra a interacao
```

### Troca de Agentes
O usuario pode a qualquer momento:
- Trocar o modelo de um slot (ex: mudar coder de Opus pra GPT-4)
- Adicionar novo slot
- Desativar um slot
- Escolher manualmente qual agente usar

## Memoria Central: Basic Memory

### O que e
Sistema de memoria persistente baseado em Markdown + SQLite + Vector Embeddings. Opera como MCP Server.

### Arquitetura
```
┌──────────────────────────────────────┐
│          Markdown Files              │
│  - YAML frontmatter (metadata)      │
│  - [category] observations           │
│  - [[wiki-links]] relations          │
├──────────────────────────────────────┤
│          SQLite Index                │
│  - Full-text search                  │
│  - Vector embeddings (FastEmbed)     │
│  - Hybrid search                     │
├──────────────────────────────────────┤
│          MCP Server                  │
│  - memory:// URLs                    │
│  - CRUD de notas                     │
│  - Navegacao semantica               │
│  - Context building                  │
└──────────────────────────────────────┘
```

### Uso no Agent OS
- **Contexto entre sessoes**: Agentes mantem conhecimento entre conversas
- **Knowledge graph**: Relacoes entre entidades (projetos, decisoes, aprendizados)
- **Multi-agente**: Todos os agentes leem/escrevem na mesma memoria
- **Orquestrador documenta**: O gestor registra cada interacao e decisao
- **Humano edita**: Usuario pode editar arquivos Markdown diretamente

### Claude Session Logger
Complementa o Basic Memory registrando automaticamente:
- Sessoes de conversa com Claude
- Ferramentas utilizadas
- Decisoes tomadas
- Erros e solucoes

## Modelos Treinados (Custom)

### agent-os-adapter-1.5b
- **Base**: Qwen 2.5 1.5B Instruct
- **Treino**: LoRA (r=32, alpha=64), 7 epochs, 415 exemplos x4
- **Funcao**: Converter linguagem natural → JSON (SQL, CLI, shell)
- **Deploy**: GGUF Q8 no llama-server (CPU, 1.6GB RAM, ~3s/query)
- **Repos**:
  - Adapter: `devsomosahub/agent-os-adapter-1.5b`
  - Merged: `devsomosahub/agent-os-1b5-merged`

### agent-os-adapter-7b
- **Base**: Qwen 2.5 7B Instruct
- **Treino**: LoRA Q4, mesma config
- **Funcao**: Mesma, mas mais preciso
- **Repos**:
  - Adapter: `devsomosahub/agent-os-adapter-7b`
  - Merged: `devsomosahub/agent-os-7b-merged`

### Limitacao conhecida
Modelos custom inventam nomes de colunas baseados no dataset de treino quando fazem queries diretas. Solucao: fluxo de 2 passos (information_schema primeiro, depois query com colunas reais).

## APIs Externas Utilizadas

| Servico | Uso | Autenticacao |
|---------|-----|-------------|
| HuggingFace (Pro) | Inference API gratis (Llama 70B), treinamento, endpoints | Token HF |
| Anthropic | Claude Opus 4.6 para coding agent | API Key |
| OpenRouter | LLMs alternativos, fallback | API Key |
| Vultr | Servidores (VMs dos boards, server Agent OS) | API Key |
| Supabase | Banco de dados dos projetos (Cloud-Hub, Hubia) | Access Token |
| GitHub | Repos, issues, PRs | gh CLI token |

## Portas do Server (207.246.65.100)

| Porta | Servico | Acesso |
|-------|---------|--------|
| 3000 | Agent OS (frontend + API) | Publico |
| 3002 | Claude Launcher Web | Interno |
| 8080 | llama-server (modelo 1.5B) | Interno |
| 8082 | SmolAgent daemon | Interno |
| 9090 | Agent bot | Interno |

## Proximos Passos

1. **Implementar Agent Registry** - Config JSON de agentes plugaveis
2. **Implementar Orquestrador** - Gestor que roteia entre agentes
3. **Integrar Basic Memory** - MCP Server como memoria central
4. **Integrar Session Logger** - Log automatico de sessoes
5. **Implementar apps Placeholder** - Inbox, Mission Control, Agents, Finder, Settings
6. **Modelo guia/assistente** - Treinar modelo que explica o sistema ao usuario
7. **Dashboard de agentes** - UI para ver/trocar/configurar agentes em tempo real