Spaces:

tokgae
/

cora

Sleeping

File size: 5,275 Bytes

38ab39c

# Architecture Overview

## System Design Philosophy

Cora is built on three core principles:

1. **Graceful Degradation**: Never fail completely; always serve a visual result
2. **RAG over Fine-Tuning**: Use museum archives to provide context without costly training
3. **Hybrid Intelligence**: Combine AI generation with curated historical data

---

## Component Architecture

### Layer 1: Interface
- **UI (Gradio)**: `ui.py` - Testing/demo interface
- **Etymology API (FastAPI)**: `etymology_api.py` - Production integration endpoint

### Layer 2: Generation Pipeline
```

CoraCurator → CoraEngine → CoraVision → CoraMemory

   (LLM)       (SDXL)       (CLIP)      (ChromaDB)

```

### Layer 3: Data Sources
- **Primary**: Hugging Face Inference API (SDXL-Lightning)
- **Fallback**: Museum Archives (Smithsonian + Met)

---

## Data Flow

### Generation Request Flow
```

1. User Request

   ↓

2. Curator: Refine prompt with LLM

   ↓

3. Engine: Attempt SDXL generation

   ├─ Success → Continue to step 4

   └─ 402 Error → RAG Fallback

       ↓

       Search Memory by embedding

       ↓

       Return museum artifact

   ↓

4. Vision: Generate embedding + tags

   ↓

5. Memory: Archive for future retrieval

   ↓

6. Response: Image URL + metadata

```

### Ingestion Flow (Museums)
```

1. Loader (smithsonian_loader.py or met_loader.py)

   ↓

2. API Query → Download images

   ↓

3. Vision: Generate embedding + detect tags

   ↓

4. Memory: Index with metadata

   ↓

5. Persistent storage in ChromaDB

```

---

## Search Strategy

### Hybrid Search Algorithm

**Input:** Query text (e.g., "roman armor")

**Process:**
1. **Text → Vector**: CLIP text encoder
2. **Keyword Detection**: Extract cultural markers ("roman", "greek", etc.)
3. **Over-Retrieve**: Fetch 3x candidates via semantic search
4. **Filter**: Apply tag constraints (must contain "roman")
5. **Rank**: Return top-k filtered results

**Advantage:** Prevents irrelevant matches (e.g., "roman" in "Roman Catholic art")

---

## Model Details

### CoraCurator (LLM)
- **Model**: `meta-llama/Llama-3.2-3B-Instruct`
- **Purpose**: Prompt refinement
- **System Instruction**: Guide toward "Daily Life" or "Epic Dimension" scenes
- **Context**: Etymology → Visual description

### CoraEngine (Image Gen)
- **Primary Model**: `ByteDance/SDXL-Lightning`
- **Params**: `guidance_scale=0.0`, `steps=4`
- **Style**: Historical Illustration / Strategy Game Art
- **Fallback**: RAG → Museum artifacts

### CoraVision (Embeddings)
- **CLIP Model**: `sentence-transformers/clip-ViT-L-14`
- **Output**: 768-dimensional vectors
- **YOLO**: `yolov8n.pt` for object detection/tagging

### CoraMemory (Vector DB)
- **Database**: ChromaDB (persistent, local)
- **Storage**: `./archive_db`
- **Metadata Schema**:
  - `path`: Local file path
  - `prompt`: Original search query
  - `tags`: Comma-separated (e.g., "roman,armor,met_museum_open_access")

  - `timestamp`: ISO format



---



## API Design



### Etymology API Endpoints



#### POST `/api/v1/generate_illustration`
**Purpose**: Single endpoint for full pipeline

**Design Decisions**:
- Returns both `image_url` and `image_base64` (flexibility)
- Includes `source` field ("generated" vs "archive")
- Auto-archives all results for future retrieval
- CORS-enabled for cross-origin integration

#### GET `/api/v1/search_archive`

**Purpose**: Direct access to historical artifacts



**Use Case**: Browse mode in etymology app



#### GET `/health`

**Purpose**: Monitor component status



**Returns**:

```json

{

  "status": "healthy",

  "components": {

    "engine": true,

    "curator": true,

    "vision": true,

    "memory": true

  }

}

```



---



## Scaling Considerations



### Current Constraints

- **Single Instance**: No load balancing

- **Local Storage**: ChromaDB in-process

- **API Limits**: HF free tier (402 errors common)



### Future Optimizations

1. **Archive Curator (Priority)**: Intelligent system to manage and curate the museum archive

   - **Auto-Tagging**: Enhance metadata with historical period, culture, object type

   - **Quality Scoring**: Rate artifact relevance for different etymology contexts

   - **Deduplication**: Detect and merge similar artifacts

   - **Smart Indexing**: Organize by historical timeline, geography, theme

   - **Active Curation**: Suggest best artifacts for specific words/contexts

   - **Gap Analysis**: Identify missing periods/cultures and trigger targeted ingestion

   

2. **Caching**: Hash etymology text → serve cached images

3. **Queue System**: Celery for async generation

4. **CDN**: Serve `archive_images/` via CloudFront/similar
5. **Model Hosting**: Self-host SDXL on GPU server to avoid 402 errors

---

## Security Notes

### API Keys
- Stored in `.env` (gitignored)
- Never exposed in responses or logs

### CORS
- Currently set to `allow_origins=["*"]` for development
- **Production**: Restrict to etymology app domain

### Static Files
- `archive_images/` served directly via FastAPI
- No authentication (museum artifacts are public domain)
- Consider rate limiting for public deployments