Spaces:

shubhjn
/

image-encoder

Running

App Files Files Community

image-encoder / DEPLOY.md

shubhjn

complete rewamp

64935ac about 2 months ago

preview code

raw

history blame contribute delete

2.89 kB

	# Image Encoder Microservice 🖼️

	Standalone service for vision-language learning

	## What It Does

	Converts any image into:

	- ✅ 512-dimensional CLIP embeddings
	- ✅ Text representation for LLMs
	- ✅ Auto-sends to cosmo-ai for learning
	- ✅ Runs on FREE HuggingFace CPU tier

	## Quick Deploy

	1. Create HuggingFace Space:

	- Name: `image-encoder`
	- SDK: Docker
	- Hardware: CPU basic (free tier)

	2. Upload files from `/image-encoder/` folder

	3. Update `COSMO_AI_URL` in `app.py` to your cosmo-ai URL

	4. Deploy! ✅

	## How It Works

	```
	[User uploads image]
	↓
	[image-encoder processes with CLIP]
	↓
	[Converts to embedding + text]
	↓
	[Sends to cosmo-ai /api/feed/vision]
	↓
	[Cosmo-AI stores and learns]
	```

	## API Usage

	### Encode Image

	```python
	import requests
	import base64

	# Read image
	with open("photo.jpg", "rb") as f:
	img_data = base64.b64encode(f.read()).decode()

	# Encode and send to cosmo-ai
	response = requests.post(
	"https://YOUR-USERNAME-image-encoder.hf.space/encode",
	json={
	"image_base64": img_data,
	"send_to_cosmo": True # Auto-send to cosmo-ai
	}
	)

	print(response.json())
	```

	### Upload File

	```python
	files = {"file": open("image.png", "rb")}
	response = requests.post(
	"https://YOUR-USERNAME-image-encoder.hf.space/encode/upload",
	files=files,
	params={"send_to_cosmo": True}
	)
	```

	## Features

	### ✅ CPU Optimized

	- Uses CLIP-vit-base-patch32 (150MB)
	- Fast inference on free CPU
	- No GPU needed

	### ✅ Auto Keepalive

	- Pings itself every 20 minutes
	- Prevents space from sleeping
	- Always available

	### ✅ Cosmo-AI Integration

	- Automatic data sending
	- Vision feed endpoint
	- Learning from visual data

	## Cosmo-AI Integration

	Cosmo-AI now has `/api/feed/vision` endpoint that:

	- ✅ Receives image embeddings
	- ✅ Stores up to 1000 images
	- ✅ Provides stats and samples
	- ✅ Enables vision-language learning

	Check stats:

	```bash
	curl https://shubhjn-cosmo-ai.hf.space/api/feed/vision/stats
	```

	## Architecture

	```
	┌─────────────────┐ ┌──────────────────┐
	│ image-encoder │──────▶│ cosmo-ai │
	│ (CPU Space) │ REST │ (Main App) │
	│ │ API │ │
	│ • CLIP Model │ │ • LLM │
	│ • Encoding │ │ • Chat │
	│ • Keepalive │ │ • Vision Feed │
	└─────────────────┘ └──────────────────┘
	```

	## Free & Independent

	- 🆓 Both services run on FREE HuggingFace tier
	- 🔓 No restrictions, no API limits
	- 🚀 Independent microservices
	- ♾️ Keepalive prevents sleeping

	Deploy and enjoy vision-enabled AI! 🎉