alphaDepth / README.md
prostochel097's picture
Update README.md
7ff512a verified
metadata
license: apache-2.0
tags:
  - depth-estimation
  - robotics
  - computer-vision
  - pytorch
  - safetensors
datasets:
  - custom-pybullet-synthetic
metrics:
  - mse
library_name: transformers

AlphaDepth v1.0 👁️

AlphaDepth — это легковесная нейросеть для оценки глубины (Depth Estimation), обученная в симуляции PyBullet. Модель принимает RGB-изображение и предсказывает карту глубины (Depth Map), позволяя роботам "видеть" расстояние до объектов с помощью одной камеры.

Входит в серию моделей Alpha.

📊 Характеристики

  • Архитектура: Custom U-Net с BatchNorm
  • Вход: RGB Image (128x128)
  • Выход: Depth Map (Normalized 0..1)
  • Вес: ~1.5 MB (FP32)
  • Формат: SafeTensors

🚀 Использование

Вам понадобится safetensors и файл model.py из этого репозитория.

import torch
from model import AlphaUNet
from PIL import Image
from torchvision import transforms

# 1. Загрузка модели
model = AlphaUNet.from_pretrained(".") # Укажите путь к папке
model.eval()

# 2. Подготовка изображения
img = Image.open("robot_view.jpg").resize((128, 128))
transform = transforms.Compose([
    transforms.ToTensor(), # 0..255 -> 0..1
])
input_tensor = transform(img).unsqueeze(0)

# 3. Инференс
with torch.no_grad():
    depth_map = model(input_tensor)

# depth_map теперь содержит расстояния!

🛠 Обучение

Модель обучалась на синтетическом датасете, сгенерированном в движке PyBullet.

  • Эпохи: 20
  • Loss: 0.0016 (MSE)
  • Оптимизатор: Adam (lr=0.001)

📦 Файлы

  • model.safetensors: Веса модели (SafeTensors формат).
  • config.json: Конфигурация архитектуры.
  • model.py: Исходный код класса нейросети.

Created by prostochel097 for the Alpha Series.