--- license: apache-2.0 tags: - depth-estimation - robotics - computer-vision - pytorch - safetensors datasets: - custom-pybullet-synthetic metrics: - mse library_name: transformers --- # AlphaDepth v1.0 πŸ‘οΈ **AlphaDepth** β€” это лСгковСсная Π½Π΅ΠΉΡ€ΠΎΡΠ΅Ρ‚ΡŒ для ΠΎΡ†Π΅Π½ΠΊΠΈ Π³Π»ΡƒΠ±ΠΈΠ½Ρ‹ (Depth Estimation), обучСнная Π² симуляции PyBullet. МодСль ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Π΅Ρ‚ RGB-ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ ΠΈ прСдсказываСт ΠΊΠ°Ρ€Ρ‚Ρƒ Π³Π»ΡƒΠ±ΠΈΠ½Ρ‹ (Depth Map), позволяя Ρ€ΠΎΠ±ΠΎΡ‚Π°ΠΌ "Π²ΠΈΠ΄Π΅Ρ‚ΡŒ" расстояниС Π΄ΠΎ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΎΠ΄Π½ΠΎΠΉ ΠΊΠ°ΠΌΠ΅Ρ€Ρ‹. Π’Ρ…ΠΎΠ΄ΠΈΡ‚ Π² ΡΠ΅Ρ€ΠΈΡŽ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ **Alpha**. ## πŸ“Š Π₯арактСристики - **АрхитСктура:** Custom U-Net с BatchNorm - **Π’Ρ…ΠΎΠ΄:** RGB Image (128x128) - **Π’Ρ‹Ρ…ΠΎΠ΄:** Depth Map (Normalized 0..1) - **ВСс:** ~1.5 MB (FP32) - **Π€ΠΎΡ€ΠΌΠ°Ρ‚:** SafeTensors ## πŸš€ ИспользованиС Π’Π°ΠΌ понадобится `safetensors` ΠΈ Ρ„Π°ΠΉΠ» `model.py` ΠΈΠ· этого рСпозитория. ```python import torch from model import AlphaUNet from PIL import Image from torchvision import transforms # 1. Π—Π°Π³Ρ€ΡƒΠ·ΠΊΠ° ΠΌΠΎΠ΄Π΅Π»ΠΈ model = AlphaUNet.from_pretrained(".") # Π£ΠΊΠ°ΠΆΠΈΡ‚Π΅ ΠΏΡƒΡ‚ΡŒ ΠΊ ΠΏΠ°ΠΏΠΊΠ΅ model.eval() # 2. ΠŸΠΎΠ΄Π³ΠΎΡ‚ΠΎΠ²ΠΊΠ° изобраТСния img = Image.open("robot_view.jpg").resize((128, 128)) transform = transforms.Compose([ transforms.ToTensor(), # 0..255 -> 0..1 ]) input_tensor = transform(img).unsqueeze(0) # 3. Π˜Π½Ρ„Π΅Ρ€Π΅Π½Ρ with torch.no_grad(): depth_map = model(input_tensor) # depth_map Ρ‚Π΅ΠΏΠ΅Ρ€ΡŒ содСрТит расстояния! ``` ## πŸ›  ΠžΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ МодСль ΠΎΠ±ΡƒΡ‡Π°Π»Π°ΡΡŒ Π½Π° **синтСтичСском датасСтС**, сгСнСрированном Π² Π΄Π²ΠΈΠΆΠΊΠ΅ PyBullet. - **Π­ΠΏΠΎΡ…ΠΈ:** 20 - **Loss:** 0.0016 (MSE) - **ΠžΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ‚ΠΎΡ€:** Adam (lr=0.001) ## πŸ“¦ Π€Π°ΠΉΠ»Ρ‹ - `model.safetensors`: ВСса ΠΌΠΎΠ΄Π΅Π»ΠΈ (SafeTensors Ρ„ΠΎΡ€ΠΌΠ°Ρ‚). - `config.json`: ΠšΠΎΠ½Ρ„ΠΈΠ³ΡƒΡ€Π°Ρ†ΠΈΡ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Ρ‹. - `model.py`: Π˜ΡΡ…ΠΎΠ΄Π½Ρ‹ΠΉ ΠΊΠΎΠ΄ класса нСйросСти. *Created by prostochel097 for the Alpha Series.*