Aleton commited on
Commit
901ffbc
·
verified ·
1 Parent(s): 2702878

Upload folder using huggingface_hub

Browse files
Files changed (3) hide show
  1. README.md +36 -0
  2. config.json +22 -0
  3. model.pt +3 -0
README.md ADDED
@@ -0,0 +1,36 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+
2
+ # 🚗 Autopilot Qwen3-VL
3
+
4
+ Vision-Language модель для предсказания скорости и угла поворота руля по изображению дороги.
5
+
6
+ ## Метрики (на тестовой выборке)
7
+ - **Speed MAE:** 4.12 km/h
8
+ - **Speed R²:** 0.9669
9
+ - **Steering MAE:** 0.385 N
10
+ - **Steering R²:** 0.8364
11
+
12
+ ## Использование
13
+
14
+ ```python
15
+ from autopilot_inference import AutopilotInference
16
+
17
+ # Загрузка
18
+ autopilot = AutopilotInference.from_pretrained("YOUR_USERNAME/autopilot-qwen3-vl")
19
+
20
+ # Инференс
21
+ from PIL import Image
22
+ image = Image.open("road.jpg")
23
+ result = autopilot.predict(image)
24
+
25
+ print(f"Speed: {result['speed_kmh']:.1f} km/h")
26
+ print(f"Steering: {result['steering_N']:.3f} N")
27
+ Архитектура
28
+ Base: Qwen3-VL-2B-Instruct (с LoRA fine-tuning)
29
+ Head: MLP регрессионная голова (3 слоя)
30
+ Output: [speed_kmh, steering_torque_N]
31
+ Обучение
32
+ Данные: 5000 кадров из SADC dataset
33
+ Эпохи: 15
34
+ Время: ~2 часа на RTX GPU
35
+ Ограничения
36
+ ⚠️ Это исследовательский проект, НЕ для реального автопилота!
config.json ADDED
@@ -0,0 +1,22 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "base_model": "Qwen/Qwen3-VL-2B-Instruct",
3
+ "image_size": 384,
4
+ "hidden_dim": 512,
5
+ "num_regression_layers": 3,
6
+ "dropout": 0.15,
7
+ "lora_r": 8,
8
+ "lora_alpha": 16,
9
+ "lora_dropout": 0.05,
10
+ "stats": {
11
+ "speed_mean": 77.0,
12
+ "speed_std": 31.5,
13
+ "steer_mean": 0.22,
14
+ "steer_std": 1.26
15
+ },
16
+ "metrics": {
17
+ "speed_mae_kmh": 4.12,
18
+ "speed_r2": 0.9669,
19
+ "steer_mae_N": 0.385,
20
+ "steer_r2": 0.8364
21
+ }
22
+ }
model.pt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:976ec4de8aa826d5df3f59044ac4498e9d48c2c52b3f7c87955103fbd6567cba
3
+ size 4313148065