Spaces:

AI-Naga
/

YOLO_V7_Object_Tracking

Runtime error

App Files Files Community

NAGA commited on Jan 8, 2023

Commit

6748ade

1 Parent(s): 1298564

Upload 182 files

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

.DS_Store +0 -0
.gitattributes +4 -0
.gitignore +5 -0
Readme.md +85 -0
__pycache__/yolo_v7.cpython-310.pyc +0 -0
__pycache__/yolo_v7.cpython-39.pyc +0 -0
__pycache__/yolor.cpython-39.pyc +0 -0
byte_track/__init__.py +3 -0
byte_track/__pycache__/__init__.cpython-310.pyc +0 -0
byte_track/__pycache__/__init__.cpython-39.pyc +0 -0
byte_track/__pycache__/bytetracker.cpython-310.pyc +0 -0
byte_track/__pycache__/bytetracker.cpython-39.pyc +0 -0
byte_track/bytetracker.py +106 -0
byte_track/tracker/__init__.py +4 -0
byte_track/tracker/__pycache__/__init__.cpython-310.pyc +0 -0
byte_track/tracker/__pycache__/__init__.cpython-39.pyc +0 -0
byte_track/tracker/__pycache__/basetrack.cpython-310.pyc +0 -0
byte_track/tracker/__pycache__/basetrack.cpython-39.pyc +0 -0
byte_track/tracker/__pycache__/byte_tracker.cpython-310.pyc +0 -0
byte_track/tracker/__pycache__/byte_tracker.cpython-39.pyc +0 -0
byte_track/tracker/__pycache__/kalman_filter.cpython-310.pyc +0 -0
byte_track/tracker/__pycache__/kalman_filter.cpython-39.pyc +0 -0
byte_track/tracker/__pycache__/matching.cpython-310.pyc +0 -0
byte_track/tracker/__pycache__/matching.cpython-39.pyc +0 -0
byte_track/tracker/basetrack.py +52 -0
byte_track/tracker/byte_tracker.py +326 -0
byte_track/tracker/kalman_filter.py +270 -0
byte_track/tracker/matching.py +178 -0
cfg/yolor_csp.cfg +1376 -0
cfg/yolor_csp_x.cfg +1576 -0
cfg/yolor_p6.cfg +1760 -0
cfg/yolor_w6.cfg +1760 -0
cfg/yolov4_csp.cfg +1334 -0
cfg/yolov4_csp_x.cfg +1534 -0
cfg/yolov4_p6.cfg +2260 -0
cfg/yolov4_p7.cfg +2714 -0
data/coco.names +80 -0
data/coco.yaml +18 -0
data/hyp.finetune.1280.yaml +28 -0
data/hyp.scratch.1280.yaml +28 -0
data/hyp.scratch.640.yaml +28 -0
deep_sort_pytorch/.DS_Store +0 -0
deep_sort_pytorch/.gitignore +13 -0
deep_sort_pytorch/LICENSE +21 -0
deep_sort_pytorch/README.md +137 -0
deep_sort_pytorch/configs/deep_sort.yaml +10 -0
deep_sort_pytorch/deep_sort/.DS_Store +0 -0
deep_sort_pytorch/deep_sort/README.md +3 -0
deep_sort_pytorch/deep_sort/__init__.py +21 -0
deep_sort_pytorch/deep_sort/__pycache__/__init__.cpython-310.pyc +0 -0

.DS_Store ADDED Viewed

Binary file (10.2 kB). View file

.gitattributes CHANGED Viewed

@@ -32,3 +32,7 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+deep_sort_pytorch/deep_sort/deep/checkpoint/ckpt.t7 filter=lfs diff=lfs merge=lfs -text
+inference/output/results.mp4 filter=lfs diff=lfs merge=lfs -text
+results.mp4 filter=lfs diff=lfs merge=lfs -text
+test.mp4 filter=lfs diff=lfs merge=lfs -text

.gitignore ADDED Viewed

	@@ -0,0 +1,5 @@

+.env/
+**__pycache__**
+*.onnx
+*.pt
+yolov7/weights/

Readme.md ADDED Viewed

	@@ -0,0 +1,85 @@

+# Yolov7 with ByteTrack
+1. Clone repo.
+```
+git clone https://github.com/axcelerateai/yolov7-bytetrack-streamlit.git
+cd yolov7-bytetrack-streamlit
+```
+2. Install requirements.
+### Pip
+```
+python3 -m venv .env
+source .env/bin/activate
+```
+```
+pip install Cython numpy
+```
+```
+pip install -r requirements.txt
+```
+- [Note]: `cython_bbox` have no windows distribution on pypi. If you're a windows user then run following command to install `cython_bbox` from source.
+```
+# for windows
+pip install -e git+https://github.com/samson-wang/cython_bbox.git#egg=cython-bbox
+# for linux
+pip install cython-bbox
+```
+### conda
+```
+conda env create -f environment.yml
+```
+```
+conda activate yolov7_bytetrack
+```
+- [Note]: `cython_bbox` have no windows distribution on pypi. If you're a windows user then run following command to install `cython_bbox` from source.
+```
+# for windows
+pip install -e git+https://github.com/samson-wang/cython_bbox.git#egg=cython-bbox
+# for linux
+pip install cython-bbox
+```
+3. Download weights.
+```
+python download_weights.py
+```
+4. Run stremlit server
+```
+streamlit run yolov7-tiny-demo.py --server.port [LPORT]
+```
+- `LPORT` = Local port of system
+### Test yolov7-tiny
+- To run Yolov7-Tiny
+```
+streamlit run yolov7-tiny-demo.py --server.port 2085
+```
+### Test yolov7
+```
+streamlit run yolov7-demo.py --server.port 2085
+```
+### Test yolor
+```
+streamlit run yolor-demo.py --server.port 2085
+```

__pycache__/yolo_v7.cpython-310.pyc ADDED Viewed

Binary file (13.8 kB). View file

__pycache__/yolo_v7.cpython-39.pyc ADDED Viewed

Binary file (13.7 kB). View file

__pycache__/yolor.cpython-39.pyc ADDED Viewed

Binary file (12.4 kB). View file

byte_track/__init__.py ADDED Viewed

	@@ -0,0 +1,3 @@

+import sys
+import os
+sys.path.append(os.path.dirname(__file__))

byte_track/__pycache__/__init__.cpython-310.pyc ADDED Viewed

Binary file (259 Bytes). View file

byte_track/__pycache__/__init__.cpython-39.pyc ADDED Viewed

Binary file (247 Bytes). View file

byte_track/__pycache__/bytetracker.cpython-310.pyc ADDED Viewed

Binary file (2.76 kB). View file

byte_track/__pycache__/bytetracker.cpython-39.pyc ADDED Viewed

Binary file (2.74 kB). View file

byte_track/bytetracker.py ADDED Viewed

	@@ -0,0 +1,106 @@

+from .tracker.byte_tracker import BYTETracker
+import cv2
+import numpy as np
+class ByteTrack(object):
+    def __init__(self, detector, min_box_area=10):
+        self.min_box_area = min_box_area
+        self.rgb_means = (0.485, 0.456, 0.406)
+        self.std = (0.229, 0.224, 0.225)
+        self.detector = detector
+        self.input_shape = tuple(detector.model.get_inputs()[0].shape[2:])
+        self.tracker = BYTETracker(frame_rate=30)
+    def inference(self, image, conf_thresh=0.25, classes=None):
+        dets, image_info = self.detector.detect(image, conf_thres=conf_thresh, input_shape=self.input_shape, classes=classes)
+        class_ids=[]
+        ids=[]
+        bboxes=[]
+        scores=[]
+        if isinstance(dets, np.ndarray) and len(dets) > 0:
+            class_ids = dets[:, -1].tolist()
+            bboxes, ids, scores = self._tracker_update(
+                dets,
+                image_info,
+            )
+            # image = self.draw_tracking_info(
+            #     image,
+            #     bboxes,
+            #     ids,
+            #     scores,
+            # )
+        # return image, len(bboxes), class_ids
+        return bboxes, ids, scores, class_ids
+    def get_id_color(self, index):
+        temp_index = abs(int(index)) * 3
+        color = ((37 * temp_index) % 255, (17 * temp_index) % 255,
+                (29 * temp_index) % 255)
+        return color
+    def draw_tracking_info(
+        self,
+        image,
+        tlwhs,
+        ids,
+        scores,
+        frame_id=0,
+        elapsed_time=0.,
+    ):
+        text_scale = 1.5
+        text_thickness = 2
+        line_thickness = 2
+        # text = 'frame: %d ' % (frame_id)
+        # text += 'elapsed time: %.0fms ' % (elapsed_time * 1000)
+        # text += 'num: %d' % (len(tlwhs))
+        # cv2.putText(
+        #     image,
+        #     text,
+        #     (0, int(15 * text_scale)),
+        #     cv2.FONT_HERSHEY_PLAIN,
+        #     2,
+        #     (0, 255, 0),
+        #     thickness=text_thickness,
+        # )
+        for index, tlwh in enumerate(tlwhs):
+            x1, y1 = int(tlwh[0]), int(tlwh[1])
+            x2, y2 = x1 + int(tlwh[2]), y1 + int(tlwh[3])
+            color = self.get_id_color(ids[index])
+            cv2.rectangle(image, (x1, y1), (x2, y2), color, line_thickness)
+            text = str(ids[index])
+            cv2.putText(image, text, (x1, y1 - 5), cv2.FONT_HERSHEY_PLAIN,
+                        text_scale, (0, 0, 0), text_thickness + 3)
+            cv2.putText(image, text, (x1, y1 - 5), cv2.FONT_HERSHEY_PLAIN,
+                        text_scale, (255, 255, 255), text_thickness)
+        return image
+    def _tracker_update(self, dets, image_info):
+        online_targets = []
+        if dets is not None:
+            online_targets = self.tracker.update(
+                dets[:, :-1],
+                [image_info['height'], image_info['width']],
+                [image_info['height'], image_info['width']],
+            )
+        online_tlwhs = []
+        online_ids = []
+        online_scores = []
+        for online_target in online_targets:
+            tlwh = online_target.tlwh
+            track_id = online_target.track_id
+            vertical = tlwh[2] / tlwh[3] > 1.6
+            if tlwh[2] * tlwh[3] > self.min_box_area and not vertical:
+                online_tlwhs.append(tlwh)
+                online_ids.append(track_id)
+                online_scores.append(online_target.score)
+        return online_tlwhs, online_ids, online_scores

byte_track/tracker/__init__.py ADDED Viewed

	@@ -0,0 +1,4 @@

+import sys
+import os
+sys.path.append(os.path.dirname(__file__))

byte_track/tracker/__pycache__/__init__.cpython-310.pyc ADDED Viewed

Binary file (267 Bytes). View file

byte_track/tracker/__pycache__/__init__.cpython-39.pyc ADDED Viewed

Binary file (255 Bytes). View file

byte_track/tracker/__pycache__/basetrack.cpython-310.pyc ADDED Viewed

Binary file (1.84 kB). View file

byte_track/tracker/__pycache__/basetrack.cpython-39.pyc ADDED Viewed

Binary file (1.87 kB). View file

byte_track/tracker/__pycache__/byte_tracker.cpython-310.pyc ADDED Viewed

Binary file (9.43 kB). View file

byte_track/tracker/__pycache__/byte_tracker.cpython-39.pyc ADDED Viewed

Binary file (9.43 kB). View file

byte_track/tracker/__pycache__/kalman_filter.cpython-310.pyc ADDED Viewed

Binary file (8.11 kB). View file

byte_track/tracker/__pycache__/kalman_filter.cpython-39.pyc ADDED Viewed

Binary file (8.09 kB). View file

byte_track/tracker/__pycache__/matching.cpython-310.pyc ADDED Viewed

Binary file (6.12 kB). View file

byte_track/tracker/__pycache__/matching.cpython-39.pyc ADDED Viewed

Binary file (6.36 kB). View file

byte_track/tracker/basetrack.py ADDED Viewed

	@@ -0,0 +1,52 @@

+import numpy as np
+from collections import OrderedDict
+class TrackState(object):
+    New = 0
+    Tracked = 1
+    Lost = 2
+    Removed = 3
+class BaseTrack(object):
+    _count = 0
+    track_id = 0
+    is_activated = False
+    state = TrackState.New
+    history = OrderedDict()
+    features = []
+    curr_feature = None
+    score = 0
+    start_frame = 0
+    frame_id = 0
+    time_since_update = 0
+    # multi-camera
+    location = (np.inf, np.inf)
+    @property
+    def end_frame(self):
+        return self.frame_id
+    @staticmethod
+    def next_id():
+        BaseTrack._count += 1
+        return BaseTrack._count
+    def activate(self, *args):
+        raise NotImplementedError
+    def predict(self):
+        raise NotImplementedError
+    def update(self, *args, **kwargs):
+        raise NotImplementedError
+    def mark_lost(self):
+        self.state = TrackState.Lost
+    def mark_removed(self):
+        self.state = TrackState.Removed

byte_track/tracker/byte_tracker.py ADDED Viewed

	@@ -0,0 +1,326 @@

+import numpy as np
+from .kalman_filter import KalmanFilter
+import matching
+from .basetrack import BaseTrack, TrackState
+class STrack(BaseTrack):
+    shared_kalman = KalmanFilter()
+    def __init__(self, tlwh, score):
+        # wait activate
+        self._tlwh = np.asarray(tlwh, dtype=np.float)
+        self.kalman_filter = None
+        self.mean, self.covariance = None, None
+        self.is_activated = False
+        self.score = score
+        self.tracklet_len = 0
+    def predict(self):
+        mean_state = self.mean.copy()
+        if self.state != TrackState.Tracked:
+            mean_state[7] = 0
+        self.mean, self.covariance = self.kalman_filter.predict(mean_state, self.covariance)
+    @staticmethod
+    def multi_predict(stracks):
+        if len(stracks) > 0:
+            multi_mean = np.asarray([st.mean.copy() for st in stracks])
+            multi_covariance = np.asarray([st.covariance for st in stracks])
+            for i, st in enumerate(stracks):
+                if st.state != TrackState.Tracked:
+                    multi_mean[i][7] = 0
+            multi_mean, multi_covariance = STrack.shared_kalman.multi_predict(multi_mean, multi_covariance)
+            for i, (mean, cov) in enumerate(zip(multi_mean, multi_covariance)):
+                stracks[i].mean = mean
+                stracks[i].covariance = cov
+    def activate(self, kalman_filter, frame_id):
+        """Start a new tracklet"""
+        self.kalman_filter = kalman_filter
+        self.track_id = self.next_id()
+        self.mean, self.covariance = self.kalman_filter.initiate(self.tlwh_to_xyah(self._tlwh))
+        self.tracklet_len = 0
+        self.state = TrackState.Tracked
+        if frame_id == 1:
+            self.is_activated = True
+        # self.is_activated = True
+        self.frame_id = frame_id
+        self.start_frame = frame_id
+    def re_activate(self, new_track, frame_id, new_id=False):
+        self.mean, self.covariance = self.kalman_filter.update(
+            self.mean, self.covariance, self.tlwh_to_xyah(new_track.tlwh)
+        )
+        self.tracklet_len = 0
+        self.state = TrackState.Tracked
+        self.is_activated = True
+        self.frame_id = frame_id
+        if new_id:
+            self.track_id = self.next_id()
+        self.score = new_track.score
+    def update(self, new_track, frame_id):
+        """
+        Update a matched track
+        :type new_track: STrack
+        :type frame_id: int
+        :type update_feature: bool
+        :return:
+        """
+        self.frame_id = frame_id
+        self.tracklet_len += 1
+        new_tlwh = new_track.tlwh
+        self.mean, self.covariance = self.kalman_filter.update(
+            self.mean, self.covariance, self.tlwh_to_xyah(new_tlwh))
+        self.state = TrackState.Tracked
+        self.is_activated = True
+        self.score = new_track.score
+    @property
+    # @jit(nopython=True)
+    def tlwh(self):
+        """Get current position in bounding box format `(top left x, top left y,
+                width, height)`.
+        """
+        if self.mean is None:
+            return self._tlwh.copy()
+        ret = self.mean[:4].copy()
+        ret[2] *= ret[3]
+        ret[:2] -= ret[2:] / 2
+        return ret
+    @property
+    # @jit(nopython=True)
+    def tlbr(self):
+        """Convert bounding box to format `(min x, min y, max x, max y)`, i.e.,
+        `(top left, bottom right)`.
+        """
+        ret = self.tlwh.copy()
+        ret[2:] += ret[:2]
+        return ret
+    @staticmethod
+    # @jit(nopython=True)
+    def tlwh_to_xyah(tlwh):
+        """Convert bounding box to format `(center x, center y, aspect ratio,
+        height)`, where the aspect ratio is `width / height`.
+        """
+        ret = np.asarray(tlwh).copy()
+        ret[:2] += ret[2:] / 2
+        ret[2] /= ret[3]
+        return ret
+    def to_xyah(self):
+        return self.tlwh_to_xyah(self.tlwh)
+    @staticmethod
+    # @jit(nopython=True)
+    def tlbr_to_tlwh(tlbr):
+        ret = np.asarray(tlbr).copy()
+        ret[2:] -= ret[:2]
+        return ret
+    @staticmethod
+    # @jit(nopython=True)
+    def tlwh_to_tlbr(tlwh):
+        ret = np.asarray(tlwh).copy()
+        ret[2:] += ret[:2]
+        return ret
+    def __repr__(self):
+        return 'OT_{}_({}-{})'.format(self.track_id, self.start_frame, self.end_frame)
+class BYTETracker(object):
+    def __init__(self, track_thresh=0.5,match_thresh=0.8, track_buffer=30, mot20=False, frame_rate=30):
+        self.tracked_stracks = []  # type: list[STrack]
+        self.lost_stracks = []  # type: list[STrack]
+        self.removed_stracks = []  # type: list[STrack]
+        self.track_thresh = track_thresh
+        self.track_buffer = track_buffer
+        self.mot20 = mot20
+        self.match_thresh = match_thresh
+        self.frame_id = 0
+        self.det_thresh = track_thresh + 0.1
+        self.buffer_size = int(frame_rate / 30.0 * self.track_buffer)
+        self.max_time_lost = self.buffer_size
+        self.kalman_filter = KalmanFilter()
+    def update(self, output_results, img_info, img_size):
+        self.frame_id += 1
+        activated_starcks = []
+        refind_stracks = []
+        lost_stracks = []
+        removed_stracks = []
+        if output_results.shape[1] == 5:
+            scores = output_results[:, 4]
+            bboxes = output_results[:, :4]
+        else:
+            output_results = output_results.cpu().numpy()
+            scores = output_results[:, 4] * output_results[:, 5]
+            bboxes = output_results[:, :4]  # x1y1x2y2
+        img_h, img_w = img_info[0], img_info[1]
+        scale = min(img_size[0] / float(img_h), img_size[1] / float(img_w))
+        bboxes /= scale
+        remain_inds = scores > self.track_thresh
+        inds_low = scores > 0.1
+        inds_high = scores < self.track_thresh
+        inds_second = np.logical_and(inds_low, inds_high)
+        dets_second = bboxes[inds_second]
+        dets = bboxes[remain_inds]
+        scores_keep = scores[remain_inds]
+        scores_second = scores[inds_second]
+        if len(dets) > 0:
+            '''Detections'''
+            detections = [STrack(STrack.tlbr_to_tlwh(tlbr), s) for
+                          (tlbr, s) in zip(dets, scores_keep)]
+        else:
+            detections = []
+        ''' Add newly detected tracklets to tracked_stracks'''
+        unconfirmed = []
+        tracked_stracks = []  # type: list[STrack]
+        for track in self.tracked_stracks:
+            if not track.is_activated:
+                unconfirmed.append(track)
+            else:
+                tracked_stracks.append(track)
+        ''' Step 2: First association, with high score detection boxes'''
+        strack_pool = joint_stracks(tracked_stracks, self.lost_stracks)
+        # Predict the current location with KF
+        STrack.multi_predict(strack_pool)
+        dists = matching.iou_distance(strack_pool, detections)
+        if not self.mot20:
+            dists = matching.fuse_score(dists, detections)
+        matches, u_track, u_detection = matching.linear_assignment(dists, thresh=self.match_thresh)
+        for itracked, idet in matches:
+            track = strack_pool[itracked]
+            det = detections[idet]
+            if track.state == TrackState.Tracked:
+                track.update(detections[idet], self.frame_id)
+                activated_starcks.append(track)
+            else:
+                track.re_activate(det, self.frame_id, new_id=False)
+                refind_stracks.append(track)
+        ''' Step 3: Second association, with low score detection boxes'''
+        # association the untrack to the low score detections
+        if len(dets_second) > 0:
+            '''Detections'''
+            detections_second = [STrack(STrack.tlbr_to_tlwh(tlbr), s) for
+                          (tlbr, s) in zip(dets_second, scores_second)]
+        else:
+            detections_second = []
+        r_tracked_stracks = [strack_pool[i] for i in u_track if strack_pool[i].state == TrackState.Tracked]
+        dists = matching.iou_distance(r_tracked_stracks, detections_second)
+        matches, u_track, u_detection_second = matching.linear_assignment(dists, thresh=0.5)
+        for itracked, idet in matches:
+            track = r_tracked_stracks[itracked]
+            det = detections_second[idet]
+            if track.state == TrackState.Tracked:
+                track.update(det, self.frame_id)
+                activated_starcks.append(track)
+            else:
+                track.re_activate(det, self.frame_id, new_id=False)
+                refind_stracks.append(track)
+        for it in u_track:
+            track = r_tracked_stracks[it]
+            if not track.state == TrackState.Lost:
+                track.mark_lost()
+                lost_stracks.append(track)
+        '''Deal with unconfirmed tracks, usually tracks with only one beginning frame'''
+        detections = [detections[i] for i in u_detection]
+        dists = matching.iou_distance(unconfirmed, detections)
+        if not self.mot20:
+            dists = matching.fuse_score(dists, detections)
+        matches, u_unconfirmed, u_detection = matching.linear_assignment(dists, thresh=0.7)
+        for itracked, idet in matches:
+            unconfirmed[itracked].update(detections[idet], self.frame_id)
+            activated_starcks.append(unconfirmed[itracked])
+        for it in u_unconfirmed:
+            track = unconfirmed[it]
+            track.mark_removed()
+            removed_stracks.append(track)
+        """ Step 4: Init new stracks"""
+        for inew in u_detection:
+            track = detections[inew]
+            if track.score < self.det_thresh:
+                continue
+            track.activate(self.kalman_filter, self.frame_id)
+            activated_starcks.append(track)
+        """ Step 5: Update state"""
+        for track in self.lost_stracks:
+            if self.frame_id - track.end_frame > self.max_time_lost:
+                track.mark_removed()
+                removed_stracks.append(track)
+        # print('Ramained match {} s'.format(t4-t3))
+        self.tracked_stracks = [t for t in self.tracked_stracks if t.state == TrackState.Tracked]
+        self.tracked_stracks = joint_stracks(self.tracked_stracks, activated_starcks)
+        self.tracked_stracks = joint_stracks(self.tracked_stracks, refind_stracks)
+        self.lost_stracks = sub_stracks(self.lost_stracks, self.tracked_stracks)
+        self.lost_stracks.extend(lost_stracks)
+        self.lost_stracks = sub_stracks(self.lost_stracks, self.removed_stracks)
+        self.removed_stracks.extend(removed_stracks)
+        self.tracked_stracks, self.lost_stracks = remove_duplicate_stracks(self.tracked_stracks, self.lost_stracks)
+        # get scores of lost tracks
+        output_stracks = [track for track in self.tracked_stracks if track.is_activated]
+        return output_stracks
+def joint_stracks(tlista, tlistb):
+    exists = {}
+    res = []
+    for t in tlista:
+        exists[t.track_id] = 1
+        res.append(t)
+    for t in tlistb:
+        tid = t.track_id
+        if not exists.get(tid, 0):
+            exists[tid] = 1
+            res.append(t)
+    return res
+def sub_stracks(tlista, tlistb):
+    stracks = {}
+    for t in tlista:
+        stracks[t.track_id] = t
+    for t in tlistb:
+        tid = t.track_id
+        if stracks.get(tid, 0):
+            del stracks[tid]
+    return list(stracks.values())
+def remove_duplicate_stracks(stracksa, stracksb):
+    pdist = matching.iou_distance(stracksa, stracksb)
+    pairs = np.where(pdist < 0.15)
+    dupa, dupb = list(), list()
+    for p, q in zip(*pairs):
+        timep = stracksa[p].frame_id - stracksa[p].start_frame
+        timeq = stracksb[q].frame_id - stracksb[q].start_frame
+        if timep > timeq:
+            dupb.append(q)
+        else:
+            dupa.append(p)
+    resa = [t for i, t in enumerate(stracksa) if not i in dupa]
+    resb = [t for i, t in enumerate(stracksb) if not i in dupb]
+    return resa, resb

byte_track/tracker/kalman_filter.py ADDED Viewed

	@@ -0,0 +1,270 @@

+# vim: expandtab:ts=4:sw=4
+import numpy as np
+import scipy.linalg
+"""
+Table for the 0.95 quantile of the chi-square distribution with N degrees of
+freedom (contains values for N=1, ..., 9). Taken from MATLAB/Octave's chi2inv
+function and used as Mahalanobis gating threshold.
+"""
+chi2inv95 = {
+    1: 3.8415,
+    2: 5.9915,
+    3: 7.8147,
+    4: 9.4877,
+    5: 11.070,
+    6: 12.592,
+    7: 14.067,
+    8: 15.507,
+    9: 16.919}
+class KalmanFilter(object):
+    """
+    A simple Kalman filter for tracking bounding boxes in image space.
+    The 8-dimensional state space
+        x, y, a, h, vx, vy, va, vh
+    contains the bounding box center position (x, y), aspect ratio a, height h,
+    and their respective velocities.
+    Object motion follows a constant velocity model. The bounding box location
+    (x, y, a, h) is taken as direct observation of the state space (linear
+    observation model).
+    """
+    def __init__(self):
+        ndim, dt = 4, 1.
+        # Create Kalman filter model matrices.
+        self._motion_mat = np.eye(2 * ndim, 2 * ndim)
+        for i in range(ndim):
+            self._motion_mat[i, ndim + i] = dt
+        self._update_mat = np.eye(ndim, 2 * ndim)
+        # Motion and observation uncertainty are chosen relative to the current
+        # state estimate. These weights control the amount of uncertainty in
+        # the model. This is a bit hacky.
+        self._std_weight_position = 1. / 20
+        self._std_weight_velocity = 1. / 160
+    def initiate(self, measurement):
+        """Create track from unassociated measurement.
+        Parameters
+        ----------
+        measurement : ndarray
+            Bounding box coordinates (x, y, a, h) with center position (x, y),
+            aspect ratio a, and height h.
+        Returns
+        -------
+        (ndarray, ndarray)
+            Returns the mean vector (8 dimensional) and covariance matrix (8x8
+            dimensional) of the new track. Unobserved velocities are initialized
+            to 0 mean.
+        """
+        mean_pos = measurement
+        mean_vel = np.zeros_like(mean_pos)
+        mean = np.r_[mean_pos, mean_vel]
+        std = [
+            2 * self._std_weight_position * measurement[3],
+            2 * self._std_weight_position * measurement[3],
+            1e-2,
+            2 * self._std_weight_position * measurement[3],
+            10 * self._std_weight_velocity * measurement[3],
+            10 * self._std_weight_velocity * measurement[3],
+            1e-5,
+            10 * self._std_weight_velocity * measurement[3]]
+        covariance = np.diag(np.square(std))
+        return mean, covariance
+    def predict(self, mean, covariance):
+        """Run Kalman filter prediction step.
+        Parameters
+        ----------
+        mean : ndarray
+            The 8 dimensional mean vector of the object state at the previous
+            time step.
+        covariance : ndarray
+            The 8x8 dimensional covariance matrix of the object state at the
+            previous time step.
+        Returns
+        -------
+        (ndarray, ndarray)
+            Returns the mean vector and covariance matrix of the predicted
+            state. Unobserved velocities are initialized to 0 mean.
+        """
+        std_pos = [
+            self._std_weight_position * mean[3],
+            self._std_weight_position * mean[3],
+            1e-2,
+            self._std_weight_position * mean[3]]
+        std_vel = [
+            self._std_weight_velocity * mean[3],
+            self._std_weight_velocity * mean[3],
+            1e-5,
+            self._std_weight_velocity * mean[3]]
+        motion_cov = np.diag(np.square(np.r_[std_pos, std_vel]))
+        #mean = np.dot(self._motion_mat, mean)
+        mean = np.dot(mean, self._motion_mat.T)
+        covariance = np.linalg.multi_dot((
+            self._motion_mat, covariance, self._motion_mat.T)) + motion_cov
+        return mean, covariance
+    def project(self, mean, covariance):
+        """Project state distribution to measurement space.
+        Parameters
+        ----------
+        mean : ndarray
+            The state's mean vector (8 dimensional array).
+        covariance : ndarray
+            The state's covariance matrix (8x8 dimensional).
+        Returns
+        -------
+        (ndarray, ndarray)
+            Returns the projected mean and covariance matrix of the given state
+            estimate.
+        """
+        std = [
+            self._std_weight_position * mean[3],
+            self._std_weight_position * mean[3],
+            1e-1,
+            self._std_weight_position * mean[3]]
+        innovation_cov = np.diag(np.square(std))
+        mean = np.dot(self._update_mat, mean)
+        covariance = np.linalg.multi_dot((
+            self._update_mat, covariance, self._update_mat.T))
+        return mean, covariance + innovation_cov
+    def multi_predict(self, mean, covariance):
+        """Run Kalman filter prediction step (Vectorized version).
+        Parameters
+        ----------
+        mean : ndarray
+            The Nx8 dimensional mean matrix of the object states at the previous
+            time step.
+        covariance : ndarray
+            The Nx8x8 dimensional covariance matrics of the object states at the
+            previous time step.
+        Returns
+        -------
+        (ndarray, ndarray)
+            Returns the mean vector and covariance matrix of the predicted
+            state. Unobserved velocities are initialized to 0 mean.
+        """
+        std_pos = [
+            self._std_weight_position * mean[:, 3],
+            self._std_weight_position * mean[:, 3],
+            1e-2 * np.ones_like(mean[:, 3]),
+            self._std_weight_position * mean[:, 3]]
+        std_vel = [
+            self._std_weight_velocity * mean[:, 3],
+            self._std_weight_velocity * mean[:, 3],
+            1e-5 * np.ones_like(mean[:, 3]),
+            self._std_weight_velocity * mean[:, 3]]
+        sqr = np.square(np.r_[std_pos, std_vel]).T
+        motion_cov = []
+        for i in range(len(mean)):
+            motion_cov.append(np.diag(sqr[i]))
+        motion_cov = np.asarray(motion_cov)
+        mean = np.dot(mean, self._motion_mat.T)
+        left = np.dot(self._motion_mat, covariance).transpose((1, 0, 2))
+        covariance = np.dot(left, self._motion_mat.T) + motion_cov
+        return mean, covariance
+    def update(self, mean, covariance, measurement):
+        """Run Kalman filter correction step.
+        Parameters
+        ----------
+        mean : ndarray
+            The predicted state's mean vector (8 dimensional).
+        covariance : ndarray
+            The state's covariance matrix (8x8 dimensional).
+        measurement : ndarray
+            The 4 dimensional measurement vector (x, y, a, h), where (x, y)
+            is the center position, a the aspect ratio, and h the height of the
+            bounding box.
+        Returns
+        -------
+        (ndarray, ndarray)
+            Returns the measurement-corrected state distribution.
+        """
+        projected_mean, projected_cov = self.project(mean, covariance)
+        chol_factor, lower = scipy.linalg.cho_factor(
+            projected_cov, lower=True, check_finite=False)
+        kalman_gain = scipy.linalg.cho_solve(
+            (chol_factor, lower), np.dot(covariance, self._update_mat.T).T,
+            check_finite=False).T
+        innovation = measurement - projected_mean
+        new_mean = mean + np.dot(innovation, kalman_gain.T)
+        new_covariance = covariance - np.linalg.multi_dot((
+            kalman_gain, projected_cov, kalman_gain.T))
+        return new_mean, new_covariance
+    def gating_distance(self, mean, covariance, measurements,
+                        only_position=False, metric='maha'):
+        """Compute gating distance between state distribution and measurements.
+        A suitable distance threshold can be obtained from `chi2inv95`. If
+        `only_position` is False, the chi-square distribution has 4 degrees of
+        freedom, otherwise 2.
+        Parameters
+        ----------
+        mean : ndarray
+            Mean vector over the state distribution (8 dimensional).
+        covariance : ndarray
+            Covariance of the state distribution (8x8 dimensional).
+        measurements : ndarray
+            An Nx4 dimensional matrix of N measurements, each in
+            format (x, y, a, h) where (x, y) is the bounding box center
+            position, a the aspect ratio, and h the height.
+        only_position : Optional[bool]
+            If True, distance computation is done with respect to the bounding
+            box center position only.
+        Returns
+        -------
+        ndarray
+            Returns an array of length N, where the i-th element contains the
+            squared Mahalanobis distance between (mean, covariance) and
+            `measurements[i]`.
+        """
+        mean, covariance = self.project(mean, covariance)
+        if only_position:
+            mean, covariance = mean[:2], covariance[:2, :2]
+            measurements = measurements[:, :2]
+        d = measurements - mean
+        if metric == 'gaussian':
+            return np.sum(d * d, axis=1)
+        elif metric == 'maha':
+            cholesky_factor = np.linalg.cholesky(covariance)
+            z = scipy.linalg.solve_triangular(
+                cholesky_factor, d.T, lower=True, check_finite=False,
+                overwrite_b=True)
+            squared_maha = np.sum(z * z, axis=0)
+            return squared_maha
+        else:
+            raise ValueError('invalid distance metric')

byte_track/tracker/matching.py ADDED Viewed

	@@ -0,0 +1,178 @@

+import numpy as np
+import scipy
+import lap
+from scipy.spatial.distance import cdist
+from cython_bbox import bbox_overlaps as bbox_ious
+import kalman_filter
+def merge_matches(m1, m2, shape):
+    O,P,Q = shape
+    m1 = np.asarray(m1)
+    m2 = np.asarray(m2)
+    M1 = scipy.sparse.coo_matrix((np.ones(len(m1)), (m1[:, 0], m1[:, 1])), shape=(O, P))
+    M2 = scipy.sparse.coo_matrix((np.ones(len(m2)), (m2[:, 0], m2[:, 1])), shape=(P, Q))
+    mask = M1*M2
+    match = mask.nonzero()
+    match = list(zip(match[0], match[1]))
+    unmatched_O = tuple(set(range(O)) - set([i for i, j in match]))
+    unmatched_Q = tuple(set(range(Q)) - set([j for i, j in match]))
+    return match, unmatched_O, unmatched_Q
+def _indices_to_matches(cost_matrix, indices, thresh):
+    matched_cost = cost_matrix[tuple(zip(*indices))]
+    matched_mask = (matched_cost <= thresh)
+    matches = indices[matched_mask]
+    unmatched_a = tuple(set(range(cost_matrix.shape[0])) - set(matches[:, 0]))
+    unmatched_b = tuple(set(range(cost_matrix.shape[1])) - set(matches[:, 1]))
+    return matches, unmatched_a, unmatched_b
+def linear_assignment(cost_matrix, thresh):
+    if cost_matrix.size == 0:
+        return np.empty((0, 2), dtype=int), tuple(range(cost_matrix.shape[0])), tuple(range(cost_matrix.shape[1]))
+    matches, unmatched_a, unmatched_b = [], [], []
+    cost, x, y = lap.lapjv(cost_matrix, extend_cost=True, cost_limit=thresh)
+    for ix, mx in enumerate(x):
+        if mx >= 0:
+            matches.append([ix, mx])
+    unmatched_a = np.where(x < 0)[0]
+    unmatched_b = np.where(y < 0)[0]
+    matches = np.asarray(matches)
+    return matches, unmatched_a, unmatched_b
+def ious(atlbrs, btlbrs):
+    """
+    Compute cost based on IoU
+    :type atlbrs: list[tlbr] | np.ndarray
+    :type atlbrs: list[tlbr] | np.ndarray
+    :rtype ious np.ndarray
+    """
+    ious = np.zeros((len(atlbrs), len(btlbrs)), dtype=np.float)
+    if ious.size == 0:
+        return ious
+    ious = bbox_ious(
+        np.ascontiguousarray(atlbrs, dtype=np.float),
+        np.ascontiguousarray(btlbrs, dtype=np.float)
+    )
+    return ious
+def iou_distance(atracks, btracks):
+    """
+    Compute cost based on IoU
+    :type atracks: list[STrack]
+    :type btracks: list[STrack]
+    :rtype cost_matrix np.ndarray
+    """
+    if (len(atracks)>0 and isinstance(atracks[0], np.ndarray)) or (len(btracks) > 0 and isinstance(btracks[0], np.ndarray)):
+        atlbrs = atracks
+        btlbrs = btracks
+    else:
+        atlbrs = [track.tlbr for track in atracks]
+        btlbrs = [track.tlbr for track in btracks]
+    _ious = ious(atlbrs, btlbrs)
+    cost_matrix = 1 - _ious
+    return cost_matrix
+def v_iou_distance(atracks, btracks):
+    """
+    Compute cost based on IoU
+    :type atracks: list[STrack]
+    :type btracks: list[STrack]
+    :rtype cost_matrix np.ndarray
+    """
+    if (len(atracks)>0 and isinstance(atracks[0], np.ndarray)) or (len(btracks) > 0 and isinstance(btracks[0], np.ndarray)):
+        atlbrs = atracks
+        btlbrs = btracks
+    else:
+        atlbrs = [track.tlwh_to_tlbr(track.pred_bbox) for track in atracks]
+        btlbrs = [track.tlwh_to_tlbr(track.pred_bbox) for track in btracks]
+    _ious = ious(atlbrs, btlbrs)
+    cost_matrix = 1 - _ious
+    return cost_matrix
+def embedding_distance(tracks, detections, metric='cosine'):
+    """
+    :param tracks: list[STrack]
+    :param detections: list[BaseTrack]
+    :param metric:
+    :return: cost_matrix np.ndarray
+    """
+    cost_matrix = np.zeros((len(tracks), len(detections)), dtype=np.float)
+    if cost_matrix.size == 0:
+        return cost_matrix
+    det_features = np.asarray([track.curr_feat for track in detections], dtype=np.float)
+    #for i, track in enumerate(tracks):
+        #cost_matrix[i, :] = np.maximum(0.0, cdist(track.smooth_feat.reshape(1,-1), det_features, metric))
+    track_features = np.asarray([track.smooth_feat for track in tracks], dtype=np.float)
+    cost_matrix = np.maximum(0.0, cdist(track_features, det_features, metric))  # Nomalized features
+    return cost_matrix
+def gate_cost_matrix(kf, cost_matrix, tracks, detections, only_position=False):
+    if cost_matrix.size == 0:
+        return cost_matrix
+    gating_dim = 2 if only_position else 4
+    gating_threshold = kalman_filter.chi2inv95[gating_dim]
+    measurements = np.asarray([det.to_xyah() for det in detections])
+    for row, track in enumerate(tracks):
+        gating_distance = kf.gating_distance(
+            track.mean, track.covariance, measurements, only_position)
+        cost_matrix[row, gating_distance > gating_threshold] = np.inf
+    return cost_matrix
+def fuse_motion(kf, cost_matrix, tracks, detections, only_position=False, lambda_=0.98):
+    if cost_matrix.size == 0:
+        return cost_matrix
+    gating_dim = 2 if only_position else 4
+    gating_threshold = kalman_filter.chi2inv95[gating_dim]
+    measurements = np.asarray([det.to_xyah() for det in detections])
+    for row, track in enumerate(tracks):
+        gating_distance = kf.gating_distance(
+            track.mean, track.covariance, measurements, only_position, metric='maha')
+        cost_matrix[row, gating_distance > gating_threshold] = np.inf
+        cost_matrix[row] = lambda_ * cost_matrix[row] + (1 - lambda_) * gating_distance
+    return cost_matrix
+def fuse_iou(cost_matrix, tracks, detections):
+    if cost_matrix.size == 0:
+        return cost_matrix
+    reid_sim = 1 - cost_matrix
+    iou_dist = iou_distance(tracks, detections)
+    iou_sim = 1 - iou_dist
+    fuse_sim = reid_sim * (1 + iou_sim) / 2
+    det_scores = np.array([det.score for det in detections])
+    det_scores = np.expand_dims(det_scores, axis=0).repeat(cost_matrix.shape[0], axis=0)
+    #fuse_sim = fuse_sim * (1 + det_scores) / 2
+    fuse_cost = 1 - fuse_sim
+    return fuse_cost
+def fuse_score(cost_matrix, detections):
+    if cost_matrix.size == 0:
+        return cost_matrix
+    iou_sim = 1 - cost_matrix
+    det_scores = np.array([det.score for det in detections])
+    det_scores = np.expand_dims(det_scores, axis=0).repeat(cost_matrix.shape[0], axis=0)
+    fuse_sim = iou_sim * det_scores
+    fuse_cost = 1 - fuse_sim
+    return fuse_cost

cfg/yolor_csp.cfg ADDED Viewed

	@@ -0,0 +1,1376 @@

+[net]
+# Testing
+#batch=1
+#subdivisions=1
+# Training
+batch=64
+subdivisions=8
+width=512
+height=512
+channels=3
+momentum=0.949
+decay=0.0005
+angle=0
+saturation = 1.5
+exposure = 1.5
+hue=.1
+learning_rate=0.00261
+burn_in=1000
+max_batches = 500500
+policy=steps
+steps=400000,450000
+scales=.1,.1
+#cutmix=1
+mosaic=1
+# ============ Backbone ============ #
+# Stem
+# 0
+[convolutional]
+batch_normalize=1
+filters=32
+size=3
+stride=1
+pad=1
+activation=silu
+# P1
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=64
+size=3
+stride=2
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=32
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=64
+size=3
+stride=1
+pad=1
+activation=silu
+# 4 (previous+1+3k)
+[shortcut]
+from=-3
+activation=linear
+# P2
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=2
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=64
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=64
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=silu
+# Merge [-1, -(3k+4)]
+[route]
+layers = -1,-10
+# Transition last
+# 17 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+# P3
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=2
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+# Merge [-1 -(4+3k)]
+[route]
+layers = -1,-28
+# Transition last
+# 48 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+# P4
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=2
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+# Merge [-1 -(3k+4)]
+[route]
+layers = -1,-28
+# Transition last
+# 79 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+# P5
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=1024
+size=3
+stride=2
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+# Merge [-1 -(3k+4)]
+[route]
+layers = -1,-16
+# Transition last
+# 98 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=1024
+size=1
+stride=1
+pad=1
+activation=silu
+# ============ End of Backbone ============ #
+# ============ Neck ============ #
+# CSPSPP
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+### SPP ###
+[maxpool]
+stride=1
+size=5
+[route]
+layers=-2
+[maxpool]
+stride=1
+size=9
+[route]
+layers=-4
+[maxpool]
+stride=1
+size=13
+[route]
+layers=-1,-3,-5,-6
+### End SPP ###
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=silu
+[route]
+layers = -1, -13
+# 113 (previous+6+5+2k)
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+# End of CSPSPP
+# FPN-4
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[upsample]
+stride=2
+[route]
+layers = 79
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -1, -3
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=silu
+# Merge [-1, -(2k+2)]
+[route]
+layers = -1, -6
+# Transition last
+# 127 (previous+6+4+2k)
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+# FPN-3
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[upsample]
+stride=2
+[route]
+layers = 48
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -1, -3
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=128
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=128
+activation=silu
+# Merge [-1, -(2k+2)]
+[route]
+layers = -1, -6
+# Transition last
+# 141 (previous+6+4+2k)
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+# PAN-4
+[convolutional]
+batch_normalize=1
+size=3
+stride=2
+pad=1
+filters=256
+activation=silu
+[route]
+layers = -1, 127
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=silu
+[route]
+layers = -1,-6
+# Transition last
+# 152 (previous+3+4+2k)
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+# PAN-5
+[convolutional]
+batch_normalize=1
+size=3
+stride=2
+pad=1
+filters=512
+activation=silu
+[route]
+layers = -1, 113
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=silu
+[route]
+layers = -1,-6
+# Transition last
+# 163 (previous+3+4+2k)
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+# ============ End of Neck ============ #
+# 164
+[implicit_add]
+filters=256
+# 165
+[implicit_add]
+filters=512
+# 166
+[implicit_add]
+filters=1024
+# 167
+[implicit_mul]
+filters=255
+# 168
+[implicit_mul]
+filters=255
+# 169
+[implicit_mul]
+filters=255
+# ============ Head ============ #
+# YOLO-3
+[route]
+layers = 141
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=silu
+[shift_channels]
+from=164
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=255
+activation=linear
+[control_channels]
+from=167
+[yolo]
+mask = 0,1,2
+anchors = 12, 16, 19, 36, 40, 28, 36, 75, 76, 55, 72, 146, 142, 110, 192, 243, 459, 401
+classes=80
+num=9
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6
+# YOLO-4
+[route]
+layers = 152
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=silu
+[shift_channels]
+from=165
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=255
+activation=linear
+[control_channels]
+from=168
+[yolo]
+mask = 3,4,5
+anchors = 12, 16, 19, 36, 40, 28, 36, 75, 76, 55, 72, 146, 142, 110, 192, 243, 459, 401
+classes=80
+num=9
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6
+# YOLO-5
+[route]
+layers = 163
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=1024
+activation=silu
+[shift_channels]
+from=166
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=255
+activation=linear
+[control_channels]
+from=169
+[yolo]
+mask = 6,7,8
+anchors = 12, 16, 19, 36, 40, 28, 36, 75, 76, 55, 72, 146, 142, 110, 192, 243, 459, 401
+classes=80
+num=9
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6

cfg/yolor_csp_x.cfg ADDED Viewed

	@@ -0,0 +1,1576 @@

+[net]
+# Testing
+#batch=1
+#subdivisions=1
+# Training
+batch=64
+subdivisions=8
+width=512
+height=512
+channels=3
+momentum=0.949
+decay=0.0005
+angle=0
+saturation = 1.5
+exposure = 1.5
+hue=.1
+learning_rate=0.00261
+burn_in=1000
+max_batches = 500500
+policy=steps
+steps=400000,450000
+scales=.1,.1
+#cutmix=1
+mosaic=1
+# ============ Backbone ============ #
+# Stem
+# 0
+[convolutional]
+batch_normalize=1
+filters=32
+size=3
+stride=1
+pad=1
+activation=silu
+# P1
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=80
+size=3
+stride=2
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=40
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=80
+size=3
+stride=1
+pad=1
+activation=silu
+# 4 (previous+1+3k)
+[shortcut]
+from=-3
+activation=linear
+# P2
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=2
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=80
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=80
+size=1
+stride=1
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=80
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=80
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=80
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=80
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=80
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=80
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=80
+size=1
+stride=1
+pad=1
+activation=silu
+# Merge [-1, -(3k+4)]
+[route]
+layers = -1,-13
+# Transition last
+# 20 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+# P3
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=2
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+# Merge [-1 -(4+3k)]
+[route]
+layers = -1,-34
+# Transition last
+# 57 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+# P4
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=2
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+# Merge [-1 -(3k+4)]
+[route]
+layers = -1,-34
+# Transition last
+# 94 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+# P5
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=1280
+size=3
+stride=2
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+# Merge [-1 -(3k+4)]
+[route]
+layers = -1,-19
+# Transition last
+# 116 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=1280
+size=1
+stride=1
+pad=1
+activation=silu
+# ============ End of Backbone ============ #
+# ============ Neck ============ #
+# CSPSPP
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+### SPP ###
+[maxpool]
+stride=1
+size=5
+[route]
+layers=-2
+[maxpool]
+stride=1
+size=9
+[route]
+layers=-4
+[maxpool]
+stride=1
+size=13
+[route]
+layers=-1,-3,-5,-6
+### End SPP ###
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=silu
+[route]
+layers = -1, -15
+# 133 (previous+6+5+2k)
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+# End of CSPSPP
+# FPN-4
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[upsample]
+stride=2
+[route]
+layers = 94
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -1, -3
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=320
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=320
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=320
+activation=silu
+# Merge [-1, -(2k+2)]
+[route]
+layers = -1, -8
+# Transition last
+# 149 (previous+6+4+2k)
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+# FPN-3
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[upsample]
+stride=2
+[route]
+layers = 57
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -1, -3
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=160
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=160
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=160
+activation=silu
+# Merge [-1, -(2k+2)]
+[route]
+layers = -1, -8
+# Transition last
+# 165 (previous+6+4+2k)
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+# PAN-4
+[convolutional]
+batch_normalize=1
+size=3
+stride=2
+pad=1
+filters=320
+activation=silu
+[route]
+layers = -1, 149
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=320
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=320
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=320
+activation=silu
+[route]
+layers = -1,-8
+# Transition last
+# 178 (previous+3+4+2k)
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+# PAN-5
+[convolutional]
+batch_normalize=1
+size=3
+stride=2
+pad=1
+filters=640
+activation=silu
+[route]
+layers = -1, 133
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=silu
+[route]
+layers = -1,-8
+# Transition last
+# 191 (previous+3+4+2k)
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+# ============ End of Neck ============ #
+# 192
+[implicit_add]
+filters=320
+# 193
+[implicit_add]
+filters=640
+# 194
+[implicit_add]
+filters=1280
+# 195
+[implicit_mul]
+filters=255
+# 196
+[implicit_mul]
+filters=255
+# 197
+[implicit_mul]
+filters=255
+# ============ Head ============ #
+# YOLO-3
+[route]
+layers = 165
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=320
+activation=silu
+[shift_channels]
+from=192
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=255
+activation=linear
+[control_channels]
+from=195
+[yolo]
+mask = 0,1,2
+anchors = 12, 16, 19, 36, 40, 28, 36, 75, 76, 55, 72, 146, 142, 110, 192, 243, 459, 401
+classes=80
+num=9
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6
+# YOLO-4
+[route]
+layers = 178
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=silu
+[shift_channels]
+from=193
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=255
+activation=linear
+[control_channels]
+from=196
+[yolo]
+mask = 3,4,5
+anchors = 12, 16, 19, 36, 40, 28, 36, 75, 76, 55, 72, 146, 142, 110, 192, 243, 459, 401
+classes=80
+num=9
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6
+# YOLO-5
+[route]
+layers = 191
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=1280
+activation=silu
+[shift_channels]
+from=194
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=255
+activation=linear
+[control_channels]
+from=197
+[yolo]
+mask = 6,7,8
+anchors = 12, 16, 19, 36, 40, 28, 36, 75, 76, 55, 72, 146, 142, 110, 192, 243, 459, 401
+classes=80
+num=9
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6

cfg/yolor_p6.cfg ADDED Viewed

	@@ -0,0 +1,1760 @@

+[net]
+batch=64
+subdivisions=8
+width=1280
+height=1280
+channels=3
+momentum=0.949
+decay=0.0005
+angle=0
+saturation = 1.5
+exposure = 1.5
+hue=.1
+learning_rate=0.00261
+burn_in=1000
+max_batches = 500500
+policy=steps
+steps=400000,450000
+scales=.1,.1
+mosaic=1
+# ============ Backbone ============ #
+# Stem
+# P1
+# Downsample
+# 0
+[reorg]
+[convolutional]
+batch_normalize=1
+filters=64
+size=3
+stride=1
+pad=1
+activation=silu
+# P2
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=2
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=64
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=64
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=64
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+#
+#[convolutional]
+#batch_normalize=1
+#filters=64
+#size=1
+#stride=1
+#pad=1
+#activation=silu
+# Merge [-1, -(3k+3)]
+[route]
+layers = -1,-12
+# Transition last
+# 16 (previous+6+3k)
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+# P3
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=2
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+#
+#[convolutional]
+#batch_normalize=1
+#filters=128
+#size=1
+#stride=1
+#pad=1
+#activation=silu
+# Merge [-1, -(3k+3)]
+[route]
+layers = -1,-24
+# Transition last
+# 43 (previous+6+3k)
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+# P4
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=384
+size=3
+stride=2
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=192
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=192
+size=1
+stride=1
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=192
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=192
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=192
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=192
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=192
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=192
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=192
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=192
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=192
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=192
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=192
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=192
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=192
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=192
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+#
+#[convolutional]
+#batch_normalize=1
+#filters=192
+#size=1
+#stride=1
+#pad=1
+#activation=silu
+# Merge [-1, -(3k+3)]
+[route]
+layers = -1,-24
+# Transition last
+# 70 (previous+6+3k)
+[convolutional]
+batch_normalize=1
+filters=384
+size=1
+stride=1
+pad=1
+activation=silu
+# P5
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=2
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+#
+#[convolutional]
+#batch_normalize=1
+#filters=256
+#size=1
+#stride=1
+#pad=1
+#activation=silu
+# Merge [-1, -(3k+3)]
+[route]
+layers = -1,-12
+# Transition last
+# 85 (previous+6+3k)
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+# P6
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=2
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+#
+#[convolutional]
+#batch_normalize=1
+#filters=320
+#size=1
+#stride=1
+#pad=1
+#activation=silu
+# Merge [-1, -(3k+3)]
+[route]
+layers = -1,-12
+# Transition last
+# 100 (previous+6+3k)
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+# ============ End of Backbone ============ #
+# ============ Neck ============ #
+# CSPSPP
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=320
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+### SPP ###
+[maxpool]
+stride=1
+size=5
+[route]
+layers=-2
+[maxpool]
+stride=1
+size=9
+[route]
+layers=-4
+[maxpool]
+stride=1
+size=13
+[route]
+layers=-1,-3,-5,-6
+### End SPP ###
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=320
+activation=silu
+[route]
+layers = -1, -13
+# 115 (previous+6+5+2k)
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+# End of CSPSPP
+# FPN-5
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[upsample]
+stride=2
+[route]
+layers = 85
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -1, -3
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=silu
+# Merge [-1, -(2k+2)]
+[route]
+layers = -1, -8
+# Transition last
+# 131 (previous+6+4+2k)
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+# FPN-4
+[convolutional]
+batch_normalize=1
+filters=192
+size=1
+stride=1
+pad=1
+activation=silu
+[upsample]
+stride=2
+[route]
+layers = 70
+[convolutional]
+batch_normalize=1
+filters=192
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -1, -3
+[convolutional]
+batch_normalize=1
+filters=192
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=192
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=192
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=192
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=192
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=192
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=192
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=192
+activation=silu
+# Merge [-1, -(2k+2)]
+[route]
+layers = -1, -8
+# Transition last
+# 147 (previous+6+4+2k)
+[convolutional]
+batch_normalize=1
+filters=192
+size=1
+stride=1
+pad=1
+activation=silu
+# FPN-3
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[upsample]
+stride=2
+[route]
+layers = 43
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -1, -3
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=128
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=128
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=128
+activation=silu
+# Merge [-1, -(2k+2)]
+[route]
+layers = -1, -8
+# Transition last
+# 163 (previous+6+4+2k)
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+# PAN-4
+[convolutional]
+batch_normalize=1
+size=3
+stride=2
+pad=1
+filters=192
+activation=silu
+[route]
+layers = -1, 147
+[convolutional]
+batch_normalize=1
+filters=192
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=192
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=192
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=192
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=192
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=192
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=192
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=192
+activation=silu
+[route]
+layers = -1,-8
+# Transition last
+# 176 (previous+3+4+2k)
+[convolutional]
+batch_normalize=1
+filters=192
+size=1
+stride=1
+pad=1
+activation=silu
+# PAN-5
+[convolutional]
+batch_normalize=1
+size=3
+stride=2
+pad=1
+filters=256
+activation=silu
+[route]
+layers = -1, 131
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=silu
+[route]
+layers = -1,-8
+# Transition last
+# 189 (previous+3+4+2k)
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+# PAN-6
+[convolutional]
+batch_normalize=1
+size=3
+stride=2
+pad=1
+filters=320
+activation=silu
+[route]
+layers = -1, 115
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=320
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=320
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=320
+activation=silu
+[route]
+layers = -1,-8
+# Transition last
+# 202 (previous+3+4+2k)
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+# ============ End of Neck ============ #
+# 203
+[implicit_add]
+filters=256
+# 204
+[implicit_add]
+filters=384
+# 205
+[implicit_add]
+filters=512
+# 206
+[implicit_add]
+filters=640
+# 207
+[implicit_mul]
+filters=255
+# 208
+[implicit_mul]
+filters=255
+# 209
+[implicit_mul]
+filters=255
+# 210
+[implicit_mul]
+filters=255
+# ============ Head ============ #
+# YOLO-3
+[route]
+layers = 163
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=silu
+[shift_channels]
+from=203
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=255
+activation=linear
+[control_channels]
+from=207
+[yolo]
+mask = 0,1,2
+anchors = 19,27,  44,40,  38,94,  96,68,  86,152,  180,137,  140,301,  303,264,  238,542,  436,615,  739,380,  925,792
+classes=80
+num=12
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6
+# YOLO-4
+[route]
+layers = 176
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=384
+activation=silu
+[shift_channels]
+from=204
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=255
+activation=linear
+[control_channels]
+from=208
+[yolo]
+mask = 3,4,5
+anchors = 19,27,  44,40,  38,94,  96,68,  86,152,  180,137,  140,301,  303,264,  238,542,  436,615,  739,380,  925,792
+classes=80
+num=12
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6
+# YOLO-5
+[route]
+layers = 189
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=silu
+[shift_channels]
+from=205
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=255
+activation=linear
+[control_channels]
+from=209
+[yolo]
+mask = 6,7,8
+anchors = 19,27,  44,40,  38,94,  96,68,  86,152,  180,137,  140,301,  303,264,  238,542,  436,615,  739,380,  925,792
+classes=80
+num=12
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6
+# YOLO-6
+[route]
+layers = 202
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=silu
+[shift_channels]
+from=206
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=255
+activation=linear
+[control_channels]
+from=210
+[yolo]
+mask = 9,10,11
+anchors = 19,27,  44,40,  38,94,  96,68,  86,152,  180,137,  140,301,  303,264,  238,542,  436,615,  739,380,  925,792
+classes=80
+num=12
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6
+# ============ End of Head ============ #

cfg/yolor_w6.cfg ADDED Viewed

	@@ -0,0 +1,1760 @@

+[net]
+batch=64
+subdivisions=8
+width=1280
+height=1280
+channels=3
+momentum=0.949
+decay=0.0005
+angle=0
+saturation = 1.5
+exposure = 1.5
+hue=.1
+learning_rate=0.00261
+burn_in=1000
+max_batches = 500500
+policy=steps
+steps=400000,450000
+scales=.1,.1
+mosaic=1
+# ============ Backbone ============ #
+# Stem
+# P1
+# Downsample
+# 0
+[reorg]
+[convolutional]
+batch_normalize=1
+filters=64
+size=3
+stride=1
+pad=1
+activation=silu
+# P2
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=2
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=64
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=64
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=64
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+#
+#[convolutional]
+#batch_normalize=1
+#filters=64
+#size=1
+#stride=1
+#pad=1
+#activation=silu
+# Merge [-1, -(3k+3)]
+[route]
+layers = -1,-12
+# Transition last
+# 16 (previous+6+3k)
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+# P3
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=2
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+#
+#[convolutional]
+#batch_normalize=1
+#filters=128
+#size=1
+#stride=1
+#pad=1
+#activation=silu
+# Merge [-1, -(3k+3)]
+[route]
+layers = -1,-24
+# Transition last
+# 43 (previous+6+3k)
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+# P4
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=2
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+#
+#[convolutional]
+#batch_normalize=1
+#filters=256
+#size=1
+#stride=1
+#pad=1
+#activation=silu
+# Merge [-1, -(3k+3)]
+[route]
+layers = -1,-24
+# Transition last
+# 70 (previous+6+3k)
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+# P5
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=768
+size=3
+stride=2
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=384
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=384
+size=1
+stride=1
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=384
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=384
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=384
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=384
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=384
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=384
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+#
+#[convolutional]
+#batch_normalize=1
+#filters=384
+#size=1
+#stride=1
+#pad=1
+#activation=silu
+# Merge [-1, -(3k+3)]
+[route]
+layers = -1,-12
+# Transition last
+# 85 (previous+6+3k)
+[convolutional]
+batch_normalize=1
+filters=768
+size=1
+stride=1
+pad=1
+activation=silu
+# P6
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=1024
+size=3
+stride=2
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+#
+#[convolutional]
+#batch_normalize=1
+#filters=512
+#size=1
+#stride=1
+#pad=1
+#activation=silu
+# Merge [-1, -(3k+3)]
+[route]
+layers = -1,-12
+# Transition last
+# 100 (previous+6+3k)
+[convolutional]
+batch_normalize=1
+filters=1024
+size=1
+stride=1
+pad=1
+activation=silu
+# ============ End of Backbone ============ #
+# ============ Neck ============ #
+# CSPSPP
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+### SPP ###
+[maxpool]
+stride=1
+size=5
+[route]
+layers=-2
+[maxpool]
+stride=1
+size=9
+[route]
+layers=-4
+[maxpool]
+stride=1
+size=13
+[route]
+layers=-1,-3,-5,-6
+### End SPP ###
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=silu
+[route]
+layers = -1, -13
+# 115 (previous+6+5+2k)
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+# End of CSPSPP
+# FPN-5
+[convolutional]
+batch_normalize=1
+filters=384
+size=1
+stride=1
+pad=1
+activation=silu
+[upsample]
+stride=2
+[route]
+layers = 85
+[convolutional]
+batch_normalize=1
+filters=384
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -1, -3
+[convolutional]
+batch_normalize=1
+filters=384
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=384
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=384
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=384
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=384
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=384
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=384
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=384
+activation=silu
+# Merge [-1, -(2k+2)]
+[route]
+layers = -1, -8
+# Transition last
+# 131 (previous+6+4+2k)
+[convolutional]
+batch_normalize=1
+filters=384
+size=1
+stride=1
+pad=1
+activation=silu
+# FPN-4
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[upsample]
+stride=2
+[route]
+layers = 70
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -1, -3
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=silu
+# Merge [-1, -(2k+2)]
+[route]
+layers = -1, -8
+# Transition last
+# 147 (previous+6+4+2k)
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+# FPN-3
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[upsample]
+stride=2
+[route]
+layers = 43
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -1, -3
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=128
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=128
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=128
+activation=silu
+# Merge [-1, -(2k+2)]
+[route]
+layers = -1, -8
+# Transition last
+# 163 (previous+6+4+2k)
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+# PAN-4
+[convolutional]
+batch_normalize=1
+size=3
+stride=2
+pad=1
+filters=256
+activation=silu
+[route]
+layers = -1, 147
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=silu
+[route]
+layers = -1,-8
+# Transition last
+# 176 (previous+3+4+2k)
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+# PAN-5
+[convolutional]
+batch_normalize=1
+size=3
+stride=2
+pad=1
+filters=384
+activation=silu
+[route]
+layers = -1, 131
+[convolutional]
+batch_normalize=1
+filters=384
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=384
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=384
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=384
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=384
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=384
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=384
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=384
+activation=silu
+[route]
+layers = -1,-8
+# Transition last
+# 189 (previous+3+4+2k)
+[convolutional]
+batch_normalize=1
+filters=384
+size=1
+stride=1
+pad=1
+activation=silu
+# PAN-6
+[convolutional]
+batch_normalize=1
+size=3
+stride=2
+pad=1
+filters=512
+activation=silu
+[route]
+layers = -1, 115
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=silu
+[route]
+layers = -1,-8
+# Transition last
+# 202 (previous+3+4+2k)
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+# ============ End of Neck ============ #
+# 203
+[implicit_add]
+filters=256
+# 204
+[implicit_add]
+filters=512
+# 205
+[implicit_add]
+filters=768
+# 206
+[implicit_add]
+filters=1024
+# 207
+[implicit_mul]
+filters=255
+# 208
+[implicit_mul]
+filters=255
+# 209
+[implicit_mul]
+filters=255
+# 210
+[implicit_mul]
+filters=255
+# ============ Head ============ #
+# YOLO-3
+[route]
+layers = 163
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=silu
+[shift_channels]
+from=203
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=255
+activation=linear
+[control_channels]
+from=207
+[yolo]
+mask = 0,1,2
+anchors = 19,27,  44,40,  38,94,  96,68,  86,152,  180,137,  140,301,  303,264,  238,542,  436,615,  739,380,  925,792
+classes=80
+num=12
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6
+# YOLO-4
+[route]
+layers = 176
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=silu
+[shift_channels]
+from=204
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=255
+activation=linear
+[control_channels]
+from=208
+[yolo]
+mask = 3,4,5
+anchors = 19,27,  44,40,  38,94,  96,68,  86,152,  180,137,  140,301,  303,264,  238,542,  436,615,  739,380,  925,792
+classes=80
+num=12
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6
+# YOLO-5
+[route]
+layers = 189
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=768
+activation=silu
+[shift_channels]
+from=205
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=255
+activation=linear
+[control_channels]
+from=209
+[yolo]
+mask = 6,7,8
+anchors = 19,27,  44,40,  38,94,  96,68,  86,152,  180,137,  140,301,  303,264,  238,542,  436,615,  739,380,  925,792
+classes=80
+num=12
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6
+# YOLO-6
+[route]
+layers = 202
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=1024
+activation=silu
+[shift_channels]
+from=206
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=255
+activation=linear
+[control_channels]
+from=210
+[yolo]
+mask = 9,10,11
+anchors = 19,27,  44,40,  38,94,  96,68,  86,152,  180,137,  140,301,  303,264,  238,542,  436,615,  739,380,  925,792
+classes=80
+num=12
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6
+# ============ End of Head ============ #

cfg/yolov4_csp.cfg ADDED Viewed

	@@ -0,0 +1,1334 @@

+[net]
+# Testing
+#batch=1
+#subdivisions=1
+# Training
+batch=64
+subdivisions=8
+width=512
+height=512
+channels=3
+momentum=0.949
+decay=0.0005
+angle=0
+saturation = 1.5
+exposure = 1.5
+hue=.1
+learning_rate=0.00261
+burn_in=1000
+max_batches = 500500
+policy=steps
+steps=400000,450000
+scales=.1,.1
+#cutmix=1
+mosaic=1
+# ============ Backbone ============ #
+# Stem
+# 0
+[convolutional]
+batch_normalize=1
+filters=32
+size=3
+stride=1
+pad=1
+activation=silu
+# P1
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=64
+size=3
+stride=2
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=32
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=64
+size=3
+stride=1
+pad=1
+activation=silu
+# 4 (previous+1+3k)
+[shortcut]
+from=-3
+activation=linear
+# P2
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=2
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=64
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=64
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=silu
+# Merge [-1, -(3k+4)]
+[route]
+layers = -1,-10
+# Transition last
+# 17 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+# P3
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=2
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+# Merge [-1 -(4+3k)]
+[route]
+layers = -1,-28
+# Transition last
+# 48 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+# P4
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=2
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+# Merge [-1 -(3k+4)]
+[route]
+layers = -1,-28
+# Transition last
+# 79 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+# P5
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=1024
+size=3
+stride=2
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+# Merge [-1 -(3k+4)]
+[route]
+layers = -1,-16
+# Transition last
+# 98 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=1024
+size=1
+stride=1
+pad=1
+activation=silu
+# ============ End of Backbone ============ #
+# ============ Neck ============ #
+# CSPSPP
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+### SPP ###
+[maxpool]
+stride=1
+size=5
+[route]
+layers=-2
+[maxpool]
+stride=1
+size=9
+[route]
+layers=-4
+[maxpool]
+stride=1
+size=13
+[route]
+layers=-1,-3,-5,-6
+### End SPP ###
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=silu
+[route]
+layers = -1, -13
+# 113 (previous+6+5+2k)
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+# End of CSPSPP
+# FPN-4
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[upsample]
+stride=2
+[route]
+layers = 79
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -1, -3
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=silu
+# Merge [-1, -(2k+2)]
+[route]
+layers = -1, -6
+# Transition last
+# 127 (previous+6+4+2k)
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+# FPN-3
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[upsample]
+stride=2
+[route]
+layers = 48
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -1, -3
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=128
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=128
+activation=silu
+# Merge [-1, -(2k+2)]
+[route]
+layers = -1, -6
+# Transition last
+# 141 (previous+6+4+2k)
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=silu
+# PAN-4
+[convolutional]
+batch_normalize=1
+size=3
+stride=2
+pad=1
+filters=256
+activation=silu
+[route]
+layers = -1, 127
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=silu
+[route]
+layers = -1,-6
+# Transition last
+# 152 (previous+3+4+2k)
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=silu
+# PAN-5
+[convolutional]
+batch_normalize=1
+size=3
+stride=2
+pad=1
+filters=512
+activation=silu
+[route]
+layers = -1, 113
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=silu
+[route]
+layers = -1,-6
+# Transition last
+# 163 (previous+3+4+2k)
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=silu
+# ============ End of Neck ============ #
+# ============ Head ============ #
+# YOLO-3
+[route]
+layers = 141
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=silu
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=255
+activation=linear
+[yolo]
+mask = 0,1,2
+anchors = 12, 16, 19, 36, 40, 28, 36, 75, 76, 55, 72, 146, 142, 110, 192, 243, 459, 401
+classes=80
+num=9
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6
+# YOLO-4
+[route]
+layers = 152
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=silu
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=255
+activation=linear
+[yolo]
+mask = 3,4,5
+anchors = 12, 16, 19, 36, 40, 28, 36, 75, 76, 55, 72, 146, 142, 110, 192, 243, 459, 401
+classes=80
+num=9
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6
+# YOLO-5
+[route]
+layers = 163
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=1024
+activation=silu
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=255
+activation=linear
+[yolo]
+mask = 6,7,8
+anchors = 12, 16, 19, 36, 40, 28, 36, 75, 76, 55, 72, 146, 142, 110, 192, 243, 459, 401
+classes=80
+num=9
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6

cfg/yolov4_csp_x.cfg ADDED Viewed

	@@ -0,0 +1,1534 @@

+[net]
+# Testing
+#batch=1
+#subdivisions=1
+# Training
+batch=64
+subdivisions=8
+width=512
+height=512
+channels=3
+momentum=0.949
+decay=0.0005
+angle=0
+saturation = 1.5
+exposure = 1.5
+hue=.1
+learning_rate=0.00261
+burn_in=1000
+max_batches = 500500
+policy=steps
+steps=400000,450000
+scales=.1,.1
+#cutmix=1
+mosaic=1
+# ============ Backbone ============ #
+# Stem
+# 0
+[convolutional]
+batch_normalize=1
+filters=32
+size=3
+stride=1
+pad=1
+activation=silu
+# P1
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=80
+size=3
+stride=2
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=40
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=80
+size=3
+stride=1
+pad=1
+activation=silu
+# 4 (previous+1+3k)
+[shortcut]
+from=-3
+activation=linear
+# P2
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=2
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=80
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=80
+size=1
+stride=1
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=80
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=80
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=80
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=80
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=80
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=80
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=80
+size=1
+stride=1
+pad=1
+activation=silu
+# Merge [-1, -(3k+4)]
+[route]
+layers = -1,-13
+# Transition last
+# 20 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+# P3
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=2
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+# Merge [-1 -(4+3k)]
+[route]
+layers = -1,-34
+# Transition last
+# 57 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+# P4
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=2
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+# Merge [-1 -(3k+4)]
+[route]
+layers = -1,-34
+# Transition last
+# 94 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+# P5
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=1280
+size=3
+stride=2
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=silu
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+# Merge [-1 -(3k+4)]
+[route]
+layers = -1,-19
+# Transition last
+# 116 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=1280
+size=1
+stride=1
+pad=1
+activation=silu
+# ============ End of Backbone ============ #
+# ============ Neck ============ #
+# CSPSPP
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+### SPP ###
+[maxpool]
+stride=1
+size=5
+[route]
+layers=-2
+[maxpool]
+stride=1
+size=9
+[route]
+layers=-4
+[maxpool]
+stride=1
+size=13
+[route]
+layers=-1,-3,-5,-6
+### End SPP ###
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=silu
+[route]
+layers = -1, -15
+# 133 (previous+6+5+2k)
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+# End of CSPSPP
+# FPN-4
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[upsample]
+stride=2
+[route]
+layers = 94
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -1, -3
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=320
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=320
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=320
+activation=silu
+# Merge [-1, -(2k+2)]
+[route]
+layers = -1, -8
+# Transition last
+# 149 (previous+6+4+2k)
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+# FPN-3
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[upsample]
+stride=2
+[route]
+layers = 57
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -1, -3
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=160
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=160
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=160
+activation=silu
+# Merge [-1, -(2k+2)]
+[route]
+layers = -1, -8
+# Transition last
+# 165 (previous+6+4+2k)
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=silu
+# PAN-4
+[convolutional]
+batch_normalize=1
+size=3
+stride=2
+pad=1
+filters=320
+activation=silu
+[route]
+layers = -1, 149
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=320
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=320
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=320
+activation=silu
+[route]
+layers = -1,-8
+# Transition last
+# 178 (previous+3+4+2k)
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=silu
+# PAN-5
+[convolutional]
+batch_normalize=1
+size=3
+stride=2
+pad=1
+filters=640
+activation=silu
+[route]
+layers = -1, 133
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+# Split
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=silu
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=silu
+[route]
+layers = -1,-8
+# Transition last
+# 191 (previous+3+4+2k)
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=silu
+# ============ End of Neck ============ #
+# ============ Head ============ #
+# YOLO-3
+[route]
+layers = 165
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=320
+activation=silu
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=255
+activation=linear
+[yolo]
+mask = 0,1,2
+anchors = 12, 16, 19, 36, 40, 28, 36, 75, 76, 55, 72, 146, 142, 110, 192, 243, 459, 401
+classes=80
+num=9
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6
+# YOLO-4
+[route]
+layers = 178
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=silu
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=255
+activation=linear
+[yolo]
+mask = 3,4,5
+anchors = 12, 16, 19, 36, 40, 28, 36, 75, 76, 55, 72, 146, 142, 110, 192, 243, 459, 401
+classes=80
+num=9
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6
+# YOLO-5
+[route]
+layers = 191
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=1280
+activation=silu
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=255
+activation=linear
+[yolo]
+mask = 6,7,8
+anchors = 12, 16, 19, 36, 40, 28, 36, 75, 76, 55, 72, 146, 142, 110, 192, 243, 459, 401
+classes=80
+num=9
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6

cfg/yolov4_p6.cfg ADDED Viewed

	@@ -0,0 +1,2260 @@

+[net]
+batch=64
+subdivisions=8
+width=1280
+height=1280
+channels=3
+momentum=0.949
+decay=0.0005
+angle=0
+saturation = 1.5
+exposure = 1.5
+hue=.1
+learning_rate=0.00261
+burn_in=1000
+max_batches = 500500
+policy=steps
+steps=400000,450000
+scales=.1,.1
+mosaic=1
+# ============ Backbone ============ #
+# Stem
+# 0
+[convolutional]
+batch_normalize=1
+filters=32
+size=3
+stride=1
+pad=1
+activation=mish
+# P1
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=64
+size=3
+stride=2
+pad=1
+activation=mish
+# Split
+[convolutional]
+batch_normalize=1
+filters=32
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=32
+size=1
+stride=1
+pad=1
+activation=mish
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=32
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=32
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=32
+size=1
+stride=1
+pad=1
+activation=mish
+# Merge [-1, -(3k+4)]
+[route]
+layers = -1,-7
+# Transition last
+# 10 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=mish
+# P2
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=2
+pad=1
+activation=mish
+# Split
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=mish
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=64
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=64
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=64
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=64
+size=1
+stride=1
+pad=1
+activation=mish
+# Merge [-1, -(3k+4)]
+[route]
+layers = -1,-13
+# Transition last
+# 26 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=mish
+# P3
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=2
+pad=1
+activation=mish
+# Split
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=mish
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=128
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=mish
+# Merge [-1, -(3k+4)]
+[route]
+layers = -1,-49
+# Transition last
+# 78 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+# P4
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=2
+pad=1
+activation=mish
+# Split
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=256
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+# Merge [-1, -(3k+4)]
+[route]
+layers = -1,-49
+# Transition last
+# 130 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+# P5
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=1024
+size=3
+stride=2
+pad=1
+activation=mish
+# Split
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+# Merge [-1, -(3k+4)]
+[route]
+layers = -1,-25
+# Transition last
+# 158 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=1024
+size=1
+stride=1
+pad=1
+activation=mish
+# P6
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=1024
+size=3
+stride=2
+pad=1
+activation=mish
+# Split
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=512
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+# Merge [-1, -(3k+4)]
+[route]
+layers = -1,-25
+# Transition last
+# 186 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=1024
+size=1
+stride=1
+pad=1
+activation=mish
+# ============ End of Backbone ============ #
+# ============ Neck ============ #
+# CSPSPP
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+### SPP ###
+[maxpool]
+stride=1
+size=5
+[route]
+layers=-2
+[maxpool]
+stride=1
+size=9
+[route]
+layers=-4
+[maxpool]
+stride=1
+size=13
+[route]
+layers=-1,-3,-5,-6
+### End SPP ###
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=mish
+[route]
+layers = -1, -13
+# 201 (previous+6+5+2k)
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+# End of CSPSPP
+# FPN-5
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[upsample]
+stride=2
+[route]
+layers = 158
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -1, -3
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+# Split
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=mish
+# Merge [-1, -(2k+2)]
+[route]
+layers = -1, -8
+# Transition last
+# 217 (previous+6+4+2k)
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+# FPN-4
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+[upsample]
+stride=2
+[route]
+layers = 130
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -1, -3
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+# Split
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=mish
+# Merge [-1, -(2k+2)]
+[route]
+layers = -1, -8
+# Transition last
+# 233 (previous+6+4+2k)
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+# FPN-3
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=mish
+[upsample]
+stride=2
+[route]
+layers = 78
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -1, -3
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=mish
+# Split
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=128
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=128
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=128
+activation=mish
+# Merge [-1, -(2k+2)]
+[route]
+layers = -1, -8
+# Transition last
+# 249 (previous+6+4+2k)
+[convolutional]
+batch_normalize=1
+filters=128
+size=1
+stride=1
+pad=1
+activation=mish
+# PAN-4
+[convolutional]
+batch_normalize=1
+size=3
+stride=2
+pad=1
+filters=256
+activation=mish
+[route]
+layers = -1, 233
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+# Split
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=mish
+[route]
+layers = -1,-8
+# Transition last
+# 262 (previous+3+4+2k)
+[convolutional]
+batch_normalize=1
+filters=256
+size=1
+stride=1
+pad=1
+activation=mish
+# PAN-5
+[convolutional]
+batch_normalize=1
+size=3
+stride=2
+pad=1
+filters=512
+activation=mish
+[route]
+layers = -1, 217
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+# Split
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=mish
+[route]
+layers = -1,-8
+# Transition last
+# 275 (previous+3+4+2k)
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+# PAN-6
+[convolutional]
+batch_normalize=1
+size=3
+stride=2
+pad=1
+filters=512
+activation=mish
+[route]
+layers = -1, 201
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+# Split
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=mish
+[route]
+layers = -1,-8
+# Transition last
+# 288 (previous+3+4+2k)
+[convolutional]
+batch_normalize=1
+filters=512
+size=1
+stride=1
+pad=1
+activation=mish
+# ============ End of Neck ============ #
+# ============ Head ============ #
+# YOLO-3
+[route]
+layers = 249
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=256
+activation=mish
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=340
+activation=linear
+[yolo]
+mask = 0,1,2,3
+anchors = 13,17,  31,25,  24,51, 61,45,  61,45,  48,102,  119,96,  97,189,  97,189,  217,184,  171,384,  324,451,  324,451, 545,357, 616,618, 1024,1024
+classes=80
+num=16
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6
+# YOLO-4
+[route]
+layers = 262
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=512
+activation=mish
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=340
+activation=linear
+[yolo]
+mask = 4,5,6,7
+anchors = 13,17,  31,25,  24,51, 61,45,  61,45,  48,102,  119,96,  97,189,  97,189,  217,184,  171,384,  324,451,  324,451, 545,357, 616,618, 1024,1024
+classes=80
+num=16
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6
+# YOLO-5
+[route]
+layers = 275
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=1024
+activation=mish
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=340
+activation=linear
+[yolo]
+mask = 8,9,10,11
+anchors = 13,17,  31,25,  24,51, 61,45,  61,45,  48,102,  119,96,  97,189,  97,189,  217,184,  171,384,  324,451,  324,451, 545,357, 616,618, 1024,1024
+classes=80
+num=16
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6
+# YOLO-6
+[route]
+layers = 288
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=1024
+activation=mish
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=340
+activation=linear
+[yolo]
+mask = 12,13,14,15
+anchors = 13,17,  31,25,  24,51, 61,45,  61,45,  48,102,  119,96,  97,189,  97,189,  217,184,  171,384,  324,451,  324,451, 545,357, 616,618, 1024,1024
+classes=80
+num=16
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6
+# ============ End of Head ============ #

cfg/yolov4_p7.cfg ADDED Viewed

	@@ -0,0 +1,2714 @@

+[net]
+batch=64
+subdivisions=8
+width=1536
+height=1536
+channels=3
+momentum=0.949
+decay=0.0005
+angle=0
+saturation = 1.5
+exposure = 1.5
+hue=.1
+learning_rate=0.00261
+burn_in=1000
+max_batches = 500500
+policy=steps
+steps=400000,450000
+scales=.1,.1
+mosaic=1
+# ============ Backbone ============ #
+# Stem
+# 0
+[convolutional]
+batch_normalize=1
+filters=40
+size=3
+stride=1
+pad=1
+activation=mish
+# P1
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=80
+size=3
+stride=2
+pad=1
+activation=mish
+# Split
+[convolutional]
+batch_normalize=1
+filters=40
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=40
+size=1
+stride=1
+pad=1
+activation=mish
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=40
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=40
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=40
+size=1
+stride=1
+pad=1
+activation=mish
+# Merge [-1, -(3k+4)]
+[route]
+layers = -1,-7
+# Transition last
+# 10 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=80
+size=1
+stride=1
+pad=1
+activation=mish
+# P2
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=2
+pad=1
+activation=mish
+# Split
+[convolutional]
+batch_normalize=1
+filters=80
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=80
+size=1
+stride=1
+pad=1
+activation=mish
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=80
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=80
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=80
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=80
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=80
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=80
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=80
+size=1
+stride=1
+pad=1
+activation=mish
+# Merge [-1, -(3k+4)]
+[route]
+layers = -1,-13
+# Transition last
+# 26 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=mish
+# P3
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=2
+pad=1
+activation=mish
+# Split
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=mish
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=160
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=mish
+# Merge [-1, -(3k+4)]
+[route]
+layers = -1,-49
+# Transition last
+# 78 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+# P4
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=2
+pad=1
+activation=mish
+# Split
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=320
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+# Merge [-1, -(3k+4)]
+[route]
+layers = -1,-49
+# Transition last
+# 130 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+# P5
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=1280
+size=3
+stride=2
+pad=1
+activation=mish
+# Split
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+# Merge [-1, -(3k+4)]
+[route]
+layers = -1,-25
+# Transition last
+# 158 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=1280
+size=1
+stride=1
+pad=1
+activation=mish
+# P6
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=1280
+size=3
+stride=2
+pad=1
+activation=mish
+# Split
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+# Merge [-1, -(3k+4)]
+[route]
+layers = -1,-25
+# Transition last
+# 186 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=1280
+size=1
+stride=1
+pad=1
+activation=mish
+# P7
+# Downsample
+[convolutional]
+batch_normalize=1
+filters=1280
+size=3
+stride=2
+pad=1
+activation=mish
+# Split
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+# Residual Block
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=3
+stride=1
+pad=1
+activation=mish
+[shortcut]
+from=-3
+activation=linear
+# Transition first
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+# Merge [-1, -(3k+4)]
+[route]
+layers = -1,-25
+# Transition last
+# 214 (previous+7+3k)
+[convolutional]
+batch_normalize=1
+filters=1280
+size=1
+stride=1
+pad=1
+activation=mish
+# ============ End of Backbone ============ #
+# ============ Neck ============ #
+# CSPSPP
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+### SPP ###
+[maxpool]
+stride=1
+size=5
+[route]
+layers=-2
+[maxpool]
+stride=1
+size=9
+[route]
+layers=-4
+[maxpool]
+stride=1
+size=13
+[route]
+layers=-1,-3,-5,-6
+### End SPP ###
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=mish
+[route]
+layers = -1, -13
+# 229 (previous+6+5+2k)
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+# End of CSPSPP
+# FPN-6
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[upsample]
+stride=2
+[route]
+layers = 186
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -1, -3
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+# Split
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=mish
+# Merge [-1, -(2k+2)]
+[route]
+layers = -1, -8
+# Transition last
+# 245 (previous+6+4+2k)
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+# FPN-5
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[upsample]
+stride=2
+[route]
+layers = 158
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -1, -3
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+# Split
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=mish
+# Merge [-1, -(2k+2)]
+[route]
+layers = -1, -8
+# Transition last
+# 261 (previous+6+4+2k)
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+# FPN-4
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+[upsample]
+stride=2
+[route]
+layers = 130
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -1, -3
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+# Split
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=320
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=320
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=320
+activation=mish
+# Merge [-1, -(2k+2)]
+[route]
+layers = -1, -8
+# Transition last
+# 277 (previous+6+4+2k)
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+# FPN-3
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=mish
+[upsample]
+stride=2
+[route]
+layers = 78
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -1, -3
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=mish
+# Split
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=160
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=160
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=160
+activation=mish
+# Merge [-1, -(2k+2)]
+[route]
+layers = -1, -8
+# Transition last
+# 293 (previous+6+4+2k)
+[convolutional]
+batch_normalize=1
+filters=160
+size=1
+stride=1
+pad=1
+activation=mish
+# PAN-4
+[convolutional]
+batch_normalize=1
+size=3
+stride=2
+pad=1
+filters=320
+activation=mish
+[route]
+layers = -1, 277
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+# Split
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=320
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=320
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=320
+activation=mish
+[route]
+layers = -1,-8
+# Transition last
+# 306 (previous+3+4+2k)
+[convolutional]
+batch_normalize=1
+filters=320
+size=1
+stride=1
+pad=1
+activation=mish
+# PAN-5
+[convolutional]
+batch_normalize=1
+size=3
+stride=2
+pad=1
+filters=640
+activation=mish
+[route]
+layers = -1, 261
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+# Split
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=mish
+[route]
+layers = -1,-8
+# Transition last
+# 319 (previous+3+4+2k)
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+# PAN-6
+[convolutional]
+batch_normalize=1
+size=3
+stride=2
+pad=1
+filters=640
+activation=mish
+[route]
+layers = -1, 245
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+# Split
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=mish
+[route]
+layers = -1,-8
+# Transition last
+# 332 (previous+3+4+2k)
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+# PAN-7
+[convolutional]
+batch_normalize=1
+size=3
+stride=2
+pad=1
+filters=640
+activation=mish
+[route]
+layers = -1, 229
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+# Split
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[route]
+layers = -2
+# Plain Block
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=mish
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=mish
+[route]
+layers = -1,-8
+# Transition last
+# 345 (previous+3+4+2k)
+[convolutional]
+batch_normalize=1
+filters=640
+size=1
+stride=1
+pad=1
+activation=mish
+# ============ End of Neck ============ #
+# ============ Head ============ #
+# YOLO-3
+[route]
+layers = 293
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=320
+activation=mish
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=340
+activation=linear
+[yolo]
+mask = 0,1,2,3
+anchors = 13,17,  22,25,  27,66, 55,41,  57,88,  112,69,  69,177,  136,138,  136,138,  287,114,  134,275,  268,248,  268,248,  232,504, 445,416,  640,640,  812,393,  477,808,  1070,908,  1408,1408
+classes=80
+num=20
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6
+# YOLO-4
+[route]
+layers = 306
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=640
+activation=mish
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=340
+activation=linear
+[yolo]
+mask = 4,5,6,7
+anchors = 13,17,  22,25,  27,66, 55,41,  57,88,  112,69,  69,177,  136,138,  136,138,  287,114,  134,275,  268,248,  268,248,  232,504, 445,416,  640,640,  812,393,  477,808,  1070,908,  1408,1408
+classes=80
+num=20
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6
+# YOLO-5
+[route]
+layers = 319
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=1280
+activation=mish
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=340
+activation=linear
+[yolo]
+mask = 8,9,10,11
+anchors = 13,17,  22,25,  27,66, 55,41,  57,88,  112,69,  69,177,  136,138,  136,138,  287,114,  134,275,  268,248,  268,248,  232,504, 445,416,  640,640,  812,393,  477,808,  1070,908,  1408,1408
+classes=80
+num=20
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6
+# YOLO-6
+[route]
+layers = 332
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=1280
+activation=mish
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=340
+activation=linear
+[yolo]
+mask = 12,13,14,15
+anchors = 13,17,  22,25,  27,66, 55,41,  57,88,  112,69,  69,177,  136,138,  136,138,  287,114,  134,275,  268,248,  268,248,  232,504, 445,416,  640,640,  812,393,  477,808,  1070,908,  1408,1408
+classes=80
+num=20
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6
+# YOLO-7
+[route]
+layers = 345
+[convolutional]
+batch_normalize=1
+size=3
+stride=1
+pad=1
+filters=1280
+activation=mish
+[convolutional]
+size=1
+stride=1
+pad=1
+filters=340
+activation=linear
+[yolo]
+mask = 16,17,18,19
+anchors = 13,17,  22,25,  27,66, 55,41,  57,88,  112,69,  69,177,  136,138,  136,138,  287,114,  134,275,  268,248,  268,248,  232,504, 445,416,  640,640,  812,393,  477,808,  1070,908,  1408,1408
+classes=80
+num=20
+jitter=.3
+ignore_thresh = .7
+truth_thresh = 1
+random=1
+scale_x_y = 1.05
+iou_thresh=0.213
+cls_normalizer=1.0
+iou_normalizer=0.07
+iou_loss=ciou
+nms_kind=greedynms
+beta_nms=0.6
+# ============ End of Head ============ #

data/coco.names ADDED Viewed

	@@ -0,0 +1,80 @@

+person
+bicycle
+car
+motorcycle
+airplane
+bus
+train
+truck
+boat
+traffic light
+fire hydrant
+stop sign
+parking meter
+bench
+bird
+cat
+dog
+horse
+sheep
+cow
+elephant
+bear
+zebra
+giraffe
+backpack
+umbrella
+handbag
+tie
+suitcase
+frisbee
+skis
+snowboard
+sports ball
+kite
+baseball bat
+baseball glove
+skateboard
+surfboard
+tennis racket
+bottle
+wine glass
+cup
+fork
+knife
+spoon
+bowl
+banana
+apple
+sandwich
+orange
+broccoli
+carrot
+hot dog
+pizza
+donut
+cake
+chair
+couch
+potted plant
+bed
+dining table
+toilet
+tv
+laptop
+mouse
+remote
+keyboard
+cell phone
+microwave
+oven
+toaster
+sink
+refrigerator
+book
+clock
+vase
+scissors
+teddy bear
+hair drier
+toothbrush

data/coco.yaml ADDED Viewed

	@@ -0,0 +1,18 @@

+# train and val datasets (image directory or *.txt file with image paths)
+train: ../coco/train2017.txt  # 118k images
+val: ../coco/val2017.txt  # 5k images
+test: ../coco/test-dev2017.txt  # 20k images for submission to https://competitions.codalab.org/competitions/20794
+# number of classes
+nc: 80
+# class names
+names: ['person', 'bicycle', 'car', 'motorcycle', 'airplane', 'bus', 'train', 'truck', 'boat', 'traffic light',
+        'fire hydrant', 'stop sign', 'parking meter', 'bench', 'bird', 'cat', 'dog', 'horse', 'sheep', 'cow',
+        'elephant', 'bear', 'zebra', 'giraffe', 'backpack', 'umbrella', 'handbag', 'tie', 'suitcase', 'frisbee',
+        'skis', 'snowboard', 'sports ball', 'kite', 'baseball bat', 'baseball glove', 'skateboard', 'surfboard',
+        'tennis racket', 'bottle', 'wine glass', 'cup', 'fork', 'knife', 'spoon', 'bowl', 'banana', 'apple',
+        'sandwich', 'orange', 'broccoli', 'carrot', 'hot dog', 'pizza', 'donut', 'cake', 'chair', 'couch',
+        'potted plant', 'bed', 'dining table', 'toilet', 'tv', 'laptop', 'mouse', 'remote', 'keyboard', 'cell phone',
+        'microwave', 'oven', 'toaster', 'sink', 'refrigerator', 'book', 'clock', 'vase', 'scissors', 'teddy bear',
+        'hair drier', 'toothbrush']

data/hyp.finetune.1280.yaml ADDED Viewed

	@@ -0,0 +1,28 @@

+lr0: 0.01  # initial learning rate (SGD=1E-2, Adam=1E-3)
+lrf: 0.2  # final OneCycleLR learning rate (lr0 * lrf)
+momentum: 0.937  # SGD momentum/Adam beta1
+weight_decay: 0.0005  # optimizer weight decay 5e-4
+warmup_epochs: 3.0  # warmup epochs (fractions ok)
+warmup_momentum: 0.8  # warmup initial momentum
+warmup_bias_lr: 0.1  # warmup initial bias lr
+box: 0.05  # box loss gain
+cls: 0.5  # cls loss gain
+cls_pw: 1.0  # cls BCELoss positive_weight
+obj: 1.0  # obj loss gain (scale with pixels)
+obj_pw: 1.0  # obj BCELoss positive_weight
+iou_t: 0.20  # IoU training threshold
+anchor_t: 4.0  # anchor-multiple threshold
+# anchors: 3  # anchors per output layer (0 to ignore)
+fl_gamma: 0.0  # focal loss gamma (efficientDet default gamma=1.5)
+hsv_h: 0.015  # image HSV-Hue augmentation (fraction)
+hsv_s: 0.7  # image HSV-Saturation augmentation (fraction)
+hsv_v: 0.4  # image HSV-Value augmentation (fraction)
+degrees: 0.0  # image rotation (+/- deg)
+translate: 0.5  # image translation (+/- fraction)
+scale: 0.8  # image scale (+/- gain)
+shear: 0.0  # image shear (+/- deg)
+perspective: 0.0  # image perspective (+/- fraction), range 0-0.001
+flipud: 0.0  # image flip up-down (probability)
+fliplr: 0.5  # image flip left-right (probability)
+mosaic: 1.0  # image mosaic (probability)
+mixup: 0.2  # image mixup (probability)

data/hyp.scratch.1280.yaml ADDED Viewed

	@@ -0,0 +1,28 @@

+lr0: 0.01  # initial learning rate (SGD=1E-2, Adam=1E-3)
+lrf: 0.2  # final OneCycleLR learning rate (lr0 * lrf)
+momentum: 0.937  # SGD momentum/Adam beta1
+weight_decay: 0.0005  # optimizer weight decay 5e-4
+warmup_epochs: 3.0  # warmup epochs (fractions ok)
+warmup_momentum: 0.8  # warmup initial momentum
+warmup_bias_lr: 0.1  # warmup initial bias lr
+box: 0.05  # box loss gain
+cls: 0.5  # cls loss gain
+cls_pw: 1.0  # cls BCELoss positive_weight
+obj: 1.0  # obj loss gain (scale with pixels)
+obj_pw: 1.0  # obj BCELoss positive_weight
+iou_t: 0.20  # IoU training threshold
+anchor_t: 4.0  # anchor-multiple threshold
+# anchors: 3  # anchors per output layer (0 to ignore)
+fl_gamma: 0.0  # focal loss gamma (efficientDet default gamma=1.5)
+hsv_h: 0.015  # image HSV-Hue augmentation (fraction)
+hsv_s: 0.7  # image HSV-Saturation augmentation (fraction)
+hsv_v: 0.4  # image HSV-Value augmentation (fraction)
+degrees: 0.0  # image rotation (+/- deg)
+translate: 0.5  # image translation (+/- fraction)
+scale: 0.5  # image scale (+/- gain)
+shear: 0.0  # image shear (+/- deg)
+perspective: 0.0  # image perspective (+/- fraction), range 0-0.001
+flipud: 0.0  # image flip up-down (probability)
+fliplr: 0.5  # image flip left-right (probability)
+mosaic: 1.0  # image mosaic (probability)
+mixup: 0.0  # image mixup (probability)

data/hyp.scratch.640.yaml ADDED Viewed

	@@ -0,0 +1,28 @@

+lr0: 0.01  # initial learning rate (SGD=1E-2, Adam=1E-3)
+lrf: 0.2  # final OneCycleLR learning rate (lr0 * lrf)
+momentum: 0.937  # SGD momentum/Adam beta1
+weight_decay: 0.0005  # optimizer weight decay 5e-4
+warmup_epochs: 3.0  # warmup epochs (fractions ok)
+warmup_momentum: 0.8  # warmup initial momentum
+warmup_bias_lr: 0.1  # warmup initial bias lr
+box: 0.05  # box loss gain
+cls: 0.3  # cls loss gain
+cls_pw: 1.0  # cls BCELoss positive_weight
+obj: 0.7  # obj loss gain (scale with pixels)
+obj_pw: 1.0  # obj BCELoss positive_weight
+iou_t: 0.20  # IoU training threshold
+anchor_t: 4.0  # anchor-multiple threshold
+# anchors: 3  # anchors per output layer (0 to ignore)
+fl_gamma: 0.0  # focal loss gamma (efficientDet default gamma=1.5)
+hsv_h: 0.015  # image HSV-Hue augmentation (fraction)
+hsv_s: 0.7  # image HSV-Saturation augmentation (fraction)
+hsv_v: 0.4  # image HSV-Value augmentation (fraction)
+degrees: 0.0  # image rotation (+/- deg)
+translate: 0.1  # image translation (+/- fraction)
+scale: 0.9  # image scale (+/- gain)
+shear: 0.0  # image shear (+/- deg)
+perspective: 0.0  # image perspective (+/- fraction), range 0-0.001
+flipud: 0.0  # image flip up-down (probability)
+fliplr: 0.5  # image flip left-right (probability)
+mosaic: 1.0  # image mosaic (probability)
+mixup: 0.0  # image mixup (probability)

deep_sort_pytorch/.DS_Store ADDED Viewed

Binary file (6.15 kB). View file

deep_sort_pytorch/.gitignore ADDED Viewed

	@@ -0,0 +1,13 @@

+# Folders
+__pycache__/
+build/
+*.egg-info
+# Files
+*.weights
+*.t7
+*.mp4
+*.avi
+*.so
+*.txt

deep_sort_pytorch/LICENSE ADDED Viewed

	@@ -0,0 +1,21 @@

+MIT License
+Copyright (c) 2020 Ziqiang
+Permission is hereby granted, free of charge, to any person obtaining a copy
+of this software and associated documentation files (the "Software"), to deal
+in the Software without restriction, including without limitation the rights
+to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
+copies of the Software, and to permit persons to whom the Software is
+furnished to do so, subject to the following conditions:
+The above copyright notice and this permission notice shall be included in all
+copies or substantial portions of the Software.
+THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
+IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
+FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
+AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
+LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
+OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
+SOFTWARE.

deep_sort_pytorch/README.md ADDED Viewed

	@@ -0,0 +1,137 @@

+# Deep Sort with PyTorch
+![](demo/demo.gif)
+## Update(1-1-2020)
+Changes
+- fix bugs
+- refactor code
+- accerate detection by adding nms on gpu
+## Latest Update(07-22)
+Changes
+- bug fix (Thanks @JieChen91 and @yingsen1 for bug reporting).
+- using batch for feature extracting for each frame, which lead to a small speed up.
+- code improvement.
+Futher improvement direction
+- Train detector on specific dataset rather than the official one.
+- Retrain REID model on pedestrain dataset for better performance.
+- Replace YOLOv3 detector with advanced ones.
+**Any contributions to this repository is welcome!**
+## Introduction
+This is an implement of MOT tracking algorithm deep sort. Deep sort is basicly the same with sort but added a CNN model to extract features in image of human part bounded by a detector. This CNN model is indeed a RE-ID model and the detector used in [PAPER](https://arxiv.org/abs/1703.07402) is FasterRCNN , and the original source code is [HERE](https://github.com/nwojke/deep_sort).
+However in original code, the CNN model is implemented with tensorflow, which I'm not familier with. SO I re-implemented the CNN feature extraction model with PyTorch, and changed the CNN model a little bit. Also, I use **YOLOv3** to generate bboxes instead of FasterRCNN.
+## Dependencies
+- python 3 (python2 not sure)
+- numpy
+- scipy
+- opencv-python
+- sklearn
+- torch >= 0.4
+- torchvision >= 0.1
+- pillow
+- vizer
+- edict
+## Quick Start
+0. Check all dependencies installed
+```bash
+pip install -r requirements.txt
+```
+for user in china, you can specify pypi source to accelerate install like:
+```bash
+pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
+```
+1. Clone this repository
+```
+git clone git@github.com:ZQPei/deep_sort_pytorch.git
+```
+2. Download YOLOv3 parameters
+```
+cd detector/YOLOv3/weight/
+wget https://pjreddie.com/media/files/yolov3.weights
+wget https://pjreddie.com/media/files/yolov3-tiny.weights
+cd ../../../
+```
+3. Download deepsort parameters ckpt.t7
+```
+cd deep_sort/deep/checkpoint
+# download ckpt.t7 from
+https://drive.google.com/drive/folders/1xhG0kRH1EX5B9_Iz8gQJb7UNnn_riXi6 to this folder
+cd ../../../
+```
+4. Compile nms module
+```bash
+cd detector/YOLOv3/nms
+sh build.sh
+cd ../../..
+```
+Notice:
+If compiling failed, the simplist way is to **Upgrade your pytorch >= 1.1 and torchvision >= 0.3" and you can avoid the troublesome compiling problems which are most likely caused by either `gcc version too low` or `libraries missing`.
+5. Run demo
+```
+usage: python yolov3_deepsort.py VIDEO_PATH
+                                [--help]
+                                [--frame_interval FRAME_INTERVAL]
+                                [--config_detection CONFIG_DETECTION]
+                                [--config_deepsort CONFIG_DEEPSORT]
+                                [--display]
+                                [--display_width DISPLAY_WIDTH]
+                                [--display_height DISPLAY_HEIGHT]
+                                [--save_path SAVE_PATH]
+                                [--cpu]
+# yolov3 + deepsort
+python yolov3_deepsort.py [VIDEO_PATH]
+# yolov3_tiny + deepsort
+python yolov3_deepsort.py [VIDEO_PATH] --config_detection ./configs/yolov3_tiny.yaml
+# yolov3 + deepsort on webcam
+python3 yolov3_deepsort.py /dev/video0 --camera 0
+# yolov3_tiny + deepsort on webcam
+python3 yolov3_deepsort.py /dev/video0 --config_detection ./configs/yolov3_tiny.yaml --camera 0
+```
+Use `--display` to enable display.
+Results will be saved to `./output/results.avi` and `./output/results.txt`.
+All files above can also be accessed from BaiduDisk!
+linker：[BaiduDisk](https://pan.baidu.com/s/1YJ1iPpdFTlUyLFoonYvozg)
+passwd：fbuw
+## Training the RE-ID model
+The original model used in paper is in original_model.py, and its parameter here [original_ckpt.t7](https://drive.google.com/drive/folders/1xhG0kRH1EX5B9_Iz8gQJb7UNnn_riXi6).
+To train the model, first you need download [Market1501](http://www.liangzheng.com.cn/Project/project_reid.html) dataset or [Mars](http://www.liangzheng.com.cn/Project/project_mars.html) dataset.
+Then you can try [train.py](deep_sort/deep/train.py) to train your own parameter and evaluate it using [test.py](deep_sort/deep/test.py) and [evaluate.py](deep_sort/deep/evalute.py).
+![train.jpg](deep_sort/deep/train.jpg)
+## Demo videos and images
+[demo.avi](https://drive.google.com/drive/folders/1xhG0kRH1EX5B9_Iz8gQJb7UNnn_riXi6)
+[demo2.avi](https://drive.google.com/drive/folders/1xhG0kRH1EX5B9_Iz8gQJb7UNnn_riXi6)
+![1.jpg](demo/1.jpg)
+![2.jpg](demo/2.jpg)
+## References
+- paper: [Simple Online and Realtime Tracking with a Deep Association Metric](https://arxiv.org/abs/1703.07402)
+- code: [nwojke/deep_sort](https://github.com/nwojke/deep_sort)
+- paper: [YOLOv3](https://pjreddie.com/media/files/papers/YOLOv3.pdf)
+- code: [Joseph Redmon/yolov3](https://pjreddie.com/darknet/yolo/)

deep_sort_pytorch/configs/deep_sort.yaml ADDED Viewed

	@@ -0,0 +1,10 @@

+DEEPSORT:
+  REID_CKPT: "deep_sort_pytorch/deep_sort/deep/checkpoint/ckpt.t7"
+  MAX_DIST: 0.2
+  MIN_CONFIDENCE: 0.3
+  NMS_MAX_OVERLAP: 0.5
+  MAX_IOU_DISTANCE: 0.7
+  MAX_AGE: 70
+  N_INIT: 3
+  NN_BUDGET: 100

deep_sort_pytorch/deep_sort/.DS_Store ADDED Viewed

Binary file (8.2 kB). View file

deep_sort_pytorch/deep_sort/README.md ADDED Viewed

	@@ -0,0 +1,3 @@


1	+ # Deep Sort
2	+
3	+ This is the implemention of deep sort with pytorch.

deep_sort_pytorch/deep_sort/__init__.py ADDED Viewed

	@@ -0,0 +1,21 @@

+from .deep_sort import DeepSort
+__all__ = ['DeepSort', 'build_tracker']
+def build_tracker(cfg, use_cuda):
+    return DeepSort(cfg.DEEPSORT.REID_CKPT,
+                max_dist=cfg.DEEPSORT.MAX_DIST, min_confidence=cfg.DEEPSORT.MIN_CONFIDENCE,
+                nms_max_overlap=cfg.DEEPSORT.NMS_MAX_OVERLAP, max_iou_distance=cfg.DEEPSORT.MAX_IOU_DISTANCE,
+                max_age=cfg.DEEPSORT.MAX_AGE, n_init=cfg.DEEPSORT.N_INIT, nn_budget=cfg.DEEPSORT.NN_BUDGET, use_cuda=use_cuda)

deep_sort_pytorch/deep_sort/__pycache__/__init__.cpython-310.pyc ADDED Viewed

Binary file (648 Bytes). View file