Spaces:

miskey607218
/

rtdetr_fog

Running on Zero

App Files Files Community

rtdetr_fog / src /data /coco /coco_dataset.py

miskey607218

First commit of my fog detection app

2a25b9b about 2 months ago

raw

history blame contribute delete

12.1 kB

	"""
	# Copyright (c) Facebook, Inc. and its affiliates. All Rights Reserved

	COCO dataset which returns image_id for evaluation.
	Mostly copy-paste from https://github.com/pytorch/vision/blob/13b35ff/references/detection/coco_utils.py
	"""

	import os
	import re
	import torch
	import torch.utils.data

	import numpy as np
	import torchvision
	torchvision.disable_beta_transforms_warning()

	try:
	from torchvision import datapoints as _datapoints
	_HAS_DATAPOINTS = True
	except Exception:
	from torchvision import tv_tensors as _datapoints
	_HAS_DATAPOINTS = False


	def _make_bounding_box(data, format, spatial_size):
	fmt = format
	if _HAS_DATAPOINTS:
	return _datapoints.BoundingBox(data, format=fmt, spatial_size=spatial_size)
	return _datapoints.BoundingBoxes(data, format=fmt, canvas_size=spatial_size)

	from PIL import Image
	from pycocotools import mask as coco_mask

	from src.core import register

	__all__ = ['CocoDetection', 'ConcatCocoDetection']


	@register
	class CocoDetection(torchvision.datasets.CocoDetection):
	__inject__ = ['transforms']
	__share__ = ['remap_mscoco_category']

	def __init__(
	self,
	img_folder,
	ann_file,
	transforms,
	return_masks,
	remap_mscoco_category=False,
	transmittance_folder=None,
	):
	super(CocoDetection, self).__init__(img_folder, ann_file)
	self._transforms = transforms
	self.prepare = ConvertCocoPolysToMask(return_masks, remap_mscoco_category)
	self.img_folder = img_folder
	self.ann_file = ann_file
	self.return_masks = return_masks
	self.remap_mscoco_category = remap_mscoco_category
	self.transmittance_folder = transmittance_folder

	def _get_transmittance_path(self, file_name: str):
	"""
	COCO `file_name` is expected to look like:
	images/<split>/<city>/<base>_leftImg8bit_foggy_beta_0.xx.png

	Transmittance GT is expected under:
	<transmittance_folder>/<split>/<city>/<base>_leftImg8bit_transmittance_beta_0.xx.png
	"""
	file_name = str(file_name).replace('\\', '/')
	parts = file_name.split('/')
	if len(parts) < 4 or parts[0] != 'images':
	raise ValueError(f'Unexpected coco file_name: {file_name}')

	split = parts[1]
	city = parts[2]
	foggy_name = parts[-1]
	trans_name = foggy_name.replace('leftImg8bit_foggy', 'leftImg8bit_transmittance')
	return os.path.join(self.transmittance_folder, split, city, trans_name)

	def _parse_fog_beta(self, file_name: str):
	"""
	Parse fog beta from file name suffix:
	*_leftImg8bit_foggy_beta_0.005.png
	*_leftImg8bit_foggy_beta_0.01.png
	*_leftImg8bit_foggy_beta_0.02.png
	"""
	m = re.search(r"_beta_([0-9.]+)\.png$", str(file_name))
	if m is None:
	return None
	try:
	return float(m.group(1))
	except Exception:
	return None

	def __getitem__(self, idx):
	img, target = super(CocoDetection, self).__getitem__(idx)
	image_id = self.ids[idx]
	target = {'image_id': image_id, 'annotations': target}
	img, target = self.prepare(img, target)

	# Always attach fog beta so criterion can do mixed-fog sample reweighting.
	file_name = self.coco.imgs[image_id]['file_name']
	fog_beta = self._parse_fog_beta(file_name)
	if fog_beta is not None:
	target['fog_beta'] = torch.tensor([fog_beta], dtype=torch.float32)

	if self.transmittance_folder is not None:
	trans_path = self._get_transmittance_path(file_name)
	if not os.path.isfile(trans_path):
	raise FileNotFoundError(f'Missing transmittance file: {trans_path}')

	t_img = Image.open(trans_path).convert('L')
	t_u8 = torch.as_tensor(np.array(t_img, dtype=np.uint8))
	# Keep it as Mask/TVTensor so geometric transforms can apply.
	if _datapoints is not None:
	t_u8 = _datapoints.Mask(t_u8)
	target['t_gt'] = t_u8

	# ['boxes', 'masks', 'labels']:
	if _datapoints is not None:
	if 'boxes' in target:
	target['boxes'] = _make_bounding_box(
	target['boxes'],
	format=_datapoints.BoundingBoxFormat.XYXY,
	spatial_size=img.size[::-1]) # h w

	if 'masks' in target:
	target['masks'] = _datapoints.Mask(target['masks'])

	if self._transforms is not None:
	img, target = self._transforms(img, target)

	if 't_gt' in target:
	t = target['t_gt']
	t = torch.as_tensor(t)
	if t.ndim == 2:
	t = t.unsqueeze(0)
	target['t_gt'] = t.float() / 255.0

	return img, target

	def extra_repr(self) -> str:
	s = f' img_folder: {self.img_folder}\n ann_file: {self.ann_file}\n'
	s += f' return_masks: {self.return_masks}\n'
	if hasattr(self, '_transforms') and self._transforms is not None:
	s += f' transforms:\n {repr(self._transforms)}'

	return s


	@register
	class ConcatCocoDetection(torch.utils.data.Dataset):
	__inject__ = ['transforms']
	__share__ = ['remap_mscoco_category']

	def __init__(
	self,
	datasets,
	transforms,
	return_masks,
	remap_mscoco_category=False,
	):
	if not isinstance(datasets, (list, tuple)) or len(datasets) == 0:
	raise ValueError('`datasets` must be a non-empty list for ConcatCocoDetection.')

	self.datasets_cfg = list(datasets)
	self._transforms = transforms
	self.return_masks = return_masks
	self.remap_mscoco_category = remap_mscoco_category

	self.subsets = []
	for i, cfg in enumerate(self.datasets_cfg):
	if not isinstance(cfg, dict):
	raise ValueError(f'datasets[{i}] must be a dict, got {type(cfg)}')
	if 'img_folder' not in cfg or 'ann_file' not in cfg:
	raise ValueError(f'datasets[{i}] must contain `img_folder` and `ann_file`.')

	ds = CocoDetection(
	img_folder=cfg['img_folder'],
	ann_file=cfg['ann_file'],
	transforms=self._transforms,
	return_masks=self.return_masks,
	remap_mscoco_category=self.remap_mscoco_category,
	transmittance_folder=cfg.get('transmittance_folder', None),
	)
	self.subsets.append(ds)

	self.concat = torch.utils.data.ConcatDataset(self.subsets)

	def __len__(self):
	return len(self.concat)

	def __getitem__(self, idx):
	return self.concat[idx]

	def extra_repr(self) -> str:
	lines = [f' num_subsets: {len(self.subsets)}']
	for i, cfg in enumerate(self.datasets_cfg):
	lines.append(f' [{i}] img_folder: {cfg.get("img_folder", "")}')
	lines.append(f' ann_file: {cfg.get("ann_file", "")}')
	if cfg.get('transmittance_folder', None) is not None:
	lines.append(f' transmittance_folder: {cfg.get("transmittance_folder", "")}')
	return '\n'.join(lines)


	def convert_coco_poly_to_mask(segmentations, height, width):
	masks = []
	for polygons in segmentations:
	rles = coco_mask.frPyObjects(polygons, height, width)
	mask = coco_mask.decode(rles)
	if len(mask.shape) < 3:
	mask = mask[..., None]
	mask = torch.as_tensor(mask, dtype=torch.uint8)
	mask = mask.any(dim=2)
	masks.append(mask)
	if masks:
	masks = torch.stack(masks, dim=0)
	else:
	masks = torch.zeros((0, height, width), dtype=torch.uint8)
	return masks


	class ConvertCocoPolysToMask(object):
	def __init__(self, return_masks=False, remap_mscoco_category=False):
	self.return_masks = return_masks
	self.remap_mscoco_category = remap_mscoco_category

	def __call__(self, image, target):
	w, h = image.size

	image_id = target["image_id"]
	image_id = torch.tensor([image_id])

	anno = target["annotations"]

	anno = [obj for obj in anno if 'iscrowd' not in obj or obj['iscrowd'] == 0]

	boxes = [obj["bbox"] for obj in anno]
	# guard against no boxes via resizing
	boxes = torch.as_tensor(boxes, dtype=torch.float32).reshape(-1, 4)
	boxes[:, 2:] += boxes[:, :2]
	boxes[:, 0::2].clamp_(min=0, max=w)
	boxes[:, 1::2].clamp_(min=0, max=h)

	if self.remap_mscoco_category:
	classes = [mscoco_category2label[obj["category_id"]] for obj in anno]
	else:
	# Keep COCO json category_id starting from 1, but use 0-based labels for training.
	classes = [obj["category_id"] - 1 for obj in anno]

	classes = torch.tensor(classes, dtype=torch.int64)

	if self.return_masks:
	segmentations = [obj["segmentation"] for obj in anno]
	masks = convert_coco_poly_to_mask(segmentations, h, w)

	keypoints = None
	if anno and "keypoints" in anno[0]:
	keypoints = [obj["keypoints"] for obj in anno]
	keypoints = torch.as_tensor(keypoints, dtype=torch.float32)
	num_keypoints = keypoints.shape[0]
	if num_keypoints:
	keypoints = keypoints.view(num_keypoints, -1, 3)

	keep = (boxes[:, 3] > boxes[:, 1]) & (boxes[:, 2] > boxes[:, 0])
	boxes = boxes[keep]
	classes = classes[keep]
	if self.return_masks:
	masks = masks[keep]
	if keypoints is not None:
	keypoints = keypoints[keep]

	target = {}
	target["boxes"] = boxes
	target["labels"] = classes
	if self.return_masks:
	target["masks"] = masks
	target["image_id"] = image_id
	if keypoints is not None:
	target["keypoints"] = keypoints

	# for conversion to coco api
	area = torch.tensor([obj["area"] for obj in anno])
	iscrowd = torch.tensor([obj["iscrowd"] if "iscrowd" in obj else 0 for obj in anno])
	target["area"] = area[keep]
	target["iscrowd"] = iscrowd[keep]

	target["orig_size"] = torch.as_tensor([int(w), int(h)])
	target["size"] = torch.as_tensor([int(w), int(h)])

	return image, target


	mscoco_category2name = {
	1: 'person',
	2: 'bicycle',
	3: 'car',
	4: 'motorcycle',
	5: 'airplane',
	6: 'bus',
	7: 'train',
	8: 'truck',
	9: 'boat',
	10: 'traffic light',
	11: 'fire hydrant',
	13: 'stop sign',
	14: 'parking meter',
	15: 'bench',
	16: 'bird',
	17: 'cat',
	18: 'dog',
	19: 'horse',
	20: 'sheep',
	21: 'cow',
	22: 'elephant',
	23: 'bear',
	24: 'zebra',
	25: 'giraffe',
	27: 'backpack',
	28: 'umbrella',
	31: 'handbag',
	32: 'tie',
	33: 'suitcase',
	34: 'frisbee',
	35: 'skis',
	36: 'snowboard',
	37: 'sports ball',
	38: 'kite',
	39: 'baseball bat',
	40: 'baseball glove',
	41: 'skateboard',
	42: 'surfboard',
	43: 'tennis racket',
	44: 'bottle',
	46: 'wine glass',
	47: 'cup',
	48: 'fork',
	49: 'knife',
	50: 'spoon',
	51: 'bowl',
	52: 'banana',
	53: 'apple',
	54: 'sandwich',
	55: 'orange',
	56: 'broccoli',
	57: 'carrot',
	58: 'hot dog',
	59: 'pizza',
	60: 'donut',
	61: 'cake',
	62: 'chair',
	63: 'couch',
	64: 'potted plant',
	65: 'bed',
	67: 'dining table',
	70: 'toilet',
	72: 'tv',
	73: 'laptop',
	74: 'mouse',
	75: 'remote',
	76: 'keyboard',
	77: 'cell phone',
	78: 'microwave',
	79: 'oven',
	80: 'toaster',
	81: 'sink',
	82: 'refrigerator',
	84: 'book',
	85: 'clock',
	86: 'vase',
	87: 'scissors',
	88: 'teddy bear',
	89: 'hair drier',
	90: 'toothbrush'
	}

	mscoco_category2label = {k: i for i, k in enumerate(mscoco_category2name.keys())}
	mscoco_label2category = {v: k for k, v in mscoco_category2label.items()}