Китти

Описание :

Kitti содержит набор задач машинного зрения, созданных с использованием платформы автономного вождения. Полный тест содержит множество задач, таких как стерео, оптический поток, визуальная одометрия и т. д. Этот набор данных содержит набор данных для обнаружения объектов, включая монокулярные изображения и ограничивающие рамки. Набор данных содержит 7481 обучающее изображение, помеченное трехмерными ограничивающими рамками. Полное описание аннотаций можно найти в файле readme комплекта разработки объектов на домашней странице Kitti.

Дополнительная документация : Изучите статьи с кодом
Домашняя страница : http://www.cvlibs.net/datasets/kitti/
Исходный код : tfds.datasets.kitti.Builder
Версии :
- 3.1.0 : Нет примечаний к выпуску.
- 3.2.0 : обновлен Devkit.
- 3.3.0 (по умолчанию): добавлены метки для occluded объекта.
Размер загрузки : 11.71 GiB
Размер набора данных : 5.27 GiB
Автокэширование ( документация ): Нет
Расколы :

Расколоть	Примеры
`'test'`	711
`'train'`	6,347
`'validation'`	423

Структура функции :

FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/file_name': Text(shape=(), dtype=string),
    'objects': Sequence({
        'alpha': float32,
        'bbox': BBoxFeature(shape=(4,), dtype=float32, description=2D bounding box of object in the image),
        'dimensions': Tensor(shape=(3,), dtype=float32, description=3D object dimensions: height, width, length (in meters)),
        'location': Tensor(shape=(3,), dtype=float32, description=3D object location x,y,z in camera coordinates (in meters)),
        'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
        'rotation_y': float32,
        'truncated': float32,
        'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
    }),
})

Функциональная документация :

Особенность	Сорт	Форма	Дтип	Описание
	ВозможностиDict
изображение	Изображение	(Нет, Нет, 3)	uint8
изображение/имя_файла	Текст		нить
объекты	Последовательность
объекты/альфа	Тензор		поплавок32	Угол наблюдения объекта в диапазоне [-pi..pi]
объекты/bbox	BBoxFeature	(4,)	поплавок32	2D-ограничительная рамка объекта на изображении
объекты/размеры	Тензор	(3,)	поплавок32	Размеры 3D-объекта: высота, ширина, длина (в метрах)
объекты/локация	Тензор	(3,)	поплавок32	Местоположение 3D-объекта x,y,z в координатах камеры (в метрах)
объекты/закрыты	Класслейбл		int64	Целое число (0,1,2,3), указывающее состояние окклюзии: 0 = полностью видно, 1 = частично закрыто, 2 = сильно закрыто, 3 = неизвестно.
объекты/rotation_y	Тензор		поплавок32	Вращение ry вокруг оси Y в координатах камеры [-pi..pi]
объекты/усеченные	Тензор		поплавок32	Плавающее значение от 0 (не усечено) до 1 (усечено), где усечено относится к объекту, выходящему за границы изображения.
объекты/тип	Класслейбл		int64	Тип объекта, например «Автомобиль» или «Фургон».

Контролируемые ключи (см. документ as_supervised ): None
Рисунок ( tfds.show_examples ):

Визуализация

Примеры ( tfds.as_dataframe ):

Цитата :

@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}