- Описание :
Kitti содержит набор задач машинного зрения, созданных с использованием платформы автономного вождения. Полный тест содержит множество задач, таких как стерео, оптический поток, визуальная одометрия и т. д. Этот набор данных содержит набор данных для обнаружения объектов, включая монокулярные изображения и ограничивающие рамки. Набор данных содержит 7481 обучающее изображение, помеченное трехмерными ограничивающими рамками. Полное описание аннотаций можно найти в файле readme комплекта разработки объектов на домашней странице Kitti.
Дополнительная документация : Изучите статьи с кодом
Домашняя страница : http://www.cvlibs.net/datasets/kitti/
Исходный код :
tfds.datasets.kitti.Builder
Версии :
-
3.1.0
: Нет примечаний к выпуску. -
3.2.0
: обновлен Devkit. -
3.3.0
(по умолчанию): добавлены метки дляoccluded
объекта.
-
Размер загрузки :
11.71 GiB
Размер набора данных :
5.27 GiB
Автокэширование ( документация ): Нет
Расколы :
Расколоть | Примеры |
---|---|
'test' | 711 |
'train' | 6,347 |
'validation' | 423 |
- Структура функции :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/file_name': Text(shape=(), dtype=string),
'objects': Sequence({
'alpha': float32,
'bbox': BBoxFeature(shape=(4,), dtype=float32, description=2D bounding box of object in the image),
'dimensions': Tensor(shape=(3,), dtype=float32, description=3D object dimensions: height, width, length (in meters)),
'location': Tensor(shape=(3,), dtype=float32, description=3D object location x,y,z in camera coordinates (in meters)),
'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
'rotation_y': float32,
'truncated': float32,
'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
}),
})
- Функциональная документация :
Особенность | Сорт | Форма | Дтип | Описание |
---|---|---|---|---|
ВозможностиDict | ||||
изображение | Изображение | (Нет, Нет, 3) | uint8 | |
изображение/имя_файла | Текст | нить | ||
объекты | Последовательность | |||
объекты/альфа | Тензор | поплавок32 | Угол наблюдения объекта в диапазоне [-pi..pi] | |
объекты/bbox | BBoxFeature | (4,) | поплавок32 | 2D-ограничительная рамка объекта на изображении |
объекты/размеры | Тензор | (3,) | поплавок32 | Размеры 3D-объекта: высота, ширина, длина (в метрах) |
объекты/локация | Тензор | (3,) | поплавок32 | Местоположение 3D-объекта x,y,z в координатах камеры (в метрах) |
объекты/закрыты | Класслейбл | int64 | Целое число (0,1,2,3), указывающее состояние окклюзии: 0 = полностью видно, 1 = частично закрыто, 2 = сильно закрыто, 3 = неизвестно. | |
объекты/rotation_y | Тензор | поплавок32 | Вращение ry вокруг оси Y в координатах камеры [-pi..pi] | |
объекты/усеченные | Тензор | поплавок32 | Плавающее значение от 0 (не усечено) до 1 (усечено), где усечено относится к объекту, выходящему за границы изображения. | |
объекты/тип | Класслейбл | int64 | Тип объекта, например «Автомобиль» или «Фургон». |
Контролируемые ключи (см. документ
as_supervised
):None
Рисунок ( tfds.show_examples ):
- Примеры ( tfds.as_dataframe ):
- Цитата :
@inproceedings{Geiger2012CVPR,
author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
year = {2012}
}