- Описание :
3dshapes — это набор данных трехмерных фигур, процедурно сгенерированных на основе шести независимых скрытых факторов. Этими факторами являются цвет пола , цвет стен , цвет объекта , масштаб , форма и ориентация .
Все возможные комбинации этих латентов присутствуют ровно один раз, генерируя всего N = 480 000 изображений.
Значения скрытого фактора
- оттенок пола: 10 значений, линейно расположенных в [0, 1]
- оттенок стены: 10 значений, линейно расположенных в [0, 1]
- оттенок объекта: 10 значений, линейно расположенных в [0, 1]
- масштаб: 8 значений, линейно расположенных в [0, 1]
- форма: 4 значения в [0, 1, 2, 3]
- ориентация: 15 значений, линейно расположенных в интервале [-30, 30]
Мы изменяли один латент за раз (начиная с ориентации, затем формы и т. д.) и последовательно сохраняли изображения в фиксированном порядке в массиве images
. Соответствующие значения факторов сохраняются в том же порядке в массиве labels
.
Дополнительная документация : Изучите статьи с кодом
Домашняя страница : https://github.com/deepmind/3d-shapes .
Исходный код :
tfds.datasets.shapes3d.Builder
Версии :
-
2.0.0
(по умолчанию): новый API разделения ( https://tensorflow.org/datasets/splits )
-
Размер загрузки :
255.18 MiB
Размер набора данных :
1.68 GiB
Автокэширование ( документация ): Нет
Расколы :
Расколоть | Примеры |
---|---|
'train' | 480 000 |
- Структура функции :
FeaturesDict({
'image': Image(shape=(64, 64, 3), dtype=uint8),
'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'value_floor_hue': float32,
'value_object_hue': float32,
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_wall_hue': float32,
})
- Функциональная документация :
Особенность | Сорт | Форма | Дтип | Описание |
---|---|---|---|---|
ВозможностиDict | ||||
изображение | Изображение | (64, 64, 3) | uint8 | |
label_floor_hue | Класслейбл | int64 | ||
label_object_hue | Класслейбл | int64 | ||
label_orientation | Класслейбл | int64 | ||
label_scale | Класслейбл | int64 | ||
label_shape | Класслейбл | int64 | ||
label_wall_hue | Класслейбл | int64 | ||
value_floor_hue | Тензор | float32 | ||
value_object_hue | Тензор | float32 | ||
значение_ориентация | Тензор | float32 | ||
шкала_значения | Тензор | float32 | ||
value_shape | Тензор | float32 | ||
value_wall_hue | Тензор | float32 |
Контролируемые ключи (см. документ
as_supervised
):None
Рисунок ( tfds.show_examples ):
- Примеры ( tfds.as_dataframe ):
- Цитата :
@misc{3dshapes18,
title={3D Shapes Dataset},
author={Burgess, Chris and Kim, Hyunjik},
howpublished={https://github.com/deepmind/3dshapes-dataset/},
year={2018}
}