kształty3d

  • Opis :

3dshapes to zbiór danych kształtów 3D wygenerowanych proceduralnie na podstawie 6 niezależnych od prawdy czynników ukrytych. Czynnikami tymi są kolor podłogi , kolor ścian , kolor obiektu , skala , kształt i orientacja .

Wszystkie możliwe kombinacje tych latencji występują dokładnie raz, tworząc łącznie N = 480000 obrazów.

Ukryte wartości czynników

  • odcień podłogi: 10 wartości rozmieszczonych liniowo w [0, 1]
  • odcień ściany: 10 wartości rozmieszczonych liniowo w [0, 1]
  • odcień obiektu: 10 wartości rozmieszczonych liniowo w [0, 1]
  • skala: 8 wartości rozmieszczonych liniowo w [0, 1]
  • kształt: 4 wartości w [0, 1, 2, 3]
  • orientacja: 15 wartości rozmieszczonych liniowo w [-30, 30]

Zmienialiśmy po jednym ukryciu na raz (zaczynając od orientacji, następnie kształtu itp.) i sekwencyjnie przechowywaliśmy obrazy w ustalonej kolejności w tablicy images . Odpowiednie wartości współczynników są przechowywane w tej samej kolejności w tablicy labels .

Podział Przykłady
'train' 480 000
  • Struktura funkcji :
FeaturesDict({
    'image': Image(shape=(64, 64, 3), dtype=uint8),
    'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'value_floor_hue': float32,
    'value_object_hue': float32,
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_wall_hue': float32,
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDykt
obraz Obraz (64, 64, 3) uint8
label_floor_hue Etykieta klasy int64
etykieta_obiekt_odcień Etykieta klasy int64
orientacja_etykiety Etykieta klasy int64
etykieta_skala Etykieta klasy int64
etykieta_kształt Etykieta klasy int64
label_wall_hue Etykieta klasy int64
wartość_odcienia_podłogi Napinacz pływak32
wartość_obiektu_barwa Napinacz pływak32
orientacja_wartości Napinacz pływak32
skala wartości Napinacz pływak32
wartość_kształt Napinacz pływak32
wartość_odcienia_ściany Napinacz pływak32

Wyobrażanie sobie

  • Cytat :
@misc{3dshapes18,
  title={3D Shapes Dataset},
  author={Burgess, Chris and Kim, Hyunjik},
  howpublished={https://github.com/deepmind/3dshapes-dataset/},
  year={2018}
}