- Opis :
dSprites to zbiór danych kształtów 2D wygenerowanych proceduralnie na podstawie 6 niezależnych od prawdy czynników ukrytych. Czynniki te to kolor , kształt , skala , obrót , pozycje x i y duszka.
Wszystkie możliwe kombinacje tych latencji występują dokładnie raz, generując łącznie N = 737280 obrazów.
Ukryte wartości czynników
- Kolor biały
- Kształt: kwadrat, elipsa, serce
- Skala: 6 wartości rozmieszczonych liniowo w [0,5, 1]
- Orientacja: 40 wartości w [0, 2 pi]
- Pozycja X: 32 wartości w [0, 1]
- Pozycja Y: 32 wartości w [0, 1]
Zmienialiśmy po jednym ukryciu na raz (zaczynając od pozycji Y, następnie pozycji X itd.) i sekwencyjnie zapisywaliśmy obrazy w ustalonej kolejności. W związku z tym kolejność w pierwszym wymiarze jest stała i pozwala na odwzorowanie wartości ukrytych odpowiadających temu obrazowi.
Celowo wybraliśmy wartości ukryte, aby zmiany były najmniejsze, zapewniając jednocześnie, że wyniki wszystkich pikseli były różne. Nie dodano żadnego hałasu.
Dodatkowa dokumentacja : Eksploruj w dokumentach z kodem
Strona główna : https://github.com/deepmind/dsprites-dataset
Kod źródłowy :
tfds.datasets.dsprites.Builder
Wersje :
-
2.0.0
(domyślnie): Nowe podzielone API ( https://tensorflow.org/datasets/splits ) -
2.1.0
: Brak informacji o wydaniu.
-
Rozmiar pobierania :
26.73 MiB
Rozmiar zbioru danych :
Unknown size
Automatyczne buforowanie ( dokumentacja ): Nieznane
Podziały :
Podział | Przykłady |
---|---|
'train' | 737280 |
- Struktura funkcji :
FeaturesDict({
'image': Image(shape=(64, 64, 1), dtype=uint8),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_x_position': float32,
'value_y_position': float32,
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDykt | ||||
obraz | Obraz | (64, 64, 1) | uint8 | |
orientacja_etykiety | Etykieta klasy | int64 | ||
etykieta_skala | Etykieta klasy | int64 | ||
etykieta_kształt | Etykieta klasy | int64 | ||
etykieta_x_pozycja | Etykieta klasy | int64 | ||
pozycja_etykiety | Etykieta klasy | int64 | ||
orientacja_wartości | Napinacz | pływak32 | ||
skala wartości | Napinacz | pływak32 | ||
wartość_kształt | Napinacz | pływak32 | ||
wartość_x_pozycja | Napinacz | pływak32 | ||
wartość_y_pozycji | Napinacz | pływak32 |
Klucze nadzorowane (zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ):
- Przykłady ( tfds.as_dataframe ):
- Cytat :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}