- opis :
Cityscapes to zestaw danych składający się z różnorodnych miejskich scen ulicznych w 50 różnych miastach w różnych porach roku, a także podstawowych prawd dla kilku zadań wizyjnych, w tym segmentacji semantycznej, segmentacji na poziomie instancji (TODO) i wnioskowania o rozbieżnościach par stereo.
W przypadku zadań segmentacji (domyślny podział, dostępny przez „cityscapes/semantic_segmentation”), Cityscapes zapewnia gęste adnotacje na poziomie pikseli dla 5000 obrazów w rozdzielczości 1024 * 2048, wstępnie podzielonych na zestawy treningowe (2975), walidacyjne (500) i testowe (1525). Adnotacje etykiet dla zadań segmentacji obejmują ponad 30 klas często spotykanych podczas postrzegania sceny jazdy. Szczegółowe informacje o etykiecie można znaleźć tutaj: https://github.com/mcordts/cityscapesScripts/blob/master/cityscapesscripts/helpers/labels.py#L52-L99
Cityscapes zapewnia również adnotacje dotyczące segmentacji gruboziarnistej (dostępne przez „cityscapes/semantic_segmentation_extra”) dla 19998 obrazów w podziale „train_extra”, które mogą okazać się przydatne w przypadku modeli do wstępnego uczenia/obciążających dane.
Oprócz segmentacji pejzaże miejskie zapewniają również pary obrazów stereo i podstawowe prawdy do zadań wnioskowania o rozbieżnościach zarówno w podziale normalnym, jak i dodatkowym (dostępne odpowiednio przez „cityscapes/stereo_disparity” i „cityscapes/stereo_disparity_extra”).
Ingore przykłady:
- Dla „pejzaży miejskich/stereo_disparity_extra”:
- troisdorf_000000 000073 {*} obrazy (brak mapy dysproporcji)
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://www.cityscapes-dataset.com
Kod źródłowy :
tfds.datasets.cityscapes.Builder
Wersje :
-
1.0.0
(domyślnie): Brak informacji o wersji.
-
Rozmiar pliku do pobrania :
Unknown size
Instrukcje ręcznego pobierania : ten zestaw danych wymaga ręcznego pobrania danych źródłowych do katalogu
download_config.manual_dir
(domyślnie~/tensorflow_datasets/downloads/manual/
):
Musisz pobrać pliki z https://www.cityscapes-dataset.com/login/ (Ten zestaw danych wymaga rejestracji). W przypadku podstawowej konfiguracji (semantic_segmentation) należy pobrać „leftImg8bit_trainvaltest.zip” i „gtFine_trainvaltest.zip”. Inne konfiguracje wymagają dodatkowych plików — zobacz kod, aby uzyskać więcej informacji.Automatyczne buforowanie ( dokumentacja ): Nie
Klucze nadzorowane (Zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :
@inproceedings{Cordts2016Cityscapes,
title={The Cityscapes Dataset for Semantic Urban Scene Understanding},
author={Cordts, Marius and Omran, Mohamed and Ramos, Sebastian and Rehfeld, Timo and Enzweiler, Markus and Benenson, Rodrigo and Franke, Uwe and Roth, Stefan and Schiele, Bernt},
booktitle={Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2016}
}
cityscapes/semantic_segmentation (domyślna konfiguracja)
Opis konfiguracji : zestaw danych semantycznej segmentacji pejzaży miejskich.
Rozmiar zestawu danych :
10.86 GiB
Podziały :
Rozdzielać | Przykłady |
---|---|
'test' | 1525 |
'train' | 2975 |
'validation' | 500 |
- Struktura funkcji :
FeaturesDict({
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
identyfikator_obrazu | Tekst | strunowy | ||
obraz_po lewej stronie | Obraz | (1024, 2048, 3) | uint8 | |
etykieta_segmentacji | Obraz | (1024, 2048, 1) | uint8 |
- Przykłady ( tfds.as_dataframe ):
cityscapes/semantic_segmentation_extra
Opis konfiguracji: zestaw danych semantycznej segmentacji pejzaży miejskich z podziałem train_extra i etykietami zgrubnymi.
Rozmiar zestawu danych :
51.92 GiB
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 2975 |
'train_extra' | 19 998 |
'validation' | 500 |
- Struktura funkcji :
FeaturesDict({
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
identyfikator_obrazu | Tekst | strunowy | ||
obraz_po lewej stronie | Obraz | (1024, 2048, 3) | uint8 | |
etykieta_segmentacji | Obraz | (1024, 2048, 1) | uint8 |
- Przykłady ( tfds.as_dataframe ):
pejzaże miejskie/stereo_disparity
Opis konfiguracji : Zestaw danych obrazu stereo pejzaży miejskich i map rozbieżności.
Rozmiar zestawu danych :
25.03 GiB
Podziały :
Rozdzielać | Przykłady |
---|---|
'test' | 1525 |
'train' | 2975 |
'validation' | 500 |
- Struktura funkcji :
FeaturesDict({
'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
mapa_rozbieżności | Obraz | (1024, 2048, 1) | uint8 | |
identyfikator_obrazu | Tekst | strunowy | ||
obraz_po lewej stronie | Obraz | (1024, 2048, 3) | uint8 | |
image_right | Obraz | (1024, 2048, 3) | uint8 |
- Przykłady ( tfds.as_dataframe ):
pejzaże miejskie/stereo_disparity_extra
Opis konfiguracji: Zestaw danych stereofonicznych pejzaży miejskich i map rozbieżności z podziałem train_extra.
Rozmiar zestawu danych :
119.18 GiB
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 2975 |
'train_extra' | 19 997 |
'validation' | 500 |
- Struktura funkcji :
FeaturesDict({
'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
'image_id': Text(shape=(), dtype=string),
'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
mapa_rozbieżności | Obraz | (1024, 2048, 1) | uint8 | |
identyfikator_obrazu | Tekst | strunowy | ||
obraz_po lewej stronie | Obraz | (1024, 2048, 3) | uint8 | |
image_right | Obraz | (1024, 2048, 3) | uint8 |
- Przykłady ( tfds.as_dataframe ):