pejzaże miejskie

  • opis :

Cityscapes to zestaw danych składający się z różnorodnych miejskich scen ulicznych w 50 różnych miastach w różnych porach roku, a także podstawowych prawd dla kilku zadań wizyjnych, w tym segmentacji semantycznej, segmentacji na poziomie instancji (TODO) i wnioskowania o rozbieżnościach par stereo.

W przypadku zadań segmentacji (domyślny podział, dostępny przez „cityscapes/semantic_segmentation”), Cityscapes zapewnia gęste adnotacje na poziomie pikseli dla 5000 obrazów w rozdzielczości 1024 * 2048, wstępnie podzielonych na zestawy treningowe (2975), walidacyjne (500) i testowe (1525). Adnotacje etykiet dla zadań segmentacji obejmują ponad 30 klas często spotykanych podczas postrzegania sceny jazdy. Szczegółowe informacje o etykiecie można znaleźć tutaj: https://github.com/mcordts/cityscapesScripts/blob/master/cityscapesscripts/helpers/labels.py#L52-L99

Cityscapes zapewnia również adnotacje dotyczące segmentacji gruboziarnistej (dostępne przez „cityscapes/semantic_segmentation_extra”) dla 19998 obrazów w podziale „train_extra”, które mogą okazać się przydatne w przypadku modeli do wstępnego uczenia/obciążających dane.

Oprócz segmentacji pejzaże miejskie zapewniają również pary obrazów stereo i podstawowe prawdy do zadań wnioskowania o rozbieżnościach zarówno w podziale normalnym, jak i dodatkowym (dostępne odpowiednio przez „cityscapes/stereo_disparity” i „cityscapes/stereo_disparity_extra”).

Ingore przykłady:

  • Dla „pejzaży miejskich/stereo_disparity_extra”:
    • troisdorf_000000 000073 {*} obrazy (brak mapy dysproporcji)
@inproceedings{Cordts2016Cityscapes,
  title={The Cityscapes Dataset for Semantic Urban Scene Understanding},
  author={Cordts, Marius and Omran, Mohamed and Ramos, Sebastian and Rehfeld, Timo and Enzweiler, Markus and Benenson, Rodrigo and Franke, Uwe and Roth, Stefan and Schiele, Bernt},
  booktitle={Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2016}
}

cityscapes/semantic_segmentation (domyślna konfiguracja)

  • Opis konfiguracji : zestaw danych semantycznej segmentacji pejzaży miejskich.

  • Rozmiar zestawu danych : 10.86 GiB

  • Podziały :

Rozdzielać Przykłady
'test' 1525
'train' 2975
'validation' 500
  • Struktura funkcji :
FeaturesDict({
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
identyfikator_obrazu Tekst strunowy
obraz_po lewej stronie Obraz (1024, 2048, 3) uint8
etykieta_segmentacji Obraz (1024, 2048, 1) uint8

cityscapes/semantic_segmentation_extra

  • Opis konfiguracji: zestaw danych semantycznej segmentacji pejzaży miejskich z podziałem train_extra i etykietami zgrubnymi.

  • Rozmiar zestawu danych : 51.92 GiB

  • Podziały :

Rozdzielać Przykłady
'train' 2975
'train_extra' 19 998
'validation' 500
  • Struktura funkcji :
FeaturesDict({
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
identyfikator_obrazu Tekst strunowy
obraz_po lewej stronie Obraz (1024, 2048, 3) uint8
etykieta_segmentacji Obraz (1024, 2048, 1) uint8

pejzaże miejskie/stereo_disparity

  • Opis konfiguracji : Zestaw danych obrazu stereo pejzaży miejskich i map rozbieżności.

  • Rozmiar zestawu danych : 25.03 GiB

  • Podziały :

Rozdzielać Przykłady
'test' 1525
'train' 2975
'validation' 500
  • Struktura funkcji :
FeaturesDict({
    'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
mapa_rozbieżności Obraz (1024, 2048, 1) uint8
identyfikator_obrazu Tekst strunowy
obraz_po lewej stronie Obraz (1024, 2048, 3) uint8
image_right Obraz (1024, 2048, 3) uint8

pejzaże miejskie/stereo_disparity_extra

  • Opis konfiguracji: Zestaw danych stereofonicznych pejzaży miejskich i map rozbieżności z podziałem train_extra.

  • Rozmiar zestawu danych : 119.18 GiB

  • Podziały :

Rozdzielać Przykłady
'train' 2975
'train_extra' 19 997
'validation' 500
  • Struktura funkcji :
FeaturesDict({
    'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
mapa_rozbieżności Obraz (1024, 2048, 1) uint8
identyfikator_obrazu Tekst strunowy
obraz_po lewej stronie Obraz (1024, 2048, 3) uint8
image_right Obraz (1024, 2048, 3) uint8