- Opis :
Z artykułu: Automatycznie zebraliśmy zbiór danych obejmujący 5003 obrazów z popularnych hollywoodzkich filmów. Obrazy uzyskano, uruchamiając najnowocześniejszy detektor osób na co dziesiątej klatce 30 filmów. Osoby zidentyfikowane z dużą pewnością (około 20 tys. kandydatów) zostały następnie wysłane na rynek crowdsourcingowy Amazon Mechanical Turk w celu uzyskania oznakowania opartego na faktach. Każde zdjęcie zostało opatrzone adnotacjami pięciu Turkerów po 0,01 dolara za sztukę i oznaczało 10 stawów górnej części ciała. Na każdym obrazie przyjęto oznaczenie mediany pięciu, aby było odporne na adnotacje odstające. Wreszcie obrazy były przez nas odrzucane ręcznie, jeśli dana osoba była zasłonięta lub w dużym stopniu nie miała frontu. Do testów przeznaczyliśmy 20% (1016 obrazów) danych.
Dodatkowa dokumentacja : Eksploruj w dokumentach z kodem
Strona główna : https://bensapp.github.io/flic-dataset.html
Kod źródłowy :
tfds.datasets.flic.Builder
Wersje :
-
2.0.0
(domyślnie): Brak informacji o wersji.
-
Rozmiar zbioru danych :
317.94 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Podział | Przykłady |
---|---|
'test' | 1016 |
'train' | 3987 |
- Struktura funkcji :
FeaturesDict({
'currframe': float64,
'image': Image(shape=(480, 720, 3), dtype=uint8),
'moviename': Text(shape=(), dtype=string),
'poselet_hit_idx': Sequence(uint16),
'torsobox': BBoxFeature(shape=(4,), dtype=float32),
'xcoords': Sequence(float64),
'ycoords': Sequence(float64),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDykt | ||||
ramka | Napinacz | pływak64 | ||
obraz | Obraz | (480, 720, 3) | uint8 | |
nazwa filmu | Tekst | strunowy | ||
poselet_hit_idx | Sekwencja (tensor) | (Nic,) | uint16 | |
tułów | Funkcja BBox | (4,) | pływak32 | |
xkoords | Sekwencja (tensor) | (Nic,) | pływak64 | |
ycoords | Sekwencja (tensor) | (Nic,) | pływak64 |
Klucze nadzorowane (zobacz dokument
as_supervised
):None
Cytat :
@inproceedings{modec13,
title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
author={Sapp, Benjamin and Taskar, Ben},
booktitle={In Proc. CVPR},
year={2013},
}
flic/small (konfiguracja domyślna)
Opis konfiguracji : Wykorzystuje 5003 przykładów użytych w artykule CVPR13 MODEC.
Rozmiar pobierania :
286.35 MiB
Rysunek ( tfds.show_examples ):
- Przykłady ( tfds.as_dataframe ):
flik/pełny
Opis konfiguracji : wykorzystuje 20928 przykładów, nadzbiór FLIC składający się z trudniejszych przykładów.
Rozmiar pliku do pobrania :
1.10 GiB
Rysunek ( tfds.show_examples ):
- Przykłady ( tfds.as_dataframe ):