- Описание :
Из статьи: Мы автоматически собрали набор данных из 5003 изображений из популярных голливудских фильмов. Изображения были получены с помощью современного детектора лиц на каждом десятом кадре 30 фильмов. Людей, выявленных с высокой степенью достоверности (примерно 20 тысяч кандидатов), затем отправляли на краудсорсинговый рынок Amazon Mechanical Turk для получения достоверной маркировки. Каждое изображение было аннотировано пятью Теркерами по цене 0,01 доллара за каждого, чтобы обозначить 10 суставов верхней части тела. Для каждого изображения была выбрана медианная из пяти маркировок, чтобы обеспечить устойчивость к выбросам. Наконец, мы отклоняли изображения вручную, если человек был закрыт или сильно нефронтально. Мы отложили 20% (1016 изображений) данных для тестирования.
Дополнительная документация : Изучите статьи с кодом
Домашняя страница : https://bensapp.github.io/flic-dataset.html.
Исходный код :
tfds.datasets.flic.Builder
Версии :
-
2.0.0
(по умолчанию): нет примечаний к выпуску.
-
Размер набора данных :
317.94 MiB
Автокэширование ( документация ): Нет
Расколы :
Расколоть | Примеры |
---|---|
'test' | 1016 |
'train' | 3987 |
- Структура функции :
FeaturesDict({
'currframe': float64,
'image': Image(shape=(480, 720, 3), dtype=uint8),
'moviename': Text(shape=(), dtype=string),
'poselet_hit_idx': Sequence(uint16),
'torsobox': BBoxFeature(shape=(4,), dtype=float32),
'xcoords': Sequence(float64),
'ycoords': Sequence(float64),
})
- Функциональная документация :
Особенность | Сорт | Форма | Дтип | Описание |
---|---|---|---|---|
ВозможностиDict | ||||
каррфрейм | Тензор | float64 | ||
изображение | Изображение | (480, 720, 3) | uint8 | |
название фильма | Текст | нить | ||
poselet_hit_idx | Последовательность (тензор) | (Никто,) | uint16 | |
торсбокс | BBoxFeature | (4,) | поплавок32 | |
координаты | Последовательность (тензор) | (Никто,) | float64 | |
ycoords | Последовательность (тензор) | (Никто,) | float64 |
Контролируемые ключи (см. документ
as_supervised
):None
Цитата :
@inproceedings{modec13,
title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
author={Sapp, Benjamin and Taskar, Ben},
booktitle={In Proc. CVPR},
year={2013},
}
flic/small (конфигурация по умолчанию)
Описание конфигурации : Использует 5003 примера, использованных в документе CVPR13 MODEC.
Размер загрузки :
286.35 MiB
Рисунок ( tfds.show_examples ):
- Примеры ( tfds.as_dataframe ):
фильм/полный
Описание конфигурации : Использует 20928 примеров, расширенный набор FLIC, состоящий из более сложных примеров.
Размер загрузки :
1.10 GiB
Рисунок ( tfds.show_examples ):
- Примеры ( tfds.as_dataframe ):