- opis :
WebVid to wielkoskalowy zbiór krótkich filmów z tekstowymi opisami pochodzącymi z sieci. Filmy są różnorodne i bogate w treść.
WebVid-10M zawiera:
10,7 mln par napisów wideo. Łącznie 52 000 godzin wideo.
Strona główna : https://m-bain.github.io/webvid-dataset/
Kod źródłowy :
tfds.datasets.webvid.Builder
Wersje :
-
1.0.0
(domyślnie): Wersja początkowa.
-
Rozmiar pliku do pobrania :
Unknown size
Rozmiar zbioru danych :
Unknown size
Instrukcje ręcznego pobierania : ten zestaw danych wymaga ręcznego pobrania danych źródłowych do
download_config.manual_dir
(domyślnie~/tensorflow_datasets/downloads/manual/
):
Postępuj zgodnie z instrukcjami pobierania w https://m-bain.github.io/webvid-dataset/ , aby pobrać dane. Umieść pliki csv i katalogi wideo wmanual_dir/webvid
, tak aby pliki mp4 zostały umieszczone wmanual_dir/webvid/*/*_*/*.mp4
.
Pierwszy katalog to zazwyczaj dowolny katalog części (do pobierania fragmentów), drugi katalog to katalog stron (dwie cyfry wokół podkreślenia), wewnątrz którego znajduje się jeden lub więcej plików mp4.
Automatyczne buforowanie ( dokumentacja ): Nieznane
Podziały :
Podział | Przykłady |
---|
- Struktura funkcji :
FeaturesDict({
'caption': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
podpis | Tekst | strunowy | ||
ID | Tekst | strunowy | ||
adres URL | Tekst | strunowy | ||
wideo | Wideo (obraz) | (Brak, 360, 640, 3) | uint8 |
Klucze nadzorowane (Zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ): Brak.
Cytat :
@misc{bain2021frozen,
title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
year={2021},
eprint={2104.00650},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
, - opis :
WebVid to wielkoskalowy zbiór krótkich filmów z tekstowymi opisami pochodzącymi z sieci. Filmy są różnorodne i bogate w treść.
WebVid-10M zawiera:
10,7 mln par napisów wideo. Łącznie 52 000 godzin wideo.
Strona główna : https://m-bain.github.io/webvid-dataset/
Kod źródłowy :
tfds.datasets.webvid.Builder
Wersje :
-
1.0.0
(domyślnie): Wersja początkowa.
-
Rozmiar pliku do pobrania :
Unknown size
Rozmiar zbioru danych :
Unknown size
Instrukcje ręcznego pobierania : ten zestaw danych wymaga ręcznego pobrania danych źródłowych do
download_config.manual_dir
(domyślnie~/tensorflow_datasets/downloads/manual/
):
Postępuj zgodnie z instrukcjami pobierania w https://m-bain.github.io/webvid-dataset/ , aby pobrać dane. Umieść pliki csv i katalogi wideo wmanual_dir/webvid
, tak aby pliki mp4 zostały umieszczone wmanual_dir/webvid/*/*_*/*.mp4
.
Pierwszy katalog to zazwyczaj dowolny katalog części (do pobierania fragmentów), drugi katalog to katalog stron (dwie cyfry wokół podkreślenia), wewnątrz którego znajduje się jeden lub więcej plików mp4.
Automatyczne buforowanie ( dokumentacja ): Nieznane
Podziały :
Podział | Przykłady |
---|
- Struktura funkcji :
FeaturesDict({
'caption': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
podpis | Tekst | strunowy | ||
ID | Tekst | strunowy | ||
adres URL | Tekst | strunowy | ||
wideo | Wideo (obraz) | (Brak, 360, 640, 3) | uint8 |
Klucze nadzorowane (Zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ): Brak.
Cytat :
@misc{bain2021frozen,
title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
year={2021},
eprint={2104.00650},
archivePrefix={arXiv},
primaryClass={cs.CV}
}