wokseleb

opis :

Zbiór danych na dużą skalę do identyfikacji mówców. Dane te są zbierane od ponad 1251 mówców, w sumie ponad 150 000 próbek. To wydanie zawiera część audio zestawu danych voxceleb1.1.

Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html
Kod źródłowy : tfds.audio.Voxceleb
Wersje :
- 1.2.1 (domyślnie): Dodaj pole youtube_id
Rozmiar pliku do pobrania : 4.68 MiB
Rozmiar zestawu danych : 107.98 GiB
Instrukcje ręcznego pobierania : ten zestaw danych wymaga ręcznego pobrania danych źródłowych do katalogu download_config.manual_dir (domyślnie ~/tensorflow_datasets/downloads/manual/ ):
katalog_ręczny powinien zawierać plik vox_dev_wav.zip. Instrukcje pobierania tego pliku można znaleźć na stronie http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html Ten zbiór danych wymaga rejestracji.
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :

Rozdzielać	Przykłady
`'test'`	7972
`'train'`	134 000
`'validation'`	6670

Struktura funkcji :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1252),
    'youtube_id': Text(shape=(), dtype=string),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
audio	Audio	(Nic,)	int64
etykieta	Etykieta klasy		int64
youtube_id	Tekst		strunowy

Klucze nadzorowane (zobacz dokument as_supervised ): ('audio', 'label')
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):

Cytat :

@InProceedings{Nagrani17,
    author       = "Nagrani, A. and Chung, J.~S. and Zisserman, A.",
    title        = "VoxCeleb: a large-scale speaker identification dataset",
    booktitle    = "INTERSPEECH",
    year         = "2017",
}

wokseleb Zadbaj o dobrą organizację dzięki kolekcji Zapisuj i kategoryzuj treści zgodnie ze swoimi preferencjami.

wokseleb