gtzan

  • opis :

Zbiór danych składa się z 1000 ścieżek dźwiękowych, każda o długości 30 sekund. Zawiera 10 gatunków, każdy reprezentowany przez 100 utworów. Wszystkie ścieżki to 16-bitowe pliki audio 22050 Hz Mono w formacie .wav.

Gatunki to:

Rozdzielać Przykłady
'train' 1000
  • Struktura funkcji :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
audio Audio (Nic,) int64
dźwięk/nazwa pliku Tekst strunowy
etykieta Etykieta klasy int64
  • Cytat :
@misc{tzanetakis_essl_cook_2001,
author    = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title     = "Automatic Musical Genre Classification Of Audio Signals",
url       = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year      = "2001"
}