caltech101

  • Opis :

Caltech-101 składa się ze zdjęć obiektów należących do 101 klas oraz jednej klasy background clutter tle. Każdy obraz jest oznaczony pojedynczym obiektem. Każda klasa zawiera około 40 do 800 obrazów, co daje łącznie około 9 tys. obrazów. Obrazy mają różne rozmiary, a typowa długość krawędzi wynosi 200–300 pikseli. Ta wersja zawiera tylko etykiety na poziomie obrazu. Oryginalny zestaw danych zawiera również ramki ograniczające.

Podział Przykłady
'test' 6084
'train' 3060
  • Struktura funkcji :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/file_name': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=102),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDykt
obraz Obraz (Brak, Brak, 3) uint8
obraz/nazwa_pliku Tekst strunowy
etykieta Etykieta klasy int64

Wyobrażanie sobie

  • Cytat :
@article{FeiFei2004LearningGV,
  title={Learning Generative Visual Models from Few Training Examples: An Incremental Bayesian Approach Tested on 101 Object Categories},
  author={Li Fei-Fei and Rob Fergus and Pietro Perona},
  journal={Computer Vision and Pattern Recognition Workshop},
  year={2004},
}