- opis :
Zestaw danych Yahoo Learning to Rank Challenge (zwany także „C14”) to zestaw danych Learning to Rank wydany przez Yahoo. Zestaw danych składa się z par zapytanie-dokument reprezentowanych jako wektory cech i odpowiadające im etykiety oceny istotności.
Zestaw danych zawiera dwie wersje:
-
set1
: Zawiera 709 877 par zapytanie-dokument. -
set2
: Zawiera 172 870 par zapytanie-dokument.
Możesz określić, czy chcesz użyć wersji set1
czy set2
zestawu danych w następujący sposób:
ds = tfds.load("yahoo_ltrc/set1")
ds = tfds.load("yahoo_ltrc/set2")
Jeśli podano tylko yahoo_ltrc
, opcja yahoo_ltrc/set1
jest wybrana domyślnie:
# This is the same as `tfds.load("yahoo_ltrc/set1")`
ds = tfds.load("yahoo_ltrc")
Strona główna : https://research.yahoo.com/datasets
Kod źródłowy :
tfds.ranking.yahoo_ltrc.YahooLTRC
Wersje :
-
1.0.0
: Pierwsza wersja. -
1.1.0
(domyślnie): Dodaj identyfikatory zapytań i dokumentów.
-
Rozmiar pliku do pobrania :
Unknown size
Instrukcje ręcznego pobierania : ten zestaw danych wymaga ręcznego pobrania danych źródłowych do katalogu
download_config.manual_dir
(domyślnie~/tensorflow_datasets/downloads/manual/
):
Poproś o dostęp do zestawu danych C14 Yahoo Learning To Rank Challenge na stronie https://research.yahoo.com/datasets Wyodrębnij pobrany plikdataset.tgz
i umieść plikltrc_yahoo.tar.bz2
w katalogumanual_dir/
.Klucze nadzorowane (Zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :
@inproceedings{chapelle2011yahoo,
title={Yahoo! learning to rank challenge overview},
author={Chapelle, Olivier and Chang, Yi},
booktitle={Proceedings of the learning to rank challenge},
pages={1--24},
year={2011},
organization={PMLR}
}
yahoo_ltrc/set1 (domyślna konfiguracja)
Rozmiar zbioru danych :
795.39 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Podział | Przykłady |
---|---|
'test' | 6983 |
'train' | 19944 |
'vali' | 2994 |
- Struktura funkcji :
FeaturesDict({
'doc_id': Tensor(shape=(None,), dtype=int64),
'float_features': Tensor(shape=(None, 699), dtype=float64),
'label': Tensor(shape=(None,), dtype=float64),
'query_id': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
identyfikator_dokumentu | Napinacz | (Nic,) | int64 | |
float_features | Napinacz | (Brak, 699) | pływak64 | |
etykieta | Napinacz | (Nic,) | pływak64 | |
identyfikator_zapytania | Tekst | strunowy |
- Przykłady ( tfds.as_dataframe ):
yahoo_ltrc/set2
Rozmiar zestawu danych :
194.92 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Podział | Przykłady |
---|---|
'test' | 3798 |
'train' | 1266 |
'vali' | 1266 |
- Struktura funkcji :
FeaturesDict({
'doc_id': Tensor(shape=(None,), dtype=int64),
'float_features': Tensor(shape=(None, 700), dtype=float64),
'label': Tensor(shape=(None,), dtype=float64),
'query_id': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
identyfikator_dokumentu | Napinacz | (Nic,) | int64 | |
float_features | Napinacz | (Brak, 700) | pływak64 | |
etykieta | Napinacz | (Nic,) | pływak64 | |
identyfikator_zapytania | Tekst | strunowy |
- Przykłady ( tfds.as_dataframe ):