- opis :
Zbiór danych klasyfikacji pytań Text REtrieval Conference (TREC) zawiera 5500 oznaczonych pytań w zbiorze uczącym i kolejne 500 w zbiorze testowym. Zbiór danych ma 6 etykiet, 47 etykiet poziomu 2. Średnia długość każdego zdania to 10, słownictwo 8700. Dane są zbierane z czterech źródeł: 4500 pytań w języku angielskim opublikowanych przez USC (Hovy i in., 2001), około 500 ręcznie skonstruowanych pytań dla kilku rzadkich klas, 894 TREC 8 i TREC 9 pytań, a także 500 pytań z TREC 10, który służy jako zestaw testowy.
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://cogcomp.seas.upenn.edu/Data/QA/QC/
Kod źródłowy :
tfds.datasets.trec.Builder
Wersje :
-
1.0.0
(domyślnie): Brak informacji o wersji.
-
Rozmiar pliku do pobrania :
350.79 KiB
Rozmiar zbioru danych :
636.90 KiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Podział | Przykłady |
---|---|
'test' | 500 |
'train' | 5452 |
- Struktura funkcji :
FeaturesDict({
'label-coarse': ClassLabel(shape=(), dtype=int64, num_classes=6),
'label-fine': ClassLabel(shape=(), dtype=int64, num_classes=47),
'text': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
gruba etykieta | Etykieta klasy | int64 | ||
etykieta w porządku | Etykieta klasy | int64 | ||
tekst | Tekst | strunowy |
Klucze nadzorowane (Zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):
- Cytat :
@inproceedings{li-roth-2002-learning,
title = "Learning Question Classifiers",
author = "Li, Xin and
Roth, Dan",
booktitle = "{COLING} 2002: The 19th International Conference on Computational Linguistics",
year = "2002",
url = "https://www.aclweb.org/anthology/C02-1150",
}
@inproceedings{hovy-etal-2001-toward,
title = "Toward Semantics-Based Answer Pinpointing",
author = "Hovy, Eduard and
Gerber, Laurie and
Hermjakob, Ulf and
Lin, Chin-Yew and
Ravichandran, Deepak",
booktitle = "Proceedings of the First International Conference on Human Language Technology Research",
year = "2001",
url = "https://www.aclweb.org/anthology/H01-1069",
}