- opis :
Zbiór danych HellaSwag jest punktem odniesienia dla Commonsense NLI. Zawiera kontekst i kilka zakończeń, które uzupełniają kontekst.
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://rowanzellers.com/hellaswag/
Kod źródłowy :
tfds.text.Hellaswag
Wersje :
-
0.0.1
: Brak informacji o wydaniu. -
1.0.0
: Dodanie oddzielnych podziałów dla zestawów walidacji/testów w domenie i poza domeną. -
1.1.0
(domyślnie): kolejny wymiar podziału dla źródła (wikihow vs activitynet)
-
Rozmiar pliku do pobrania :
68.18 MiB
Rozmiar zestawu danych :
107.45 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'test' | 10003 |
'test_ind_activitynet' | 1870 |
'test_ind_wikihow' | 3132 |
'test_ood_activitynet' | 1651 |
'test_ood_wikihow' | 3350 |
'train' | 39905 |
'train_activitynet' | 14740 |
'train_wikihow' | 25165 |
'validation' | 10042 |
'validation_ind_activitynet' | 1809 |
'validation_ind_wikihow' | 3192 |
'validation_ood_activitynet' | 1434 |
'validation_ood_wikihow' | 3607 |
- Struktura funkcji :
FeaturesDict({
'activity_label': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'endings': Sequence(Text(shape=(), dtype=string)),
'label': int32,
'source_id': Text(shape=(), dtype=string),
'split_type': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
etykieta_aktywności | Tekst | strunowy | ||
kontekst | Tekst | strunowy | ||
zakończenia | Sekwencja (tekst) | (Nic,) | strunowy | |
etykieta | Napinacz | int32 | ||
identyfikator_źródła | Tekst | strunowy | ||
typ_podziału | Tekst | strunowy |
Klucze nadzorowane (Zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):
- Cytat :
@inproceedings{zellers2019hellaswag,
title={HellaSwag: Can a Machine Really Finish Your Sentence?},
author={Zellers, Rowan and Holtzman, Ari and Bisk, Yonatan and Farhadi, Ali and Choi, Yejin},
booktitle ={Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics},
year={2019}
}