- opis :
Korpus SNLI (wersja 1.0) to zbiór 570 000 par zdań napisanych przez ludzi w języku angielskim, ręcznie oznaczonych w celu zrównoważonej klasyfikacji za pomocą etykiet implikacji, sprzeczności i neutralności, wspierających zadanie wnioskowania w języku naturalnym (NLI), znanego również jako rozpoznawanie implikacji tekstowych (RTE).
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://nlp.stanford.edu/projects/snli/
Kod źródłowy :
tfds.datasets.snli.Builder
Wersje :
-
1.1.0
(domyślnie): Brak informacji o wersji.
-
Rozmiar pliku do pobrania :
90.17 MiB
Rozmiar zestawu danych :
87.00 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Podział | Przykłady |
---|---|
'test' | 10 000 |
'train' | 550152 |
'validation' | 10 000 |
- Struktura funkcji :
FeaturesDict({
'hypothesis': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'premise': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
hipoteza | Tekst | strunowy | ||
etykieta | Etykieta klasy | int64 | ||
przesłanka | Tekst | strunowy |
Klucze nadzorowane (Zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):
- Cytat :
@inproceedings{snli:emnlp2015,
Author = {Bowman, Samuel R. and Angeli, Gabor and Potts, Christopher, and Manning, Christopher D.},
Booktitle = {Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing (EMNLP)},
Publisher = {Association for Computational Linguistics},
Title = {A large annotated corpus for learning natural language inference},
Year = {2015}
}