- Описание :
Корпус SNLI (версия 1.0) представляет собой набор из 570 000 пар английских предложений, написанных человеком, вручную помеченных для сбалансированной классификации ярлыками следствия, противоречия и нейтральности, что поддерживает задачу вывода на естественном языке (NLI), также известную как распознавание текстового следствия. (РТЭ).
Дополнительная документация : изучить документы с кодом
Домашняя страница : https://nlp.stanford.edu/projects/snli/
Исходный код :
tfds.datasets.snli.Builder
Версии :
-
1.1.0
(по умолчанию): нет примечаний к выпуску.
-
Размер загрузки :
90.17 MiB
Размер набора данных :
87.00 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'test' | 10 000 |
'train' | 550 152 |
'validation' | 10 000 |
- Структура функции :
FeaturesDict({
'hypothesis': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'premise': Text(shape=(), dtype=string),
})
- Документация по функциям :
Характерная черта | Класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
гипотеза | Текст | нить | ||
этикетка | Метка класса | int64 | ||
помещение | Текст | нить |
Ключи под наблюдением (см . документ
as_supervised
):None
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :
@inproceedings{snli:emnlp2015,
Author = {Bowman, Samuel R. and Angeli, Gabor and Potts, Christopher, and Manning, Christopher D.},
Booktitle = {Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing (EMNLP)},
Publisher = {Association for Computational Linguistics},
Title = {A large annotated corpus for learning natural language inference},
Year = {2015}
}