- Описание :
Набор данных SciTail представляет собой набор данных, созданный на основе научных экзаменов с несколькими вариантами ответов и веб-предложений. Каждый вопрос и правильный вариант ответа преобразуются в утвердительное утверждение для формирования гипотезы. Информационный поиск используется для получения релевантного текста из большого текстового корпуса веб-предложений, и эти предложения используются в качестве предпосылки P. Аннотация такой пары предпосылка-гипотеза краудсорсинг как поддерживает (подразумевает) или нет (нейтрально), чтобы для создания набора данных SciTail. Набор данных содержит 27 026 примеров, из них 10 101 пример с меткой влечет за собой и 16 925 примеров с нейтральной меткой.
Дополнительная документация : изучить документы с кодом
Домашняя страница : https://allenai.org/data/scitail
Исходный код :
tfds.datasets.sci_tail.Builder
Версии :
-
1.0.0
(по умолчанию): Первоначальный выпуск.
-
Размер загрузки :
13.52 MiB
.Размер набора данных :
6.01 MiB
Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'test' | 2126 |
'train' | 23 097 |
'validation' | 1304 |
- Структура функции :
FeaturesDict({
'hypothesis': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'premise': Text(shape=(), dtype=string),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
гипотеза | Текст | нить | ||
этикетка | Метка класса | int64 | ||
помещение | Текст | нить |
Ключи под наблюдением (см . документ
as_supervised
):None
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :
@inproceedings{khot2018scitail,
title={Scitail: A textual entailment dataset from science question answering},
author={Khot, Tushar and Sabharwal, Ashish and Clark, Peter},
booktitle={Proceedings of the 32th AAAI Conference on Artificial Intelligence (AAAI 2018)},
url = "http://ai2-website.s3.amazonaws.com/publications/scitail-aaai-2018_cameraready.pdf",
year={2018}
}