научный_хвост

  • Описание :

Набор данных SciTail представляет собой набор данных, созданный на основе научных экзаменов с несколькими вариантами ответов и веб-предложений. Каждый вопрос и правильный вариант ответа преобразуются в утвердительное утверждение для формирования гипотезы. Информационный поиск используется для получения релевантного текста из большого текстового корпуса веб-предложений, и эти предложения используются в качестве предпосылки P. Аннотация такой пары предпосылка-гипотеза краудсорсинг как поддерживает (подразумевает) или нет (нейтрально), чтобы для создания набора данных SciTail. Набор данных содержит 27 026 примеров, из них 10 101 пример с меткой влечет за собой и 16 925 примеров с нейтральной меткой.

Расколоть Примеры
'test' 2126
'train' 23 097
'validation' 1304
  • Структура функции :
FeaturesDict({
    'hypothesis': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'premise': Text(shape=(), dtype=string),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
гипотеза Текст нить
этикетка Метка класса int64
помещение Текст нить
  • Цитата :
@inproceedings{khot2018scitail,
    title={Scitail: A textual entailment dataset from science question answering},
    author={Khot, Tushar and Sabharwal, Ashish and Clark, Peter},
    booktitle={Proceedings of the 32th AAAI Conference on Artificial Intelligence (AAAI 2018)},
    url = "http://ai2-website.s3.amazonaws.com/publications/scitail-aaai-2018_cameraready.pdf",
    year={2018}
}