- Описание :
BoolQ — это набор данных для ответов на вопросы «да/нет», содержащий 15942 примера. Эти вопросы возникают естественным образом, они генерируются в непринужденной и непринужденной обстановке.
Каждый пример представляет собой триплет (вопрос, отрывок, ответ) с заголовком страницы в качестве необязательного дополнительного контекста. Настройка классификации текстовых пар аналогична существующим задачам вывода на естественном языке.
Дополнительная документация : изучить документы с кодом
Домашняя страница : https://github.com/google-research-datasets/boolean-questions
Исходный код :
tfds.datasets.bool_q.Builder
Версии :
-
1.0.0
(по умолчанию): нет примечаний к выпуску.
-
Размер загрузки :
8.36 MiB
Размер набора данных :
8.51 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 9427 |
'validation' | 3270 |
- Структура функции :
FeaturesDict({
'answer': bool,
'passage': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
отвечать | Тензор | логический | ||
проход | Текст | нить | ||
вопрос | Текст | нить | ||
заглавие | Текст | нить |
Ключи под наблюдением (см . документ
as_supervised
):None
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :
@inproceedings{clark2019boolq,
title = {BoolQ: Exploring the Surprising Difficulty of Natural Yes/No Questions},
author = {Clark, Christopher and Lee, Kenton and Chang, Ming-Wei, and Kwiatkowski, Tom and Collins, Michael, and Toutanova, Kristina},
booktitle = {NAACL},
year = {2019},
}