- Описание :
QASC — это набор данных для ответов на вопросы с упором на состав предложений. Он состоит из 9 980 вопросов с 8 вариантами ответов о школьных науках (8 134 обучающих, 926 разрабатываемых, 920 тестовых) и содержит 17 миллионов предложений.
Дополнительная документация : изучить документы с кодом
Домашняя страница : https://allenai.org/data/qasc
Исходный код :
tfds.datasets.qasc.Builder
Версии :
-
0.1.0
(по умолчанию): нет примечаний к выпуску.
-
Размер загрузки :
1.54 MiB
Размер набора данных :
6.61 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'test' | 920 |
'train' | 8134 |
'validation' | 926 |
- Структура функции :
FeaturesDict({
'answerKey': Text(shape=(), dtype=string),
'choices': Sequence({
'label': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
}),
'combinedfact': Text(shape=(), dtype=string),
'fact1': Text(shape=(), dtype=string),
'fact2': Text(shape=(), dtype=string),
'formatted_question': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
ключ ответа | Текст | нить | ||
выбор | Последовательность | |||
выбор/метка | Текст | нить | ||
выбор/текст | Текст | нить | ||
комбинированный факт | Текст | нить | ||
факт1 | Текст | нить | ||
факт2 | Текст | нить | ||
форматированный_вопрос | Текст | нить | ||
я бы | Текст | нить | ||
вопрос | Текст | нить |
Ключи под наблюдением (см . документ
as_supervised
):None
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :
@article{allenai:qasc,
author = {Tushar Khot and Peter Clark and Michal Guerquin and Peter Jansen and Ashish Sabharwal},
title = {QASC: A Dataset for Question Answering via Sentence Composition},
journal = {arXiv:1910.11473v2},
year = {2020},
}