- Описание :
КАЧЕСТВО, набор данных с множественным выбором и пониманием при чтении.
Мы предоставляем только сырую версию.
Домашняя страница : https://github.com/nyu-mll/качество
Исходный код :
tfds.datasets.quality.Builder
Версии :
-
1.0.0
(по умолчанию): Первоначальный выпуск.
-
Размер загрузки :
17.26 MiB
Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'dev' | 230 |
'test' | 232 |
'train' | 300 |
- Структура функции :
FeaturesDict({
'article': Text(shape=(), dtype=string),
'article_id': Text(shape=(), dtype=string),
'difficults': Sequence(bool),
'gold_labels': Sequence(int32),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'question_ids': Sequence(Text(shape=(), dtype=string)),
'questions': Sequence(Text(shape=(), dtype=string)),
'set_unique_id': Text(shape=(), dtype=string),
'source': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'topic': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'writer_id': Text(shape=(), dtype=string),
'writer_labels': Sequence(int32),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
статья | Текст | нить | ||
article_id | Текст | нить | ||
трудности | Последовательность (тензор) | (Никто,) | логический | |
gold_labels | Последовательность (тензор) | (Никто,) | int32 | |
параметры | Последовательность(Последовательность(Текст)) | (Нет, Нет) | нить | |
question_ids | Последовательность (текст) | (Никто,) | нить | |
вопросы | Последовательность (текст) | (Никто,) | нить | |
set_unique_id | Текст | нить | ||
источник | Текст | нить | ||
заглавие | Текст | нить | ||
тема | Текст | нить | ||
URL | Текст | нить | ||
идентификатор_писателя | Текст | нить | ||
Writer_labels | Последовательность (тензор) | (Никто,) | int32 |
Ключи под наблюдением (см . документ
as_supervised
):None
Рисунок ( tfds.show_examples ): не поддерживается.
Цитата :
@article{pang2021quality,
title={ {QuALITY}: Question Answering with Long Input Texts, Yes!},
author={Pang, Richard Yuanzhe and Parrish, Alicia and Joshi, Nitish and Nangia, Nikita and Phang, Jason and Chen, Angelica and Padmakumar, Vishakh and Ma, Johnny and Thompson, Jana and He, He and Bowman, Samuel R.},
journal={arXiv preprint arXiv:2112.08608},
year={2021}
}
качество/сырое (конфигурация по умолчанию)
Описание конфига : Raw с HTML.
Размер набора данных :
22.18 MiB
.Примеры ( tfds.as_dataframe ):
качество/раздетый
Описание конфига : Без HTML.
Размер набора данных :
20.73 MiB
.Примеры ( tfds.as_dataframe ):