- Описание :
Набор данных содержит пары таблица-вопрос и соответствующий ответ. Вопросы требуют многоэтапного рассуждения и различных операций с данными, таких как сравнение, агрегирование и арифметические вычисления. Таблицы были выбраны случайным образом среди таблиц Википедии, содержащих не менее 8 строк и 5 столбцов.
(Согласно примечаниям по использованию документации)
Разработчик: средняя точность по трем (не пяти) разделениям обучающих данных. Другими словами, тренируйтесь на «split-{1,2,3}-train» и тестируйте на «split-{1,2,3}-dev» соответственно, а затем усредняйте точность.
Тест: тренируйтесь на «поезде» и тестируйте на «тесте».
Дополнительная документация : изучить документы с кодом
Домашняя страница : https://ppasupat.github.io/WikiTableQuestions/#usage-notes
Исходный код :
tfds.structured.wiki_table_questions.WikiTableQuestions
Версии :
-
1.0.0
(по умолчанию): Первоначальный выпуск.
-
Размер загрузки :
65.36 MiB
.Размер набора данных :
237.24 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'split-1-dev' | 2810 |
'split-1-train' | 11 321 |
'split-2-dev' | 2838 |
'split-2-train' | 11 312 |
'split-3-dev' | 2838 |
'split-3-train' | 11 311 |
'test' | 4344 |
'train' | 14 149 |
- Структура функции :
FeaturesDict({
'input_text': FeaturesDict({
'context': string,
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
input_text | ОсобенностиDict | |||
input_text/контекст | Тензор | нить | ||
input_text/таблица | Последовательность | |||
input_text/таблица/column_header | Тензор | нить | ||
input_text/таблица/содержание | Тензор | нить | ||
input_text/таблица/номер_строки | Тензор | int16 | ||
целевой_текст | Тензор | нить |
Контролируемые ключи (см . документ
as_supervised
):('input_text', 'target_text')
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :
@inproceedings{pasupat-liang-2015-compositional,
title = "Compositional Semantic Parsing on Semi-Structured Tables",
author = "Pasupat, Panupong and
Liang, Percy",
booktitle = "Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 1: Long Papers)",
month = jul,
year = "2015",
address = "Beijing, China",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/P15-1142",
doi = "10.3115/v1/P15-1142",
pages = "1470--1480",
}