- Описание :
Данные содержат наборы от 1 до 7 троек формы субъект-сказуемое-объект, извлеченные из (DBpedia) [ https://wiki.dbpedia.org/ ] и текст на естественном языке, который представляет собой вербализацию этих троек. Тестовые данные охватывают 15 различных доменов, из которых только 10 появляются в обучающих данных. Набор данных соответствует стандартному формату таблицы.
Дополнительная документация : изучить документы с кодом
Домашняя страница : https://webnlg-challenge.loria.fr/challenge_2017/
Исходный код :
tfds.structured.web_nlg.WebNlg
Версии :
-
0.1.0
(по умолчанию): нет примечаний к выпуску.
-
Размер загрузки :
19.76 MiB
.Размер набора данных :
13.78 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'test_all' | 4928 |
'test_unseen' | 2433 |
'train' | 18 102 |
'validation' | 2268 |
- Структура функции :
FeaturesDict({
'input_text': FeaturesDict({
'context': string,
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
input_text | ОсобенностиDict | |||
input_text/контекст | Тензор | нить | ||
input_text/таблица | Последовательность | |||
input_text/таблица/column_header | Тензор | нить | ||
input_text/таблица/содержание | Тензор | нить | ||
input_text/таблица/номер_строки | Тензор | int16 | ||
целевой_текст | Тензор | нить |
Контролируемые ключи (см . документ
as_supervised
):('input_text', 'target_text')
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :
@inproceedings{gardent2017creating,
title = ""Creating Training Corpora for {NLG} Micro-Planners"",
author = ""Gardent, Claire and
Shimorina, Anastasia and
Narayan, Shashi and
Perez-Beltrachini, Laura"",
booktitle = ""Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)"",
month = jul,
year = ""2017"",
address = ""Vancouver, Canada"",
publisher = ""Association for Computational Linguistics"",
doi = ""10.18653/v1/P17-1017"",
pages = ""179--188"",
url = ""https://www.aclweb.org/anthology/P17-1017.pdf""
}