- Описание :
BillSum, обобщение законопроектов Конгресса США и штата Калифорния.
Есть несколько функций: - text: текст счета. - резюме: сводка счетов. - название: название счета. особенности для нас счетов. ca векселей не имеет. - text_len: количество символов в тексте. - sum_len: общее количество символов.
Дополнительная документация : изучить документы с кодом
Домашняя страница : https://github.com/FiscalNote/BillSum
Исходный код :
tfds.datasets.billsum.Builder
Версии :
-
3.0.0
(по умолчанию): нет примечаний к выпуску.
-
Размер загрузки :
64.14 MiB
Размер набора данных :
260.84 MiB
Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'ca_test' | 1237 |
'test' | 3269 |
'train' | 18 949 |
- Структура функции :
FeaturesDict({
'summary': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
резюме | Текст | нить | ||
текст | Текст | нить | ||
заглавие | Текст | нить |
Контролируемые ключи (см.
as_supervised
doc ):('text', 'summary')
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :
@misc{kornilova2019billsum,
title={BillSum: A Corpus for Automatic Summarization of US Legislation},
author={Anastassia Kornilova and Vlad Eidelman},
year={2019},
eprint={1910.00523},
archivePrefix={arXiv},
primaryClass={cs.CL}
}