- Описание :
Набор данных государственных отчетов состоит из отчетов, написанных государственными исследовательскими агентствами, включая Исследовательскую службу Конгресса и Счетную палату правительства США.
Дополнительная документация : изучить документы с кодом
Домашняя страница : https://gov-report-data.github.io/
Исходный код :
tfds.summarization.gov_report.GovReport
Версии :
-
1.0.0
(по умолчанию): Первоначальный выпуск.
-
Размер загрузки :
320.59 MiB
Автоматическое кэширование ( документация ): Нет
Рисунок ( tfds.show_examples ): не поддерживается.
Цитата :
@inproceedings{
anonymous2022efficiently,
title={Efficiently Modeling Long Sequences with Structured State Spaces},
author={Anonymous},
booktitle={Submitted to The Tenth International Conference on Learning Representations },
year={2022},
url={https://openreview.net/forum?id=uYLFoz1vlAC},
note={under review}
}
gov_report/crs_whitespace (конфигурация по умолчанию)
Описание конфигурации : отчет CRS со сводкой. Структуры сплющены и соединены пробелами. Это формат, используемый оригинальной бумагой
Размер набора данных :
349.76 MiB
.Сплиты :
Расколоть | Примеры |
---|---|
'test' | 362 |
'train' | 6514 |
'validation' | 362 |
- Структура функции :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
я бы | Текст | нить | ||
Дата_релиза | Текст | нить | ||
отчеты | Текст | нить | ||
резюме | Текст | нить | ||
заглавие | Текст | нить |
Контролируемые ключи (см.
as_supervised
doc ):('reports', 'summary')
Примеры ( tfds.as_dataframe ):
gov_report/gao_whitespace
Описание конфигурации : отчет GAO с выделением структур, сглаженных и соединенных пробелами. Это формат, используемый оригинальной бумагой
Размер набора данных :
690.24 MiB
.Сплиты :
Расколоть | Примеры |
---|---|
'test' | 611 |
'train' | 11 005 |
'validation' | 612 |
- Структура функции :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
быстрый факт | Текст | нить | ||
выделять | Текст | нить | ||
я бы | Текст | нить | ||
Дата_публикации | Текст | нить | ||
Дата_релиза | Текст | нить | ||
отчет | Текст | нить | ||
заглавие | Текст | нить | ||
URL | Текст | нить |
Ключи под наблюдением (см . документ
as_supervised
):('report', 'highlight')
Примеры ( tfds.as_dataframe ):
gov_report/crs_html
Описание конфигурации : отчет CRS со сводкой. Структуры выравниваются и соединяются новой строкой при добавлении тегов html. Теги добавляются только для section_title в формате
<h2>xxx<h2>
.Размер набора данных :
351.25 MiB
.Сплиты :
Расколоть | Примеры |
---|---|
'test' | 362 |
'train' | 6514 |
'validation' | 362 |
- Структура функции :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
я бы | Текст | нить | ||
Дата_релиза | Текст | нить | ||
отчеты | Текст | нить | ||
резюме | Текст | нить | ||
заглавие | Текст | нить |
Контролируемые ключи (см.
as_supervised
doc ):('reports', 'summary')
Примеры ( tfds.as_dataframe ):
gov_report/gao_html
Описание конфигурации : отчет GAO с выделением структур, сглаженных и объединенных новой строкой при добавлении тегов html. Теги добавляются только для section_title в формате
<h2>xxx<h2>
.Размер набора данных :
692.72 MiB
.Сплиты :
Расколоть | Примеры |
---|---|
'test' | 611 |
'train' | 11 005 |
'validation' | 612 |
- Структура функции :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
быстрый факт | Текст | нить | ||
выделять | Текст | нить | ||
я бы | Текст | нить | ||
Дата_публикации | Текст | нить | ||
Дата_релиза | Текст | нить | ||
отчет | Текст | нить | ||
заглавие | Текст | нить | ||
URL | Текст | нить |
Ключи под наблюдением (см . документ
as_supervised
):('report', 'highlight')
Примеры ( tfds.as_dataframe ):
gov_report/crs_json
Описание конфигурации : отчет CRS со сводкой. Структуры представлены в виде необработанного json.
Размер набора данных :
361.92 MiB
.Сплиты :
Расколоть | Примеры |
---|---|
'test' | 362 |
'train' | 6514 |
'validation' | 362 |
- Структура функции :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
я бы | Текст | нить | ||
Дата_релиза | Текст | нить | ||
отчеты | Текст | нить | ||
резюме | Текст | нить | ||
заглавие | Текст | нить |
Контролируемые ключи (см.
as_supervised
doc ):('reports', 'summary')
Примеры ( tfds.as_dataframe ):
gov_report/gao_json
Описание конфигурации : отчет GAO с выделением структур, представленных в виде необработанного json.
Размер набора данных :
712.82 MiB
.Сплиты :
Расколоть | Примеры |
---|---|
'test' | 611 |
'train' | 11 005 |
'validation' | 612 |
- Структура функции :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
быстрый факт | Текст | нить | ||
выделять | Текст | нить | ||
я бы | Текст | нить | ||
Дата_публикации | Текст | нить | ||
Дата_релиза | Текст | нить | ||
отчет | Текст | нить | ||
заглавие | Текст | нить | ||
URL | Текст | нить |
Ключи под наблюдением (см . документ
as_supervised
):('report', 'highlight')
Примеры ( tfds.as_dataframe ):