- opis :
Zbiór danych raportów rządowych składa się z raportów napisanych przez rządowe agencje badawcze, w tym Congressional Research Service i US Government Accountability Office.
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://gov-report-data.github.io/
Kod źródłowy :
tfds.summarization.gov_report.GovReport
Wersje :
-
1.0.0
(domyślnie): Wersja początkowa.
-
Rozmiar pliku do pobrania :
320.59 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :
@inproceedings{
anonymous2022efficiently,
title={Efficiently Modeling Long Sequences with Structured State Spaces},
author={Anonymous},
booktitle={Submitted to The Tenth International Conference on Learning Representations },
year={2022},
url={https://openreview.net/forum?id=uYLFoz1vlAC},
note={under review}
}
gov_report/crs_whitespace (domyślna konfiguracja)
Opis konfiguracji : Raport CRS z podsumowaniem. Struktury spłaszczone i połączone odstępami. Jest to format używany przez oryginalny papier
Rozmiar zestawu danych :
349.76 MiB
Podziały :
Rozdzielać | Przykłady |
---|---|
'test' | 362 |
'train' | 6514 |
'validation' | 362 |
- Struktura funkcji :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
ID | Tekst | strunowy | ||
Data wypuszczenia | Tekst | strunowy | ||
raporty | Tekst | strunowy | ||
streszczenie | Tekst | strunowy | ||
tytuł | Tekst | strunowy |
Nadzorowane klucze (Zobacz
as_supervised
doc ):('reports', 'summary')
Przykłady ( tfds.as_dataframe ):
gov_report/gao_whitespace
Opis konfiguracji: raport GAO z wyróżnionymi strukturami spłaszczonymi i połączonymi spacjami. Jest to format używany przez oryginalny papier
Rozmiar zestawu danych :
690.24 MiB
Podziały :
Rozdzielać | Przykłady |
---|---|
'test' | 611 |
'train' | 11 005 |
'validation' | 612 |
- Struktura funkcji :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
szybki fakt | Tekst | strunowy | ||
atrakcja | Tekst | strunowy | ||
ID | Tekst | strunowy | ||
Data publikacji | Tekst | strunowy | ||
Data wypuszczenia | Tekst | strunowy | ||
raport | Tekst | strunowy | ||
tytuł | Tekst | strunowy | ||
adres URL | Tekst | strunowy |
Nadzorowane klucze (Zobacz
as_supervised
doc ):('report', 'highlight')
Przykłady ( tfds.as_dataframe ):
gov_report/crs_html
Opis konfiguracji : Raport CRS z podsumowaniem. Struktury spłaszczone i połączone znakami nowej linii podczas dodawania tagów html. Tagi są dodawane tylko dla sekcji nazwa_sekcji w formacie takim jak
<h2>xxx<h2>
.Rozmiar zestawu danych :
351.25 MiB
Podziały :
Rozdzielać | Przykłady |
---|---|
'test' | 362 |
'train' | 6514 |
'validation' | 362 |
- Struktura funkcji :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
ID | Tekst | strunowy | ||
Data wypuszczenia | Tekst | strunowy | ||
raporty | Tekst | strunowy | ||
streszczenie | Tekst | strunowy | ||
tytuł | Tekst | strunowy |
Nadzorowane klucze (Zobacz
as_supervised
doc ):('reports', 'summary')
Przykłady ( tfds.as_dataframe ):
gov_report/gao_html
Opis konfiguracji: raport GAO z wyróżnionymi strukturami spłaszczonymi i połączonymi znakami nowej linii podczas dodawania tagów html. Tagi są dodawane tylko dla sekcji nazwa_sekcji w formacie takim jak
<h2>xxx<h2>
.Rozmiar zbioru danych :
692.72 MiB
Podziały :
Rozdzielać | Przykłady |
---|---|
'test' | 611 |
'train' | 11 005 |
'validation' | 612 |
- Struktura funkcji :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
szybki fakt | Tekst | strunowy | ||
atrakcja | Tekst | strunowy | ||
ID | Tekst | strunowy | ||
Data publikacji | Tekst | strunowy | ||
Data wypuszczenia | Tekst | strunowy | ||
raport | Tekst | strunowy | ||
tytuł | Tekst | strunowy | ||
adres URL | Tekst | strunowy |
Nadzorowane klucze (Zobacz
as_supervised
doc ):('report', 'highlight')
Przykłady ( tfds.as_dataframe ):
gov_report/crs_json
Opis konfiguracji : Raport CRS z podsumowaniem. Struktury reprezentowane jako surowy json.
Rozmiar zestawu danych :
361.92 MiB
Podziały :
Rozdzielać | Przykłady |
---|---|
'test' | 362 |
'train' | 6514 |
'validation' | 362 |
- Struktura funkcji :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
ID | Tekst | strunowy | ||
Data wypuszczenia | Tekst | strunowy | ||
raporty | Tekst | strunowy | ||
streszczenie | Tekst | strunowy | ||
tytuł | Tekst | strunowy |
Nadzorowane klucze (Zobacz
as_supervised
doc ):('reports', 'summary')
Przykłady ( tfds.as_dataframe ):
gov_report/gao_json
Opis konfiguracji: raport GAO z wyróżnionymi strukturami przedstawionymi jako nieprzetworzony plik json.
Rozmiar zbioru danych :
712.82 MiB
Podziały :
Rozdzielać | Przykłady |
---|---|
'test' | 611 |
'train' | 11 005 |
'validation' | 612 |
- Struktura funkcji :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
szybki fakt | Tekst | strunowy | ||
atrakcja | Tekst | strunowy | ||
ID | Tekst | strunowy | ||
Data publikacji | Tekst | strunowy | ||
Data wypuszczenia | Tekst | strunowy | ||
raport | Tekst | strunowy | ||
tytuł | Tekst | strunowy | ||
adres URL | Tekst | strunowy |
Nadzorowane klucze (Zobacz
as_supervised
doc ):('report', 'highlight')
Przykłady ( tfds.as_dataframe ):