- opis :
CORD-19 to zasób ponad 45 000 artykułów naukowych, w tym ponad 33 000 z pełnym tekstem, na temat COVID-19, SARS-CoV-2 i powiązanych koronawirusów.
Pomoc w organizowaniu informacji w literaturze naukowej na temat COVID-19 poprzez abstrakcyjne podsumowania. Ten zestaw danych przetwarza te artykuły na pary dokumentów i streszczeń pełny_tekst-abstrakt lub wstęp-abstrakt.
Funkcje obejmują ciągi znaków: streszczenie, pełny_tekst, sha (hash pdf), source_x (źródło publikacji), tytuł, doi (cyfrowy identyfikator obiektu), licencja, autorzy, czas publikacji, czasopismo, adres URL.
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge
Kod źródłowy :
tfds.summarization.Covid19sum
Wersje :
-
1.0.0
(domyślnie): Brak informacji o wersji.
-
Rozmiar pliku do pobrania :
Unknown size
Rozmiar zbioru danych :
Unknown size
Instrukcje ręcznego pobierania : ten zestaw danych wymaga ręcznego pobrania danych źródłowych do katalogu
download_config.manual_dir
(domyślnie~/tensorflow_datasets/downloads/manual/
):
Ten zestaw danych należy pobrać ręcznie za pomocą kaggle api:kaggle datasets download allen-institute-for-ai/CORD-19-research-challenge
Umieść pobrany plik zip w folderze manual.Automatyczne buforowanie ( dokumentacja ): Nieznane
Podziały :
Rozdzielać | Przykłady |
---|
- Struktura funkcji :
FeaturesDict({
'abstract': string,
'authors': string,
'body_text': Sequence({
'section': string,
'text': string,
}),
'doi': string,
'journal': string,
'license': string,
'publish_time': string,
'sha': string,
'source_x': string,
'title': string,
'url': string,
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
abstrakcyjny | Napinacz | strunowy | ||
autorski | Napinacz | strunowy | ||
treść_tekstu | Sekwencja | |||
treść_tekstu/sekcja | Napinacz | strunowy | ||
treść_tekst/tekst | Napinacz | strunowy | ||
doi | Napinacz | strunowy | ||
dziennik | Napinacz | strunowy | ||
licencja | Napinacz | strunowy | ||
czas_opublikowania | Napinacz | strunowy | ||
sza | Napinacz | strunowy | ||
źródło_x | Napinacz | strunowy | ||
tytuł | Napinacz | strunowy | ||
adres URL | Napinacz | strunowy |
Nadzorowane klucze (zobacz
as_supervised
doc ):('body_text', 'abstract')
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ): Brak.
Cytat :
@ONLINE {CORD-19-research-challenge,
author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
title = "COVID-19 Open Research Dataset Challenge (CORD-19)",
month = "april",
year = "2020",
url = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}