xsum

  • opis :

Zbiór danych ekstremalnego podsumowania (XSum).

Dostępne są dwie funkcje: - dokument: artykuł z wiadomościami wejściowymi. - streszczenie: jednozdaniowe streszczenie artykułu.

Dane te należy ręcznie pobrać i wyodrębnić zgodnie z opisem w https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.md Folder „xsum-extracts-from-downloads” należy skompresować jako „xsum-extracts-from-downloads.tar.gz” i umieść w ręcznie pobranym folderze.

Rozdzielać Przykłady
'test' 11301
'train' 203577
'validation' 11305
  • Struktura funkcji :
FeaturesDict({
    'document': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
dokument Tekst strunowy
streszczenie Tekst strunowy
  • Cytat :
@article{Narayan2018DontGM,
  title={Don't Give Me the Details, Just the Summary! Topic-Aware Convolutional Neural Networks for Extreme Summarization},
  author={Shashi Narayan and Shay B. Cohen and Mirella Lapata},
  journal={ArXiv},
  year={2018},
  volume={abs/1808.08745}
}