określone_zaimek_rozdzielczość

  • opis :

Utwór skomponowany przez 30 studentów jednej z autorskich klas licencjackich. Te pary zdań obejmują różne tematy, od rzeczywistych wydarzeń (np. plan Iranu ataku na ambasadora Arabii Saudyjskiej w USA) po wydarzenia/postacie z filmów (np. Batman) i czysto wyimaginowane sytuacje, w dużej mierze odzwierciedlające popkulturę postrzeganą przez amerykańskie dzieci urodzony na początku lat 90. Każdy przykład z adnotacjami obejmuje cztery wiersze: pierwszy wiersz zawiera zdanie, drugi zawiera zaimek docelowy, trzeci wiersz zawiera dwa kandydujące poprzedniki, a czwarty wiersz zawiera poprawny poprzednik. Jeśli zaimek docelowy pojawia się w zdaniu więcej niż raz, jego pierwsze wystąpienie jest tym, które ma zostać rozwiązane.

Podział Przykłady
'test' 564
'train' 1322
  • Struktura funkcji :
FeaturesDict({
    'candidates': Sequence(Text(shape=(), dtype=string)),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'pronoun': Text(shape=(), dtype=string),
    'sentence': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
kandydaci Sekwencja (tekst) (2,) strunowy
etykieta Etykieta klasy int64
zaimek Tekst strunowy
zdanie Tekst strunowy
  • Cytat :
@inproceedings{rahman2012resolving,
  title={Resolving complex cases of definite pronouns: the winograd schema challenge},
  author={Rahman, Altaf and Ng, Vincent},
  booktitle={Proceedings of the 2012 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning},
  pages={777--789},
  year={2012},
  organization={Association for Computational Linguistics}
}