zbierz2002

  • opis :

Wspólne zadanie CoNLL-2002 dotyczy niezależnego od języka rozpoznawania nazwanych jednostek. Typy nazwanych podmiotów obejmują: osoby, lokalizacje, organizacje oraz nazwy różnych podmiotów, które nie należą do poprzednich trzech grup. Uczestnikom wspólnego zadania zaproponowano szkolenie i dane testowe dla co najmniej dwóch języków. W tym zadaniu udostępnionym mogły zostać użyte źródła informacji inne niż dane szkoleniowe.

@inproceedings{tjong-kim-sang-2002-introduction,
    title = "Introduction to the {C}o{NLL}-2002 Shared Task: Language-Independent Named Entity Recognition",
    author = "Tjong Kim Sang, Erik F.",
    booktitle = "{COLING}-02: The 6th Conference on Natural Language Learning 2002 ({C}o{NLL}-2002)",
    year = "2002",
    url = "https://aclanthology.org/W02-2024",
}

conll2002/es (domyślna konfiguracja)

  • Rozmiar pliku do pobrania : 3.95 MiB

  • Rozmiar zestawu danych : 3.52 MiB

  • Podziały :

Podział Przykłady
'dev' 1916
'test' 1518
'train' 8324
  • Struktura funkcji :
FeaturesDict({
    'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
    'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=60)),
    'tokens': Sequence(Text(shape=(), dtype=string)),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształtować się Typ D Opis
FunkcjeDict
nie Sekwencja (etykieta klasy) (Nic,) int64
poz Sekwencja (etykieta klasy) (Nic,) int64
żetony Sekwencja (tekst) (Nic,) strunowy

conll2002/nl

  • Rozmiar pliku do pobrania : 3.47 MiB

  • Rozmiar zestawu danych : 3.55 MiB

  • Podziały :

Podział Przykłady
'dev' 2896
'test' 5196
'train' 15807
  • Struktura funkcji :
FeaturesDict({
    'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
    'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=12)),
    'tokens': Sequence(Text(shape=(), dtype=string)),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształtować się Typ D Opis
FunkcjeDict
nie Sekwencja (etykieta klasy) (Nic,) int64
poz Sekwencja (etykieta klasy) (Nic,) int64
żetony Sekwencja (tekst) (Nic,) strunowy