- opis :
Wspólne zadanie CoNLL-2002 dotyczy niezależnego od języka rozpoznawania nazwanych jednostek. Typy nazwanych podmiotów obejmują: osoby, lokalizacje, organizacje oraz nazwy różnych podmiotów, które nie należą do poprzednich trzech grup. Uczestnikom wspólnego zadania zaproponowano szkolenie i dane testowe dla co najmniej dwóch języków. W tym zadaniu udostępnionym mogły zostać użyte źródła informacji inne niż dane szkoleniowe.
Strona główna : https://aclanthology.org/W02-2024/
Kod źródłowy :
tfds.text.conll2002.Conll2002
Wersje :
-
1.0.0
(domyślnie): Wersja początkowa.
-
Automatyczne buforowanie ( dokumentacja ): Tak
Klucze nadzorowane (Zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :
@inproceedings{tjong-kim-sang-2002-introduction,
title = "Introduction to the {C}o{NLL}-2002 Shared Task: Language-Independent Named Entity Recognition",
author = "Tjong Kim Sang, Erik F.",
booktitle = "{COLING}-02: The 6th Conference on Natural Language Learning 2002 ({C}o{NLL}-2002)",
year = "2002",
url = "https://aclanthology.org/W02-2024",
}
conll2002/es (domyślna konfiguracja)
Rozmiar pliku do pobrania :
3.95 MiB
Rozmiar zestawu danych :
3.52 MiB
Podziały :
Podział | Przykłady |
---|---|
'dev' | 1916 |
'test' | 1518 |
'train' | 8324 |
- Struktura funkcji :
FeaturesDict({
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=60)),
'tokens': Sequence(Text(shape=(), dtype=string)),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształtować się | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
nie | Sekwencja (etykieta klasy) | (Nic,) | int64 | |
poz | Sekwencja (etykieta klasy) | (Nic,) | int64 | |
żetony | Sekwencja (tekst) | (Nic,) | strunowy |
- Przykłady ( tfds.as_dataframe ):
conll2002/nl
Rozmiar pliku do pobrania :
3.47 MiB
Rozmiar zestawu danych :
3.55 MiB
Podziały :
Podział | Przykłady |
---|---|
'dev' | 2896 |
'test' | 5196 |
'train' | 15807 |
- Struktura funkcji :
FeaturesDict({
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=12)),
'tokens': Sequence(Text(shape=(), dtype=string)),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształtować się | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
nie | Sekwencja (etykieta klasy) | (Nic,) | int64 | |
poz | Sekwencja (etykieta klasy) | (Nic,) | int64 | |
żetony | Sekwencja (tekst) | (Nic,) | strunowy |
- Przykłady ( tfds.as_dataframe ):