- opis :
Zestawy danych do oceny dla tłumaczenia maszynowego o niskich zasobach: nepalsko-angielski i syngalesko-angielski.
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://github.com/facebookresearch/flores/
Kod źródłowy :
tfds.translate.Flores
Wersje :
-
1.2.0
(domyślnie): Brak informacji o wersji.
-
Rozmiar pliku do pobrania :
1.47 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :
@misc{guzmn2019new,
title={Two New Evaluation Datasets for Low-Resource Machine Translation: Nepali-English and Sinhala-English},
author={Francisco Guzman and Peng-Jen Chen and Myle Ott and Juan Pino and Guillaume Lample and Philipp Koehn and Vishrav Chaudhary and Marc'Aurelio Ranzato},
year={2019},
eprint={1902.01382},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
flores/neen (domyślna konfiguracja)
Opis konfiguracji : zestaw danych translacji z ne na en.
Rozmiar zestawu danych :
1.89 MiB
Podziały :
Rozdzielać | Przykłady |
---|---|
'test' | 2835 |
'validation' | 2559 |
- Struktura funkcji :
Translation({
'en': Text(shape=(), dtype=string),
'ne': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
Tłumaczenie | ||||
en | Tekst | strunowy | ||
nie | Tekst | strunowy |
Klucze nadzorowane (zobacz dokument
as_supervised
):('ne', 'en')
Przykłady ( tfds.as_dataframe ):
flores/sien
Opis konfiguracji : Translacja zestawu danych z si na en.
Rozmiar zestawu danych :
2.05 MiB
Podziały :
Rozdzielać | Przykłady |
---|---|
'test' | 2766 |
'validation' | 2898 |
- Struktura funkcji :
Translation({
'en': Text(shape=(), dtype=string),
'si': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
Tłumaczenie | ||||
en | Tekst | strunowy | ||
si | Tekst | strunowy |
Nadzorowane klucze (zobacz
as_supervised
doc ):('si', 'en')
Przykłady ( tfds.as_dataframe ):