- opis :
Zbiór danych opisany w artykule: Unnatural Instructions: Tuning Language Models with (prawie) bez pracy ludzkiej (2022). Zawiera zestawy instrukcji w języku naturalnym z opcjonalnymi ograniczeniami / przeformułowaniami generowanymi przez LLM.
Strona główna : https://github.com/orhonovich/unnatural-instructions
Kod źródłowy :
tfds.text.unnatural_instructions.UnnaturalInstructions
Wersje :
-
0.0.1
(domyślnie): Wersja początkowa. Pomiń instrukcje / dane wejściowe, ponieważ wymagają one dodatkowego przetwarzania. Instrukcja_z_wejściami i przeformułowania zawierają instrukcje i konteksty.
-
Rozmiar pliku do pobrania :
17.48 MiB
Rozmiar zestawu danych :
154.71 MiB
Automatyczne buforowanie ( dokumentacja ): Tylko wtedy, gdy
shuffle_files=False
(pociąg)Podziały :
Podział | Przykłady |
---|---|
'train' | 66010 |
- Struktura funkcji :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'instances': Sequence({
'constraints': Text(shape=(), dtype=string),
'input': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
'instruction': Text(shape=(), dtype=string),
'reformulations': Sequence({
'input': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
ID | Tekst | strunowy | Unikalny identyfikator np. | |
instancje | Sekwencja | |||
instancje/ograniczenia | Tekst | strunowy | Ograniczenia specyficzne dla zadania. | |
instancje/wejście | Tekst | strunowy | Dane wejściowe, które mają zostać wprowadzone do symboli zastępczych dla danej instrukcji. | |
instancje/instrukcja_z_wejsciem | Tekst | strunowy | Instrukcje z danymi wejściowymi dostarczane do symboli zastępczych. | |
instancje/wyjście | Tekst | strunowy | Docelowe wyjście dla danego zadania. | |
instrukcja | Tekst | strunowy | Instrukcja z symbolem zastępczym dla danych wejściowych. | |
przeformułowania | Sekwencja | |||
przeformułowania/wkład | Tekst | strunowy | Dane wejściowe, które mają zostać wprowadzone do symboli zastępczych dla danej instrukcji. | |
przeformułowania/instrukcje | Tekst | strunowy | Instrukcja z symbolem zastępczym dla danych wejściowych. | |
przeformułowania/instrukcja_z_wprowadzeniem | Tekst | strunowy | Instrukcje z danymi wejściowymi dostarczane do symboli zastępczych. | |
przeformułowania/wyjście | Tekst | strunowy | Docelowe wyjście dla danego zadania. |
Klucze nadzorowane (Zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):
- Cytat :
@misc{honovich2022unnatural,
title = {Unnatural Instructions: Tuning Language Models with (Almost) No Human Labor},
author = {Honovich, Or and Scialom, Thomas and Levy, Omer and Schick, Timo},
url = {https://arxiv.org/abs/2212.09689},
publisher = {arXiv},
year={2022}
}