bot_adversarial_dialogue

Opis :

Zbiór danych dialogu kontradyktoryjnego botów.

Zestawy danych dialogu oznaczone jako obraźliwe z zadania dialogu kontradyktoryjnego z botami. Dialogi zebrano poprzez poproszenie ludzi o kontradyktoryjną rozmowę z botami.

Więcej szczegółów w artykule .

Strona główna : https://github.com/facebookresearch/ParlAI/tree/main/parlai/tasks/bot_adversarial_dialogue
Kod źródłowy : tfds.datasets.bot_adversarial_dialogue.Builder
Wersje :
- 1.0.0 (domyślnie): Wersja pierwsza.
Automatyczne buforowanie ( dokumentacja ): Tak
Klucze nadzorowane (zobacz dokument as_supervised ): None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :

@misc{xu2021recipes,
      title={Recipes for Safety in Open-domain Chatbots},
      author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
      year={2021},
      eprint={2010.07079},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

bot_adversarial_dialogue/dialogue_datasets (konfiguracja domyślna)

Opis konfiguracji : Zestawy danych dialogowych podzielone na części pociągowe, walidacyjne i testowe.
Rozmiar pliku do pobrania : 3.06 MiB
Rozmiar zbioru danych : 23.38 MiB
Podziały :

Podział	Przykłady
`'test'`	2598
`'train'`	69274
`'valid'`	7002

Struktura funkcji :

FeaturesDict({
    'bot_persona': Sequence(Text(shape=(), dtype=string)),
    'dialogue_id': float32,
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'round_id': float32,
    'speaker_to_eval': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D	Opis
	FunkcjeDykt
bot_persona	Sekwencja (tekst)	(Nic,)	strunowy	Osoba, pod którą podszywa się bot.
identyfikator_dialogu	Napinacz		pływak32
odcinek_skończony	Napinacz		bool
ID	Tekst		strunowy	Identyfikator próbki.
etykiety	Etykieta klasy		int64
okrągły_id	Napinacz		pływak32
głośnik_do_eval	Tekst		strunowy	Osoba mówiąca wypowiedzi oznaczone.
tekst	Tekst		strunowy	Wyrażenie do sklasyfikowania.

Przykłady ( tfds.as_dataframe ):

bot_adversarial_dialogue/human_nonadv_safety_eval

Opis konfiguracji : zestaw oceny bezpieczeństwa ludzi oceniony przez pracowników korzystających z crowdsourcingu pod kątem obraźliwości.
Rozmiar pliku do pobrania : 10.57 KiB
Rozmiar zbioru danych : 34.55 KiB
Podziały :

Podział	Przykłady
`'test'`	180

Struktura funkcji :

FeaturesDict({
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'text': Text(shape=(), dtype=string),
})

Dokumentacja funkcji :

Funkcja	Klasa	Typ D	Opis
	FunkcjeDykt
odcinek_skończony	Napinacz	bool
ID	Tekst	strunowy	Identyfikator próbki.
etykiety	Etykieta klasy	int64
tekst	Tekst	strunowy	Wyrażenie do sklasyfikowania.

Przykłady ( tfds.as_dataframe ):