bot_adversarial_dialogue

Описание :

Набор данных состязательного диалога ботов.

Наборы данных диалогов, помеченные как оскорбительные, из задачи «Состязательный диалог ботов». Диалоги были собраны путем предложения людям враждебно разговаривать с ботами.

Подробности в статье .

Домашняя страница : https://github.com/facebookresearch/ParlAI/tree/main/parlai/tasks/bot_adversarial_dialogue.
Исходный код : tfds.datasets.bot_adversarial_dialogue.Builder .
Версии :
- 1.0.0 (по умолчанию): первоначальный выпуск.
Автокэширование ( документация ): Да
Контролируемые ключи (см. документ as_supervised ): None
Рисунок ( tfds.show_examples ): не поддерживается.
Цитата :

@misc{xu2021recipes,
      title={Recipes for Safety in Open-domain Chatbots},
      author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
      year={2021},
      eprint={2010.07079},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

bot_adversarial_dialogue/dialogue_datasets (конфигурация по умолчанию)

Описание конфигурации : наборы данных диалога, разделенные на поезда, проверки и тесты.
Размер загрузки : 3.06 MiB
Размер набора данных : 23.38 MiB
Расколы :

Расколоть	Примеры
`'test'`	2598
`'train'`	69 274
`'valid'`	7002

Структура функции :

FeaturesDict({
    'bot_persona': Sequence(Text(shape=(), dtype=string)),
    'dialogue_id': float32,
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'round_id': float32,
    'speaker_to_eval': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
})

Функциональная документация :

Особенность	Сорт	Форма	Дтип	Описание
	ВозможностиDict
bot_persona	Последовательность (Текст)	(Никто,)	нить	Персона, олицетворяемая ботом.
id_диалога	Тензор		поплавок32
эпизод_done	Тензор		логическое значение
идентификатор	Текст		нить	Идентификатор образца.
этикетки	Класслейбл		int64
round_id	Тензор		поплавок32
динамик_to_eval	Текст		нить	Диктор высказываний помечен.
текст	Текст		нить	Высказывание, подлежащее классификации.

Примеры ( tfds.as_dataframe ):

bot_adversarial_dialogue/human_nonadv_safety_eval

Описание конфигурации : набор для оценки безопасности человека, который оценивается краудсорсинговыми работниками на предмет оскорбительного характера.
Размер загрузки : 10.57 KiB
Размер набора данных : 34.55 KiB
Расколы :

Расколоть	Примеры
`'test'`	180

Структура функции :

FeaturesDict({
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'text': Text(shape=(), dtype=string),
})

Функциональная документация :

Особенность	Сорт	Дтип	Описание
	ВозможностиDict
эпизод_done	Тензор	логическое значение
идентификатор	Текст	нить	Идентификатор образца.
этикетки	Класслейбл	int64
текст	Текст	нить	Высказывание, подлежащее классификации.

Примеры ( tfds.as_dataframe ):

bot_adversarial_dialogue Оптимизируйте свои подборки Сохраняйте и классифицируйте контент в соответствии со своими настройками.

Набор данных состязательного диалога ботов.

bot_adversarial_dialogue/dialogue_datasets (конфигурация по умолчанию)

bot_adversarial_dialogue/human_nonadv_safety_eval

bot_adversarial_dialogue