мнения_резюме

Описание :

Есть два поднабора данных:

(1) RottenTomatoes: Кинокритики и консенсус, взятые с сайта http://rottentomatoes.com/ , содержат поля «_movie_name», «_movie_id», «_critics» и «_critic_consensus».

(2) IDebate: Аргументы, просканированные с http://idebate.org/ , содержат поля «_debate_name», «_debate_id», «_claim», «_claim_id», «_argument_sentences».

См. также https://web.eecs.umich.edu/~wangluxy/datasets/opinion_README.txt

Домашняя страница : https://web.eecs.umich.edu/~wangluxy/data.html
Исходный код : tfds.datasets.opinion_abstracts.Builder
Версии :
- 1.0.0 (по умолчанию): нет примечаний к выпуску.
Размер загрузки : 20.08 MiB
Автоматическое кэширование ( документация ): Да
Рисунок ( tfds.show_examples ): не поддерживается.
Цитата :

@inproceedings{wang-ling-2016-neural,
    title = "Neural Network-Based Abstract Generation for Opinions and Arguments",
    author = "Wang, Lu  and
      Ling, Wang",
    booktitle = "Proceedings of the 2016 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies",
    month = jun,
    year = "2016",
    address = "San Diego, California",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/N16-1007",
    doi = "10.18653/v1/N16-1007",
    pages = "47--57",
}

mind_abstracts/rotten_tomatoes (конфигурация по умолчанию)

Описание конфигурации : Профессиональные критики и консенсус 3731 фильма.
Размер набора данных : 50.10 MiB
Сплиты :

Расколоть	Примеры
`'train'`	3731

Структура функции :

FeaturesDict({
    '_critic_consensus': string,
    '_critics': Sequence({
        'key': string,
        'value': string,
    }),
    '_movie_id': string,
    '_movie_name': string,
})

Документация по функциям :

Особенность	Сорт	Dтип
	ОсобенностиDict
_critic_consensus	Тензор	нить
_критики	Последовательность
_критики/ключ	Тензор	нить
_критики/значение	Тензор	нить
_movie_id	Тензор	нить
_movie_name	Тензор	нить

Контролируемые ключи (см. документ as_supervised ): ('_critics', '_critic_consensus')
Примеры ( tfds.as_dataframe ):

mind_abstracts/idebate

Описание конфига : 2259 заявок на 676 дебатов.
Размер набора данных : 3.15 MiB
Сплиты :

Расколоть	Примеры
`'train'`	2259

Структура функции :

FeaturesDict({
    '_argument_sentences': Sequence({
        'key': string,
        'value': string,
    }),
    '_claim': string,
    '_claim_id': string,
    '_debate_name': string,
})

Документация по функциям :

Особенность	Сорт	Dтип
	ОсобенностиDict
_argument_sentences	Последовательность
_argument_sentences/ключ	Тензор	нить
_argument_sentences/значение	Тензор	нить
_требовать	Тензор	нить
_claim_id	Тензор	нить
_debate_name	Тензор	нить

Контролируемые ключи (см. документ as_supervised ): ('_argument_sentences', '_claim')
Примеры ( tfds.as_dataframe ):

мнения_резюме Оптимизируйте свои подборки Сохраняйте и классифицируйте контент в соответствии со своими настройками.

mind_abstracts/rotten_tomatoes (конфигурация по умолчанию)

mind_abstracts/idebate

мнения_резюме