простой

l10n-placeholder1 Treatment == 1, 2, 1) test\\(treat <- ifelse(test\\)Treatment == 1, 2, 1) train\\(y <- ifelse(train\\)y == 1, 2, 1) test\\(y <- ifelse(test\\)y == 1, 2, 1) train\\(ts = NULL test\\)ts = NULL ``` Параметры: - `n` = количество выборок - `p` = количество предикторов - `ro` = ковариация между предикторами - `sigma` = множитель ошибки термин - `beta.den` = бета умножается на 1/beta.den Создатель: Лео Гельман leo.guelman@gmail.com Чтобы использовать этот набор данных: ```python import tensorflow_datasets as tfds ds = tfds.load('simpte' , split='train') for ex в ds.take(4): print(ex) ``` См. [руководство] (https://www.tensorflow.org/datasets/overview) для получения дополнительной информации о [tensorflow_datasets ](https://www.tensorflow.org/datasets). " />
  • Описание :

Полное название: Моделирование для персонализированных лечебных эффектов

Сгенерировано с помощью пакета R's Uplift: https://rdrr.io/cran/uplift/man/sim_pte.html

Пакет можно скачать здесь: https://cran.r-project.org/src/contrib/Archive/uplift/

Набор данных создан в версии R 4.1.2 со следующим кодом:

  library(uplift)

  set.seed(123)

  train <- sim_pte(n = 1000, p = 20, rho = 0, sigma = sqrt(2), beta.den = 4)
  test <- sim_pte(n = 2000, p = 20, rho = 0, sigma = sqrt(2), beta.den = 4)

  train$treat <- ifelse(train$treat == 1, 2, 1)
  test$treat <- ifelse(test$treat == 1, 2, 1)

  train$y <- ifelse(train$y == 1, 2, 1)
  test$y <- ifelse(test$y == 1, 2, 1)

  train$ts = NULL
  test$ts = NULL

Параметры:

  • n = количество образцов
  • p = количество предикторов
  • ro = ковариация между предикторами
  • sigma = множитель члена ошибки
  • beta.den = бета умножается на 1/beta.den

Создатель: Лео Гельман leo.guelman@gmail.com

  • Домашняя страница : https://rdrr.io/cran/uplift/man/sim_pte.html

  • Исходный код : tfds.datasets.simpte.Builder

  • Версии :

    • 1.0.0 (по умолчанию): Первоначальный выпуск.
  • Размер загрузки : Unknown size

  • Размер набора данных : 1.04 MiB

  • Инструкции по ручной загрузке : этот набор данных требует, чтобы вы загружали исходные данные вручную в download_config.manual_dir (по умолчанию ~/tensorflow_datasets/downloads/manual/ ):
    Пожалуйста, загрузите тренировочные данные: sim_pte_train.csv и тестовые данные: sim_pte_test.csv в ~/tensorflow_datasets/downloads/manual/.

  • Автоматическое кэширование ( документация ): Да

  • Сплиты :

Расколоть Примеры
'test' 2000
'train' 1000
  • Структура функции :
FeaturesDict({
    'X1': float32,
    'X10': float32,
    'X11': float32,
    'X12': float32,
    'X13': float32,
    'X14': float32,
    'X15': float32,
    'X16': float32,
    'X17': float32,
    'X18': float32,
    'X19': float32,
    'X2': float32,
    'X20': float32,
    'X3': float32,
    'X4': float32,
    'X5': float32,
    'X6': float32,
    'X7': float32,
    'X8': float32,
    'X9': float32,
    'treat': int32,
    'y': int32,
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
Х1 Тензор поплавок32
Х10 Тензор поплавок32
Х11 Тензор поплавок32
Х12 Тензор поплавок32
Х13 Тензор поплавок32
Х14 Тензор поплавок32
Х15 Тензор поплавок32
Х16 Тензор поплавок32
Х17 Тензор поплавок32
Х18 Тензор поплавок32
Х19 Тензор поплавок32
Х2 Тензор поплавок32
Х20 Тензор поплавок32
Х3 Тензор поплавок32
Х4 Тензор поплавок32
Х5 Тензор поплавок32
Х6 Тензор поплавок32
Х7 Тензор поплавок32
Х8 Тензор поплавок32
Х9 Тензор поплавок32
рассматривать Тензор int32
у Тензор int32
  • Контролируемые ключи (см. as_supervised doc ): ({'X1': 'X1', 'X10': 'X10', 'X11': 'X11', 'X12': 'X12', 'X13': 'X13', 'X14': 'X14', 'X15': 'X15', 'X16': 'X16', 'X17': 'X17', 'X18': 'X18', 'X19': 'X19', 'X2': 'X2', 'X20': 'X20', 'X3': 'X3', 'X4': 'X4', 'X5': 'X5', 'X6': 'X6', 'X7': 'X7', 'X8': 'X8', 'X9': 'X9', 'treat': 'treat'}, 'y')

  • Рисунок ( tfds.show_examples ): не поддерживается.

  • Примеры ( tfds.as_dataframe ):

  • Цитата :
@misc{https://doi.org/10.48550/arxiv.1212.2995,
  doi = {10.48550/ARXIV.1212.2995},
  url = {https://arxiv.org/abs/1212.2995},
  author = {Tian, Lu and Alizadeh, Ash and Gentles, Andrew and Tibshirani, Robert},
  keywords = {Methodology (stat.ME), FOS: Computer and information sciences, FOS: Computer and information sciences},
  title = {A Simple Method for Detecting Interactions between a Treatment and a Large Number of Covariates},
  publisher = {arXiv},
  year = {2012},
  copyright = {arXiv.org perpetual, non-exclusive license}
}