curated_breast_imaging_ddsm

  • Описание :

CBIS-DDSM (подмножество DDSM, разработанное для визуализации молочной железы) представляет собой обновленную и стандартизированную версию цифровой базы данных для скрининговой маммографии (DDSM). DDSM представляет собой базу данных 2620 отсканированных пленочных маммографических исследований. Он содержит нормальные, доброкачественные и злокачественные случаи с проверенной информацией о патологии.

Конфигурация по умолчанию состоит из патчей, извлеченных из исходных маммограмм в соответствии с описанием ( http://arxiv.org/abs/1708.09427 ), чтобы сформулировать задачу, которую необходимо решить в традиционной настройке классификации изображений.

Поскольку для загрузки и чтения изображений, содержащихся в наборе данных, необходимы специальное программное обеспечение и библиотеки, TFDS предполагает, что пользователь загрузил исходные файлы DCIM и преобразовал их в PNG.

Следующие команды (или эквивалентные) следует использовать для создания файлов PNG, чтобы гарантировать воспроизводимые результаты:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

Полученные изображения следует поместить в manual_dir , например: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png .

@misc{CBIS_DDSM_Citation,
  doi = {10.7937/k9/tcia.2016.7o02s9cy},
  url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author = {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title = {Curated Breast Imaging Subset of DDSM},
  publisher = {The Cancer Imaging Archive},
  year = {2016},
}
@article{TCIA_Citation,
  author = {
    K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L. Tarbox and F. Prior
  },
  title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
  Public Information Repository} },
  journal = {Journal of Digital Imaging},
  volume = {26},
  month = {December},
  year = {2013},
  pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    = {Li Shen},
  title     = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               An All Convolutional Design},
  journal   = {CoRR},
  volume    = {abs/1708.09427},
  year      = {2017},
  url       = {http://arxiv.org/abs/1708.09427},
  archivePrefix = {arXiv},
  eprint    = {1708.09427},
  timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm/patches (конфигурация по умолчанию)

  • Описание конфигурации : патчи, содержащие как случаи кальцификации, так и массовые образования, а также пути без отклонений. Разработан как традиционная задача классификации 5 классов.

  • Размер загрузки : 2.01 MiB

  • Размер набора данных : 801.46 MiB

  • Расколы :

Расколоть Примеры
'test' 9770
'train' 49 780
'validation' 5,580
  • Структура функции :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
  • Функциональная документация :
Особенность Сорт Форма Дтип Описание
ВозможностиDict
идентификатор Текст нить
изображение Изображение (Нет, Нет, 1) uint8
этикетка Класслейбл int64

Визуализация

curated_breast_imaging_ddsm/original-calc

  • Описание конфигурации : Исходные изображения случаев кальцификации, сжатые в формате PNG без потерь.

  • Размер загрузки : 1.06 MiB

  • Размер набора данных : 4.42 GiB

  • Расколы :

Расколоть Примеры
'test' 284
'train' 1227
  • Структура функции :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
        'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Функциональная документация :
Особенность Сорт Форма Дтип Описание
ВозможностиDict
аномалии Последовательность
отклонения/оценка Класслейбл int64
аномалии/calc_distribution Класслейбл int64
аномалии/calc_type Класслейбл int64
аномалии/идентификатор Тензор int32
аномалии/маска Изображение (Нет, Нет, 1) uint8
отклонения/патология Класслейбл int64
аномалии/тонкости Класслейбл int64
грудь Класслейбл int64
идентификатор Текст нить
изображение Изображение (Нет, Нет, 1) uint8
пациент Текст нить
вид Класслейбл int64

Визуализация

curated_breast_imaging_ddsm/original-mass

  • Описание конфига : Исходные изображения массовых случаев, сжатые в PNG без потерь.

  • Размер загрузки : 966.57 KiB

  • Размер набора данных : 4.80 GiB

  • Расколы :

Расколоть Примеры
'test' 348
'train' 1166
  • Структура функции :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
        'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Функциональная документация :
Особенность Сорт Форма Дтип Описание
ВозможностиDict
аномалии Последовательность
отклонения/оценка Класслейбл int64
аномалии/идентификатор Тензор int32
аномалии/маска Изображение (Нет, Нет, 1) uint8
аномалии/массовые поля Класслейбл int64
аномалии/массовая_форма Класслейбл int64
отклонения/патология Класслейбл int64
аномалии/тонкости Класслейбл int64
грудь Класслейбл int64
идентификатор Текст нить
изображение Изображение (Нет, Нет, 1) uint8
пациент Текст нить
вид Класслейбл int64

Визуализация