医学影像学吧 关注:8,955贴子:28,450
  • 2回复贴,共1

医学SCI之数据:影像组学数据不够怎么办?

只看楼主收藏回复

现在大家在做实验的时候都遇到一个窘境,好不容易学会了模型,算法,训练的时候发现数据不够,靠自己收集吧搞不好半年的时间过去了,尤其是一些特殊病例,两三月甚至半年都不一定能碰上一个,所以笔者整理了一下思路,告诉大家如何去找适合自己的公开数据集数据获取


• Benchmark开源数据获取
– iSeg2019数据集
从婴儿连接体项目(BCP)的试点研究——多次就诊高级儿科脑成像研究(Multi-visit Advanced Pediatric Brain Imaging Study, MAP)中随机选取,影像学参数如下:
• T1:144张矢状切片获得t1加权MR图像:TR/TE = 1900/4.38 ms,翻转角度= 7º,分辨率= 1×1×1 mm3;
• T2:64个轴向切片获得t2加权MR图像:TR/TE = 7380/119 ms,翻转角度= 150º,分辨率= 1.25×1.25×1.95 mm3。
– Brats2018-2020
BraTS 数据集是脑肿瘤分割比赛数据集,brats 2018中的训练集( training set) 有285个病例,每个病例有四个模态(t1、t2、flair、t1ce),需要分割三个部分:whole tumor(WT), enhance tumor(ET), and tumor core(TC).
• t1、t2、flair、t1ce可以理解为核磁共振图像的四个不同纬度信息,每个序列的图像shape为(155,240,240)
• 目标是分割出三个label。对应医学中的三个不同肿瘤类型。在真正的分割任务中,包括4个类别,除了这三个label外,还有「背景」类。
– LiTS数据集
• 肝脏肿瘤边界模糊、与正常组织对比度低、结构复杂、灰度多样,分布多样。数量: 训练集130,测试集70。
– MRBrainS18
• 图像数据是在UMC乌得勒支(荷兰)的3T扫描仪上获得的。对于30名受试者中的每一位,都可以进行完全注释的多序列(t1加权、t1加权反转恢复和T2-FLAIR)扫描。30名受试者包括糖尿病、痴呆和阿尔茨海默症患者,以及具有不同程度萎缩和白质病变(年龄> 50岁)的匹配对照(心血管风险增加)。
• 数据标注
– 数据格式转化
– itk-snap使用教程

免费赠送:
1、医学影像组学SCI论文复现桌面
2、医学影像组学复现论文/案例
3、强大的机器算力
4、3D影像分割课
5、病理切片分割课
6、数据获取渠道
7、现成的算法模型
课 程
1. 医学影像组学项目代码结构拆解(自己加代码改哪里)
2. 医学影像组学模型代码详解(别人怎么改的)
3. 医学影像组学数据增强(数据不够的时候怎么办)
4. 医学影像组学困难样本的挖掘和处理(怎么让模型更聪明)
5. 医学影像组学样本均衡的处理(模型不偏科)
6. 医学影像组学数据、模型蒸馏,activate Learning(快速获取数据)
7. 医学影像组学多机多卡并行训练(模型跑的更快)
8. 医学影像组学模型训练过程可视化(论文素材)
9. 医学影像组学训练模型的小技巧
1. learning rate怎么调整。
2. 优化器的选择依据
上边看不明白的话可以在公众号后台回复“数据获取”有详细的讲解视频。
给大家推荐个获取数据的网站:
https://wsss4luad.grand-challenge.org/Datasets/
另外笔者整理了一些影像组学的教学小视频,有兴趣的可以下方评论


IP属地:北京1楼2021-10-12 09:32回复


    IP属地:北京2楼2021-10-12 09:41
    回复
      依托我们开发出来的傻瓜式医学实验平台,在短期内快速复现影像组学SCI论文,在复现结果的基础上做改进


      IP属地:北京3楼2021-10-12 14:26
      回复