MBIT姚鹏老师、申书伟老师等在人工智能皮肤病识别领域取得新进展
发布人:Liang Xu  发布时间:2022-05-27   浏览次数:497

深度卷积神经网络 (DCNN) 模型已被广泛用于皮肤病诊断,其中一些模型的诊断结果可与皮肤科医生媲美,甚至优于皮肤科医生。然而,DCNN 在皮肤病检测中的广泛实施受到了可公开访问的小规模以及数据不平衡的皮肤病变数据集的阻碍。

中国科学技术大学MBIT实验室姚鹏老师、申书伟老师等人提出了一种新的基于单模型的策略,用于在小型且不平衡的数据集上对皮肤病变进行分类。首先,在不同的小型和不平衡数据集上训练各种 DCNN,以验证具有中等复杂度的模型优于较大的模型。其次,增加了正则化 DropOut 和 DropBlock 以减少过拟合,并提出了 Modified RandAugment 增强策略来解决小数据集中样本代表性不足的缺陷。最后,提出一种新颖的多加权新损失(MWNL)函数和一个端到端累积学习策略(CLS)以克服样本量不均和分类难度的挑战,减少异常样本对训练的影响。通过结合 Modified RandAugment、MWNL 和 CLS,文章提出的单个 DCNN 模型的方法在分类精度上达到或优于多个集成模型不同的皮肤镜图像数据集。研究表明,该方法能够以较低的计算资源和推理时间成本实现高分类性能,可能适合在移动设备中实现皮肤病变和许多自动筛查资源匮乏地区的其他恶性肿瘤。

相关研究成果以“Single Model Deep Learning on Imbalanced Small Datasets for Skin Lesion Classification为题发表在人工智能行业顶刊《IEEE TRANSACTIONS ON MEDICAL IMAGING》(中科院1区,IF10+)上。

1.网络架构流程图

为了防止模型出现过拟合,研究人员重新设计了一个新模型,即RegNetY-##-Drop(##表示未指定的参数,例如“3.3G”),这种设计是基于 DropOut 仅在 FC 层中工作而 DropBlock 在卷积层中工作的基本原理。

2. RegNetY-##-Drop 的架构

研究人员还对RandAugment方法进行改进,使之更适合皮肤癌的检测任务。首先,研究人员拟将 RandAugment方法的搜索空间采用的图像变换种类进行扩充,由 14 种扩充到更多种类,比如增加噪声、缩放、扭曲变形、Cutout等,这样可以进一步增加数据的多样性。接着,更改数据增广的执行过程。RandAugment方法使用两个参数 N来控制数据增广过程,表示要对每一个训练图像进行几次操作,每次操作都均等的从图像变换集中选择一个变换。表示对于所有的图像变换,都使用一个统一的变形程度值。

3.改进的 RandAugment 方法的流程图(N=2)

考虑到训练集样本中存在极其难训练的异常值与类不均衡的问题,文章还提出了Multi-weighted New Loss Method以及Cumulative Learning Strategy等高效策略。最终文章在ISIC2019,ISIC2018,ISIC2017,7-PT等过个公开的皮肤病分类数据集上取得最佳成绩。

文章的第一作者分别是姚鹏讲师和特任副研究员申书伟。徐晓嵘教授为通讯作者。

论文链接:https://doi.org/10.1109/TMI.2021.3136682