深度学习在医学图像中的应用
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.2.3 乳腺医学图像CAD系统

1.基于钼靶图像的乳腺CAD系统

乳腺钼靶摄影(Mammography)是一类用低剂量X线检查乳腺的技术,具有全面、直观、操作简单、安全和费用比较低廉等特点,是目前诊断早期乳腺癌的首选而有效的方法[96]。钼靶图像按头尾位(CC)和内外斜位(MLO),双侧分别产生两张图像(如图1.3所示)。CAD系统利用计算机图像技术检测或诊断乳腺图像上的异常,如肿块、微钙化和结构扭曲这些病变。

图1.3 乳腺钼靶图像图[97]

注:左上图为头尾位右侧,右上图为头尾位左侧,
左下图为内外侧斜位右侧,右下图为内外侧斜位左侧

1)预处理

乳腺钼靶图像在产生时会有内在的噪声,在正常的腺体和恶性的组织之间X线的衰减差较小[98],因此CAD系统在预处理阶段要做的工作有降噪、增强对比度。有时为了减少干扰和计算量,还要去除背景区域和MLO视图下的胸肌区域。降噪常用的算法有中值滤波[99-101]和有限对比适应性直方图均衡化(CLAHE)[99,100]等。Jain等[102]提出了一种组合的方法抑制密度脉冲噪声,引入带多状态自适应增益的非线性增强算子增强乳腺图像特征。Bhateja等[103]使用0型Volterra滤波器和Ⅱ型Volterra滤波器的线性组合增强病变区域对比度。0型滤波器提供对比增强并抑制不良背景噪声,Ⅱ型滤波器提供边缘增强。

2)异常检测/分割

此环节是找到并标出包含异常病变的ROIs。乳腺异常表现为肿块、微钙化、结构扭曲或双边非对称。

(1)恶性肿块。恶性肿块的征象通常是毛刺状、分叶状、边缘模糊、边界不规则,以及内部密度不均匀、灶状致密影等。检测/分割算法常用的有区域增长法[104]、阈值法[101]等。Jen等[105]使用灰度值量化的方法检测ROIs。Sharma[106]采用k-means聚类的方法检测/分割ROIs。在CAD系统中用一个优化的度量计算输入图像上动态窗口和模板的不同,对应记录矩阵中最小记录的图像窗口被作为疑似区域抽取出来。该试验取得了97.73%的诊断准确度。

Dhungel等[108]引入和评估了一种基于使用CNN和深度信念网络(DBN)作为其潜在函数的结构化预测模型,从乳房X线片分割肿块的新方法。作者将基于CNN和DBN的深度学习表征模型引入到结构化输出模型:条件随机场(CRF)和结构化支持向量机(SSVM)中。CRF模型通过使用树重加权置信传播进行推理,并用截断拟合来学习,SSVM模型使用图形切割推理和切割平面进行训练。作者以实证的方式展示了这种方法产生的结果是DDSM-BCRP和INbreast数据库上迄今为止最好的结果。同时发现CRF模型在推理和训练时间方面明显快于SSVM,这体现出CRF模型与深度学习潜在函数相结合的优势。

(2)微钙化。微钙化是钙在乳腺组织中的沉淀,通常比周围组织更亮、更小。良性钙化一般较粗糙且边缘较圆滑,恶性钙化表现为许多聚集且较小的,其大小和形状变化多样、有角、不规则和有多向分叉[109]。由于钙化在乳腺X线片上表现出较高的亮度,所以常用算法有基于小波变换的和阈值的算法。尽管微钙化检测已有先进的CAD系统出现,但由于售价太高不能普及,所以此领域尚处于研究水平[110]

Oliver等[110]构建了一个基于知识的检测微钙化和簇的方法。首先建造一个字典,字典中的元素是通过一组滤波器得到的包含不同微钙化特征的卷积块。这个字典允许表征已知微钙化的范例,后面用于表征未知的图像。用有正负样本的微钙化字典训练Gentleboost分类器,最后用得到的分类器对未知的乳房X线片检测。3D图像包含更丰富的信息,有很大的潜力实现医学图像CAD性能的提高。

Sahiner等[111]提出一种在3D模式下用阈值迭代的方法检测成簇的微钙化点的方法。该系统由预筛选、簇检测和假阳性去除阶段组成。在预筛选阶段,通过增强调制的3D钙化反应函数增加微钙化样对象的显著性。使用阈值迭代和3D对象生长方法来检测作为微钙化簇的潜在中心的簇种子对象。在簇检测阶段,使用二次阈值迭代程序识别微钙化候选物,将其应用于具有阳性钙化回馈的信噪比(SNR)增强图像体素。以每个聚类种子对象作为初始聚类中心,动态聚类算法通过在簇种子对象的3D邻域内,包含满足聚类标准的微钙化候选点来形成聚类候选簇。在假阳性去除阶段,使用微钙化的数量、大小和信噪比以及簇形状属性来减少FP的数量。

乳腺组织的致密性和乳腺X线片图像较差的对比度是造成后者有效识别前者中微钙化的最大障碍。Malar等[112]尝试了基于小波的组织纹理分析,使用极限学习机(ELM)在数字化乳腺X线片中的微钙化检测的方法,并与使用灰度空间依赖矩阵(GLSDM)和基于Gabor滤波器的技术提取的不同特征向量进行比较。在此次研究中,共使用从55个乳腺X线片图像中提取的120个ROIs(包括正常和微钙化图像),采用小波特征进行训练。结果表明,ELM比Bayesnet分类器、Naivebayes分类器和SVM等人工神经网络具有更好的分类精度(94%),训练时间显著减少。ELM还回避了诸如局部最小值、不正确的学习率和过度拟合等问题。

通过回顾性分析,谭婉嫦等[113]探讨了CADx在微钙化检测与特征提取基础上的分类对于导管原位癌(DCIS)的诊断价值。分析采用乳腺X线摄像检查发现微钙化并经病理学证实的623例患者图像资料(其中良性病变378例,DCIS 245例)。用受试者操作特征曲线(ROC)分别分析采用计算机方法提取的每个微钙化特征对于这两类病变判别的诊断效能,以及应用所有微钙化特征集且基于支持向量机(SVM)分类器的CADx的分类诊断效能。该试验结果为:CADx对于良性病变和DCIS这两类病变微钙化分类的ROC曲线下面积为0.853;特异度、准确率、灵敏度分别为70.1%、82.1%、90.7%,都高于单个微钙化特征的诊断性能。该结果也说明采用CADx对于DCIS微钙化能进行较好的检测与定位,对乳腺癌早期病变的识别能提供有益的参考。

(3)结构扭曲。结构扭曲是指乳腺结构变化,如乳腺组织结构紊乱(包括有毛刺从一点辐射出来和病灶收缩或腺体实质的边缘变形),但没有明确的肿瘤病变。结构扭曲也可以是一个附属的发现,是第三常见的未扪及肿块的乳腺钼靶图像的癌症[114]。由于它的细微和多样性表现,所以在筛查时往往被漏检。如果图像改变是创伤引起的瘢痕或软组织损伤,则这种图像学上的变形是良性的。

尽管是提示病变高度恶性,乳腺X线片中的结构扭曲是放射科医师最容易漏检的病变。为提高检测结构扭曲的准确率,Yoshikawa等[115]开发了一种用于自动检测乳腺X线片中的结构扭曲的新方法。作者使用了1个自适应Gabor滤波器检测乳腺结构扭曲,它通过改变参数的组合来创建3个Gabor滤波器。选择与乳腺X线片中逐像素的乳腺结构最佳匹配的滤镜。检测乳腺后,进行结构密集区域的增强和假阳性去除。在试验中,作者使用50个乳腺X线片验证了此方法的检测性能。结果显示,真阳性率为82.45%,每幅图像假阳性率为1.06。

Singh等[116]的CADx系统在诊断结构变形的乳腺病变时利用了GLCM纹理、GLRLM纹理、不规则碎片形纹理和谱纹理特征,分类时采用SVM算法,系统的整体灵敏度和准确度都很高。文中作者对4种纹理特征的系统性能分别进行了各种组合对比,发现最好的输出结果是所有特征的结合。

(4)双边非对称。双边非对称表示左或右一侧的乳腺的和另外一侧乳腺的对应区域对比,没有明显的肿块,表现出一个较大的体积或密度不同,或更突显的导管[117]。双边非对称是判断乳腺癌的一个很有价值的指标,已被证明是对乳腺癌预测的一个重要指标[118]。目前研究检测双边非对称的文章较少,用到的算法有基于形状、拓扑、亮度分布、纹理等的算法[119]

人工免疫方法是模仿自然免疫系统的一种智能方法,该方法的理论基础有耐噪声、无师学习、自组织、记忆等进化学习机制。自适应人工免疫网络是人工免疫网络的一种半监督学习框架,这种自我智能的网络可以用来解决复杂的分类问题。Magna等[120]研究了基于自适应人造免疫系统(A2INET)计算机辅助方法,以捕获数字乳腺X线片上乳腺的早期非对称体征,用于乳腺癌的早期诊断。算法中,类模板被看作抗体,新样本被看作抗原,它们的距离表示其亲和力。为了测试算法的效率,作者考虑了两个公共数据集:从DDSM中检索到32对乳腺X线图像,包括MLO投影,以及来自mini-MIAS数据库的30对图像。对于其他更传统的分类器LDA、k-NN和PLS-DA,A2INET产生了最佳的结果。

在2D乳腺投影X线片上准确分割病变区域非常困难,而且不可靠,Kel-der等[121]对一个“三环节”(双边配准、图像特征提取和朴素贝叶斯线性分类)的CAD系统进行了性能评估。评估从mini-MIAS数据库中选用了161个对象,使用留一法交叉验证,结果显示出良好的性能。此方法通过检测和分析双边乳腺图像局部特征的非对称性,有效回避了图像分割环节。

Wang等[122]对一个检测乳腺肿块的CADe系统进行了结合双边乳腺密度非对称信息之后的性能评估。在600个病例2400张全域数字乳腺图像片上,阳性和阴性病例各占一半。两次试验分别是单独和融合双边非对称信息检测疑似肿瘤。研究表明双边非对称信息检测疑似肿瘤比双侧平均密度更有效,与传统的特征结合检测可使性能得到明显的提升。

3)特征提取与选择

Taylor等[123]使用商用的“Second Look”CAD系统,利用形态学、密度、纹理等特征分别对152个病例做了回顾性的分析。CAD系统表现出很高的敏感度,而且不受乳腺密度和病变大小的影响。Elfarra等[78]在CADx系统中提出了一种新的特征抽取方法—长方形中心线灰度分布法(SCLGM)。此方法得到了很高的全局测试特异性和准确度。Taylor等[124]对商用的CAD系统R2 ImageChecker在乳腺癌筛查项目中的应用潜能进行了评估。评估结果显示,此方法对于被忽略的癌变能有较强的提示作用,在医生做决策时有进一步的提示作用。

从乳腺异常ROIs中能抽取到的特征可达几百维之多,其中有一些特征是与诊断分类无关[124]或影响非常小。如前所述,特征选择是选择使分类结果最显著的特征子集的过程[77],目的是减少冗余的特征,降低特征维数[78],以提高运算效率,最大化乳腺异常分类准确性。常用的降维算法有主成分分析法(PCA)、线性判别分析法(LDA)等。特征选择算法一般有嵌入式、封装式、滤波式及混合型四类,在此基础上可以用顺序前向法或后向法进行特征子集选择[79]。Eltoukhy等[125]设计了用小波变换和曲波变换的算法抽取乳腺X线图像上的特征形成特征集,并用动态阈值法选取分类效果明显的特征。

Choi等[126]提出的一个新的集成分类框架以提高CAD系统的乳腺图像分类能力。这个新框架分为两部分:①联合使用一个实例的不同特征描述和重采样产生的多样化的数据及准确的基分类器作为成员。②结合使用一个新的“组合分类选择”机制进一步最大化整体分类的性能。然后在乳腺X线基准数据集上测试两个分类应用:①使用分类器去除假阳性。②使用分类器诊断良、恶性肿块。试验结果表明,此分类器比常用的单神经网络或SVM算法有更好的分类性能。

深度学习模型直接从数据中自动学习特征,并在自然场景分类和物体检测等计算机视觉问题上取得了显著的成绩[127]。Arevalo等[128]对基于传统和CNN特征的乳腺X线片上肿瘤CAD分类器的性能作了评估,该试验选取了传统的HOG、HGD、HCfeats。与CNN特征相比,基于传统特征的分类性能最好为AUC,可达到0.799,CNN可达到0.86。同时作者在试验中还发现较小的CNN模型表现最好,并得出两个结论:第一,说明CNN模型对于乳腺X线图像的分析表征是最好的;第二,这次自动分析有自身的特殊性,不需要用大的CNN模型来学习,而且,学习过程中应该使用具有广泛视觉变化性的训练集,这样才能表现大量病变中呈现的纹理模型和形状特征。

4)分类

在乳腺CAD系统中,SVM依然是使用最多的分类方法[99,106,129],此外,ANN也是功能强大的分类工具[78,130]。Choi等[126]提出了同一实例的不同特征表示相结合和数据重采样的方法生成更加多样化和精确的分类器集合成员,还采取一种新型“组合选择”机制进一步提高整体分类的性能。与SVM、ANN等算法的融合方案相比,此方案有明显的优势。这种集成框架还同时具有弱分类器和强分类器的工作优势。Verma等[131]实现了在数字乳腺钼靶图像上的微钙化分类CAD系统,系统中采用了模糊神经技术和特征抽取技术,并发现在分辨微钙化良恶模式时,系统与熵、标准方差和像素数是最好的结合。作者分别采用MLP、k-NN和SVM等3种算法并作性能对比,显示此方法更高效和易用。Dheeba等[131]的论文研究了CADe系统上的一个新的分类算法:粒子群优化小波神经网络,是一个基于从乳腺X线图像上抽取LAWS纹理能量的方法,通过应用一个模式分类器对可疑区域诊断分类。此试验结果展示出良好的系统性能。

Cascio等[132]对CyclopusCAD和SecondLook®两个商用的乳腺CAD系统的诊断性能进行了对比分析。分别使用两个系统对126个数字乳腺图像样例进行操作。在标准阈值时,CyclopusCAD的全局灵敏度为76.9%,SecondLook®的灵敏度为66.2%(P=0.04)。对于肿块病变,CyclopusCAD的灵敏度为76.9%(0.73FP/im),SecondLook®的灵敏度为61.5%,(0.28FP/im)。对于微钙化病变,CyclopusCAD的灵敏度为76.2%(0.64FP/im),SecondLook®的灵敏度为61.9%(0.19FP/im)。

受人工免疫算法启发,Peng等[133]研究了一个半监督算法—人工免疫半监督学习算法,以减少对标注数据的依赖。算法中引入Kent混沌在整个“抗体细胞”特征向量空间中搜索最好的解决方案。作者使用两个从UCI机器学习数据库下载的知名的乳腺癌基准数据集做研究。在这两个数据集上进行的大量的试验和评估都展示了算法的有效性和效率,证明此算法在乳腺癌自动诊断中非常有潜力。

近几年,深度学习模型在计算机视觉和机器学习中产生相当有竞争力的结果[134]。Carneiro等[135]展示了在医学图像分析中使用深CNN的两个重要发现。其一,使用计算机视觉数据库(例如Imagenet)预先训练的CNN模型在医学图像应用中是有用的,尽管图像外观有显著的差异。其二,不需要预先配准输入图像就可以进行多视角分类,相反,可以分别使用在每个视图中训练的CNN所产生的高级特征。针对乳腺X线片的分类,使用CC和MLO视图及其相应的肿瘤和微钙化分割图。首先使用基于Imagenet预训练的模型为每个视图和每个分割图训练单独的CNN模型。然后,使用从每个分割图和未配准视图中学习到的特征,训练一个最终的CNN分类器,使用乳腺成像报告和数据系统(BI-RADS)得分作为输出,估计患者发生乳腺癌的风险。作者在两个数据集(InBreast和DDSM)中测试了这种方法,显示它在ROC的AUC上产生了超过0.9,并且对于二分类问题—良性和恶性诊断AUC也超过0.9。此方法输出了非常好的分类结果,也展示了此方法是一种解决这一具有挑战性的分类问题的全面、综合的方法。

2.基于乳腺超声图像的CAD系统

尽管乳腺钼靶图像目前被认为是早期检查乳腺癌最可靠的方式—能减少18%~30%的致死率,但它的对比度不高,肿瘤与周围正常组织的分界不明显,这会导致10%~30%的癌症漏检[136]。由于这个原因,在最近几十年,作为乳腺X线图像检查乳腺病变的技术辅助,超声波检查被引入CAD系统,主要目的是对图像学上表现致密的乳腺提供更精确的评估。当这两种图像技术结合使用时,鉴别囊性结节和实性结节的有效率能达到约95%,并且减少25%~35%的活检数量[137]

超声乳腺病变CAD系统一般包括4个环节:图像预处理,图像分割,特征提取、选择和分类。散斑干涉和低对比度是超声图像的主要局限。与其他CAD系统相比,超声乳腺病变CAD系统的预处理主要致力于增强对比度和抑制散斑。散斑降噪技术主要有滤波方法、小波域法和组合方法3类[138]。背向散射回声的密度值也可以被用作表征肿瘤的特性。

Moon等[139]提出一个通过B超散斑的统计学特征区分乳腺良性恶性病变的CAD系统。该系统对每个肿瘤统计感兴趣区的平均散斑像素数,并将之作为散数密度,通过一阶和二阶散斑像素统计得到像素分布值和空间关系,以此散斑特性作为特征检测肿瘤。

Alam等[140]开发了一个利用“回声反射性、不均匀性、影、面积、纵横比、边缘不规则性和边界清晰度”等多特征在超声图像上进行乳腺良性恶性病变分类的诊断系统。为了得到定量的声学特征,作者使用滑动窗傅里叶分析,计算了病灶和相邻区域的射频(RF)回波信号的频谱参数图,通过跟踪病变边界的几何和分形分析量化形态特征。作者对130例活检定期患者常规超声检查期间获得的数据进行分析,产生ROC下AUC为0.947±0.045。

Huang等[141]在一个CADx中提出了基于模式识别的病变区域分割方法,先使用全局变分模型以减少斑点噪声,然后用一种基于图的鲁棒分割方法把图像分割成一些子区域,再结合图像纹理抽取、特征选择和分类过程以自动地确定与乳腺相关的肿瘤区域,最后使用主动轮廓模型提取出肿瘤区域。该系统在试验应用中表现出良好的性能。

Cheng等[142]对通过避免不准确的图像处理结果而造成的潜在错误的CADx系统进行了全面的研究,并具体对比了两个基于SADE的乳腺超声病变和肺CT结节诊断CADx系统性能。SDAE架构具备自动特征探索机制和容忍噪声的优势,因此适于处理从不同成像方式产生的有内在噪声特性的医学图像数据。为了展示基于SDAE的CADx系统相对于传统方案的优越性,文章中将两种算法进行了比较。试验结果表明,基于SADE的CADx算法相对于常规的算法在性能上有显著的提升,这也表明深度学习技术能潜在改变CADx设计的模式,而不需面临具体的特征设计和选择问题。

3.基于CT图像的乳腺癌症CAD系统

乳腺钼靶摄影对病变的显示存在非显著性和误报问题,会导致不必要的阴性穿刺活检。锥束乳腺CT扫描仪(bCT)作为一个新的专用图像方法,能够生成高质量的层析数据以提高乳腺组织和结构的可视化,并使病灶显示更显著。量化成像分析能够被用来从bCT图像集中抽取关于感兴趣组织的有用的数字信息[143]

CAD的准确输出依赖对病灶的有效分割,为此Kuo等[144]提出了3D模式下的乳腺肿瘤分割方法,先用3D径向梯度指数分割得到一个粗糙的轮廓,然后用基于3D水平集的主动轮廓算法对边缘进行细化。算法用肿块的中心点作为输入,设定3个边缘估计停止标准:①体积的变化范围;②每一次增长迭代后得到的分割区域的平均密度;③已分割区域内外的平均密度变化率。

Ray等[145]通过使用定量成像(QI)分析的方法实现一个CADx系统。系统先执行图像预处理、感兴趣区分割(用迭代分水岭分割法),然后对分割的对象进行结构性分析(提取8个形态学参数、6个基于GLCM的纹理特征参数),最后用ANN算法进行分类,并针对有效训练数据量较小的问题引入网络优化和交叉验证的方法弥补。上述两个方案准确率都较高,如训练有更大的数据集,系统的泛化性能还可进一步得到提高。

4.基于MRI图像的乳腺癌CAD系统

自20世纪90年代以来,乳腺MRI就开始被用于表征和检测乳腺病变。MRI诊断乳腺癌的灵敏度非常高,可达到78%~98%,但特异度不足,只有43%~75%。近些年发展起来的计算机辅助诊断软件的目的主要是为了使MRI分析和报告更便利,或试图进一步突出显示检测到的病变[143]

Wang等[146]开发了一个在3D动态对比增强磁共振图像上对乳腺肿瘤分割,利用动力学、形态学特征诊断分类的CAD系统。系统用由交叉动力学与AUC下面积相结合得到彩色映射图法探测潜在的乳腺病变区域,用区域增长法分割肿瘤。采用药代动力学或传统曲线分析算法对代表肿瘤的分割的动能曲线特征化,得到鲁棒的系统。

Pang等[147]在乳腺磁共振图像上建立了一个全自动的乳腺肿块良性和恶性诊断分类系统。该系统包括:①乳腺分割,包含一个确定空气和乳腺边界和用曲线拟合确定肺壁的预处理步骤;②乳腺肿块分割,此环节引入了Chan-Vese(CV)水平集方法;③SVM结合ReliefF特征选择,用于把抽取的形状和纹理特征融合,得到一个分类得分。这个RelifF/SVM/CVLS混合的模型具有很好的性能。

Gallego-Ortiz等[148]发表了在动态对比增强磁共振乳腺图像上区分肿瘤和非肿瘤CAD系统的研究,介绍了如何确定合适的特征和优化分类算法等问题。Agha等[149]对一个新开发的3T MRI CAD系统的诊断性能进行评估,此试验对120个从超声图像上看表现有争议的或疑似恶性病变的女性病例的3T MRI CAD诊断结果进行评估。评估结果显示,CAD系统能达良好的灵敏度和特异度,对避免不必要的侵入式检查过程是有益的。