中英文核心期刊咨询网

当前位置:首页>>医学论文 > 正文

基于脑功能连接和SAE的自闭症分类

发布时间:2019-11-20

  摘要:为了对自闭症(autismspectrumdisorder,ASD)的计算机辅助诊断提供参考,本文探讨了基于大数据和深度学习的静息态功能磁共振成像(rs-fMRI)的数据分类研究。研究从国际自闭症专业数据库(ABIDE)中获取了306名ASD和350名正常受试者(typicallydeveloping,TD)的rs-fMRI数据。通过对预处理之后的rs-fMRI数据提取脑功能连接(Functionalconnectivity,FC)相关矩阵,再利用堆栈自编码(Stackedautoencoder,SAE)进行训练,最后对ASD和TD进行了分类,得到了准确率高达95.27%的识别。本文的结果表明,基于相关矩阵和SAE的ASD分类系统已经达到了较高性能,可以为计算机辅助诊断ASD提供参考。

基于脑功能连接和SAE的自闭症分类

  关键词:脑功能连接相关矩阵;SAE;自闭症;分类

  自闭症谱系障碍(autismspectrumdisorder,ASD)是一种具有生物基础的发育障碍类疾病,主要体现为社会交流障碍、语言交流障碍、重复刻板行为等[1]。ASD是一种普遍流行的发育障碍类疾病,在印度,ASD人数占人口的1/150;在美国,占1/68;英国,1/100,等等。传统的ASD诊断方法是自闭症诊断观察量表法(Autismdiagnosticobservationschedule,ADOS)[2]和自闭症诊断访谈量表法(修订版)(Autismdiagnosticinterview-revised,ADI-R)[3]。ADOS和ADI-R很大程度上依赖于对患者的采访以及专业人士的知识和经验。功能性磁共振成像(Functionalmagneticresonanceimaging,fM-RI)是一种成熟的大脑成像技术。fMRI成像具有很高的时间和空间分辨率,可以结合机器学习技术应用在神经精神疾病的研究之中[4]。因此,现在很多学者利用这些技术为计算机辅助诊断ASD提供了大量有用手段和方法。

  2010年,Bressler等人的研究表明认知是在不同大脑网络区域的动态交互作用下产生的[5]。Levy等人提出,基于fMRI神经学基础上的生物标志物识别将有助于确保早期准确诊断和最佳治疗[6]。近年来兴起的一些客观诊断方法,如神经发育模型[6]、疾病特异性基因方法[7]和生物标志物方法[8]等,分类精度不高,离临床应用尚有很大距离。这些方法常采用特征选择和基于机器学习的分类算法,如支持向量机(Supportvectormachine,SVM)和人工神经网络(Artificialneuralnetwork,ANN)[9]。然而,基于机器学习的方法也有一定的局限性。例如,SVM基本上不涉及概率估计和大数定律,不适用于ASD研究的统计分析。2014年,Iidaka在文献[10]中将概率神经网络用于ASD的分类,准确率约为90%(敏感性=92%,特异性=87%)。在其他一些使用静息态下或被动观看电影时的内在连接的分类研究中,样本数目不足限制了结果的准确性[11]。所以ASD的计算机辅助诊断仍是一个具有挑战性的课题。现在,研究静息态下的大脑网络活动已经成为一种新的热点。到目前为止,研究对象多集中于ASD和正常受试者(Typi-callydeveloping,TD)的大脑网络活动[12][13]。

  本文采用656名被试者(306名ASD,350名TD)的大量fMRI数据集,使用自动解剖标签(auto-matedanatomicallabeling,AAL)模板从数据中提取116个感兴趣区域(Regionofinterests,ROI)的平均时间序列做相关分析,得到脑功能连接(Func-tionalconnection,FC)相关矩阵,进而基于SAE进行识别分类。该方法克服了普通浅层网络的缺点和训练样本过少的弊端,取得了较好的95.27%的分类准确度(灵敏度=95.42%,特异度=95.14%)。

  1实验方法

  1.1数据获取

  本文所有数据都来源于国际自闭症专业数据库(ABIDE,http://fcon_1000.projects.nitrc.org/indi/abide/index.html)。由于自闭症严重影响患者的成长,所以应在儿童和青少年时期及时做出诊断和预后。因此,本文的实验数据全部是18岁以下的扫描样本数据。所有数据的主要扫描参数如表1所示,样本人口统计学数据如表2所示。

  1.2数据处理

  1.2.1预处理

  在MATLAB下使用SPM8(http://www.fil.ion.ucl.ac.uk/spm/)[14]和DPARSF(http://www.rfmri.org)[15]对图像数据进行预处理,包括分割、配准、空间标准化和平滑等。其中对时间层的校正,需同时将图像配准到第一个时间点的图像。在此过程中我们做了切片正位校正、头部运动校正和全局信号回归,并且用刚体变换对各个图像的时间序列进行对齐操作,去除了头动和全局信号的影响。校正后的图像通过SPM自带的标准EPI模板进行空间标准化之后重采样。通过上述步骤,我们将不同机构的数据进行了规范化处理。

  1.2.2特征提取

  本研究利用基于AAL模板对预处理之后的fMRI数据进行了相关分析,提取了116个ROI,然后计算出一个116×116的相关矩阵,其可视化效果如图1所示。由于该矩阵具有对称性,且对角线代表某个ROI与自身的相关性,故只取矩阵上三角中6,670个有效元素作为研究对象。本文首先计算ASD组和TD组相关矩阵的平均值和标准偏差(SD),然后创建表示ROI和SD之间的平均相关性差异的矩阵,最后计算出代表各个ROI的效应值的矩阵。参考文献[10]的方法,本文按七种不同效应值(绝对值从0.05到0.35,增量为0.05)对矩阵元素进行阈值化比较,最后筛选出4248个相关系数单元。根据ABIDE提供的诊断数据,本文对656名样本的相关矩阵添加标签,然后输入到改进型SAE进行训练,最后利用softmax分类。

  1.3SAE分类

  深度学习是机器学习中的一个新的研究领域,它通过构建深层网络来对目标和行为进行特征提取。20世纪80年代,人工神经网络的反向传播算法的出现带来了基于统计模型的机器学习热潮。深层网络是包含有多个隐含层的网络,它允许输入数据有更复杂抽象的特征,比浅层网络具有更大的函数集紧凑表达能力。虽然在使用监督学习算法训练浅层网络时通常可以获得合理的结果,但在解决非凸优化问题和局部收敛最优问题时效果不明显,因此需要用深层网络来训练。本文使用了SAE方法来区分ASD和TD。

  SAE可克服传统神经网络容易陷入过拟合的缺点,预训练中使特征提取更具有普遍性,而Soft-max分类器可以使概率分布更接近标准结果,交叉熵损失减小。故采用SAE进行特征选择和降维,而后使用Softmax分类器进行分类,整个系统框架如图2所示。

  SAE是一个典型的深度学习模型,它是由多个稀疏自编码(Autoencoder,AE)组成的神经网络。AE一种无监督的学习过程,它分为三层:输入层,隐含层和输出层,其中输入层与输出层的神经元个数是相同的。本文中构建的SAE的结构如图3所示。

  SAE包含10层网络,即一个输入层,8个隐藏层和一个输出层。8个隐藏层被分成4个组,每个组有2个隐藏层并且每个组中的节点数是相同的。第l层的第i个神经元a(l)i通过上一层(l-1层)的各个神经元的输出和对应的权重W并加上偏置项b,再由激活函数输出得到。

  在监督训练的阶段,将SAE和softmax分类器作为一个整体进行训练,预训练中得到的W和b进行微调。训练集包括数据x(i)及其标签y(i)。文中使用SAE从FC相关矩阵中提取足够多的稀疏特征,然后将特征输入到softmax分类器中进行分类。ASD分类系统内参数的具体设置主要有权重、稀疏的惩罚项和稀疏惩罚项的权重,如表3所示。

  2、结果与讨论

  本文通过留一交叉验证法(leave-one-outcrossvalidation,LOOCV)和k折交叉验证分别评估ASD识别准确率。该方法将原始样本分成不相交的k组,随机选择1组作为深度学习网络的测试集,剩余的k-1组作为训练集;然后重复验证k次,使得每组均仅作为一次测试集;最后对得到的k个结果进行平均得出准确率数据。所得的结果中LOOCV比较可靠,减小了随机因素带来的偶然误差,整个过程是可重复的。分类器的性能指标包括真阳性(TP),假阴性(FN),真阴性(TN)和假阳性(FP),并据此计算出灵敏度、特异性、准确度、阳性预测值(PPV)和阴性预测值(NPV)。

  另一方面,研究中的8个隐含层SAE也比其他隐含层数不同的SAE算法更有效。通过在50折交叉验证的基础上加入不同的隐含层多次实验结果表明,所提出的SAE算法在分类精度和计算时间成本之间的平衡比其他算法要好,如表5所示。

  相关知识推荐:医学类论文怎么投稿

  3结论

  综上所述,基于FC相关矩阵和深度学习SAE方法成功地将18岁以下的人群进行ASD和TD预测分类,准确度高达95.27%,且灵敏度、特异性、PPV和NPV等指标均处于较高水平。本文主要目的是使用不同研究机构的大量神经影像学数据样本,在若干外界混杂因素下获得较高分类准确度。分析方法是数据驱动的预处理和SAE方法。本文结果是计算机辅助诊断的一个满意结果,对于临床预测有重要的意义。同时,本文基于计算机自动提取图像特征的深度学习技术可以尽可能减少人工干预,实验证明了使用大量数据样本的深度学习型方法可使精度和灵敏度都有很大的提高,并且在MATLAB中实现了该系统。不过,深度学习相比于传统的机器学习的方法,深度学习的训练时间偏长。因此,在未来的研究中需要一个更有效的平台,今后的研究方向我们将该方法扩展到计算机科学的其他领域,也可以考虑进一步优化本文算法并移植到移动终端平台,从而为临床诊断提供更有效的参考。

回到顶部