【51CTO.com快译】随着人工智能的发展, 与人们日常生活息息相关的许多领域都受到人工智能的影响。其中,医疗领域作为人们关注的重点,很早便引入了机器学习来辅助医生进行治疗。
例如人们可以利用机器学习来自动识别 X 光片中的影像是否有骨折,或者判断医疗影像中是否存在肿瘤或者癌症。这些相关的研究有的历史非常悠久,有长达10年甚至更久的研究时间。人工智能在医疗行业的商业化落地实践,最近受到了风投行业的追捧,成为了最为热门的投资领域之一。
图1. 人工智能医疗公司图谱
MICCAI 是医学图像处理领域的权威会议。2016 年, Han Zhang 等3位研究者在 MICCAI 上发表了题为 Outcome Prediction for Patient with High-Grade Gliomas from Brain Functional and Structural Networks 的论文,讲述了他们如何利用图像处理和机器学习的技术预测脑瘤发展趋势。下面我们来看一下他们的方法:
45% 的脑瘤都可以归类为大脑胶质瘤,论文是对高恶性程度大脑胶质瘤(HGG)发展趋势的预测。作者声称本研究是研究界首次通过分析大脑神经连接情况进行脑瘤预测。HGG 发展预测由3个部分组成:图像处理、特征选择、分类,具体步骤见下图:
图2. 脑瘤预测系统架构图
训练数据
作者选取了68名病人作为研究对象,其中34 名病人在 650 天内病故,被当作负样本(bad)。另外 34 名病人存活日期超过了 650 天,被当作正样本(good)。训练数据来源为 rs-fMRI 数据和 DTI 数据。
图像处理
作者利用了 SPM8 和DPARSF 软件处理 rs-fMRI 数据来构建功能性大脑网络模型,同时采用 FSL 和 PANDA 软件处理 DTI 数据来结构性大脑网络模型。
网络构建
针对结构性大脑网络,作者利用 AAL 将大脑分割成 116 个区域,并构建图论模型。其中每个区域是图中的一个结点,有神经纤维连接的区域之间产生一条边,边的权重与纤维的数量成正比,与两个区域的皮质表面积之和成反比。作者对这 116 个区域中的每个区域抽取了 BOLD 时间序列,并计算序列和序列之间的相关性作为节点之间的权重。
特征抽取
作者计算了构建的大脑网络中的如下特征作为机器学习模型的输入数据:网络中节点的度、 网络的聚类系数和最短路径长度、网络效度和网络中心度。还加入了13个额外特征,包括性别、年龄、肿瘤大小等。每个病人的特征总数为 2797 个。因为特征的维数较高,会产生过拟合问题,作者采用如下3个步骤进行特征抽取:
1. 利用 t-检验 挑选出最能区分正负样例的特征
2. 利用 RELIEF 算法给剩余的特征进行排序并赋予权重
3. 使用序列后向法进行特征选取。然后利用 SVM 在特征子集上进行预测。准确度最高的特征子集被用来作为分类步骤的特征。
实验结果
当值采用临床特征进行预测时,正确率只有 63.2%;当采用全部特征进行预测时,正确率为 75%。具体实验结果参见下表:
图3. 不同人工智能算法在脑瘤预测问题上的效果
人工智能医疗领域方兴未艾,目前风头正劲。人工智能医疗涉及到图像处理,机器学习等相关技术,历史渊源流长。近年来备受风投青睐的人工智能医疗究竟是新瓶装旧酒,还是下一个风口,让我们拭目以待。
原文标题:Outcome Prediction for Patient with High-Grade Gliomas from Brain Functional and Structural Networks,作者:Luyan Liu,Han Zhang,Islem Rekik,Xiaobo Chen,Qian Wang,Dinggang Shen
汪昊,恒昌利通大数据部负责人,美国犹他大学硕士,在百度,新浪,网易,豆瓣等公司有多年的研发和技术管理经验,擅长机器学习,大数据,推荐系统,社交网络分析,计算机图形学,可视化等技术。在 TVCG 和 ASONAM 等国际会议和期刊发表论文 5 篇。本科毕业论文获国际会议 IEEE SMI 2008 最佳论文奖。
【51CTO译稿,合作站点转载请注明原文译者和出处为51CTO.com】