【51CTO.com原创稿件】秋冬季节临近,流感与新冠肺炎的高发季再次到来。全球再度面临“双流行”的严峻考验。
目前为止,检测新冠肺炎病毒的最好标准,依然是进行病原学检测或免疫学检测,也就是我们常说的核酸检测。
但由于核酸检测的复杂性问题,正常的检测流程最快也需要24小时才能够获得结果,且准确率仅能保证在50%—70%,这样的检测效果并不十分理想。那么是否有其他技术或方法能够帮助我们更加快速准确的对新冠肺炎病毒进行检测区分呢?
其实早在2020年,国内相关科研团队已经就该方向进行了进一步的研究并取得了一定的理论成果。
研究中,科研团队通过更为普遍快捷的血常规、PCT(降钙素原)、CRP(C反应蛋白)等检验进行数据指标的获取,并创新性的尝试利用机器学习算法对系统进行病毒检测分类的训练。
在实验初期的数据预处理层面,研究人员利用患者的可鉴别数据建立原始特征库并进行初步筛选。根据具体情况对初步筛选后的数据进行异常值与噪声处理,利用独立样本t检验的方法,成功对新冠肺炎病毒的多项异常指标进行了确认。
而后,在病毒检测算法的评估过程中,研究人员采取数据特征直方图、密集分布图对数据进行分析,并根据结果对数据进行正态化处理,通过Box-Cox转换提高模型准确度。
成功获取准确模型后,针对逻辑回归算法(LR)、线性判别分析(LDA)、分类与回归算法(CART)、支持向量机(SVM)、贝叶斯分类器(NB)、K近邻算法(KNN)六种线性与非线性算法,随机森林(RF)、极端随机树算法(ET)、AdaBoost(AB)、随机梯度上升(GBM)四种集成算法,统一采用10折交叉验证进行数据分离工作。
使用不同算法对数据进行鉴别分类训练时,根据反馈作出惩罚系数C、径向基函数kernel以及估计量estimators的参数调整。利用准确度比较算法进行结果对比,以找到能够对新冠肺炎进行最优检测的算法。
最终,研究人员通过对十种算法的训练准确度进行对比评估发现,在惩罚系数 C=2.0且径向基函数kernel为rbf 时,支持向量机算法对正态化数据的检测分类具有最优的准确率95%。
这意味着,当满足以上条件时,利用该算法对检测系统进行训练,能够使系统对新冠肺炎病毒的检测准确率达到95%。这一结果已经远超传统核算检测50%—70%的准确率。
而检测效率方面,基于机器学习的快速鉴别方法也实现了对传统核酸检测的完全超越,通过更为简便快捷的血液检测流程,仅需几分钟时间便可通过系统获取到准确的检验结果。
研究团队表示,该系统的测试应用普遍获得了临床医生的肯定。在疫情影响的特殊时期,我们更应当继续加大研发力度,推动技术不断走向成熟和完善。
虽然由于在疾病推理覆盖面、用户体验、静态知识库方面还需进一步优化和提升,该系统还没有正式实现大范围普及。但是相信在不久的将来,这项基于机器学习算法的创新技术定会成为我们彻底战胜疫情的有力武器。
时至今日,我们已经正式进入了一个“算法”的时代。各式算法应用在各领域中大放异彩。现如今,在产业的信息化、数字化、乃至更火爆的智能化过程中,算法能起到多大作用,算法应用还有哪些成功案例,产业互联网与消费互联网中算法的应用有哪些不同?敬请关注WOT全球技术创新大会2022“算法与AI应用”专题。
☆ WOT全球技术创新大会2022 ☆
2022/4/9-4/10
【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】