近日,百度研究院在发表的论文中提出了“神经条件随机场”的病理切片分析算法,并且在Github上开源了整套算法代码。
该算法在公开数据集Camelyon16大赛测试集上,定位FROC分数为0.8096,超过专业病理医生水平以及由哈佛和麻省理工学院联合团队所保持的最好成绩。
病理切片分析是癌症诊断中的基本标准,即便是经验丰富的病理医生,对于切片的精准度把握也不会达到100%。一张40倍放大的电子化病理切片通常由超过十亿个像素点组成,磁盘空间大小超过1GB。然而淋巴结附近微转移肿瘤细胞群可能最小只有不到1000像素的直径。而一旦发现微转移肿瘤细胞群,病人的治疗方案和预后可能就会有极大差别。
百度研究院提出的“神经条件随机场”是一种深度学习算法,一次性输入一组3x3的图块,并联合预测每一张图块是否有肿瘤区域,图块之间的空间关系可以通过一种名为“条件随机场”的概率图模型来模拟。整套算法框架可以在GPU上进行端到端的训练,而不需任何后处理的步骤。