Madhu Nair博士和Asha Das博士即将实现一项重大突破,即使用人工智能(AI)模型在患者组织样本的扫描图像中检测乳腺癌症细胞。
这两位印度研究人员曾面临着一个巨大的挑战:他们花了几个月的时间来训练他们的人工智能模型,以准确识别癌症细胞。Das和她的团队经常花数周时间审查成堆的高分辨率巨型像素图像,逐个图像标记癌区。
该团队需要一种能够准确快速地扫描这些图像的解决方案,并且无需人工监督。
2022年,印度科钦科技大学人工智能与计算机视觉实验室的研究人员Das博士和Nair博士与英特尔工程、销售和营销团队合作,使用英特尔至强可扩展处理器和英特尔优化TensorFlow实现了一种新的解决方案,一个依赖英特尔CPU加速功能的软件套件。
今天,发现癌症的早期症状在很大程度上依赖于放射科医生和治疗医生的专业知识,他们手动扫描组织病理学结果。但是,根据美国国家癌症研究所(National cancer Institute)的数据,仅仅依靠人眼也有其负面影响,大约20%的乳腺癌症症状会被忽视。
这就是人工智能可以提供帮助的地方。由于计算技术的突破,越来越多的医院开始接受使用人工智能来发现医生可能会错过的东西的思路。去年12月,英特尔和宾夕法尼亚医学院宣布,他们已经帮助研究人员将癌症脑瘤的检测提高了33%。
Das解释了她的团队是如何首先采用基于GPU的解决方案来增强他们的深度学习模型的。只有一个问题:他们基于GPU的系统经常会失败,因为处理大图像所需的计算量远远超过了系统的设计限制,导致莫名其妙的停机和令人沮丧的重启。
Nair在描述这些挑战时写道:“我们的模型对计算要求很高,我们使用GPU训练模型的尝试失败了。”“我们花了几天时间来执行,发现很难完成更高分辨率图像的训练。这促使我们寻找更好的计算设备。”
2022年,Nair发现了英特尔的机会。几个月后,他们部署了四台服务器,作为一个单一的计算集群运行,没有任何深度学习加速器。服务器和存储器使用高速以太网连接。在软件方面,联合团队转向了英特尔针对TensorFlow的优化软件套件,通过利用英特尔CPU的加速功能来提高TensorFlow性能。
研究结果正是研究人员所希望的,还有一个令人欣慰的惊喜:他们的模型不仅能标记癌细胞,还能区分不同级别的癌症。它非常准确:该解决方案的准确率为98%,比其他模型高出约10个百分点。随着时间的推移和在更多的数据集上训练他们的模型,研究人员预计准确率会逐渐上升。
Nair说:“英特尔的体系结构令人惊叹。“我们能够在几个小时内完成培训。因为服务器有192GB的内存,超过了显卡上的40GB或80GB,所以我们能够使用高分辨率图像,并将整个模型放入内存中。英特尔还帮助我们改进了模型,并与我们分享了优化,使其发挥作用。这就是我们能够成功的原因。”
考虑到准确度数据是用比其他模型所需的训练数据少得多的数据实现的,这一结果更令人印象深刻,大大缩短了周转时间。她补充道,“值得注意的是,我们只注释了20%的数据,就实现了98%的准确率。这真的很令人兴奋。”
该技术的下一步正在等待,因为该团队获得了专利,并找到了愿意打破习惯于人类接触的市场空间的商业合作伙伴。另外还有准确性的问题,虽然98%的准确率可能看起来很高,但对于现实世界的患者来说,它还不够精确。
现在Das和Nair已经证明了他们的模型能够可靠地检测到乳腺癌症细胞,他们正在研究对脑动脉瘤应用类似的方法,并从内窥镜检查中对息肉进行分类。Das说:“我们还计划扩展这个模型来检测多器官癌症。”她补充说,她现在正致力于扩展解决方案来分析淋巴结图像,因为乳腺癌症经常会扩散到腋下相邻的淋巴结。