近年来,微软在计算机视觉领域取得了巨大的进步,其应用在人脸识别,图像理解,搜索,无人机,地图,半自动和自动驾驶等领域。
微软开源了计算机视觉库,涵盖了计算机视觉领域的最佳实践、代码示例和丰富文档——computervision-recipes,该存储库专门为数据科学家和机器学习工程师准备的,本周登上了GitHub热榜,标星5.3K,累计分支 608 个(GitHub地址:https://github.com/microsoft/computervision-recipes)
computervision-recipes旨在构建一套全面的计算机视觉工具和代码示例,以利用最先进的计算机视觉算法、神经系统构建等。当然这个库并非是从零开始教你创建实现,而是从现有的最先进的库中提取并构建关于加载图像数据、优化和评估模型以及扩展到云的附加实用程序。
除此之外,微软表示:由于在这一领域工作多年,因此我们的目标是通过这个项目解答视觉领域的常见问题,指出显而易见的Bug,并展示如何使用云进行训练和部署。
示例
该存储库支持在单个图像上运行的各种计算机视觉方案:
以及将视频序列作为输入的诸如动作识别之类的场景:
以下是该库涵盖常用的计算机视觉场景,包含如下类别:
对于每个主要场景(base),该项目均提供使用户高效构建自己模型的工具。这需要使用者完成一些任务,如基于自己的数据微调模型的简单任务,或者难例挖掘甚至模型部署等更复杂的任务。
如果你对这个项目感兴趣,赶紧到GitHub详情页学习一下吧。