无代码数据科学是什么?它可以解决什么问题?
现代企业级用户与数据的关系相当复杂,一般都始于好奇心。“高级用户中哪一个会做X,Y或Z?”如果没有沟通问题,就需要数据输出来进行决策。
待解决的问题经常会出现漏洞,最终导致工程师在学习代码时出现障碍。沟通障碍导致无法投入足够的时间在数据科学流程中,也许最终就会考虑彻底放弃。
我们认为这种与数据的关系需要改变,即需要有一些火花。
在与企业级用户合作的这些年,我们认识到以下几点:
- 传统的数据科学对于普通的非技术团队成员来说太复杂了。
- 非技术用户要求一个工程师团队解决可能需要几个星期才能解决的问题。
- 流程采用的是技术编码语言,如Python或SQL。
- 需要考虑给数据配备哪种算法,这可能会浪费时间或出错。
- 用户无法将数据输出可视化,必须创建用户自己的图表来交流发现成果。
所有这些问题都可以通过无代码数据科学来解决。
什么是无代码?
一般来说,无代码工具是任意一种允许任何人在不编写代码的情况下运行复杂的、繁重的编程任务的工具。
事实上,这并不是什么新发明。早在2003年,Squarespace和Wordpress就开始描绘这一蓝图了。最初,这些无代码工具是为初学者准备的,使其能在没有技术背景的情况下完成原本无法完成的任务。
如今,这些工具可以允许任何人在不编写代码的情况下完成任何复杂的任务。业务用户可以利用大量的无代码工具来更有效地执行任务。
Makerpad创建的图像
1. 无代码如何影响业务
无代码工具所创造的真正价值是,它们将技术性的、深奥的任务转换为自动化的、对于没有技术背景的人来说也可以实现的任务。它们使这些技能更大众化,并使得缺乏技术专业技能的小型企业和团队更易于创建网站、市场环境和自动化工作流程。
2. 涉足无代码数据科学
虽然无代码工具的概念在科技领域并不新鲜,但无代码数据科学仍然是一种新事物——这就是你与数据的关系中所需要的那种火花。
一般来说,企业级用户不得不依赖工程师,以从数据寻找答案。许多人都想要一个复杂的SQL查询系统或繁复的神经网络,但公司真正需要的是一个决策层,能帮助他们快速获得对业务的了解。(这不只仅仅涉及数据可视化或制作图表,而是真正可行的了解,例如预测客户流失、欺诈、理解应用内购买行为产生的原因等等。)无代码数据科学可以做到这一点,并使得除工程师外的每一个人都可以进行机器学习和数据洞察,毫不费力地应用于业务中。
从传统数据科学向无代码数据科学的过渡
再次探讨一下传统数据科学的问题:
- 流程太具技术性。
- 获得洞察耗时长,无法实施灵活适合的决策。
- 数据科学仅限于谷歌和苹果等能够负担得起机器学习工程师团队的大公司。
现在,针对以上问题应用无代码数据科学。
1. 无代码数据科学将流程简化为三步
传统机器学习流程如下图所示:
事实证明,企业级用户真正关心的只是获得对数据的洞察。他们想尽快得到问题的答案。想象一下,如果只需向数据提出一个问题,就能比传统机器学习工作流程更快地做出决策。
如果省略编码和模型训练,再加上一个搜索栏,一切都会变得容易得多。数据科学将变为三个步骤:
- 上传数据
- 提出问题
- 获得洞察
2. 只要一个简单的搜索栏,就可以毫不费力地实现数据科学
读者可能想知道“第二步:提出问题”是什么意思。想象一下,如果能用英语与数据对话,并能立即迅速得到答案。
上文提到在数据科学流程中添加搜索栏。搜索栏不仅代表着寻找答案的能力,而且代表着快速、毫不费力地找到答案的能力。
搜索栏把一切都放到人类的自然语言环境里,替换了只有技术用户才懂的技术语言。搜索栏让数据科学对每个人来说都毫不费力。
三、无代码数据科学促进创造力,增强灵活性,提高速度
来源:Pexels
传统的流程不具有这些能力,尤其是在整个公司只有一个数据科学家的情况下。有时可能需要数周才能做出预测。要分析数据,必须创建一个耗时的SQL查询,才能弥补团队成员的错误或曲解。
有了无代码数据科学和自然语言,用户可以像提出问题一样快速地得到报告,并灵活地使用算法。无代码数据科学还允许企业级用户发挥创造力,并以极具竞争性的方式使用数据。
例如: 如果一个非技术用户想要在构思过程中研究应用商店的竞争,他们就必须雇佣一个数据专家来研究应用商店的数据集。有了无代码数据科学,相同的非技术用户可以得到相同的输出,并且不局限于只对数据专家提出几个问题。
他们可以问一些创造性的问题,比如“一个拥有50个评论的音乐应用获得一万次下载的概率有多大?”或者“应用商店中排名前100的应用的平均评论数是多少?”
无论用户对什么感到好奇,他们都可以简单地用自然语言提问,并为这些问题做出创造性的预测。
四、数据科学的未来
我们预测,人们在业务中思考数据科学和机器学习的方式将发生翻天覆地的变化。在机器学习过程中添加无代码,任何中小企业都可以像那些大型公司一样,从自己的数据中获得价值。
在业务中,对自己与数据科学之间关系的看待,需要通过以下方式改变:
- 传统的数据科学是一个漫长的过程,有很强的技术障碍,但是现在数据科学可以简化为三个步骤。
- 传统的数据科学需要一个工程师团队来训练和创建算法,但是现在即使是较小的企业也可以在不依赖工程师的情况下从事数据科学研究和预测模型。
- 传统的数据科学任务要花数周时间来解决简单的问题,而且要用技术语言编写,但是现在数据科学只需几分钟,就可以用英语解释给公司的其他部门。
来源:Pexels
无代码数据科学代替了为技术用户设计的复杂过程,使得那些采用无代码工具的人可以以更轻松的方式获得同样的洞察。
我们开始重新思考与数据科学的关系是从无代码开始的。
如果能重新思考这种关系,是否可以更富创造性地用它来解决问题?