关注AI大模型技术的朋友们,在欢度春节的这些天,一定有被国产大模型底座DeepSeek的”横空出圈"霸屏了。
国产化大模型在算力更加“节约”的情况下,研发出了近乎和OpenAI GPT-4o同等“聪明”的大模型底座,极大地激励了国人对于AI技术研发的信心,同时也给国内外同行们带来了不少“焦虑”与“反思”。
与其他主流大模型相比,正如DeepSeek的中文名“深度求索”想表达的,它在解决具体回答任务时,不仅关注“端到端”的一问一答结果,更加关注这个答案是怎么得到的。
这个AI模型会像人一样思考,把任务分解,给出分析框架,然后逐步完善创作类答案的内容细节或计算任务的解体过程。
因为过程合理,所以结果更加make sense,仿佛真的是很深思熟虑给出的结论,而不仅仅是从资料库里找一些相关的答案随便拼凑应付个结果。
下面主要从两个方面来聊聊DeepSeek对我们的影响。
其一是,对于AI技术研发企业或团队的影响;其二是,对于普通人的影响。我想这两个问题都是大家非常关心的。
众所周知,如果想构建一个新的AI模型,主要有三个关键的影响变量:算法、算力、数据。DeepSeek之前出现的一些“顶级”大模型,多数对算力有很大资源要求。
这就导致ai大模型底座的研发成本“居高不下”,成为少数“大厂”的专利。同时,ai大模型产业,对gpu等芯片厂商也产生了极强的“供应链"依赖。
值得注意的是,算力只是ai成功的因素之一,算法和数据同样重要。而DeepSeek,就是从算法寻得突破的!
DeepSeek在训练大模型底座时,巧妙地运用强化学习技术,让模型本身在解决问题的思维过程上不断得到提升。
DeepSeek在有限的数据样本中,得到更多的关于思考方面的启发,从而让ai技术回归本质 —— 对人的思考方式和解决问题的逻辑的模拟,而不仅仅是追求“正确答案”。
DeepSeek的成功让国内外都为之震惊的是,该模型打破了所谓的Scale Law魔咒,让人工智能技术研发重新开始关注算法策略的重要性!
与此同时,DeepSeek的模型训练对于数据质量的要求也是非常高的。其采用了很多高质量的COT(思维链)数据。
这类样本数据不仅记录了问题输入和答案输出,还详细地描述了每一步的“解题”过程。
这也是ai技术的魅力所在,“暗示”ai厂商不要过度迷恋粗放式的数据投喂,而是关注如何让机器更好地学挖掘数据的深层次价值。
从另一方面看,随着ai算法的不断优化,大模型底座训练和推理成本同步降低!
这让更多有技术能力的厂商和研发团队有机会参与到“百模大战”,突破算力资源匮乏的技术瓶颈,在未来5-10年将会不断出现更多“令人振奋”的底层能力创新和应用场景创新!
对于普通人来说,相信不少人都已经试用了DeepSeek的创意作诗、写文案、实事点评这些热门功能。发现ai技术的产出确实“文采横溢”,甚至达到“以假乱真”的效果,很多ai文稿的质量已经超过了大多数普通文字工作者的水平。
与此同时,DeepSeek在写代码方面的能力,也几乎可以替代一般的程序员——只需要把产品需求描述清晰,立刻就能生成可以直接运行的稳定代码案例。
难得一个ai产品一经发布,同时让文科生、理科生都同时焦虑了!似乎未来大多数的职业都在逐渐被ai替代。
有人说,ai降低了一个行业的门槛,因为谁都可以用大模型创作;也有人觉得,其实是提高了门槛,因为如果无法证明人比ai强,企业就没有动力去雇佣所谓“资质平平”的员工。
智能化技术的进步,让人们开始反思什么才是真正的职场竞争力 —— 是业务经验、是创新能力,是沟通能力,是情绪价值,而不是循规蹈矩、墨守成规。
几乎所有标准化的工作,都可以用大模型复现。以前是规章条例、文案模板、技术公式,现在还包括解决问题的方式方法。
当试用DeepSeek时,你会发现在提出一个开放式任务时,它会很快地告诉你如何科学地、有条不紊地对这个任务进行分解,然后逐步给出细节步骤指导。
然而,这是基于大数据提炼总结得到的常规性手段和策略,尽管做到这一点已经超越了80%的行业从业者。这也就是为什么所谓万金油的咨询行业,开始面临市场寒冬 ...
ai对于垂直行业的替代过程仍然是漫长的。因为光有标准化的“解题思路”还不够,还缺少业务内容 ...
这需要更多的业务数据投喂,以及不同领域专家在具体ai应用场景中通过与机器交互产生的增量信息对模型能力进行矫正。
需要注意的是,在一个动态、多变、复杂的市场环境中,绝大多数业务问题是非标准化、随机性强、无先验案例的(少样本或零样本) ...
这也就是为什么很多ai工具看起来输出形式很爽,业务方却觉得隔靴搔痒 ...
ai很有用,但人不能完全依赖于ai —— 使用ai的人的认知和业务能力,决定ai工具的效果上限。
即便在业务决策过程中能使用类似DeepSeek一类的大模型工具辅助完成,也是需要根据具体情况来适配,加入专家的行业洞察与经验预判。
这个过程就像炒菜一样,机器只能搞定前面食材准备的工作,至于最后烹饪的火候、调料配比,也只有“主厨”(人)才能心领神会。
这也是人难以被替代的环节!大模型技术会让普通人更普通,强者更强 ...
当机器变得越来越像人,那么对于绝大多数普通人来说,只有不断学习和成长,努力让自己的能力体系尽可能地与机器产生差异,才能证明自己的职场稀缺性与独特的社会价值!