当大模型遇到了传统机器学习，是生搬硬凑？原创

鱼虫子

发布于 2024-5-24 13:07

浏览

0收藏

前面我们通过LLM+向量数据库搭建了RAG，然后又将LLM和外部组件协作构建了Agent。

LLM作为AI的一个细分领域，LLM+也和AI+一样正在重塑各行业。

今天，我们来看看LLM和传统机器学习能碰撞出什么火花。

我们都知道，机器学习模型擅长从数据中发掘潜在模式，大语言模型擅长自然语言理解与生成。

但传统机器学习算法依赖人的经验去做特征工程，模型选择，调参等。那能否借助LLM的理解和生成能力去弥补传统机器学习的不足呢？这种融合新范式能否实现1+1>2？

当大模型遇到了传统机器学习，是生搬硬凑？-AI.x社区

先介绍一个工具Pecan，Pecan是一个基于LLM和机器学习模型实现预测的平台，然后通过一个用户购买可能性的示例来展示LLM和ML融合的潜在能力。

https://www.pecan.ai

第一步，需求分析

首先会有一个LLM助手与你沟通，目的是明确需求，根据需求确定任务类型。

当大模型遇到了传统机器学习，是生搬硬凑？-AI.x社区

目前Pecan中支持二分类、多分类和线性回归任务，Pecan会根据你的需求自动选择分类模型还是回归模型。

Pecan的第一个问题是：你想预测什么？

假设我是一个电商，我想预测用户是否会再次购买我的商品。

此时，Pecan会进一步细分需求，例如，确认目标群体、预测周期以及触发机制等。

例如，我想预测一个用户购买商品后在下一个月是否还会再次购买，如果没有，我将会采取一些激励措施，例如，发放优惠券等等。

第二步，数据集成

当大模型遇到了传统机器学习，是生搬硬凑？-AI.x社区

当Pecan明确我的需求后，会要求你上传数据，然后对数据进行初步分析。

当我上传历史交易数据csv文件后，Pecan会识别出列的名称和类型，并根据需求识别交易日期和客户ID这两个关键列。

第三步，数据预处理

当大模型遇到了传统机器学习，是生搬硬凑？-AI.x社区

Pecan基于前面的需求描述和数据，生成一个notebook，里面是对数据进行预处理的SQL语言，

首先会对数据进行简单的处理，例如，补全，清理，相关性分析等等。

然后，根据用户购买时间，去搜索下个月的销售记录，以此判断该用户是否再次购买，如果购买了，则该数据的标签为True，否则标签为False。

最终将用户特征和标签组织成机器学习模型可识别的训练数据。

在此过程中，如果对SQL代码不理解，还可以让AI帮你解释一下。

第四步，模型训练和预测

当大模型遇到了传统机器学习，是生搬硬凑？-AI.x社区

Pecan会训练多个模型，然后选择性能最好的。

这个过程中数据预处理，特征工程，模型选择都是几乎是通过自然语言完成的，而不需要过多的数据科学和机器学习经验。

每一次颠覆性技术的出现，对人类社会的思想冲击都很大，本文的目的不是介绍某个工具，而是向大家传送一个概念，那就是AI正在重塑各行业，让我们理解当下时代，拥抱AI，拥抱变革。

本文转载自公众号人工智能大讲堂

原文链接：https://mp.weixin.qq.com/s/m6OT9j0RlX5TQMXoa7loEw

标签

机器学习

大模型

相关推荐

大模型微调新范式：当LoRA遇见MoE

zhangyannni • 3040浏览 • 0回复
【春“码”盎然学习季】春日生发，宜学习，宜进阶，宜赢取春日好礼！

AI.x社区官方账号 • 52.2w浏览 • 52回复
【乘风进阶学习季】夏日初长，乘风而上，码出未来！

AI.x社区官方账号 • 52.9w浏览 • 36回复
搬砖机器人？浅谈RPA技术及其应用

zhcs333 • 2648浏览 • 0回复
CodeRAG-Bench：RAG遇到了Coder，哪个模型在RAG的加持下最会写代码？

大语言模型论文跟踪 • 3699浏览 • 0回复
【创新一夏学习季】热浪升温，创新一夏，释放开发潜能

AI.x社区官方账号 • 52.8w浏览 • 39回复
一文看懂RAG的各种套路 | 综述：当RAG遇到大语言模型

大语言模型论文跟踪 • 3742浏览 • 0回复
DSARE：当传统NLP遇到LLM后的关系提取新思路

大语言模型论文跟踪 • 2563浏览 • 0回复
什么是端到端(end to end)大模型，它和传统的大模型有什么区别？其优势与劣势是什么？

AI探索时代 • 3425浏览 • 0回复
构建大模型，GPU是唯一生命线？未必

51CTO技术栈 • 2277浏览 • 0回复
抛开技术，从问题来串联人工智能，机器学习和大模型技术

AI探索时代 • 1372浏览 • 0回复
什么是主动学习？

鱼虫子 • 1778浏览 • 0回复
机器学习四大范式：监督学习、无监督学习、半监督学习和自监督学习

智驻未来 • 1.1w浏览 • 0回复
机器学习|从0开始大模型之位置编码

周末程序猿 • 1375浏览 • 0回复
机器学习|从0开始大模型之模型DPO训练

周末程序猿 • 1676浏览 • 0回复
机器学习 | 从0开发大模型之DeepSeek的GRPO

周末程序猿 • 1687浏览 • 0回复
Anthropic秘密「混合模型」 Claude 4首曝细节，硬刚GPT-5！深度推理模型来了

duhorse • 1917浏览 • 0回复
机器学习 | 从0开发大模型-译llama3-from-scratch

周末程序猿 • 1515浏览 • 0回复
机器学习|从0开发大模型之复现DeepSeek的aha moment

周末程序猿 • 1443浏览 • 0回复

鱼虫子

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

51CTO

51CTO博客

51CTO学堂

当大模型遇到了传统机器学习，是生搬硬凑？原创

51CTO

51CTO博客

51CTO学堂

当大模型遇到了传统机器学习，是生搬硬凑？ 原创

当大模型遇到了传统机器学习，是生搬硬凑？原创