仅用 SQL 就可以搞机器学习

人工智能 机器学习
MindsDB 通过采用 AI 表的概念将机器学习引入数据库。AI 表是作为虚拟表存储在数据库中的机器学习模型。它们有助于根据数据进行预测。你可以在数据库中执行时间序列、回归和分类预测,并通过使用简单的 SQL 语句查询 AI 表几乎立即获得输出。

最近在 GitHub 上看到的这个 MindsDB[1] 项目让我眼前一亮,它可以在数据库里执行机器学习相关的操作,也就是说,仅用 SQL 就可以构建、训练、优化和部署机器学习模型,要获得预测,只需查询数据和 ML 模型就可以。

MindsDB 通过采用 AI 表的概念将机器学习引入数据库。AI 表是作为虚拟表存储在数据库中的机器学习模型。它们有助于根据数据进行预测。你可以在数据库中执行时间序列、回归和分类预测,并通过使用简单的 SQL 语句查询 AI 表几乎立即获得输出。

接下来,我们来看一个官方提供的一个简单示例。

1、申请一个免费的 MindsDB 云账号,这样就可以立刻体验到了。如果你更喜欢本地部署,可以安装他们的 Docker 版本。

2、从 SQL 客户端连接到 MindsDB。

3、使用 CREATE DATABASE 连接到数据库。MindsDB 有一个示例数据库,可以立即使用。请使用 CREATE DATABASE 语句,如下所示:

CREATE DATABASE example_data
WITH ENGINE = "postgres",
PARAMETERS = {
"user": "demo_user",
"password": "demo_password",
"host": "3.220.66.106",
"port": "5432",
"database": "demo"
};

执行之后可以得到下面的结果:

Query OK, 0 rows affected (3.22 sec)

4、可以使用标准 SQL 来预览数据,如下图所示:

图片

5、使用 CREATE PREDICTOR 创建预测器:

CREATE PREDICTOR mindsdb.home_rentals_predictor
FROM example_data
(SELECT * FROM demo_data.home_rentals)
PREDICT rental_price;

执行后:

Query OK, 0 rows affected (9.79 sec)

6、检查预测器的状态:

SELECT status
FROM mindsdb.predictors
WHERE name='home_rentals_predictor';

会得到正在训练或者已完成的状态:

+----------+
| status |
+----------+
| training |
+----------+

或者

+----------+
| status |
+----------+
| complete |
+----------+

7、执行预测

SELECT 语句允许你基于特征进行预测,其中特征是用于进行预测的输入变量或输入列。现在来预测一栋带两间浴室的 1000 平方英尺房屋的租金是多少。

SELECT rental_price
FROM mindsdb.home_rentals_predictor
WHERE number_of_bathrooms=2
AND sqft=1000;

得到结果如下:

+--------------+
| rental_price |
+--------------+
| 1130 |
+--------------+

到了这一步,你已经成功地使用 SQL 训练了一个预测模型并获得了预测的数据!

特性

1、自动数据预处理、特征工程和编码

2、分类、回归、时间序列任务

3、无需“传统部署”即可将模型投入生产

4、获取每个预测的模型准确度评分和置信区间

5、可以将 ML 模型与现有数据 Join

6、异常检测

7、模型可解释性分析

8、支持 GPU 训练

支持和以下数据库集成:

图片

最后的话

仅用 SQL 就可以使用机器学习真的很方便,MindsDB 的技术细节可以访问官方文档[2],如果有帮助请点在看分享给更多的朋友。

参考资料:

[1]MindsDB: https://github.com/mindsdb/mindsdb

[2]文档: docs.mindsdb.com

责任编辑:武晓燕 来源: Python七号
相关推荐

2018-12-03 08:04:25

负载均衡机器流量

2018-11-27 09:21:41

负载均衡机器Session

2018-07-19 06:07:22

物联网安全物联网IOT

2020-11-19 08:00:03

打工人离职工作

2018-03-01 15:00:15

Oracle数据中心云计算

2015-07-10 11:18:19

2017-02-13 09:33:32

2022-02-28 17:57:44

云迁移云计算

2022-02-28 22:58:04

云迁移IT开发

2022-05-31 06:14:01

Python自动化测试

2009-03-17 08:46:57

Windows 7微软发布

2009-10-21 09:46:13

VB使用ArrayLi

2021-02-23 07:01:24

js小游戏技术

2020-09-17 15:59:37

Java技术开发

2020-07-06 10:55:38

CIO首席信息官IT

2010-10-22 16:20:39

SQL Server表

2022-04-13 14:20:00

技术睡眠装置

2024-01-07 16:56:59

Python人工智能神经网络

2014-06-19 14:49:37

iCloud认证令牌密码

2023-03-26 01:00:48

模型编程语言
点赞
收藏

51CTO技术栈公众号