人工智能博士一篇文章让你详解分类、回归评价指标,机器学习必看

人工智能 机器学习
我们总是想到建模一个好的机器学习算法所涉及的步骤。第一步是评估模型优劣的指标。当我们拟合模型并做出预测时,我们总是尝试了解误差和准确性。本文将尝试提供并解释回归和分类中的各种错误度量方法。

 在本文中,我们将讨论机器学习中回归和分类的各种指标。我们总是想到建模一个好的机器学习算法所涉及的步骤。第一步是评估模型优劣的指标。当我们拟合模型并做出预测时,我们总是尝试了解误差和准确性。本文将尝试提供并解释回归和分类中的各种错误度量方法。

有一些标准可以评估模型的预测质量,如下所示:

  • 度量函数:我们将在本文中进行研究。
  • 估计器评分方法:此方法具有评估解决问题的评分方法。
  • 评分参数:该评分参数告诉估算人员选择度量与模型的评估grid_search.GridSearchCV和cross_validation.cross_val_score

基本定义

估计器:它是一个函数或方程式,用于预测实际数据点上的更准确的建模点。
要知道的技巧
评估方法中有两点需要注意,如下所示:

  • 首先,某些方法以score单词结尾,这意味着价值来自于此,它决定了基本事实。在这种情况下,如果数字较高,则更好。
  • 第二个,如果单词以error或结尾loss。在这种情况下,数量越少越好。

回归指标
评估回归性能的指标如下:

  1. 解释方差得分:此指标评估数据点的变化或离散度。
  • 该指标的公式如下所示:

python中的示例:

  1. #从sklearn导入差异分数 
  2. from sklearn.metrics import explained_variance_score 
  3. true_values = [52.536
  4. predicted_values = [4.52.937
  5. explained_variance_score(true_values, predicted_values) 
  6. #output: 
  7. 0.8525190839694656 

 

2.最大误差:此度量标准将计算真实值和预测值之间的最差值。

  • 最大误差的公式如下所示:

python中的示例

  1. from sklearn.metrics import max_error 
  2. true_values = [52.536
  3. predicted_values = [4.52.938
  4. max_error(true_values, predicted_values) 
  5. #output: 
  6. 2 

 3.平均绝对误差:此度量标准计算真实值和预测值之差的平均误差。该度量对应于l1-范数损失。

  • 该指标的公式如下所示:

python中的示例

  1. from sklearn.metrics import mean_absolute_error 
  2. true_values = [52.536
  3. predicted_values = [4.52.937
  4. mean_absolute_error(true_values, predicted_values) 
  5. #output: 
  6. 0.475 

3.均方误差:此度量标准计算二次误差或损失。

  • 公式如下所示:

 

python中的示例

  1. from sklearn.metrics import mean_squared_error 
  2. true_values = [52.536
  3. predicted_values = [4.52.937
  4. mean_squared_error(true_values, predicted_values) 
  5. #output: 
  6. 0.3525 

4. R平方得分:此度量标准从均值或估计量(如拟合的回归线)计算数据的分布。通常称为“确定系数”。

  • 该指标的公式如下:

python中的示例

  1. from sklearn.metrics import r2_score 
  2. true_values = [52.536
  3. predicted_values = [4.52.937
  4. r2_score(true_values, predicted_values) 
  5. #output: 
  6. 0.8277862595419847 

分类指标

评估分类效果的指标如下:

  1. 准确性得分:此度量标准计算真实值的准确性等于预测值,然后返回分数的分数,否则,如果归一化参数为FALSE,则它将返回真实预测值的总数。

公式如下:

python中的示例

  1. from sklearn.metrics import accuracy_score 
  2. true_values = [5236
  3. predicted_values = [4336
  4. accuracy_score(true_values, predicted_values) 

2.分类报告:此度量标准计算的报告包含分类问题的精度,召回率和F1得分。

Python范例

  1. from sklearn.metrics import classification_report 
  2. true_values = [3436
  3. predicted_values = [4336
  4. target_names = ['Apple''Orange''Kiwi'
  5. print(classification_report(true_values, predicted_values, target_names=target_names)) 

3.铰链损耗:此损耗计算数据点和模型预测点之间的平均距离。SVM算法中也使用它来获得最大边际。

  • 公式如下所示:

python中的示例

  1. from sklearn import svm 
  2. from sklearn.metrics import hinge_loss 
  3. from sklearn.svm import LinearSVC 
  4. #data set in x and y values 
  5. x_values = [[3], [2]] 
  6. y_values = [-11
  7. #using linear SVC model 
  8. svm_linear = svm.LinearSVC(random_state=0
  9. #fitting the model 
  10. svm_linear.fit(x_values, y_values) 
  11. LinearSVC(random_state=0
  12. #making decision prediction 
  13. pred_decision = svm_linear.decision_function([[-2], [3], [0.5]]) 
  14. hinge_loss([-111], pred_decision) 
  15. #output: 
  16. 1.333372678152829 

结论:

这些都是从回归和分类中评估模型性能的一些指标。分类中有基于回归,二元类和多类指标的各种指标。

 

责任编辑:梁菲 来源: 今日头条
相关推荐

2018-06-05 10:24:03

2017-11-17 08:39:40

人工智能机器学习深度学习

2019-09-11 08:52:24

MVCMVPMVVM

2022-08-09 08:00:55

AWS安全API

2011-07-12 13:35:04

程序员

2020-07-28 17:27:53

Nginx 负载均衡模块

2023-11-01 15:52:35

2021-04-07 13:28:21

函数程序员异步

2020-06-23 16:28:25

Nginx负载均衡服务器

2023-07-28 07:14:13

2019-10-17 19:15:22

jQueryJavaScript前端

2018-12-26 10:14:56

综合布线系统数据

2017-11-02 14:06:40

2017-08-22 16:20:01

深度学习TensorFlow

2020-11-13 08:14:28

JavaScript

2021-02-19 19:35:53

SVG 形状元素

2023-06-21 00:10:17

JSONWeb服务器JavaScript

2018-05-17 17:41:53

大数据

2014-05-14 11:15:02

历史起源iOSAndroid

2018-05-14 14:00:15

大数据数据挖掘方法
点赞
收藏

51CTO技术栈公众号