回归模型评估是指基于预测结果和原始结果,评估回归算法模型的优劣性,从而输出评估指标及残差直方图。
组件配置
您可以使用以下任意一种方式,配置回归模型评估组件参数。
方式一:可视化方式
在Designer(原PAI-Studio)工作流页面配置组件参数。
页签 |
参数 |
描述 |
字段设置 |
原回归值 |
支持数值类型。 |
预测回归值 |
支持数值类型。 |
|
执行调优 |
节点个数 |
与参数单个节点内存大小搭配使用,取值范围为1~9999。 |
单个节点内存大小 |
取值范围为1024 MB~64*1024 MB。 |
方式二:PAI命令方式
使用PAI命令方式,配置该组件参数。您可以使用SQL脚本组件进行PAI命令调用,详情请参见SQL脚本。
PAI -name regression_evaluation -project algo_public
-DinputTableName=input_table
-DyColName=y_col
-DpredictionColName=prediction_col
-DindexOutputTableName=index_output_table
-DresidualOutputTableName=residual_output_table;
参数 |
是否必选 |
参数描述 |
默认值 |
inputTableName |
是 |
输入表的名称。 |
无 |
inputTablePartitions |
否 |
输入表中,参与计算的分区。 |
全表 |
yColName |
是 |
输入表中,原始因变量的列名,支持数值类型。 |
无 |
predictionColName |
是 |
预测结果中,因变量的列名,支持数值类型。 |
无 |
indexOutputTableName |
是 |
回归指标输出表的名称。 |
无 |
residualOutputTableName |
是 |
残差直方图输出表的名称。 |
无 |
intervalNum |
否 |
直方图区间数量。 |
100 |
lifecycle |
否 |
输出表的生命周期,取值范围为正整数。 |
无 |
coreNum |
否 |
Instance数量,取值范围为1~9999。 |
系统自动设置 |
memSizePerCore |
否 |
每个核心的内存,取值范围为1024 MB~64*1024 MB。 |
系统自动设置 |
组件输出
回归指标输出表的输出结果为JSON格式,包括以下参数。
参数 |
描述 |
SST |
总平方和 |
SSE |
误差平方和 |
SSR |
回归平方和 |
R2 |
判定系数 |
R |
多重相关系数 |
MSE |
均方误差 |
RMSE |
均方根误差 |
MAE |
平均绝对误差 |
MAD |
平均误差 |
MAPE |
平均绝对百分误差 |
count |
行数 |
yMean |
原始因变量的均值 |
predictionMean |
预测结果的均值 |
内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家
阿里云企业补贴进行中: 马上申请
腾讯云限时活动1折起,即将结束: 马上收藏
同尘科技为腾讯云授权服务中心。
购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠
转转请注明出处:https://www.yunxiaoer.com/162826.html