详情页标题前

阿里云人工智能平台PAIXGBoost训练-云淘科技

详情页1

XGBoost训练组件是在开源社区的基础上进行包装,使功能和PAI更兼容,更易用。

算法原理

XGBoost算法在Boosting算法的基础上进行了扩展和升级,具有较好的易用性和鲁棒性,被广泛用在各种机器学习生产系统和竞赛领域。当前支持分类和回归。

数据格式

当前支持Table格式和LibSVM格式的数据。

  • Table格式示例如下:

f0

f1

label

0.1

1

0

0.9

2

1

  • LibSVM格式示例如下:

示例数据

1 2:1 9:1 10:1 20:1 29:1 33:1 35:1 39:1 40:1 52:1 57:1 64:1 68:1 76:1 85:1 87:1 91:1 94:1 101:1 104:1 116:1 123:1

0 0:1 9:1 18:1 20:1 23:1 33:1 35:1 38:1 41:1 52:1 55:1 64:1 68:1 76:1 85:1 87:1 91:1 94:1 101:1 105:1 115:1 121:1

1 2:1 8:1 18:1 20:1 29:1 33:1 35:1 39:1 41:1 52:1 57:1 64:1 68:1 76:1 85:1 87:1 91:1 94:1 101:1 104:1 116:1 123:1

0 2:1 9:1 13:1 21:1 28:1 33:1 36:1 38:1 40:1 53:1 57:1 64:1 68:1 76:1 85:1 87:1 91:1 94:1 97:1 105:1 113:1 119:1

0 0:1 9:1 18:1 20:1 22:1 33:1 35:1 38:1 44:1 52:1 55:1 64:1 68:1 76:1 85:1 87:1 91:1 94:1 101:1 104:1 115:1 121:1

0 0:1 8:1 18:1 20:1 23:1 33:1 35:1 38:1 41:1 52:1 55:1 64:1 68:1 76:1 85:1 87:1 91:1 94:1 101:1 105:1 116:1 121:1

配置参数

Designer支持通过可视化方式,配置XGBoost训练组件参数。

参数

类型

参数描述

字段设置

标签列名

字符串

标签列名。

特征列名数组

字符串数组

表格数据中特征列。和向量列名互斥,代表输入数据的格式为表格数据。

向量列名

字符串

LibSVM格式数据列名,和特征列名数组互斥。代表输入数据的格式为LibSVM数据。

参数设置

训练的轮数

整型数值

训练的轮数。

objective

字符串

目标函数,默认值binary:logistic

Base score

浮点数值

全局bias,默认值为0.5

类别数

整型数值

多分类中类别个数。

构建树的方法

字符串

构建树的方法,取值如下。

  • 自动(auto)(默认值)

  • 精确(exact)

  • 近似(approx)

  • 直方图(hist)

L1 正则项

浮点数值

L1正则项,默认值为0.0

L2 正则项

浮点数值

L2正则项,默认值为1.0

学习率

浮点数值

学习率,默认值为0.3

scale_pos_weight

浮点数值

控制正负样本比例,默认值为1.0

sketch_eps

浮点数值

构建树方法为approx时,控制分箱个数,默认值为0.03

连续特征的最大分割箱数

整型数值

构建树方法为hist时,控制分箱个数,默认值为256

树的最大深度

整型数值

树的最大深度,默认值为6

最大节点个数

整型数值

叶节点最大个数,默认值为0

节点的最小权重

浮点数值

节点的最小权重,默认值为1.0

Max delta step

浮点数值

叶节点的最大步长,可以调节模型精细度,默认值为0.0

样本采样比例

浮点数值

样本采样比例,默认值为1

采样方法

字符串

样本采样方法,取值如下。

  • GRADIENT_BASED(默认值)

  • UNIFORM

每一层的列采样比例

浮点数值

按层进行列采样的比例,默认值为1.0

每个节点的列采样比例

浮点数值

按节点进行列采样的比例,默认值为1.0

每棵树的列采样比例

浮点数值

按树进行列采样的比例,默认值为1.0

Grow Policy

字符串

树生长的规则,取值如下。

  • depthwise(默认值)

  • lossguide

节点分裂最小损失变化

浮点数值

最小分裂loss,默认值为0.0

交互约束

字符串

interaction约束。

单调约束

字符串

monotone约束。

Tweedie variance power

浮点数值

Tweedie分布方差。Tweedie分布中有效。默认值为1.5

执行调优

节点个数

正整数

单个节点内存大小参数配对使用。取值范围为[1, 9999]。

单个节点内存大小

正整数

单位为兆。取值范围为[1024, 64*1024]。

使用示例

阿里云人工智能平台PAIXGBoost训练-云淘科技

注意事项:

XGBoost预测组件输出为原生XGBoost库输出的JSON序列化,所以需要转换为评估组件需要的格式,使用评估组件进行评估。二分类的转换代码如下:

set odps.sql.udf.getjsonobj.new=true;

select *, CONCAT("{\"0\":", 1.0-prob, ",\"1\":", prob, "}") as detail
FROM (
select *, cast(get_json_object(pred, '$[0]') as double) as prob FROM ${t1})

更多内容,详情请参见XGBoost参数说明。

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/162449.html

(0)
上一篇 2023年12月10日
下一篇 2023年12月10日
详情页2

相关推荐

  • 阿里云RDS数据库使用控制台设置参数-云淘科技

    您可以使用控制台或者API查看和修改部分参数的值,以及查询参数修改历史。 前提条件 仅RDS SQL Server 2008 R2(本地SSD盘)实例支持使用该功能。 注意事项 为保证实例的稳定,控制台仅开放部分参数的修改。 修改参数值时请参见控制台上可修改参数页面中的可修改参数列。 SQL Server 2012及以上版本的实例只能通过SQL命令设置实例参…

    2023年12月9日
  • 阿里云云原生大数据计算服务 MaxComputeWM_CONCAT-云淘科技

    用指定的separator做分隔符,连接colname中的值。 注意事项 升级到MaxCompute 2.0后,产品扩展了部分函数。如果您用到的函数涉及新数据类型(TINYINT、SMALLINT、INT、FLOAT、VARCHAR、TIMESTAMP或BINARY),在使用扩展函数时,需要执行如下语句开启新数据类型开关: Session级别:如果使用新数据…

  • 阿里云大数据开发治理平台 DataWorks提交节点报错:当前节点依赖的父节点输出名不存在-云淘科技

    问题现象 提交节点时,系统报错,提示当前节点依赖的父节点输出名不存在。以上图为例,出现此类报错说明,系统无法通过本节点配置的这条父节点输出名称的依赖关系,找到产出表xc_ods_user_info_d_133的上游节点。说明 出现此报错,说明调度依赖配置里的节点输出名不存在(即没有节点将这个节点输出名配置为本节点的输出),并不是指表不存在。如果表存在,且由某…

    2023年12月10日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云RDS数据库CreateDdrInstance – 跨地域恢复数据到新实例-云淘科技

    该接口用于跨地域恢复数据到新实例。 接口说明 说明 恢复前可以调用CheckCreateDdrDBInstance接口预检查某RDS实例是否可以用跨地域备份集进行跨地域恢复。 适用引擎 RDS MySQL RDS PostgreSQL RDS SQL Server 相关功能文档 注意 使用该接口前,请仔细阅读功能文档,确保完全了解使用接口的前提条件及使用后造…

    阿里云数据库 2023年12月9日
  • 阿里云RDS数据库通过DMS登录RDS数据库-云淘科技

    您可以通过阿里云的数据管理服务DMS登录RDS实例的数据库。 背景信息 数据管理DMS是一种集数据管理、结构管理、用户授权、安全审计、数据趋势、数据追踪、BI图表、性能与优化和服务器管理于一体的数据管理服务。 操作步骤 访问RDS实例列表,在上方选择地域,然后单击目标实例ID。 单击页面上方的登录数据库。 在DMS的登录实例页面,输入实例数据库的账号密码,单…

    2023年12月9日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。