圈选任务输入数据说明
准备输入数据
- 当您的训练数据集和预测数据集完全一致时,即user_id是完全相同的一批数据,您只需按照下方输入数据格式说明准备人群数据即可。
说明 您无需准备特征数据,系统会从人群圈选任务关联的策略训练任务的输入数据中自动获取。 - 当您的训练数据集和预测数据集不完全一致时,您需要为待圈选用户准备特征数据,即用户基础信息(user)、物品基础信息(item)、用户行为(behavior)和运营记录(operation)4张维表数据,具体格式要求,详情请参见策略训练任务输入数据格式说明。
重要 为保证圈选结果的准确性,请您为待圈选用户准备最新的特征数据。
例如:您一共有100万条用户数据,参考以下两种场景,准备输入数据。
场景 | 圈选任务输入数据 |
---|---|
其中5万条数据同时为训练数据集和预测数据集。 | 您只需按照输入数据格式说明准备5万条包含user_id、item_id和phone字段的人群数据。 |
其中5万条数据为训练数据集,100万条数据为预测数据集。 | 您需要按照策略训练任务输入数据格式说明,为100万条预测数据集准备用户基础维表(user)、物品基础维表(item)、行为维表(behavior)和运营记录维表(operation)四张维表数据。 |
输入数据格式说明
人群圈选任务包含以下两类输入数据:
- 待圈选人群数据,各字段定义如下表所示。
字段名称 描述 user_id 待圈选的用户ID,String类型,不能为空。 item_id 物品ID,String类型,不能为空。 phone 待圈选的用户的手机号,String类型。 - 当算法类型为回流概率时,输入数据包含user_id、item_id和phone字段。
- 当算法类型为流失预测时,输入数据包含user_id和phone字段。
- 待圈选人群特征数据
系统从人群圈选任务关联的策略训练任务的输入数据中自动获取,请确保每天更新策略训练任务的输入数据。
圈选任务输出数据格式说明
圈选任务圈选完成后,输出的数据格式说明如下表所示。
列名 | 描述 |
---|---|
user_id | 待圈选的用户ID,String类型,不能为空。 |
item_id | 物品ID,String类型,不能为空。 |
phone | 待圈选的用户的手机号,String类型。 |
score | 模型对该user_id的打分。 |
内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家
阿里云企业补贴进行中: 马上申请
腾讯云限时活动1折起,即将结束: 马上收藏
同尘科技为腾讯云授权服务中心。
购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠
转转请注明出处:https://www.yunxiaoer.com/164621.html