kmeans
-
阿里云云原生大数据计算服务 MaxCompute聚类分片全链路测试-云淘科技
本文为您介绍聚类分片的测试结论及测试过程。 测试结论 Proxima CE在不同的数据集上,针对不同的采样率、聚类中心点个数以及索引分片个数,观察聚类分片方式的召回情况与耗时情况,经测试验证Proxima CE聚类分片的正确性测试符合预期。以下是几条经验准则: 聚类中心点个数与召回呈正相关,中心点越多召回越高。 中心点访问率与召回呈正相关,访问率越高召回越高…
-
阿里云云原生大数据计算服务 MaxCompute聚类分片-云淘科技
Proxima CE支持使用聚类分片方式检索任务,本文为您介绍聚类分片检索功能的使用方法及示例。 前提条件 已安装Proxima CE包并准备输入表,详情请参见安装Proxima CE包。 基本原理 Proxima CE在检索时有两种划分数据分片的方式:哈希分片与聚类分片。您可以通过设置-sharding_mode参数来选择具体的索引分片模式,值为hash时…
- 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
-
阿里云云原生大数据计算服务 MaxCompute参考:Proxima CE全量参数说明-云淘科技
本文为您介绍Proxima CE在运行过程中所使用到的参数说明,包括可选参数和必选参数。 必选参数 参数名称 说明 doc_table 输入底库表(MaxCompute table),需要用户准备,作为检索候选集合。 重要 创建的表名不能使用半角点号.,这是MaxCompute的特殊字符,会导致MaxCompute表解析失败,引用其他工程的表名可以用proj…