详情页标题前

阿里云容器服务ACK使用ContainerOS实现节点极速扩容-云淘科技

详情页1

ContainerOS是为容器场景垂直优化的阿里云官方操作系统,完全兼容现有的Kubernetes生态。ContainerOS对OS启动速度、镜像拉取时间等方面进行了优化,以提升ACK节点扩容速度和节点扩容体验。本文介绍如何使用ContainerOS实现节点极速扩容

索引

  • 前提条件

  • 注意事项

  • ContainerOS扩容优势

  • 操作步骤

    • Kube Controller Manager限流调整

    • Kube Scheduler限流调整

    • APIServer数量调整

  • 相关文档

前提条件

  • 已配置ContainerOS为托管节点池的操作系统。具体操作,请参见使用ContainerOS作为托管节点池操作系统。

  • 第一次基于ContainerOS创建托管节点池的场景下,已确保Kubernetes集群的如下组件处于最新版本,以便更好地实现节点扩容性能。

    • 创建集群时使用的网络组件:Terway组件、Flannel组件

    • 创建集群时默认的存储插件:csi-plugin

    您可以在目标集群信息页面,选择运维管理 > 组件管理,查看组件是否为最新版本。如果组件卡片右下方出现升级,请单击升级完成组件升级。

注意事项

为提升启动速度,ContainerOS采用预置镜像的方式减少镜像拉取时间。在使用过程中,请勿手动升级ACK相关组件(Terway或Flannel、csi-plugin),以免出现预置镜像版本与应用版本不一致的情况,导致启动耗时变长。

说明

借助于容器镜像分层的特性,相较于拉取全新镜像,ContainerOS更新镜像的耗时更短,弹性能力更优。但仍然建议您提前完成相关组件升级,以获得更好的节点扩容体验。

ContainerOS扩容优势

优化项

说明

OS启动速度

通过简化OS启动流程,ContainerOS可以有效降低OS启动时间。ContainerOS是云上虚拟机的操作系统,涉及到的硬件驱动较少,可以将必要的内核驱动模块修改为built-in模式。此外,ContainerOS去除initramfs,并显著简化udev规则,使得OS启动速度大幅提升。以ecs.g7.large规格的ECS实例为例,Alibaba Cloud Linux 3首次启动时间为1分钟以上,而ContainerOS仅需2秒左右。

镜像拉取耗时

ECS节点启动完成后,需要拉取部分组件的容器镜像,以在ACK场景下执行一些基础性的工作。通过预置集群管控必备组件的容器镜像,ContainerOS可以减少节点启动过程中因镜像拉取而带来的耗时。

以Terway网络组件为例,节点需等待Terway组件的容器就绪后,才可以转换为就绪状态。网络拉取的长尾效应将带来极大的耗时。为避免此问题,ContainerOS通过预置的方式提前将此组件提前安装在OS内部,使得组件可以直接从本地目录获取,避免网络拉取镜像耗时。

节点弹性性能

通过与ACK管控链路能力结合,ContainerOS可以有效提高节点弹性性能。

下图统计了从空的ACK节点池扩容的端到端的P90耗时,计时从下发扩容请求开始,到90%的节点处于就绪状态结束。相较于CentOS和Alibaba Cloud Linux 2自定义镜像方案,ContainerOS性能优势明显。具体数据如下图所示。

阿里云容器服务ACK使用ContainerOS实现节点极速扩容-云淘科技重要

本示例中提供的数据仅为理论值,实际数据可能会因产品功能优化略有偏差,请以您的操作环境为准。

操作步骤

如果您有同时启动大量节点的业务场景,例如同时扩容超过100个ECS节点,您可以手动配置Kube Controller Manager、Kube Scheduler、APIServer三个优化项以提升节点扩容速度。

说明

部分API默认支持的最大连接数为100,因此同时启动少于100个ECS节点时无需额外配置。

Kube Controller Manager限流调整

  1. 登录容器服务管理控制台,在左侧导航栏选择集群

  2. 集群列表页面,单击目标集群名称,然后在左侧导航栏,选择运维管理 > 组件管理

  3. 组件管理页面的核心组件页签,定位到Kube Controller Manager,然后单击卡片右下方的配置

  4. 在参数配置对话框,配置kubeAPIQPS800kubeAPIBurst1000(其余选项按需配置),然后单击确定

    说明

    基于测试数据,推荐您按照上方数值进行配置。如有其他需求,您也可以按照自身业务场景灵活配置。

Kube Scheduler限流调整

  1. 登录容器服务管理控制台,在左侧导航栏选择集群

  2. 集群列表页面,单击目标集群名称,然后在左侧导航栏,选择运维管理 > 组件管理

  3. 组件管理页面的核心组件页签,定位到Kube Scheduler,然后单击卡片右下方的配置

  4. 在参数配置对话框,配置connectionQPS800connectionBurst1000(其余选项按需配置),然后单击确定

    说明

    基于测试数据,推荐您按照上方数值进行配置。如有其他需求,您也可以按照自身业务场景灵活配置。

APIServer数量调整

集群内APIServer的副本数量根据负载进行弹性伸缩。如果同一时间弹出节点较多,APIServer会进行扩容,增加节点Ready的耗时。您可以提前提交工单,调整APIServer的副本数量,优化扩容效果。

相关文档

ContainerOS概述

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/170952.html

(0)
上一篇 2023年12月10日
下一篇 2023年12月10日
详情页2

相关推荐

  • 腾讯云CVM服务器共享自定义镜像问题

    每个镜像最多可以共享给多少个用户? 50个。 共享镜像能否更改名称和描述? 不能。 共享镜像是否占用自身镜像配额? 不占用。 共享镜像在创建和重装云服务器实例时是否有地域限制? 有地域限制,共享镜像与源镜像同地域,只能在相同地域创建和重装云服务器实例。 共享镜像是否能复制到其他地域? 不能。 共享给其他用户的自定义镜像是否可以删除? 可以删除,但需先取消该自…

    腾讯云 2023年12月9日
  • 阿里云ECS云服务器部署Linux主机管理系统WDCP-云淘科技

    WDCP(WDlinux Control Panel)是一套Linux服务器及虚拟主机管理系统,通过Web控制和管理服务器。在WDCP的后台中,您可以更方便地使用Linux系统作为网站服务器系统,并对Linux服务器进行管理。 前提条件 已注册阿里云账号。如还未注册,请先完成账号注册。 已创建网络类型为专有网络的安全组,并且安全组的入方向添加规则并放行808…

    阿里云服务器 2023年12月9日
  • 阿里云ECS云服务器远程登录Windows实例出现黑屏,无法进入桌面如何解决?-云淘科技

    本文介绍远程登录Windows实例时,出现黑屏,无法进入桌面的解决办法。 问题现象 如果您的Windows实例操作系统中C:\Windows目录下的explorer.exe文件丢失,则远程登录Windows实例时会一直处于黑屏状态,无法进入桌面,黑屏状态如下。 说明 该场景下,使用任何方式远程登录Windows实例均不能进入桌面。 C:\Windows目录下…

    2023年12月9日
  • 阿里云ECS云服务器ImportImage-云淘科技

    调用ImportImage导入一份您的本地镜像文件到云服务器ECS,作为自定义镜像出现在相应地域中。您可以使用导入的镜像创建ECS实例(RunInstances),或者更换实例的系统盘(ReplaceSystemDisk)。 接口说明 调用该接口时,您需要注意: 您必须提前上传镜像文件到对象存储OSS。具体操作,请参见上传文件。 为避免部分服务器、虚拟机或者…

    阿里云服务器 2023年12月9日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云ECS云服务器升级Linux ECS实例内核-云淘科技

    当Linux ECS实例的操作系统内核版本遇到了稳定性或性能问题(如系统崩溃、卡顿、内存泄漏等),或需要使用新的内核功能时,可通过升级实例的操作系统内核解决。 升级须知 升级操作系统内核是一个比较复杂和风险较高的操作,可能会导致系统不稳定或出现兼容性问题。在进行升级前,建议备份重要数据,了解升级过程和可能出现的问题,并谨慎操作。 操作步骤 以CentOS和D…

    阿里云服务器 2023年12月9日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。