详情页标题前

腾讯云容器服务设置工作负载的健康检查同尘科技

详情页1

腾讯云容器集群内核基于 Kubernetes。Kubernetes 支持对容器进行周期性探测,并根据探测结果判断容器的健康状态,执行额外的操作。

健康检查类别

健康检查分为以下类别:容器存活检查:用于检测容器是否存活,类似于执行 ps 命令检查进程是否存在。如果容器的存活检查失败,集群会对该容器执行重启操作。如果容器的存活检查成功,则不执行任何操作。容器就绪检查:用于检测容器是否准备好开始处理用户请求。例如,程序的启动时间较长时,需要加载磁盘数据或者要依赖外部的某个模块启动完成才能提供服务。此时,可通过容器就绪检查方式检查程序进程,确认程序是否启动完成。如果容器的就绪检查失败,集群会屏蔽请求访问该容器。如果容器的就绪检查成功,则会开放对该容器的访问。

健康检查方式

TCP 端口探测

TCP 端口探测的原理如下:
对于提供 TCP 通信服务的容器,集群周期性地对该容器建立 TCP 连接。如果连接成功,证明探测成功,否则探测失败。选择 TCP 端口探测方式,必须指定容器监听的端口。
例如,一个 redis 容器,它的服务端口是6379。我们对该容器配置了 TCP 端口探测,并指定探测端口为6379,那么集群会周期性地对该容器的6379端口发起 TCP 连接。如果连接成功,证明检查成功,否则检查失败。

HTTP 请求探测

HTTP 请求探测是针对于提供 HTTP/HTTPS 服务的容器,并集群周期性地对该容器发起 HTTP/HTTPS GET 请求。如果 HTTP/HTTPS response 返回码属于200 – 399范围,证明探测成功,否则探测失败。使用 HTTP 请求探测必须指定容器监听的端口和 HTTP/HTTPS 的请求路径。
例如,提供 HTTP 服务的容器,服务端口为 80,HTTP 检查路径为 /health-check,那么集群会周期性地对容器发起GET http://containerIP:80/health-check 请求。

执行命令检查

执行命令检查是一种强大的检查方式,该方式要求用户指定一个容器内的可执行命令,集群会周期性地在容器内执行该命令。如果命令的返回结果是0,检查成功,否则检查失败。
对于 TCP 端口探测 和 HTTP 请求探测,都可以通过执行命令检查的方式来替代:对于 TCP 端口探测,可以写一个程序对容器的端口进行 connect。如果 connect 成功,脚本返回0,否则返回-1。对于 HTTP 请求探测,可以编写一个脚本对容器进行 wget 并检查 response 的返回码。例如,wget http://127.0.0.1:80/health-check。如果返回码在200 – 399的范围,脚本返回0,否则返回-1。

注意事项

必须将需要执行的程序放在容器的镜像中,否则会因找不到程序而执行失败。若执行的命令是一个 shell 脚本,则不能直接指定脚本作为执行命令,需要加上脚本的解释器。例如,脚本是 /data/scripts/health_check.sh,那么使用执行命令检查时,指定的程序应为:

sh 
/data/scripts/health_check.sh 

操作步骤

设置步骤以通过容器服务控制台创建 Deployment 为例:1. 登录容器服务控制台,选择左侧导航栏中的 集群。2.集群管理页面,选择需创建服务的集群 ID,进入集群的基本信息页面。3.工作负载 > Deployment页面,单击新建。Deployment 参数设置请参见 Deployment 管理。4.新建 Deployment 页面,单击实例内容器中的显示高级设置。5.容器健康检查中,以选择存活检查为例,设置以下参数。检查方法:选择“执行命令检查”。执行命令:输入以下内容。

sh 
/data/scripts/health_check.sh 

其余公共参数如下:启动延时:单位秒。指定容器启动后,多久开始探测。例如,启动延时设置为5,那么健康检查将在容器启动5秒后开始。间隔时间:单位秒。指定健康检查的频率。例如,间隔时间设置成10,那么集群会每隔10s检查一次。响应超时:单位秒。指定健康探测的超时时间。对应到 TCP 端口探测、HTTP 请求探测、执行命令检查三种方式,分别表示 TCP 连接超时时间、HTTP 请求响应超时时间以及执行命令的超时时间。健康阈值:单位次。指定健康检查连续成功多少次后,才判定容器是健康的。例如,健康阈值设置成3,则说明只有满足连续3次探测都成功,才认为容器是健康的。注意如果健康检查的类型为存活检查,那么健康阈值只能是1,用户设置成其它值将被视为无效。不健康阈值:单位次。指定健康检查连续失败多少次后,才判定容器是不健康的。例如,不健康阈值设置成3,则说明只有满足连续3次都探测失败,才认为容器是不健康的。6. 单击创建 Deployment
容器服务官网1折活动,限时活动,即将结束,速速收藏
同尘科技为腾讯云授权服务中心。
购买腾讯云产品享受折上折,更有现金返利。同意关联立享优惠

转转请注明出处:https://www.yunxiaoer.com/147454.html

(0)
上一篇 2023年12月9日 下午12:40
下一篇 2023年12月9日
详情页2

相关推荐

  • 腾讯云云直播用量统计

    新版连麦管理方案的多个功能已集成至云直播控制台的 连麦管理,便于用户快捷使用,具体分为快速上手、连麦应用、用量统计和地址生成器四个功能页面。更多连麦功能说明,请参见 新版连麦方案。连麦管理模块提供连麦应用用量统计页面,支持查看已创建应用消耗的详细用量数据。 注意事项 已开通 腾讯云直播服务。已开通 实时音视频服务。用量统计非实时刷新,每5分钟统计一次,数据展…

    2023年12月9日
  • 腾讯云高性能计算集群GPU 型实例安装 nvidia-fabricmanager 服务

    操作背景 HCCPNV4h 实例搭载了 A100 GPU 并支持 NvLink & NvSwitch,需额外安装与驱动版本对应的 nvidia-fabricmanager 服务使 GPU 卡间能够互联。若您使用该实例,请参考本文安装 nvidia-fabricmanager 服务,否则可能无法正常使用 GPU 实例。 操作步骤 本文以驱动版本 470…

    2023年12月9日
  • DataWorks中maxcompute 如何同步mysql 增量数据至 hologres分区表?-云小二-阿里云

    DataWorks中maxcompute 实时同步如何同步mysql 增量数据至 hologres 分区表? 以下为热心网友提供的参考意见 MySQL分库分表同步至Hologres(方案1.0)https://help.aliyun.com/zh/dataworks/user-guide/synchronize-data-from-tables-in-sha…

    阿里云 2023年12月10日
  • 腾讯云对象存储恢复归档对象

    简介 本文档提供关于恢复归档对象操作相关的 API 概览以及 SDK 示例代码。 API 操作名 操作描述 POST Object restore 恢复归档对象 将归档类型的对象取回访问 恢复归档对象 功能说明 将归档类型的对象取回访问(POST Object restore)。 方法原型 restore_object(Bucket, Key, Restor…

    腾讯云 2023年12月9日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 如何调用quickBi 的官方api-云小二-阿里云

    通过java在内网调用quick BI的api,完成对组织用户批量添加和删除等,谁能分享个demo参考一下 以下为热心网友提供的参考意见 要调用Quick BI的官方API,你可以参考以下步骤: 首先,你需要在阿里云官方网站上注册并创建一个AccessKey和SecretKey。 下载并安装阿里云的Java SDK:https://github.com/al…

    2023年12月27日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。