详情页标题前

阿里云日志服务SLSLogtail机器组问题排查思路(主机场景)-云淘科技

详情页1

本文主要介绍如何系统排查主机场景下的机器组心跳问题。

步骤一:检查Logtail是否正常运行

Linux系统

  1. 登录已安装Logtail的机器。

  2. 执行如下命令。

    ps -ef | grep ilogtail
    • 返回结果中出现两条如下类似信息(分别代表Logtail守护进程和Logtail工作进程)时,说明Logtail正常运行。

      UID          PID    PPID  C STIME TTY          TIME CMD
      ...
      root          12       1  0 Nov10 ?        00:00:00 /usr/local/ilogtail/ilogtail
      root          14      12  0 Nov10 ?        03:07:43 /usr/local/ilogtail/ilogtail
      ...

      重要

      如果返回结果中出现3条及以上Logtail运行信息,则说明当前服务器中有多个Logtail实例在运行,存在重复采集的风险,请检查是否为预期行为。

    • 如果返回结果显示Logtail相关进程未运行,请安装Logtail。具体操作,请参见安装Logtail(Linux系统)。

      重要

      安装时,请务必选择支持安装Logtail的操作系统、按照日志服务Project所属地域选择安装参数以及根据网络类型选择安装方式。关于网络类型的更多信息,请参见选择网络。

Windows系统

  1. 登录Logtail所在的机器。

  2. 打开运行窗口,输入services.msc

  3. 查看LogtailDaemon服务(Logtail 1.0.0.0及以上版本)或LogtailWorker服务(Logtail 0.x.x.x版本)的运行状态。

    如果上述服务未运行,请安装Logtail。具体操作,请参见安装Logtail(Windows系统)。

    重要

    安装时,请务必选择支持安装Logtail的操作系统、按照日志服务Project所属地域选择安装参数以及根据网络类型选择安装方式。关于网络类型的更多信息,请参见选择网络。

步骤二:确认机器组中的IP地址是否为Logtail获取的IP地址

Logtail获取服务器IP地址的方式如下:

  • 如果您没有设置主机名绑定,则Logtail会获取服务器中第一块网卡的IP地址。

  • 如果您在/etc/hosts文件中设置了主机名绑定,则Logtail会获取绑定的主机名对应的IP地址。

您可以根据下述步骤完成排查。

  1. 打开app_info.json文件。

    Logtail将获取的IP地址记录在app_info.json文件的ip字段中,该文件在不同系统下的默认路径说明如下表所示。

    操作系统

    Logtail

    app_info.json文件路径

    Linux

    Logtail(64位程序)

    /usr/local/ilogtail/app_info.json

    Windows(64位操作系统)

    Logtail (64位程序)

    C:\Program Files\Alibaba\Logtail\app_info.json

    Logtail(32位程序)

    C:\Program Files (x86)\Alibaba\Logtail\app_info.json

    Windows (32位操作系统)

    Logtail(32位程序)

    C:\Program Files\Alibaba\Logtail\app_info.json

  2. 获取app_info.json文件中的ip字段值。

    {
      "UUID" : "",
      "hostname" : "iZ8vbdlzf******azuhZ",
      "instance_id" : "E9633380-***********-00163E1AA597_172.16.2.200_166****11",
      "ip" : "172.**.**.200",
      "logtail_version" : "1.3.1",
      "os" : "Linux; 4.19.91-26.1.al7.x86_64; #1 SMP Tue Jul 26 17:52:28 CST 2022; x86_64",
      "update_time" : "2022-12-27 05:38:33"
    }
  3. 确认机器组中使用的是Logtail获取的IP地址。

    日志服务机器组包括IP地址机器组和用户自定义标识机器组。更多信息,请参见机器组简介。

    • 如果是IP地址机器组,请查看IP地址文本框内的IP地址。具体操作,请参见查看机器组状态。

      IP地址文本框内填写了目标Logtail的其它IP地址(例如公网地址)时,请修改为Logtail获取的IP地址,然后观察机器心跳是否正常。如果正常,则可以结束本次排查。

    • 如果是用户自定义标识机器组,请使用Logtail获取的IP地址搜索目标机器组的状态信息。具体操作,请参见查看机器组状态。如果搜索成功,则可以结束本次排查流程。阿里云日志服务SLSLogtail机器组问题排查思路(主机场景)-云淘科技

步骤三:检查Logtail启动参数是否正确

ilogtail_config.json文件记录了Logtail的相关启动参数。

  1. 登录Logtail所在的机器。

  2. 查找ilogtail_config.json文件。

    先执行如下命令确认环境变量中是否指定了该文件的存储路径。

    echo $ALIYUN_LOGTAIL_CONFIG
    • 如果返回结果非空,则返回的环境变量值为ilogtail_config.json文件的存储路径,一般为/etc/ilogtail/conf//ilogtail_config.json

    • 如果返回结果为空,则说明未使用环境变量指定ilogtail_config.json文件的存储路径。您可以通过如下默认路径查找。

      操作系统

      Logtail

      ilogtail_config.json文件路径

      Linux

      Logtail(64位程序)

      /usr/local/ilogtail/ilogtail_config.json

      Windows(64位操作系统)

      Logtail(64位程序)

      C:\Program Files\Alibaba\Logtail\ilogtail_config.json

      Logtail(32位程序)

      C:\Program Files (x86)\Alibaba\Logtail\ilogtail_config.json

      Windows (32位操作系统)

      Logtail(32位程序)

      C:\Program Files\Alibaba\Logtail\ilogtail_config.json

  3. 打开ilogtail_config.json文件,确认配置文件参数是否正确。

    {
      "config_server_address" : "http://logtail..log.aliyuncs.com",
      "data_server_list" :
      [
        {
          "cluster" : "",
          "endpoint" : ""
        }
      ],
      ...
    }
    • 如果ilogtail_config.json文件中的启动参数符合下述表格中的说明,则表示Logtail启动参数正确。

    • 如果Logtail启动参数错误,请根据下述表格修改ilogtail_config.json文件,然后重启Logtail。具体操作,请参见附录:重启Logtail。

      场景

      网络类型

      服务器为ECS,且与Project属于同一地域

      阿里云内网

      -intranet

      -intranet.log.aliyuncs.com

      其它情况

      公网

      .log.aliyuncs.com

      全球加速

      log-global.aliyuncs.com

步骤四:检查网络是否通畅

使用Logtail上传数据成功,至少需要保证Logtail所在服务器能够连通下列地址。

重要

如果使用内网,需要在地址中添加-intranet

  1. ilogtail_config.json文件中config_server_address字段指定的地址及其HTTPS版本。

  2. http://.。其中为ilogtail_config.json文件中data_server_list.endpoint字段指定的地址。

  3. http://ali--sls-admin.。其中为ilogtail_config.json文件中data_server_list.endpoint字段指定的地址。

具体的网络检查及解决方法如下:

Linux系统

  1. 登录Logtail所在的机器。

  2. 执行curl命令依次连接上述地址。

    curl xxx

    所有返回结果都为如下类似信息,说明网络畅通。

    {"Error":{"Code":"OLSInvalidMethod","Message":"The script name is invalid : /","RequestId":"5D****09"}}

    如果网络不畅通,请检查网络环境中80和443端口是否已经开放、目标地址是否被拦截以及其他网络侧的检查(例如DNS配置、安全组等)。

Windows系统

  1. 登录Logtail所在的机器。

  2. 调用telnet命令依次尝试连接上述地址。

    telnet xxx 80 # 如果是HTTPS协议,则端口号为443。

    所有返回结果都为如下类似信息,说明网络畅通。

    Trying 100*0*7*5...
    Connected to xxx.
    Escape character is '^]'.

    如果网络不畅通,请检查网络环境中80和443端口是否已经开放、目标地址是否被拦截以及其他网络侧的检查(例如DNS配置、安全组等)。

步骤五:检查Logtail所在服务器的系统时间是否正确

Linux系统

  1. 登录Logtail所在的机器。

  2. 执行date命令查看系统时间。

    Wed Dec 28 06:59:26 UTC 2022

    如果系统时间明显快于或慢于当前真实时间,请尝试如下修改。

    • 调整系统时间至真实时间。

    • 如果不能修改系统时间,请修改Logtail启动参数,即在ilogtail_config.json文件中增加配置项"enable_log_time_auto_adjust": true。修改后,需要重启Logtail。具体操作,请参见附录:重启Logtail。ilogtail_config.json文件路径说明,请参见步骤三:检查Logtail启动参数是否正确。

Windows系统

  1. 登录Logtail所在的机器。

  2. 查看桌面右下角任务栏中时间信息。

    • 调整系统时间至真实时间。

    • 如果不能修改系统时间,请修改Logtail启动参数,即在ilogtail_config.json文件中增加配置项”enable_log_time_auto_adjust”: true。修改后,需要重启Logtail。具体操作,请参见附录:重启Logtail。ilogtail_config.json文件路径说明,请参见步骤三:检查Logtail启动参数是否正确。

步骤六:检查是否已配置用户标识

如果您的服务器是与日志服务属于不同账号的ECS、其他云厂商的服务器和自建IDC时,您要通过Logtail采集该服务器日志,需在服务器上安装Logtail后,手动配置日志服务所在阿里云账号ID为用户标识,表示该账号有权限通过Logtail采集该服务器日志。更多信息,请参见配置用户标识。

重要

必须是阿里云账号ID(主账号ID)。如何获取,请参见获取日志服务所在的阿里云账号ID。

您可以通过环境变量ALIYUN_LOGTAIL_USER_ID或指定目录下的用户标识文件判断是否已配置用户标识。如果已通过环境变量设置用户标识,则以环境变量配置方式为准。因此,您需要先执行如下命令,确认是否已通过环境变量指定用户标识。

echo $ALIYUN_LOGTAIL_USER_ID
  • 如果返回结果中包含当前Project所属阿里云账号ID,则说明已正确配置用户标识。

  • 如果返回结果非空但未包含当前Project所属阿里云账号ID,则需修改该环境变量的值为Project所属的阿里云账号ID或在现有值后面增加Project所属的阿里云账号ID,以半角逗号(,)分隔。

  • 如果返回结果为空,则您需要查看指定路径中是否已有用户标识文件。

    说明

    用户标识文件路径如下:

    • Linux系统:/etc/ilogtail/users/

    • Windows系统:C:\LogtailData\users\

    • 如果指定路径下无用户标识文件或用户标识文件配置错误,请按照如下方法解决。

      • Linux系统:执行cd /etc/ilogtail/users/ && touch 命令,创建用户标识文件。其中为Project所属的阿里云账号ID。

      • Windows系统:进入C:\LogtailData\users\目录,创建一个名为的空文件。其中为Project所属的阿里云账号ID。

    • 如果指定路径下存在以当前Project所属的阿里云账号ID命名的文件,则说明用户标识配置正确。

重要

完成上述修改后,必须重启Logtail。具体操作,请参见附录:重启Logtail。

步骤七:如果是用户自定义标识机器组,检查是否已配置自定义标识

您可以通过环境变量ALIYUN_LOGTAIL_USER_DEFINED_ID或指定目录下的user_defined_id文件判断是否已在服务器上配置用户自定义标识。如果已通过环境变量设置用户自定义标识,则以环境变量配置为准。因此,您需要先执行如下命令,确认是否已通过环境变量指定用户自定义标识。

echo $ALIYUN_LOGTAIL_USER_DEFINED_ID
  • 如果返回结果中包含您在机器组中设置的用户自定义标识,则说明已正确配置用户自定义标识。

  • 如果返回结果非空但未包含您在机器组中设置的用户自定义标识,则您需要修改该环境变量的值为您在机器组中设置的用户自定义标识或在现有值后增加机器组的用户自定义标识,以半角逗号(,)分隔。

  • 如果返回结果为空,您需要查看是否存在user_defined_id文件或该文件中是否已配置用户自定义标识。

    说明

    user_defined_id文件路径如下:

    • Linux系统:/etc/ilogtail/user_defined_id

    • Windows系统:C:\LogtailData\user_defined_id

    • 如果user_defined_id文件不存在,则新增一个user_defined_id的文件,然后在文件中输入机器组的用户自定义标识。具体操作,请参见配置用户自定义标识。

    • 如果user_defined_id文件中无用户自定义标识或自定义标识配置错误,则在文件中新增一行,然后输入机器组的用户自定义标识。具体操作,请参见配置用户自定义标识。

    • 如果user_defined_id文件已包含您在机器组中设置的用户自定义标识,则说明用户自定义标识配置正确。

重要

完成上述修改后,必须重启Logtail。具体操作,请参见附录:重启Logtail方法。

后续步骤

经过上述排查后,仍未解决问题,请提工单。

附录:重启Logtail

Linux系统

  1. 登录Logtail所在的机器。

  2. 运行如下命令。

    sudo /etc/init.d/ilogtaild restart

Windows系统

  1. 登录Logtail所在的机器。

  2. 打开运行窗口,输入services.msc

  3. 重启LogtailDaemon服务(Logtail 1.0.0.0及以上版本)或LogtailWorker服务(Logtail 0.x.x.x版本)。

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/160538.html

(0)
上一篇 2023年12月10日 上午2:29
下一篇 2023年12月10日 上午2:31
详情页2

相关推荐

  • 阿里云负载均衡DescribeVServerGroupAttribute – 查询服务器组的详细信息-云淘科技

    查询服务器组的详细信息。 调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。 调试调试授权信息下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下: 操作:是指具…

    阿里云负载均衡 2023年12月10日
  • 阿里云日志服务SLSLogtail诊断-云淘科技

    日志服务提供Logtail诊断功能,帮助您排查Logtail采集的异常问题。本文介绍Logtail诊断的操作步骤。 前提条件 已使用Logtail采集日志。具体操作,请参见数据采集。 已开通目标Logtail配置所在Project的重要日志采集功能。具体操作,请参见开通服务日志。 背景信息 Logtail诊断包括高级版诊断和基础版诊断,具体说明如下: 高级版…

    阿里云日志服务SLS 2023年12月10日
  • 阿里云负载均衡RemoveServersFromServerGroup – 移除后端服务器-云淘科技

    从网络型负载均衡服务器组中移除后端服务器。 调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。 调试调试授权信息下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如…

    阿里云负载均衡 2023年12月10日
  • 阿里云日志服务SLSUpdateMachineGroup-云淘科技

    调用UpdateMachineGroup接口修改机器组配置信息。 接口说明 Host由Project名称和日志服务Endpoint构成,您需要在Host中指定Project名称。 已创建并获取AccessKey。更多信息,请参见访问密钥。 阿里云账号AccessKey拥有所有API的访问权限,风险很高。强烈建议您创建并使用RAM用户进行API访问或日常运维。…

    阿里云日志服务SLS 2023年12月10日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云日志服务SLS采集客户端数据的高可用方案-云淘科技

    本文介绍日志服务从客户端采集数据的两个高可用方案,包括双写方案和数据加工复制+写入切换方案。 背景 在单集群环境下,日志服务存储采用三副本机制来保证数据的可靠性,即每份数据都有3个副本,副本按照一定的分布式存储算法保存在集群的不同机器中。通过该机制,存储系统确保3个数据副本分布在不同服务器的不同物理磁盘上,单个硬件设备的故障不会造成数据丢失,同时确保3个数据…

    阿里云日志服务SLS 2023年12月10日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。