详情页标题前

阿里云日志服务SLS数据脱敏-云淘科技

详情页1

数据脱敏可以有效地减少敏感数据在加工、传输、使用等环节中的暴露,降低敏感数据泄露的风险,保护用户权益。本文介绍日志服务数据加工过程中常见的脱敏场景、对应的脱敏方法及示例。

背景信息

使用敏感数据包括手机号、银行卡号、邮箱、IP地址、AK、身份证号网址、订单号、字符串等场景中,您需要为敏感数据进行脱敏操作。在日志服务数据加工服务中,常见的脱敏方法有正则表达式替换(关键函数regex_replace)、Base64转码(关键函数base64_encoding)、MD5编码(关键函数md5_encoding)、str_translate映射(关键函数str_translate)、GROK捕获(关键函数grok)等。更多信息,请参见正则表达式函数、GROK函数和编码解码函数。

场景1:手机号脱敏

  • 脱敏方法

    日志中包含不希望被暴露的手机号,可采用正则表达式,运用regex_replace函数脱敏。

  • 示例
    • 原始日志
      iphone: 13900001234
    • 加工规则
      e_set(
          "sec_iphone",
          regex_replace(v("iphone"), r"(\d{0,3})\d{4}(\d{4})", replace=r"\1****\2"),
      )
    • 加工结果
      iphone: 13900001234
      sec_iphone: 139****1234

场景2:银行卡信息脱敏

  • 脱敏方法

    日志中包含银行卡或者信用卡信息,可采用正则表达式,运用regex_replace函数脱敏。

  • 示例
    • 原始日志
      content: bank number is 491648411333978312 and credit card number is 4916484113339780
    • 加工规则
      e_set(
          "bank_number",
          regex_replace(
              v("content"), r"([1-9]{1})(\d{14}|\d{13}|\d{11})(\d{4})", replace=r"****\3"
          ),
      )
    • 加工结果
      content: bank number is 491648411333978312 and credit card number is 4916484113339780 
      bank_number: bank number is ****8312 and credit card number is ****9780

场景3:邮箱地址脱敏

  • 脱敏方法

    日志中包含邮箱信息,可采用正则表达式,运用regex_replace函数脱敏。

  • 示例
    • 原始日志
      content: email is username@example.com
    • 加工规则
      e_set(
          "email_encrypt",
          regex_replace(
              v("content"),
              r"[A-Za-z\d]+([-_.][A-Za-z\d]+)*(@([A-Za-z\d]+[-.])+[A-Za-z\d]{2,4})",
              replace=r"****\2",
          ),
      )                            
    • 处理后数据
      content: email is username@example.com
      email_encrypt: email is ****@example.com

场景4:AK脱敏

  • 脱敏方法

    日志中包含AccessKey信息,可采用正则表达式,应用regex_replace函数。

  • 示例
    • 原始日志
      content: ak id is  and ak key is 
    • 加工规则
      e_set(
          "akid_encrypt",
          regex_replace(
              v("content"),
              r"([a-zA-Z0-9]{4})(([a-zA-Z0-9]{26})|([a-zA-Z0-9]{12}))",
              replace=r"\1****",
          ),
      )
    • 加工结果
      content: ak id is  and ak key is 
      akid_encrypt: ak id is rDhc**** and ak key is XQr1****

场景5:IP地址脱敏

  • 脱敏方法

    日志中包含IP地址信息,可同时运用regex_replace函数和grok函数,对IP地址进行正则捕获后而脱敏。

  • 示例
    • 原始日志
      content: ip is 192.0.2.10
    • 加工规则
      e_set("ip_encrypt",regex_replace(v('content'), grok('(%{IP})'), replace=r"****"))
    • 加工结果
      content: ip is 192.0.2.10
      ip_encrypt: ip is ****

场景6:身份证脱敏

  • 脱敏方法

    日志中包含身份证信息,可同时运用regex_replace函数和grok函数,对身份证号进行正则捕获后而脱敏。

  • 示例
    • 原始日志
      content: Id card is 111222190002309999
    • 加工规则
      e_set(
          "id_encrypt", regex_replace(v("content"), grok("(%{CHINAID})"), replace=r"\1****")
      )
    • 加工结果
      content: Id card is 111222190002309999
      id_encrypt: Id card is 111222****

场景7:网址脱敏

  • 脱敏方法

    对日志内容中的网址做脱敏处理,并且将脱敏的数据转成明文格式,可运用Base64编码解码函数,对网址进行转码。

  • 示例
    • 原始日志
      url: https://www.aliyun.com/sls?logstore
    • 加工规则
      e_set("base64_url",base64_encoding(v("url")))
    • 加工结果
      url: https://www.aliyun.com/sls?logstore
      base64_url: aHR0cHM6Ly93d3cuYWxpeXVuLmNvbS9zbHM/bG9nc3RvcmU=


      说明 如果想对base64_url进行解码,可以使用base64_decoding(v("base64_url"))DSL语法规则。

场景8:订单号脱敏

  • 脱敏方法

    对日志内容中的订单号做脱敏处理,同时不希望其他人能够解码,可运用MD5编码函数,对订单号进行编码。

  • 示例
    • 原始日志
      orderId: 20210101123456
    • 加工规则
      e_set("md5_orderId",md5_encoding(v("orderId")))
    • 加工结果
      orderId: 20210101123456
      md5_orderId: 9c0ab8e4d9f4eb6fbd5c508bbca05951

场景9:字符串脱敏

  • 脱敏方法

    您希望日志中的关键字符串不被暴露,可通过str_translate函数制订映射规则,对关键字符或字符串进行映射脱敏。

  • 示例
    • 原始日志
      data: message level is info_
    • 加工规则
      e_set("data_translate", str_translate(v("data"),"aeiou","12345"))
    • 加工结果
      data: message level is info
      data_translate: m2ss1g2 l2v2l 3s 3nf4

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/160115.html

(0)
上一篇 2023年12月10日
下一篇 2023年12月10日
详情页2

相关推荐

  • 阿里云日志服务SLS地理函数-云淘科技

    本文介绍地理函数的基本语法及示例。 注意 在日志服务分析语句中,表示字符串的字符必须使用单引号(”)包裹,无符号包裹或被双引号(””)包裹的字符表示字段名或列名。例如:’status’表示字符串status,status或”status”表示日志字段status。 函数名称 …

    2023年12月10日
  • 阿里云ECS云服务器DescribeDiskEvents-云淘科技

    调用DescribeDiskEvents查询云盘风险事件。 接口说明 块存储数据洞察(CloudLens for EBS)正在华东1(杭州)、华东2(上海)、华北3(张家口)、华南1(深圳)和中国(香港)地域邀测,如需使用请提交工单申请。 调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Exp…

    阿里云服务器 2023年12月9日
  • 阿里云日志服务SLS复制和分发数据-云淘科技

    日志服务支持对每一个源Logstore配置一个加工任务,实现数据复制后分发到不同Logstore。本文介绍数据复制后分发到不同Logstore的典型场景和操作方法。 场景说明 某数据分析公司需要将Logstore中的每一条数据进行复制,并根据内容分别分发到两个Logstore。对此需求,可通过日志服务数据加工的复制和分发功能完成,包括使用e_set函数设置t…

    2023年12月10日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云日志服务SLS分区(Shard)-云淘科技

    日志服务使用Shard控制Logstore或MetricStore的读写数据的能力,数据必定保存在某一个Shard中。 Shard范围 每个Shard均有范围,为MD5左闭右开区间[BeginKey,EndKey)。每个Shard范围不会相互覆盖,且属于整个MD5范围内[00000000000000000000000000000000,fffffffffff…

    阿里云日志服务SLS 2023年12月10日
  • 阿里云对象存储OSS日志转存-云淘科技

    访问OSS的过程中会产生大量的访问日志。您可以通过日志转存功能将这些日志按照固定命名规则,以小时为单位生成日志文件写入您指定的存储空间(Bucket)。对于已存储的日志,您可以通过阿里云日志服务或搭建Spark集群等方式进行分析。 注意事项 如果生成日志的源Bucket有地域属性,则存储日志的目标Bucket与源Bucket可以相同也可以不同,但是必须属于同…

    阿里云对象存储 2023年12月10日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。