详情页标题前

阿里云大数据开发治理平台 DataWorks数据治理中心概述-云淘科技

详情页1

数据治理中心可自动发现平台使用过程中数据存储、任务计算、代码开发、数据质量及安全等维度存在的问题,并通过健康分量化评估,从全局、工作空间、个人等多个视角,以治理报告及排行榜呈现治理成果,帮助您高效达成治理目标。同时,提供任务资源消耗明细、费用预估等功能,帮助您有效控制各类资源费用。

使用限制

  • 版本限制

    目前仅支持DataWorks企业版及以上版本使用数据治理中心。DataWorks各版本介绍,详情请参见DataWorks各版本详解;购买DataWorks,详情请参见购买指引。

  • 地域限制

    目前仅支持华北2(北京政务云)、华东2(上海金融云)、华东2(上海)、华东1(杭州)、华北2(北京)、华南1(深圳)、西南1(成都)、中国(香港)、新加坡、美国(硅谷)、德国(法兰克福)、印度尼西亚(雅加达)地域使用数据治理中心。

  • 权限限制

    • 使用数据治理中心的用户角色主要分为空间管理员和普通用户,其权限限制如下。

      角色

      权限说明

      相关参考

      空间管理员

      可使用工作空间视角查看治理评估报告。如您需使用该视角查看某工作空间的治理评估报告,需被授权为该空间的空间管理员。

      • 授权操作,详情请参见添加空间成员并管理成员角色权限。

      • 查看治理评估报告,详情请参见查看治理评估报告。

      普通用户

      数据治理工作中实际处理待治理问题的整改人员,可使用个人视角查看检查项事件及治理项问题,并执行整改操作。如您需整改租户下存在的问题,则需被授权为该空间的成员。

      说明

      通常,除阿里云主账号和具有AliyunDataWorksFullAccess权限的RAM用户外,其他租户内成员默认均为普通用户。

      授权操作,详情请参见添加空间成员并管理成员角色权限。

    • 目前仅支持阿里云主账号或具有AliyunDataWorksFullAccess权限的RAM用户(即子账号)使用数据治理中心的全部功能。部分功能对普通用户受限使用,如您需使用数据治理中心的全部功能,则可授予RAM用户该权限,授权详情,请参见为RAM用户授权DataWorks相关管理权限。

  • 数据源限制

    目前仅支持MaxCompute、E-MapReduce数据源使用数据治理中心。

数据治理逻辑

数据治理问题检测包括数据开发任务提交发布前的检查项检测,及提交发布后的治理项检测,帮助您全方位管控当前数据存在的待治理问题。当触发检测项后,若校验不通过,则会生成相应事件(严重问题将阻塞开发流程),您需通过治理中心查看并处理该事件问题,直至校验通过后,该任务才可执行后续步骤。数据治理逻辑如下图所示。阿里云大数据开发治理平台 DataWorks数据治理中心概述-云淘科技DataWorks的工作空间分为标准模式和简单模式,不同模式工作空间下任务的开发流程存在一定差异。本文以标准模式工作空间的开发流程示例。实际流程请根据您使用的工作空间模式为准。不同模式工作空间的通用开发流程,详情请参见任务开发流程。

  • 检查项检测。

    用于提交发布前的管控治理,主要校验规范性问题。在进行数据开发前,可通过检查项对数据开发功能相关的约束进行检查,当检查出存在不符合约束规范的内容时,系统会生成影响开发流程正常执行的问题事件。您可基于该事件处理暴露的问题,以便数据开发流程可以正常执行。

  • 治理项检测。

    用于提交发布后的管控治理。可使用数据治理中心的治理功能,通过全局视角个人视角工作空间视角,查看对应的待治理项。数据治理人员可以基于暴露的待治理项,快速发现并解决存在的问题,推进团队内的数据治理目标。

相关概念

  • 检查项:用于任务提交、发布等环节的事前检查,在开发流程中检测不符合数据规范的内容,生成影响开发流程正常执行的问题事件,约束、管理开发流程。

    例如,检查项可以配置为禁止使用select*语句,不允许通过create table语句创建表等。

  • 检查项事件:检查项检测出的影响开发流程正常执行的问题事件。

  • 治理项:用于任务提交、发布后的分析环节,检测系统存在的待治理优化问题。治理项包括强治理项和可选治理项,强治理项默认全局开启,且不可更改,可选治理项可根据需求选择是否启用。

    例如,治理项可以配置为任务运行时间超长、连续出错节点、无人访问叶子节点、空跑节点等。

  • 治理项问题:治理项检测出的待治理优化问题。

  • 治理方案模板:数据治理中心提供的统一模板,配置了常见的检查项及治理项,默认为启用状态。您可直接使用该模板检测问题数据,若模板的配置项无法满足需要,则也可自定义检查项及治理项。

  • 健康分:基于治理项,按照系统预先定义的模型计算得出,用于评估治理成效。

  • 治理单元:由一个或多个工作空间组成,用于集中统计指定工作空间的整体健康分、治理项问题和检查项事件。

  • 知识库:数据治理中心提供的,针对常见检查项事件及治理项问题给出的解决方案。

数据治理流程

数据治理流程如下图所示。阿里云大数据开发治理平台 DataWorks数据治理中心概述-云淘科技

  1. 配置治理工具。

    • 启用治理方案模板并自定义检测项。

      细分操作

      操作目的

      操作指导链接

      启用治理模板

      数据治理中心的整体治理操作是基于治理方案模板执行的,模板中包含了预先配置的检查项及治理项,在治理前期,您需要开启治理方案模板后,才能进行后续治理操作。当前仅支持使用默认模板,且该模板默认为启用状态。

      查看治理方案模板

      自定义检查项

      若模板中提供的检查项不符合您的需要,则可根据实际情况自定义检查项。

      • 注册检查项。

        如果您希望对扩展程序进行检测,则可以注册检测扩展程序的检查项,注册后,数据治理中心后续会检测扩展程序触发的检查项事件。

      • 关闭检查项。

        如果模板中包含您无需使用的检查项,则您可以配置指定工作空间停止使用目标检查项,停止使用后,该检查项对目标工作空间不生效,数据治理中心后续将不会检测目标工作空间中该检查项触发的检查项事件。

      配置检查项

      自定义治理项

      如果模板中包含您无需使用的治理项,则可设置排除规则,定义指定治理项在目标工作空间中不启用。排除治理项后,数据治理中心将不会检测该工作空间下对应的治理项问题。同时,在待治理列表中也不会展示该治理项问题。

      说明

      数据治理中心仅支持停用可选治理项,不支持停用强治理项,并且不支持新建治理项。

      配置治理项

    • 配置治理单元(可选)。

      DataWorks通常包含较多的工作空间,您可采用治理单元,按照业务划分,将一个或多个目标工作空间统一管理,集中统计该单元下所有工作空间的整体健康分、治理项问题及检查项事件。配置治理单元,详情请参见配置治理单元。

    • 配置消息通知(可选)。

      如果您希望将待解决的治理问题通过系统消息、邮件、钉钉群消息、Webhook等方式定期发送至指定人员,方便及时查看并处理,则可配置消息通知。配置详情,请参见配置消息通知。

  2. 启动检查并处理待治理问题。

    • 任务提交发布前检测。

      通过触发检查项进行检测。实现数据开发任务在提交发布环节,进行检查项触发检测、生成检查项事件、查看并处理检查项事件等主要流程,操作详情请参见处理检查项事件。

    • 任务提交发布后检测。

      通过触发治理项进行检测。实现数据开发提交发布后,进行治理项触发检测、生成治理项问题、查看并处理治理项问题等主要流程,操作详情请参见处理治理项问题。

    • 治理工具箱专项检查。

      您可通过治理工具箱,对目标任务或表进行全方位查看并检测相关治理问题,精准完成任务或表的治理操作,详情请参见全景查看任务、全景查看表。

    此过程,若检测出无效问题,则可根据需要将该类问题添加至白名单或进行下线。详情请参见无效问题添加白名单、下线无效任务。

  3. 选择分析视角。

    • 基于使用场景:DataWorks提供数据生产、数据使用、数据管理等多维视角,助力您分析数据治理情况,高效进行数据治理工作。详情请参见全景视角。

    • 基于合理利用资源的目的:DataWorks提供消费和任务运行情况、MaxCompute表的数量及存储情况、资源使用概况及明细,助力数据开发者及管理者查看和分析工作空间的整体资源情况,为合理使用整体资源做辅助判断。详情请参见透视分析。

  4. 查看治理成效。

    待治理问题处理完成后,您可以进入治理评估页面,通过治理评估报告或治理排行榜,从不同视角查看已执行的治理操作所取得的治理成效。您可以通过分析治理结果,快速识别治理项问题较多的维度及问题类别,推动治理工作的解决落地,达成治理目标。查看治理结果,详情请参见查看治理结果。

    数据治理中心是基于治理项,按照定义的健康分模型进行量化评估,最终通过治理评估报告及治理排行榜中的健康分来体现当前所取得的治理成效,健康分越高,治理成效越好。健康分相关内容,详情请参见量化评估:健康分。

量化评估:健康分

健康分是依据数据资产在数据生产、数据流通及数据管理中的用户行为、数据特性、任务性质等元数据,使用数据处理及机器学习等技术,对各类型数据进行综合处理和评估,通过个人、工作空间维度客观呈现数据资产状态的综合分值。在数据治理中,健康分体系依托不同元数据,建设了“存储、计算、研发、质量和安全”等五大健康度领域,并构建“存储健康分、计算健康分、研发健康分、质量健康分和安全健康分”五大健康分指标。阿里云大数据开发治理平台 DataWorks数据治理中心概述-云淘科技

健康分的取值范围为0至100,分值越大表示数据资产的健康度越好,较高的健康度可以帮助您更放心、高效、稳定的使用数据,保障数据生产和业务运转。数据治理中心基于治理项,按照定义的健康分模型进行量化评估,最终通过健康分的形式来体现当前账号的治理成效,健康分越高,治理成效越好。数据治理评估等级和健康分的对应关系如下。

等级

健康分

优秀

【90,100】

良好

【75,90)

及格

【60,75)

需改进

【30,60)

极差

【0,30)

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/172493.html

(0)
上一篇 2023年12月10日 下午4:33
下一篇 2023年12月10日
详情页2

相关推荐

  • 腾讯云裸金属云服务器概述

    迁移任务用于进行物理机间的操作系统与数据迁移,在符合迁移条件的情况下,实现透明化的迁移工作,迁移完成后,除资源 ID(cpm-XXXXXX)发生变化,以及解绑 LB/EIP 外,目标服务器将继承原服务器的其它配置信息(如网络配置等)与数据。 核心流程 迁移任务的整体流程分为两大环节,依次进行:发起迁移n请您由物理机页面,选定源服务器与目标服务器,启动迁移任务…

    2023年12月9日
  • 阿里云日志服务SLS产品架构-云淘科技

    本文介绍日志服务的架构。 日志服务的架构如下图所示: 数据来源 日志服务支持采集开源软件、服务器与应用、阿里云产品、标准协议、移动端、物联网等多种来源的数据。 日志服务 数据类型 日志服务为Log、Metric、Trace等数据提供大规模、低成本、实时的平台化服务。更多信息,请参见日志(Log)、时序数据(Metric)、链路数据(Trace)。 功能特性 …

    阿里云日志服务SLS 2023年12月10日
  • 阿里云大数据开发治理平台 DataWorks数据开发概述-云淘科技

    DataWorks数据开发(DataStudio)模块用于定义周期调度任务的开发及调度属性,与运维中心配合使用,面向各引擎(MaxCompute、Hologres、EMR等)提供可视化开发主界面,支持智能代码开发、多引擎混编工作流、规范化任务发布等能力,帮助您轻松构建离线数仓、实时数仓与即席分析系统,保证数据生产的高效稳定。 进入数据开发 登录DataWor…

    2023年12月10日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云大数据开发治理平台 DataWorks配置消息通知-云淘科技

    DataWorks支持您根据业务需要,将治理工作台 > 治理项问题页面待解决的治理项问题以通知的形式,通过系统提示、邮件、钉钉群消息等发送给指定人员,方便及时查看并处理。本文为您介绍如何创建定期通知。 使用限制 仅租户管理员或拥有AliyunDataWorksFullAccess权限的RAM用户可以使用全局视角新增定期通知。权限设置详情请参见数据治理中…

    2023年12月10日
  • 阿里云容器服务ACK什么是容器服务 Serverless 版-云淘科技

    本文介绍阿里云容器服务 Serverless 版的产品简介、核心优势、与ACK集群对比、应用场景、核心功能等信息,帮助您快速了解ACK Serverless集群。 产品简介 容器服务 Serverless 版是阿里云推出的无服务器Kubernetes容器服务。在容器服务 Serverless 版提供的ACK Serverless集群中,您无需购买节点即可直接…

    2023年12月10日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。