详情页标题前

阿里云大数据开发治理平台 DataWorks数据分析场景实践-云淘科技

详情页1

DataWorks为您提供在线数据分析能力,以下通过对MaxCompute的公共数据集进行分析为例,为您介绍如何端到端操作实践在线数据分析。

实践背景与目的

本实践的操作流程与目的:

  1. 环境准备:进行实践操作前所需的环境,便于了解数据查询分析所需的环境要求。

  2. 数据查询:以查询MaxCompute的公共数据集的两张表的数据为例,示例数据查询的操作入口和流程。

  3. 数据分析与分享:以典型的排序分析和透视分析为例,示例web excel的线上数据分析能力与操作入口。

环境准备

本实践以使用同一地域的MaxCompute和DataWorks进行数据查询与分析为例,在进行实践操作前,您需提前通同一地域的MaxCompute与DataWorks,并创建好用于实践操作的DataWorks项目空间与MaxCompute项目,做好数据查询分析前的环境准备。如果您已有符合要求的环境,可跳过此步骤。

  1. 开通MaxCompute与DataWorks。

    1. 登录并进入阿里云MaxCompute产品首页,单击立即开通

    2. 选择开通地域等开通产品的信息,勾选服务协议,根据界面引导完成付款开通。

  2. 创建DataWorks工作空间与MaxCompute项目。

    1. 创建MaxCompute项目,详情请参见创建MaxCompute项目。

    2. 创建DataWorks工作空间并绑定MaxCompute项目,详情请参见创建工作空间、为工作空间绑定引擎。

数据查询

此部分实践操作会以使用MaxCompute公共数据集为例,示例如何通过DataWorks的在线分析服务进行数据查询操作。

MaxCompute的公共数据集中提供了多种公共数据用于验证功能操作,本实践使用2017年电影票房相关信息表(maxcompute_public_data.dwd_product_movie_basic_info和maxcompute_public_data.ods_product_movie_box),统计当年春节档期每日票房排行榜。阿里云大数据开发治理平台 DataWorks数据分析场景实践-云淘科技

  • maxcompute_public_data.dwd_product_movie_basic_info:电影基本信息,包含影片名、导演、编剧、主演、影片类型等基础信息。

  • maxcompute_public_data.ods_product_movie_box:电影票房基本信息,包含影片名、当日票房、累计票房等信息。

统计当年春节档期每日票房排行榜时,需关联上述两张表获取信息。操作步骤与示例代码如下。

  1. 在MaxCompute控制台单击查询编辑,进入DataWorks的数据分析的查询模式页面。

  2. 选择数据源。

    选择MaxCompute数据源类型,工作空间选择环境准备中创建的空间。

  3. 找到公共数据集里的表maxcompute_public_data.dwd_product_movie_basic_info和maxcompute_public_data.ods_product_movie_box,了解数据表的基本内容。

    1. 展开数据集后,鼠标悬浮在字段名称上即可了解各个字段的描述。

    2. 右键数据表,单击数据预览,会随机显示20条数据进行预览。

  4. 在右侧代码编辑框中编辑代码,进行数据查询。

    本实践取2017年1月28日至2月3日作为春节假日档期,查询这期间每日上映的影片票房以及影片关键信息,并将查询结果保存为查询结果表,用于后续在线分析。

    1. 在右侧代码编辑框中编辑查询代码。

      示例代码如下。

      WITH 
          a as(select ds,moviename,sumboxoffice,DENSE_RANK() OVER (PARTITION BY ds ORDER BY CAST(sumboxoffice AS DOUBLE) DESC) AS srank,boxoffice,irank from maxcompute_public_data.ods_product_movie_box WHERE ds>='20170128' and ds='20170128' and ds<='20170203' ),
          c as (select b.movie_name,b.dirctor,b.type ,b.area, b.actors,b.movie_language from b where b.nums=1)
          select a.ds as 放映日期,a.moviename as 影片名,a.irank as 当日票房排名,a.boxoffice as 当日票房_万 ,a.srank as 总票房排名,a.sumboxoffice as 总票房_万,c.dirctor as 导演,c.type as 电影类型,c.area as 制片地区,c.actors as 主演,c.movie_language as 影片时长 from a LEFT join c on a.moviename=c.movie_name;
    2. 单击运行图标运行查询代码。

    3. 运行成功后,单击保存查询图标,保存查询代码。

      阿里云大数据开发治理平台 DataWorks数据分析场景实践-云淘科技

    4. 单击左上角的模式切换按钮,切换到分析模式后,单击右上角的保存按钮,保存结果表,便于后续分析和分享。

      阿里云大数据开发治理平台 DataWorks数据分析场景实践-云淘科技

数据分析与分享

可以通过数据分析的分析模式使用Web Excel进行一些简单的二次分析统计,并直接分享。

  1. 数据分析

    • 查看每日放映的电影当日票房排行榜阿里云大数据开发治理平台 DataWorks数据分析场景实践-云淘科技

      1. 随机选择结果集中某个单元格,单击筛选和排序功能。

      2. 选择当日票房排名列,右键选择将该列转成数值型以便对排名进行排序。

      3. 先对当日票房排名列进行升序,再对放映日期列进行降序,既可直观查看每日放映的电影当日票房排行榜。

    • 统计整个春节档期放映的影片票房分布,此操作主要用到透视功能。选择需要透视的结果列,单击透视阿里云大数据开发治理平台 DataWorks数据分析场景实践-云淘科技

      1. 行维度选择“影片名”,指标选择“当日票房(万)”,并对指标编辑将汇总方式改成sum。

      2. 选择列表使用饼图进行透视。

    您还可以根据业务需求,对数据进行更多样化的分析统计,所有统计分析结果不要忘记进行保存。

  2. 数据分享。

    保存好的图表可以通过分享功能将分析结果共享给主账号下其他子账号,被分享的子账号可以通过URL或提取码访问到该结果表。您可以根据需求指定对方是否可编辑或仅可以查看。阿里云大数据开发治理平台 DataWorks数据分析场景实践-云淘科技

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/172434.html

(0)
上一篇 2023年12月10日 下午4:21
下一篇 2023年12月10日 下午4:22
详情页2

相关推荐

  • 阿里云RDS数据库查看监控数据-云淘科技

    使用RDS PostgreSQL数据库代理时,您可以随时查看数据库代理的性能数据,了解数据库代理的负载情况,以便及时调整代理数量。 前提条件 已开通数据库代理服务,具体请参见开通并配置数据库代理服务。 操作步骤 访问RDS实例列表,在上方选择地域,然后单击目标实例ID。 在左侧导航栏单击数据库代理。 选择监控数据页签。 设置查询时间段,即可查看数据库代理的各…

    阿里云数据库 2023年12月9日
  • 阿里云日志服务SLS开通日志分析功能-云淘科技

    本文介绍如何在云安全中心控制台上开通日志分析功能。 前提条件 已开通日志服务、云安全中心服务。操作步骤登录云安全中心控制台。在左侧导航栏,选择检测响应 > 日志分析。在开通日志服务配置向导中,单击立即开通。在购买页面,选择版本并设置日志存储容量,其他参数说明请参见购买云安全中心。设置日志存储容量后,即表示开通日志分析功能。重要云安全中心基础版不支持开通…

    阿里云日志服务SLS 2023年12月10日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云日志服务SLS通知内容常见问题-云淘科技

    本文介绍通知内容相关的常见问题。 如何在通知中引用日志内容? 您可以在内容模板中选择合适的变量(labels、annotations、fire_results或results),用于在告警通知中引用日志内容。具体操作,请参见在告警通知中引用日志内容。 如何在通知中展示触发告警的日志内容? 触发告警的查询分析结果存储在fire_results变量中,因此您可通…

    阿里云日志服务SLS 2023年12月10日
  • 阿里云日志服务SLS授予RAM用户操作CloudLens for EBS的权限-云淘科技

    本文介绍如何授予RAM用户操作CloudLens for EBS的权限。 前提条件 已创建RAM用户。具体操作,请参见创建RAM用户。背景信息您可以通过如下两种方式授予RAM用户操作CloudLens for EBS的权限。 极简授权:权限较大,操作简单。 自定义权限策略:权限精细,配置复杂。 极简授权 使用阿里云账号登录RAM控制台,为RAM用户授予全部管…

    阿里云日志服务SLS 2023年12月10日
  • 阿里云日志服务SLS轨迹图-云淘科技

    本文介绍轨迹图操作步骤及案例。 简介 以高德地图为基础,通过描点和线,展示一段时间内目标在地图上的移动轨迹。目前轨迹图根据数据的不同分为经纬度和POI地址两种模式。 基本构成如下: 地图画布 点和线 时间轴 操作步骤 登录日志服务控制台。 在Project列表区域,单击目标Project。 在日志存储 > 日志库页签中,单击目标Logstore。 输入…

    2023年12月10日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。