详情页标题前

阿里云云原生大数据计算服务 MaxComputeSuperset连接MaxCompute-云淘科技

详情页1

MaxCompute支持您将MaxCompute项目数据接入Superset,帮助您快速、轻量、直观地探索和可视化分析数据。本文为您介绍如何通过PyODPS连接Superset和MaxCompute项目,并进行可视化数据分析。

背景信息

Apache Superset是一个现代数据探索和可视化平台,具有丰富的从简单的折线图到高度详细的地理空间图的图表形态。更多Superset信息,请参见Superset。

前提条件

在执行操作前,请确认您已满足如下条件:

  • 已创建MaxCompute项目。

    更多创建MaxCompute项目操作,请参见创建MaxCompute项目。

  • 已获取可访问MaxCompute项目的AccessKey ID和AccessKey Secret。

    您可以进入AccessKey管理页面获取AccessKey ID和AccessKey Secret。

  • 已安装Superset。

    您可以按照Superset官方资料安装,请参见安装Superset。您还可以通过Docker方式安装Superset并按照官方资料执行额外步骤,请参见添加驱动(Docker)。

    本文中的Superset示例版本为v1.1.0。

  • 已安装或更新v0.10.7及以上版本的PyODPS。

    建议使用Python 3安装PyODPS,更多安装操作,请参见安装PyODPS。

    本文中的PyODPS示例版本为v0.10.7。

步骤一:连接Superset和MaxCompute

  1. 启动Superset,进入Superset界面。

    更多启动操作信息,请参见启动Superset。

  2. 在顶部菜单栏,选择Data > Databases后,在右侧单击+DATABASE

    阿里云云原生大数据计算服务 MaxComputeSuperset连接MaxCompute-云淘科技

  3. 在数据源配置界面填写下表所列参数信息。

    阿里云云原生大数据计算服务 MaxComputeSuperset连接MaxCompute-云淘科技

    参数

    说明

    DATABASE NAME

    新建数据连接的名称,用于在系统中区分不同数据库的连接。

    SQLALCHEMY URI

    连接MaxCompute项目的SQLAlchemy连接串。格式为odps://:@/?endpoint=。配置时删除符号。参数说明如下:

    • accesskey_id:必填。具备目标MaxCompute项目访问权限的AccessKey ID。

      您可以进入AccessKey管理页面获取AccessKey ID。

    • accesskey_secret:必填。AccessKey ID对应的AccessKey Secret。

      您可以进入AccessKey管理页面获取AccessKey Secret。

    • :必填。待连接的目标MaxCompute项目名称。

      此处为MaxCompute项目名称,非工作空间名称。您可以登录MaxCompute控制台,左上角切换地域后,即可在项目管理页面查看到具体的MaxCompute项目名称。

    • :必填。MaxCompute项目所属区域的Endpoint。

      各地域的Endpoint信息,请参见Endpoint。

    如果您需要启用查询加速功能,需要在SQLAlchemy连接串后增加如下参数。

    参数

    取值

    说明

    interactive_mode

    true

    查询加速功能总开关。

    reuse_odps

    true

    可选。启用强制复用连接模式,建议开启。Superset默认对每个SQL请求强制重新创建连接,启用此模式后可以更方便地创建连接。

    fallback_policy

    • unsupported

    • upgrading

    • noresource

    • timeout

    • generic

    • default

    • all

    可选。控制查询加速失败时的回退行为。格式为,...。支持的policy如下:

    • unsupported:不支持查询加速功能时,回退到离线模式。

    • upgrading:升级过程中回退到离线模式。

    • noresource:资源不足时回退到离线模式。

    • timeout:连接超时回退到离线模式。

    • generic:发生未知错误时回退到离线模式。

    • default:等同于同时指定unsupported、upgrading、noresource和timeout。如果SQLAlchemy连接串中未指定fallback_policy,则此项为默认值。

    • all:将在所有情况下回退到离线模式。

    基于上述解释,打开查询加速功能、启用强制复用连接模式、在查询加速功能尚未支持、升级中和资源不足时回退到离线模式的SQLAlchemy连接串示例为:odps://:@/?endpoint=&interactive_mode=true&reuse_odps=true&fallback_policy=unsupported,upgrading,noresource

  4. 单击TEST CONNECTION,右下角出现提示 Connection looks good!时代表可以连接成功,单击ADD即可将MaxCompute项目添加至Superset。

    阿里云云原生大数据计算服务 MaxComputeSuperset连接MaxCompute-云淘科技

步骤二:使用Superset查询及分析数据

完成数据源配置后,您可以通过添加数据集,对特定表进行查询和可视化分析。您可以执行如下操作,更多操作请参见Superset帮助。

  • 查看所有表

    在Superset界面的顶部菜单栏,选择Data > Datasets后,在右侧单击+DATASET。在Add dataset对话框选择您创建的Database(数据连接)、Schema(MaxCompute项目名称)即可查看所有表信息。

    阿里云云原生大数据计算服务 MaxComputeSuperset连接MaxCompute-云淘科技

  • 查看表结构

    在Superset界面的顶部菜单栏,选择Data > Datasets后,在右侧单击+DATASET。在Add dataset对话框选择您创建的Database(数据连接)、Schema(MaxCompute项目名称)及Table(表)后,单击ADD即可查看表结构信息。

    阿里云云原生大数据计算服务 MaxComputeSuperset连接MaxCompute-云淘科技

  • 查看表数据

    您可以通过SQL编辑器输入并运行SQL脚本,即可查看表数据信息。

    阿里云云原生大数据计算服务 MaxComputeSuperset连接MaxCompute-云淘科技

  • 可视化分析数据

    Datasets界面,您可以单击目标表后,选择图表类型并配置属性,即可根据实际业务诉求开展数据分析。

    阿里云云原生大数据计算服务 MaxComputeSuperset连接MaxCompute-云淘科技

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/160100.html

(0)
上一篇 2023年12月10日
下一篇 2023年12月10日
详情页2

相关推荐

  • 阿里云日志服务SLS内容模板变量-云淘科技

    日志服务按照内容模板中定义的内容给您发送告警内容。本视频介绍内容模板的基本信息和相关操作。 内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家阿里云企业补贴进行中: 马上申请腾讯云限时活动1折起,即将结束: 马上收藏同尘科技为腾讯云授权服务中心。 购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

    阿里云日志服务SLS 2023年12月10日
  • 阿里云大数据开发治理平台 DataWorksLindorm数据源-云淘科技

    DataWorks数据集成支持使用Lindorm Reader和Lindorm Writer插件读取和写入Lindorm双向通道的功能,本文为您介绍DataWorks的Lindorm数据读取与写入能力。 使用限制 Lindorm不需要在DataWorks上配置数据源,可直接使用脚本模式配置任务,通过Lindorm Reader和Lindorm Writer插…

  • 阿里云RDS数据库使用pg_restore恢复逻辑备份文件数据-云淘科技

    本文介绍如何使用pg_restore命令将逻辑备份文件(.dump文件)中的数据恢复到RDS PostgreSQL实例或本地PostgreSQL数据库中。 说明 对于少量的数据,您可参考本文使用逻辑备份进行快速恢复,例如恢复某个表的数据。对于大量的数据,建议您使用全量物理备份来恢复数据到新的实例中,然后通过数据传输服务DTS将数据迁移回原有实例。 更多数据恢…

    2023年12月10日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 帮忙看一个大数据计算MaxCompute bug,会出现两条数据?-云小二-阿里云

    帮忙看一个大数据计算MaxCompute bug,我使用md5进行加密一个字符串的时候,会出现两条数据?以下为我的logview:http://logview.odps.aliyun.com/logview/?h=http://service.cn.maxcompute.aliyun-inc.com/api&p=pharmcube_pro&i…

    阿里云 2023年12月31日
  • 阿里云日志服务SLS术语表-云淘科技

    本文介绍日志服务所涉及的术语。 基础资源 术语 说明 项目(Project) 项目是日志服务的资源管理单元,是进行多用户隔离与访问控制的主要边界。更多信息,请参见项目(Project)。 日志库(Logstore) 日志库是日志服务中日志数据的采集、存储和查询单元。更多信息,请参见日志库(Logstore)。 时序库(MetricStore) 时序库是日志服…

    阿里云日志服务SLS 2023年12月10日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。