详情页标题前

阿里云人工智能平台PAI5分钟操作EAS一键部署通义千问模型-云淘科技

详情页1

本文为您介绍如何通过EAS一键部署基于开源模型通义千问的WebUI应用,以及使用WebUI和API进行模型推理。

背景信息

通义千问-7B(Qwen-7B)是阿里云研发的通义千问大模型系列的70亿参数规模的模型。Qwen-7B是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。同时,在Qwen-7B的基础上,我们使用对齐机制开发了基于大语言模型的AI助手Qwen-7B-Chat。

前提条件

已开通PAI(EAS)后付费,并创建默认工作空间。具体操作,请参见开通PAI并创建默认工作空间。

部署通义千问模型

将通义千问模型部署为AI-Web应用服务,具体操作步骤如下。

  1. 进入PAI-EAS 模型在线服务页面。

    1. 登录PAI控制台。

    2. 在左侧导航栏单击工作空间列表,在工作空间列表页面中单击待操作的工作空间名称,进入对应工作空间内。

    3. 在页面左侧导航栏选择模型部署 > 模型在线服务(EAS),进入PAI-EAS 模型在线服务页面。

  1. PAI-EAS 模型在线服务页面,单击部署服务

  2. 部署服务页面,配置以下关键参数。

    参数

    描述

    服务名称

    自定义服务名称。本案例使用的示例值为:qwen_demo

    部署方式

    选择镜像部署AI-Web应用

    镜像选择

    选择PAI平台镜像 > modelscope-inference > 1.8.1

    环境变量

    MODEL_ID输入:qwen/Qwen-7B-Chat

    TASK输入:chat

    REVISION输入:v1.0.5

    相关配置可参考modelscope上的模型介绍。

    运行命令

    服务运行命令:python app.py

    输入端口号:8000

    资源组种类

    选择公共资源组

    资源配置方法

    选择常规资源配置

    资源配置选择

    选择GPU > ml.gu7i.c16m60.1-gu30

    说明

    本文模型推理服务需要选择GPU类型,且内存至少20G,从性价比角度推荐使用ml.gu7i.c16m60.1-gu30

    额外系统盘

    输入系统盘大小(GB):100

  3. 单击部署,进入PAI-EAS 模型在线服务,等待服务状态变更为运行中,表示模型部署完成。

    说明

    一般在5分钟能够完成部署,具体与资源紧缺程度、服务负载以及配置有关。

进行模型推理

模型部署完成后,可以使用多种方式进行模型推理。

使用WebUI进行模型推理

  1. 单击目标服务的服务方式 > 查看Web应用,打开WebUI页面。

  1. 在WebUI页面,进行模型推理验证。

阿里云人工智能平台PAI5分钟操作EAS一键部署通义千问模型-云淘科技

使用在线调试进行模型推理

  1. 单击目标服务的操作列下的在线调试,打开在线调试页面。

  1. 在请求的body输入框中输入相应的请求json,点击发送请求,在右侧调试信息窗格中查看调试结果。

    说明

    本文模型调试信息格式为list,input字段是输入内容;history字段是历史对话,每个item是长度为2的list,第一个元素是问题,第二个元素是当时的回答。

    1. 开始可以输入没有history的请求:

      {"input": "浙江的省会在哪里?"}

      服务会返回结果,并给出history字段,示例如下。

      Status Code: 200
      Content-Type: application/json
      Date: Mon, 14 Aug 2023 12:01:45 GMT
      Server: envoy
      Vary: Accept-Encoding
      X-Envoy-Upstream-Service-Time: 511
      Body: {"response":"浙江的省会是杭州。","history":[["浙江的省会在哪里?","浙江的省会是杭州。"]]}
    2. 可以将history直接带入下次请求中,实现连续对话。

      {"input": "江苏呢?", "history": [["浙江的省会在哪里?", "浙江的省会是杭州。"]]}

      服务返回结果示例:

      Status Code: 200
      Content-Type: application/json
      Date: Mon, 14 Aug 2023 12:01:23 GMT
      Server: envoy
      Vary: Accept-Encoding
      X-Envoy-Upstream-Service-Time: 522
      Body: {"response":"江苏的省会是南京。","history":[["浙江的省会在哪里?","浙江的省会是杭州。"],["江苏呢?","江苏的省会是南京。"]]}

使用API进行模型推理

您可以选择直接使用API进行调用。

  1. 服务详情页签,单击基本信息区块中查看调用信息,得到调用的公网地址和Token

    阿里云人工智能平台PAI5分钟操作EAS一键部署通义千问模型-云淘科技

  2. 在终端中,根据上面信息进行调用。

    curl -d '{"input": "江苏呢?", "history": [["浙江的省会在哪里?", "浙江的省会是杭州。"]]}' -H "Authorization: xxx" http://xxxx.com

    得到返回结果,示例如下:

    {"response":"江苏的省会是南京。","history":[["浙江的省会在哪里?","浙江的省会是杭州。"],["江苏呢?","江苏的省会是南京。"]]}

实际使用中,可以根据需求向服务发送HTTP请求,也可以参考PAI提供的SDK进行调试。Python代码调用示例:

import requests
import json

data = {"input": "你是谁?"}
response = requests.post(url='http://qwen-demo.16623xxxxx.cn-hangzhou.pai-eas.aliyuncs.com/',
              headers={"Authorization": "yourtoken"},
              data=json.dumps(data))

print(response.text)

data = {"input": "你能做什么?", "history": json.loads(response.text)["history"]}


response = requests.post(url='http://qwen-demo.16623xxxxx.cn-hangzhou.pai-eas.aliyuncs.com/',
              headers={"Authorization": "yourtoken"},
              data=json.dumps(data))

print(response.text)

使用流式方式进行模型推理

  1. 服务详情页签,单击基本信息区块中查看调用信息,得到调用的公网地址和Token

    阿里云人工智能平台PAI5分钟操作EAS一键部署通义千问模型-云淘科技

  2. 在终端中,根据上面信息执行以下Python代码发送流式请求。

    #encoding=utf-8
    from websockets.sync.client import connect
    import os
    import platform
    
    def clear_screen():
        if platform.system() == "Windows":
            os.system("cls")
        else:
            os.system("clear")
    
    
    def print_history(history):
        print("欢迎使用 Qwen-7B 模型,输入内容即可进行对话,clear 清空对话历史,stop 终止程序")
        for pair in history:
            print(f"
    User: {pair[0]}
    Qwen-7B: {pair[1]}")
    
    
    def main():
        history, response = [], ''
        clear_screen()
        print_history(history)
        with connect("", additional_headers={"Authorization": ""}) as websocket:
    
            while True:
                query = input("
    User: ")
                if query.strip() == "stop":
                    break
                websocket.send(query)
                while True:
                    msg = websocket.recv()
                    
                    if msg == '':
                        break
                    clear_screen()
                    print_history(history)
                    print(f"
    User: {query}")
                    print("
    Qwen-7B: ", end="")
                    print(msg)
                    response = msg
                    
                history.append((query, response))
    
    
    if __name__ == "__main__":
        main()

    其中:

    • :需要替换为步骤1中获取的服务访问地址,并将访问地址中前端的http替换为ws

    • :需要替换为步骤1中获取的服务Token。

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/165278.html

(0)
上一篇 2023年12月10日 上午7:16
下一篇 2023年12月10日
详情页2

相关推荐

  • 阿里云人工智能平台PAIEAS使用案例汇总-云淘科技

    本文为您介绍EAS产品使用案例相关文档入口链接汇总。 案例名称 描述 EAS快速部署AI绘画SDWebUI 介绍如何使用阿里云模型在线服务(EAS)的预置镜像,快速部署AIGC Stable Diffusion SDWebUI绘画的AI-Web应用,以及启动WebUI进行模型推理。 5分钟使用EAS一键部署ChatGLM及LangChain应用 介绍如何通过…

    阿里云人工智能平台PAI 2023年12月10日
  • 阿里云人工智能平台PAI基本概念-云淘科技

    本文从管理员视角、AI开发视角及PAI产品模块三个方面介绍涉及的基本概念。 管理员视角 名词 描述 工作空间(WorkSpace) 工作空间是PAI的顶层概念,为企业和团队提供统一的计算资源管理及人员权限管理能力,为AI开发者提供支持团队协作的全流程开发工具及AI资产管理能力。PAI工作空间和DataWorks工作空间在概念和实现上互通。 默认工作空间:默认…

    阿里云人工智能平台PAI 2023年12月10日
  • 阿里云人工智能平台PAI什么是机器学习PAI-云淘科技

    机器学习PAI(Platform of Artificial Intelligence)是阿里云人工智能平台,提供一站式的机器学习解决方案。本文为您介绍什么是机器学习PAI。 什么是机器学习 机器学习是指机器通过统计学算法对大量历史数据进行学习,进而利用生成的经验模型指导业务。目前,机器学习主要应用在以下场景: 营销类场景:商品推荐、用户群体画像或广告精准投…

    阿里云人工智能平台PAI 2023年12月10日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云人工智能平台PAIWorkQueue-云淘科技

    在大规模分布式异步训练中,您可以使用WorkQueue进行弹性数据切分,以缓解长尾效应,从而降低模型训练所需的时间。本文介绍WorkQueue的调用格式、参数及其提供的方法。同时,以文件数据源和MaxCompute表数据源为例,介绍实现数据切分的经典示例。 背景信息 在大规模分布式异步训练中,如果每个Worker读取相同数量的样本,则慢节点的训练时长会远大于…

    阿里云人工智能平台PAI 2023年12月10日
  • 阿里云人工智能平台PAI5分钟操作EAS一键部署通义千问模型-云淘科技

    本文为您介绍如何通过EAS一键部署基于开源模型通义千问的WebUI应用,以及使用WebUI和API进行模型推理。 背景信息 通义千问-7B(Qwen-7B)是阿里云研发的通义千问大模型系列的70亿参数规模的模型。Qwen-7B是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业…

    2023年12月10日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。