详情页标题前

腾讯云容器服务使用 TKE 快速部署 ChatGLM同尘科技

详情页1

背景介绍

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有62亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需6GB显存)。ChatGLM-6B 使用了和 ChatGPT 相似的技术,针对中文问答和对话进行了优化。经过约1TB标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持。在开源的中文大模型中,ChatGLM-6B 是非常不错的选择。最近,来自 LMSYS Org(UC 伯克利主导)的研究人员发起的大语言模型版排位赛中,ChatGLM 虽然只有60亿参数,但依然冲进了前五,只比130亿参数的 Alpaca 落后了23分。基于或使用了 ChatGLM-6B 的开源项目如下:langchain-ChatGLM:基于 langchain 的 ChatGLM 应用,实现基于可扩展知识库的问答。闻达:大型语言模型调用平台,基于 ChatGLM-6B 实现了类 ChatPDF 功能。chatgpt_academic:支持 ChatGLM-6B 的学术写作与编程工具箱,具有模块化和多线程调用 LLM 的特点,可并行调用多种 LLM。glm-bot:将 ChatGLM 接入 Koishi 可在各大聊天平台上调用 ChatGLM 话题。

部署步骤

通过控制台创建。

准备集群

1. 开通并创建 TKE 集群,操作步骤详情可参见 创建容器服务集群。如下图所示:

腾讯云容器服务使用 TKE 快速部署 ChatGLM同尘科技


2. 在创建集群时,集群选择托管类型。由于 ChatGLM-6B 的 GPU 版本最少需要14G显存,因此 Worker 节点选择 V100 GPU 节点,型号为 GN10Xp.2XLARGE40,系统盘空间为100GB。如下图所示:

腾讯云容器服务使用 TKE 快速部署 ChatGLM同尘科技


3. 根据业务部署时对 GPU 的共享需求,可以选择并打开 qGPU 选项。关于 qGPU 的使用方法,可参见容器服务使用 qGPU。4. 配置完毕后,确认选项及扩展组件无误,单击确认

创建应用

使用控制台创建 Deployment

1. 在 容器服务控制台 中,选择集群 ID,进入集群详情页。2. 选择工作负载 > Deployment,在 Deployment 页面单击新建。3.新建 Deployment 中,参考以下信息开始创建 ChatGLM 应用。

腾讯云容器服务使用 TKE 快速部署 ChatGLM同尘科技


实例内容器中,名称:填写 chatglm-6b。镜像:填写 ccr.ccs.tencentyun.com/chatglm/chatglm-6b:v1.2。CPU/内存限制:由于 ChatGLM-6B 的资源需要主要是 GPU,因此 CPU 和内存可以按需设置。GPU 资源:设置为1个,GPU 类型选择 Nvidia。容器端口:端口填写7860。运行命令:分别添加 python3web_demo.py。如下图所示:

腾讯云容器服务使用 TKE 快速部署 ChatGLM同尘科技


4.基本信息中,实例数量选择手动调节,并设置为1个。如下图所示:

腾讯云容器服务使用 TKE 快速部署 ChatGLM同尘科技


5. 为了让外部可访问,在访问设置中,您可参考以下信息进行设置。服务访问方式:选择公网 LB 访问。端口映射:将容器端口和服务端口都填写为7860。

腾讯云容器服务使用 TKE 快速部署 ChatGLM同尘科技


服务访问方式:选择公网 LB 访问。端口映射:将容器端口和服务端口都填写为7860。6. 设置完成后,单击创建 Deployment,等待 Pod Ready。需注意,由于镜像大小为25GB,因此需要等待一段时间才能完成部署,大致需要等待半小时左右。7. 选择服务与路由 > Service,在页面上获取项目的公网 IP。如下图所示:

腾讯云容器服务使用 TKE 快速部署 ChatGLM同尘科技

在浏览器中输入 http://IP:7860,即可访问。

腾讯云容器服务使用 TKE 快速部署 ChatGLM同尘科技



使用 YAML 创建 Deployment

您也可以使用以下 YAML 配置直接创建 Deployment:

apiVersion: apps/v1kind: Deploymentmetadata:  name: chatglm-6bspec:  replicas: 1  selector:    matchLabels:      app: chatglm-6b  template:    metadata:      labels:        app: chatglm-6b    spec:      containers:      - name: chatglm-6b        image: ccr.ccs.tencentyun.com/chatglm/chatglm-6b:v1.2        command:        - python3        - web_demo.py        ports:        - containerPort: 7860        resources:          limits:            nvidia.com/gpu: "1"
---
apiVersion: v1kind: Servicemetadata: name: chatglm-6b-svcspec: type: ClusterIP ports: - port: 7860 targetPort: 7860 selector: app: chatglm-6b

创建 CPU 版本应用

如果没有 GPU 硬件,ChatGLM-6B 也可以在 CPU 上进行推理,但推理速度会更慢。资源需要大概32GB内存,相比创建 GPU 版本应用,您需要注意以下两点:1. 内存资源需要32GB。2. 将 运行命令 改为 python3 web_demo.py cpu。如下图所示:

腾讯云容器服务使用 TKE 快速部署 ChatGLM同尘科技



容器服务官网1折活动,限时活动,即将结束,速速收藏
同尘科技腾讯云授权服务中心。
购买腾讯云产品享受折上折,更有现金返利。同意关联立享优惠

转转请注明出处:https://www.yunxiaoer.com/148790.html

(0)
上一篇 2023年12月9日 下午1:01
下一篇 2023年12月9日 下午1:01
详情页2

相关推荐

  • 腾讯云计算加速套件TACO KitTACO Infer 优化 Stable Diffusion 系列模型

    操作场景 本文将演示如何使用 GPU 云服务器优化 AI 绘画模型,模型范围包括以 Stable Diffusion 1.5为基础的系列模型,您可以使用 Lora 结合模型使用,支持ControlNet。TACO Infer 的加速能力优化后,端到端时延可减少约30%~50%。 操作步骤 购买 GPU 云服务器 购买实例,其中实例、存储及镜像请参见以下信息选…

    2023年12月9日
  • 腾讯云云直播COS bucket 授权给直播实现截图存储

    本文档主要介绍将腾讯云直播截图或鉴黄数据存储至腾讯云对象存储中,以实现通过存储桶(COS Bucket)存储云直播截图或鉴黄数据。首先要创建 COS Bucket ,然后通过 COS Bucket 给云直播授权,最后在直播控制台进行直播截图鉴黄设置,云直播截图或鉴黄数据即可写入指定 COS Bucket(新版控制台功能)。 创建 COS Bucket 1. …

    2023年12月9日
  • 腾讯云对象存储复制与移动对象

    简介 本文档提供关于对象的复制、移动操作相关的 API 概览以及 SDK 示例代码。简单操作 API 操作名 操作描述 PUT Object – Copy 设置对象复制(修改对象属性) 复制文件到目标路径 分块操作 API 操作名 操作描述 Initiate Multipart Upload 初始化分块复制 初始化分块复制任务 Upload Pa…

    腾讯云 2023年12月9日
  • 腾讯云对象存储图片审核

    简介 内容审核功能是由 数据万象(Cloud Infinite,CI)提供的,数据万象将处理能力与 COS SDK 完全结合,您可以直接按照本篇文档指引进行使用。说明使用内容审核服务需拥有数据万象使用权限:主账号请 单击此处 进行角色授权。子账号请参见 授权子账号接入数据万象服务 文档。本文档提供关于图片审核的相关的 API 概览以及 SDK 示例代码。 A…

    腾讯云 2023年12月9日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 腾讯云容器服务腾讯云 Prometheus 一键关联监控容器服务同尘科技

    实践背景 众所周知,Prometheus 是容器场景的最佳监控工具,但自建 Prometheus 对于运维人力有限的中小型企业而言,成本太高;对于业务发展快速的大企业又容易出现性能瓶颈。因而使用云上托管 Prometheus 已成为越来越多上云企业的第一选择。下列将为您介绍如何使用 托管 Prometheus 监控腾讯云容器服务 TKE。 前提条件 已创建腾…

    2023年12月9日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。