2026年7月9日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

GLM4-9B 介绍

发布日期:2024-06-29 11:45:09 浏览次数: 7963
作者:是海潮音

微信搜一搜,关注“是海潮音”

2024.06.05 智谱 AI 在Open Day发布 GLM-4-9B 系列开源模型

2024.06.18发布了技术报告

  • https://github.com/THUDM/GLM-4
  • ChatGLM: A Family of Large Language Models from GLM-130B to GLM-4 All Tools

GLM-4-9B 是智谱 AI 推出的最新一代预训练模型 GLM-4 系列中的开源版本。

在语义、数学、推理、代码和知识等多方面的数据集测评中, GLM-4-9B 及其人类偏好对齐的版本 GLM-4-9B-Chat 均表现出超越 Llama-3-8B 的卓越性能。

除了能进行多轮对话,GLM-4-9B-Chat 还具备网页浏览、代码执行、自定义工具调用(Function Call)和长文本推理(支持最大 128K 上下文)等高级功能。

本代模型增加了多语言支持,支持包括日语,韩语,德语在内的 26 种语言。

我们还推出了支持 1M 上下文长度(约 200 万中文字符)的 GLM-4-9B-Chat-1M 模型和基于 GLM-4-9B 的多模态模型 GLM-4V-9B。

GLM-4V-9B 具备 1120 * 1120 高分辨率下的中英双语多轮对话能力,在中英文综合能力、感知推理、文字识别、图表理解等多方面多模态评测中,GLM-4V-9B 表现出超越 GPT-4-turbo-2024-04-09、Gemini 1.0 Pro、Qwen-VL-Max 和 Claude 3 Opus 的卓越性能。

Tech Report:

Abstract

  • This report primarily focuses on the GLM-4 language series, which includes GLM-4, GLM-4-Air, and GLM-4-9B.
  • GLM-4 models are pre-trained on 10T of tokens mostly in Chinese and English, along with a small set of corpus from 24 languages, and aligned primarily for Chinese andEnglish usage.
  • The high-quality alignment is achieved via a multi-stage posttraining process, which involves supervised fine-tuning and learning from human feedback.

1. Introduction

  • GPT-3.5 series 在 GPT-3 的基础上进行改进,结合instruction tuning, supervised fine tuning (SFT), and/or reinforcement learning from human feedback (RLHF)
  • GLM (General Language Model) pretrained with an autoregressive blank-filling objective and can be finetuned on various natural language understanding and generation tasks.
    • GLM: General Language Model Pretraining with Autoregressive Blank Infilling

ChatGLM-6B(第一代)

  • 基于GLM架构,6.2B参数,结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。
  • 针对中文问答和对话进行了优化**1T 中英tokens **
  • context length of 2,048 (2K)
  • 为了方便下游开发者针对自己的应用场景定制模型,同时实现了基于 P-Tuning v2 的高效参数微调方法 使用指南) ,INT4 量化级别下最低只需 7GB 显存即可启动微调。
  • 局限性:如事实性/数学逻辑错误,可能生成有害/有偏见内容,较弱的上下文能力,自我认知混乱,以及对英文指示生成与中文指示完全矛盾的内容。
  • ChatGLM-6B 的部署与微调教程
  • ChatGLM-6B 结合 langchain 实现本地知识库 QA Bot

ChatGLM2-6B(第二代)

  • 使用了 GLM 的混合目标函数,经过了 1.4T 中英token的预训练与人类偏好对齐训练
  • 采用FlashAttention,context length 从2K扩展到 32K,并在对话阶段使用 8K 的上下文长度训练。对于更长的上下文,我们发布了 ChatGLM2-6B-32K 模型。
  • 使用Multi-Query Attention,使得inference speed增加42%
  • INT4 量化下,6G 显存支持的对话长度由 1K 提升到了 8K。
  • ChatGLM2-6B 在腾讯云部署教程
  • ChatGLM2-6B 的部署与微调教程

ChatGLM3-6B(第三代)

  • ChatGLM3-6B 的基础模型 ChatGLM3-6B-Base 采用了更多样的训练数据、更充分的训练步数和更合理的训练策略。

  • 采用了全新设计的 Prompt 格式 ,除正常的多轮对话外, 同时原生支持工具调用(Function Call)、代码执行(Code Interpreter)和 Agent 任务等复杂场景

  • 除了对话模型 ChatGLM3-6B 外,还开源了基础模型 ChatGLM3-6B-Base 、长文本对话模型 ChatGLM3-6B-32K 和进一步强化了对于长文本理解能力的 ChatGLM3-6B-128K。

  • 微调 ChatGLM3-6B 模型

ChatGLM4-9B

  • 预训练后的checkpoint,经过multi-stage post-training process (e.g., SFT, RLHF, safety alignment)主要关注中英文
  • 然后分为两个版本: GLM-4 and GLM-4 All Tools, 均支持128K的上下文长度
  • 最新的模型是 GLM-4 (0520) 和 GLM-4-Air (0605),在预训练和对齐方面均进行了升级。 GLM-4-Air 的性能与 GLM-4 (0116) 相当,但延迟和推理成本更低。
  • GLM-4 0520 能力表现接近 GPT-4 0613 and Gemini 1.5 Pro
  • GLM-4’s instruction following capacities on both prompt and instruction levels are approximately as effective as GPT-4-Turbo in both English and Chinese.
  • GLM-4 outperforms GPT-4 and matches GPT-4-Turbo across eight dimensions in AlignBench
  • for long-context tasks, the GLM-4 (128K) model matches the performance level of GPT-4 Turbo and Claude 3 Opus as measured by LongBench-Chat

GLM-4-9B

  • 在接近10T token多语言语料上进行预训练
  • context length of 8192 (8K)
  • post-trained with the same pipeline and data used for GLM-4 (0520).
  • 更少的训练计算, 效果超过 Llama-3- 8B 支持 all the functionality of All Tools in GLM-4
  • 提供GLM-4-9B-Chat-1M with 1 million (1M) context length (about 2 million Chinese characters)
微调
  • https://github.com/THUDM/GLM-4/blob/main/finetune_demo/README.md

2. ChatGLM Techniques

Pre-Training Data

  • consists of multilingual (mostly English and Chinese) documents from a mixture of different sources
  • data processing pipeline: deduplication, filtering, and tokenization
    • 使用字节级byte pair encoding (BPE) 算法 to separately learn the Chinese and multilingual tokens merge them with the tokens of the cl100k_base tokenizer in tiktoken into a unified vocabulary with a size of 150,000
    • 为了提升性能,我们将 tokenizer 的词表大小从 65k 扩充到了 150k,这一改进使得编码效率提高了 30%。
    • data quality and diversity are crucial for building effective LLMs
    • 尽管获得了经验教训和见解,但迄今为止我们尚未确定可以指导数据收集、清理和选择过程的基本原则。

Architecture

  • GLM family of LLMs is built on Transformer

  • ** No Bias Except QKV**: To increase training speed, we have removed all bias terms with the exception of the biases in Query, Key, and Value (QKV) of the attention layers. In doing so, we observed a slight improvement in length extrapolation.

  • RMSNorm and SwiGLU: 用于替换 LayerNorm and ReLU

  • Rotary positional embeddings (RoPE): We have extended the RoPE to a two-dimensional form to accommodate the 2D positional encoding in GLM.

  • Group Query Attention (GQA): 替换 Multi-Head Attention (MHA) 用于 cut down on the KV cache size during inference. Given GQA uses fewer parameters than MHA, we increased the FFN parameter count to maintain the same model size, i.e., setting dffn to 10/3 of the hidden size.

  • context length of our models was extended from 2K (ChatGLM), to 32K (ChatGLM2 and ChatGLM3), and to 128K and 1M (GLM-4).

Alignment

  • 在 SFT 中,我们发现真实的人类提示和交互(而不是基于模板或模型生成的响应)对对齐质量至关重要。虽然 SFT 在很大程度上使基础模型与人类偏好保持一致,但 RLHF 可以进一步帮助缓解响应拒绝、安全性、生成的双语标记混合以及多轮连贯性等问题。
  • 对于第一代模型(ChatGLM-6B 和 ChatGLM-130B),提示-响应对 大多由模型开发人员注释。对于后续模型,对齐数据是内部注释数据和从第三方获得的专有数据的组合,并受到相对严格的质量控制措施的约束。与现有实践 类似,指示注释者从多个维度对模型响应进行评分,包括安全性、事实性、相关性、有用性和人类偏好。

ChatGLM Techniques

  • Emergent Abilities of LLMs 在相同的预训练损失下,不同模型大小和训练标记的 LLM 产生相同的下游性能
  • LongAlign 一种全面的长上下文对齐方法。它使 GLM-4 能够处理长上下文文本(最多 128K 个标记),性能可与 Claude 2 和 GPT-4 Turbo(1106)相媲美。
  • ChatGLM-Math 利用自我批评而不是外部模型或手动注释来选择数据。
  • ChatGLM-RLHF 将 PPO 和 DPO 应用于 LLM 的实践
  • Self-Contrast为了避免需要昂贵的人类偏好反馈数据,我们开发了一种无反馈对齐策略 Self-Contrast。它利用目标 LLM 本身为其 RLHF 对齐自行生成大量负样本
  • AgentTuning 为了提高 LLM 的代理能力,我们使用 AgentInstruct 指令调整数据集开发了 AgentTurning 框架,该数据集包含代理与环境之间的高质量交互轨迹。
  • APAR 为了提高具有层次结构响应的 LLM 推理速度,我们提出了一种自并行自回归 (APAR) 生成方法。它利用指令调优来训练 LLM 来规划其(并行)生成过程并执行 APAR 生成。
  • 基准测试:我们还开发了几个开放的 LLM 基准测试,包括用于评估 LLM 作为代理的 AgentBench、用于评估 LLM 的长上下文处理性能的 LongBench 、用于测量 ChatGLM 与中文内容的对齐质量的 AlignBench、用于评估 Python 以外的编程语言中的 HumanEval 问题的 HumanEval-X ,以及用于衡量模型解决实际编程任务的能力的 NaturalCodeBench (NCB)。

GLM-4 All Tools

3. GLM-4 Capabilities


GLM-4-9B 支持包括汉语、英语、俄语、西班牙语、德语、法语、意大利语、葡萄牙语、波兰语、日语、荷兰语、阿拉伯语、土耳其语、捷克语、越南语、波斯语、匈牙利语、希腊语、罗马尼亚语、瑞典语、乌克兰语、芬兰语、韩语、丹麦语、保加利亚语和挪威语在内的 26 种语言。

4. Safety and Risks


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅