智谱AI GLM4发布会全解析：揭秘国产AI大模型的最新进展

AI前沿2年前 (2024)发布 wanglu852

18,995 0 0

智谱AI GLM4发布会全解析：揭秘国产AI大模型的最新进展

转：数字生命卡兹克

一、智谱AI的背景

智谱AI，是我一直非常喜欢的国内大模型公司。喜欢他们不仅因为他们学术气息浓厚，技术底蕴深，更是因为这家公司的真诚、开放的态度。前段时间他们给AI创业者提供的“Z计划”，让我感叹他们的格局。

智谱AI GLM4发布会全解析：揭秘国产AI大模型的最新进展

二、智谱AI的GLM4发布会

今天，他们终于正式召开了他们的发布会，但是这个发布会的结构还是非常“智谱”。上午发布GLM4、ALL Tools、多模态大模型CogVLM3、代码大模型CodeGeeX3、汇报技术进展，下午圆桌讨论讲干货。

1. GLM4的发布

其中，GLM4的发布是国内所有AI相关人员都在关注的重点，其意义不亚于去年大模型GPT4的发布。毕竟，中国也真的需要自己的，真正属于自己技术路线的大模型。

GLM采用的是与GPT完全不同的技术路线，基于Transformer架构的模型有三种：仅编码器架构（Encoder-only）、仅解码器架构（Decoder-only）、编码器-解码器架构（Encoder-Decoder）。GPT走的是仅解码器架构，而智谱是借了编码器-解码器架构思想走的自己的路，这也是我为什么一直很关注他们。

他们之前开源的GLM6B，在国际上掀起了多少的风浪，也相信不用我多说了。

2. GLM4发布会的三个重点

我觉得可以用3个点来总结掉：

基座模型的性能提升。
All Tools。
GLMs。

从整体上看，智谱AI毫不避讳的直接对标OpenAI，用他们的话说，我们还在不断的追赶OpenAI，追赶GPT，他们有的，我们都要有。

2.1 GLM4基座模型的性能提升

首先是基座的评分，几个比较主流的评测任务，我简单的介绍一些这些评测集的代表意义，让大家知道GLM4在哪些地方效果好，哪些地方跟GPT4还有一些差距。

智谱AI GLM4发布会全解析：揭秘国产AI大模型的最新进展

MMLU(Massive Multitask Language Understanding) ：这个测试是一个大规模多任务语言理解测试，主要评估大模型的对于知识的理解的，可以看到目前GLM4是81.5分，GPT4是86.4分，目前能达到GPT4的94%。
GSM8K (Grade School Math 8K) ：主要是测试数学能力，基本就是小学数学和初中数学水平。GLM4打到GPT4的95%。
MATH：跟GSM8K 有点类似，也是偏数学，但是会更难更复杂一点，涉及到一些比较难的逻辑推理。目前GLM4只能达到GPT4的91%。
BBH (Big Bench Hackathon) ：偏综合测试，有一堆综合类的任务，比如翻译、语言理解、逻辑推理等等乱七八糟的。这块GLM4很强，基本跟GPT4打平，能到99%。
HellaSwag：偏常识测试的任务，看看大模型有没有人类的常识。这块是目前GLM4对比GPT4最弱的一个，只能达到90%。
HumanEval：纯粹的编程任务。评测大模型在算法、代码、编程层面的效果。这块是GLM4唯一超越GPT4的任务，非常强，程序员有福了。

从这些里面，你就能大概知道GLM4目前是个啥水平了，智谱也很实诚，从来不会说全面超越GPT4这种鬼话，不弄虚做假，客观的承认差距，然后努力追赶，这点我非常非常喜欢。

智谱AI GLM4发布会全解析：揭秘国产AI大模型的最新进展

基座能力第二个方面就是指令跟随上，通俗点说，就是理解Prompt和Instruction的能力上。GLM4目前大概都在GPT4的88%左右。

GPT4的语义理解和吃Prompt的能力，我相信大家都知道，基本是冠绝全球，不要以为88%所以不咋地，你要看跟谁比。。。国内的很多的所谓全面超越GPT4的大模型，你能达到60%我就愿意给你磕一个。

在中文的能力上，GLM4各方面都比GPT4强一点，这个正常，毕竟GPT4就那么点中文预料，超过是正常事。但是可以看到，在推理这块，受限于大模型本身的底层能力，还是差了一点点。

GLM4终于也上了128K的长文本，大概等于一次性灌300页吧，最好玩的是智谱自己也做了一个“大海捞针”的测试，很有意思。

2.2 ALL Tools

ChatGPT有一个能牛逼的玩意，我相信用过的人都知道，就是他们的All Tools，在一个任务里，可以同时调用联网、画图、识图、代码解释器。形成一个小型Agent，能做很多很有意思的事情。

目前国内还没有一个能真正把ALL Tools搞出来的，智谱是第一个。

其实他们的识图能力其实早就有了，代码解释器也有了，这次主要是新增了画图的部分，也就是CogView3。再将它们全部打包在了一起。

比如我说一句：“搜索一下过去7天北京的天气，然后给我处理成一张表格让我可以下载”，直接就给我处理完了，非常爽。第一次，在国产大模型上用上了ALL Tools。要知道，GPT4的联网搜索默认都是外网，那些个结果，很多时候真的特娘的水土不服。

智谱AI GLM4发布会全解析：揭秘国产AI大模型的最新进展

然后智谱也上线了他们的绘图大模型CogView3。

有一说一，之前智谱的画图模型，真的，有点丑emmmm…..

但是这次得到了大幅的加强，至少，能看了。

你要是拿它跟MJ比那就有点欺负人了，但是至少画出来的东西不丑，能用，并且最好的一点是，可以用自然语义去做微调。

智谱AI GLM4发布会全解析：揭秘国产AI大模型的最新进展

比如说，我先让他画一只“短脚柯基在公园里奔跑”，画的还不错，挺可爱的。然后我们再说一句：“给它旁边加几只蝴蝶”，小蝴蝶就加上了，这种感觉还是很爽的。说实话，我还是喜欢用这种自然语言作画。智谱AI GLM4发布会全解析：揭秘国产AI大模型的最新进展

然后再放几个他们的参数，从数据层面对标一下GPT4，这块我就不去做过多详细的解释了，有兴趣的可以自己去用智谱清言识图，让他给你解释一下。

智谱AI GLM4发布会全解析：揭秘国产AI大模型的最新进展

他们自己官方也放了两个例子，可以简单看下。

智谱AI GLM4发布会全解析：揭秘国产AI大模型的最新进展

2.3 GLMs

众所周知，OpenAI上线了他们的GPTs，前几天也上线了GPT store，被各种人吹为下一个APP store。当然，到底是不是，那就是另一个话题了…

现在智谱也正式上线了他们的GLMs和智能体中心。

智谱AI GLM4发布会全解析：揭秘国产AI大模型的最新进展

目前没有搜索，只有官方推荐的，基本能保证这些GLMs的质量，毕竟GPTs那玩意，真的鱼龙混杂。

而在整个GLMs的创建页面上，智谱这次挺致敬的（笑）。跟GPTs基本一摸一样，你用过GPTs创建智能体的话，就会很容易上手了。直接用自然语义来，来说人话，就OK。你做完了以后，也可以分享给朋友。

他们也即将公布创作者分成计划。

期待一下后面的生态，看看智谱要怎么运营这块。

三、写在最后

说一个有趣的小故事。

早上智谱CEO张鹏在演讲讲一半，即将开始现场演示时，直接宣布GLM4已经正式上线，大家可以立刻在线上使用了。

然后才开始的现场演示。

然后，就，翻车了。。。当时在画一张图，我记得好像是个狗还是啥，愣是加载不出来。

如果这是别的国产大模型公司，可能就各种冷嘲热讽就开始了。

然而在群里，大家在看到翻车后，画风完全不一样。

你的口碑、你的真诚，是会被所有人看到的。

这是绝对的，长期的力量。

智谱的开源、贡献，国内AI行业肯定都是看的到的。

比如他们又成立了大模型科研基金。

掏1000张GPU、1000万人民币、1000亿的Token，来支持开源开放的大模型软件开发。

我觉得，这就是中国AI，龙头的格局吧。

# AI前沿 # AI大模型 # GLM4 # 国产之光 # 智谱AI

文章版权归作者所有，未经允许请勿转载。

AutoGLM沉思版：DeepResearch破局？| 智谱AI巧解数据孤岛 | 国内首个免费不限量

wang, yizzcn

10,620

CogView4开源：智谱AI重塑辉煌？首个中英混合AI绘图模型！

wang, yizzcn

9,716

还在emo？00后用AI鼠标，10分钟搞定紧急任务！打工人必备神器！

wang, yizzcn

7,845

小红书评论挖掘：数据采集工具｜AI模型分析｜爆款APP需求

wang, yizzcn

5,727

美国制裁！中国大模型公司智谱AI如何突围？

wang, yizzcn

11,023

DeepSeek免费用：火山引擎邀请码DRBW5U1L，tokens翻十倍！

wang, yizzcn

12,129

智谱AI GLM4发布会全解析：揭秘国产AI大模型的最新进展

智谱AI GLM4发布会全解析：揭秘国产AI大模型的最新进展

一、智谱AI的背景

二、智谱AI的GLM4发布会

1. GLM4的发布

2. GLM4发布会的三个重点

2.1 GLM4基座模型的性能提升

2.2 ALL Tools

2.3 GLMs

三、写在最后

宝塔docker如何对项目进行升级？

ChatGPT提示词工程之角色提示，生成特定格式回复！

相关文章

相关文章