智谱AI发布其最新基座大模型GLM-4-Plus以及展示了类-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

9 月前

trueweixin_37992011

智谱AI发布其最新基座大模型GLM-4-Plus

以及展示了类似OpenAI GPT 4o模型的视觉能力，能进行自由语音通话和视觉推理，并宣布8月30日开放！

GLM-4-Plus在多个方面表现出了卓越的性能，具体如下：

1.语言能力：

•GLM-4-Plus在语言理解、指令遵循、长文本处理等方面达到了国际领先水平。与GPT-4和参数量为405B的Llama3.1相比，GLM-4-Plus的语言文本能力相当。

•在长文本处理方面，GLM-4-Plus通过更精准的长短文本数据混合策略，显著提升了长文本推理的效果，达到国际先进水平。

2.图像/视频理解：

•GLM-4V-Plus在图像和视频理解能力上表现卓越，具备时间感知能力，能够处理和理解复杂的视频内容。

•该模型将在智谱开放平台上线，成为国内首个通用视频理解模型API。

3.文生图与视频生成：

•CogView-3-Plus在文生图性能上接近目前最优的MJ-V6和FLUX等模型。

•视频生成模型CogVideoX发布了性能更强的5B版本，被认为是当前开源视频生成模型中的最佳选择。

智谱的清言 APP将迎来“视频通话”功能，这也是国内首个面向 C 端开放的视频通话功能。

清言视频通话能力跨越了文本模态、音频模态和视频模态，并具备实时推理的能力。

可以进行流畅通话，即便频繁打断它也能迅速反应。只要打开摄像头，我们看到的画面，清言也可以看到，同时可以听懂指令并准确执行。

视频通话功能将于8 月 30 日上线，首批面向清言部分用户开放，同时开放外部申请。

详细：https://mp.weixin.qq.com/s/Ww8njI4NiyH7arxML0nh8w

CSDN App 扫码分享

分享

12

141

复制链接
举报

下一条：

Ideogram功能90秒讲解！以下是Ideogram的主要功能概览：搜索、描述、魔法提示、调色板控制、绘制和重混、样式以及升级！