热门
最新
红包
立Flag
投票
同城
我的
发布
智谱AI发布其最新基座大模型GLM-4-Plus
以及展示了类似OpenAI GPT 4o模型的视觉能力,能进行自由语音通话和视觉推理,并宣布8月30日开放!
GLM-4-Plus在多个方面表现出了卓越的性能,具体如下:
1.语言能力:
•GLM-4-Plus在语言理解、指令遵循、长文本处理等方面达到了国际领先水平。与GPT-4和参数量为405B的Llama3.1相比,GLM-4-Plus的语言文本能力相当。
•在长文本处理方面,GLM-4-Plus通过更精准的长短文本数据混合策略,显著提升了长文本推理的效果,达到国际先进水平。
2.图像/视频理解:
•GLM-4V-Plus在图像和视频理解能力上表现卓越,具备时间感知能力,能够处理和理解复杂的视频内容。
•该模型将在智谱开放平台上线,成为国内首个通用视频理解模型API。
3.文生图与视频生成:
•CogView-3-Plus在文生图性能上接近目前最优的MJ-V6和FLUX等模型。
•视频生成模型CogVideoX发布了性能更强的5B版本,被认为是当前开源视频生成模型中的最佳选择。
智谱的清言 APP将 迎来“视频通话”功能,这也是国内首个面向 C 端开放的视频通话功能。
清言视频通话能力跨越了文本模态、音频模态和视频模态,并具备实时推理的能力。
可以进行流畅通话,即便频繁打断它也能迅速反应。只要打开摄像头,我们看到的画面,清言也可以看到,同时可以听懂指令并准确执行。
视频通话功能将于8 月 30 日上线,首批面向清言部分用户开放,同时开放外部申请。
详细:https://mp.weixin.qq.com/s/Ww8njI4NiyH7arxML0nh8w
CSDN App 扫码分享
12
141
- 复制链接
- 举报