热门
最新
红包
立Flag
投票
同城
我的
发布
xAI发布Grok-2和Grok-2 mini
这两个模型现在已经在𝕏平台上发布测试版。
Grok-2与其前身Grok-1.5相比,在推理、编程和对话能力上有显著提升。Grok-2在多个基准测试中表现出色,超越了其他领先的模型,如Claude 3.5和GPT-4 Turbo。
xAI计划在本月晚些时候通过企业API提供这两个模型的访问权限
Grok 2.0 整合X 功能和能力曝光
显示其可以编程解决数学问题,查询当天的头条新闻、撰写求职信、推荐游戏…
而且似乎是整合了FLUX.1,可以生成图像!
Grok-2在处理检索内容的推理能力和工具使用能力(例如,正确识别缺失信息、推理事件顺序和排除无关信息)方面有显著提升。
基准测试:
Grok-2和Grok-2 mini在多个学术基准测试中表现突出,包括推理、阅读理解、数学、科学和编程。与Grok-1.5相比,这两个新模型在多个领域都展现了显著的进步,如研究生级别的科学知识(GPQA)、一般知识(MMLU, MMLU-Pro)以及数学竞赛问题(MATH)。
此外,Grok-2在视觉任务中表现出色,在视觉数学推理(MathVista)和文档问题回答(DocVQA)方面达到了先进的性能水平。
实时信息整合:
在𝕏平台上,Grok-2和Grok-2 mini为用户提供了更新的界面和功能。𝕏 Premium和Premium+用户可以通过𝕏应用中的Grok标签访问这些新模型。Grok-2具有先进的文本和视觉理解能力,能够整合𝕏平台的实时信息,并在各类任务中表现得更加直观和多功能,无论是寻找答案、协作写作还是解决编程任务。
详细介绍:https://x.ai/blog/grok-2
AI资讯
CSDN App 扫码分享
评论
点赞
打赏
- 复制链接
- 举报