Andrej Karpathy 体验 Grok 3 总结:
Grok 3是xAI公司最新发布的AI模型,经过初步测试表现出以下特点:
1. 核心能力:
- 在思考模型方面处于技术前沿
- 能力水平与OpenAI的o1-pro(月费200美元)相当
- 领先于DeepSeek-R1和Gemini 2.0 Flash Thinking
2. 主要优势:
- 在编程和数学问题上表现出色
- 具备深度搜索功能,可提供高质量研究性问题答案
- 思考功能可以帮助解决复杂问题
3. 存在的不足:
- 在幽默感方面没有明显提升
- 对"复杂伦理问题"反应过于敏感
- 在生成SVG图像等视觉任务上仍有改进空间
4. 技术突破:
- 从一年前开始开发到达到顶级水平,开发速度创纪录
- 使用了包含20万个GPU的超级计算机进行训练
- 计算能力是Grok 2的10倍
5. 总体评价:
- 作为新兴AI模型展现出强大实力
- 在多个基准测试中表现优异
- 显示出xAI团队具有极强的开发速度和发展势头