我认为工具使用对LLM能力的影响并没有得到充分重视。我给了G-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

2 年前

trueweixin_37070507

我认为工具使用对LLM能力的影响并没有得到充分重视。我给了GPT-4o一个我们为虚构太空任务仿真集创建的原创难题（先自己尝试一下）。

当要求手动解决时，它接近但失败了。当使用代码时，它完美解决了。

CSDN App 扫码分享

分享

5

67

复制链接
举报

下一条：

这很有趣，如果我们相信这些回复。看起来GPT-4o的核心训练来源于先前的ChatGPT，通过微调和训练扩展来包括最新内容。最新的GPT-4截止到6个月前。这些似乎是非常不同的模型。