热门
最新
红包
立Flag
投票
同城
我的
发布
唔去
1 年前
trueweixin_37070507
我认为工具使用对LLM能力的影响并没有得到充分重视。我给了GPT-4o一个我们为虚构太空任务仿真集创建的原创难题(先自己尝试一下)。
当要求手动解决时,它接近但失败了。当使用代码时,它完美解决了。
下一条:
这很有趣,如果我们相信这些回复。看起来GPT-4o的核心训练来源于先前的ChatGPT,通过微调和训练扩展来包括最新内容。最新的GPT-4截止到6个月前。这些似乎是非常不同的模型。
立即登录