热门

最新

红包

立Flag

投票

同城

我的

发布
weixin_41524835
MIT_CSAIL
2 年前
trueweixin_41524835

基础LLM尝试解决数学问题,例如“a^3 · a^2 如果a=5”,其错误地计算出答案为125。

Co-LLM训练模型与大型数学LLM Llemma合作,他们共同确定正确的答案是3,125。

CSDN App 扫码分享
分享
评论
11
  • 复制链接
  • 举报
下一条:
如果你让Co-LLM列举一些已经灭绝的熊类物种的例子,两种模型会一起拟定答案。通用LLM开始编写回复,而切换变量在可以插入专家模式更好词汇的位置进行干预(例如,添加熊类物种灭绝的年份)。
立即登录