热门
最新
红包
立Flag
投票
同城
我的
发布
做個酷人
10 月前
trueweixin_36881830
ZebraLogic 基准测试:
https://huggingface.co/spaces/allenai/ZebraLogic
下一条:
介绍🦓ZebraLogic,一种用于评估大型语言模型逻辑推理的新基准,专门设计用于逻辑谜题。伟大的工作,感谢@明智之光 和 @你不是我你不行 团队!我们正在改进Gradio网页UI上选项卡的外观。敬请期待更多惊喜😉😎!
立即登录