发布 BigCodeBench-Hard:一组更具挑战性和用户导向的任务子集。BigCodeBench-Hard 提供了更准确的模型性能评估,我们还研究了一些最近的模型更新。阅读更多:https://huggingface.co/blog/terryyz/bigcodebench-hard 排行榜:https://huggingface.co/spaces/bigcode/bigcodebench-leaderboard