GPT-4o-mini (@openai) 在 WildBench 的前10名(按 WB-Elo 排名)。它比 Gemini-flash (@头秃搞学习) 更好,而且比 Claude 3 Haiku (@wxy百年孤独) 好得多。鉴于其规模和价格,我认为 GPT-4o-mini 是目前最具性价比的大型语言模型 API。🔗 https://hf.co/spaces/allenai/WildBench