什么!?!?在Shaberi3基准测试中评估Gemma2-9B-it(使用Llama.cpp进行Q8_0量化)时得到了7.65的分数!!!!啊……不可能……这简直是次元不同的级别……仅仅9B参数就匹敌Gemini1.5Flash的性能!?这肯定是哪里搞错了……如果这是真的,这个得分可是了不得的事情啊……