Qwen1.5系列的各个模型我都用ElyzaTasks进行了-CSDN blink-领先的开发者技术社区

最新

红包

立Flag

投票

同城

我的

发布

umiyuki_ai

1 年前

trueweixin_41975548

Qwen1.5系列的各个模型我都用ElyzaTasks进行了评估。果然，Qwen1.5非常出色。7B模型略逊于Llama3-8B。14B模型超过了35B的Command R！32B模型略低于104B的Command R+。72B模型竟然超过了GPT3.5Turbo和Llama3-70B！不知为何，110B模型的得分却比72B低。仔细看了下回答的内容，发现很多都是用中文回答的，这可能拉低了分数。0.5B和1.8B的表现不行。4B的话，如果努力的话，可能还有用武之地。

CSDN App 扫码分享

10

复制链接
举报

下一条：

如果在本地LLM上运行类似AutoGPT这样的东西，并且让AI自己决定想做什么，任其自由地进行研究，会发生什么呢？

立即登录