热门

最新

红包

立Flag

投票

同城

我的

发布
2403_84693443
交通工具是猴
1 年前
true2403_84693443

有人知道这个问题怎么解决吗

保持热爱共赴山海
CSDN App 扫码分享
分享
1
点赞
打赏
  • 复制链接
  • 举报
下一条:
通义千问发布Qwen1.5-110B 首款超1000亿参数模型 Qwen1.5-110B是Qwen1.5系列中的新成员,也是该系列首个拥有超过1000亿参数的模型。该模型在基础模型评估中表现出色,与Meta-Llama3-70B相媲美,并在聊天模型评估(包括MT-Bench和AlpacaEval 2.0)中表现出色。模型支持多语言,包括英语、中文、法语、西班牙语等,上下文长度可达32K令牌。模型特性:•架构:采用Transformer解码器架构,具有分组查询注意力(GQA)。•性能:在标准评估和聊天模型评估中均展现卓越性能。•多语言支持:支持多种语言,上下文长度可达32K令牌。根据官方公布的评测结果Qwen1.5-110B模型的评测结果略略超过Llama-3-70B和Mixtral-8×22B。Qwen1.5-110B模型在综合理解(MMLU)、数学推理(GSM8K和MATH)方面得分比Llama-3-70B略高一点点,是几个模型中最强的。而在复杂推理任务ARC-C上则略低于Mixtral-8×22B模型。在编程测试HumanEval得分则是远超另几个模型,而MBPP编程测试上则低于Mixtral-8×22B模型。详细:https://qwenlm.github.io/blog/qwen1.5-110b/
立即登录