热门
最新
红包
立Flag
投票
同城
我的
发布
《DeepSeek-V3.1技术深度解析:128K上下文与高效推理的革命性突破》
DeepSeek-V3.1带来128K超长上下文处理与高效推理的革命性突破。其核心创新包括动态稀疏注意力机制,通过数学优化将计算复杂度从O(n²)降至O(n log n);扩展版RoPE位置编码支持128K上下文;以及条件计算与早期退出机制实现动态推理加速。该模型采用混合专家架构(MoE)与高效参数共享策略,在保持性能的同时显著降低计算成本。这一技术突破为长文档处理、复杂推理等场景提供了全新可能,标志着大模型技术进入新阶段。
——来自博客 https://blog.csdn.net/Liudef06/article/details/150564439
用了DeepSeek-V3.1吗,感觉怎么样(单选)
2 人已经参与 已结束
好用,长文本表现优秀
2人
一般,不如deepseek r1
0人
CSDN App 扫码分享
评论
点赞
- 复制链接
- 举报