热门

最新

红包

立Flag

投票

同城

我的

发布
universsky2015
光子AI
2 年前
trueuniverssky2015

xAI 发布 Grok-1

博客: x.ai/blog/grok-os
代码: github.com/xai-org/grok

基础模型基于大量文本数据进行训练,未针对任何特定任务进行微调。

314B 参数混合专家模型,其中 25% 的权重在给定代币上处于活动状态。

xAI 于 2023 年 10 月使用基于 JAX 和 Rust 的自定义训练堆栈从头开始训练。

人工智能时代
CSDN App 扫码分享
分享
评论
1
打赏
  • 复制链接
  • 举报
下一条:
论文提出了不同策略,用于音频/文本特征序列的时间聚合。它还考虑了跨模态和内模态相似性。https://arxiv.org/abs/2403.10146
立即登录