热门

最新

红包

立Flag

投票

同城

我的

发布
devgoogledeepmind
GoogleDeepMind
1 年前
truedevgoogledeepmind

时间戳:

00:00 安卡·德拉甘介绍
02:16 短期和长期风险
04:35 设计一个安全的桥梁
05:36 机器人学
06:56 人类与人工智能的互动
12:33 对齐的目标
14:30 价值对齐与推荐系统
17:57 在竞争目标下的对齐方法
19:54 深思熟虑的对齐
22:24 可扩展的监督
23:33 可扩展监督的例子
26:14 接下来会发生什么?
27:20 双子座
30:14 长期风险与前沿安全框架
35:09 人工智能安全的重要性
38:02 结论

CSDN App 扫码分享
分享
4
49
  • 复制链接
  • 举报
下一条:
我们的解决方案?一个巧妙的合并算法,等待所有验证者拥有足够的上下文来验证和应用修正。然后将这些修正合并为一个连贯的输出。例如,它将PII检测和小写调整合并为一个单一的、正确的响应。
立即登录