谷歌DeepMind研究人员提出以人为中心的视觉模型对齐以提-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

2 年前

trueweixin_40912980

谷歌DeepMind研究人员提出以人为中心的视觉模型对齐以提升AI的泛化和解释能力

来自谷歌DeepMind、机器学习组、柏林工业大学、BIFOLD、柏林学习与数据基础研究所、马克斯·普朗克人类发展研究所、Anthropic、韩国首尔大学人工智能系、马克斯·普朗克信息学研究所的研究人员提出了一个名为AligNet的独特框架，以解决人类和机器视觉表示之间的错位问题。这种方法旨在模拟大规模的人类相似性判断数据集，以使神经网络模型与人类感知对齐。该方法首先使用仿射变换将模型表示与在人类三元组奇偶任务中的语义判断对齐。这个过程结合了来自人类反应的不确定性测量，以改进模型校准。对齐后的一个最新的视觉基础模型（VFM）版本随后作为生成类似人类相似性判断的替代模型。通过将表示分组为有意义的高级类别，研究人员从替代模型中采样语义上重要的三元组并获得奇偶反应，从而生成一个包含类似人类三元组判断的综合数据集，称为AligNet。

阅读我们的完整评论：https://www.marktechpost.com/2024/09/16/google-deepmind-researchers-propose-human-centric-alignment-for-vision-models-to-boost-ai-generalization-and-interpretation/

论文：https://arxiv.org/abs/2409.06509

@头秃搞学习

CSDN App 扫码分享

分享

评论

10

复制链接
举报

下一条：

对LitServe受到的热烈欢迎感到谦卑 ☺️。LitServe增强了FastAPI，极大地简化了AI模型的服务，具有批处理、流处理、GPU自动检测等功能！立即试用：https://github.com/Lightning-AI/LitServe