总的来说,COAR是一种可扩展的方法,用于估计预测性组件归因,其性能在各种模型和任务中均优于之前的方法。COAR的归因作为反事实估算器,帮助进行有针对性的模型编辑——从修正错误到增强子群体的鲁棒性——无需额外训练。这项工作揭开了黑盒,代表了朝向更可解释和可控的AI系统迈出的重要一步。查阅博客文章(https://bit.ly/477Wkne)了解更多信息!