我们正在分享对于语言模型神经活动的理解进展。我们改进了大规模训练稀疏自编码器的方法,将GPT-4的内部表示拆解成1600万个特征——这些特征往往对应于可理解的概念。https://openai.com/index/extracting-concepts-from-gpt-4/