GPT-4 通过图灵测试
研究人员称人们在图灵测试中无法区分 GPT-4 和人类
圣地亚哥加州大学认知科学系的研究人员针对GPT 4复刻了图灵测试。
研究人员招募了500名参与者,与四个代理人交谈,其中包括一个人类和三个不同类型的AI模型,以测试他们是否能分辨出哪个是人类。
这些代理人包括1960年代的ELIZA程序、GPT-3.5和GPT-4。对话持续五分钟后,参与者需要判断他们是否在与人类或AI交谈。
研究结果显示,参与者认为GPT-4是人类的概率为54%,而ELIZA只有22%,GPT-3.5为50%,人类为67%。
这是首次有实验证据表明人工智能系统通过了互动式的双人图灵测试,并暗示当前AI系统可能难以被人类察觉。结果表明,当前的AI系统可能会在实际应用中欺骗人类,这一结果对机器智能的讨论有重要影响。