热门

最新

红包

立Flag

投票

同城

我的

发布
universsky2015
光子AI
3 年前
trueuniverssky2015

提示创新可以解锁更深层次的专家能力,并展示出GPT-4在医学问答数据集上轻松超越之前的领先成果。我们探索的提示工程方法具有通用性,不需要特别使用领域专家知识,从而消除了对专家策划内容的需求。我们的实验设计严格控制了在提示工程过程中的过拟合。我们引入了基于多种提示策略组合的Medprompt。Medprompt大幅提升了GPT-4的性能,在MultiMedQA套件中的全部九个基准数据集上都达到了最新的成果。该方法以数量级更少的模型调用次数,大幅超越了如Med-PaLM 2等最新专家模型。使用Medprompt指导GPT-4在MedQA数据集(USMLE考试)上的错误率比迄今为止使用专家模型获得的最佳方法减少了27%,并首次超过了90%的分数。超越了医学挑战问题,我们展示了Medprompt在其他领域的普适性,并通过在电气工程、机器学习、哲学、会计、法律、护理和临床心理学的能力考试中的策略研究,提供了这种方法广泛适用性的证据。

CSDN App 扫码分享
分享
评论
1
打赏
  • 复制链接
  • 举报
下一条:
一半理解,一半算了
立即登录