「微软教小模型推理进阶版：Orca2性能媲美10倍参数模型，-CSDN blink-领先的开发者技术社区

最新

红包

立Flag

投票

同城

发布

程序员的店小二

2 年前

truem0_46163918

「微软教小模型推理进阶版：Orca 2性能媲美10倍参数模型，已开源」

链接: https://news.miracleplus.com/share_link/12224

GPT-4、PaLM 等前沿语言模型已经展现了出色的推理能力，例如回答复杂问题、生成解释，甚至解决需要多步推理的问题，这些能力曾被认为是 AI 无法达到的。这样的能力在较小的语言模型中并不明显，因此现在的挑战就是如何利用对大型语言模型不断增长的知识，进而提升较小模型的能力。之前微软研究院推出了 Orca，它是拥有 130 亿参数的语言模型，通过模仿更强大 LLM 的逐步推理过程，展现了强大的推理能力。现在研究者再接再厉推出了 Orca 2，继续探索如何通过改进训练信号来提升较小语言模型的推理能力。

AI资讯

下一条：

「专注图表理解，腾讯、南洋理工等开源图表羊驼大模型ChartLlama」链接：https://news.miracleplus.com/share_link/12223 在图像理解领域，多模态大模型已经充分展示了其卓越的性能。然而，对于工作中经常需要处理的图表理解与生成任务，现有的多模态模型仍有进步的空间。尽管当前图表理解领域中的最先进模型在简单测试集上表现出色，但由于缺乏语言理解和输出能力，它们无法胜任更为复杂的问答任务。另一方面，基于大语言模型训练的多模态大模型的表现也不尽如人意，主要是由于它们缺乏针对图表的训练样本。这些问题严重制约了多模态模型在图表理解与生成任务上持续进步。近期，腾讯联合南洋理工大学、东南大学提出了 ChartLlama。研究团队创建了一个高质量图表数据集，并训练了一个专注于图表理解和生成任务的多模态大型语言模型。ChartLlama 结合了语言处理与图表生成等多重性能，为科研工作者和相关专业人员提供了一个强大的研究工具。