FruitNeRF一个基于统一神经辐射场的水果计数框架讨论:-CSDN blink-领先的开发者技术社区

最新

红包

立Flag

投票

同城

发布

_akhaliq

2 年前

truetechsavvyak

FruitNeRF

一个基于统一神经辐射场的水果计数框架

讨论: https://huggingface.co/papers/2408.06190

我们介绍了FruitNeRF，这是一个统一的创新水果计数框架，它利用最先进的视角合成方法，直接在3D中计数任何类型的水果。我们的框架使用单目相机拍摄的一组无序的带姿态图像，并在每个图像中分割水果。为了使我们的系统不依赖于水果类型，我们使用了一个基础模型，该模型生成任何水果的二值分割掩码。通过利用RGB和语义两种模式，我们训练了一个语义神经辐射场。通过对隐含的水果场进行均匀体积采样，我们获得了仅含水果的点云。通过对提取的点云应用级联聚类，我们的方法实现了精确的水果计数。与传统方法如目标跟踪或光流相比，使用神经辐射场提供了显著的优势，因为计数本身是在3D中进行的。我们的方法防止了重复计数水果，并避免了计数无关的水果。我们使用现实世界和合成数据集评估了我们的方法。现实世界数据集包括三棵苹果树，并有手动计数的地面真值，一个包含一行和地面真值水果位置的基准苹果数据集，而合成数据集包括各种水果类型，包括苹果、李子、柠檬、梨、桃子和芒果。此外，我们还评估了使用基础模型与U-Net进行水果计数的表现。

下一条：

互相推理使得较小的大语言模型成为更强的问题解决者讨论：https://huggingface.co/papers/2408.06195这篇论文介绍了rStar，一种自我博弈的互相推理方法，可以显著提高小型语言模型（SLMs）的推理能力，而无需微调或使用更高等级的模型。rStar将推理分离为一个自我博弈的生成-判别过程。首先，目标SLM利用丰富的人类类似推理动作增强蒙特卡洛树搜索（MCTS），以构建更高质量的推理轨迹。接下来，另一具有与目标SLM相似能力的SLM充当判别器，以验证目标SLM生成的每一条推理轨迹。相互认可的推理轨迹被认为是相互一致的，因此更有可能是正确的。通过在五个SLM上的大量实验表明，rStar能够有效解决各种推理问题，包括GSM8K、GSM-Hard、MATH、SVAMP和StrategyQA。值得注意的是，rStar将LLaMA2-7B在GSM8K上的准确率从12.51%提升到63.91%，将Mistral-7B的准确率从36.46%提升到81.88%，将LLaMA3-8B-Instruct的准确率从74.53%提升到91.13%。