热门
最新
红包
立Flag
投票
同城
我的
发布
FruitNeRF
一个基于统一神经辐射场的水果计数框架
讨论: https://huggingface.co/papers/2408.06190
我们介绍了FruitNeRF,这是一个统一的创新水果计数框架,它利用最先进的视角合成方法,直接在3D中计数任何类型的水果。我们的框架使用单目相机拍摄的一组无序的带姿态图像,并在每个图像中分割水果。为了使我们的系统不依赖于水果类型,我们使用了一个基础模型,该模型生成任何水果的二值分割掩码。通过利用RGB和语义两种模式,我们训练了一个语义神经辐射场。通过对隐含的水果场进行均匀体积采样,我们获得了仅含水果的点云。通过对提取的点云应用级联聚类,我们的方法实现了精确的水果计数。与传统方法如目标跟踪或光流相比,使用神经辐射场提供了显著的优势,因为计数本身是在3D中进行的。我们的方法防止了重复计数水果,并避免了计数无关的水果。我们使用现实世界和合成数据集评估了我们的方法。现实世界数据集包括三棵苹果树,并有手动计数的地面真值,一个包含一行和地面真值水果位置的基准苹果数据集,而合成数据集包括各种水果类型,包括苹果、李子、柠檬、梨、桃子和芒果。此外,我们还评估了使用基础模型与U-Net进行水果计数的表现。
CSDN App 扫码分享
7
71
- 复制链接
- 举报
下一条:
互相推理使得较小的大语言模型成为更强的问题解决者讨论:https://huggingface.co/papers/2408.06195这篇论文介绍了rStar,一种自我博弈的互相推理方法,可以显著提高小型语言模型(SLMs)的推理能力,而无需微调或使用更高等级的模型。rStar将推理分离为一个自我博弈的生成-判别过程。首先,目标SLM利用丰富的人类类似推理动作增强蒙特卡洛树搜索(MCTS),以构建更高质量的推理轨迹。接下来,另一具有与目标SLM相似能力的SLM充当判别器,以验证目标SLM生成的每一条推理轨迹。相互认可的推理轨迹被认为是相互一致的,因此更有可能是正确的。通过在五个SLM上的大量实验表明,rStar能够有效解决各种推理问题,包括GSM8K、GSM-Hard、MATH、SVAMP和StrategyQA。值得注意的是,rStar将LLaMA2-7B在GSM8K上的准确率从12.51%提升到63.91%,将Mistral-7B的准确率从36.46%提升到81.88%,将LLaMA3-8B-Instruct的准确率从74.53%提升到91.13%。