热门
最新
红包
立Flag
投票
同城
我的
发布
CSDN App 扫码分享
评论
11
- 复制链接
- 举报
下一条:
GPT-4o是集成图像/文本理解的最先进技术,我们已经创建了一本完整的教程书,向您展示如何使用GPT-4o从图像中提取出结构化的JSON。它比GPT-4V做得更好。我们向它提供了由@sun海涛创建的各种研究论文的详细纸卡(见下图),并测量失败率和提取输出质量等定量指标。GPT-4o能够从每个图像中提取出结构化的输出(0%失败率),并且合成的答案/见解质量比4V高得多。在这里查看我们的完整教程书-同样由@sun海涛!https://github.com/run-llama/llama_index/blob/main/docs/docs/examples/multi_modal/gpt4o_mm_structured_outputs.ipynb