热门

最新

红包

立Flag

投票

同城

我的

发布
m0_46163918
程序员的店小二
9 月前
truem0_46163918

Upstash Vector:将1100万篇维基百科索引成1.44亿向量数据,支持包括中文在内的11种语言。

你可以用它轻松构建搜索引擎和RAG机器人

Upstash Vector,一个支持可扩展相似性搜索的向量数据库,对整个维基百科文章进行了向量化。

使得你可以针对维基百科基于语义进行搜索,提高搜索的准确性。

他们还开源了一个工具你可以基于该数据库轻松创建基于维基百科搜索和RAG机器人。

Upstash Vector 还能够处理和理解多种语言的内容,并在不同语言之间进行相似性搜索。

这意味着它支持跨语言的语义搜索。用户可以用一种语言进行查询,并在其他语言的数据中找到相应的结果。

比如你用中文搜索“世界最高的山”,它也能找到英文里关于“Mount Everest”的信息。

GitHub:
https://github.com/upstash/wikipedia-semantic-search
在线体验:https://wikipedia-semantic-search.vercel.app

AI资讯
CSDN App 扫码分享
分享
评论
1
打赏
  • 复制链接
  • 举报
下一条:
我想明确一点,我很高兴人们在尝试和建立新事物。我不能容忍的是人们为了营销而假装他们的模型优于其他模型。结果才是关键。不是营销。在你有结果之前,你都是无关紧要的。
立即登录