按照我的理解：实际上就是在检索的时候，不仅仅是按照相似度检索文档摘要，还检索文档的元数据，比如作者、日期、分类等等结构化的信息。现在回想我今天看到的一篇文章说的还真的挺对：构建搜索引擎，而非向量数据库！内容摘录：很多向量数据库的主要作用被描述为解决大语言模型 (LLM)…

发布时间: 2023-12-21 16:50:55

1分

数据加载中

2

1

0

按照我的理解：实际上就是在检索的时候，不仅仅是按照相似度检索文档摘要，还检索文档的元数据，比如作者、日期、分类等等结构化的信息。
现在回想我今天看到的一篇文章说的还真的挺对：构建搜索引擎，而非向量数据库！
内容摘录：
很多向量数据库的主要作用被描述为解决大语言模型 (LLM)…
IT技术
( twitter.com )

4个月前由宝玉提交

按照我的理解：实际上就是在检索的时候，不仅仅是按照相似度检索文档摘要，还检索文档的元数据，比如作者、日期、分类等等结构化的信息。

现在回想我今天看到的一篇文章说的还真的挺对：构建搜索引擎，而非向量数据库！

内容摘录：

很多向量数据库的主要作用被描述为解决大语言模型 (LLM) 缺乏长期记忆的问题，或者无法将一个问题的全部上下文放入提示语中。

然而，向量搜索实质上只是搜索的一种特殊形式。虽然让大语言模型 (LLM) 能够写入和检索数据库非常有用，但最终这更像是提供给智能体一个搜索引擎的权限，而非真正“增加了存储空间”。

假设你是一家企业，想要建立一个由 LLM 驱动的文档查询体验。如果你将向量数据库仅看作是为语言模型提供更多存储空间，那么你可能会把公司的所有产品文档都嵌入其中，然后让用户向你的机器人提问。用户按下回车键时，系统会对他们的查询进行向量搜索，找到相关片段，加载到上下文中，然后让语言模型尝试回答问题。实际上，这正是我在 Stripe 工作时，开发他们的 AI 文档产品时最初尝试的方法。

但我最终发现，这种方法并不理想。关键在于，尽管向量搜索在某些方面优于传统搜索，但它并非万能。就像常规搜索一样，你可能会在搜索结果中遇到不相关或遗漏的文档。语言模型，就像人类一样，只能利用它们所拥有的信息，而这些不相关的文档很可能会导致误导。

如果你想打造一个优秀的基于文档的 RAG 工具，你首先应该构建一个足够优秀的搜索引擎，让人类也能轻松使用。这可能是你们组织之前已经考虑过的，如果尚未实现，那是因为打造一个高效的搜索引擎通常是一项颇具挑战的工作。

原文：https://t.co/CeCqZ6kusU
译文：https://t.co/YRcOZo1BjQ

点击图片查看原图

评论加载中...

您可能感兴趣的：更多

1

2

1

1

今天偶然看到LangChain的 MultiQueryRetriever 检索器，很有意思。

通常我们在用自然语言做相似度查询时，有一个常见问题就是直接按照查询的文本去做相似度查找，很可能检索不到很好的结果，因为对查询文本做向量化（Embedding）的时候，可能因为用词的准确性导致检索结果出现差异。…
IT技术
( twitter.com)

6个月前 • 宝玉 • -- 点击 0 评论

2

2

1

1

这是一个本地基于向量的本地文档检索工具，事先将文档向量化，然后可以利用自然语言检索。

注意它只有自然语言检索，并不支持文档对话，按照作者的话说是他不想让GPT去解释而让结果可能不准确，验证的责任应该在用户自己身上。
推特中文圈
( twitter.com)

1年前 • 宝玉 • -- 点击 0 评论

3

2

1

1

实际上生理男/女这种区分最开始就是按照生育职能来区分的。
甚至到现在，很多染色体异常的人直到特地去做了检查才能得知自己的真实状况，这不就揭露了这套机制吗？它根本不在乎所谓的“男女之间的本质区分”，它只在乎你能够在生育职能担任什么角…
推特中文圈
( twitter.com)

11个月前 • ほしこ🍧 • -- 点击 0 评论

4

2

1

1

看到推友这条。

实际上，小孩子就是该玩啊。该把时间用在探索自我、探索世界上。

青少年时期谈过恋爱，成年了才会知道怎么表达爱、经营爱。

小时候探索了自己的爱好和天赋，选专业才不会像国内一样，一股脑全选热门专业。

相比之下，国…
推特中文圈
( twitter.com)

1年前 • garrulous abyss🌈 • -- 点击 0 评论

5

2

1

1

太真实了，我年轻的时候不懂这个道理，因为这个多次被实际上我完全没有兴趣的女生表白🥲🥲
时政
( twitter.com)

4个月前 • 象牙山刘能 • -- 点击 0 评论

6

2

1

1

知道和理解有本质区别。
知识经济其实是花钱购买信息——你花了钱，知道了，然后就没然后了。
让你理解的付费模式叫教育——把知识教你，告诉你原理是啥，什么时候用，可以解决哪些问题。
更进一步的理解并能实际应用，很难很痛苦，要靠不断自我…
推特中文圈
( twitter.com)

10个月前 • 章工GPT • -- 点击 0 评论

7

2

1

1

不知道你有没有一种感觉，就是当你通过阅读理解一件事情或一个现象时，自己也会有种被理解的感觉。

我好像慢慢理解了那句：「探索世界的过程，其实也是探索自己的过程」。同样，理解复杂世界的过程，也是理解自己的过程。这或许才是阅读真正的意义吧。

或许当你真正理解自己之后，就不再需要避难所。
时政
( twitter.com)

7个月前 • 左手墨迹 • -- 点击 0 评论

8

2

1

1

怎么让 ChatGPT 检索你的文档，并与你对话

用普通开发者也能理解的语言，解释怎么利用 embedding，实现使用 ChatGPT 的 AI 文档检索系统

从产品设计角度说，超出我的知识范围了，不过技术障碍并不影响普通人…
视频
( twitter.com)

1年前 • 倪爽 • -- 点击 • 下载视频 0 评论

00:00:26

9

2

1

1

我曾经在青岛看了几年的海，下大雨的时候我就穿着雨衣蹦到石头上看，汹涌澎湃，有人说我是傻瓜、怪物。你们在座的都脱离青少年，对青少年不能理解，女主角看到归来的爱人激动得跳进海中，拼命去见他，你们居然不能理解，我就能理解，我年轻时这样，…
推特中文圈
( twitter.com)

10个月前 • 鹅笼书生 • -- 点击 0 评论