embedchain 是一个框架,可以在任何数据集上轻松创建 LLM 支持的机器人

embedchain 是一个框架,可以在任何数据集上轻松创建 LLM 支持的机器人。如果您想要 javascript 版本,请查看 embedchain-js

它抽象了加载数据集、对其进行分块、创建嵌入然后存储在矢量数据库中的整个过程。

您可以使用 .add 和 .add_local 函数添加单个或多个数据集,然后使用 .query 函数从添加的数据集中查找答案。

如果您想创建一个 Naval Ravikant 机器人,其中包含 1 个 YouTube 视频、1 本 pdf 书籍和 2 篇博客文章,以及您提供的一对问答,您所需要做的就是添加视频链接, pdf 和博客文章以及 QnA 对和嵌入链将为您创建一个机器人。

from embedchain import App
naval_chat_bot = App()
# Embed Online Resourcesnaval_chat_bot.add("youtube_video", "https://www.youtube.com/watch?v=3qHkcs3kG44")naval_chat_bot.add("pdf_file", "https://navalmanack.s3.amazonaws.com/Eric-Jorgenson_The-Almanack-of-Naval-Ravikant_Final.pdf")naval_chat_bot.add("web_page", "https://nav.al/feedback")naval_chat_bot.add("web_page", "https://nav.al/agi")
# Embed Local Resourcesnaval_chat_bot.add_local("qna_pair", ("Who is Naval Ravikant?", "Naval Ravikant is an Indian-American entrepreneur and investor."))
naval_chat_bot.query("What unique capacity does Naval argue humans possess when it comes to understanding explanations or concepts?")# answer: Naval argues that humans possess the unique capacity to understand explanations or concepts to the maximum extent possible in this physical reality.

支持的格式

视频

要将任何 YouTube 视频添加到您的应用程序,请使用 data_type ( .add 的第一个参数)作为 youtube_video 。例如:

app.add('youtube_video', 'a_valid_youtube_url_here')

pdf文件

要添加任何 pdf 文件,请将 data_type 用作 pdf_file 。例如:

app.add('pdf_file', 'a_valid_url_where_pdf_file_can_be_accessed')

请注意,我们不支持受密码保护的 pdf。

文本

要提供您自己的文本,请使用 data_type 作为 text 并输入字符串。文本未经处理,这可以非常通用。例如:

app.add_local('text', 'Seek wealth, not money or status. Wealth is having assets that earn while you sleep. Money is how we transfer time and wealth. Status is your place in the social hierarchy.')

注意:示例中未使用此选项,因为在大多数情况下,您将提供不适合的整个段落或文件。

问答对

要提供您自己的 QnA 对,请使用 data_type 作为 qna_pair 并输入一个元组。例如:

app.add_local('qna_pair', ("Question", "Answer"))

重用矢量数据库

默认行为是在目录 ./db 中创建持久向量 DB。您可以将应用程序拆分为两个 Python 脚本:一个用于创建本地矢量数据库,另一个用于重用此本地持久矢量数据库。当您想要索引数百个文档并单独实现聊天界面时,这非常有用。

创建本地索引:

from embedchain import App
naval_chat_bot = App()naval_chat_bot.add("youtube_video", "https://www.youtube.com/watch?v=3qHkcs3kG44")naval_chat_bot.add("pdf_file", "https://navalmanack.s3.amazonaws.com/Eric-Jorgenson_The-Almanack-of-Naval-Ravikant_Final.pdf")

您可以使用相同的代码重用本地索引,但无需添加新文档:

from embedchain import App
naval_chat_bot = App()print(naval_chat_bot.query("What unique capacity does Naval argue humans possess when it comes to understanding explanations or concepts?"))

项目链接

https://github.com/embedchain/embedchain

原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun267430.html

(0)
打赏 微信扫一扫不于多少! 微信扫一扫不于多少! 支付宝扫一扫礼轻情意重 支付宝扫一扫礼轻情意重
上一篇 2023年11月23日 下午12:09
下一篇 2023年11月24日 下午9:50

相关推荐