日期:2023-06-26 17:23:08 来源:Python七号
今天偶然翻到一个仓库 Embedchain,觉得很实用,分享给大家。仓库地址如下:
【资料图】
https://github.com/embedchain/embedchain
它是基于 OpenAI 的,但是你可以添加自己的数据集,然后生成一个对话机器人,使用方法简单,很容易上手。
Embedchain 简介Embedchain 是一个可以方便地基于任何数据集创建 LLM(Large Language Models)机器人的框架。它抽象了加载数据集、分块、创建嵌入向量以及存储在向量数据库中的整个过程。你可以使用.add和.add_local函数添加单个或多个数据集,然后使用.query函数从添加的数据集中查找答案。
假如你崇拜一个很厉害的人 - Naval Ravikant,你想把他的知识做成一个对话机器人,你可以把他的 Youtube 视频、PDF 书籍、博客文章,以及你提供的一个问题和答案对,添加到 Embedchain,Embedchain 将为你创建一个机器人。这是一个例子:
from embedchain import Appnaval_chat_bot = App()# 嵌入在线资源naval_chat_bot.add("youtube_video", "https://www.youtube.com/watch?v=3qHkcs3kG44")naval_chat_bot.add("pdf_file", "https://navalmanack.s3.amazonaws.com/Eric-Jorgenson_The-Almanack-of-Naval-Ravikant_Final.pdf")naval_chat_bot.add("web_page", "https://nav.al/feedback")naval_chat_bot.add("web_page", "https://nav.al/agi")# 嵌入本地资源naval_chat_bot.add_local("qna_pair", ("Who is Naval Ravikant?", "Naval Ravikant is an Indian-American entrepreneur and investor."))naval_chat_bot.query("What unique capacity does Naval argue humans possess when it comes to understanding explanations or concepts?")# 答案:Naval 认为,人类在理解解释或概念方面拥有独特的能力,这是在这个物理现实中可能的最大程度。
Embedchain 使用要开始使用 Embedchain,首先确保你已经安装了该包。如果还没有安装,可以使用pip进行安装:
pip install embedchain
Embedchain使用 OpenAI 的嵌入模型创建块的嵌入,使用 ChatGPT API 作为 LLM,给出相关文档的答案。确保你有一个 OpenAI 帐户和 API 密钥。如果你没有 API 密钥,可以通过访问此链接[1]创建一个。
一旦你有了 API 密钥,将其设置在一个名为OPENAI_API_KEY的环境变量中
import osos.environ["OPENAI_API_KEY"] = "sk-xxxx"
接下来,从 embedchain 中导入App类并使用.add函数添加任何数据集。
from embedchain import Appnaval_chat_bot = App()# 嵌入在线资源naval_chat_bot.add("youtube_video", "https://www.youtube.com/watch?v=3qHkcs3kG44")naval_chat_bot.add("pdf_file", "https://navalmanack.s3.amazonaws.com/Eric-Jorgenson_The-Almanack-of-Naval-Ravikant_Final.pdf")naval_chat_bot.add("web_page", "https://nav.al/feedback")naval_chat_bot.add("web_page", "https://nav.al/agi")# 嵌入本地资源naval_chat_bot.add_local("qna_pair", ("Who is Naval Ravikant?", "Naval Ravikant is an Indian-American entrepreneur and investor."))
如果在你的脚本或应用中有任何其他的应用实例,你可以更改导入如下
from embedchain import App as EmbedChainApp# 或者from embedchain import App as ECApp
现在你的应用已经创建好了。可以使用.query函数获得任何查询的答案。
print(naval_chat_bot.query("What unique capacity does Naval argue humans possess when it comes to understanding explanations or concepts?"))# answer: Naval argues that humans possess the unique capacity to understand explanations or concepts to the maximum extent possible in this physical reality.
支持的格式支持以下格式:
Youtube 视频要将任何 Youtube 视频添加到你的应用中,使用数据类型(.add的第一个参数)为youtube_video。例如:
app.add("youtube_video", "a_valid_youtube_url_here")
PDF 文件要添加任何 PDF 文件,使用数据类型为pdf_file。例如:
app.add("pdf_file", "a_valid_url_where_pdf_file_can_be_accessed")
注意,不支持密码保护的 PDF。
网页要添加任何网页,使用数据类型为web_page。例如:
app.add("web_page", "a_valid_web_page_url")
文本要提供你自己的文本,使用数据类型为text并输入一个字符串。文本不会被处理,这可以非常多样化。例如:
app.add_local("text", "Seek wealth, not money or status. Wealth is having assets that earn while you sleep. Money is how we transfer time and wealth. Status is your place in the social hierarchy.")
注意:这在示例中没有使用,因为在大多数情况下,你将提供整个段落或文件。
标签:
上一篇: 香港六和合神算子456888开奖结果_帕特莱利为什么叫神算子
下一篇: 最后一页
基于任何数据集创建LLM(Large Language Models)机器人
香港六和合神算子456888开奖结果_帕特莱利为什么叫神算子
2023年6月海南汽车指标摇号结果查询时间及入口
今日关注:中国女篮45分大胜黎巴嫩女篮,收获亚洲杯开门红
环球快报:不想头发白得太早,3个保养方法要记住
巨潮网上市公司的财务报告 巨潮网上市公司报表|环球视点
证券行业2023年中期策略:正值山鸣谷应 期待风起水涌|观热点
极兔速递环球有限公司向港交所提交上市申请书
【天风机械】机器人:零部件选型逻辑及空间几何?
头条焦点:合康新能、创维、TCL等家电巨头布局光伏
这个间歇期对于河南队来讲是一个难得的喘息之机 世界最资讯
世界观察:高尔夫——殷若宁获PGA女子锦标赛冠军
天天百事通!重要提醒!这个时间段,住房公积金部分业务暂停办理
热搜第一!又要调休,这次是“休八上七”
网银怎么转账可以延时还能撤回-网银怎么转账|全球观热点
狂野飙车7存档位置_狂野飙车7存档-环球今亮点
简讯:奔驰发布了一台诺基亚
PKM个人知识管理:解锁智慧,掌握未来
焦点资讯:百家云:董事长及总裁作出未来12个月锁定承诺
维罗:米兰准备将阵型变为433以吸引弗拉泰西加盟...
开封市顺河回族区:“三到位”筑牢防溺水“安全屏障” 焦点信息
出海记·走进非洲④丨一脉清渠 引川归海
天天资讯:吉林省开展工作农药包装废弃物回收处理培训
抖音公开“用于搜索订单的方法”专利 预测用户可能感兴趣订单
环球百事通!【科大讯飞】参评“维科杯·OFweek 2023中国工业自动化与数字化行业卓越技术创新企业奖”