Pinecone Canopy:生成Ai Edo Liberty认识到将AI模型与矢量搜索相结合的变革力量。这种见解导致了2019年Pinecone的创建,这是一个旨在使访问最先进AI应用程序的媒介数据库。 Pinecone在这个基础的基础上,最近推出了Canopy,这是一个开源检索增强一代(RAG)框架。
冠层通过使复杂的抹布任务自动化来简化生成AI应用程序的开发。 这包括管理聊天历史记录,文本块和嵌入,查询优化,上下文检索(包括及时的工程)以及增强生成。 结果是部署准备生产的破布应用程序的速度更快,更容易。 Pinecone声称用户可以在一个小时内实现这一目标。>
Pinecone Canopy的关键特征和优势:
免费级别:访问免费层的免费层,最多可容纳100,000个嵌入(约1500万个单词或30,000页)。 未来计划免费嵌入模型和LLM。
>
>- >易用性:支持各种数据格式(JSONL,PARQUET,纯文本,PDF支持即将推出)。 与OpenAI LLM的无缝集成,包括GPT-4 Turbo,以及对其他LLM和嵌入模型的未来支持。>
可伸缩性:- 利用Pinecone的鲁棒向量数据库,以规模为可靠,高性能的Genai应用。>
灵活性:- 模块化和可扩展设计允许自定义应用程序开发。 可通过REST API部署为Web服务,并轻松地集成到现有的OpenAI应用程序中。
迭代开发:互动CLI可以轻松地比较抹布和非剥离工作流程,从而促进迭代开发和评估。
- 设置Pinecone Canopy环境:
- > 帐户设置:注册Pinecone标准或企业帐户。 没有信用卡的免费基于POD的索引。 新用户获得100美元的无服务器信用。
>
安装:- 使用
安装冠层SDK。 建议使用虚拟环境(例如,)。
- API键:
从Pinecone控制台(API Keys部分)获取您的。 设置以下环境变量:>,pip install canopy-sdk
和python3 -m venv canopy-env; source canopy-env/bin/activate
(如果省略,则使用默认值)。 使用
命令(例如, )。-
-
验证:使用canopy
验证安装。 成功的安装显示“ Canopy:Ready”消息和使用说明。
>您的第一个Pinecone Canopy项目:
-
索引创建:使用创建一个新的松果索引,然后遵循CLI提示。 索引名称将具有一个前缀。canopy new
canopy--
> - 数据上升:
>使用加载数据,指定数据目录或文件的路径(JSONL,Parquet,CSV或纯文本)。 使用编写或覆盖记录;使用canopy upsert
进行部分记录修改。 对于大型数据集,以100或更少的组为单位。upsert
>
update
- >服务器启动:
使用启动Canopy Server。 这将启动可通过访问的REST API,以与聊天应用程序集成。>
canopy start
/chat.completion
冠层体系结构:
冠层包括三个核心组件:
知识库:准备抹布的数据,文本块并创建用于Pinecone中的存储的嵌入。-
基于查询,从Pinecone中检索相关文档,为LLM创建上下文。
冠层聊天引擎:
管理完整的抹布工作流程,包括聊天历史记录,查询生成和响应综合。-
高级功能和最佳实践:
-
缩放:
缩放松果索引(更多资源)或水平(更多的机器)来处理大型数据集。 使用名称空间来分区数据以进行有效的查询。
>
性能优化:在准备数据时考虑块尺寸以优化抹布性能和准确性。-
结论:
Pinecone Canopy提供了一种用户友好,有效的方法来构建抹布应用程序。 它简化的工作流程和强大的功能使所有技能水平的开发人员都充分利用抹布的力量为生成AI。 探索提供的链接以进行进一步的学习和示例。
- (显示Canopy的体系结构的图)
以上是使用Pinecone Canopy构建智能应用:初学者指南的详细内容。更多信息请关注PHP中文网其他相关文章!