目录
Transformers,无所不能
什么是工具?什么是智能体?
代码生成
首页 科技周边 人工智能 人手AutoGPT!让ChatGPT自选10万+AI模型,HuggingFace官方出品

人手AutoGPT!让ChatGPT自选10万+AI模型,HuggingFace官方出品

May 22, 2023 pm 11:04 PM
ai 模型

前段时间,浙大微软团队提出的HuggingGPT在整个科技圈爆火。

这个大模型协作系统利用ChatGPT作为控制器,随意调用HuggingFace中的各种模型,以实现多模态任务。

让ChatGPT当「老板」,已经成为许多人看好的方向。

这不,该来的还是来了......

全球最火的AI社区HuggingFace官方出品「Transformers Agent」,通过控制10万多个AI,也能实现魔法。

人手AutoGPT!让ChatGPT自选10万+AI模型,HuggingFace官方出品

英伟达科学家Jim Fan称赞道,这是向Everything App迈出的第一步,随着生态系统的扩大,它的能力也不断增长。

他继续表示,HuggingGPT是这一想法首次大规模地展示,它使用GPT作为控制器,动态地选择工具(模型)来解决多阶段任务。

ChatGPT的「App Store」当然是AI工具生态系统应用的一个实例。全新Transformers Agent让你拥有超强buff,快速构建AI智能体。

Transformers,无所不能

用上Transformers Agent,你可以张口来图,还能让它为你读出来。

先来看看几个例子~

<code>agent.run("Caption the following image", image=image)</code>
登录后复制

人手AutoGPT!让ChatGPT自选10万+AI模型,HuggingFace官方出品

第一个先从简单的开始。输入一张图片然后配个解说,一只可爱的河狸在水里游泳(超可爱,想rua)。

<code>agent.run("Read the following text out loud", text=text)</code>
登录后复制

人手AutoGPT!让ChatGPT自选10万+AI模型,HuggingFace官方出品

第二个也不难,简简单单文字转语音。

<code>agent.run("In the following `document`, where will the TRRF Scientific Advisory Council Meeting take place?",document=document,)</code>
登录后复制

人手AutoGPT!让ChatGPT自选10万+AI模型,HuggingFace官方出品

这个上了点难度。输入的要求是,说出科学咨询委员会会议将在哪里举办。

当然对AI来说,检索到最后一行也是找到了答案。

用户在使用agent.run之前,需要将一个智能体实例化,也就是一个大型语言模型(LLM)。

研究人员提供了对OpenAI模型的支持,以及来自BigCode和OpenAssistant的开源替代品。

虽然OpenAI的模型性能更好,但用户得有OpenAI的API密钥,所以不是免费使用。

Hugging Face表示,正在提供BigCode和OpenAssistant等模型的免费访问端点。

首先,用户需要安装智能体附加程序。

<code>pip install transformers[agents]</code>
登录后复制

要想使用OpenAI的模型,用户需要在安装OpenAI dependency项后实例化一个OpenAiAgent:

<code>pip install openaifrom transformers import OpenAiAgentagent = OpenAiAgent(model="text-davinci-003", api_key="<your_api_key>")</code>
登录后复制

用户要使用BigCode或OpenAssistant的话,得先登录,以便能够访问API:

<code>from huggingface_hub import loginlogin("<YOUR_TOKEN>")</code>
登录后复制

然后,将智能体实例化:

<code>from transformers import HfAgent# Starcoderagent = HfAgent("https://api-inference.huggingface.co/models/bigcode/starcoder")# StarcoderBase# agent = HfAgent("https://api-inference.huggingface.co/models/bigcode/starcoderbase")# OpenAssistant# agent = HfAgent(url_endpoint="https://api-inference.huggingface.co/models/OpenAssistant/oasst-sft-4-pythia-12b-epoch-3.5")</code>
登录后复制

这是在使用Hugging Face目前免费提供的推理API。如果用户有自己的推理端点,就可以替换上面的URL。

StarCoder和OpenAssistant是免费使用的,在简单的任务上表现得不错。

然而,在处理更复杂的提示时,检查点就不成立了。如果用户面临这样的问题,可以尝试一下OpenAI模型,虽然很遗憾它不是开源的,但胜在表现不错。

单一执行方法是在使用代理的run()方法时使用的:

<code>agent.run("Draw me a picture of rivers and lakes.")</code>
登录后复制

它自动选择适合你要执行的任务的工具(或工具)并适当地运行它们。它可以在同一指令中执行一个或几个任务(你的指令越复杂,就越有可能失败)。

<code>agent.run("Draw me a picture of the sea then transform the picture to add an island")</code>
登录后复制

人手AutoGPT!让ChatGPT自选10万+AI模型,HuggingFace官方出品

每个run()操作都是独立的,所以你可以用不同的任务连续运行几次。

请注意,用户的智能体只是一个大语言模型,所以prompt中的小变化可能产生完全不同的结果。尽可能清楚地解释要执行的任务是很重要的。

研究人员深入地讨论了如何写出更好的prompt。

如果你想在整个执行过程中保持一个状态,或者向智能体传递非文本对象,你可以通过指定变量来做到这一点。

例如,你可以生成第一张河流和湖泊的图片,并要求模型通过以下方式更新该图片以增加一个岛屿:

<code>picture = agent.run("Generate a picture of rivers and lakes.")updated_picture = agent.run("Transform the image in `picture` to add an island to it.", picture=picture)agent.chat("Generate a picture of rivers and lakes")</code>
登录后复制

人手AutoGPT!让ChatGPT自选10万+AI模型,HuggingFace官方出品

这里让系统生成一张河流湖泊的照片。

<code>agent.chat("Transform the picture so that there is a rock in there")</code>
登录后复制

人手AutoGPT!让ChatGPT自选10万+AI模型,HuggingFace官方出品

下一步,研究人员又让系统给原图中加一个岛屿。

当用户想保持跨指令的状态时,这是一个很有趣的方法。

它更适合于实验,但往往在单条指令而不是复杂指令方面会好很多。

如果你想传递非文本类型或特定的提示,这个方法也可以接受参数。

要了解如何自己设置远程执行器工具,研究人员建议用户阅读自定义工具指南。

为了与远程工具一起运行,在run()或chat()中指定remote=True就可以了。

例如,以下命令可以在任何设备上有效地运行,不需要大量的RAM或GPU:

<code>agent.run("Draw me a picture of rivers and lakes", remote=True)</code>
登录后复制

对chat()来说也是一样的:

<code>agent.chat("Draw me a picture of rivers and lakes", remote=True)</code>
登录后复制

网友表示,Transformers Agent就像AutoGPT一样。

人手AutoGPT!让ChatGPT自选10万+AI模型,HuggingFace官方出品

还有人表示,Transformers Agent打开了自然语言编程的大门,可以想象,未来的操作系统就是智能模型,人类通过自然语言编排任务,越来越多的非开发者可以自己实现各种计算机应用。

人手AutoGPT!让ChatGPT自选10万+AI模型,HuggingFace官方出品

什么是工具?什么是智能体?

Transformers Agents整体的运作流程简单分为四步:

设定目标、提供工具、展示示例、下达任务。

智能体会使用链式思考推理来确定其任务,并用提供的工具输出Python代码。

如何安装和使用,官方给出了具体步骤。

人手AutoGPT!让ChatGPT自选10万+AI模型,HuggingFace官方出品

https://www.php.cn/link/e4f67a0e4293245fba713c412fc63e28

其中,这里的「智能体」指的是,一个大型语言模型。通过提示LLM,让其访问特定的一组工具。

因为LLM非常擅长生成较小的代码样本,所以API利用了这一点优势。

你可以用抱抱脸自家的OpenAssistant、StarCoder,甚至还可以用OpenAI的模型。

提示LLM给出一个小的代码样本,并用一组工具执行一个任务。这个提示包括,给智能体的任务,以及工具的描述。

这样,「智能体」就可以找到所使用工具的文档,特别是预期的输入和输出,并可以生成相关的代码。

人手AutoGPT!让ChatGPT自选10万+AI模型,HuggingFace官方出品

而「工具」就非常好理解,是一个单独的函数,带有名称和描述。

然后,使用这些工具的描述来提示「智能体」,作用就在于可以像智能体展示如何用工具来执行查询中的请求内容。

再之后,通过利用Python解释器在与工具一起上传的一组输入中执行代码。

如果唯一调用的函数是你自己提供的工具和print函数,那么,开发者会在可执行内容上受到限制。当然了,抱抱脸社区的工具,是比较安全的。

除此之外,HuggingFace在Transformers Agents中还集成了以下工具:

- 文档问答:给定一个图像格式的文档(PDF),回答文档的问题(Donut) 

- 文本问答:给定一个长文本和一个问题,回答文本中的问题(Flan-T5) 

- 无条件给图像加标题:(BLIP) 

- 图像问答:给定一个图像,回答关于这个图像的问题(VILT) 

- 图像分割:给定一个图像和一个提示,输出该提示的分割掩码(CLIPSeg) 

- 语音转文本:给定一个音频记录,将语音转录为文本(Whisper) 

- 文本到语音:将文本转换为语音(SpeechT5) 

- 零样本文本分类:给定一个文本和一列标签,确定该文本与哪个标签最对应(BART) 

- 文本总结:用一个或几个句子来总结一个长文本(BART) 

- 翻译:将文本翻译成一种语言(NLLB)

这些工具都内置在Transformers中,也可以手动使用,比如:

<code>from transformers import load_tooltool = load_tool("text-to-speech")audio = tool("This is a text to speech tool")</code>
登录后复制

此外,还有一些定制的工具集成在Transformers Agents中,其中包括文本下载器、文本到图像的扩散模型stable diffusion、图像变换instruct pix2pix stable diffusion,以及文本到视频damo-vilab。

官方给出了一个自定义工具和提示的教程:

人手AutoGPT!让ChatGPT自选10万+AI模型,HuggingFace官方出品

https://www.php.cn/link/735a8b95123648555736192cd3978bc1

代码生成

如上,已经展示了如何使用Transformers Agents流程。

但是,智能体只生成代码,通过使用非常受限的Python解释器执行这些代码。

如果你希望使用在不同设置中生成的代码,可以提示智能体返回代码,对工具定义,并准确导入。

比如,根据以下步骤实现:

<code>agent.run("Draw me a picture of rivers and lakes", return_code=True)</code>
登录后复制

返回以下代码:

<code>from transformers import load_toolimage_generator = load_tool("huggingface-tools/text-to-image")image = image_generator(prompt="rivers and lakes")</code>
登录后复制

然后,你就可以修改和执行自己的工具了。

以上是人手AutoGPT!让ChatGPT自选10万+AI模型,HuggingFace官方出品的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

web3交易平台排行榜_web3全球交易所前十名汇总 web3交易平台排行榜_web3全球交易所前十名汇总 Apr 21, 2025 am 10:45 AM

币安是全球数字资产交易生态的霸主,其特点包括:1. 日均交易量突破$1500亿,支持500 交易对,覆盖98%主流币种;2. 创新矩阵涵盖衍生品市场、Web3布局和教育体系;3. 技术优势为毫秒级撮合引擎,峰值处理量达140万笔/秒;4. 合规进展持有15国牌照,并在欧美设立合规实体。

对于加密货币行业来说,'黑色星期一抛售”是艰难的一天 对于加密货币行业来说,'黑色星期一抛售”是艰难的一天 Apr 21, 2025 pm 02:48 PM

加密货币市场暴跌引发投资者恐慌,Dogecoin(Doge)成为重灾区之一。其价格大幅下挫,去中心化金融(DeFi)总价值锁定(TVL)也出现显着下降。 “黑色星期一”的抛售潮席卷加密货币市场,Dogecoin首当其冲。其DeFiTVL跌至2023年水平,币价在过去一个月内下跌23.78%。 Dogecoin的DeFiTVL降至272万美元的低点,主要原因是SOSO价值指数下跌26.37%。其他主要DeFi平台,如无聊的Dao和Thorchain,TVL也分别下降了24.04%和20.

十大加密货币交易所平台 世界最大的数字货币交易所榜单 十大加密货币交易所平台 世界最大的数字货币交易所榜单 Apr 21, 2025 pm 07:15 PM

在当今的加密货币市场中,交易所扮演着至关重要的角色,它们不仅是投资者进行买卖交易的平台,更是市场流动性和价格发现的重要来源。全球最大的虚拟货币交易所排行前十,这些交易所不仅在交易量上遥遥领先,而且在用户体验、安全性和创新服务方面也各有千秋。排行榜首的交易所通常拥有庞大的用户基础和广泛的市场影响力,它们的交易量和资产种类往往是其他交易所难以企及的。

Rexas Finance(RXS)可以在2025年超过Solana(Sol),Cardano(ADA),XRP和Dogecoin(Doge) Rexas Finance(RXS)可以在2025年超过Solana(Sol),Cardano(ADA),XRP和Dogecoin(Doge) Apr 21, 2025 pm 02:30 PM

在波动剧烈的加密货币市场中,投资者正寻求超越热门币种的替代方案。Solana(SOL)、Cardano(ADA)、XRP和Dogecoin(DOGE)等知名加密货币,尽管占据着一定的市场地位,但也面临着市场情绪、监管不确定性和可扩展性等挑战。然而,一个新兴项目RexasFinance(RXS)正在崭露头角。它并非依靠名人效应或炒作,而是专注于将现实世界资产(RWA)与区块链技术结合,为投资者提供一种创新的投资方式。这一策略使其有望成为2025年最成功的项目之一。RexasFi

WorldCoin(WLD)价格预测2025-2031:到2031年WLD会达到4美元吗? WorldCoin(WLD)价格预测2025-2031:到2031年WLD会达到4美元吗? Apr 21, 2025 pm 02:42 PM

WorldCoin(WLD)凭借其独特的生物识别验证和隐私保护机制,在加密货币市场中脱颖而出,吸引了众多投资者的目光。 WLD凭借其创新技术,特别是结合OpenAI人工智能技术,在众多山寨币中表现突出。但未来几年,数字资产的走势如何呢?让我们一起预测WLD的未来价格。 2025年WLD价格预测预计2025年WLD将实现显着增长。市场分析显示,WLD平均价格可能达到1.31美元,最高可能触及1.36美元。然而,在熊市情况下,价格可能跌至0.55美元左右。这一增长预期主要源于WorldCoin2.

Web3社交媒体平台TOX与Omni Labs合作,以集成AI基础架构 Web3社交媒体平台TOX与Omni Labs合作,以集成AI基础架构 Apr 21, 2025 pm 07:06 PM

去中心化社交媒体平台Tox与人工智能基础设施解决方案领导者OmniLabs达成战略合作,将人工智能功能整合到Web3生态系统中。此合作关系由Tox官方X账号发布,旨在构建更公平、更智能的在线环境。OmniLabs以其智能自主系统而闻名,其AI即服务(AIaaS)功能支持众多DeFi和NFT协议。其基础设施利用AI代理进行实时决策、自动化流程和深入数据分析,旨在无缝集成到去中心化生态系统中,为区块链平台赋能。与Tox的合作将使OmniLabs的AI工具覆盖范围更广,通过整合到去中心化社交网络中,

币圈杠杆交易所排名 币圈十大杠杆交易所APP最新推荐 币圈杠杆交易所排名 币圈十大杠杆交易所APP最新推荐 Apr 21, 2025 pm 11:24 PM

2025年在杠杆交易、安全性和用户体验方面表现突出的平台有:1. OKX,适合高频交易者,提供最高100倍杠杆;2. Binance,适用于全球多币种交易者,提供125倍高杠杆;3. Gate.io,适合衍生品专业玩家,提供100倍杠杆;4. Bitget,适用于新手及社交化交易者,提供最高100倍杠杆;5. Kraken,适合稳健型投资者,提供5倍杠杆;6. Bybit,适用于山寨币探索者,提供20倍杠杆;7. KuCoin,适合低成本交易者,提供10倍杠杆;8. Bitfinex,适合资深玩

币圈交易所前十的平台是哪些? 币圈交易所前十的平台是哪些? Apr 21, 2025 pm 12:21 PM

头部交易所包括:1. 币安(Binance),全球最大交易量,支持600 币种,现货手续费0.1%;2. OKX,均衡型平台,支持708交易对,永续合约手续费0.05%;3. Gate.io,覆盖2700 小币种,现货手续费0.1%-0.3%;4. Coinbase,美国合规标杆,现货手续费0.5%;5. Kraken,安全性顶尖,定期储备审计。

See all articles