自主 AI 来了?一文详解火爆全网的 AutoGPT
2023-05-04 10:08:08 来源:CSDN公众号

你是否曾听说过开源项目 Auto-GPT?该项目使用各种技巧打造的 GPT 可以围绕某个特定的目标自主完成任务,还为 GPT 提供了一个可执行命令列表,帮助它朝着总体目标持续迈进。

我尝试使用 Auto-GPT 获得了一些有趣的结果,我还深入查看了项目的整体架构,github 上10万+的 Star 数表明了其巨大的发展潜力。

为了更好地理解 Auto-GPT 的概念及其工作原理,我们将深入探讨以下核心领域:


(资料图片)

▶ 该项目使用了哪些模型?

▶如何让 GPT 具备记忆力?

▶如何提高 GPT 的响应可靠性?

▶如何解析 GPT 的响应?

▶如何指定 GPT 可以执行的命令?

模型

在撰写本文之际,Auto-GPT 仅支持 OpenAI 的 GPT 模型。如果你不熟悉 OpenAI,请参考官方文档(参考链接:https://platform.openai.com/docs/guides/chat/introduction),了解 API 与模型的互动。

在使用GPT-3.5-turbo 和 GPT-4测试了 Auto-GPT 之后,我发现仍有改进的空间,但是通过GPT-4获得的输出远胜于GPT-3.5-turbo。包括 token 限制在内的所有设置,都可以直接在 .env 文件中配android置,例如可以利用 token 限制控制输入(上下文)和输出(响应)的长度,从而控制成本。

我看到了一些与 LangChain 集成的拉取请求,这意味着Auto-GPT可以访问其他开源模型了,但也许项目本身也有集成其他模型的计划。我不打算在此深入研究 OpenAI API 或其他开源模型,但在接下来几个主题的讨论中,了解一些大型语言模型的背景会有所帮助。

如何让 GPT 具备记忆力?

GPT 模型的设计并没有考虑记忆力,然而 Auto-GPT 使用外部记忆模块消除了这个限制。在深入了解如何让 GPT 具备记忆力之前,我们先来介绍几个概念:

▶嵌入

▶向量存储与搜索

▶OpenAI 的聊天补全 API

嵌入是文本的向量表示,可以更轻松地用于各种机器学习的模型或算法。Auto-GPT 使用了 OpenAI 的嵌入 API 根据 GPT 文本输出创建嵌入。

我们可以使用的向量存储服务有很多。Auto-GPT 使用的是:本地存储、Pinecone(第三方服务)、Redis 和 Milvus(开源服务)。Pinecone 和 Milvus 优化了向量搜索算法,可以根据相关上下文搜索文本嵌入。

Auto-GPT 将嵌入存储到这些向量存储服务之一,然后通过搜索当前任务会话的相关向量将上下文注入到 GPT。下面是这段代码的核心部分:

图片源自:https://github.com/Significant-Gravitas/Auto-GP编程客栈T/blob/master/autogpt/chat.py

OpenAI 的聊天补全 API 拥有“系统”角色的概念,用于为 GPT 提供初始身份、约束和上下文。你可以看到在上述代码片段中,relevant_memory 被注入到对话中,作为 GPT 过去事件的引用。此外,Auto-GPT 还将相应角色完整的聊天对话传递给了聊天补全 API(最大长度为 token 的上限)。

给出提示以获得可靠的响应

在对话刚开始的时候,Auto-GPT 使用“系统”角色来配置约束,并进行自我绩效评估。Auto-GPT 有一个提示生成器,其中一些约束是硬编码的:

图片源自:https://github.com/Significant-Gravitas/Auto-GPT/blob/master/autogpt/prompts/prompt.py

我们看到在这些提示的引导下,GPT 的自主性和自力更生能力都得到了提高,还能看到很多通过持续反馈循环来帮助 GPT 自我改进输出的案例。我不确定下面的自我绩效评估提示是否能达编程到同样的效果,但至少这段代码奠定了基础:

图片源自:https://github.com/Significant-Gravitas/Auto-GPT/blob/master/autogpt/prompts/prompt.py

初始角色还有一些额外的提示。不过,需要指出的是:“每个命令都有成本,所以一定要确保智能且高效。我们的目标是以最少的步骤完成任务。”由于我们稍后会查看命令以及 GPT 执行每个命令的过程,因此这一行代码很重要,可以确保响应尽可能高效,避免不必要的步骤(使用更多 token),保证最低成本。

解读响应

这可能是理解 Auto-GPT 内部工pwawl作原理最重要的方面。如果不能有效地解释响应,就不应该让 GPT 执行命令(即允许它访问外部世界)。Auto-GPT 使用了一种非常简单但很强大的提示技术来确保 GPT 以固定的 jsON 格式响应,然后通过代码进行解析:

图片源自:https://github.com/Significant-Gravitas/Auto-GPT/blob/master/autogpt/prompts/generator.py

在测试中,我使用了固定格式的响应,从结果看来 GPT-3.5-turbo 非常高效,尽管偶尔也有一些幻觉(相比之下 GPT-4更可靠)。我们通过这种方法指示 GPT 执行命令,还需要检查结果。在 GPT 执行命令时,响应的信息包含在 command 对象中。

与现实世界互动

自主代理要想真正发挥作用就必须能编程客栈够完成实际的工作,并与现实世界交互,比如文件系统或互联网等。Auto-GPT 必须编写能授权 GPT 执行的每个命令,在生成约束和自我评估的初始提示时,还可以提供可执行命令及其参数的列表。下面是将命令添加到提示符的类函数:

图片来源:https://github.com/Significant-Gravitas/Auto-GPT/blob/master/autogpt/prompts/generator.py

基本的提示生成器中有一个预定义的命令列表:

图片来源:https://github.com/Significant-Gravitas/Auto-GPT/blob/stable/autogpt/prompt.py

这是 GPT 引用命令的格式,可以使用参数执行命令。以下代码可以将最终提示格式化为 GPT 的字符串:

图片来源:https://github.com/Significant-Gravitas/Auto-GPT/blob/master/autogpt/prompts/generator.py

如你所见,这段代码集合了上述所有功能。这个提示可以为 GPT 提供约束条件、自我评估的方向、资源、命令以及响应格式。接下来,在解析 GPT 返回的响应时,我们就很清楚它所执行的命令和参数了。最后一步是执行命令:

图片来源:https://github.com/Significant-Gravitas/Auto-GPT/blob/stable/autogpt/app.py

在这段代码中,在解析 GPT 的响应后,每个命令都获得了自己的参数,然后执行。GPT 的命令之一是 task_completed,如果在连续模式下运行,程序将在 GPT 实现目标后关闭或退出:

图片来源:https://github.com/Significant-Gravitas/Auto-GPT/blob/master/autogpt/app.py

BabyAGI

BabyAGI 也使用了类似的概念,但大大简化了实现(整体功能较少)。它支持 LLaMA 和 OpenAI 作为模型输入,在提供目标和初始任务后,创建三个代理来执行目标:任务执行代理、任务创建代理和任务优先级代理。每个代理都有自己的提示和约束,包括来自每个相关任务执行的上下文。这个过程将循环执行,直到没有剩余的任务并且目标完成。

Auto-GPT 和 BabyAGI 都获得了大量关注,并且正在不断改进。

总结

毋庸置疑,很多人为这些项目做出了努力,并在不断改进它们。这些项目是 AI 领域向前迈出的激动人心的一步,我们距离 AI 自主完成任务并在生活方方面面协助我们的未来更近了一步。我要强调的不仅仅是一些核心概念,这些概念可以帮助我们了解其内部运作方式,并为自主代理的新世界做出贡献。

自主 AI 来了?一文详解火爆全网的 AutoGPT

2023-05-04

专访万达影视尹香今:项目投资主要看创新性 希望电影档期更多

2023-05-04

【世界快播报】温州S1线屡创新高!单日客流突破6.2万人次

2023-05-04

候补购票成功率多少_候补购票的成功率是多少

2023-05-04

【天天播资讯】危机才刚开始!经济学家:今年三家美国银行倒闭规模已超过2008年危机时全年

2023-05-04

全球最资讯丨微博怎么更改昵称 微博怎么更改昵称位置

2023-05-04

【诺唯赞】2022年报及一季报点评:常规业务增长稳健,产品布局持续推进 世界时快讯

2023-05-04

弘业期货(03678.HK):5月3日南向资金减持113.9万股 全球焦点

2023-05-04

全球最新:如何开通黄钻(qq 黄钻功能)

2023-05-04

公历是农历的意思吗_公历是快的还是慢的

2023-05-04

每日焦点!不加鸡蛋的蛋糕做法(不加鸡蛋的蛋糕做法电饭锅)

2023-05-03

头条:联通最低套餐是多少元月租_联通最低套餐

2023-05-03

当前资讯!一叶障目不见泰山的意思是什么_一叶障目不见泰山的含义

2023-05-03

杨瀚森领衔!国青男篮海外拉练,辽篮1人,山东男篮0人,3人伤退_实时焦点

2023-05-03

小额投资买什么比较好 小额投资什么比较好而且稳定 环球视点

2023-05-03

马克思主义认为世界的真正统一性在于它的_全球播报

2023-05-03

沃尔沃汽车4月中国市场销量达12543辆 同比增长46%-全球热点

2023-05-03

香港恒生指数5月3日(周三)收盘下跌234.65点,跌幅1.18%,报19699.16点-全球看点

2023-05-03

近期市区二手房成交亮眼_世界新动态

2023-05-03

比以前所有“五一”假期都更火 飞猪国内游预订量较春节翻倍增长

2023-05-03

夫菱生于水而曰土产什么意思_夫菱生于水而曰土产出自哪里

2023-05-03

试车日志|第五代智能电混加持 雷凌还是家用车的首选吗?

2023-05-03

港股异动 | 金风科技(02208)跌近6% 股价创逾2年半新低 一季度营收、净利润双降 每日资讯

2023-05-03

前沿热点:上周五应为高点,节日后仍需要防跌

2023-05-03

视频·松鼠鉴食丨口香糖不小心咽下会怎么样? 热点评

2023-05-03

全球观焦点:“五大工程”擦亮天津援青品牌 推动黄南州巩固拓展脱贫攻坚成果同乡村振兴有效衔接

2023-05-03

今日部分民航飞行航路和机场航班起降将受降雨影响

2023-05-03

蓝牙耳机单边免提是什么意思_蓝牙耳机单边免提的解释_焦点播报

2023-05-03

当前观察:诛仙鬼王完美加点图片_诛仙鬼王完美加点

2023-05-03

5年办理侵犯知识产权犯罪审查起诉案件260件_世界热头条

2023-05-03

销量轻松破10万+,魅族20热度太高了!但这些缺点也必须知道

2023-05-03

词根词缀记忆英语3500单词_词根词缀速记20000单词 天天视点

2023-05-03

世界新动态:中青漫评丨跟着“二次元”动车“守护神” 给动车组做“体检”

2023-05-02

每日热议!五一健康提示③|出游要小心草丛“杀手”

2023-05-02

挺进地下一万米 亚洲最深井在塔里木盆地开钻施工

2023-05-02

白领利用假期时间就医为健康“加油”,武汉市中心医院“无假日医疗”为健康护航

2023-05-02

全球热资讯!孙浩铭

2023-05-02

劳动者的十二时辰 致敬全国各地辛勤工作的工程建设者们 全球实时

2023-05-02

腐乳的营养是什么_腐乳的介绍 环球热推荐

2023-05-02

全球热资讯!假期返程高峰 湖北将迎强降雨 局地有雷暴大风、冰雹

2023-05-02

世界聚焦:日媒:时隔近一个月,自卫队高官所乘失事直升机被从海里捞上来

2023-05-02

大摩:予美高梅中国(02282)“增持”评级 目标价13港元 环球新视野

2023-05-02

【与你“邮”约】“方寸”里的河北与世界-天天快消息

2023-05-02

商务部:5月1日全国重点零售和餐饮企业销售额同比增长15.6% 天天最资讯

2023-05-02

大连提取公积金的条件_提取公积金的条件_全球滚动

2023-05-02

“五一”假期,“高铁游”人气火爆

2023-05-02

刘德华、陈道明、何炅:真正的成熟,是历经世事后的天真

2023-05-02

登山、游船、寻故里 体验不一样的假期生活

2023-05-02

黄磷用来干嘛(黄磷用途)|环球快看点

2023-05-02

iPhone 15系列将用上最贵的CMOS:索尼独家定制

2023-05-02

Piper Sandler:维持Core Laboratories(CLB.US)中性评级_信息

2023-05-02

环球讯息:CBA|深圳末节发威胜浙江 距总决赛一胜之遥

2023-05-02

手机号被标记为快递怎么取消呢_手机号被标记为快递怎么取消

2023-05-01

​穿山遁地“钢铁侠”——记全国五一劳动奖章获得者、省劳动模范张帅坤 当前关注

2023-05-01

最近公共祖先 倍增算法

2023-05-01

SoFi Techs(SOFI.US):2023年Q1财报实现营收4.602亿美元-天天热头条

2023-05-01

【速看料】吉林迎今春首场透雨 土壤缺墒区域减小

2023-05-01

前端和后端的区别是什么_前端和后端的区别

2023-05-01

不锈钢反应釜的结构及原理_不锈钢反应釜操作规程

2023-05-01

动物园猩猩用石头砸游客 园方回应:游客投喂水果吓到猩猩,出现应激行为

2023-05-01

日本乒乓球名将石川佳纯退役:感谢中国乒乓和中国球迷 今日最新

2023-05-01

dc05硬度-dc53硬度是多少

2023-05-01

【天天聚看点】鲐鲅鱼怎么做好吃又简单还没腥味_鲐鲅鱼

2023-05-01

蓝天为幕草坪为台 上海城市草坪音乐会举办十周年

2023-05-01

世界观焦点:正月里正月正_关于正月里正月正简述

2023-05-01

上海理工大学管理科学怎么样的与程|世界观天下

2023-05-01

贵阳地铁单日客运量再创新高 达到47.14万人次

2023-05-01

【全球速看料】人寿保险与长期护理保险责任转换业务试点今日正式启动

2023-05-01

上海实施多子女家庭住房公积金支持政策,5月1日起执行_世界热点评

2023-05-01

环球讯息:湖南科技大学财务处官网 湖南科技大学财务处

2023-05-01

赛诺菲产品用法用量_赛诺菲产品

2023-05-01

注意!湖南高速这些路段车流量大

2023-05-01

书字的各种字体写法图片 书字的各种字体写法

2023-05-01

全球头条:黄赤交角示意图手绘_黄赤交角示意图

2023-05-01

DNF:比自定义还强的装备!领域之主大放异彩,新的土豪玩具 热门看点

2023-04-30

《CSGO2》对饰品行情影响介绍[多图]

2023-04-30

kubernetes就绪探针使用|天天报道

2023-04-30

西安多个景区已停票限流,警方发布提示:不建议前往大唐不夜城_焦点速递_环球微速讯

2023-04-30

曼城已经将英超争冠主动权牢牢握在手中 每日速递

2023-04-30

数字化推动城乡融合 数治城乡中“产学研合作”有哪些趋势?

2023-04-30

动态焦点:四川发布高森林草原火险橙色预警

2023-04-30

国际贸易实务专业代码_国际贸易实务专业

2023-04-30

如何加强高标准农田建设,保障国家粮食安全?委员发言干货满满→

2023-04-30

旅游 | 西安楼观五月畅游季 开启假日缤纷乐享游

2023-04-30

天天快消息!长宁月季花开正艳,在家门口就可闻香赏花!

2023-04-30

潮起上海 乐享消费!2023国际消费季暨第四届上海“五五购物节”启动 焦点信息

2023-04-30

天天最资讯丨2023年重庆成人高考报名时间及报名入口

2023-04-30

一季度全社会用电量超2.1万亿千瓦时 当前头条

2023-04-30

一鼓作气 再而衰 三而竭的出处哪个战役_一鼓作气再而衰三而竭的出处|焦点速讯

2023-04-30

传华硕游戏掌机ROG Ally起售价599美元

2023-04-30

一周热点 | 新能源汽车行业将引入积分池制度;全新宝马i5于5月24日首发亮相;海鸥上市;本田明年推多款纯电SUV

2023-04-30

买的混沌皮上面有小黑点是什么原因 昨天买的混沌皮今天就发现上面有黑点

2023-04-30

4399的火影忍者ol 4399火影忍者ol修改器_每日报道

2023-04-30

全球看点:国家救生员资格证书查询_国家救生员资格证查询

2023-04-30

【以闪亮之名】「玩呐挑战」第四章•平民不起来攻略

2023-04-30

哈特:球队没人对布伦森的表现感到惊讶 去年季后赛他就这样了 当前播报

2023-04-29

视点!“只保留那些让你开心的东西”

2023-04-29

完美国际代码在哪个文件夹下_完美国际代码在哪个文件夹|全球看点

2023-04-29

乳酸脱氢酶偏高的原因及危害性_乳酸脱氢酶偏高的原因及危害 环球时讯

2023-04-29

大功率电器是多少瓦_大功率电器的定义

2023-04-29