GPT:ChatGPT思考：探索智能的极限_ING

作者：

时间：

TheGameofScale在中国已然拉开。

2022年12月，ChatGPT横空出世。OpenAI用一个核弹级的成果改变了科学研究和工程应用的范式。在中国，ChatGPT受到了广泛的关注与深刻的讨论。在过去的一个月里，我走访各大高校，研究院，大厂，创业公司，风投；从北京到上海到杭州到深圳，跟所有头部的玩家们全部聊了一遍。TheGameofScale在中国已然拉开，风暴中心的玩家们，在已知国内技术和生态与世界前沿的巨大鸿沟下，如何做成这件事？谁能做成这件事？

秦失其鹿，天下共逐之。———《史记·淮阴侯列传》

以下为本文目录，建议结合要点进行针对性阅读。

01三种不同的答案

02极限思维

03人工智能显著超过人类的点

04Alignment对齐

05结语

01.三种不同的答案

我每接触到一个创业公司，都会问同一个问题：”ChatGPT在那里，你们想做什么？“我大概能收到三种不同的答案。第一个答案很明确，要做中国的ChatGPT。

做中国的ChatGPT

因为它就在那里，所以想要复现，想要国产化。这是很经典的产品导向中文互联网思维。这种思路也是过去二十年，中文互联网常见的商业模式：首先硅谷做出来一个东西，然后我们把它抄过来。

但这里的问题是，首先，ChatGPT可不像打车软件，复现难度完全不可同日而语。光从人的角度看，GPT的产生，是这个世界上最顶尖的科学家和工程师们从2015年开始就不断研究的结果。OpenAI的首席科学家，IlyaSutskever，深刻地相信AGI一定能实现。作为图灵奖得主GeofferyHinton的大弟子，从2007年就开始研究深度学习。他的citation有37万，发过的文章精准踩中了过去十年DeepLearning的所有关键节点。即使是如此强大的团队，从GPT2到GPT3.5也花了四年的时间，它的科学与工程的难度可想而知。

同时，初代ChatGPT，是OpenAI在GPT3.5的基础模型上，花了两星期时间对着dialog做finetuning之后随手扔出来的demo。这里真正强的并不是ChatGPT这一个产品，而是底下的GPT3.5基础模型。这个模型还在不断地演化，GPT3.5系列在2022年更新了三个大版本，每个大版本都显著强于前一个版本；同样地，ChatGPT发布两个月一共更新了四个小版本，每个小版本都在单个的维度上比前一个版本有着明显的改进。OpenAI的所有模型都在持续不断的演化，随时间推移越来越强。

阿迪达斯Web3项目ALTS by adidas宣布“Chapter 2”将于六月底推出:金色财经报道，阿迪达斯Web3项目ALTS by adidas在社交媒体宣布“Chapter 2（第二章）”将于六月底推出，据悉ALTS by adidas已于5月17日向每位ALT持有者空投了三枚Rift Valley Motel Coin NFT，这些NFT持有者将可以访问adidas PFPs/Avatar的定制ALTS，非ALT持有者和没有Rift Valley Motel Coin NFT的用户将无法参与Chapter 2。[2023/6/6 21:18:16]

这也就意味着，如果只盯着当前ChatGPT这一个产品看，无异于刻舟求剑。当ChatGPT出现的时候，它对已有的语音助手们形成了降维打击；如果看不到基础模型的演化，即使花个一两年辛辛苦苦做出一个类似的东西，那时候OpenAI的基础模型也在继续变强，如果他们接着产品化，以新的更强的基础模型finetune到一个更强的产品，难道要再被降维打击一次吗？

刻舟求剑的做法是行不通的。

做中国的OpenAI

第二种答案是，要做中国的OpenAI。给出这个答案的玩家，跳出了经典中文互联网产品思维。他们不止看到单个产品，而且还看到了这个产品背后，基础模型不断演化的强大驱动力，来源于尖端人才的密度和先进的组织架构。

•?尖端人才的密度：不是一个人集资源带队然后把任务按层级打包分配给底下的人，而是一群顶级的集science和engineering于一身的人们共同协作；

•?先进的组织架构：Language团队与Alignment的团队相互合作迭代，然后底下scaling团队和data团队帮忙提供基础设施，每个team都非常小，但目标明确路径清晰，高度集中资源，朝着AGI进发。

所以，如果要做这件事情，不只要看到产品，还要看到它背后的人才团队和组织架构；按稀缺程度排名的话，人>卡>钱。

但这里的问题是，不同的土壤对创新的鼓励程度是不一样的。在OpenAI刚创立的2015年，它的投资者们都相信AGI，即使当时看不到什么盈利的点。现在GPT做出来了，国内的投资者们也都信了AGI，但相信的点或许也不一样：到底是信AGI能挣钱，还是信AGI能推动人类发展？

更进一步地，即使OpenAI就产生在这里，明天就出现，但他们跟微软达成的deal，能否跟国内的云计算厂商达成呢？大模型的训练和推理都需要极大的成本，需要一个云计算引擎作为支撑。微软可以倾尽所有，让整个Azure给OpenAI打下手，这个换到国内，阿里云有可能给一个创业公司打下手吗？

THORChain宣布主网上线完成，金库控制权将很快移交社区:6月23日消息，跨链DeFi协议THORChain今日宣布主网上线完成，目前已正式进入开发、扩展和采用阶段。THORChain目前正在进一步去中心化，节点运营商已逐步替代中心化的控制，金库的控制权也将很快全部移交给社区。

此外，在接下来的12个月内，大部分RUNE代币归属将锁定在Node的债券中。当价格是历史最高价的1/10时，会解锁RUNE。具体为：2000万个RUNE将被解锁，每3个月解锁20%，持续12个月。4100万个RUNE在Node's Bond中仍被锁定至少12个月。金库将不再向流动性提供者或节点运营商进行退款。重点将仅放在开发、安全性和可扩展性上。[2022/6/23 1:25:52]

组织架构很重要，只有尖端的人才和先进的组织架构才能推动智能的不断迭代与进化；但它同样需要跟所在的土壤做适配，寻找可以flourish的方法。

探索智能的极限

第三种答案是，要探索智能的极限。这是我听到的最好的答案。它远超刻舟求剑式的经典互联网产品思维，也看到了组织架构和尖端人才密度的重要性，并且更重要地是它看到了未来，看到了模型演化与产品迭代，思考着如何把最深刻，最困难的问题用最创新的方法来解决。

这就涉及到了思考大模型的极限思维。

02.极限思维

观察现在的ChatGPT/GPT-3.5，它明显是一个中间状态，它还有很多显著可以加强，并且马上就能加强的点，包括：

•?更长的输入框：开始的时候，GPT3.5的上下文最长到八千个token；现在的ChatGPT上下文建模的长度似乎已经过万。并且这个长度明显可以接着增长，在融入efficientattention和recursiveencoding的方法之后，contextlength应该可以接着scale到十万，甚至百万的长度；

•?更大的模型，更大的数据：模型的大小还没有到极限，MoE可以接着把模型scale到T的量级；数据的大小还没有到极限，人类反馈的数据每天都在增长；

•?多模态：在增加了多模态数据，特别是视频数据之后，总体与训练数据的大小可以再增大两个量级，这个可以让已知的能力接着按scalinglaw线性增加，同时还有可能继续出现新的涌现能力。比如可能模型在看过各种几何形状的图片，以及看过代数题之后，或许会自动学会做解析几何；

•?专业化：现有的模型在文科上大概相当于研究生水平，但在理科上相当于高中或大一大二的学生水平；已有的工作已经证明我们可以把模型的技能点从一个方向挪到另一个方向，这就意味着即使不做任何scaling，我们依然可以在通过牺牲其他方面能力的情况下，把模型朝着目标方向推进。比如牺牲掉模型的理科能力，把它的文科能力从研究生推到专家教授的水准。

宝莱坞明星Amitabh Bachchan的NFT收藏品在拍卖会首日出价达52万美元:11月3日消息，宝莱坞明星Amitabh Bachchan的NFT收藏品在Beyondlife.Club组织的拍卖会第一天就收到价值52万美元（约3800万卢比）的出价。此次拍卖会于11月1日上线，并将于11月4日结束，由印度NFT去中心化品牌市场Guardian Link提供支持。（Times of India）[2021/11/3 6:29:17]

以上四点只是现阶段可以看到的，马上就可以加强但暂时还没有加强的点，随着时间的推移和模型的演化，会有更多可以被scale的维度进一步体现出来。这意味着我们需要有极限的思维，思考当我们把能够拉满的维度全部拉满的时候，模型会是什么样子。

能够拉满全部拉满

模型的输入框可以接着加长，模型的大小可以继续增大，模型的数据可以继续增多，多模态的数据可以融合，模型的专业化程度可以继续增高，所有这些维度可以继续往上拉，模型还没有到极限。极限是一个过程，在这个过程中模型的能力会怎样发展呢？

•Log-linear曲线：一部分能力的增长会遵循log-linear的曲线，比如说某项任务的finetuning。随着finetune数据的指数增长，模型所对应的finetune的任务的能力会线性增长。这部分能力会可预测地变得更强；

•Phasechange曲线：一部分能力会随着scaling继续涌现，比如说上文中的模型做解析几何的例子。随着可以被拉满的维度被不断拉满，新的，难以预测的涌现能力会接着出现；

•多项式曲线?当模型强到一定程度，与人类align到一定程度之后，或许一些能力的线性增长，所需要的数据，会突破指数增长的封锁，而降低到多项式的量级。也就是说，当模型强到一定程度之后，它或许不需要指数级的数据，而是只需要多项式级的数据，就可以完成泛化。这可以从人类的专业学习中观察到：当一个人还不是领域专家的时候，ta需要指数级的数据来学习领域的知识；当一个人已经是领域专家的时候了，ta只需要很少量级的数据就自己迸发出新的灵感和知识。

所以，在极限思维下，把所有能拉满的维度全部拉满，模型注定会越来越强，出现越来越多的涌现能力。

反推中间过程

在思考清楚极限的过程之后，就可以从极限状态往后反推中间过程。比如说，如果我们希望增长输入框的大小：

•如果希望把模型的输入框从千的量级增长到万的量级，可能只需要增加显卡数量，进行显存优化就能实现；

Thor Chan：应用层面如有更多的盈利模式，以太坊会有更好的前景:近日，AAX CEO Thor Chan在2020 Q3数字资产交易所行业领袖报告中表达了最近对市场的观点看法。

Thor认为DeFi的爆发对去中心化交易所的发展起到很好的作用，但也放大DEX现存的问题。从交易量看，中心化交易所确实受到了一定冲击，但新的项目也带来新的资金。尽管DeFi很火热，但是占比很小，我们看到的增长点其实是“小白”。其实DeFi带动的收益最大的是以太坊。而新手却不容易被带进圈子，门槛很高。

Thor指出主流币种发展方向好，基本面有很多利好消息证明主流资产发展方向是正确的。比特币在成为“数字黄金”的路上也有很正向的发展，和黄金的相关性也越来越高。现在比特币对更多公司的资产配置来说是不能被忽视的。以太坊Thor将他形容为“像是美国科技公司”，现在很多应用还没有验证出来，现在出来的有DeFi，如果以后在应用层面有更多的盈利模式，以太坊肯定能有更好的前景。[2020/11/14 20:47:41]

•如果希望接着把输入框从万的量级增长到十万的量级，可能需要linearattention的方法，因为此时加显存应该也架不住attention运算量随输入框长度的二次增长；

•如果希望接着把输入框从十万的量级增长到百万的量级，可能需要recursiveencoding的方法和增加long-termmemory的方法，因为此时linearattention可能也架不住显存的增长。

以这种方式，我们可以反推不同阶段的scaling需要怎样的技术。以上分析不止适用于输入框的长度，也适用于其他因素的scaling的过程。

这样的话，我们可以得到清晰的从现阶段的技术到scaling的极限的每个中间阶段的技术路线图。

按模型演化进程产品化

模型在不断演化，但产品化不需要等到最终那个模型完成—每当模型迭代出来一个大的版本，都可以产品化。以OpenAI的产品化过程为例：

•2020年，初代GPT3训练完成，开放OpenAIAPI；

•2021年，初代Codex训练完成，开放GithubCopilot；

•2022年，GPT-3.5训练完成，以dialog数据finetune成ChatGPT然后发布。

可以看到，在中间阶段的每一个重要版本，模型的能力都会增强，都存在产品化的机会。

动态 | Polkadot宣布Chainlink成为其Oracle网络供应商:2月25日，Polkadot宣布Chainlink将成为其首家和主要Oracle网络供应商，Pkadot将使用Chainlink Oracle实现互操作网络。据悉，Polkadot将是第一个集成Chainlink的非以太坊区块链。（CoinDesk）[2020/2/25]

更加重要的是，按照模型演化进程产品化，可以在产品化的阶段适配市场。学习OpenAI的组织架构来推进模型演化本身，但产品化可以按照本土市场的特征来。这种方式或许可以既学到OpenAI的先进经验，又避免水土不服的问题。

03.人工智能显著超过人类的点

到目前为止，我们讨论了要用模型演化的视角来分析模型，要用极限的思维讨论模型的演化历程。现阶段马上可以加强的点包括了输入框的长度，更大的模型和数据，多模态数据，和模型的专业化程度。现在让我们再把视野放得更长期些，思考在更大的时间和空间中，模型如何进一步地往极限推。我们讨论：

•?并行感知：一个人类研究员一次顺序地读四五篇论文已经是极限，但模型输入框变长之后，可以在极短的时间内并行阅读一百篇论文。这意味着，模型对外部信息的感知能力远超人类一个数量级；

•?记忆遗传：人类的演化过程中，子代只继承父代的基因，但不继承父代的记忆，这意味着每一次生殖都需要重启一次；在模型的演化过程中，子代可以继承父代的记忆，并且这个继承的程度可控：我们可以设置子代继承100%，50%，20%的记忆，或清空记忆，这意味着父代的经验和技能可以不断累积；

•?加速时间：人类相互交流的速率是受到人类说话的物理速度限制的，而模型相互交流的速率可以远快于人类，这意味着模型可以通过相互交流来解决人类数据随时间线性增长的问题；人类演化的过程受到物理时间的限制，模型的演化可以比人类的物理时间快上几个数量级，这意味着模型的进步速度可以远快于人类；

•?无限生命：一个人的生命有限，百年之后终归尘土，但模型的权重只要不丢失，就可以不断地演化。

从这些角度来说，人工智能超过人类并不是一件难以想象的事情。这就引发了下一个问题：

如何驾驭远超人类的强人工智能？

这个问题，是Alignment这项技术真正想要解决的问题。

04.Alignment对齐

当前阶段，模型的能力，除了?AlphaGo在围棋上超过了最强人类之外，其他方面的AI并没有超过最强的人类。在模型还没超过人类的时候，Alignment的任务是让模型符合人类的价值观和期望；但当模型继续演化到超过人类之后，Alignment的任务就变成了寻找驾驭远超人类的智能体的方法。

Alignment作为驾驭远超人类的智能体的方法

一个显然的问题是，当AI超过人类之后，还可以通过人类反馈让ta更强/更受约束吗？是不是这个时候就已经管不了了？

不一定，即使模型远超人类，我们依然又可能驾驭ta，这里的一个例子是运动员和教练之间的关系：金牌运动员在ta的方向上已经是最强的人类了，但这并不意味着教练就不能训练ta。相反，即使教练不如运动员，ta依然可以通过各种反馈机制让运动员变得更强且更有纪律。

类似地，人类和强人工智能的关系，在AI发展的中后期，可能会变成运动员和教练之间的关系。这个时候，人类需要的能力并不是完成一个目标，而是设定一个好的目标，然后衡量机器是否足够好地完成了这个目标，并给出改进意见。

这个方向的研究还非常初步，这个新学科的名字，叫ScalableOversight。

Alignment与组织架构

在通往强人工智能的路上，不只是需要人类与AI对齐，人类与人类，也需要高度的对齐。从组织架构的角度，alignment涉及到：

•Pretraining团队与instructiontuning-alignment团队之间的对齐：

这两者应该是一个相互迭代的过程，pretraining团队不断地scale基础模型，alignment团队为基础模型做instructiontuning，同时用得到的结果反向指导pretraning团队的方向。

•Pretraining/Alignment团队与Scaling/Data团队的对齐：

scaling负责为pretraining/alignment做好基础设施，data做好高质量数据与人类反馈数据。

•?创业公司与VC的对齐：

AGI是一个困难的事情，需要长期的投入，这需要各个方面的人都有足够的耐心和足够高的视野。烧一趟热钱后催产品化然后占满市场的逻辑在大模型时代应该已经不复存在了。大模型的游戏要求ta的玩家们有足够高的视野与格局，模型的演化会让有足够耐心的，踏实做事人们在长期得到丰厚的回报，也会让只看短期刻舟求剑的人们一次又一次被降维打击。

05.结语

在2017年，我刚刚入行NLP的时候，花了很大的力气做可控生成这件事情。那个时候所谓的textstyletransfer最多就是把句子情感分类改一改，把good改成bad就算是完成了transfer。

2018年我花了大量的时间研究如何让模型从句子结构的角度修改句子的风格，一度误认为风格转换是几乎不可能完成的事情。而今ChatGPT做风格转换简直信手拈来。那些曾经看似不可能完成的任务，曾经极其困难的事情，今天大语言模型非常轻松地就能完成。

在2022年一整年，我追踪了从GPT-3到GPT-3.5的全部版本迭代，亲眼看到它一步步地从弱到强不断演化。这个演化速度并没有变慢，反而正在加快。那些原先看来科幻的事情，现在已经成为现实。谁会知道未来会怎样呢？

彼黍离离，彼稷之苗。

行迈靡靡，中心摇摇。

彼黍离离，彼稷之穗。

行迈靡靡，中心如醉。

———《诗经·黍离》

Reference

1.IlyaSutskever

https://scholar.google.com/citationsuser=x04W_mMAAAAJ&hl=en

2.?GPT3.5系列在2022年更新了三个大版本

https://platform.openai.com/docs/model-index-for-researchers

3.?ChatGPT发布两个月一共更新了四个小版本https://help.openai.com/en/articles/6825453-chatgpt-release-notes

4.?微软Azure辅助OpenAI

https://blogs.microsoft.com/blog/2023/01/23/microsoftandopenaiextendpartnership/

5.?efficientattention

https://arxiv.org/abs/2302.04542

6.?recursiveencoding

https://openai.com/research/summarizing-books

7.?MoE可以接着把模型scale到T的量级

https://arxiv.org/abs/2101.03961

8.?log-linear的曲线

https://arxiv.org/abs/2001.08361

https://arxiv.org/abs/2203.15556

9.?Phasechange曲线

https://arxiv.org/abs/2206.07682

10.?linearattention

https://arxiv.org/abs/2103.02143

https://arxiv.org/abs/2302.04542

11.?recursiveencoding

https://openai.com/research/summarizing-books

12.?long-termmemory

https://arxiv.org/abs/2112.04426

13.?OpenAIAPI

https://platform.openai.com/docs/introduction/overview

14.?GithubCopilot

https://github.com/features/copilot

15.?ScalableOversight

https://arxiv.org/abs/2211.03540

16.?从GPT-3到GPT-3.5的全部版本迭代

https://yaofu.notion.site/How-does-GPT-Obtain-its-Ability-Tracing-Emergent-Abilities-of-Language-Models-to-their-Sources-b9a57ac0fcf74f30a1ab9e3e36fa1dc

来源：元宇宙之心

标签：GPT CHA ING OPEN GPTG DrinkChain hunterkingtoken OPENAIERC

DeFi数据 1、DeFi代币总市值：488.53亿美元 DeFi总市值及前十代币数据来源：coingecko2、过去24小时去中心化交易所的交易量22.

NFT:ChatGPT 等 LLM 使用强化学习而非监督学习进行微调的 5 个原因_Data Vital

撰文：TanyaMalhotra来源：Marktechpost 编译：DeFi之道图片来源：由无界版图AI工具生成随着生成性人工智能在过去几个月的巨大成功,大型语言模型正在不断改进.

GPT:经验之谈：我如何从亏损九成到重回巅峰？_FGPT

撰文：Louround 编译：0x11,ForesightNews上一轮牛市期间,我由于贪婪损失了90%的净资产。一年半后,我的投资组合达到了历史最高。这里我分享加密投资者需要避免的五个陷阱.

GPT:项目周刊 | BTC 活跃度达到 2 年低点_NAI

金色周刊是金色财经推出的一档每周区块链行业总结栏目,内容涵盖一周重点新闻、行情与合约数据、矿业信息、项目动态、技术进展等行业动态。本文是项目周刊,带您一览本周主流项目以及明星项目的进展.

NFT:MicroStrategy：没有任何资产由Silvergate托管_OSEAN

金色财经报道,商业软件公司MicroStrategy(MSTR)周四表示,该公司没有由SilvergateCapital(SI)托管的资产,除了承诺在2025年偿还贷款外.

NFT:从代币到版税再到聚合器头部NFT交易所的下轮战火将烧至哪里_Open Link

NFT交易市场的格局将如何演进？本文梳理了NFT相关概念,以及比较了Top5的NFT交易平台,以供参考.

GPT:ChatGPT思考：探索智能的极限_ING

AAVE热门资讯