链资讯 链资讯
Ctrl+D收藏链资讯

BIT:OpenAI发布炸裂研究:让AI解释AI黑箱,人类无法理解,语言无法描述_PEN

作者:

时间:

来源:FounderPark

就算在新产品满天飞,商业文明正在被AI重建的当下,我们仍然不知道,这些令人惊叹的技术是如何运作的。

AI,语言模型,它是个黑箱,人类无法理解,我们甚至不知道怎样研究才能够理解。

但如果,研究这个黑箱的不是人类,而是AI自己呢?

这是一个令人好奇但又非常危险的想法。因为你甚至不知道,这一研究方法产生的结果,是否会彻底颠覆多年来人类对人脑和AI的理解。

但是有人这样做了。几小时前,OpenAI发布了最新的研究成果,他们用GPT-4解释GPT-2的行为,获得了初步的成果。

毫不夸张地说,人们震惊极了:「求求你们让它离觉醒远点吧!」

「AI理解AI,然后很快,AI训练AI,然后再过几年,AI创造新的AI。」

但客观来说,学术界为之感到兴奋:「疯了,OpenAI刚刚搞定了可解释性问题。」

人与机器之间是GPT-4

OpenAI刚刚在官网发布博客文章《语言模型可以解释语言模型中的神经元》。

Yuga Labs将取消对OpenSea SeaPort所有可升级合约和新系列的支持:金色财经报道,Yuga Labs首席执行官Daniel Alegre在社交媒体发文称,鉴于OpenSea昨天宣布,他们将在2024年2月之前取消他们推出的Operator Filter,并转而对所有系列的所有二次销售收取可选的创作者费用,Yuga Labs将开始取消对OpenSea SeaPort所有可升级合约和任何新系列的支持,目标是跟随OpenSea的决定于2024年2月逐步完成。

据悉,OpenSea Seaport是ERC-721和ERC-1155销售的市场合约,这是NFT的两个以太坊代币标准。

Alegre还表示,NFT不仅让用户真正拥有自己的数字资产,同时也为创作者赋权,Yuga相信保护创作者的版税,以便创作者的作品得到适当的回报。[2023/8/19 18:09:43]

简单来说,他们开发了一个工具,调用GPT-4来计算出其他架构更简单的语言模型上神经元的行为,这次针对的是GPT-2,发布于4年前的开源大模型。

大模型和人脑一样,由「神经元」组成,这些神经元会观察文本中的特定规律,进而影响到模型本身生产的文本。

OpenSea已支持按ENS形式搜索相关账户与NFT项目:9月29日消息,NFT市场OpenSea已支持用户按ENS形式“.eth”直接搜索相关账户与NFT项目。[2022/9/29 22:39:29]

举例来说,如果有一个针对「漫威超级英雄」的神经元,当用户向模型提问「哪个超级英雄的能力最强」时,这个神经元就会提高模型在回答中说出漫威英雄的概率。

OpenAI开发的工具利用这种规则制定了一套评估流程。

开始之前,先让GPT-2运行文本序列,等待某个特定神经元被频繁「激活」的情况。

然后有三个评估步骤:

第一步,让GPT-4针对这段文本,生成解释。比如在下面的案例中,神经元主要针对漫威内容。GPT-4接收到文本和激活情况后,判断这与电影、角色和娱乐有关。

第二步,用GPT-4模拟这个GPT-2的神经元接下来会做什么。下图就是GPT-4生成的模拟内容。

Ripple与FLUF World达成合作,将通过The Root Network开启“The Open Metaverse”:6月17日消息,Ripple与NFT公司FLUF World达成合作,将通过The Root Network开启“The Open Metaverse”。The Root Network基于XRPL构建,XRPL将通过为NFT功能设置标准,并利用XRP作为The Root Network多代币gas经济中交易活动的默认数字资产,在该网络中发挥关键作用。(Business Wire)[2022/6/17 4:35:46]

最后一步,对比评估打分。对比4代模拟神经元和2代真实神经元的结果,看GPT-4猜的有多准。

通过这样的方法,OpenAI对每个神经元的行为作出了初步的自然语言解释,并对这种解释和实际行为的匹配程度进行了评分。

派盾: OpenSea 网络钓鱼攻击事件攻击者使用 Tornado.cash混币1,100 ETH:2月20日消息,派盾(PeckShield)在社交媒体发布相关交易记录表示,OpenSea漏洞事件攻击者已将攻击所得部分NFT出售获利后,使用以太坊隐私交易平台Tornado.cash混币1,100ETH,价值约290万美元。

此前报道,OpenSea 疑似遭到网络钓鱼攻击,大量NFT被窃取并卖出套利。本次攻击中共有32位用户签署了来自攻击者的恶意交易,导致用户部分NFT被盗。据统计已经有包括3只Bored Ape、25个NFTWorlds、37个Azuki等近百个NFT遭到被盗, 按照主流资产的地板价计算,黑客至少获取了416.6 万美元。[2022/2/21 10:04:35]

最终他们对GPT-2中307200个神经元全部进行了解释,这些解释汇编成数据集,与工具代码一起在GitHub上发布。

超越语言的机器,人类无法理解的机器

据OpenAI在博客文章中表示,目前GPT-4生成的解释还不完美,尤其要解释比GPT-2更大的模型时,表现效果很差,「可能是因为后面的layer更难解释」。

Opensea一月交易额超47.7亿美元再创历史新高:1月24日消息,据 Dune Analytics 最新数据显示,目前 NFT 市场 Opensea 平台一月交易额已逼近 50 亿美元,创下历史新高,本文撰写时约为达到 47.7 亿美元,其中以太坊链上交易额约为 47.2 亿美元,Polygon 链上交易额约为 5500 万美元。此外,Opensea 交易量也创下单月历史新高,其中以太坊链上交易量为 1,804,833 笔,Polygon 链上交易量为 1,984,025 笔,总计 3,788,858 笔。[2022/1/24 9:09:01]

对于GPT-2解释的评分大多也非常低,仅有1000个左右的解释获得了较高的评分。

OpenAI可拓展对齐团队的JeffWu表示,「大多数解释的得分很低,或者无法解释实际神经元那么多的行为。比如,许多神经元以一种难以判断的方式保持活跃,它们在五六件事上保持激活,但却没有可以辨别的模式。有时候存在明显的模式,但GPT-4有无法找到它。」

虽然现阶段成绩不好,但是OpenAI却比较有信心,他们认为可以使用机器学习的方式提高GPT-4产出解释的能力。

比如通过反复产出解释,并根据激活情况修改解释;或者使用更大的模型作出解释;以及调整解释模型的结构等等。

OpenAI还提到,这一方法目前还有很多局限性。

使用简短的自然语言进行解释,也许并不匹配神经元可能非常复杂的行为,不能简洁地进行描述。神经元可能会具备多个不同概念,也可能,会具备一个人类没有语言描述甚至无法理解的概念。

最终OpenAI希望能够自动化找到并解释能够实现复杂行为的整个神经回路,而目前的方法只解释了神经元的行为,并没有涉及下游影响。

解释了神经元的行为,但没有解释产生这种行为的机制。这意味着即使是拿了高分的解释,也只能描述相关性。

整个过程是计算密集型的。

在论文中,OpenAI表示:「语言模型可能代表了人类无法用语言表达的陌生概念。这可能是因为语言模型关心不同的事情,比如统计结构对下一个token预测任务有用,或者因为模型已经发现了人类尚未发现的自然的抽象,例如在不同领域的类似概念家族。」

它把LLM的这种属性,称为AlienFeature,在生物领域翻译为「异类特征」。

FounderPark微信后台回复「解释神经元论文」,获取论文链接和中英对照PDF链接。

把对齐问题也交给AI

「我们正试图开发预测『AI系统会出现什么问题』的方法,」OpenAI可解释性团队负责人WilliamSaunders对媒体说,「我们希望能够真正做到,让这些模型的行为和生产的回答是可以被信任的。」

SamAltman也转发博客文章称:GPT-4对GPT-2做了一些可解释性工作。

可解释性是机器学习的研究子领域,指的是对模型的行为有清晰的理解和对模型结果的理解能力。

简单来说,目的就是解释机器学习模型「如何做到」。

2019年开始,可解释性成为机器学习的重要领域,相关研究有助于开发人员对模型进行优化和调整。针对当下AI模型大规模应用时,亟需解决的可信度、安全性和决策参考等问题。

如果我们不知道AI是如何作出决策的,始终把它当做一个黑箱,那么就算AI在各种场景下表现得再完美,也无法解决部分人类的信任问题。

OpenAI这次使用GPT-4来解决可解释性的问题,就是希望能够使用自动化的方式,让机器完成AI研究。

「这是我们对齐研究的第三支柱的一部分:我们希望自动化对齐研究。令人期待的是,这一方向能让它与AI发展的步伐相匹配。」

在2022年夏天,OpenAI曾发布文章《我们做对齐研究的方法》。

文中提到,宏观来看,OpenAI的对齐研究将由三大支柱支撑:

1、利用人工反馈训练AI

2、训练AI系统协助人类评估

3、训练AI系统进行对齐研究

「语言模型非常适合自动化对齐研究,因为它们通过阅读互联网『预装』了大量有关人类价值观的知识和信息。开箱即用,它们不是独立代理,因此不会在世界上追求自己的目标。」

太快了,连认知都范式革命了

虽然OpenAI本意很好,但是这样的研究成果着实吓坏了网友。

OpenAI的推文下梗图横飞,有不少人在认真地建议OpenAI搞慢点。

「用我们不理解的东西,解释另一个我们不理解的东西,这合理吗?」

「护栏都被你撤了」

「这太迷人了,但也让我感到极度不适。」

「自然创造了人类来理解自然。我们创造了GPT-4来理解自己。」

「我们要怎么判断解释者是好的?这就像...谁监督着监督者?」(whowatchesthewatchers)

还有人看到了更深的一层:

「大模型很快就能比人类更好地解释他们自己的思维过程,我想知道我们未来要创造多少新的词汇,来描述那些AI发现的概念?我们还没有一个合适的词描述它们。或者,我们是否会觉得这些概念有意义?它们又能教会我们如何认识自己呢?」

另一网友回应道:「人类本身对自己行为的解释,大多是谎言、捏造、幻觉、错误的记忆、事后推理,就像AI一样。」

标签:BITPENNAIOpenSeabybit交易所注册PENDULUMBrainAIopensea币价格

狗狗币最新价格热门资讯
NFT:主网上线一周,Sui 生态进展如何?_BIR

在SuiNetwork主网上线一周后的今天,加密研究员2Lambroz对所有上线主网的DeFi项目进行了体验,将这些dApp的相关信息整理和汇总在了一个表格之中.

NFT:Crypto做空大师GCR的30条交易心得_Crypto Birds

原文作者:VIKTOR 原文编译:PengSUN,ForesightNewsGCR是一个匿名交易员,他在2021年牛市爆红,因为其对交易走势似乎了如指掌.

BIT:Bittrex申请破产?实为退出美国市场,将反击SEC指控_TREX

原文作者:Nancy,PANews加密行情动荡之际,成立于?2015?年的加密交易所?Bittrex?宣布于?5?月?9?日在美国特拉华州申请破产,引发了市场恐慌和猜测.

BIT:ChatGPT之父酝酿AI加密货币产品 为流量变现?_ArkWorld

ChatGPT之后,山姆·奥特曼酝酿了新产品。5月10日,北京商报记者注意到,山姆主导的加密货币项目“世界币”推出加密钱包WorldApp一事引发热议.

虚拟资产:6月起执行 香港引入虚拟资产服务提供者发牌制度_BTC

香港特区政府《行政长官2022年施政报告》中,曾提出会不断提升金融科技竞争力,当中包括在虚拟资产方面草议引入有关服务提供者的法定发牌制度.

区块链:启动! | 科创中国数字经济技术应用创新大赛开启,邀您一马当先秀出硬实力_BTC

大赛背景 “科创中国”是中国科协系统服务科技经济发展的重要品牌,为进一步深入贯彻总书记提出的关于网络强国的重要指导思想,将建设数字中国作为数字时代推进中国式现代化的重要引擎.