链资讯 链资讯
Ctrl+D收藏链资讯
首页 > 中币下载 > 正文

LMS:A16Z:生成式人工智能领域的 4 个突破点_GPT

作者:

时间:

大型语言模型(LLMs)已经成为科技行业的热点,为我们提供了一些令人称奇的体验——从几秒钟内编写一周的代码,到生成比与人类进行的对话更富有共情的对话。通过使用成千上万个GPU进行数万亿令牌的数据训练,LLMs展示了出色的自然语言理解能力,并改变了文案和代码等领域,将我们推进了全新、令人兴奋的生成式AI时代。与任何新兴技术一样,生成式AI也受到了一些批评。尽管这些批评在一定程度上反映了LLMs当前能力的局限性,但我们将这些阻碍视为进一步创新的机会,而不是技术本质性的缺陷。

为了更好地了解LLMs的近期技术突破,并为创始人和运营者做好未来准备,我们与一些领先的生成式AI研究人员进行了交谈,他们正在积极构建和训练一些最大最前沿的模型,包括Anthropic公司的首席执行官Dario Amodei、Cohere公司的首席执行官Aidan Gomez、Character.AI公司的首席执行官Noam Shazeer以及AI21 Labs的Yoav Shoham。这些交谈确定了未来即将到来的4个关键创新方向:导向、记忆、"手和脚"以及多模态。在本文中,我们将讨论这些关键创新如何在未来6到12个月内发展,以及对于对将AI整合到自己的业务中感兴趣的创始人来说,如何利用这些新进展。

导向

许多创始人对在其产品和工作流程中使用LLMs表示担忧,因为这些模型有可能产生幻觉和重现偏见。为了解决这些问题,一些领先的模型公司正在致力于改进导向技术——一种在LLMs输出中更好地控制模型结果、让模型更好地理解和执行复杂用户需求的方法。Noam Shazeer在这方面提到了LLMs和孩子之间的相似之处:“这是如何更好地引导[模型]的问题...我们在LLMs上面临的问题就是我们需要正确的方式告诉它们如何按照我们的要求行事。小孩子也是如此——他们有时会编造事情,对幻想和现实没有一个明确的理解。”尽管在模型提供商和类似Guardrails和LMQL的工具出现之后,在导向能力方面已经取得了显著的进展,研究人员仍在不断取得进步,我们认为这对于更好地将LLMs产品化对于最终用户至关重要。

a16z合伙人:加密市场低迷给风投公司更多投资机会,希望创造一个更好的互联网:8月23日消息,a16z合伙人Chris Dixon在接受《金融时报》采访时表示,目前的加密市场低迷给风险投资公司更多的投资机会。目前互联网上的权力由一小部分公司掌握。我们可以做的是创造一个更好的互联网,创造新的系统,让网络效应累积到社区而不是公司。(CoinDesk)[2022/8/23 12:43:10]

在企业公司中,改进的导向尤其重要,因为不可预测行为的后果可能是昂贵的。Amodei指出,LLMs的不可预测性会让人们感到不安,作为一个API提供者,他希望能够“对着客户说‘不,模型不会做这个’,或者至少很少会这样做。”通过改进LLMs的输出,创始人们可以更有信心地确保模型的性能与客户需求相符。改进的导向还将为其他行业的广泛采用铺平道路,这些行业对精确性和可靠性的要求更高,例如广告行业,其中广告投放的风险很高。Amodei还认为改进的导向可以应用于“法律用例、医疗用例、存储金融信息和管理金融注,以及需要保护公司品牌的场景。您不希望您所整合的技术是不可预测或难以预测或刻画的。”通过更好的导向,LLMs还能够在少量提示工程的情况下完成更复杂的任务,因为它们将能够更好地理解整体意图。

LLMs导向方面的进展还有可能在用户期望定制和准确回应的敏感消费者应用中开启新的可能性。虽然当用户与LLMs进行对话或创造性交互时,他们可能会容忍较低准确性的输出,但是当用户使用LLMs来协助日常任务、指导重要决策或增强生活教练、治疗师和医生等专业人士时,他们希望得到更准确的输出。有人指出,LLMs有望取代搜索等已深入人心的消费者应用,但在这成为真正可能之前,我们可能需要更好的导向来改善模型输出并建立用户信任。

加密合规平台Sardine完成1950万美元A轮融资,a16z等参投:2月11日消息,金融科技行业加密合规平台 Sardine 宣布在 A 轮融资中筹集了 1950 万美元,参投方包括 Andreessen Horowitz (a16z)、NYCA 和 Experian Ventures等。作为投资的一部分,a16z 的普通合伙人 Angela Strange 将加入 Sardine 董事会。

据了解,总部位于旧金山的 Sardine 于2021年推出,使用人工智能根据用户在账户创建和账户资金时的身份、设备和行为模式提供实时欺诈评分,该平台会在每次登录、存款和取款期间检查欺诈行为。

此前3月份,数字防欺诈解决方案Sardine曾完成460万美元种子轮融资。[2022/2/11 9:43:50]

关键突破点:用户可以更好地定制LLMS的输出。

记忆

由LLMs驱动的文案撰写和广告生成应用程序已经取得了巨大的成功,从而在营销人员、广告商和创业者中迅速流行起来。然而,目前大多数LLMs的输出相对泛化,这使得难以将它们用于需要个性化和情境理解的用例。虽然提示工程和微调可以提供一定程度的个性化,但是提示工程的可扩展性较差,而微调往往代价高昂,因为它需要一定程度的重新训练,并且通常需要与大多数闭源LLMs紧密合作。为每个个体用户进行微调模型通常是不可行或不可取的。

上下文学习是实现这一目标的圣杯,其中LLMs从您的公司生成的内容、您公司的特定行话和特定上下文中获取信息,以创建更精细、针对特定用例的输出。为了实现这一目标,LLMs需要增强的记忆能力。LLM记忆有两个主要组成部分:上下文窗口和检索。上下文窗口是模型可以处理和用于指导其输出的文本,除了它被训练的数据语料库之外。检索是指从模型的训练数据语料库之外的数据体中检索和引用相关信息和文档(“上下文数据”)。目前,大多数LLMs的上下文窗口有限,无法原生地检索附加信息,因此生成的输出缺乏个性化。然而,通过更大的上下文窗口和改进的检索,LLMs可以直接提供更加精细的、针对个别用例的输出。

a16z创始人取关Jack Dorsey社交账号 此前曾因Web3问题引发争论:12月23日,a16z创始人Marc Andreessen已将推特前CEO、现任Block公司(前身为Square)CEO JackDorsey社交媒体账号取消关注。对此Jack Dorsey表示:我已经正式被Web3驱逐了(I'm officially banned from web3)。此前消息,JackDorsey曾在社交平台抨击「Web3世界里,VC才是问题」,暗指a16z等VC投资了大量所谓Web3.0公司,用户并没有享受到真正的Web3产品。随后12月22日晚间,JackDorsey在推特上取关Coinbase首席执行官Brian Armstrong以及a16z创始人Marc Andreessen。[2021/12/23 7:58:08]

特别是通过扩展上下文窗口,模型将能够处理更大量的文本并更好地保持上下文,包括在对话中保持连贯性。这将进一步显著提高模型在需要更深入理解较长输入的任务中的能力,例如总结长篇文章或在长时间对话中生成连贯且上下文准确的回应。在上下文窗口方面,我们已经看到了显著的改进——GPT-4具有8k和32k标记的上下文窗口,相比之下,GPT-3.5和ChatGPT的上下文窗口分别为4k和16k标记,而Claude最近将其上下文窗口扩展到惊人的100k标记。

仅扩展上下文窗口并不能充分改善内存,因为推理的成本和时间与提示的长度呈准线性甚至二次方关系。检索机制通过与提示相关的上下文数据增强和完善LLM的原始训练语料库。由于LLMs是在一个信息体上进行训练的,并且通常难以更新,检索的两个主要好处是根据Shoham的说法:“首先,它允许您访问在训练时没有的信息源。其次,它使您可以将语言模型聚焦在您认为与任务相关的信息上。”矢量数据库(例如Pinecone)已成为高效检索相关信息的事实标准,并且作为LLMs的内存层,使模型更容易快速准确地搜索和引用海量信息中的正确数据。

Jack Dorsey取关Coinbase CEO与a16z创始人推特:12 月 22 日,前推特首席执行官、现任 Block 公司(前身为 Square)CEO 的 Jack Dorsey 已经在推特上取消关注 Coinbase 联合创始人、首席执行官 Brian Armstrong 以及 a16z 创始人 Marc Andreessen。目前尚不清楚 Jack Dorsey 为何做出这一举动,有加密社区用户认为这件事并不意外,因为 Coinbase 长期以来一直是比特币的“敌人”。

此前报道,Jack Dorsey 和特斯拉 CEO 埃隆·马斯克、以及 a16z 合伙人 Chris Dixon 在推特上就 Web 3 问题引发了剧烈争论。[2021/12/22 7:57:09]

增加的上下文窗口和检索将在企业用例中尤为重要,例如导航大型知识库或复杂数据库。公司将能够更好地利用其专有数据,如内部知识、历史客户支持票据或财务结果,作为LLMs的输入,而无需进行微调。改进LLMs的记忆将在培训、报告、内部搜索、数据分析和业务智能以及客户支持等领域带来改进和深度定制的能力。

在消费者领域,改进的上下文窗口和检索将实现强大的个性化功能,从而革新用户体验。Noam Shazeer认为:“其中一个重大突破将是开发出一种具有非常高的内存容量,可以针对每个用户进行定制,同时在规模上仍然具有成本效益的模型。您希望您的治疗师了解您的生活方方面面;您希望您的老师了解您已经掌握的知识;您希望生活教练能够就正在发生的事情向您提供建议。他们都需要上下文。” Aidan Gomez对此发展也表示兴奋。“通过让模型访问与您独特相关的数据,如您的电子邮件、日历或直接消息,”他说,“模型将了解您与不同人的关系以及您如何与朋友或同事交谈,并在这种情况下帮助您最大程度地提供帮助。”

A16z发布第三代全新互联网政策议程:金色财经报道,10月13日消息,a16z发布第三代互联网政策议程,该议程将成为a16z全新Web3 Policy Hub的动态文件,同时为政府、学术界、民间社会和私营部门的领导者提供更多资源并致力于为网络未来建立一个共同愿景。?A16z表示,过去十年教会我们需要一个积极的战略来塑造技术,并且在开放社会中发挥作用,在这种情况下,Web3将会带来一波全新的创新浪潮,政策制定者和监管机构可以利用 Web3 提供的工具来构建互联网,从而更好地为社会释放更多机会、保护数据、并且解决关键问题。?A16z已经开始努力确保这个新议程能够运作,在过去几周时间已经向参议院领导层提交了一封信函,旨在解决目前基础设施法案中税收条款的挑战,此外a16z还发布了一个政策框架,概述了稳定币在促进金融包容性方面的作用,另外也与参议院银行委员会的每位成员分享了四项立法提案,以鼓励政策制定者考虑周到、具体的方案去监管去中心化技术。由于 Web3 的广度和影响,定义开明的政策和监管战略是一项重要任务,任何单个组织都无法自行解决。A16z认为,现在是时候开始建立一个更好的互联网了。[2021/10/13 20:26:46]

关键突破点:LLMs将能够考虑大量相关信息,并提供更个性化、定制和有用的输出。

“手臂和腿部”:赋予模型使用工具的能力

LLMs的真正威力在于使自然语言成为行动的媒介。LLMs对常见且有详细文档的系统具有复杂的理解能力,但它们无法执行从这些系统中提取的任何信息。例如,OpenAI的ChatGPT、Anthropic的Claude和Character AI的Lily可以详细描述如何预订航班,但它们本身无法原生地预订航班(尽管像ChatGPT的插件等技术进展正在推动这一边界)。Amodei表示:“这个大脑在理论上拥有所有这些知识,只是缺少从名称到按钮的映射。”他说:“连接这些电缆并不需要太多的训练。你有一个没有实体的大脑,它知道如何移动,但它还没有连接上手臂和腿部。”

随着时间的推移,我们已经看到公司不断改善LLMs使用工具的能力。像必应和谷歌这样的老牌公司和Perplexity和You.com这样的初创公司推出了搜索API。AI21 Labs推出了Jurassic-X,它通过将模型与一组预定工具(包括计算器、天气API、维基百科API和数据库)结合起来,解决了独立LLMs的许多缺陷。OpenAI推出了ChatGPT的插件测试版,允许ChatGPT与Expedia、OpenTable、Wolfram、Instacart、Speak、网络浏览器和代码解释器等工具进行交互,这一突破被认为类似于苹果的“应用商店”时刻。最近,OpenAI在GPT-3.5和GPT-4中引入了函数调用 ,允许开发者将GPT的能力与任何外部工具进行链接。

通过从知识挖掘转向行动导向,增加手臂和腿部的能力有望在各种公司和用户类型之间实现一系列用例。对于消费者而言,LLMs可能很快就能给出菜谱建议,然后为您订购所需的食材,或者建议一个早午餐地点并为您预订餐桌。在企业领域,创始人可以通过接入LLMs使他们的应用程序更易于使用。正如Amodei所指出的:“对于从用户界面角度来说非常难以使用的功能,我们可能只需用自然语言描述即可实现复杂的操作。”例如,对于Salesforce等应用程序,LLM集成应允许用户用自然语言进行更新,并使模型自动进行这些更改,从而大大减少了维护CRM所需的时间。像Cohere和Adept这样的初创公司正在致力于将LLMs集成到这类复杂工具中。

Gomez认为,虽然LLMs能够在2年内使用Excel等应用程序的可能性越来越大,但“仍然需要进行许多细化工作。我们将拥有第一代能够使用工具的模型,这将是引人注目但易碎的。最终,我们将获得梦寐以求的系统,我们可以将任何软件交给模型,并附上一些描述,例如‘这是工具的功能,这是如何使用它的’,它将能够使用它。一旦我们可以为LLMs提供特定和通用的工具,它所带来的自动化将成为我们领域的巅峰之作。”

关键突破点:LLMs将能够与我们今天使用的工具进行更加有效的交互。

多模态

尽管聊天界面对许多用户来说令人兴奋和直观,但人类听和说语言的频率可能与写或读语言的频率相当或更高。正如Amodei所指出的:“AI系统能做的事情是有限的,因为并不是所有的事情都是文本。”具备多模态功能的模型能够无缝地处理和生成多种音频或视觉格式的内容,将这种交互扩展到超越语言的领域。像GPT-4、Character.AI和Meta的ImageBind这样的模型已经能够处理和生成图像、音频和其他模态,但它们在这方面的能力还比较基础,尽管进展迅速。用Gomez的话说,我们的模型在字面上今天是盲的,这一点需要改变。我们构建了很多假设用户能够看到的图形用户界面(GUI)。

随着LLMs不断进化,更好地理解和与多种模态交互,它们将能够使用依赖GUI的现有应用程序,比如浏览器。它们还可以为消费者提供更加引人入胜、连贯和全面的体验,使用户能够超越聊天界面进行互动。Shazeer指出:“多模态模型的许多出色整合可以使事物更具吸引力和与用户更紧密相连。”他还说:“我认为,目前大部分核心智能来自文本,但音频和视频可以使这些事物更有趣。”从与AI导师进行视频聊天到与AI合作迭代和编写电视剧剧本,多模态有潜力改变娱乐、学习与发展以及跨各种消费者和企业用例的内容生成。

多模态与工具使用密切相关。尽管LLMs最初可能通过API与外部软件进行连接,但多模态将使LLMs能够使用设计给人类使用但没有自定义集成的工具,例如传统的企业资源计划(ERP)系统、桌面应用程序、医疗设备或制造机械。在这方面,我们已经看到了令人兴奋的进展:例如,谷歌的Med-PaLM-2模型可以合成乳腺摄影和X射线图像。而且从长远来看,多模态(特别是与计算机视觉的集成)可以通过机器人、自动驾驶车辆和其他需要与物理世界实时交互的应用程序,将LLMs扩展到我们自己的物理现实中。

关键突破点:多模态模型能够在没有重大定制的情况下推理图像、视频,甚至物理环境。

尽管LLMs存在一些实际限制,但研究人员在短时间内对这些模型进行了惊人的改进。事实上,我们在撰写本文时已经多次更新过它,这证明了该领域技术的快速发展。Gomez也表示同意:“LLM在20次中有1次编造事实显然还是太高了。但我真的非常有信心,这是我们第一次构建这样的系统。人们的期望相当高,所以目标已经从‘计算机很笨,只会做数学’变成了‘一个人可能做得更好’。我们已经足够弥合差距,以至于批评集中在人类能做到什么程度上。”

我们特别对以下4项创新感到兴奋,它们正处于改变创业者构建产品和经营公司方式的临界点。从长远来看,潜力更大。Amodei预测:“在某个时刻,我们可能会拥有一个模型,它能够阅读所有生物数据,并找出治愈癌症的方法。”现实情况是,最好的新应用可能仍然是未知的。在Character.AI,Shazeer让用户开发这些用例:“我们将看到许多新的应用程序解锁。对我来说很难说出这些应用程序是什么。将会有数百万个应用程序,用户比少数工程师更善于发现如何使用技术。”我们迫不及待地期待这些进步将如何影响我们作为创业者和公司在生活和工作中的方式,因为这些新工具和能力赋予了我们新的力量。

感谢Matt Bornstein、Guido Appenzeller和Rajko Radovanovi?在撰写过程中提供的意见和反馈。

DoraFactory

个人专栏

阅读更多

金色早8点

Odaily星球日报

金色财经

Block unicorn

DAOrayaki

曼昆区块链法律

标签:LMSWEBGPTWEB3LMS币web3游戏赚钱gpt币团队WEB3ALLBI价格

中币下载热门资讯
BAYC:去年fomo追高猴子小图片的各位Kol 现在亏了多少?_比特币

随着 NFT 市场步入熊市,即使是市场的领头羊「无聊猿」(BAYC)也未能逃脱,其地板价已经猛烈下跌,直至跌破 40ETH,现在的报价为 38ETH,过去一周的跌幅已达到 14.92%.

NFT:贝莱德现货比特币ETF上市关键日期和时间表_Santas War NFT Epic

作者:huf,Pear Protocol联合创始人;翻译:金色财经xiaozou我们将在本文了解一下BlackRock现货比特币ETF的关键日期和时间表.

ETF:特斯拉失宠?方舟投资转战加密市场 押注Coinbase和Robinhood_nhbtc币怎么样

在过去的一周里,方舟投资(Ark Invest)减少了对特斯拉的持仓。与此同时,该公司转而大举投资加密行业,收购了Coinbase和Robinhood的大量股份.

LMS:福布斯:三阶段详述Gary Gensler如何从加密盟友变成行业公敌?_WEB

作者:Sam Lyman;编译:Luffy,Foresight News华盛顿特区 - SEC 主席 Gary Gensler 与参众两院的成员建立了密切的联系...  谁来监视监察者.

FTX:FTX粉碎泰勒·斯威夫特的Crypto梦想 1亿美元合作也随之告吹_STASIA

编译:区块链骑士 泰勒·斯威夫特(Taylor Swift)与现已破产的Crypto交易所FTX的合作伙伴关系一直备受关注,此前CNBC的一份报告显示.

ROL:美国首只杠杆比特币 ETF 低调开盘 首日成交量近550万美元_比特币

作者:比推BitpushNews Mary Liu纽约时间6月27日,美国首只杠杆比特币 ETF(股票代码:BITX)在CBOE BZX交易所开盘交易.