原标题:《HoldtheDoor!区块链底层平台流控分析》
导读
流量控制是为了解决在面对不确定的和不稳定的流量冲击下,依旧能够保障系统的稳定运行。如果不对系统实施过载保护,大量流量冲击可能影响系统稳定性,甚至引起“雪崩效应”,导致系统崩溃,停止服务。
当无法预测和控制入口流量时,则系统需要进行流量控制。要想达到系统流控的效果,系统流控策略需要从系统整体架构出发,站在系统流量来源、系统总体架构、系统模块资源分配等角度进行分析,从而制定出符合系统的流控策略。
流控纬度分析
▲?流量来源角度
区块链节点的入口流量大体分为两种,一种为客户端发送过来的请求,请求可能为区块链数据查询、发送新交易、合约操作等。节点接收到客户端请求后,首先需要从网络IO流中读取到请求的字节内容,然后反序列化字节内容为结构化内容,最后根据结构化请求体调用对应的API逻辑;另一种为其他区块链节点发过来的网络消息,区块链系统底层是由多个共识节点组成的共识网络,节点间通过计算机网络进行信息传输。节点接收到对端节点发送过来的网络消息后,根据消息类型,抛给对应的模块去处理。
Cholla CEO:比特币是人类下一阶段进步的关键支柱:金色财经报道,德克萨斯州石化勘探和投资公司Cholla Inc. 首席执行官Gideon Powell表示,比特币是人类下一阶段进步的一个关键支柱。Powell认为,在某种程度上,还没有词语来准确的描述什么是去中心化数字无许可网络,因此比特币不仅仅是一种商品和货币,走向更加点对点的系统对于坚持整个社会的公平制衡至关重要,没有其他创新可以真正协调所有独特的激励措施,比特币是允许人们在未经任何人许可的情况下跨时间和空间协作的基石。[2023/7/29 16:05:13]
因此,不仅需要对客户端请求进行流量控制,防止大量突发外部请求都往同一个节点发送,耗尽目标节点资源导致目标节点服务瘫痪。还要对节点接收到的网络消息进行限流,防止节点在高负载下,前面的消息涉及的系统逻辑还未处理完,还源源不断地接收和缓存后面到来的消息,甚至导致节点内存溢出。总结起来,即区块链节点入口流量有两种,一种为客户端请求,另一种为节点间网络消息,需要分别对这两类流量进行限流。
▲?总体架构角度
同一个节点或分区内的不同模块,存在资源竞争问题。以趣链区块链底层平台为例,存在网络资源竞争的模块主要包括:
NBA国王队俱乐部董事长宣布将用比特币支付NBA球员薪资:4月15日消息,美国《福布斯》双周刊网站近日报道称,美职篮(NBA)萨克拉门托国王队俱乐部董事长维维克·拉纳戴夫说:“我准备在近期宣布,我将向国王队的每个成员提供他们所需的比特币薪酬,包括球员报酬在内的薪资未来都可以用比特币支付。”(财联社)[2021/4/15 20:21:37]
共识模块区块数据同步模块NVP模块文件上传下载模块其中,共识模块是决定系统服务质量的关键模块。因此,为了保证系统的高可用,需要保证关键模块的流量得到优先处理,限制非关键模块可使用的流量,避免非关键模块抢占了所有系统资源。
▲?多分区架构角度
如下图所示,多分区的区块链系统架构下,每个分区都有一条单独的链,虽然同一个节点不同分区间共识、执行和存储完全解耦,但是不同分区共享同一个计算机资源,因此,多分区本质上也存在资源竞争问题。
当多分区架构被应用于业务分区而治场景时,不同分区上运行着不同的业务,如果不对分区流量进行控制,可能存在分区1业务负载极大情况下,分区2虽然空闲,但由于此刻没有空闲计算机资源可用,发往分区2的请求可能需要很久才有响应,甚至出现拒绝服务。因此,多分区架构下,不同分区存在资源竞争,需要对各分区流量进行限流。
MXC抹茶:已将风险比特币地址已加入黑名单 阻断风险提币:7月16日凌晨,多位知名人士推特账户疑似遭入侵,并发布涉及比特币转账相关内容。MXC抹茶相关负责人16日表示,为保护用户资产安全,MXC抹茶第一时间将相关地址加入了黑名单,同时阻止了用户向该地址的风险提币行为。[2020/7/16]
▲?有限带宽角度
有时候,我们不希望节点的运行抢占了所有的网络带宽,导致其他程序无法提供服务,这时就希望机房里分配给节点服务器或者分给某个进程有限的带宽。由于带宽有限,这就要求提高节点带宽利用率,并且保证关键流量被优先传输,优先保证系统稳定性和可用性。
常见流量控制算法
在分析完不同角度的流控后,我们需要选择出适用的限流算法。目前常见的限流算法,主要有以下两种:
漏桶算法令牌桶算法▲?漏桶算法
漏桶算法的原理可以类比为往一个固定大小的桶里盛水,同时,水从桶底漏洞以固定速度流出,如果加水过快,则直接溢出,如下图所示。它可以应用于网络传输限流,计算机每发送一个数据包,如果桶内未满,则把数据包放入桶里,如果桶内已满,则丢弃数据包,与此同时,以固定速度从桶内取出数据包,发送到网络,从而达到强行限制数据平均传输速率的目的。
MIU Talk潘国力:算力下降不会对比特币网络有较大的影响:在MIU Talk线上AMA社群专访活动上,中研智创区块链科技有限公司技术负责人潘国力就目前算力情况及矿业市场未来发展做了分享。他表示,受全球疫情的影响,各个传统金融资产出现了普遍性下跌,原油、纳斯达克指数最高跌幅达到了30%以上。而作为全球资产之一的比特币肯定也不能独善其身,跟随全球资产的下跌趋势。此外,人们对比特币产量减半价格暴涨的预期过高。前两次比特币产量减半分别是2012年和2017年,两次减半均带来价格的大幅度上涨,据此推理此次产量减半应该也会带来价格的大幅度上涨。
对于目前算力下跌的情况,他表示,全网算力已经从120E下降到目前的90E左右,目前跌幅大概25%。对于比特币网络而言,难度调整周期大约是两个星期,如果期间算力下降太多或者波动太多,可能会导致出块不平稳,总体而言对比特币网络不会有多大的影响。[2020/3/19]
图片来源于网络
漏桶算法常用于将突发或不稳定流量整形为以固定速度在网络中传输的流量。
动态 | 主流矿机S9逼近关机价 当前有7款比特币矿机处于关机价:据F2pool最新数据,基于比特币当前挖矿全网难度,以电价0.35元/度计算,有神马M3(¥80444)、神马M3v2(¥77709)、雪豹A1(¥58527)、蚂蚁V9(¥118761)、阿瓦隆 A741(¥72868)、翼比特 E9(¥67070)、蚂蚁T9(¥63083)等7款比特币矿机处于关机价。此外,主流矿机S9(¥46255)也非常接近关机价。据此前提及,Primitive Ventures创始合伙人Dovey Wan表示:“据我所知,所有的S9矿工都在恐慌抛售,因为他们非常接近关机币价。要知道,S9占了一半以上的算力。”[2019/10/24]
▲?令牌桶算法
对于要求允许某种程度的突发传输,漏桶算法显然无法满足需求,而令牌桶可以做到这一点。令牌桶算法同样定义了一个固定大小的桶,桶里最多可容纳b个令牌,每当有数据包需要发送时,要从桶里取出对应数量的令牌才能发送,如果桶里没有足够令牌,则无法发送。与此同时,以固定速度r往桶里添加新令牌,当桶里令牌数已经达到b个时,丢弃新令牌。
图片来源于网络
令牌桶算法非常适合于针对系统外部请求的限流,当桶内有足够多令牌时,系统在某一时刻可以同时接收并处理多个请求,充分利用到系统资源。
总结来说,令牌桶限流允许突发流量,对于请求的限流、网络带宽限流,更能充分利用系统资源和网络资源,是适用于区块链底层平台系统流控的一种限流方法。
流控实践
最终,我们采用交易拦截器限流+消息分发器限流+网络带宽限流组成三道限流阀门,来应对不同业务场景的压力,保证系统具备较高处理能力的同时又能稳定运行,持续可用。
▲?交易拦截器限流
主要用来限制客户端到节点的流量。具体指在系统达到交易最大处理能力时,接口服务层及早对新交易进行拦截并拒绝,阻止新交易渗透到主流程花费不必要的系统开销,一定程度上让出更多的系统资源去处理未完成的交易。
交易拦截器通过定义拦截规则,来达到限流的目的,最终效果包括:
限制请求速率:通过令牌桶限流算法控制请求速率,并限制节点最多可同时接收并处理的HTTP请求数。节点高负载下拒绝新交易:当节点交易池已满或者处于异常、异常恢复状态无法进行正常三阶段共识时,拒绝来自HTTP客户端发送过来的新交易,避免交易解析、交易验签带来的CPU消耗。▲?带权消息分发器限流
主要用来限制非关键模块的流量,防止带宽、CPU和内存都被非关键模块给占用。具体做法是为各个需要进行网络通信的模块分配带缓存空间的读、写管道,根据模块在系统中所占权重为其管道分配不同的缓存大小。
消息分发器收到一条来自底层P2P网络的网络消息,根据消息类型将消息分发给对应模块进行处理。这条消息首先分发给模块对应的R管道,模块再从R管道按照FIFO原则取出消息,执行相关逻辑,如果R管道消费速度慢于生产速度,导致分发消息时R管道已满,则说明模块内部已处于高负载,丢弃这条消息。为了保证达到系统限流目的,模块从R管道取出消息并处理消息的过程必须是串行的,而模块间的消息并行处理,互不干扰。
举个例子,当非关键模块处于高负载处理能力变慢时,其R管道虽然占满,但是不会影响共识模块消息的处理速度,同时又由于不同模块根据权重R管道大小不同,一定程度上防止节点一直处理非关键模块消息占用过多系统资源而导致共识模块消息无法得到及时处理。
带权消息分发一定程度上降低了各模块由于处理能力差异而相互干扰,提高系统网络消息并行处理能力,保证核心网络消息不被非核心网络消息占去全部系统资源,同时,系统高负载下自动丢弃新接收到的网络消息,防止系统负载过高而崩溃。
▲?网络带宽限流
本文所提的网络带宽限流特指限制节点间通信的最大出口带宽流量,该实现基于GuavaRateLimiter限流。开启出口带宽的限制一定程度上会比关闭带宽限制带来一定TPS的损失,前期经过测试,我们发现,TPS大幅下降主要原因在于开启带宽限制后,我们没有对节点处理能力进行“降级”,导致节点有限的带宽都被用于交易转发而无法在规定时间内发送或处理相关共识消息而极易进入异常状态,而异常状态下节点拒绝新交易,最终导致系统整体交易吞吐量大幅下降。
因此,经过适当修改后,当开启节点出口带宽限流时,根据设置的带宽上限值自动计算交易转发速率,通过控制交易转发速率,使得出口带宽可以被共识关键网络消息充分利用。这种网络带宽限流方法,相比直接使用TC限流,一定程度上,可以提高有限带宽下节点运行的稳定性,并且使得TPS下降在预期可接受范围内。
▲?分区间限流
每个分区通过交易拦截器+带权消息分发来达到限流的目的,从而均衡分配各个分区使用的系统资源。这里不再阐述。
总结
本文通过从多个角度对区块链系统流控进行分析,并得出适用于系统的流控策略,有效解决了节点在各压力测试场景下系统不稳定、容易崩溃的问题,同时保证节点高性能和高稳定性。除了上文的实践以外,后续我们还将进行多种优化,包括但不限于读/写请求并发的限流、限流权重动态调整等等。
作者简介
马晓敏来自趣链科技基础平台部,区块链底层网络研究小组
参考文献
?Leakybucket-Wikipedia
?bucketToken-Wikipedia
?超详细的GuavaRateLimiter限流原理解析
标签:NFT区块链rippleITCOxNFT价格区块链通俗易懂的说法ripple币币值稳定Bitcoin Galaxy
巴比特讯,9月27日,由中关村区块链产业联盟主办,北京泰尔英福科技承办的“ICT中国·2021高层论坛之区块链创新应用发展论坛”在北京召开,超级账本执行董事BrianValendorf分享称.
原标题:《扑克NFT、乒乓球NFT、计算器NFT......如何警惕那些炒作过度的NFT?》在之前的文章里,小编介绍了NFT的“出道简史”以及安全问题,而现在,出圈的NFT,玩的越来越“野”.
元宇宙见闻原创作者|Camila编辑|Chi导语比特币ETF(指数股票基金,ExchangeTradedFunds)准备上市的消息,带动连日来比特币的强劲涨幅.
据U.Today消息,土耳其总统RecepTayyipErdogan9月18日在梅尔辛市与来自81个省的学生会面时表示,土耳其正在与加密货币“交战”.
随着国家发改委等部分“关于整治虚拟货币挖矿通知”的颁布,过去5个月,比特币、以太坊等高能耗的POW挖矿产业有序清退,逐步出清.
证券日报记者邢萌见习记者张博“太难抢了,根本抢不到。”中秋节之前,“黄牛”余军对记者抱怨。余军所说的并不是车票,而是当日某互联网大厂限量发售的亚运会“数字火炬”数字收藏品.