澳门美高梅手机网站MGW——美团点评高性能四层负载均衡

迎接大家之腾讯云社区,获取更多腾讯海量技术实施干货哦~

作者:腾讯技术工程官方号

微信朋友围包括图形和视频两模仿业务架构重组,朋友围图片的性状是请求量大、消耗计算资源比较多,视频则重要消耗带来富。朋友围的数量是世代存储的,而且随着事情的迅速发展,存储容量、带宽和装置的吃大量长,而要节日带来的使用量增长,更加剧了吃,也给运维人员之涵养带来了伟大压力。

节保重大出于三地方做:软件保障指经序、业务逻辑层面的优化及评估,减轻负载;硬件保障关键指带宽、机器负载的评估和扩容;柔性措施指的是由此作业调整,降低局部不重要特色的资源,来维持要特性的常规运转。

本文整理自美团点评技术沙龙第14期:美团背后的故事-你切莫亮的美团云。

软件保障

情侣围整体情况:

 

澳门美高梅手机网站 1

 

恋人围的架构,主要分为OC和IDC两种植,IDC指的是数核心,即数据最终诞生存储的地方,OC指的是带来外网的独机房,SOC指规模比较充分的OC。每个IDC都有一整套接口机/逻辑设备/存储设备用以支持用户的上传下载、及文件落地存储的需求。

OC点的重大作用是供外网访问,承载用户的下载流量。每个OC内的配备,一起结一个缓存池,用户下载时,本地OC中缓存不命中,才到IDC去回源拉取文件。每个OC的效益还是同样的,用户一般到邻近的OC点下载,当单个OC点故障时,会透过重试或者切换为用户到任何OC点下载,确保下载成功。

美团点评技术沙龙由美团点评技术集团牵头,每月同样愿意。每期沙龙请美团点评和另外互联网商家之技术专家分享来自一线的实践经验,覆盖各要技术世界。

容灾及重试机制:

情人围的模块容灾主要是兑现单机故障时之机动删除,主要形式是经master管理服务器的ip列表,通过心跳探测等艺术找到十分设备,并屏蔽故障ip,不回来给前端采用,以front层的单机剔除为条例:

 

澳门美高梅手机网站 2

如若一切OC或IDC点碰到故障,由于改变较生,一般依靠运维人员手工切换来恢复,或者经过模块之间的重试机制来保障

情人围下载的重试:

 

澳门美高梅手机网站 3

任由是用户到OC的下载过程,还是OC到IDC的回源过程,默认都见面开展2次垮后的重试,并且重试一定会选择异地的接入点,避免后续重试到故障的节点。实现之规律是各一样层master都见面回去给前端至少少组ip列表,并包一定量组ip列表为外地节点,前端失败时才得以兑现异地重试。

可重试由于会招请求的增,所以是把双刃剑,节日期间由于请我涨幅一度坏高,重试更爱吸引问题,需要开展调整:

1.经master路由下,关闭重试。在元旦/春节这种求有数倍增长的纪念日实行。

2.值班人员严密监督,如果IDC失败率超过20%,则迫切手工关闭重试。这种当中秋/国庆这种增长并无愈之节假日实行。

Front模块的重试控制界面:

澳门美高梅手机网站 4

 

时下沙龙会分别在京城、上海跟厦门对等地做,要与下一致涂鸦最新沙龙活动?赶快关注微信公众号“美团点评技术团队”。

硬件保障

 

容量评估以及配备扩容:

节假日前运维人员会连同资源组,根据工作预算和作业加强的需跟实际负荷,进行逐机房、模块的装备扩容。预算之外的要上涨,则经过柔性或者过载之计,进行降低或拒绝。

 

  • 机房容量主要依据交换机带宽的上限评估
  • 接入层设备容量主要因CPU、内存的负荷比例、网卡的流量/包量占比较来评估。
  • 囤层设备容量主要因CPU、内存的载重比例、磁盘IO的读写次数来评估。

新年情侣围上污染负载:

 

澳门美高梅手机网站 5

 

事务侧春节求的提高比例,是上传支持9加倍增长,下载支持1倍增长,超过这个比重的请求可以拒绝掉,但因预算扩容后,达到上图的效用,还是时有发生局部模块无法支撑这个涨幅,尤其是压缩compress模块,该模块每支持一倍增长就用大量虚拟机扩容,预算内无法支撑,这样便得采取柔性策略来化解。

本期沙龙席卷三集讲座:美团云Docker平台、美团云对象存储系统、美团四层负载均衡网关MGW。其他几街讲座的图文实录会陆续刊登,请继续关注。

柔性策略

对象围的柔性策略分为两层:

 

第一重叠是粗暴柔性,即准百分比、接工作直限制上传下载的伸手,被限的伸手会回给用户失败,与微信C2C相同,这种一般用于超过系统预估的载重能力,造成系统故障时用于快速恢复工作时使用。

仲重合是比照工作特点柔性,即从事情范围通过降落图片视频清晰度、延迟用户更新等系列化降低系统的载荷。下面要详述业务柔性

情侣围业务的重中之重增长以及瓶颈:

 

自前文的装置负载评估图看,在预算范围外,接入层和逻辑层都只好支持5倍增提高,而压缩compress模块只能支持1加倍增长。

 

澳门美高梅手机网站 6

前言

每当高速发展的活动互联网时代,负载均衡有着重要的地位,它是运流量之输入,对以之可靠性和性于在决定性的意向,因此负载均衡得满足大性能、高可靠两单特征。MGW是美团点评自研的一模一样慢慢悠悠四层负载均衡,主要用以代替旧环境之季重合负载均衡LVS,目前拍卖在美团点评数十
Gbps的流量、上千万底起连接。本文主要介绍MGW是什么兑现强性能、高可靠的。

1.压缩compress柔性

Compress模块的意是将客户端上传播的本来图片按照需要减少成各种格式和尺寸,以支撑特定的事务场景,并且节省存储空间以及拉动富。由于削减技术之频频升华,使用还先进的压缩格式,同等清晰度之图样压缩比例更强,需要耗费的压缩计算资源就愈加多。

 

澳门美高梅手机网站 7

从而一旦反向操作,将眼前采取的hevc格式替换回jpeg格式存储的口舌,就可节省压缩资源,实测compress的cpu负载可以落为20%,即支持5倍提高。但图的平均大小也会上涨,造成下载流量上涨。

因此利用的折衷方法,是在上传图片换回jpeg格式的又,将图纸的清晰度从70暴跌为50,这样好减多少文件平均大小,从而抵消换回jpeg格式带来的流量上涨效果。实际测试中,发现用户指向降低清晰度之感知并无明白,在节日短短开启无会见潜移默化用户体验。

 

什么是负载均衡?

互联网首,业务流量比小而且作业逻辑比较简单,单台服务器就得以满足基本的需;但随着互联网的前进,业务流量更深并且作业逻辑吗越发复杂,单台机器的习性问题同单点问题凸显显了出去,因此用差不多令机械来进展性的程度扩展及避免单点故障。但是只要争用不同之用户之流量分发到不同的服务器上面吧?

澳门美高梅手机网站 8

首的方式是运用DNS做负载,通过被客户端解析不同的IP地址,让客户端的流量直接抵达各个服务器。但是这种措施来一个百般老之短处就是延时性问题,在做出调度策略改变之后,由于DNS各级节点的缓存并无会见应声的当客户端生效,而且DNS负载的调度策略比较简单,无法满足工作需要,因此就出现了负荷均衡。

澳门美高梅手机网站 9

客户端的流量首先会见到达负载均衡服务器,由负载均衡服务器通过自然的调度算法将流量分发到不同之应用服务器上面,同时负载均衡服务器也会见对应用服务器做周期性的健康检查,当发现故障节点时即便动态的拿节点打应用服务器集众多中剔除,以之来保管应用的强可用。

澳门美高梅手机网站 10

负载均衡又分为四层负载均衡和七层负载均衡。四交汇负载均衡工作于OSI模型的传输层,主要工作是转发,它当吸纳到客户端的流量下通过修改数据包的地址信息用流量转发到应用服务器。

七层负载均衡工作在OSI模型的应用层,因为她要分析采用层流量,所以七层负载均衡在接客户端的流量下,还需要一个完好的TCP/IP协议栈。七层负载均衡会与客户端起平等久完整的连续并将应用层的呼吁流量解析出,再以调度算法选择一个应用服务器,并和应用服务器建立另外一长条连接将请发送过去,因此七层负载均衡的显要办事就是代理。

既然四层负载均衡做的机要工作是转发,那就算存一个转化模式之问题,目前首要发生四重合转发模式:DR模式、NAT模式、TUNNEL模式、FULLNAT模式。

澳门美高梅手机网站 11

DR模式为让作三角传输,通过修改数据包的目的MAC地址来为流量经第二重叠转发到应用服务器,这样应用服务器就足以直接以应发给应用服务器,性能于好。由于这种模式需依赖二重合转发,因此其要求负载均衡服务器和应用服务器必须在一个次重叠可达到的条件外,并且要以应用服务器上布置VIP。

NAT模式通过改动数据包的目的IP地址,让流量到应用服务器,这样做的益处是数据包的目的IP就是应用服务器的IP,因此不欲重以应用服务器上布置VIP了。缺点是由于这种模式修改了目的IP地址,这样一旦应用服务器直接用对包发给客户端吧,其源IP是应用服务器的IP,客户端就未会见健康接收这答复,因此我们需要让流量继续回到负载均衡,负载均衡将应答包的源IP改回VIP再作至客户端,这样才得管健康通信,所以NAT模式要求负载均衡得以网关的形式在为网络被。

TUNNEL模式之优缺点和DR是相同的,并且TUNNEL模式要求应用服务器必须支持TUNNEL功能。

FULLNAT模式是于NAT模式之基本功及召开一次源地点转换(即SNAT),做SNAT的补益是足以被许答流量经过正规的老三层路由于回到负载均衡上,这样负载均衡就无欲坐网关的款型有吃网络中了,对纱环境要求比没有,缺点是由于做了SNAT,应用服务器会丢客户端的诚实IP地址。

澳门美高梅手机网站 12

脚详细介绍一下FULLNAT模式。首先负载均衡上待有一个localip池,在做SNAT时之源IP就是打localip池中挑选的。当客户端流量到达负载均衡设备以后,负载均衡会根据调度策略在应用服务器池中甄选一个应用服务器,然后将数据包的目的IP改吗应用服务器的IP。同时由localip池中摘一个localip将数据包的源IP改呢localip,这样应用服务器在承诺答时,目的IP是localip,而localip是真性是叫负载均衡上的IP地址,因此得以经正规的老三层路由于至负载均衡。由于FULLNAT比NAT模式多做了扳平浅SNAT,并且SNAT中有选端口的操作,因此该特性要低于NAT模式,但是出于该于强的大网环境适应性,我们选了FULLNAT作为MGW的中转模式。

2.轻频码率柔性

小视频的带富平时会见越1TB,节日效应增强明显。所下的降流量方法与图片类似,即退上传视频的码率,通过降低文件平均大小的措施来节省带富。

柔性: 小视频码率1800 -> 1200 平均大小 2.1MB -> 1.3MB

经测试,降码率后基本不见面影响用户体验,但出于是对准新高达传视频生效,要体现到下充斥带富的低落中,就出相当程度的推,大约用4钟头全奏效。所以这无异于柔性措施以节日之前就是待开启,不能够用来应付紧急情况。

澳门美高梅手机网站 13

降码率生效期间流量变动

胡选择自研四层负载均衡?

选料自研四层负载均衡的由要发生少独:第一个是考虑到硬件负载均衡成本较大;第二单,随着美团点评业务流量更深,LVS出现了性能瓶颈和运维成本的上升问题。

3.齐传TSSD缓冲池柔性

 

澳门美高梅手机网站 14

是因为上传preupload接口机及后层的逻辑模块等,都无法支撑10加倍涨幅。所以当搭中另外搭建了有限模拟TSSD缓冲池,缓冲池用于临时存储新上传的公文,可以支撑读写。按上图所示,在zone模块处多了缓冲池一,在上传preupload处,增加了缓冲池二。两独缓冲池的来意是发分之:

 

  •  zone模块如果过载,主动了载掉的上传请求,不会见一直归失败,而是以请求写副到缓冲池一中,缓冲池一中之公文并无克叫下充斥及,但会按部就班可比缓慢的快将文件发出,写副到后端模块。所以缓冲池一底机要作用是迟迟缺乏日内大量的上传请求,而非是全然抵消上传请求,并且缓冲池一中的文本是不可知叫下充斥到之。

 

  • 以preupload模块处增加了缓冲池次,preupload模块中对存储TFS的勾勒请求次数做了限定,如果上传请求数超过了蕴藏TFS的能力,则preupload会将请求写副缓冲池二。用户下载时,会因文件标识进行判断,如果发现文件存储于缓冲池其次只要不是TFS中,则会到缓冲池第二惨遭失得到文件。所以缓冲池二得以取代TFS的法力,起至保障底层模块的机能。等交缓冲池其次下架时,需要以里面的文书人工写副到TFS中。

 

硬件负载均衡成本问题

  1. 硬件成本:中低端硬件负载均衡价位以数十万,高端的上百万,价格格外贵。当我们得整合一个高可用集群时,需要反复玉机器,成本非常高。
  2. 人力财力:硬件负载均衡功能于强,配置于灵活,这也致使在保障及,我们要有由此专业培训的食指,就增了人工成本。
  3. 岁月成本:当以的历程遭到碰到bug或者新需要要厂商提供新本子的时候,我们需要经繁琐的流程向厂商上报,然后厂商还宣布新本子供我们升级,时间周期异常长,在便捷发展的互联网行业,这种周期是无法接受之。

4.恋人圈timeline按比例柔性

timeline指的凡微信朋友围更新的光阴穿,这等同柔性的规律是以通知用户好友朋友围更新的流年戳先缓存起来,不产发给用户的微信终端,这样微信及就是看不到朋友围更新的始末了,也就不见面发下充斥图片/视频的乞求,可以直接压缩下载流量。

澳门美高梅手机网站 15

timeline柔性后此不会见更新了

 

可是为发出几乎沾注意事项:

 

  • 善招用户投诉,用户一般会肯定感知到朋友围内容变少了。
  • 设若缓存timeline的时光过久,将缓存下发的进程就得充分缓慢,否则会招下载流量的逾暴涨。

 

澳门美高梅手机网站 16

新年人工执行柔性的步调

 

LVS的性能问题

早期美团点评使用的凡LVS+Nginx组成的载重均衡布局,LVS做四叠负载均衡,Nginx做七层负载均衡,但是随着美团点评流量的高效增长(几独月内任新建连接数还是吞吐量都产生三加倍的加强),LVS故障频发,性能及冒出瓶颈,因此我们自研了一如既往缓缓高性能、高可靠的季重合负载均衡MGW来替换LVS。

推荐阅读

新年微信访问突发,存储业务怎么稳定度过?

6
单月清洗近千亿漫长微信支付交易记录,他们假设打出什么异常工作?

称服务器20元/月于,更享千元续费大礼包


此文已由作者授权腾讯云技术社区发布,转载请注明原稿出处

MGW如何实现大性能

下通过对照LVS的片段属性瓶颈来介绍MGW是怎么样促成强性能的。

停顿问题及协和栈路径性能过长题目

暂停是熏陶LVS性能最要的一个素,假如我们一致秒需要处理600万的数据包,每6只数据包有一个硬件中断的话,那无异秒就见面发100万单硬件中断,每一样赖发硬件中断都见面死正在拓展密集计算的载重均衡程序,中间闹大量底cache
miss,对性能的震慑挺大。

与此同时由于LVS是根据内核netfilter开发之一个应用程序,而netfilter是运行在本协议栈的一个钩子框架。这就意味着当数码包到达LVS时,已经经过了一样段老丰富之协议栈处理,但是及时段处理对LVS来说都未是必需的,这也促成了平部分非必要之属性损耗。

澳门美高梅手机网站 17

本着这点儿独问题,解决方法是以轮询模式之使与举行kernel
bypass,而DPDK提供的用户态PMD驱动恰好可以缓解当时有限独问题。DPDK在统筹时行使了大气硬件相关特性比如numa、
memory channel、
DDIO等,对性能优化非常特别,同时提供了比较多网络方面的库房,可以大大减弱多少开难度,提高开支效率。因此挑选DPDK作为MGW的支付框架。

由水源是一个于通用的应用程序,因此它并不曾指向部分一定情景做一些定制设计,这就算招部分公共的数据结构需要锁之护卫。下面介绍一下出现锁的由和MGW的解决措施。

澳门美高梅手机网站 18

第一介绍一下RSS(Receive Side
Scaling),RSS是一个由此数据包的元组信息用数据包散列到不同网卡队列的效能,这时候不同之CPU再失相应的网卡队列读取数据进行拍卖,就好充分利用CPU资源。之前介绍MGW使用FULLNAT的模式,FULLNAT会将数据包的元组信息一五一十反,这样和一个连,请求和报方向的多寡包出或会见受RSS散列到不同的网卡队列中,在不同之网卡队列也便象征当受不同的CPU进行拍卖,这时候在走访session结构的时节便需对斯组织进行加锁保护。

釜底抽薪是题材之艺术发生一定量种,一种就是以做SNAT选端口的时段,通过增选一个端口lport0让RSS(cip0,
cport0, vip0, vport0) = RSS(dip0, dport0, lip0,
lport0)相等;另外一栽艺术就是是我们为每个CPU分配一个localip,在举行SNAT选IP的当儿,不同的CPU选择自己之localip,等回答回来以后,再通过lip和CPU的映照关系,将指定目的IP的数码包送到指定队列上。

由于第二种艺术恰好可以被网卡的flow
director特性支持,因此我们捎了第二种植方法来去掉session结构的沿。

澳门美高梅手机网站 19

flow
director可以依据早晚策略将点名的数量包送到指定网卡队列,其于网卡中之先期级要较RSS高,因此我们当做初始化的早晚便也每个CPU分配一个localip,比如为cpu0分配lip0,为cpu1分配lip1,为cpu2分配lip2,为cpu3分红lip3。
当一个告保管(cip0, cport0, vip0,
vport0)到达负载均衡后,被RSS散列到了起列0上,这时是包给cpu0处理。cpu0在针对其举行fullnat时,选择cpu0自己之localip
lip0,然后将数据包(lip0, lport0, dip0,
dport0)发到应用服务器,在应用服务器应答后,应答数据包(dip0, dport0,
lip0,
lport0)被作到了负荷均衡服务器。此时咱们尽管可以flow
director下一样长长的以目的IP为lip0的多少包送到队列0的条条框框,这样答复数据包就是见面给送及队列0让cpu0处理。这时候CPU在对同一个一连两单样子的数包进行处理的时光就是截然串行的一个操作,也就是不要再次指向session结构进行加锁保护了。

上下文切换

澳门美高梅手机网站 20

以统筹时,希望控制面及数码平面完全分开,数据平面专心做协调的拍卖,不吃任事件打断。因此用CPU分成两组,一组用作多少平面一组用做决定面。同时,对数码平面的CPU进行CPU隔离,这样控制面的进程就非会见调度到数码平面的即时组CPU上面了;对数据平面的线程进行CPU绑定,这样尽管可吃每个数据线程独占一个CPU。
其他的决定面的主次比如Linux kernel、 SSH等还飞在决定面的及时组CPU上。

MGW如何做到高可靠

下面从MGW集群、MGW单机以及应用服务器层就三个层介绍MGW如何在各级一样叠实现强可靠。

集群的赛可靠

澳门美高梅手机网站 21

MGW使用OSPF+ECMP的模式做集群,通过ECMP将数据包散列到聚集众多被各个节点上,再经过OSPF保证单台机器故障后用立即尊机器的路由动态的去除出去,这样ecmp就无见面再次给就令机器分发流量,也尽管成功了动态的failover。

澳门美高梅手机网站 22

风土的ecmp算法有一个生要紧的题材,当集众多中节点数量发生变化以后,会招致大部分流量的门道有变动,发生转移之流量达其他MGW节点上常凡摸索不交祥和之session结构的,这就算见面招致大量之连日出现异常,对作业影响好非常,并且当我们以对集群做提升操作时会见以每个节点都开展同样浅下线操作,这样就算加剧了是题目之熏陶。

同一种缓解智是运用支持一致性hash的交换机,这样在节点发生变化的时段,只有发生变化的节点上面的连续会产生影响,其他总是都见面维持正常,但是支持这种算法的交换机于少,并且也尚未了落实强可用,因此我们做了集群中的session同步功能。

澳门美高梅手机网站 23

集合众多被每个节点都见面全量的用好之session同步出去,使集众多中每个节点都维护一份全局的session表,因此无论节点变化以后流量的路为另外款式改变,这些流量都得以找到好的session结构,也就是说可以于正常的转向,这样便可以当汇众多中节点数量发生变化时保证有连接正常。

每当设计的长河被要考虑了零星个问题:第一单凡是故障切换,第二只是故障恢复跟扩容。

故障切换

澳门美高梅手机网站 24

以故障切换的问题达到,我们愿意在机器故障后,交换机可以即时将流量切到其它机器上,因为流量不决走,意味着到这尊机器流量会被全部扔,产生大量丢包。经过调研测试发现,当交换机侧全部使用物理接口并且服务器侧对接口进行断电时,交换机会瞬间拿流量切换到其他机器及。通过一个100ms发少单保险的测试(客户端与服务端各发一个),这种操作方法是0丢包之。

由故障切换主要靠让交换机的感知,当服务器上出现一些百般,交换机感知不至常,交换机就无法开展故障切换操作,因此待一个正规自检程序,每半秒进行相同蹩脚正常自检,当发现服务器是老时即对服务器执行网口断电操作,从而给流量就切走。

故障切换主要靠让网口断电操作而网卡驱动是走在主程序里面的,当主程序挂掉后,就无法还对网口执行断电操作了,因此为了缓解者题材,主进程会捕获异常信号,当发现异常时就是对准网卡进行断电操作,在断电操作了后还累将信号发给系统开展处理。

经过以上设计,MGW可以成功升级操作0丢包,主程序故障0丢包,其他异常(网线等)会生出一个不过丰富500ms的丢包,因为这种好需要依靠自检程序去检测,而自检程序的周期是500ms。

故障恢复和扩容

澳门美高梅手机网站 25

管当开展故障恢复还是扩容操作,都见面促成集群节点数量发生变化,这样吗即见面造成流量路径发生变化。当变化之流量到集群中原本的节点时,因为本来节点都维护着一个大局的session表,因此这些流量是可让正常转发的;但是若流量达了新机械及,这个机器是没有大局session表的,那么就有的流量就见面尽被废除。为了解决之题目,MGW在上线以后会更一个预上丝的中间状态,在这状态上,MGW不会见于交换机感知到温馨上丝了,这样交换机为便不见面把流量切过来。首先MGW会对聚集众多中任何节点发送一个批量一同的恳求,其他节点收到请求后会将协调的session全量的旅到新上丝之节点上,新及线节点在吸纳任何session以后才会受交换机感知到好达到线,这时交换机又用流量切过来就是可以正常为转接出来了。

于此进程中主要有个别接触问题。
首先单问题是,由于聚众多被连无一个主控节点来维护一个大局的状态,如果request报丢失或session同步的数量丢失的话,那新上线节点就无办法保护一个大局的session状态。但是考虑到独具节点都维护着一个大局的session表,因此有着节点有所的session数量还是平之,那么就足以以有节点每次做扫尾批量联合以后发送一个finish消息,finish信息遭带来在温馨备的session数量。当新高达丝节点收到finish消息后,便会坐祥和之session数量与finish中之多寡做对比。当上数求下,新高达丝节点就决定好进行上线操作。否则在伺机一定之逾期时间后,重新开展相同糟糕批量同步操作,直到上要求了。

另外一个题目是于拓展批量同步操作时,如果出现了新建连接,那么新建连接就未会见经过批量共同并到新达成丝之机器及。如果新建连接特别多,就会导致新上线机器直接上不至要求。因此,需要确保处于预上线状态的机能够接受及增量同步数据,因为新建连接可以由此增量同步同出来。通过增量同步同批量伙就足以确保新上线机器可以最终获一个大局的session表。

单机高可靠

澳门美高梅手机网站 26

于单机高可靠方面,MGW做了一个自动化测试平台,自动化平台经过连通性和布局的不利来判断一个测试用例是否实行成功,失败的测试用例平台可以经邮件通知测试人员。在历次新效能迭代结束以后,都见面拿新成效的测试用例加至自动化平台内,这样以每次上线之前都进行同样不良自动化测试,可以大大避免改动引发的问题。

当前面,每次上线之前还需要进行同样次等手动的回归测试,回归测试好耗时又大易遗漏用例,但是为了避免改动引发新题材又不得不开,有矣自动化测试平台下,大大提高了回归测试的效率与可靠性。

RS可靠性

节点平滑下线

澳门美高梅手机网站 27

当RS可靠性方面,MGW提供了节点平滑下线功能,主要是为了化解当用户需要针对RS进行升级换代操作时,如果直接用待升级的RS下线,那这RS上存的有着连接都见面砸,影响到工作。此时如果调用MGW的坦下线功能,MGW就足以确保此RS已发出连日正常工作,但无会见为上面调度新的连天。当有着都来连日了以后,MGW会上报一个为止的状态,用户就足以依据是结束的状态对RS进行升级换代操作,升级后还调用上线接口让这个RS器进行例行的服务。如果用户平台支撑自动化应用部署,那就算足以经过连接云平台使用平滑下线功能,实现了自动化且对业务无影响之升级换代操作。

一致性源IP Hash调度器

源IP
Hash调度器主要是保平等的客户端的连天为调度到平等应用服务器上,也就是说建立一个客户端和应用服务器一对一之照关系。普通的源IP
Hash调度器在应用服务器发生变化以后会促成映射关系发生反,会对作业造成影响。

因而我们付出了一致性源IP
Hash调度器,保证在应用服务器集群发生变化时,只有发生变化的应用服务器与客户端的照关系发生反,其他都是匪变换的。

澳门美高梅手机网站 28

以确保流量的平均,首先以hash环上分红一定数量的虚构节点,然后以虚拟机节点均的双重分布至大体节点上,重分布算法需要确保一定量接触:

  1. 每当大体节点发生变化时,只有个别虚拟节点映射关系发生变化,也就是要是力保一致性Hash的主导条件。
  2. 盖MGW是以集群的花样在的,当多只应用服务器发生上线下线操作时,反馈及不同之MGW节点上即生或会见并发顺序不同等的问题,因此无论不同的MGW节点产生何种应用服务器上下线顺序,都用确保最终之投关系一致,因为若不相同即导致同客户端的连接会叫不同之MGW节点调度到不同的应用服务器上,也就是失了源IP
    Hash调度器的标准。

综上所述以上两沾,Google
Maglev负载均衡的一致性Hash算法是一个坏好的例子,在paper中起详实的牵线,这里虽可大多讨论了。

总结

通过美团点评和美团云的流量验证,MGW无论在风网络环境还是overlay的雅二重合环境下都来佳之属性和安宁表现。在工作场景方面带有数据库业务,千万级别的增长连业务,嵌入式业务,存储业务以及酒店、外卖、团购等Web应用工作。在工作需要迅速变动之条件下,MGW在不断完善自身功能,在各种事情场景下都有绝妙的呈现。
在未来之一段时间内,MGW除了会圆满四重叠的力量需求客,也会考虑为七层方向进步。

参考资料

  1. DPDK.
  2. LVS.
  3. Eisenbud D E, Yi C, Contavalli C, et al. Maglev: A Fast and
    Reliable Software Network Load
    Balancer.

发表评论

电子邮件地址不会被公开。 必填项已用*标注