服务器故障!“B站崩了”冲上热搜第一?

首页 > 科技 > 正文
2021-07-15

发表自话题:b站崩了

  昨晚夜深人静之际

  当你打开B站刷视频的时候

  却发现

  ⬇ ⬇ ⬇

  

  

  

  ??瓦特??

  这小破站咋地肥事?

  

  打开微博发现

  ⬇ ⬇ ⬇

  

  微博出现了各种版本说法

  B站停电了……

  B站起火了……

  B站被偷袭了……

  B站大楼塌了……

  

  直到凌晨2点20分

  官方终于通报了原因

  ⬇ ⬇ ⬇

  

  服务器机房故障?

  于是……在新媒体各大平台

  IT界的各路神仙开始沸腾了

  

  “B站这个这么大一社交平台

  难道没有两地三中心的容灾中心?

  还是说两地三中心没有被负载成功拉起?

  又或者是云服务器CDN挂掉了?

  网关跟着CDN也挂掉了?”

  

  各路神仙提了不少猜测

  网友们听得更是云里雾里

  那今天,咱们就来说说

  什么是异地容灾负载均衡

  在数字化时代

  IT系统的故障

  会直接导致难以估量的损失

  尽管我们上了多重的保险

  但自然灾害、人为因素等因素

  都可能会造成业务中断

  著名的911事件就是典型的例子

  那怎样才能减轻这种风险呢?

  异地容灾无疑是最好的选择

  

  容灾体系介绍

  

  异地容灾,顾名思义就是在不同的地域,构建一套或者多套相同的应用或者数据库,起到灾难后立刻接管的作用。

  数据中心

  集团公司通过两地建立三个数据中心,通过双活、冷备等方式,实现两地三中心容灾架构。

  

  体系建设

  系统类型

  容灾策略

  核心业务系统

  两地三活

  关键平台系统

  同城双活

  非关键系统

  异地冷备

  技术方案

  异地冷备

  恢复能力 RTO≤1h,RPO≤5min

  选取异地数据中心搭建灾备环境,通过公司统一平台工具实现应用配置同步,生产库与同城库可进行实时同步,同城库与异地灾备库可进行异步同步。

  端到端双活

  恢复能力 RTO≤10min,RPO≈0min

  系统在两个地理节点部署所有组件并同时承载业务,当其中一个地理节点的系统组件发生故障时,部署于其它地理节点的系统组件可以及时完成业务接管。

  B站作为知名的社交平台

  想必异地容灾的IT架构还是有的

  那为什么服务器还是崩了呢?

  不少IT界的网友猜测

  可能是因为负载均衡跟不上所导致的

  毕竟B站的访问量惊人

  负载均衡要承载的并发数也相当高

  那,什么又是负载均衡呢?

  

  负载均衡(Load Balance,简称 LB)是高并发、高可用系统必不可少的关键组件,目标是尽力将网络流量平均分发到多个服务器上,以提高系统整体的响应速度和可用性。

  通俗点讲

  这种官方的说法可能比较难理解,为此小编特地请教了我们的售前工程师讨了个说法:

  负载均衡,打个比方,一个150斤的人,需要2只才能拉得动,假设当这个人换成一个250斤的,那可能就需要3-4只才能拉得动了,而负载均衡则可以实现系统自动分配多几只来支援,轻轻松松就能拉动这个250斤的人。

  

  负载均衡的作用

  高并发:负载均衡通过算法调整负载,尽力均匀地分配应用集群中各节点的工作量,以此提高应用集群的并发处理能力(吞吐量)。

  
伸缩性:添加或减少服务器数量,然后由负载均衡进行分发控制。这使得应用集群具备伸缩性。

  
高可用:负载均衡器可以监控候选服务器,当服务器不可用时,自动跳过,将请求分发给可用的服务器。这使得应用集群具备高可用的特性。

  
安全防护:有些负载均衡软件或硬件提供了安全性功能,如:黑白名单处理、防火墙,防 DDos 攻击等。

  B站这波事件

  可没少折腾运维人员

  传闻昨晚B站大楼灯火通明

  不知道又熬秃了多少运维人

  

  望各大企业引以为鉴

  尽早做好异地容灾和负载均衡

  切莫因小失大

标签组:[容灾] [高可用] [服务器类型] [负载均衡

上一篇“B站崩了”又上热搜 网友:它承受了太多

下一篇“b站崩了”冲上热搜 网友急了:我也崩了

相关阅读

热门阅读