14日凌晨,B站发布消息称,昨晚,B站的部分服务器机房发生故障,造成无法访问。技术团队随即进行了问题排查和修复,现在服务已经陆续恢复正常。耽误大家看视频了,对不起!
昨晚打开B站看直播的时候发现页面502,又打开APP发现还是不行,第一念头是“B站挂了?”可是马上又转念一想“B站这么大上市公司不可能出现这种低级问题,肯定是我家广电宽带的问题”,然后默默打开了斗鱼。结果一夜醒来,B站就上了热搜第一,这应该算是一个环联网圈的大事件了吧,作为一个技术宅,对这事还是挺关心的,所以决定整理这一篇文章,汇总一下B站崩溃的原因、线索、来龙去脉、此次事故造成的影响。
一 (8363赞同 483评论)
一些情报:
1.b站,豆瓣,a站等都崩了
2.豆瓣,a站等很快恢复了,b站在编写回答的目前还没有恢复。
3.疑似云服务提供商因意外断电。
以下是猜测:
因为云服务提供商出现意外,a站和豆瓣很快接到报警,然后启动容灾方案,重新部署了环境。
至于Bilibili,从这篇文章
https://cloud.tencent.com/developer/article/1618923
可以得知b站的LB是自研的,还有容灾系统也是自研的,一种比较靠谱的可能流程是:
1. 云服务提供商提供的CDN出现意外之后,大量请求绕过CDN直接打到网关。
2. 网关收到大量请求,自动启动了容灾策略。
3. 容灾策略启动服务降级。服务降级了但没完全降。
4. CDN挂了,网关也跟着挂了,服务雪崩,一直崩到整个环境。
5. 整个环境炸了,重启全部容器需要相当长的时间。
至于一些其他有的没的,各种各样的情况可能性就太低了。鸡蛋不可能放在一个篮子里,bilibili这么大一公司也不可能把机器全放在一栋楼,然后楼里断电还没ups。
大家都是冷备热备冷热备,多机房异地容灾。这么久还没恢复我目前认为合理的情况只有这一个了。
作者:余歌
链接:https://www.zhihu.com/question/472065470/answer/1996564735
来源:知乎
二 (1146赞同 116评论)
目前可以确认的是:不只是国内版,国外版所有内容也都已经炸掉
理论上逼站应该不是有统一的固定服务器分发,肯定是有各种下端cdn的,在这种情况下,包括国外的所有cdn都炸掉了。
这……恕我直言。我觉得应该是逼站炸掉了。
还有一个问题啊,B站你们没有任何保障措施吗?
到现在连客服都无法联络了,你们确定你们这不是搞信任危机呢?
而且我现在要是叔叔的话,我现在就连夜买cloudflare,我都要赶紧把cdn再搞起来吧?自己家游戏聊天室都开始聊这种东西呢你们真的不觉得得赶快搞好吗?
算了,毁灭吧,赶快的!
评论区+自己的体验,再补充几件事情
1.国外服务器在22:15分左右,似乎部分恢复效果,可以打开主界面,但仍然无法进行操作。
而很快国外服务器也崩溃,目前已完全无法显示
2.在该时间内,通过B站登录游戏,仍然可以使用B站的游戏,游戏也仍然持续运营
3.目前官方无任何回复
4.上接3,现在已经有各种怀疑论了
5.必剪可以使用,也仍然可以上传视频(这不赶紧成为炸服完第一个发视频的人)
作者:旧时代的残党
链接:https://www.zhihu.com/question/472065470/answer/1996436909
来源:知乎
三 (1589赞同 148评论)
短短几分钟,整个论坛社交软件变成百家讲坛
-停电说
-火灾说
-删库跑路说
-刑事案件说
-服务器供应商说
-外星人说
-黑客攻击说
-大楼坍塌说
-陈睿遇刺说
-网警查封说
-decade破坏说
-墨茶显灵说
-黄旭东毒奶说
-境外势力说
-反二次元吧吧友说
-原神c++大佬爆破说
-腾讯恶意攻击说
-孙笑川恶意踹机房说
-李老八机房自焚说
-抽象山庄b站团建说
-嘉心糖咬断电缆说
-刀哥最新整活说
-V吧吧友不满国V说
-国V友不满狗罕见说
(期待最新版本)
作者:李森科博士
链接:https://www.zhihu.com/question/472065470/answer/1996569817
来源:知乎
评论