深圳幻海软件技术有限公司 欢迎您!

GitHub“灾难性”宕机24小时,程序员通宵修复......

2023-02-26

 北京时间10月22日早上6点52分,GitHub.com出现大面积网站宕机,GitHub官方为用户带来的不便表示诚挚的歉意,并表示将尽快修复。​​ 程序员们忙了一个通宵,历经24小时,10月23日7点,一切终于恢复正常。GitHub在24小时里都经历了些什么?先来看下GitHu

 北京时间 10 月 22 日早上 6 点 52 分,GitHub.com 出现大面积网站宕机,GitHub 官方为用户带来的不便表示诚挚的歉意,并表示将尽快修复。

 

程序员们忙了一个通宵,历经 24 小时,10 月 23 日 7 点,一切终于恢复正常。

GitHub 在 24 小时里都经历了些什么?

先来看下 GitHub“血红”的状态消息列表:

 

北京时间下午 2 点 51 分开始,状态消息不断在更新:再给我 2 小时!再给我 1.5 小时!再给我半小时!......

然而,“小时复小时,小时何其多”,承诺了太多,做到的太少,无奈,官方发布致歉函,表示真挚的歉意:

北京时间 10 月 22 日早上 6 点 52 分,GitHub.com 上多个服务由于受到网络分裂(network partition)和 subsequent 数据库故障的影响,导致我们网站显示的信息不一致。

我们非常谨慎地采取了措施确保数据的完整性,包括暂停 webhook 事件和其他内部处理系统。

我们知道我们的服务对您的开发工作流程是有多么重要,我们正在积极、努力地建立一个网站全面恢复的预估时间表。我们会尽快与您分享这条信息。

在此期间,GitHub.com 上的信息可能会显示为过期,但数据并没有丢失。一旦服务完全恢复,一切都会完好如初。

此外,此事件仅影响存储在 MySQL 数据库中的网站元数据,例如 issue 和 pull request。 Git 存储库数据并不受影响,并且在整个事件期间一直可用。

我们将继续通过状态页面提供更新和预估的解决时间。

从问题出现开始到解决的这 24 小时里,GitHub 团队显然处于崩溃状态。

GitHub 到底怎么了?

由官宣的致歉函以及状态消息列表可以看出,此次 GitHub 大面积的宕机主要是由于数据存储系统出现了问题。

给用户带来的困扰,简单来说就是:存储库,突然“消失”了!举个例子,你建了一个公共存储库,然后敲代码时,GitHub 会提示你存储库不存在;同时也无法打开其他存储库,也不能创建同名存储库。

然后网友们就炸锅了:

 

也有网友表示,“天呢!GitHub 还没修复好?!要破纪录了!”
​​

 

还有网友说这个月不太平,微博、YouTube、Twitter、GitHub 通通都挂了......


 

 

有网友称找到宕机的真正原因:

 

作为 GitHub 的新东家,微软也就毫无悬念的躺枪了......

 

我也想知道是微软的锅么?

 

GitHub 是正在迁移到 Azure 云么?

 

GitHub 的终结者......

 

也有网友建议把项目迁移到 GitLab 上面:

 

但 GitLab 就一定靠谱么?那倒也未必。

GitHub 也给出了本次网络宕机热力图,可以看到遭受此次影响较为严重的是日本、美国西海岸、马来西亚以及澳大利亚东南地区。

​​​​

 

不过,于北京时间 10 月 23 日早 7 点,GitHub 终于解决的此次“灾难性”问题,如下图:

 

想必 GitHub 的工作人员们应当是 24 小时没有合过眼了,辛苦了!致敬每一位奋斗在前线的程序员与工程师!