深圳幻海软件技术有限公司 欢迎您!

  • 2021.7.13故障后,哔哩哔哩SRE稳定性保障揭秘

    B站SRE发展的5年B站2017年之前没有SRE,当时主要负责的事情就是效率优先,需求响应(比如变更、标准化、报警治理和琐事优化)。2018年引入SRE文化,开始理解业务架构、推进读的多活建设、探索SRE里的Oncall制度/复盘文化在B站的落地。2019年正式进入落地,首先做了琐事优化(释放人力)

  • 持续保障系统稳定性和高可用:腾讯游戏混沌工程实践

    最近一两年,我们可以发现混沌工程这个技术变得十分火热,大家都知道它变成了一个新的风口。常说做事情要顺势而为,我们希望能够抓住这个机会,所以我最近一年的工作主要是将混沌工程这一技术在腾讯游戏落地。一、什么是混沌工程1、混沌工程的定义混沌工程是为应对故障而生。大家知道我们运维人员都很辛苦,经常在周末或者

推荐阅读