深圳幻海软件技术有限公司 欢迎您!

  • 混沌演练实践(一)

    作者:京东科技孙民英一、混沌工程介绍1.什么是混沌工程混沌工程是通过主动制造故障场景并根据系统在各种压力下的行为表现确定优化策略的一种系统稳定性保障手段,简单说就是通过主动注入故障的方式、提前发现问题,然后解决问题规避风险。2.为什么要进行混沌演练随着互联网业务发展,微服务架构、分布式架构和虚拟化容

  • 突破传统可靠性测试:混沌工程优秀实践

    在数字经济快速稳定发展背景下,云计算已经成为企业数字化转型的基石。应用层追求更全面、更便利、更快捷的服务,逆向推动技术层面系统越来越庞大,持续维护系统的难度与日俱增,故障的发生不可避免,如何保障业务持续的高可用性和稳定性成为了大家面临的挑战!在稳定性保障能力建设方面,互联网公司的思考及实践已较为深入

  • 在 Kubernetes 中使用混沌工程

    在这篇文章中学习混沌工程的基础知识。混沌工程是由科学、规划以及实验组成的。它是一门在系统上进行实验的学科,用来建立系统在生产中承受混乱条件能力的信心。首先,我会在文章导论部分解释混沌系统如何工作。如何开始学习混沌系统呢?以我的经验,开始学习混沌系统的最好方式是触发一个此前生产中出现的事故来进行实验。

  • 持续保障系统稳定性和高可用:腾讯游戏混沌工程实践

    最近一两年,我们可以发现混沌工程这个技术变得十分火热,大家都知道它变成了一个新的风口。常说做事情要顺势而为,我们希望能够抓住这个机会,所以我最近一年的工作主要是将混沌工程这一技术在腾讯游戏落地。一、什么是混沌工程1、混沌工程的定义混沌工程是为应对故障而生。大家知道我们运维人员都很辛苦,经常在周末或者

  • 软件架构治理与混沌工程

    在文章《 ​​软件架构治理之架构混沌之谜 ​​》中我把软件架构比作一个房子,需求总是无法预测的,特别是在当前信息量巨大,网络非常发达的时代。只要对这个房子的使用场景做个简单的重新定义或补充定义,它就有了非常多的可能性,比如每个房间都需要接入网络,比如有一个房间要做成暗房用来冲洗照

  • 迄今见过最易懂的混沌工程落地实践,针不戳!

    一、背景从2010年Netflix上线ChaosMokey的第一个版本到现在,虽然混沌工程发展已历时十年,但其实只在少数大厂里面有较成熟的落地,对绝大部分研发同学来说,混沌工程还是一个比较陌生的领域。分布式和微服务化已经成为主流的系统架构设计方案,大规模分布式系统的可用性保障能力越来越成为关注的重点

  • 鲜为人知的混沌工程,到底哪里好?

     一、为什么需要混沌工程?(翻译自ChaosEngineering电子书)1.1混沌工程与故障测试的区别混沌工程是在分布式系统上进行实验的学科,目的是建立对系统抵御生产环境中失控条件的能力以及信心,最早由Netflix及相关团队提出。故障演练是阿里巴巴在混沌工程领域的产品,目标是沉淀通用的

推荐阅读