一、背景引入这篇文章,给大家聊一下写入Kafka的数据该如何保证其不丢失?看过之前的文章《字节面试官:让你设计一个MQ每秒要抗几十万并发,怎么做?》的同学,应该都知道写入Kafka的数据是会落地写入磁盘的。我们暂且不考虑写磁盘的具体过程,先大致看看下面的图,这代表了Kafka的核心架构原理。
一、背景引入这篇文章,给大家聊一下写入Kafka的数据该如何保证其不丢失?我们暂且不考虑写磁盘的具体过程,先大致看看下面的图,这代表了Kafka的核心架构原理。二、Kafka分布式存储架构那么现在问题来了,如果每天产生几十TB的数据,难道都写一台机器的磁盘上吗?这明显是不靠谱的啊!所以说,这里就得考
今天先来说说kafka吧,我看Hbase没什么人看,于是直接跳过,讲大家最喜欢的。一、Kafka架构图 在一套kafka架构中有多个Producer,多个Broker,多个Consumer,每个Producer可以对应多个Topic,每个Consumer只能对应一个
MQ(消息队列)是跨进程通信的方式之一,可理解为异步rpc,上游系统对调用结果的态度往往是重要不紧急。使用消息队列有以下好处:业务解耦、流量削峰、灵活扩展。接下来介绍消息中间件Kafka。Kafka是什么?Kafka是一个分布式的消息引擎。具有以下特征能够发布和订阅消息流(类似于消息队列
Kafka中的术语broker:中间的kafkacluster,存储消息,是由多个server组成的集群。topic:kafka给消息提供的分类方式。broker用来存储不同topic的消息数据。producer:往broker中某个topic里面生产数据。con
上周分享的一篇文章《Kafka如何实现每秒上百万的超高并发写入?》,相信大家都知道了写入Kafka的数据是会落地写入磁盘的,这篇给大家聊下写入Kafka的数据该如何保证其不丢失?我们暂且不考虑写磁盘的具体过程,先大致看看下面的图,这代表了Kafka的核心架构原理。 Kafka分