Kafka,Mq和Redis作为消息队列使用时的差异有哪些?

只是一只鱼


Kafka作为新一代的消息系统,mq是比较成熟消息系统,而redis也可以发布订阅,那么这三者有何异同?

RabbitMQ

是使用Erlang编写的一个开源的消息队列,本身支持很多的协议:AMQP,XMPP, SMTP, STOMP,也正是如此,使的它变的非常重量级,更适合于企业级的开发。同时实现了一个经纪人(Broker)构架,这意味着消息在发送给客户端时先在中排队。对路由(Routing),负载均衡(Load balance)或者数据持久化都有很好的支持。


Redis

是一个Key-Value的NoSQL数据库,开发维护很活跃,虽然它是一个Key-Value数据库存储系统,但它本身支持MQ功能,所以完全可以当做一个轻量级的队列服务来使用。对于RabbitMQ和Redis的入队和出队操作,各执行100万次,每10万次记录一次执行时间。测试数据分为128Bytes、512Bytes、1K和10K四个不同大小的数据。实验表明:入队时,当数据比较小时Redis的性能要高于RabbitMQ,而如果数据大小超过了10K,Redis则慢的无法忍受;出队时,无论数据大小,Redis都表现出非常好的性能,而RabbitMQ的出队性能则远低于Redis。


Kafka

Kafka是Apache下的一个子项目,是一个高性能跨语言分布式Publish/Subscribe消息队列系统,而Jafka是在Kafka之上孵化而来的,即Kafka的一个升级版。具有以下特性:快速持久化,可以在O(1)的系统开销下进行消息持久化;高吞吐,在一台普通的服务器上既可以达到10W/s的吞吐速率;完全的分布式系统,Broker、Producer、Consumer都原生自动支持分布式,自动实现复杂均衡;支持Hadoop数据并行加载,对于像Hadoop的一样的日志数据和离线分析系统,但又要求实时处理的限制,这是一个可行的解决方案。Kafka通过Hadoop的并行加载机制来统一了在线和离线的消息处理,这一点也是本课题所研究系统所看重的。Apache Kafka相对于ActiveMQ是一个非常轻量级的消息系统,除了性能非常好之外,还是一个工作良好的分布式系统。


对比MQ与Kafka

1)在架构模型方面

RabbitMQ遵循AMQP协议,RabbitMQ的broker由Exchange,Binding,queue组成,其中exchange和binding组成了消息的路由键;客户端Producer通过连接channel和server进行通信,Consumer从queue获取消息进行消费(长连接,queue有消息会推送到consumer端,consumer循环从输入流读取数据)。rabbitMQ以broker为中心;有消息的确认机制。

kafka遵从一般的MQ结构,producer,broker,consumer,以consumer为中心,消息的消费信息保存的客户端consumer上,consumer根据消费的点,从broker上批量pull数据;无消息确认机制。

2)在吞吐量

kafka具有高的吞吐量,内部采用消息的批量处理,zero-copy机制,数据的存储和获取是本地磁盘顺序批量操作,具有O(1)的复杂度,消息处理的效率很高。

rabbitMQ在吞吐量方面稍逊于kafka,他们的出发点不一样,rabbitMQ支持对消息的可靠的传递,支持事务,不支持批量的操作;基于存储的可靠性的要求存储可以采用内存或者硬盘。

3)在可用性方面,

rabbitMQ支持miror的queue,主queue失效,miror queue接管。


Java高并发框架


Redis

看到问题的第一个反应是,MQ和Redis有啥可比性,再看了看题目【作为消息队列使用时

】,仔细想了想Redis何尝不能作为消息队列使用呢,就算是用数据库实现也完全没有问题。

Redis其实可以当做一个轻量级的队列使用。Redis在数据量大的时候入队较慢,Redis出队则无论数据量大小性能都不错。

只不过消息队列中的很多功能都需要额外实现,平时我们还是把它用作内存数据库吧。


Kafka和MQ

题目提出Kafka和MQ进行对比,这点我觉得很奇怪,因为我认为Kafka是分布式消息中间件,有时候也会被称作是一款MQ产品。

所以在我眼里,MQ是一个总称,Kafka也算MQ的一种,你要是说Kafka和RabbitMQ、RocketMQ相比有什么异同,还能说得过去。

我的理解,如果理解有问题,请指正,当然我也知道Kafka是作为分布式日志系统发明出来的;并且MQ遵守了jms规范,kafka没有遵循jms规范。


和其他MQ相比,

Kafka的优势:

  • 可扩展:集群可以在线增加新的服务器

  • 高性能:性能很高,吞吐量大
  • 容错性:每个Partition数据会复制到几台服务器上面,一台挂了,可以用其他服务器上面的数据


缺点:

  • 重复消息:小概率

  • 消息乱序:partition之间的消息送达不保证有序


RabbitMQ

找一款MQ的产品RabbitMQ来进行一下对比,优点:

  • 数据一致性

  • 稳定

  • 可靠性很高

缺点:

  • 性能和吞吐量稍差


希望我的回答可以帮助到你!

会点代码的大叔


KAFKA

本人所在的公司使用kafa作为ETL数据通道,通过kafka配套的connect和schemaRegisty来方便快速实现异构数据源的相互转换和存储,通过connect插件生产和消费数据,通过schemaRegisty转换异构数据(可以在几乎所有你知道的数据源之间相互转换),并且数据可以重复被消费(可以通过配置指定数据存储时长)。kafka的开发团队围绕着kafka开发了一整套自成体系的生态圈(confluent platform)。

优点:

  1. 可扩展。Kafka集群可以透明的扩展,增加新的服务器进集群。
  2. 高性能。Kafka性能远超过传统的ActiveMQ、RabbitMQ等,Kafka支持Batch操作。
  3. 容错性。Kafka每个Partition数据会复制到几台服务器,当某个Broker失效时,Zookeeper将通知生产者和消费者从而使用其他的Broker。

缺点:

  1. 重复消息。Kafka保证每条消息至少送达一次,虽然几率很小,但一条消息可能被送达多次。
  2. 消息乱序。Kafka某一个固定的Partition内部的消息是保证有序的,如果一个Topic有多个Partition,partition之间的消息送达不保证有序。
  3. 复杂性。Kafka需要Zookeeper的支持,Topic一般需要人工创建,部署和维护比一般MQ成本更高。

MQ

消息队列中间件还有很多种,列举几个:

RocketMq,是阿里在充分reviewkafka代码后,开发的metaQ。在不断更新,修补以后,阿里把metaQ3.0更名为rocket,并且rocket是java写的易于维护。

RabbitMQ,支持对消息的可靠的传递,支持事务,不支持批量的操作;基于存储的可靠性的要求存储可以采用内存或者硬盘。

REDIS

Redis 的有序集合用来做队列还是不错的,用来实现做简单的任务队列,性能不错,也有持久化(rdb/aof) 但是发布、消费等的确认需要自己实现,所以redis得使用还是建议把它当内存数据库来吧。


分享到:


相關文章: