12.30 大数据 Kafka 知识要点技术頭條網

12.30 大数据 Kafka 知识要点

2019-12-30 10:52:54 JackYang1993

信息时代

kafka消息服务器使用场景 90% 缓冲消息通讯组件

1、jd订单系统

2、解决数据的并发写

Topic ：消息分类，以日志分区存储，每一个分区都会有leader和Follower

Record：组成Topic的基本单元，一则消息 key value ts

broker：运行Kafka服务-broker 一台机器只运行一个Broker

Producer:生产消息

Consumer：消费消息

ConsumerGroup:把消费者归类，同一Group的消费者默认是对Topic分区消息实现负载均衡（Fair Shard）

不同Group之间相互不影响，消息是以广播的形式发布。

Kafka消息服务搭建：

1.解压到/usr目录

[root@CentOS ~]# tar zxf kafka_2.11-0.11.0.0.tgz -C /usr/

2.创建软连接（可选）

[root@CentOS ~]# ln -s /usr/kafka_2.11-0.11.0.0/ kafka

3.启动zookeeper （对broker监控，记录集群的元数据信息）

4.搭建kafka的伪分布式

1.创建三个kafka的配置文件

[root@CentOS config]# cp server.properties server-1.properties

[root@CentOS config]# cp server.properties server-2.properties

[root@CentOS config]# cp server.properties server-3.properties

修改配置文件:

server-1.peroperties

broker.id=0 -- 一个kafka实例唯一标示必须唯一

delete.topic.enable=true --允许用户删除topic

listeners=PLAINTEXT://CentOS:9092 --因为kafka服务是通过TCP/IP实现

log.dirs=/tmp/kafka-logs-1 --配置kafka消息存储路径

zookeeper.connect=CentOS:2181

server-2.peroperties

broker.id=1 -- 一个kafka实例唯一标示必须唯一

delete.topic.enable=true --允许用户删除topic

listeners=PLAINTEXT://CentOS:9093 --因为kafka服务是通过TCP/IP实现

log.dirs=/tmp/kafka-logs-2 --配置kafka消息存储路径

zookeeper.connect=CentOS:2181

server-3.peroperties

broker.id=3 -- 一个kafka实例唯一标示必须唯一

delete.topic.enable=true --允许用户删除topic

listeners=PLAINTEXT://CentOS:9094 --因为kafka服务是通过TCP/IP实现

log.dirs=/tmp/kafka-logs-3 --配置kafka消息存储路径

zookeeper.connect=CentOS:2181

启动Kafka

start.sh

echo 'start kafka cluster..'

for i in {1..3}

/usr/kafka_2.11-0.11.0.0/bin/kafka-server-start.sh /usr/kafka_2.11-0.11.0.0/config/server-$i.properties 1>/dev/null 2>&1 &

sleep 5

done

shutdown.sh

for i in `jps|grep Kafka | awk '{print $1}'`

echo 'kill kafka '$i

kill -9 $i

done

Topic管理

创建Topic

[root@CentOS kafka_2.11-0.11.0.0]# ./bin/kafka-topics.sh --zookeeper CentOS:2181 --create --topic topic01 --partitions 3 --replication-factor 2

查看所有Topic

[root@CentOS kafka_2.11-0.11.0.0]# ./bin/kafka-topics.sh --zookeeper CentOS:2181 --list

查看Tpoic详情

[root@CentOS kafka_2.11-0.11.0.0]# ./bin/kafka-topics.sh --zookeeper CentOS:2181 --describe --topic topic01

Topic:topic01PartitionCount:3ReplicationFactor:2Configs:

Topic: topic01Partition: 0Leader: 2Replicas: 2,0Isr: 2,0

Topic: topic01Partition: 1Leader: 0Replicas: 0,1Isr: 0,1

Topic: topic01Partition: 2Leader: 1Replicas: 1,2Isr: 1,2

修改分区

[root@CentOS kafka_2.11-0.11.0.0]# ./bin/kafka-topics.sh --zookeeper CentOS:2181 --alter --topic topic01 --partitions 4

删除

[root@CentOS kafka_2.11-0.11.0.0]# ./bin/kafka-topics.sh --zookeeper CentOS:2181 --delete --topic topic01

Topic topic01 is marked for deletion.

Note: This will have no impact if delete.topic.enable is not set to true.

订阅消息：

[root@CentOS kafka_2.11-0.11.0.0]# ./bin/kafka-console-consumer.sh --bootstrap-server CentOSA:9092,CentOSB:9092,CentOSC:9092 --topic topic01 --from-beginning

生产消息

[root@CentOS kafka_2.11-0.11.0.0]# ./bin/kafka-console-producer.sh --broker-list CentOSA:9092,CentOSB:9092,CentOSC:9092 --topic topic01

介绍：http://kafka.apache.org/documentation/

Java集成Kafka

<groupid>org.apache.kafka/<groupid>

<artifactid>kafka-clients/<artifactid>

1.消费方offset管理

①：手动一定offset

kafkaConsumer.seek(new TopicPartition("t_user_topic",part),offset);

②kafkaConsumer.commitAsync();

提交指定分区的offset

①props.put(ConsumerConfig.ENABLE_AUTO_COMMIT_CONFIG,false);

②将所有的消息的消费放置在try{}catch(Exception e)

try{

//消费消息

//提交offset+1

}catch(Exception e){

//seek到上一次消费的消息

}

提交到指定分区

Map<topicpartition> offsetMetaMap=new HashMap<topicpartition>() ;/<topicpartition>/<topicpartition>

OffsetAndMetadata offsetMeta=new OffsetAndMetadata(offset+1);//必须必当前offset大1

offsetMetaMap.put(new TopicPartition("topic01",分区号),offsetMeta);

kafkaConsumer.commitAsync(offsetMetaMap,null);

2、如何使用Kafka发送复杂消息

Deserializer、Serializer接口

3.如何实现Partition数据的负载均衡

①生产方：实现 Partitioner

②消费方：

1.subscribe fair shared 均分策略

2.assign 指定指定分区

分享到:

閱讀更多 JackYang1993 的文章

關鍵字: 服务器大数据 CentOS

12.30 大数据 Kafka 知识 要点

相關文章:

「大数据」（一百四十八）常用算法及数据结构之Stacks

「大数据」（一百三十六）常见算法及数据结构之Bitmap树

大数据：了解Hadoop生态中Hive和HBase兄弟俩的区别

「大数据」（一百二十七）Python基础之字符串：字符串方法

「大数据」（一百二十五）Python基础之元组：tuple函数

「大数据」（一百二十三）Python基础之列表：列表方法

「大数据」（一百二十一）Python基础之序列：成员资格

「大数据」（一百二十）Python基础之序列：乘法

「大数据」（一百一十九）Python基础之序列：序列相加

「大数据」（一百一十七）Python基础之字符串

「大数据」（一百一十六）Python基础之注释

大数据，Hadoop生态详解

「大数据」（一百一十五）Python基础之常用魔法函数

「大数据」（一百一十四）Python基础知识之函数

「大数据」（一百一十三）Python基础知识之获取用户输入

「大数据」（一百一十二）Python基础之数字和表达式

「大数据」（一百零一）常用分区工具

「大数据」（一百）磁盘分区类型及各自作用

「大数据」（九十七）Scala之文件操作

「大数据」（九十二）Scala之辅助构造器

「大数据」（八十八）Scala之数组

「大数据」（八十七）Scala之控制器和函数

「大数据」（八十六）Scala基础

「大数据」（八十五）Spark之MLlib体验

「大数据」（八十三）Spark之Streaming实时流

「大数据」（八十二）Spark之SparkSQL应用案例

「大数据」（八十一）Spark之SparkSQL运行架构

03.08 「大数据」（八十一）Spark之SparkSQL运行架构

「大数据」（八十）Spark之Shuffle机制

「大数据」（七十九）Spark之Lineage机制

「大数据」（七十八）Spark之通信模块

03.03 「大数据」（七十六）Spark之工作机制

02.27 大数据：了解Hive和HBase的区别

02.26 「大数据」（七十）Spark之生态系统

大数据 Hadoop（中） 笔记大全 收藏加关注

大数据 Linux笔记大全

大数据：Yarn应用程序提交流程

大数据、Hadoop核心框架和MapReduce原理

大数据：清洗流程以及入门实例

大数据：数据清洗的定义以及数据清洗的方法

大数据、云计算系统顶级架构师课程学习路线图

大数据:Hbase的知识大全都在这里

大数据：基于zookeeper协调的分布式日志系统Kafka的文件存储机制

大数据、机器学习和深度学习类命令行工具

大数据，Java丶Python丶Web前端等300G的学习资料无偿分享！

大数据——MapReduce

大数据-hadoop生态系统及版本演化

刚刚工作的毕业生，一个月只有2000多，是不是太少了？

为什么只有edg赚钱？

网上罗马仕充电宝20000毫安的，参数怎么很多样？哪个是真的？

我们买的新商品房还没有拿到房产证，怎么转卖最好？

为什么突厥人可以成功复国？是大唐的刀不锋利了么？

小高层16层高楼间距60米哪一层比较好？

金银花盆栽好养吗？怎么养？

长城对于抵御古代匈奴和蒙古人起到了多大作用？

什么树可以嫁接腊梅？

行情堪忧，还有多少教育机构的老师们五一假期有课上的？课时量多不多？

在农村“立夏节”都有哪些民间习俗？

男朋友失望分手，但对我还有感觉，答应我两个月之后可以在一起，我应该怎么做，才能改变之前他对我的看法？

工程分包乙方人员伤残谁承担？

有哪些看起来毫不相关的两个历史人物实际上有过联系？

13年雪铁龙世嘉自动挡7万多公里，没有水泡事故，多少钱能买？

22+吃土少女17年就有驾驶证了，今年才开始开车，想买个二手昂克赛拉，或者有什么好建议吗？

如何骑车去台湾骑行？

本人预算5万左右，想买一辆二手法系车！求推荐？

14年进口马自达5PK进口10年道奇酷威买哪个划算？

2020年，河南教育行业国务院特殊津贴推荐，河南大学并列第三，大家怎么看？

本田CRV2019款1.5T舒适版油耗高吗？

国外疫情如果没有得到有效控制，世界会发生什么事情？头脑风暴？

本田XRV这款车的整体表现怎么样？我想买1.5T自动豪华版，全款多少钱？

现在存款有14万，借了5万还没收回来，该做什么好？

2070super和5700xt买哪个比较好？

生完二胎后，感觉自己有点抑郁，总是想发火，特别烦躁，怎么办？

人这一生遇到的人和事为什么感觉都像是必然的经历？

现在校内校外到底教的是美式英语还是英式英语还是混搭英语？

上有老下有小，我们真的跳不出这个人生循环了吗？

如果外面正在下小雨，你会突然想起了谁？

初中同学许久未见大学期间突然联系请吃饭，态度还良好，我给推了，会不会让人很烦？

12.30 大数据 Kafka 知识要点

大数据 Hadoop（中）笔记大全收藏加关注

装修高手来帮忙看下144平，套内122平，怎么三房改四房？？