Kafka + Flink + Redis 的电商大屏实时计算案

2020-02-21 10:41:58 一隻程序哼

做积极的人，而不是积极废人

前言
数据格式与接入
统计站点指标
商品Top N
The End

前言

阿里的双11销量大屏可以说是一道特殊的风景线。实时大屏（real-time dashboard）正在被越来越多的企业采用，用来及时呈现关键的数据指标。并且在实际操作中，肯定也不会仅仅计算一两个维度。由于Flink的“真·流式计算”这一特点，它比Spark Streaming要更适合大屏应用。本文从笔者的实际工作经验抽象出简单的模型，并简要叙述计算流程（当然大部分都是源码）。

数据格式与接入

简化的子订单消息体如下。

<code>{    "userId": 234567,    "orderId": 2902306918400,    "subOrderId": 2902306918401,    "siteId": 10219,    "siteName": "site_blabla",    "cityId": 101,    "cityName": "北京市",    "warehouseId": 636,    "merchandiseId": 187699,    "price": 299,    "quantity": 2,    "orderStatus": 1,    "isNewOrder": 0,    "timestamp": 1572963672217}/<code>

由于订单可能会包含多种商品，故会被拆分成子订单来表示，每条JSON消息表示一个子订单。现在要按照自然日来统计以下指标，并以1秒的刷新频率呈现在大屏上：

每个站点（站点ID即siteId）的总订单数、子订单数、销量与GMV；
当前销量排名前N的商品（商品ID即merchandiseId）与它们的销量。

由于大屏的最大诉求是实时性，等待迟到数据显然不太现实，因此我们采用处理时间作为时间特征，并以1分钟的频率做checkpointing。

<code>StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();env.setStreamTimeCharacteristic(TimeCharacteristic.ProcessingTime);env.enableCheckpointing(60 * 1000, CheckpointingMode.EXACTLY_ONCE);env.getCheckpointConfig().setCheckpointTimeout(30 * 1000);/<code>

然后订阅Kafka的订单消息作为数据源。

<code>    Properties consumerProps = ParameterUtil.getFromResourceFile("kafka.properties");    DataStream<string> sourceStream = env      .addSource(new FlinkKafkaConsumer011<>(        ORDER_EXT_TOPIC_NAME,                        // topic        new SimpleStringSchema(),                    // deserializer        consumerProps                                // consumer properties      ))      .setParallelism(PARTITION_COUNT)      .name("source_kafka_" + ORDER_EXT_TOPIC_NAME)      .uid("source_kafka_" + ORDER_EXT_TOPIC_NAME);/<string>/<code>

给带状态的算子设定算子ID（通过调用uid()方法）是个好习惯，能够保证Flink应用从保存点重启时能够正确恢复状态现场。为了尽量稳妥，Flink官方也建议为每个算子都显式地设定ID，参考：

https://ci.apache.org/projects/flink/flink-docs-stable/ops/state/savepoints.html#should-i-assign-ids-to-all-operators-in-my-job

接下来将JSON数据转化为POJO，JSON框架采用FastJSON。

<code>    DataStream<suborderdetail> orderStream = sourceStream      .map(message -> JSON.parseObject(message, SubOrderDetail.class))      .name("map_sub_order_detail").uid("map_sub_order_detail");/<suborderdetail>/<code>

JSON已经是预先处理好的标准化格式，所以POJO类SubOrderDetail的写法可以通过Lombok极大地简化。如果JSON的字段有不规范的，那么就需要手写Getter和Setter，并用@JSONField注解来指明。

<code>@Getter@Setter@NoArgsConstructor@AllArgsConstructor@ToStringpublic class SubOrderDetail implements Serializable {  private static final long serialVersionUID = 1L;  private long userId;  private long orderId;  private long subOrderId;  private long siteId;  private String siteName;  private long cityId;  private String cityName;  private long warehouseId;  private long merchandiseId;  private long price;  private long quantity;  private int orderStatus;  private int isNewOrder;  private long timestamp;}/<code>

统计站点指标

将子订单流按站点ID分组，开1天的滚动窗口，并同时设定ContinuousProcessingTimeTrigger触发器，以1秒周期触发计算。注意处理时间的时区问题，这是老生常谈了。

<code>    WindowedStream<suborderdetail> siteDayWindowStream = orderStream      .keyBy("siteId")      .window(TumblingProcessingTimeWindows.of(Time.days(1), Time.hours(-8)))      .trigger(ContinuousProcessingTimeTrigger.of(Time.seconds(1)));/<suborderdetail>/<code>

接下来写个聚合函数。

<code>    DataStream<orderaccumulator> siteAggStream = siteDayWindowStream      .aggregate(new OrderAndGmvAggregateFunc())      .name("aggregate_site_order_gmv").uid("aggregate_site_order_gmv");  public static final class OrderAndGmvAggregateFunc    implements AggregateFunction<suborderdetail> {    private static final long serialVersionUID = 1L;    @Override    public OrderAccumulator createAccumulator() {      return new OrderAccumulator();    }    @Override    public OrderAccumulator add(SubOrderDetail record, OrderAccumulator acc) {      if (acc.getSiteId() == 0) {        acc.setSiteId(record.getSiteId());        acc.setSiteName(record.getSiteName());      }      acc.addOrderId(record.getOrderId());      acc.addSubOrderSum(1);      acc.addQuantitySum(record.getQuantity());      acc.addGmv(record.getPrice() * record.getQuantity());      return acc;    }    @Override    public OrderAccumulator getResult(OrderAccumulator acc) {      return acc;    }    @Override    public OrderAccumulator merge(OrderAccumulator acc1, OrderAccumulator acc2) {      if (acc1.getSiteId() == 0) {        acc1.setSiteId(acc2.getSiteId());        acc1.setSiteName(acc2.getSiteName());      }      acc1.addOrderIds(acc2.getOrderIds());      acc1.addSubOrderSum(acc2.getSubOrderSum());      acc1.addQuantitySum(acc2.getQuantitySum());      acc1.addGmv(acc2.getGmv());      return acc1;    }  }/<suborderdetail>/<orderaccumulator>/<code>

累加器类OrderAccumulator的实现很简单，看源码就大概知道它的结构了，因此不再多废话。唯一需要注意的是订单ID可能重复，所以需要用名为orderIds的HashSet来保存它。HashSet应付我们目前的数据规模还是没太大问题的，如果是海量数据，就考虑换用HyperLogLog吧。

接下来就该输出到Redis供呈现端查询了。这里有个问题：一秒内有数据变化的站点并不多，而ContinuousProcessingTimeTrigger每次触发都会输出窗口里全部的聚合数据，这样做了很多无用功，并且还会增大Redis的压力。所以，我们在聚合结果后再接一个ProcessFunction，代码如下。

<code>    DataStream<tuple2>> siteResultStream = siteAggStream      .keyBy(0)      .process(new OutputOrderGmvProcessFunc(), TypeInformation.of(new TypeHint<tuple2>>() {}))      .name("process_site_gmv_changed").uid("process_site_gmv_changed");  public static final class OutputOrderGmvProcessFunc    extends KeyedProcessFunction<tuple>> {    private static final long serialVersionUID = 1L;    private MapState<long> state;    @Override    public void open(Configuration parameters) throws Exception {      super.open(parameters);      state = this.getRuntimeContext().getMapState(new MapStateDescriptor<>(        "state_site_order_gmv",        Long.class,        OrderAccumulator.class)      );    }    @Override    public void processElement(OrderAccumulator value, Context ctx, Collector<tuple2>> out) throws Exception {      long key = value.getSiteId();      OrderAccumulator cachedValue = state.get(key);      if (cachedValue == null || value.getSubOrderSum() != cachedValue.getSubOrderSum()) {        JSONObject result = new JSONObject();        result.put("site_id", value.getSiteId());        result.put("site_name", value.getSiteName());        result.put("quantity", value.getQuantitySum());        result.put("orderCount", value.getOrderIds().size());        result.put("subOrderCount", value.getSubOrderSum());        result.put("gmv", value.getGmv());        out.collect(new Tuple2<>(key, result.toJSONString());        state.put(key, value);      }    }    @Override    public void close() throws Exception {      state.clear();      super.close();    }  }/<tuple2>/<long>/<tuple>/<tuple2>/<tuple2>/<code>

说来也简单，就是用一个MapState状态缓存当前所有站点的聚合数据。由于数据源是以子订单为单位的，因此如果站点ID在MapState中没有缓存，或者缓存的子订单数与当前子订单数不一致，表示结果有更新，这样的数据才允许输出。

最后就可以安心地接上Redis Sink了，结果会被存进一个Hash结构里。

<code>    // 看官请自己构造合适的FlinkJedisPoolConfig    FlinkJedisPoolConfig jedisPoolConfig = ParameterUtil.getFlinkJedisPoolConfig(false, true);    siteResultStream      .addSink(new RedisSink<>(jedisPoolConfig, new GmvRedisMapper()))      .name("sink_redis_site_gmv").uid("sink_redis_site_gmv")      .setParallelism(1);  public static final class GmvRedisMapper implements RedisMapper<tuple2>> {    private static final long serialVersionUID = 1L;    private static final String HASH_NAME_PREFIX = "RT:DASHBOARD:GMV:";    @Override    public RedisCommandDescription getCommandDescription() {      return new RedisCommandDescription(RedisCommand.HSET, HASH_NAME_PREFIX);    }    @Override    public String getKeyFromData(Tuple2<long> data) {      return String.valueOf(data.f0);    }    @Override    public String getValueFromData(Tuple2<long> data) {      return data.f1;    }    @Override    public Optional<string> getAdditionalKey(Tuple2<long> data) {      return Optional.of(        HASH_NAME_PREFIX +        new LocalDateTime(System.currentTimeMillis()).toString(Consts.TIME_DAY_FORMAT) +        "SITES"      );    }  }/<long>/<string>/<long>/<long>/<tuple2>/<code>

商品Top N

我们可以直接复用前面产生的orderStream，玩法与上面的GMV统计大同小异。这里用1秒滚动窗口就可以了。

<code>    WindowedStream<suborderdetail> merchandiseWindowStream = orderStream      .keyBy("merchandiseId")      .window(TumblingProcessingTimeWindows.of(Time.seconds(1)));    DataStream<tuple2>> merchandiseRankStream = merchandiseWindowStream      .aggregate(new MerchandiseSalesAggregateFunc(), new MerchandiseSalesWindowFunc())      .name("aggregate_merch_sales").uid("aggregate_merch_sales")      .returns(TypeInformation.of(new TypeHint<tuple2>>() { }));/<tuple2>/<tuple2>/<suborderdetail>/<code>

聚合函数与窗口函数的实现更加简单了，最终返回的是商品ID与商品销量的二元组。

<code>  public static final class MerchandiseSalesAggregateFunc    implements AggregateFunction<suborderdetail> {    private static final long serialVersionUID = 1L;    @Override    public Long createAccumulator() {      return 0L;    }    @Override    public Long add(SubOrderDetail value, Long acc) {      return acc + value.getQuantity();    }    @Override    public Long getResult(Long acc) {      return acc;    }    @Override    public Long merge(Long acc1, Long acc2) {      return acc1 + acc2;    }  }  public static final class MerchandiseSalesWindowFunc    implements WindowFunction<long>, Tuple, TimeWindow> {    private static final long serialVersionUID = 1L;    @Override    public void apply(      Tuple key,      TimeWindow window,      Iterable<long> accs,      Collector<tuple2>> out) throws Exception {      long merchId = ((Tuple1<long>) key).f0;      long acc = accs.iterator().next();      out.collect(new Tuple2<>(merchId, acc));    }  }/<long>/<tuple2>/<long>/<long>/<suborderdetail>/<code>

既然数据最终都要落到Redis，那么我们完全没必要在Flink端做Top N的统计，直接利用Redis的有序集合（zset）就行了，商品ID作为field，销量作为分数值，简单方便。不过flink-redis-connector项目中默认没有提供ZINCRBY命令的实现（必须再吐槽一次），我们可以自己加，步骤参照之前写过的那篇加SETEX的命令的文章，不再赘述。RedisMapper的写法如下。

<code>  public static final class RankingRedisMapper implements RedisMapper<tuple2>> {    private static final long serialVersionUID = 1L;    private static final String ZSET_NAME_PREFIX = "RT:DASHBOARD:RANKING:";    @Override    public RedisCommandDescription getCommandDescription() {      return new RedisCommandDescription(RedisCommand.ZINCRBY, ZSET_NAME_PREFIX);    }    @Override    public String getKeyFromData(Tuple2<long> data) {      return String.valueOf(data.f0);    }    @Override    public String getValueFromData(Tuple2<long> data) {      return String.valueOf(data.f1);    }    @Override    public Optional<string> getAdditionalKey(Tuple2<long> data) {      return Optional.of(        ZSET_NAME_PREFIX +        new LocalDateTime(System.currentTimeMillis()).toString(Consts.TIME_DAY_FORMAT) + ":" +        "MERCHANDISE"      );    }  }/<long>/<string>/<long>/<long>/<tuple2>/<code>

后端取数时，用ZREVRANGE命令即可取出指定排名的数据了。只要数据规模不是大到难以接受，并且有现成的Redis，这个方案完全可以作为各类Top N需求的通用实现。

The End

大屏的实际呈现需要保密，截图自然是没有的。以下是提交执行时Flink Web UI给出的执行计划（实际有更多的统计任务，不止3个Sink）。通过复用源数据，可以在同一个Flink job内实现更多统计需求。

分享到:

閱讀更多 一隻程序哼 的文章

關鍵字: 电子商务实时 JSON

Redis 创始人宣布 Redis 6.0.0 稳定版正式 GA

【开源推荐】Redis 桌面管理工具RedisDesktopManager2020.0 发布

高频Redis面试题解析：Redis 事务是否具备原子性？

Redis 的多线程版本比 Redis 本身要快 5 倍

Redis zset内部实现

Redis 压力测试

Redis 高可用

Redis 缓存

Redis Set和ZSet常用命令

Redis 的数据淘汰策略

Redis 的持久化底层如何实现的和优点缺点

Redis Hash和List常用命令

惊呆了，竟然可以用这种方式秒建 Redis 集群？

redis 安装及队列应用测试

关于缓存穿透、缓存击穿、缓存雪崩的模拟与解决(Redis)

Redis 官网昨日宕机，错误提示为无法连接 Redis

Redis 位图基础到统计活跃用户

redis 常用7种数据类型的使用场景解析

Redis Cluster 3.0集群部署与使用

Redis 讲解系列之与Spring集成

Redis 如何处理已过期的元素？

01.21 「Redis 干货」如何将 Redis 的内存优化？

「Redis」Redis 基础

12.24 面试必问：Redis 是如何进行主从复制的？

Redis 复制搭建

Redis 的 Sentinel

12.03 redis 安装启动

12.02 Redis-AOF持久化

Redis 面试热点：什么是 Redis 的雪崩、穿透和击穿？（附笔记）

Redis 持久化

Redis 消息队列的实现和区别

Redis 一站式管理平台

redis 延时队列

基于 Electron 的 Redis 图形化客户端 k-Redis 数

基于 Electron 的 Redis 图形化客户端 k-Redis

Redis 分布式锁的正确实现方式（Java版）

redis 常见数据结构实现

redis 中如何切换db

Redis 集群分布式锁与 API 网关分布式限流

Redis 内存淘汰机制详解

Redis 5 有序集合新增命令

Redis 杀死许可证：RediSearch、Redis Graph 等五个项目闭源

Redis Sentinel机制与用法说明

Redis 基本数据类型

05.08 高级的 Redis Java客户端-Lettuce

12.19 Redis 队列

Redis 队列

第二章 IoC容器和Bean配置

bean是一个对象，它是由Spring

运算里不得不说的python模块—math

Help

Devops度量--DevOps 现状快速检查表

今天主要分享一个DevOps

SOP是什么（解读）

SOP不是单个的，是一个体系，虽然我们可以单独地定义每一个SOP，但真正从企业管理来看，SOP不可能只是单个的，必然是一个整体和体系，也是企业不可或缺的。

还不知道交换机上如何配置DHCP，赶紧过来围观吧，一分钟包你学会

随着终端设备的越来越多，人工干预配置IP地址，不仅工作效率低，而且，还很容易导致IP冲突，影响正常的网络访问。到此已经完成了，DHCP服务的配置了，我们可以在终端验证。

还在手动配置IP地址吗？太Low了，一分钟教会您如何配置DHCP

Python爬虫自学笔记：分析头条文章网页源文件

这两天分析了一下头条文章网页的源文件，现在将分析的结果分享给大家。首先以一篇文章为例，其网址如下：https://www.toutiao.com/i6822245428176617998/如上图网页所示，文章中包含文字和图片。

DNS侦查工具

我们只需要打开浏览器输入例如:www.baidu.com就可以解析到该网站.为了便于记住不需要输入长长的IP地址去访问这就是DNS域名解析.关于域名域名的层次划分用点来分割这时DNS把相对应的域名解析成IP地址高的在右边.例如:www. NS简介访问某网站的时候最低在左边

国人开源的异步 Python ORM：GINO

程序测评：Create React App 3.3中有哪些酷炫新功能？

Create

“明学”的魅力？我只要我觉得：驾驭终端，提高生产力

最后一个要介绍的命令是

（必收藏系列）Linux面试题——命令集

关注，后台私信【Linux】分享Linux入门到进阶电子书、Linux入门到精通视频教程（免费）。文件管理命令cat

五分钟学会如何在 IPFS 上部署网站

原文标题:五分钟学会如何在

「正点原子NANO STM32F103开发板资料连载」第29章内存管理实验

1）实验平台：【正点原子】

小白怎么学Web前端开发如何成为技术达人

Web前端开发工程师已经成为了很多年轻人心中的理想工作，不仅入行门槛低、而且薪资待遇和发展前景都不错，自然吸引了大批人加入行业。

如何开发一个web静态服务器

我们都知道如今的web服务器有很多，比如著名的有apache，有nginx，有tomcat，有resin服务器，有sphere，有iis服务器等等，这些服务器都能提供web服务，并且几乎都能和多种语言进行搭配使用，那么一个web服务器都需要那些功能，开发一个web服务器都需要那些

学Java编程还有前景吗如何才能拿到高薪

需求大、薪资高似乎是Java开发人员的标签，不过学Java编程还有前景吗？它架构在操作系统之上，屏蔽了底层的差异，真正实现了“Writeonce run

Python网络爬虫之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例实现前后分离权限注解+JWT登录认证

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的运行效率太低？几行代码快速提升！

return的就是是你所需要的结果2.3、运行这一步就是最后一步了，只要像下面一样输入上述函数名，赋予参数值，点击运行Run，就能得到你想要的结果arg1=5

python的优点是什么？最新Python400集视频（附教程）

2020，最新Python零基础到精通资料教材，干货分享，新基础Python教材，稳稳找到过万工作，看这里，这里有你想要的所有资源哦，最强笔记，教你怎么入门提升！获取方式：私信小编“

MySQL中OOM故障应如何下手-爱可生

作者：孙祚龙爱可生南区分公司交付服务部成员，实习工程师。负责公司产品问题排查及日常运维工作。本文来源：原创投稿*爱可生开源社区出品，原创内容未经授权不得随意使用，转载请联系小编并注明来源。

像专家一样使用 panic

|go

30种不同的编程语言怎么写“Hello, World”

printfn

percona QAN 介绍

一、背景QAN慢查询日志分析工具是PMM

面试官：你可以用纯CSS判断鼠标进入的方向吗？

虽然没什么软用，但是对付面试官应该是够用了。感谢面试官提出的问题，让我实现了这个功能，对CSS

网络工程师职业生涯中，哪两点是最重要的？

网络工程师最重要的技能是扎实的基础和非常开放的思维，微观知识扎实、宏观能力突出。项目经验也会让网络工程师基础更牢靠，网络工程师是要实战的，要避免纸上谈兵，我认为对基础理论的理解，比你清楚配置更重要。

交换机中相关术语代表什么意思，有必要弄清楚

由浅入深了解以太坊 2.0：最常见问题和最全学习清单

有关以太坊2.0

【Linux简单实用小命令001】CentOS 7、8的防火墙端口开放

yuminstall

吃透这些IPFS硬核知识点，日后抢头矿随时“弯道超车”

今天的你捉住IPFS机遇了吗？我们都知道在Filecoin网络中作为一名存储矿工，信誉对于我们是非常重要的——信誉越高，爆块几率越大。那么信誉系统现在怎么样了呢？

Hive分桶表

fieldsterminated

Spring中资源的加载原来是这么一回事啊！

自己动手搭建邮件系统：怎样让Exchange Server 发出第一封邮件？

编辑Exchange

$【MySQL】RDS物理备份文件(.idb\.frm)恢复到MySQL自建数据库$

【MySQL】RDS物理备份文件(.idb\.frm)恢复到MySQL自建数据库

在阿里云控制台，我们能下载的文件是一个压缩包，解压之后，是.idb和.frm文件，你可能要问了，我可以直接把解压好的问题件覆盖到MySQL的data目录下吗？

NLP算法入门系列：隐含马尔可夫链(HMM)模型的简单介绍

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度学习这样实现人脸的年龄检测

前期的文章我们分享了人脸的识别以及如何进行人脸数据的训练，本期文章我们结合人脸识别的模型进行人脸年龄的检测人脸年龄的检测步骤1、首先需要进行人脸的检测2、把检测到的人脸数据给年龄检测模型去检测3、把检测结果呈现到图片上人脸年龄检测import

嵌入式linux网络编程之——5年程序员给你深度讲解socket套接字

图8-1

深入了解ProcessFunction的状态操作(Flink-1.10)

先反思为何会有上述疑惑上述疑惑产生的原因，应该是受到平时使用HashMap的影响，HashMap获取值就是在调用get方法时指定key，设置值也是在put时指定key，所以看到state.value，看懂了这些，其实也是在了解DataStream/DataSetAPI的设计思路：

Redis内存分析工具--rdr安装与使用

分析Redis

资深架构师教你源码讲解zookeeper实现分布式锁以及集群搭建步骤

//getData发现前一个子节点被删除，抛出异常

一行代码提升迁移性能

论文原址：https://arxiv.org/pdf/2003.12237.pdf开源地址：https://github.com/cuishuhao/BNM在发表在CVPR2020

利用相似几何信息，做可泛化3D形状分割模型

更具体的有以下三种典型的分割方案：FullyConvolutional-Like

这么好用的开源计算器SpeedCrunch，没有不尝试一下的道理

介绍SpeedCrunch是一款高精度科学计算器，具有快速，键盘驱动的用户界面。获取方式在GitHub上搜索SpeedCrunch，就可以去到

分布式缓存，真香

他是前易宝支付架构师、阿里云MVP、腾讯云

特征工程的力量

在本文中，我希望教给您一些有关特征工程的知识，以及如何使用它来对非线性决策边界进行建模。为了说明这一点，假设恢复时间与身高和体重具有以下关系：Y=β₀+β₁+β2+β₃+noise从第三项来看，我们可以看到Y与身高和体重没有线性关系。

java架构：天天写面向接口编程，你考虑过性能吗？大神都是这么写

public

SpringBoot如何优雅的使用RocketMQ

源码编译需要Maven3.2x，JDK8在根目录进行打包:Copymvn-Prelease-all

css代码规范工具stylelint

"mixin"