# EMQ X Kuiper - 超轻量物联网边缘数据分析软件
## 概览
EMQ X Kuiper 是 Golang 实现的轻量级物联网边缘分析、流式处理开源软件,可以运行在各类资源受限的边缘设备上。Kuiper 设计的一个主要目标就是将在云端运行的实时流式计算框架(比如 [Apache Spark](https://spark.apache.org),[Apache Storm](https://storm.apache.org) 和 [Apache Flink](https://flink.apache.org) 等)迁移到边缘端。Kuiper 参考了上述云端流式处理项目的架构与实现,结合边缘流式数据处理的特点,采用了编写基于``源 (Source)``,``SQL (业务逻辑处理)``, ``目标 (Sink)`` 的规则引擎来实现边缘端的流式数据处理。

**应用场景**
Kuiper 可以运行在各类物联网的边缘使用场景中,比如工业物联网中对生产线数据进行实时处理;车联网中的车机对来自汽车总线数据的即时分析;智能城市场景中,对来自于各类城市设施数据的实时分析。通过 Kuiper 在边缘端的处理,可以提升系统响应速度,节省网络带宽费用和存储成本,以及提高系统安全性等。
## 功能
- 超轻量
- 核心服务安装包约 4.5MB,初始运行时占用内存约 10MB
- 跨平台
- 流行 CPU 架构:X86 AMD * 32, X86 AMD * 64; ARM * 32, ARM * 64位; PPC
- 常见 Linux 发行版、OpenWrt 嵌入式系统、MacOS、Docker
- 工控机、树莓派、工业网关、家庭网关、MEC 边缘云等
- 完整的数据分析
- 通过 SQL 支持数据抽取、转换和过滤
- 数据排序、分组、聚合、连接
- 60+ 各类函数,覆盖数学运算、字符串处理、聚合运算和哈希运算等
- 4 类时间窗口,以及计数窗口
- 高可扩展性
提供插件扩展机制,可以支持在``源 (Source)``,``SQL 函数 ``, ``目标 (Sink)`` 三个方面的扩展
- 源 (Source) :内置支持 MQTT 数据的接入,提供了扩展点支持任意的类型的接入
- 目标(Sink):内置支持 MQTT、HTTP,提供扩展点支持任意数据目标的支持
- SQL 函数:内置支持60+常见的函数,提供扩展点可以扩展自定义函数
- 管理能力
- [基于 Web 的管理控制台](https://hub.docker.com/r/emqx/kuiper-manager),用于节点,插件,流和规则的管理
- 通过命令行和 REST API 对流、规则和插件进行管理
- 与 [KubeEdge](https://github.com/kubeedge/kubeedge)、[K3s](https://github.com/rancher/k3s)、[Baetyl](https://github.com/baetyl/baetyl) 等基于边缘 Kubernetes 框架的集成能力
- 与 EMQ X Edge 集成
提供了与 EMQ X Neuron 和 EMQ X Edge 的无缝集成,实现在边缘端从消息接入到数据分析端到端的场景实现能力
## 快速入门
- [Kuiper 5分钟快速入门](./quick_start_docker.md)
- [EdgeX 规则引擎教程](./edgex/edgex_rule_engine_tutorial.md)
## Slack
加入我们的 [Slack](https://join.slack.com/t/emqx/shared_invite/zt-7xrracuf-GGdbNB1pARtaZKvv6IfTvw),然后加入 [kuiper](https://emqx.slack.com/archives/C0138SZP23Y) 频道。
## 性能测试结果
### MQTT 吞吐量测试支持
- 使用 JMeter MQTT 插件来发送数据到 EMQ X 服务器,消息类似于 ``{"temperature": 10, "humidity" : 90}``, 温度与湿度的值是介于 0 ~ 100 之间的随机整数值
- Kuiper 从 EMQ X 服务器订阅消息,并且通过 SQL 分析数据: ``SELECT * FROM demo WHERE temperature > 50 ``
- 分析结果通过 [文件插件](./plugins/sinks/file.md) 写到本地的文件系统里
| 设备 | 每秒发送消息数 | CPU 使用 | 内存 |
| ---------------------------------------------------- | -------------- | --------------- | ---- |
| 树莓派 3B+ | 12k | sys + user: 70% | 20M |
| AWS t2.micro (x86: 1 Core * 1 GB)
Ubuntu 18.04 | 10k | sys + user: 25% | 20M |
### EdgeX 吞吐量测试
- 一个 [Go 应用](fvt_scripts/edgex/benchmark/pub.go) 用于向 ZeroMQ 消息总线发送数据,数据如下。
```
{
"Device": "demo", "Created": 000, …
"readings":
[
{"Name": "Temperature", value: "30", "Created":123 …},
{"Name": "Humidity", value: "20", "Created":456 …}
]
}
```
- Kuiper 从 EdgeX ZeroMQ 消息总线订阅数据,并且使用 ``SELECT * FROM demo WHERE temperature > 50 `` 来分析数据,其中 90% 数据被规则所过滤。
- 分析结果将被发送到 [nop sink](./rules/sinks/nop.md),所有的数据都被忽略。
| | 每秒发送消息数 | CPU 使用 | 内存 |
| ---------------------------------------------- | -------------- | ------------- | ---- |
| AWS t2.micro( 1 Core * 1 GB)
Ubuntu18.04 | 11.4 k | sys+user: 75% | 32M |
### 最大规则数支持
- 8000 条规则,吞吐量为 800 条消息/秒
- 配置
- AWS 2 核 * 4GB 内存
- Ubuntu
- 资源消耗
- 内存: 89% ~ 72%
- CPU: 25%
- 400KB - 500KB / 规则
- 规则
- 源: MQTT
- SQL: SELECT temperature FROM source WHERE temperature > 20 (90% 数据被过滤)
- 目标: 日志
## 文档
- [开始使用](./getting_started.md)
- [参考指南](./reference.md)
- [安装与操作](./operation/overview.md)
- [命令行界面工具-CLI](./cli/overview.md)
- [Kuiper SQL参考](./sqls/overview.md)
- [规则](./rules/overview.md)
- [扩展Kuiper](./extension/overview.md)
- [插件](./plugins/overview.md)
## 从源码编译
### 准备
+ Go version >= 1.13
### 编译
+ 编译二进制:
- 编译二进制文件: `$ make`
- 编译支持 EdgeX 的二进制文件: `$ make build_with_edgex`
+ 安装文件打包:
- 安装文件打包:: `$ make pkg`
- 支持 EdgeX 的安装文件打包: `$ make pkg_with_edgex`
+ Docker 镜像:`$ make docker`
> Docker 镜像默认支持 EdgeX
如果您要实现交叉编译,请参考[此文档](./cross-compile.md)。
## 开源版权
[Apache 2.0](LICENSE)