Kuiper提供了用于构建查询的各种元素。 总结如下。
元素 | 总结 |
---|---|
SELECT | SELECT用于从输入流中检索行,并允许从Kuiper中的一个或多个输入流中选择一个或多个列。 |
FROM | FROM指定输入流。 任何SELECT语句始终需要FROM子句。 |
JOIN | JOIN用于合并来自两个或更多输入流的记录。 JOIN包括LEFT,RIGHT,FULL和CROSS。 |
WHERE | WHERE指定查询返回的行的搜索条件。 |
GROUP BY | GROUP BY将一组选定的行分组为一组汇总行,这些汇总行按一个或多个列或表达式的值分组。 |
ORDER BY | 按一列或多列的值对行进行排序。 |
HAVING | HAVING为组或集合指定搜索条件。 HAVING只能与SELECT表达式一起使用。 |
从输入流中检索行,并允许从Kuiper中的一个或多个输入流中选择一个或多个列。
SELECT
*
| [source_stream.]column_name [AS column_alias]
| expression
指定应返回FROM子句中所有输入流的所有列。 列由输入源返回,如FROM子句中指定的那样,并按它们在传入流中存在的顺序或由ORDER BY子句指定的顺序返回。
*
从源流中选择所有字段。
source_stream
源流名称或别名。
column_name
要返回的列的名称。 如果要指定的列是嵌入式嵌套记录类型,则使用JSON 表达式引用嵌入式列。
column_alias
用替代名称替换查询结果集中的列名称。 别名还用于指定表达式结果的名称。column_alias不能在WHERE、GROUP BY或HAVING子句中使用。
表达式
表达式是一个常量、函数、或者由一个或多个运算符连接的列名、常量和函数的任意组合。
指定输入流。 任何SELECT语句始终需要FROM子句。
FROM source_stream | source_stream AS source_stream_alias
source_stream | source_stream_alias
输入流名称或别名。
JOIN用于合并来自两个或更多输入流的记录。 JOIN包括LEFT,RIGHT,FULL和CROSS。
LEFT | RIGHT | FULL | CROSS
JOIN
source_stream | source_stream AS source_stream_alias
ON <source_stream|source_stream_alias>.column_name =<source_stream|source_stream_alias>.column_name
LEFT
LEFT JOIN关键字从左流(stream1)返回所有记录,并从右流(stream2)返回匹配的记录。 如果不匹配,则结果从右侧为NULL。
SELECT column_name(s)
FROM stream1
LEFT JOIN stream2
ON stream1.column_name = stream2.column_name;
RIGHT
JOIN关键字从右侧流(stream2)返回所有记录,并从左侧流(stream1)返回匹配的记录。 如果没有匹配项,则结果从左侧为NULL。
SELECT column_name(s)
FROM stream1
RIGHT JOIN stream2
ON stream1.column_name = stream2.column_name;
FULL
当左(stream1)或右(stream2)表记录匹配时,FULL JOIN关键字返回所有记录。
注意: FULL JOIN可能返回较大的结果集!
SELECT column_name(s)
FROM stream1
FULL JOIN stream2
ON stream1.column_name = stream2.column_name
WHERE condition;
CROSS
CROSS JOIN用于将第一个流(stream1)的每一行与第二个流(stream2)的每一行组合。 这也称为笛卡尔联接,因为它从联接表返回行集的笛卡尔乘积。 假设在stream1中有m 行,在stream2中有 n 行,那么CROSS JOIN的结果将返回m * n 行。
注意: CROSS JOIN可能返回非常大的结果集!
SELECT column_name(s)
FROM stream1
CROSS OUTER JOIN stream2
ON stream1.column_name = stream2.column_name
WHERE condition;
source_stream | source_stream_alias
要连接的输入流名称或别名。
column_name
要返回的列的名称。 如果要指定的列是嵌入式嵌套记录类型,则使用JSON 表达式引用嵌入式列。
WHERE指定查询返回的行的搜索条件。 WHERE子句仅用于提取满足指定条件的那些记录。
WHERE <search_condition>
<search_condition> ::=
{ <predicate> | ( <search_condition> ) }
[ { AND | OR } { <predicate> | ( <search_condition> ) } ]
[ ,...n ]
<predicate> ::=
{ expression { = | < > | ! = | > | > = | < | < = } expression
表达式是一个常量、函数、及由一个或多个运算符连接的列名、常量和函数的任意组合。
< search_condition >
为SELECT语句或查询表达式的结果集中返回的行指定条件。搜索条件中可以包含的谓词数量没有限制。
AND
组合两个条件,当两个条件都为真时计算为真。
OR
组合两个条件,当任一条件为真时计算为真。
< predicate >
返回TRUE或FALSE的表达式。
表达式
是列名、常数、函数、变量、标量子查询,或由一个或多个运算符或子查询连接的列名、常数和函数的任意组合。表达式也可以包含CASE表达式。
=
用于测试两个表达式之间相等性的运算符。
<>
用于测试两个表达式不相等的条件的运算符。
!=
用于测试两个表达式不相等的条件的运算符。
>
用于测试一个表达式大于另一个表达式的条件的运算符。
>=
用于测试一个表达式大于或等于另一个表达式的条件的运算符。
<
用于测试一个表达式小于另一个表达式的条件的运算符。
<=
用于测试一个表达式小于或等于另一个表达式的条件的运算符。
SELECT column1, column2, ...
FROM table_name
WHERE condition;
GROUP BY将一组选定的行分组为一组汇总行,这些汇总行按一个或多个列或表达式的值分组。
GROUP BY <group by spec>
<group by spec> ::=
<group by item> [ ,...n ]
| <window_type>
<group by item> ::=
<column_expression>
指定任何支持Kuiper的窗口,有关详细信息,请参阅 windows 。
< column_expression >
执行分组操作的列的表达式或名称。列表达式不能包含在选择列表中定义的列别名。
SELECT column_name(s)
FROM stream1
GROUP BY column_name
指定组或集合的搜索条件。 HAVING只能与SELECT表达式一起使用。 HAVING通常在GROUP BY子句中使用。 如果不使用GROUP BY,则HAVING的行为类似于WHERE子句。
[ HAVING <search condition> ]
< search_condition >
指定要满足的组或集合的搜索条件。
SELECT temp AS t, name FROM topic/sensor1 WHERE name = "dname" GROUP BY name HAVING count(name) > 3
按一列或多列的值对行进行排序。
ORDER BY column1, column2, ... ASC|DESC
sql中的ORDER BY语句用于根据一个或多个列对获取的数据进行升序或降序排序。
ASC
按升序对数据进行排序。
DESC
按降对数据进行排序。
SELECT column1, column2, ...
FROM table_name
ORDER BY column1, column2, ... ASC|DESC;
如果你想在 SQL 或者流管理中使用保留关键字,或者特殊字符,请参考 Kuiper 词法元素.