match_recognize-阿里云开发者社区

match_recognize

2017-11-08 1963

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

类似分析函数的功能，可以在行间进行匹配判断并进行计算。在 SQL 中新的模式匹配语句是“match_recognize”。

match_recognize
CREATE TABLE Ticker (SYMBOL VARCHAR2(10), tstamp DATE, price NUMBER);

INSERT INTO Ticker VALUES('ACME', DATE '2011-04-01', 12);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-02', 17);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-03', 19);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-04', 21);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-05', 25);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-06', 12);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-07', 15);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-08', 20);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-09', 24);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-10', 25);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-11', 19);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-12', 15);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-13', 25);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-14', 25);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-15', 14);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-16', 12);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-17', 14);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-18', 24);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-19', 23);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-20', 22);

SELECT *
FROM Ticker MATCH_RECOGNIZE (
PARTITION BY symbol
ORDER BY tstamp
MEASURES STRT.tstamp AS start_tstamp,
LAST(DOWN.tstamp) AS bottom_tstamp,
LAST(UP.tstamp) AS end_tstamp
ONE ROW PER MATCH
AFTER MATCH SKIP TO LAST UP
PATTERN (STRT DOWN+ UP+)
DEFINE
DOWN AS DOWN.price < PREV(DOWN.price),
UP AS UP.price > PREV(UP.price)
) MR
ORDER BY MR.symbol, MR.start_tstamp;

SYMBOL START_TST BOTTOM_TS END_TSTAM

ACME 05-APR-11 06-APR-11 10-APR-11
ACME 10-APR-11 12-APR-11 13-APR-11
ACME 14-APR-11 16-APR-11 18-APR-11

这个查询做了什么？下面解释了 MATCH_RECOGNIZE子句中的每一行：

．PARTITION BY 将Ticker表数据划分成逻辑分组，每组包含一种股票代号。

．ORDER BY 将每个逻辑分组内的数据按照tstamp排序。

．MEASURES 定义了三个度量：V形开始的时间戳(start_tstamp)，V形底部的时间戳(bottom_tstamp)，以及V形结束的时间戳(end_tstamp)。bottom_tstamp 和 end_tstamp 度量使用了LAST()函数来确保读取到的值是每个匹配模式中的最后一个时间戳的值。

．ONE ROW PER MATCH 的意思是对于每个找到的模式匹配，只会有一行输出。

．AFTER MATCH SKIP TO LAST UP 的意思是每当你找到一个匹配，你就在UP模式变量的最后一行重新开始你的搜索。一个模式变量是一个在MATCH_RECOGNIZE中使用的变量，在DEFINE子句定义。

．PATTERN (STRT DOWN+ UP+) 说的是你在搜索的模式有三个模式变量：STRT, DOWN, 以及 UP。DOWN 和 UP之后的加号(+)意思是它们中的每一个都至少有一行被映射。这个模式定义一个规则表达式，这是一种表现力很强的搜索方式。

．DEFINE 给了我们当一个行被映射到你的行模式变量STRT, DOWN, 和 UP时应该满足的条件。因为没有为STRT指定条件，任何一行都可以被映射为STRT。为什么一个模式变量会没有条件？你可以用它来作为测试匹配的起点。DOWN和UP都利用了PREV()函数，这使得它们能够把当前行的价格和前一行的价格进行比较。当价格比前一行更低时DOWN被匹配，所以它定义了V形的下行侧（左腿）。如果价格比前一行更高则被映射到UP。

下面两个图可以帮助你更好地理解例子20-1返回的结果。图20-2显示了映射到特定模式变量（在PATTERN子句中指定）的日期。在模式变量到日期的映射可见之后，MEASURES子句就用该信息来计算度量值。度量值的结果被显示在图20-3中。

本文转自whshurk 51CTO博客，原文链接：http://blog.51cto.com/shurk/2056949，如需转载请自行联系原作者

match_recognize

热门文章

最新文章

相关电子书

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

match_recognize

热门文章

最新文章

相关电子书