类似分析函数的功能,可以在行间进行匹配判断并进行计算。在 SQL 中新的模式匹配语句是“match_recognize”。
CREATE TABLE Ticker (SYMBOL VARCHAR2(10), tstamp DATE, price NUMBER);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-01', 12);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-02', 17);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-03', 19);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-04', 21);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-05', 25);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-06', 12);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-07', 15);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-08', 20);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-09', 24);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-10', 25);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-11', 19);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-12', 15);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-13', 25);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-14', 25);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-15', 14);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-16', 12);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-17', 14);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-18', 24);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-19', 23);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-20', 22);
SELECT *
FROM Ticker MATCH_RECOGNIZE (
PARTITION BY symbol
ORDER BY tstamp
MEASURES STRT.tstamp AS start_tstamp,
LAST(DOWN.tstamp) AS bottom_tstamp,
LAST(UP.tstamp) AS end_tstamp
ONE ROW PER MATCH
AFTER MATCH SKIP TO LAST UP
PATTERN (STRT DOWN+ UP+)
DEFINE
DOWN AS DOWN.price < PREV(DOWN.price),
UP AS UP.price > PREV(UP.price)
) MR
ORDER BY MR.symbol, MR.start_tstamp;
SYMBOL START_TST BOTTOM_TS END_TSTAM
ACME 05-APR-11 06-APR-11 10-APR-11
ACME 10-APR-11 12-APR-11 13-APR-11
ACME 14-APR-11 16-APR-11 18-APR-11
这个查询做了什么?下面解释了 MATCH_RECOGNIZE子句中的每一行:
.PARTITION BY 将Ticker表数据划分成逻辑分组,每组包含一种股票代号。
.ORDER BY 将每个逻辑分组内的数据按照tstamp排序。
.MEASURES 定义了三个度量:V形开始的时间戳(start_tstamp),V形底部的时间戳(bottom_tstamp),以及V形结束的时间戳(end_tstamp)。bottom_tstamp 和 end_tstamp 度量使用了LAST()函数来确保读取到的值是每个匹配模式中的最后一个时间戳的值。
.ONE ROW PER MATCH 的意思是对于每个找到的模式匹配,只会有一行输出。
.AFTER MATCH SKIP TO LAST UP 的意思是每当你找到一个匹配,你就在UP模式变量的最后一行重新开始你的搜索。一个模式变量是一个在MATCH_RECOGNIZE中使用的变量,在DEFINE子句定义。
.PATTERN (STRT DOWN+ UP+) 说的是你在搜索的模式有三个模式变量:STRT, DOWN, 以及 UP。DOWN 和 UP之后的加号(+)意思是它们中的每一个都至少有一行被映射。这个模式定义一个规则表达式,这是一种表现力很强的搜索方式。
.DEFINE 给了我们当一个行被映射到你的行模式变量STRT, DOWN, 和 UP时应该满足的条件。因为没有为STRT指定条件,任何一行都可以被映射为STRT。为什么一个模式变量会没有条件?你可以用它来作为测试匹配的起点。DOWN和UP都利用了PREV()函数,这使得它们能够把当前行的价格和前一行的价格进行比较。当价格比前一行更低时DOWN被匹配,所以它定义了V形的下行侧(左腿)。如果价格比前一行更高则被映射到UP。
下面两个图可以帮助你更好地理解例子20-1返回的结果。图20-2显示了映射到特定模式变量(在PATTERN子句中指定)的日期。在模式变量到日期的映射可见之后,MEASURES子句就用该信息来计算度量值。度量值的结果被显示在图20-3中。
本文转自whshurk 51CTO博客,原文链接:http://blog.51cto.com/shurk/2056949,如需转载请自行联系原作者