我有一个事件表,其中包含以下字段:
event_id event_type event_time
给定一个持续时间D和一个数字k,我需要在持续时间的任何相对时间窗口中,对所有event_type大于K事件的事件进行计数D。这基本上需要针对每个事件的滑动窗口。例如,我希望所有event_type在10分钟的持续时间内具有超过5个事件的活动。
D
k
event_type
K
我不确定如何在没有窗口功能的情况下解决此问题。
(我使用的是mysql 5.6。我在说的是一百万行以下的数据集。)
MySQL不支持窗口功能,但是您可以在SELECT列表中使用相关子查询来精确检索一列:
SELECT
SELECT event_id, event_type, event_time, (SELECT COUNT(*) FROM events EC WHERE EC.event_type = E.event_type AND EC.event_time > E.event_time) AS subsequent_event_count FROM events E WHERE ...
做EXPLAIN吧 就执行逻辑而言,这CROSS APPLY与SQL Server中的有点相似 。
EXPLAIN
CROSS APPLY
另一种方法是自我加入:
SELECT E.event_id, E.event_type, E.event_time, COUNT(EC.event_id) AS subsequent_event_count FROM events E LEFT JOIN events EC ON E.event_type = EC.event_type AND E.event_type < EC.event_type GROUP BY E.event_id, E.event_type, E.event_time
请测试两种方法的性能。
您可以进行更多的创意连接,例如
EC.event_time > E.event_time AND EC.event_time < E.event_time + INTERVAL 1 DAY