小编典典

MySQL GROUP BY DateTime +/- 3秒

mysql

假设我有一个包含3列的表格:

  • id(PK,int)
  • 时间戳记(日期时间)
  • 标题(文字)

我有以下记录:

1, 2010-01-01 15:00:00, Some Title
2, 2010-01-01 15:00:02, Some Title
3, 2010-01-02 15:00:00, Some Title

我需要在彼此之间3秒钟之内进行GROUP BY记录。对于此表,第1行和第2行将组合在一起。

这里有一个类似的问题: Mysql
DateTime组15分钟

我也发现了这一点:http :
//www.artfulsoftware.com/infotree/queries.php#106

我不知道如何将这些方法转换为可以工作几秒钟的方法。SO问题上的方法的麻烦在于,在我看来,它仅适用于在已知点开始的时间范围内的记录。例如,如果我要FLOOR()以秒为单位工作,则以5秒为间隔,将15:00:04的时间与15:00:01分组,但不与15:00:06分组。

这有意义吗?请让我知道是否需要进一步说明。

编辑: 对于一组数字{1、2、3、4、5、6、7、50、51、60},看来最好将它们分组为{1、2、3、4、5,
6、7},{50、51},{60},以便每个分组行都取决于该行是否在上一行的3秒内。我知道这会改变一些情况,对此感到遗憾,我对此感到遗憾。

我正在尝试模糊匹配来自不同服务器的日志。服务器#1可能会记录一个项目“项目#1”,而服务器#2将在服务器#1的几秒钟内记录相同的项目“项目#1”。我需要在两条日志行上执行一些聚合函数。不幸的是,由于服务器软件的性质,我只有标题要继续。


阅读 366

收藏
2020-05-17

共1个答案

小编典典

我使用的是汤姆·H(Tom H.)的好主意,但在这里做的有点不同:

与其寻找一切在链的开始行的,我们可以发现所有的 时间 是链条的开端,然后回去ifnd符合时代的行。

此处的查询1可以通过找出3秒钟之内没有多少时间来告诉您哪个时间是链的起点。

SELECT DISTINCT Timestamp
FROM Table a
LEFT JOIN Table b
ON (b.Timestamp >= a.TimeStamp - INTERVAL 3 SECONDS
    AND b.Timestamp < a.Timestamp)
WHERE b.Timestamp IS NULL

然后,对于每一行,我们可以找到最大的链开始时间戳,该时间戳小于使用查询2的时间戳:

SELECT Table.id, MAX(StartOfChains.TimeStamp) AS ChainStartTime
FROM Table
JOIN ([query #1]) StartofChains
ON Table.Timestamp >= StartOfChains.TimeStamp
GROUP BY Table.id

一旦有了这些,我们就可以根据需要对它进行分组。

SELECT COUNT(*) --or whatever
FROM Table
JOIN ([query #2]) GroupingQuery
ON Table.id = GroupingQuery.id
GROUP BY GroupingQuery.ChainStartTime

我不确定这与Tom H的答案是否足够不同,可以单独发布,但是听起来您在实施方面遇到了麻烦,并且我正在考虑此事,因此我想再次发布。祝好运!

2020-05-17