我希望能够从电子邮件表中选择一堆行并按发件人分组。我的查询如下所示:
SELECT `timestamp`, `fromEmail`, `subject` FROM `incomingEmails` GROUP BY LOWER(`fromEmail`) ORDER BY `timestamp` DESC
该查询几乎可以按我希望的方式工作-它选择按电子邮件分组的记录。问题在于主题和时间戳记与特定电子邮件地址的最新记录不符。
例如,它可能返回:
fromEmail: john@example.com, subject: hello fromEmail: mark@example.com, subject: welcome
当数据库中的记录是:
fromEmail: john@example.com, subject: hello fromEmail: john@example.com, subject: programming question fromEmail: mark@example.com, subject: welcome
如果“编程问题”主题是最新的,那么在对电子邮件进行分组时如何使MySQL选择该记录?
一个简单的解决方案是将查询包裹与ORDER语句子选择 第一 和应用GROUP BY 后 :
SELECT * FROM ( SELECT `timestamp`, `fromEmail`, `subject` FROM `incomingEmails` ORDER BY `timestamp` DESC ) AS tmp_table GROUP BY LOWER(`fromEmail`)
这类似于使用联接,但看起来要好得多。
在带有GROUP BY子句的SELECT中使用非聚合列是非标准的。MySQL通常会返回找到的第一行的值,并丢弃其余的行。任何ORDER BY子句仅适用于返回的列值,而不适用于丢弃的值。
重要更新 选择非聚合列可在实践中使用,但不应依赖于此。根据MySQL文档, “这主要在以下情况下有用:每个未聚合的列中未在GROUP BY中命名的所有值对于每个组都是相同的。服务器可以从每个组中 自由选择任何值 ,因此 除非它们相同,否则这些值选择的是不确定的 。”
从5.7.5版本开始,默认情况下仅启用ONLY_FULL_GROUP_BY,因此非聚合列会导致查询错误(ER_WRONG_FIELD_WITH_GROUP)
正如@mikep在下面指出的,解决方案是使用5.7及更高版本的ANY_VALUE()
参见 http://www.cafewebmaster.com/mysql-order-sort-group https://dev.mysql.com/doc/refman/5.6/en/group-by-handling.html https://dev.mysql .com / doc / refman / 5.7 / en / group-by-handling.html https://dev.mysql.com/doc/refman/5.7/en/miscellaneous- functions.html#function_any- value