问题定义: 我有一个包含大量数据(超过100,000行)的数据库表,表结构像
AppID DocID DocStatus 1 100 0 1 101 1 2 200 0 2 300 1
每个applicationID可能有成千上万的文档,我必须获取按applicationID分组的状态为0的文档数和状态为1的文档数。
当我使用hibernate方式映射该对象时,由于大量的表数据,它将占用大量的堆内存。
如何使用Hibernate查询实现这一目标? 还是我应该为此使用SQL查询或存储过程?
注意: 我的Web应用程序在JAVA / Tapestry框架中并使用Hibernate3。数据库是SQL Server 2012。
每当遇到以数据为中心的问题(与以Java域模型为中心的问题相对)时,都应直接使用SQL。您的数据库将比Java代码快得多,因为可以对数据进行紧密的计算,而不必通过导线将其全部传输到内存中。另请参阅本博客文章“ 2.处理内存中的数据”。
您可以直接使用JDBC,本地查询或您选择的任何第三方SQL库(例如MyBatis或jOOQ)来实现。
您可以使用以下任一查询轻松解决您的问题:
SELECT [AppID], [DocStatus], count(*) FROM [MyTable] GROUP BY [AppID], [DocStatus]
SQLFiddle上的示例
SELECT [AppID], (SELECT count(*) FROM [MyTable] [t2] WHERE [t1].[AppID] = [t2].[AppID] AND [DocStatus] = 0) [Status_0], (SELECT count(*) FROM [MyTable] [t2] WHERE [t1].[AppID] = [t2].[AppID] AND [DocStatus] = 1) [Status_1] FROM [MyTable] [t1] GROUP BY [AppID]
SELECT [AppID], SUM(IIF([DocStatus] = 0, 1, 0)) [Status_0], SUM(IIF([DocStatus] = 1, 1, 0)) [Status_1] FROM [MyTable] [t1] GROUP BY [AppID]
SELECT [AppID], [0], [1] FROM ( SELECT [AppID], [DocStatus] FROM [MyTable] ) [t] PIVOT (count([DocStatus]) FOR [DocStatus] IN ([0], [1])) [pvt]