小编典典

在 sql 中执行计算与在您的应用程序中执行计算的优缺点是什么

all

shopkeeper表有以下字段:

id (bigint),amount (numeric(19,2)),createddate (timestamp)

比方说,我有上表。我想获取昨天的记录并通过将金额打印为美分来生成报告。

一种方法是在我的 java 应用程序中执行计算并执行一个简单的查询

Date previousDate ;// $1 calculate in application

Date todayDate;// $2 calculate in application

select amount where createddate between $1 and $2

然后遍历记录并将金额转换为我的java应用程序中的美分并生成报告

另一种方式就像在 sql 查询本身中执行计算:

select cast(amount * 100 as int) as "Cents"
from shopkeeper  where createddate  between date_trunc('day', now()) - interval '1 day'  and  date_trunc('day', now())

然后遍历记录并生成报告

在一种方式中,我的所有处理都在 java 应用程序中完成,并触发了一个简单的查询。在其他情况下,所有转换和计算都在 Sql 查询中完成。

上面的用例只是一个例子,在实际场景中,一个表可以有许多列需要类似类型的处理。

你能告诉我哪种方法在性能和其他方面更好,为什么?


阅读 64

收藏
2022-08-21

共1个答案

小编典典

这取决于很多因素——但最关键的是:

  • 计算的复杂性(更喜欢在应用服务器上进行复杂的运算,因为它可以扩展;而不是扩展的 数据库 服务器 ) __
  • 数据量(如果您需要访问/聚合大量数据,在数据库服务器上执行将节省带宽,如果聚合可以在索引内完成,则磁盘 io)
  • 方便(sql 不是复杂工作的最佳语言 - 尤其不适合程序性工作,但非常适合基于集合的工作;但糟糕的错误处理)

与往常一样,如果您 确实 将数据带回应用服务器,则最小化列和行将是您的优势。确保对查询进行了调整并对其进行了适当的索引,这对这两种情况都有帮助。

回复你的笔记:

然后遍历记录

在 sql 中循环 遍历记录几乎总是错误的事情——最好编写一个基于集合的操作。

作为一般规则 ,我更喜欢将数据库的工作保持在最低限度“存储此数据,获取此数据” - 但是,总是有一些场景示例,服务器上的优雅查询可以节省大量带宽。

还要考虑:如果这在计算上很昂贵,它可以缓存在某个地方吗?

如果你想要一个 准确 的“哪个更好”;两种方式都对其进行编码并进行比较(请注意,任何一种方式的初稿都可能不是 100%
调整的)。但是考虑到典型用法:如果实际上它一次被调用 5 次(分别),那么模拟一下:不要只比较一个“其中的 1 个与其中的 1 个”。

2022-08-21