我试图理解为什么saveAll具有比Spring Data存储库中的保存更好的性能。我正在使用CrudRepository,可以在这里看到。
CrudRepository
为了测试,我创建了10k个实体并将其添加到列表中,这些实体只有一个id和一个随机字符串(对于基准测试,我将该字符串保持不变)。遍历我的列表并调用.save每个元素,这花费了40秒。调用.saveAll同一完整列表将在2秒内完成。.saveAll甚至用30k元素进行调用都花了4秒钟。我确保在执行每个测试之前截断表。即使将.saveAll呼叫分批处理到50个子列表,也要花费10秒和30k的时间。
.save
.saveAll
.saveAll整个清单中的简单清单似乎是最快的。
我试图浏览春数据源代码,但是这是我发现的唯一有价值的东西。在这里,似乎.saveAll只是遍历整个过程Iterable并.save像我所做的那样调用每个。那怎么快呢?它在内部进行一些事务批处理吗?
Iterable
我不得不猜测,如果没有您的代码,我相信这与为所保存的每个对象创建新事务的开销有关,而与之save相比则要打开一个事务saveAll。
save
saveAll
注意的定义,save并且saveAll它们都用注释@Transactional。如果您的项目配置正确(由于将实体保存到数据库,这似乎是事实),则意味着只要调用这些方法之一就将创建事务。如果您save在循环中进行调用,这意味着每次调用都会创建一个新的事务save,但是在saveAll有一个调用的情况下,则创建一个事务,而与保存的实体数量无关。
@Transactional
我假设测试本身不是在事务内运行,如果要在事务内运行,则所有保存调用都将在该事务内运行,因为默认事务传播为Propagation.REQUIRED,这意味着如果有事务已经打开的呼叫将在其中运行。如果您打算使用spring数据,我强烈建议您阅读有关Spring中的事务管理的信息。
Propagation.REQUIRED