批量插入与单条插入多值:批量处理何时成为瓶颈?
一项令人意外的性能比较显示,单独执行1000条INSERT语句(290毫秒)的性能显着优于使用单条INSERT语句插入1000个值(2800毫秒)。为了调查这个意外的结果,让我们分析执行计划并找出潜在的瓶颈。
对执行计划的检查显示,单条INSERT语句使用自动参数化过程,最大限度地减少了解析/编译时间。但是,单条INSERT语句的编译时间在约250个值子句处出现突然增加,导致缓存计划大小下降,编译时间增加。
进一步分析表明,在为特定字面值编译计划时,SQL Server可能会执行一些不能线性扩展的活动,例如排序。即使在编译时不进行排序,向表中添加聚集索引也会在计划中显示显式的排序步骤。
在编译阶段,SQL Server进程的堆栈跟踪表明,大量时间都花在了比较字符串上。这可能与查询处理的规范化阶段(绑定或代数化)有关,在此阶段,表达式解析树被转换为代数化表达式树。
改变插入字符串的长度和唯一性的实验表明,较长的字符串和较少的重复项会导致更差的编译时间性能。这表明SQL Server在编译期间花费更多时间来比较和识别重复项。
在某些情况下,可以利用这种行为来提高性能。例如,在使用无重复项的列作为主要排序键的查询中,SQL Server可以在运行时跳过按次要键排序,并避免除零错误。
因此,虽然使用单条INSERT语句插入多个值似乎比多条INSERT语句更快,但与处理大量不同值(尤其是长字符串)相关的编译时间开销可能会导致SQL Server的性能显着下降。
以上是具有多个值的单个插入与多个插入:批处理何时成为瓶颈?的详细内容。更多信息请关注PHP中文网其他相关文章!