索引视图有助于提高 T-SQL 的性能-MySQL 튜토리얼-php.cn

집

데이터 베이스

MySQL 튜토리얼

索引视图有助于提高 T-SQL 的性能

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 03:07 PM

성능 개선하다 색인 보다

T-SQL 是一种允许您以逻辑方式设计请求的语言。这里所说的逻辑的意思是，当编写查询时，您指定的是希望获得什么结果，而不是希望以何种方式获得结果。对如何处理查询进行设计是查询优化器的工作。您所遇到的需要 T-SQL 解决方案的每个问题通常都有许多不

T-SQL 是一种允许您以逻辑方式设计请求的语言。这里所说的“逻辑”的意思是，当编写查询时，您指定的是希望获得什么结果，而不是希望以何种方式 获得结果。对如何处理查询进行设计是查询优化器的工作。您所遇到的需要 T-SQL 解决方案的每个问题通常都有许多不同的解决方案，它们最终会返回同样的结果。在理想情况下，假设有两个执行同一任务的不同查询，优化器会为二者生成相同的执行计划－最优化的计划。SQL Server 开发组似乎正在朝这个方向努力。利用 SQL Server 的每个发行版本，优化器会设计出更高级、更有效的计划，执行同一任务的不同查询使用这个相同计划的可能性也在提高。

不过，在许多情况下，您编写查询的方式仍然会动态地影响查询的性能。为了使优化器在不同的计划中作出选择并找到一个高效的计划，您需要完成一些准备工作－也就是，创建索引。大多数人是将普通索引作为其数据库优化的一部分创建的，但我还没有看到索引视图的广泛实现。索引视图可以极大地提高查询性能，尤其在聚合数据的时候。在某些情况下，对视图进行创建并索引后，您甚至不需要更改引用基表的原始查询，这是因为优化器的智能程度足以使用那些索引。

下面我们将讨论使用索引视图来获得性能提高的两个问题。我假设您已经很熟悉索引视图的基本概念。（有关索引视图的详细信息，请参阅 Kalen Delaney 的 "Introducing Indexed Views" （2000 年 5 月发表，InstantDoc ID 8410）一文。）

关于新客户的问题

第一个问题涉及一个典型的市场营销请求－在每个期间（例如，月份），根据定单活动而定的新客户、现有客户和全部客户的数量分别是多少？某个月的新客户就是第一次下达定单的客户。现有客户是那些在以前的月份下达过定单的客户。您可以将 Northwind 数据库中的 Orders 表作为最初的基本数据。表 1（表 1）显示了预期输出的简化版本。创建解决方案并验证您的代码在逻辑上正确无误之后，可针对一个更大的 Orders 表测试其性能，您可以通过运行第 18 页清单 1 显示的代码，在 tempdb 中创建该表。

第 18 页清单 2 显示了我针对此问题的第一个解决方案。定义派生表 M 的最内部查询从 Orders 返回了不同的月份和客户组合。月份表示为指向当月第一天的一个 datetime 值。定义派生表 N 的查询使用 CASE 表达式，对于每个月份和客户组合，如果该客户在当月之前还没有下达过定单，则该表达式返回 1，否则，返回 0。也就是说，如果客户是新客户，CASE 表达式返回 1。最外部查询按月份对 N 中的行进行分组，并通过对 N 表中名为 new 的列中的所有 1 进行汇总，来计算新客户的总数。客户的总数就是该组中的行数 (COUNT(*))，因为该组中的每一行都代表一个不同的客户。现有客户的数量是客户总数减去新客户的数量。

当我编写此解决方案时，我并没有考虑性能，我只想到要用逻辑方式来编写该查询。在我的笔记本电脑上，对我在 tempdb 中创建的较大的 Orders 表运行该查询时，该查询发生了超过 137,000 次的逻辑读取，运行的时间长达 17 秒。普通索引并没有提供多少帮助－当我在 customerid 列和 orderdate 列上创建了组合索引后，该查询运行了 15 秒。看来，这个问题需要采用另一种方法，这次，我决定先考虑性能。

这个较大的 Orders 表会包括每个月份的每个客户的许多定单。如果您有一个只包含月份和客户的不同组合的汇总表，就可以编写一个更易于执行的查询。索引视图的实质就是对表进行汇总。请运行清单 3 中的代码，创建一个名为 Vymcusts 的索引视图，该视图只包含月份和客户的不同组合。注意，如果您希望对一个使用聚合的视图进行索引，则必须在该视图内包括 COUNT_BIG(*) 函数。如果 SQL Server 知道每组中的行数，就可以有效地维护索引视图。

接下来，我测试了几个不同的解决方案，所有方案执行起来都比第一个要好得多。我们来看一下我编写出的执行效果最好的解决方案。我创建了另一个名为 Vnewcusts 的视图，该视图包含每个客户的最小年/月份 (ym) 值：

CREATE VIEW Vnewcusts 
AS 
SELECT customerid, MIN(ym) AS min_ym 
FROM Vymcusts (NOEXPAND) 
GROUP BY customerid

로그인 후 복사

客户的 ym 最小值就是该客户的第一份定单的月份。NOEXPAND 提示要求优化器将索引视图视为表，不要尝试使用来自基表 Orders 的索引。最后，我将 Vymcusts (VY) 左联接到了 Vnewcusts (VN)。如果 VY 和 VN 同时拥有同一个客户，并且 VY 中的当前月份是该客户的最小月份 (VY.ym = VN.min_ym)，则 VY 中的某一行会在 VN 中寻找匹配的行。如果该月份不是该客户的最小月份，则外部联接在 VN.customerid 中以及在 VN 的所有列中均返回 NULL。查询按 VY.ym 列对外部联接的结果进行分组。SQL Server 通过对 VN.customerid 中的非 Null 值进行计数来计算新客户的总数。清单 4 显示了这个最终的查询，该查询在我的笔记本电脑上只运行了 1 秒，仅发生了 280 次逻辑读取。这样的性能令人非常满意。

列基数

我发现索引视图对解决另一个问题也非常有用，这就是计算列基数 －列中不同的值的数量。计算表中每列的基数会占用大量系统开销，因为 SQL Server 需要重新排列每列的值，这样就可以很容易地对不同的值进行计数。现在我们来看一些示例，它们使用一个具有三个数据列和一百万行的表。请运行清单 5 显示的脚本，在 tempdb 中创建一个名为 T1 的表，该表包括的各列是 c1、c2 和 c3，这些列分别包含 50,000、100,000 和 200,000 个不同的值。

在没有适当索引的情况下，下面的查询将计算每个数据列的基数，该查询的执行性能比较差：

SET STATISTICS TIME ON 
SET STATISTICS IO ON 
SELECT COUNT(DISTINCT c1),  
COUNT(DISTINCT c2), COUNT(DISTINCT c3) FROM T1

로그인 후 복사

我们在查询分析器中看看该查询的执行计划，我们注意到，SQL Server 对 T1 的聚集索引扫描了三次，对每一列中的值都执行了哈希操作来计数不同值的数量。因此，该查询用了很长的时间才完成，并且发生了大量 I/O 系统开销。在我的笔记本电脑上，该查询运行了 23 秒，发生了 9294 次逻辑读取。

为了获得更好的性能，很明显，第一个步骤就是对每一列进行索引：

CREATE NONCLUSTERED INDEX idx_nc_c1 ON T1(c1) 
CREATE NONCLUSTERED INDEX idx_nc_c2 ON T1(c2) 
CREATE NONCLUSTERED INDEX idx_nc_c3 ON T1(c3)

로그인 후 복사

这样一来，SQL Server 可以用排序的方式单独扫描每个索引，并对不同的值进行计数。现在，查询只运行 5 秒钟，发生 4083 次逻辑读取。

您可能对这样的性能提高感到满意，但对于包括更多列和更多行的表，可能还需要进一步提高性能。获得更好查询性能的一个方式（不过要以修改性能为代价）是编写 INSERT、UPDATE 和 DELETE 触发器，它们在单独的非正式表中维护每列的非重复计数值。您也可以在不使用触发器的情况下解决该问题，方法是：使用索引视图，而不是普通的非聚集索引。

对于每一列，您可以创建一个只包含感兴趣的列和 COUNT_BIG(*) 函数的索引视图，该函数是对有聚合的视图进行索引所必需的。例如，可为 c1 创建以下索引视图：

CREATE VIEW V_T1_c1 WITH SCHEMABINDING 
AS 
SELECT c1, COUNT_BIG(*)  
  AS cnt FROM dbo.T1 GROUP BY c1 
GO 
CREATE UNIQUE CLUSTERED INDEX 
 idx_uc_c1 ON V_T1_c1(c1)

로그인 후 복사

然后，运行清单 6 显示的脚本，为 c2 和 c3 创建索引视图。现在，重新运行该查询，测量一下持续时间和 I/O，并查看执行计划。优化器的智能程度足以理解该执行计划，对列的非重复计数进行计算，它可以只对在其 GROUP BY 子句中使用该列的索引视图内的行数进行计数。现在，该查询运行的时间不到一秒，发生的逻辑读取不到 1000 次。

关于索引视图的其他信息

如果编写 T-SQL查询的方式对您来说很重要，您应该测试同一个问题的几个不同的解决方案来获得更好的性能。索引视图是一个很出色的优化方法，因为它会在磁盘上存储查询结果；尤其在聚合数据时，索引视图可节省许多 I/O 系统开销。在某些情况下，索引视图可以在很大程度上提高检索性能，但要记住，索引视图也会降低修改性能。

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7792

자바 튜토리얼

1644

Cakephp 튜토리얼

1401

라라벨 튜토리얼

1298

PHP 튜토리얼

1234

Related knowledge

vivox100s와 x100의 차이점: 성능 비교 및 기능 분석 Mar 23, 2024 pm 10:27 PM

vivox100s와 x100 휴대폰은 모두 in vivo 휴대폰 제품군의 대표적인 모델입니다. 두 휴대폰은 각각 서로 다른 시대의 vivo 첨단 기술 수준을 대표하므로 디자인, 성능, 기능 면에서 일정한 차이가 있습니다. 이번 글에서는 소비자들이 자신에게 꼭 맞는 휴대폰을 선택할 수 있도록 두 휴대폰을 성능비교와 기능분석 측면에서 자세히 비교해보겠습니다. 먼저 vivox100s와 x100의 성능 비교를 살펴보겠습니다. vivox100s에는 최신 기술이 탑재되어 있습니다.

Windows 11에서 숨겨진 성능 오버레이를 표시하는 방법 Mar 24, 2024 am 09:40 AM

이 튜토리얼에서는 Windows 11의 숨겨진 성능 오버레이를 공개하는 데 도움을 드립니다. Windows 11의 성능 오버레이 기능을 사용하면 시스템 리소스를 실시간으로 모니터링할 수 있습니다. 컴퓨터 화면에서 실시간 CPU 사용량, 디스크 사용량, GPU 사용량, RAM 사용량 등을 볼 수 있습니다. 이는 게임을 하거나 대용량 그래픽 프로그램(비디오 편집기 등)을 사용할 때, 특정 프로그램을 사용할 때 시스템 성능이 얼마나 영향을 받는지 확인해야 할 때 편리합니다. 시스템 성능을 모니터링하는 데 사용할 수 있는 뛰어난 무료 소프트웨어가 있고 리소스 모니터와 같은 일부 내장 도구를 사용하여 시스템 성능을 확인할 수 있지만 성능 오버레이 기능에도 장점이 있습니다. 예를 들어 현재 사용하고 있는 프로그램이나 앱을 종료할 필요가 없거나

Windows 10 vs. Windows 11 성능 비교: 어느 것이 더 낫나요? Mar 28, 2024 am 09:00 AM

Windows 10 vs. Windows 11 성능 비교: 어느 것이 더 낫나요? 지속적인 기술 개발과 발전으로 운영 체제는 지속적으로 업데이트되고 업그레이드됩니다. 세계 최대 운영 체제 개발자 중 하나인 Microsoft의 Windows 운영 체제 시리즈는 항상 사용자로부터 많은 관심을 받아 왔습니다. 2021년에 Microsoft는 Windows 11 운영 체제를 출시하여 광범위한 논의와 관심을 불러일으켰습니다. 그렇다면 Windows 10과 Windows 11의 성능 차이는 무엇입니까?

PHP와 Go 언어의 비교: 큰 성능 차이 Mar 26, 2024 am 10:48 AM

PHP와 Go는 일반적으로 사용되는 두 가지 프로그래밍 언어이며 서로 다른 특성과 장점을 가지고 있습니다. 그 중 성능 차이는 모두가 일반적으로 우려하는 문제이다. 이 기사에서는 성능 관점에서 PHP와 Go 언어를 비교하고 구체적인 코드 예제를 통해 성능 차이를 보여줍니다. 먼저 PHP와 Go 언어의 기본 기능을 간략하게 소개하겠습니다. PHP는 원래 웹 개발을 위해 설계된 스크립팅 언어로, 배우기 쉽고 사용하기 쉬우며 웹 개발 분야에서 널리 사용됩니다. Go 언어는 Google에서 개발한 컴파일 언어입니다.

Win11과 Win10 시스템의 성능을 비교하면 어느 것이 더 낫습니까? Mar 27, 2024 pm 05:09 PM

Windows 운영 체제는 항상 개인용 컴퓨터에서 가장 널리 사용되는 운영 체제 중 하나였으며, Windows 10은 Microsoft가 새로운 Windows 11 시스템을 출시한 최근까지 오랫동안 Microsoft의 주력 운영 체제였습니다. Windows 11 시스템이 출시되면서 사람들은 Windows 10과 Windows 11 시스템 중 어느 것이 더 나은지에 관심을 가지게 되었습니다. 먼저 W부터 살펴보겠습니다.

Embedding 서비스의 로컬 실행 성능은 OpenAI Text-Embedding-Ada-002를 능가하므로 매우 편리합니다! Apr 15, 2024 am 09:01 AM

Ollama는 Llama2, Mistral, Gemma와 같은 오픈 소스 모델을 로컬에서 쉽게 실행할 수 있는 매우 실용적인 도구입니다. 이번 글에서는 Ollama를 사용하여 텍스트를 벡터화하는 방법을 소개하겠습니다. Ollama를 로컬에 설치하지 않은 경우 이 문서를 읽을 수 있습니다. 이 기사에서는 nomic-embed-text[2] 모델을 사용합니다. 짧은 컨텍스트 및 긴 컨텍스트 작업에서 OpenAI text-embedding-ada-002 및 text-embedding-3-small보다 성능이 뛰어난 텍스트 인코더입니다. o를 성공적으로 설치한 후 nomic-embed-text 서비스를 시작하십시오.

Kirin 8000 프로세서는 Snapdragon 시리즈와 경쟁합니다. 누가 왕이 될 수 있습니까? Mar 25, 2024 am 09:03 AM

모바일 인터넷 시대를 맞아 스마트폰은 국민의 일상생활에서 없어서는 안 될 존재가 되었습니다. 스마트폰의 성능은 사용자 경험의 질을 직접적으로 결정하는 경우가 많습니다. 스마트폰의 '두뇌'인 프로세서의 성능은 특히 중요합니다. 시장에서 Qualcomm Snapdragon 시리즈는 항상 강력한 성능, 안정성 및 신뢰성을 대표해 왔으며 최근 Huawei는 뛰어난 성능을 갖춘 것으로 알려진 자체 Kirin 8000 프로세서도 출시했습니다. 일반 사용자들에게는 강력한 성능의 휴대폰을 어떻게 선택하느냐가 중요한 이슈가 되었다. 오늘 우리는

PHP 배열 키 값 뒤집기: 다양한 방법의 성능 비교 분석 May 03, 2024 pm 09:03 PM

PHP 배열 키 값 뒤집기 방법의 성능 비교는 array_flip() 함수가 대규모 배열(100만 개 이상의 요소)에서 for 루프보다 더 나은 성능을 발휘하고 시간이 덜 걸리는 것을 보여줍니다. 키 값을 수동으로 뒤집는 for 루프 방식은 상대적으로 시간이 오래 걸립니다.

See all articles

索引视图有助于提高 T-SQL 的性能

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제