技术感悟:我对Oracle索引的理解
欢迎进入Oracle社区论坛,与200万技术人员互动交流 >>进入 本文只讲最最平常最最简单的索引,就是以create index ix on tx(a,b,c);形式创建的索引,而不讲位图索引、反向键索引、倒序索引、基于函数的索引等等。其实呢,只要是基于B树的索引,不管是在Oracle
欢迎进入Oracle社区论坛,与200万技术人员互动交流 >>进入
本文只讲最最平常最最简单的索引,就是以create index ix on tx(a,b,c);形式创建的索引,而不讲位图索引、反向键索引、倒序索引、基于函数的索引等等。其实呢,只要是基于B树的索引,不管是在Oracle, Mysql,还是其它数据库中,原理应当都是一样的。
索引最重要的一个性质应该就是有序,索引中的每一项,是从左到右,从小到大,以严格的顺序排列好的。
下面的讨论都以上面的索引ix(a,b,c)为例。
把这棵索引的叶子节点画到纸上,大概是这样的:
a1 a2 a3 ...... an
b1 b2 b3 ...... bn
c1 c2 c3 ...... cn
上面这个3×n的矩阵,每一列代表了一条记录,同时这一列记录,也对应了表里的唯一一条记录。当然,在Oracle里,对于non-unique索引,需要补上rowid,才是真正唯一的。上面的索引相当于create unique index ix on tx(a,b,c,rowid); 我们把这个细节忽略掉。
把每一列看作一个向量,vi = (ai, bi, ci),
有序的含义就是:
vi
vi
(ai
从这个基本性质,我们可以得到一些其它性质(为了打字方便,ai+k表示a(i+k),而不是a(i)+k):
1) 如果ai, ai+1, ……, ai+k 都是相等的,那么,
bi
2) 如果ai, ai+1, ……, ai+k是相等的,而且bi,bi+1, ……, bi+k也是相等的,那么
ci
但是从 ai, ai+1, ……, ai+k相等,我们得不到
ci
索引相关的很多问题,都和上面提到的这几个性质有关系。
下面来看几个常见的查询:
q1) select * from tx where a = :va and b = :vb;
q2) select * from tx where b = :vb and c = :vc;
q3) select * from tx where a = :va and c = :vc;
q4) select * from tx where a = :va order by b;
q5) select * from tx where a = :va order by b, c;
q6) select * from tx where a = :va order by c;
q7) select * from tx where a = :va order by b, c desc;
q8) select * from tx where a = :va order by b desc, c desc;
q9) select * from tx where a = :va and b
qa) select * from tx where a = :va and b >= :vb
qb) select * from tx where a = :va and c >= :vc
qc) select * from tx where a = :va and b >= :vb order by c
大家可以考虑一下这些查询各自会以怎样的方式执行,不同查询之间有什么区别?
同样,为什么在索引字段上作了函数运算之后,索引不可用?
考虑下面这个语句:
select * from tx where f(a) = :vfa;
首先,在字段 a上作了函数运算之后,排序的规则是否仍旧一样? a
其次,就算f(a)和a的排序规则一样,但是索引块中存的a, 但是你传给它的是经过了函数运算的值:vfa, 只有oracle知道函数f的反函数inv_f,并在vfa上做inv_f(:vfa)计算之后,才能通过索引的B树结果进行查找。
当然,现实中f可能不是显示的,而是隐式的,如传入参数和字段类型不匹配的情况下,Oracle可能在字段上作函数运算。从语句上可能看不出索引字段上被做了函数运算,但Oracle内部已经在字段上运用了函数。这样也会导致索引不可用,这种情况下用hint强制使用索引也是没用的。
通过dbms_xplan.display_cursor可以或许可以查看到这种隐式类型转换。
通过v$sql_bind_metadata应当可以查看到每个绑定变量的类型,
通过v$sql_bind_capture这个视图甚至可以看到每个绑定变量具体的值,不要把bind_capture和bind peek搞混哦,而且这里bind_cature也不会每绑定一次变量就capture一次,不然对执行量非常高,绑定频繁的语句,capture以同样频率进行的话,开销可能还是有点大的。
上面讲到了索引的有序性,下面来讲讲索引另外一个有趣的性质,其实,我们完全可以把索引看作一张表,这张表包含和主表一样多的记录(如果不考虑null),只不过每条记录只有主表的部分字段,开个玩笑,我们是不是可以把索引叫做有序视图呢?或者精确一点,有序物化视图:)。
那么,我在执行一些查询的时候,如果所有字段都包含在索引中,是不是只要访问索引就可以了呢?
这些字段可以出现在select列表中,where条件中,order by字段中,也可以出现在两个表连接时的连接条件中。
那么,根据业务的需求,我们是不是可以设计或调整索引以减少对主表的访问呢?或者,是不是可以适当的调整应用的设计或实现来满足索引呢?
同时,考虑到索引的有序性,是不是可以利用索引来避免排序呢?
当然,我们不能忽略null的存在。如果一条记录在索引中的所有字段上都是null的,那么oracle是不会索引这条记录的。比如如果记录ri的ai, bi, ci字段都是null的,索引中是找不到这条记录的。这会有什么问题呢?首先表中的记录和索引中的记录从数量上来说就不一样了。
考虑一下Oracle会怎样执行下面这个查询:
select count(*) from tx;
这个呢,hint起作用了吗?
select /*+ parallel(tx, 4) */ count(*) from tx;
大家可以测试一下,怎样把count(*)这个操作并行化,从这里或许可以得到一些Oracle怎么处理hint的提示。
最后,讲一下Oracle CBO计算索引访问成本的公式:
cost =
blevel +
ceiling(leaf_blocks * effective index selectivity) +
ceiling(clustering_factor * effective table selectivity)
这个公式相信很多地方可以找到(我是从cost base oracle fundamentals这本书里copy出来的),简单说一下我自己对这个公式的理解:
blevel是索引树的高度,
leaf_blocks是索引的页子节点的个数,
effective index selectivity (eis)怎么算呢?
还是举几个例子,
1. where a = :va and b = :vb c = :vc
这里eis是 (selectivity a) * (selectivity b) * (selectivity c)
2. where a = :va and c = :vc
这里eis是 selectivity a
3. where b = :vb and c = :vc
这里eis是 1
4. where a = :va and b >= :vb and c = :vc
这里eis是 (selectivity a) * (selectivity range b)
就是说按索引字段的顺序,第一个不在where条件中出现的字段,或者第一个做了范围运算的字段,之后出现的字段的selectivity是不能乘到effective index selectivity里去的。
简单的说,ceiling(leaf_blocks * effective index selectivity)表示的是Oracle需要访问的索引叶子节点的个数。
clustering_factor表示的是按索引的顺序,从头走到尾,需要访问多少次数据块。这里需要考虑到Oracle的一个优化:如果连续n条记录在同一个表块中,那么oracle认为只需要访问一次数据块。
那么clustering_factor的值的范围就很容易确定了:cf >= table blocks and cf
effective table selectivity,这个计算就容易了,把索引中所有字段的selectivity乘起来就可以了。
如果查询中还有其它条件, 比如 d = :vd and e = :ve ....,但是d,e这些字段又不在索引中,那么在这些列上的过滤条件,需要回表后把这些值取出来才能判断,所以d,e这些列的selectivity是不能乘到effective table selectivity里去的。
ceiling(clustering_factor * effective table selectivity)表示需要回表的次数。
所以上面索引访问的cost就是走某个索引,需要访问的数据块的个数。
当然,前面的讨论忽略了index skip scan这种情况,因为本人对index skip scan也不是很明白。
什么情况下会走skip scan?
select * from tx where a = :va and c = :vc 是不是会在c这个字段上也作一个skip scan呢?
同时也没有考虑in list iterate,这些情况需要进一步研究。

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

Oracle 打不開的解決辦法包括:1. 啟動數據庫服務;2. 啟動監聽器;3. 檢查端口衝突;4. 正確設置環境變量;5. 確保防火牆或防病毒軟件未阻止連接;6. 檢查服務器是否已關閉;7. 使用 RMAN 恢復損壞的文件;8. 檢查 TNS 服務名稱是否正確;9. 檢查網絡連接;10. 重新安裝 Oracle 軟件。

解決 Oracle 游標關閉問題的方法包括:使用 CLOSE 語句顯式關閉游標。在 FOR UPDATE 子句中聲明游標,使其在作用域結束後自動關閉。在 USING 子句中聲明游標,使其在關聯的 PL/SQL 變量關閉時自動關閉。使用異常處理確保在任何異常情況下關閉游標。使用連接池自動關閉游標。禁用自動提交,延遲游標關閉。

Oracle 中,FOR LOOP 循環可動態創建游標, 步驟為:1. 定義游標類型;2. 創建循環;3. 動態創建游標;4. 執行游標;5. 關閉游標。示例:可循環創建游標,顯示前 10 名員工姓名和工資。

可以通過 EXP 實用程序導出 Oracle 視圖:登錄 Oracle 數據庫。啟動 EXP 實用程序,指定視圖名稱和導出目錄。輸入導出參數,包括目標模式、文件格式和表空間。開始導出。使用 impdp 實用程序驗證導出。

Oracle 日誌文件寫滿時,可採用以下解決方案:1)清理舊日誌文件;2)增加日誌文件大小;3)增加日誌文件組;4)設置自動日誌管理;5)重新初始化數據庫。在實施任何解決方案前,建議備份數據庫以防數據丟失。

Oracle不僅是數據庫公司,還是雲計算和ERP系統的領導者。 1.Oracle提供從數據庫到雲服務和ERP系統的全面解決方案。 2.OracleCloud挑戰AWS和Azure,提供IaaS、PaaS和SaaS服務。 3.Oracle的ERP系統如E-BusinessSuite和FusionApplications幫助企業優化運營。

在CentOS系統上搭建Hadoop分佈式文件系統(HDFS)需要多個步驟,本文提供一個簡要的配置指南。一、前期準備安裝JDK:在所有節點上安裝JavaDevelopmentKit(JDK),版本需與Hadoop兼容。可從Oracle官網下載安裝包。環境變量配置:編輯/etc/profile文件,設置Java和Hadoop的環境變量,使系統能夠找到JDK和Hadoop的安裝路徑。二、安全配置:SSH免密登錄生成SSH密鑰:在每個節點上使用ssh-keygen命令

要停止 Oracle 數據庫,請執行以下步驟:1. 連接到數據庫;2. 優雅關機數據庫(shutdown immediate);3. 完全關機數據庫(shutdown abort)。
