mysql多維資料倉儲指南是一個實戰的書。你將使用mysql資料庫,但該書不是關於mysql的。本書不涉及任何硬體架構的問題。 本書主要關心資料倉儲的設計與開發技術。歡迎使用 mysql多維資料倉儲指南。
推薦課程:MySQL教學
#資料倉儲可以透過整合各種多樣的資料來實現資訊的統一,這些資料來源包括現行的事務操作和管理資訊系統,以及外部各種資訊來源。這些來源資料將被整合,清洗,轉換,如果需要直接從這些資料來源讀取資料的話,該資料將會在資料倉儲中以更有利於操作的方式儲存。
資料倉儲的資料建構方式使你可以儲存目前和歷史的資料。目前資料是實際事務操作活動必要的,一般是定期的硬拷貝(例如列印出的報表)或是線上報表。而歷史數據,往往不是那麼容易利用,可以提供基於時間點分析的商業資訊,例如:追蹤、推論分析,以及對比,這些對於長期計畫和策略性的市場決策都是很重要的。
如何從多個資訊來源整合訊息,定期累積存儲,有效的需求設計和發展技術,所有這些都和事務型管理資訊系統所應用的技術有很大的不同。本書都是關於資料倉儲的設計和開發技術,它涵蓋了大部分建立資料倉儲所涉及到的大部分技術問題。更重要的是,本書提供了一個易懂的操作指南,方便開發一個實際的資料倉儲。
本書的適用範圍
mysql多維資料倉儲指南是一本實戰的書。你將使用mysql資料庫,但該書不是關於mysql的。本書不涉及任何硬體架構的問題。
本書主要關心資料倉儲的設計與開發技術。它不涉及開發專案的管理,理論,以及如何領導開發等相關的技術問題。
本書用一個資料倉儲開發的範例來展示技術如何應用。提供資料模型和sql腳本,將能夠適用於實際的資料倉儲開發。這些腳本已經在Windows xp professional sp2 平台上使用mysql 5。0。21 版本測試通過。
另外,本書不再對以下的幾個主題進行特別的論述:
資料倉儲的概念
Sql
MySQL資料庫
適合閱讀本書的人:
資料倉儲應用於各種組織和商業機構,從政府部門,非營利組織到學校,從製造業到零售店,從金融機構到醫療機構,從傳統公司到網路商家。
本書首先是針對資料倉儲開發人員。但是,it 經理和其他it職業,特別是對mis(經營報告)和dss(決策支援應用)感興趣的人將發現本書同樣有用。總的說來,本書是給那些為分析應用準備資料工作相關的人,以及那些需要遞交資訊的人,例如列印報表,線上報表。
本書同樣適用於那些資料倉儲初學者。它將直接快速的為那些正在準備開發他們第一個資料倉儲的人提供幫助。
教師和學生可以將該書作為教科書,以便於明確他們對於資料倉儲原理,概念的理解。大部分章節可以被客製化用於實驗練習。
預備的技能
本書不是面向it新人,為了更有效的利用本書,讀者必須有一些系統開發經驗。但是,不要求先有資料倉儲的建置經驗。
需要實作操作本書範例的人需要有rdbms(關聯式資料庫管理系統)和sql的實際操作技能。
你可以從本書得到
你將可以僅用一個範例,一個最先儲存商業銷售相關資料的資料倉儲,並且進行實務操作,就可以磨練你的數據倉庫知識和實際技能。這個範例是一個精簡版的實際資料倉儲,可以在許多商業類型中找到它的原型。
你將基於mysql資料庫用本書介紹的技術一步步的開發該範例中銷售相關資料倉儲。這些技術是在通常資料倉儲開發中將碰到的問題的分解技巧。透過完成本文的學習並且完成所有的練習,你將獲得相關工作經驗並可以為負責第一個實際資料倉儲專案做好準備。
章節總覽
本書包含25個章節和一個附錄。所有章節組織為四個部分。第一部分涵蓋資料倉儲基礎。第二部分描述從原始資料到資料倉儲的遷移。第三部分討論如何控制資料倉儲的發展演化。第四部分涉及一些高階的多維技術。接下來的部分將給出每個章節的預覽。
第一篇 基本原理
第一篇,涵蓋多維資料倉儲的基礎原理,有四個章節。
第1章,“基本組成”,介紹星型模式(一種資料庫模式,有一個事實表,周圍圍繞著多個維表)以及解釋該模式的基本組成。
第2章,」維度歷史「 介紹用代理健來維護維成員的歷史記錄。
第3章,“度量可加性”,包含維度資料倉儲中最重要的特性之一,也就是儲存在資料倉儲事實表中的度量的可加性。
第4章,“維度查詢”,介紹最適合應用於星型模式的一種sql查詢,維度查詢可以用來證明一個維度資料倉儲是否具備兩個最基本的設計指標:簡單和高效。
第二篇: 提取、轉換和加載
該篇的所有5個章節涉及了資料集成,事實表,維表。
第5章,「來源資料擷取」介紹了不同類型資料的擷取。
第6章「導入時間維」涵蓋了三種最通用的載入時間維的技術。
第7章 「初始化導入「和第8章,『定期導入』涉及兩種類型的導入技術,初始化和週期性。
第9章,“週期導入計劃”,作為第二篇的總結,提供一個進階式的指導,關於如何利用Windows的任務管理器實現定期導入計劃。
第三篇:成長
第三篇介紹了不同的處理技術,這些技術主要處理一個成功的多維資料倉儲成長過程中碰到的相關問題。該部分有十個章節。
第10章,「增加欄位」討論關於為現有資料倉儲中的資料表增加一個欄位的技術問題。
第11章,「按需載入」涉及按需載入的技術。
第12章,“維表子集”,介紹相關技術以幫助使用者處理維表子集問題。
第13章,“維度角色扮演”,關於在一個事實表中多次使用同一個維度的問題。
第14章,「快照」讓你在需要作出匯總資料的時候,能提供快速效能的查詢。
第15章,「唯度層次」和第16章「多路徑和不齊整的維度層次」是關於簡單和多路徑維度技術,相應的,這些技術幫助人們進行匯聚和鑽取分析。
第17章,“維度退化”,展示如何用維度退化技術去減少一個資料倉儲模式的複雜性。
第18章,“垃圾維”,是關於垃圾維的技術,即將表面上不相關的但是經常會被用戶進行要求分析的數據,用維的方式組織起來。
第19章,「多星型模式」展示如何在模式中增加多個星型模式。
第四篇:進階技術
包含六個章節。
第20章,“不齊整資料來源”,介紹如何在資料倉儲中處理那些結構無法直接對應到目標表的資料來源。
第21章,“無事實的事實表”,幫助你為客戶建立一種可供分析的輔助數據,一種無事實字段的事實表,該數據無法從數據源直接獲取度量。
第22章,“遲來的事實”,包含一個技術,用於處理當資料來源中某個特殊的事實沒有在計劃載入時間之前產生的情況。
第23章,「外部資料來源和維度合併“,包括兩個主題:處理外部資料來源和如何將多個維中分散的屬性合併到一個維的技術。
第24章,“累積度量”,討論兩個相關的問題:計算度量和累積度量的不可相加性。
第25章,“分段維度”,闡述一種技術,可以幫助使用者針對那些有連續值的屬性進行資料分析。
附錄
附錄a,“格式檔案資料來源”,介紹如何使用本書範例中的格式檔案資料來源。
將Mysql這個最受歡迎的開源資料庫軟體進行資料倉儲應用,在本書之前還從來沒有被在創建多維資料倉儲方面用這種入門指南的方式進行介紹。主題包括 星型模式建模,資料載入(資料的擷取、轉換與載入:etl),測試檢驗,以及多維查詢。本書由始至終應用一個可實踐,相對精簡的真實的項目。其全面,易於接受的寫作形式使得那些需要建立資料倉儲的程式設計師可以得到相關的範例和資料。
關於作者
Djoni Darmawikarta 曾就職於ibm,現在是一個加拿大保險公司的資料倉儲、商業智慧團隊中的技術專家。目前生活在Toronto, Ontario
以上是mysql多維資料倉儲指南是什麼的詳細內容。更多資訊請關注PHP中文網其他相關文章!