SQL Server 2008商务智能方面的功能优化
在SQL Server 2008数据库中,对这商务智能方面的功能做了很大的优化。笔者结合相关的案例来谈谈这些优化,希望对各位数据库工程师有所帮助。 商务智能被某些专家宣传的优点神乎其技。其实商务智能并没有那么复杂,在我们身边有很多类似的案例。如就拿SQL Ser
在SQL Server 2008中,对这商务智能方面的功能做了很大的优化。笔者结合相关的案例来谈谈这些优化,希望对各位工程师有所帮助。
商务智能被某些专家宣传的优点神乎其技。其实商务智能并没有那么复杂,在我们身边有很多类似的案例。如就拿SQL Server 数据库来说,数据挖掘功能就是商务智能的最好体现。根据相关的数据,对其按照一定的模型与算法进行分析,最后得出一个结果或者决策。这就是商务智能。
优化一:完善了时序算法的内容。
对于数据挖掘所需要的数据,可以分为两大类,分别为连续性的数据与非连续性的数据。数据类型不同,需要采用不同的算法与数据挖掘模型,只有如此最后得到的结构误差才会最小。而时序算法,就是针对连续数据进行预测分析的回归算法。时序算法仅仅根据用于创建这个模型的原始数据集就可以做出相关的趋势预测。当然,提供的信息越详细,最后的预测结果准确率也会随之上升。用户在进行预测时还可以向模型中添加更多的数据,以获得更小的误差。在实际工作中,这个算法进程使用。如需要根据以前的销售数据,来预测一下下一年各个地区的销售额或者一年四季每个季度的销售趋势,都需要用到这个算法。
在2008版本之前,时序算法中没有采用ARTxp自动回归树算法。为此在使用时序算法与模型来对长期的趋势进行预测时,误差会比较大。也就是说,这之前的时序算法比较适合用来进行短期的趋势预测。为了完善时序模型与算法中某些预测的准确性和稳定性,在2008的数据库商务智能中加入了这个ARTxp自动回归树算法。通过这个算法,时序模型可以实现一些针对比较长期的趋势预测,并且达到比较高的精确度。
在实际工作中,如果要采用时序算法来进行长期趋势预测的话,为了提高最大的准确率,笔者建议两种算法都做一下。即利用ARTxp自动回归树算法和使用ARTMA算法各自计算一次。此时数据库会提供两种不同的结果。虽然数据相同,采用的算法不同最后的结果也是不同的。最后通过数据挖掘模型来评估这两种计算方法得出的结果。在数据分析专家眼中,有时候他们关注的可能并不是最后的结过,而是关系为什么会造成这个差异。通过对差异的分析,找到相关的原因。然后在后续的工作中,积极消除这些因素,使得后续的发展趋势符合预先的规划。
在2008的时序模型中还对这两种算法的结果进行了组合。如可以通过加权的方式最终根据权数来得到一个加权的结果。如果用户有信心的话,当然也可以选择只采用一种算法,以提高数据分析的效率。不过在大部分情况下,用户还是会选择两种算法独立的计算,以得到一个可以比较的结果。具体选择那种算法,还是需要根据用户的用户来定。如需要考虑预测时期的长短、数据的多少、预测的业务等等情况进行确定。
优化二:通过刷选器来帮助用户选择恰当的数据挖掘模型。
在SQL Server 数据库中设计了很多的数据挖掘模型,如决策树模型、线性回归模型、神经网络模型、逻辑回归模型等等。相同的数据,采用了不同的模型,最后得到的结果会有很大的差异。为了提高商务智能的准确性,在对历史数据进行挖掘时,用户需要根据数据的特征、业务的类型等情况选择恰当的数据挖掘模型。只有如此,用户最终才能够得到使用价值比较高的结果。否则的话,反而可能会给用户一个误导。但是,这对用户的要求比较高。如果用户没有丰富的工作经验与理论知识,那么他是很难有这个能力来判断采用哪个模型。这也在很大程度上限制了数据挖掘功能的应用。
在2008数据库版本中,这种对员工经验的依赖情况有所改善。因为在这个版本中,数据库提供了一个挖掘模型的刷选器。这就好像是一个向导工具。在向导中,用户可以输入数据的特征、要预测的业务等内容,然后向导工具在根据用户这些输入的内容,推荐用户采用哪个模型来挖掘数据。这些傻瓜式的操作,可以在最大程度上避免因为用户经验的不足而错误的采用了不恰当的数据挖掘模型。总而言之,通过使用数据挖掘模型刷选器,可以控制用户给模型定型的数据,可以更加容易的帮助用户判断模型的适用性。从而避免采用了不恰当的数据挖掘模型而产生的错误结果。
另外刷选器还可以对数据进行刷选。如现在用户有一份客户信息,里面有所有客户的消费习惯等等。现在企业准备推出一个专门针对女性的服务或者产品。现在需要根据历史数据来预测一下这个产品或者服务的销售情况。此时就需要对原有的数据进行刷选。在以前,必需先对基础数据进行刷选。不过有了刷选器之后,就不需要这么麻烦了。可以在使用数据挖掘模型的时候,直接利用刷选器对于基础数据进行刷选,过滤男性客户的纪录信息。这不仅可以提高数据挖掘结果的准确性,而且还可以提高数据分析的效率。
优化三:支持多个挖掘模型的交叉验证。
在数据挖掘中有一个基础两个核心。基础就是数据,而核心则是挖掘模型与数据挖掘算法。在商务智能中,只有通过这三方面的共同作用,才能够得出正确的结果。在以前的版本中,由于采用的挖掘模型不同,最后产生的结果会相差很大,有时候甚至风马牛不相及。如在SQL Server 数据中,提供了聚类分析模型、决策树模型、逻辑回归模型、顺序分析和聚类分析模型等等数据挖掘模型。即使这些模型采用的数据与计算方法相同,最后得出的结果很有可能都是不同的。为了提高数据挖掘的准确性,在2008中对此进行了优化。主要是提供了多个数据挖掘模型交叉验证的方法,来提高结果与决策的准确性。
多个数据挖掘模型之间的交叉验证是用于评估数据挖掘模型准确性的常用方法之一。在这交叉验证中,数据库工程师可以将挖掘结果分为若干个子集。然后利用这些子集的数据生成对应的子集模型。最后通过衡量每个分区的模型的准确性来判断某个数据挖掘模型是否准确。通过对最后返回的统计信息的分析,可以判断这个挖掘模型的可靠程度,或者说用户所采用的数据挖掘模型是否适用。而且在交叉验证中,用户还可以选择几个相同结构的模型进行对比,以发现相同结构不同模型之间结果的差异。有时候最终的结果可能没有多大的价值,但是中间的分析过程或者结果之间的差异往往会给企业带来意外的收获。如在实际工作中,可以查找差异的原因,从而找到影响某个结果或者决策的关键因素。
在SQL Server 2008数据库版本中,用户可以在两个地方调用这个交叉验证。一是在数据挖掘设计器向导中,可以在“挖掘准确性图表”视图中调用交叉验证;二是通过数据分析存储过程来对挖掘结构分区,调用交叉验证。最后数据库可以根据用户的需要,生成相关的交叉验证报表。在这个报表中,会反映各种可能性以及对应的均方根误差。如果采用聚合模型的话,还会有聚合模型的所有度量值的平均偏差和标准偏差等相关的统计信息。
不过这里需要注意的是,即使采用再复杂的交叉验证模型,也不能够保证最后结构与事实相符。这也是到目前为止商务智能的一个局限性。最后通过数据挖掘所得到的结果,还是要跟用户的相关工作经验进行结合进行判断、甄别决策的准确性。

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

HQL和SQL在Hibernate框架中進行比較:HQL(1.物件導向語法,2.資料庫無關的查詢,3.類型安全),而SQL直接操作資料庫(1.與資料庫無關的標準,2.可執行複雜查詢和資料操作)。

vivox100s和x100手機都是vivo手機產品線中的代表機型,它們分別代表了vivo在不同時間段內的高端技術水平,因此這兩款手機在設計、性能和功能上均有一定區別。本文將從效能比較和功能解析兩個面向對這兩款手機進行詳細比較,幫助消費者更好地選擇適合自己的手機。首先,我們來看vivox100s和x100在效能上的比較。 vivox100s搭載了最新的

《OracleSQL中除法運算的用法》在OracleSQL中,除法運算是常見的數學運算之一。在資料查詢和處理過程中,除法運算可以幫助我們計算欄位之間的比例或得出特定數值的邏輯關係。本文將介紹OracleSQL中除法運算的用法,並提供具體的程式碼範例。一、OracleSQL中除法運算的兩種方式在OracleSQL中,除法運算可以用兩種不同的方式來進行

Oracle和DB2是兩個常用的關聯式資料庫管理系統,它們都有自己獨特的SQL語法和特性。本文將針對Oracle和DB2的SQL語法進行比較與區別,並提供具體的程式碼範例。資料庫連接在Oracle中,使用以下語句連接資料庫:CONNECTusername/password@database而在DB2中,連接資料庫的語句如下:CONNECTTOdataba

隨著網路的快速發展,自媒體這個概念已經深入人心。那麼,自媒體到底是什麼呢?它有哪些主要特點和功能呢?接下來,我們將一一探討這些問題。一、自媒體到底是什麼?自媒體,顧名思義,就是自己就是媒體。它是指透過網路平台,個人或團隊可以自主創建、編輯、發布和傳播內容的資訊載體。不同於傳統媒體,如報紙、電視、電台等,自媒體具有更強的互動性和個人化,讓每個人都能成為訊息的生產者和傳播者。二、自媒體的主要特色和功能有哪些? 1.低門檻:自媒體的崛起降低了進入媒體產業的門檻,不再需要繁瑣的設備和專業的團隊,一部手

隨著小紅書在年輕人中的流行,越來越多的人開始利用這個平台分享各方面的經驗和生活見解。如何有效管理多個小紅書帳號成為關鍵問題。在本文中,我們將討論一些小紅書帳號管理軟體的功能,並探討如何更好地經營小紅書帳號。隨著社群媒體的發展,許多人發現自己需要管理多個社群帳號。對於小紅書用戶來說,這也是一個挑戰。一些小紅書帳號管理軟體可以幫助使用者更輕鬆地管理多個帳號,包括自動發佈內容、定時發布、資料分析等功能。透過這些工具,使用者可以更有效率地管理他們的帳號,提高帳號的曝光率和關注。另一、小紅書帳號管理軟體有

資料庫技術大比拼:Oracle和SQL的差別有哪些?在資料庫領域中,Oracle和SQLServer是兩種備受推崇的關聯式資料庫管理系統。儘管它們都屬於關係型資料庫的範疇,但兩者之間存在著許多不同之處。在本文中,我們將深入探討Oracle和SQLServer之間的區別,以及它們在實際應用中的特徵和優勢。首先,Oracle和SQLServer在語法方面存

PHP是一種廣泛應用於Web開發的伺服器端腳本語言,它主要的功能是產生動態網頁內容,與HTML結合使用,可以創造出豐富多彩的網頁。 PHP的功能強大,它可以執行各種資料庫操作、檔案操作、表單處理等任務,為網站提供強大的互動性和功能性。在接下來的文章中,我們將進一步探究PHP的作用與功能,並配以詳細的程式碼範例。首先,我們來看看PHP的常見用途:動態網頁生成:P
