查ICP網:全新的綜合網站備案信息查詢網
Copyright ? 2008-2028 www.mshuangcha.com [ 查icp] All Rights Reserved.
數據倉庫的特點有哪些?數據倉庫是為企業的決策制定過程,提供數據支持的戰略集合。它是單個數據存儲,出于分析性報告和決策支持目的而創建。數據倉庫是面向主題的、集成的、非易失的和時變的數據集合,用以支持管理決策。
面向主題
即處于數據倉庫中的數據是按照特定的主題組織而成的,這里的主題不是具體的而是一個抽象的概念,常指企業或個人在使用數據倉庫著重關注的方面。傳統數據庫中,最大的特點是面向應用進行數據的組織,各個業務系統可能是相互分離的。而數據倉庫則是面向主題的。主題是一個抽象的概念,是較高層次上企業信息系統中的數據綜合、歸類并進行分析利用的抽象。在邏輯意義上,它是對應企業中某一宏觀分析領域所涉及的分析對象。
集成性
數據集成,指在數據倉庫中的數據信息并不是在各業務系統中簡單、隨機抽取的,由于數據倉庫間的獨立性,因此需要消除源數據中的異值。通過對分散、獨立、異構的數據庫數據進行抽取、清理、轉換和匯總便得到了數據倉庫的數據,這樣保證了數據倉庫內的數據關于整個企業的一致性。
數據倉庫中的綜合數據不能從原有的數據庫系統直接得到。因此在數據進入數據倉庫之前,必然要經過統一與綜合,這一步是數據倉庫建設中最關鍵、最復雜的一步,所要完成的工作有:1.要統一源數據中所有矛盾之處,如字段的同名異義、異名同義、單位不統一、字長不一致,等等。2.進行數據綜合和計算。數據倉庫中的數據綜合工作可以在從原有數據庫抽取數據時生成,但許多是在數據倉庫內部生成的,即進入數據倉庫以后進行綜合生成的。
穩定性
業務系統中的數據總是處于不斷變化的狀態,即數據為最新的狀態。相對于業務系統的不斷變化,數據倉庫具有穩定性,是指數據在進入數據倉庫后,數據一般用于查詢,很少會對數據進行修改,常見的操作也只是進行定期的加載和刷新。
時變性
數據倉庫包含各種粒度的歷史數據。數據倉庫中的數據可能與某個特定日期、星期、月份、季度或者年份有關。數據倉庫的目的是通過分析企業過去一段時間業務的經營狀況,挖掘其中隱藏的模式。雖然數據倉庫的用戶不能修改數據,但并不是說數據倉庫的數據是永遠不變的。分析的結果只能反映過去的情況,當業務變化后,挖掘出的模式會失去時效性。因此數據倉庫的數據需要更新,以適應決策的需要。從這個角度講,數據倉庫建設是一個項目,更是一個過程。
數據倉庫的數據隨時間的變化表現在以下幾個方面:
數據倉庫的數據時限一般要遠遠長于操作型數據的數據時限。
操作型系統存儲的是當前數據,而數據倉庫中的數據是歷史數據。
數據倉庫中的數據是按照時間順序追加的,它們都帶有時間屬性。
總結數據倉庫特點
數據倉庫是面向主題的,操作型數據庫的數據組織面向事務處理任務,而數據倉庫中的數據是按照一定的主題域進行組織。
數據倉庫是集成的,數據倉庫將所需數據從原來的數據中抽取出來,進行集成,才能進入數據倉庫。
數據倉庫是不可更新的,數據倉庫主要是為決策分析提供數據。
數據倉庫是隨時間而變化的,穩定的數據以只讀格式保存,且不隨時間改變。
匯總的。操作性數據映射成決策可用的格式。
大容量。時間序列數據集合通常都非常大。
非規范化的。Dw 數據經常是冗余的。
元數據。將描述數據的數據保存起來。
數據源。數據來自內部的和外部的非集成操作系統。
數據倉庫是單個數據存儲,用于支持分析性報告、決策等為目的而建立的。其可以提供各種類型數據,支持企業進行各種級別決策的制定,還能為有業務智能需求的企業提供有關數據監看、業務流程改進等支持。由此可見數據倉庫對整個數據挖掘過程的重要性。