通常意義上講,大數(shù)據(jù)(Big Data)包括海量交易數(shù)據(jù)(結(jié)構(gòu)化數(shù)據(jù))和海量交互數(shù)據(jù)集(非結(jié)構(gòu)化數(shù)據(jù))在內(nèi)的所有數(shù)據(jù)集,其規(guī)模(PB級(jí)別)或復(fù)雜程度超出了常用技術(shù)按照合理的成本和時(shí)限捕捉、管理及處理這些數(shù)據(jù)集的能力。
傳統(tǒng)的企業(yè)用戶的海量數(shù)據(jù)分析處理系統(tǒng)目前絕大多數(shù)都采用高性能主機(jī)+高端存儲(chǔ)的Shared-Everything架構(gòu),隨著數(shù)據(jù)來(lái)源的極大豐富和數(shù)據(jù)量的急劇增加,傳統(tǒng)的系統(tǒng)架構(gòu)已顯露出技術(shù)瓶頸和成本性價(jià)比的問(wèn)題,簡(jiǎn)而言之,不僅實(shí)現(xiàn)成本高昂且更關(guān)鍵在于無(wú)法解決客戶所關(guān)心的問(wèn)題。而與此同時(shí),互聯(lián)網(wǎng)公司等新興行業(yè)普遍采用的分布式Shared-Nothing大數(shù)據(jù)處理架構(gòu)已經(jīng)證明了大數(shù)據(jù)分析處理行業(yè)可以有著完全不同的演進(jìn)方向。
通常意義上講,大數(shù)據(jù)(Big Data)包括海量交易數(shù)據(jù)(結(jié)構(gòu)化數(shù)據(jù))和海量交互數(shù)據(jù)集(非結(jié)構(gòu)化數(shù)據(jù))在內(nèi)的所有數(shù)據(jù)集,其規(guī)模(PB級(jí)別)或復(fù)雜程度超出了常用技術(shù)按照合理的成本和時(shí)限捕捉、管理及處理這些數(shù)據(jù)集的能力。
傳統(tǒng)的企業(yè)用戶的海量數(shù)據(jù)分析處理系統(tǒng)目前絕大多數(shù)都采用高性能主機(jī)+高端存儲(chǔ)的Shared-Everything架構(gòu),隨著數(shù)據(jù)來(lái)源的極大豐富和數(shù)據(jù)量的急劇增加,傳統(tǒng)的系統(tǒng)架構(gòu)已顯露出技術(shù)瓶頸和成本性價(jià)比的問(wèn)題,簡(jiǎn)而言之,不僅實(shí)現(xiàn)成本高昂且更關(guān)鍵在于無(wú)法解決客戶所關(guān)心的問(wèn)題。而與此同時(shí),互聯(lián)網(wǎng)公司等新興行業(yè)普遍采用的分布式Shared-Nothing大數(shù)據(jù)處理架構(gòu)已經(jīng)證明了大數(shù)據(jù)分析處理行業(yè)可以有著完全不同的演進(jìn)方向。









