隨著互聯網、移動互聯網、社交網絡、物聯網、云計算等新一代信息技術的應用和推廣,人類產生的數據成倍增長,數據種類繁多,數據在寬帶網絡中高速流動,數據的待開發價值越來越大,毫無疑問,我們已經進入了大數據(Massive Datasets)時代。
大數據分析是指對規模巨大的數據進行分析,通常被理解為將網絡中現有的數據轉化為知識,幫助用戶做出明智的業務決策的工具。實時大數據分析是指對大數據高效、快速地完成分析,達到近似實時的效果,更及時的反映數據的價值和意義。
本課程詳細介紹了支持大規模數據挖掘的分布式文件系統及MapReduce分布式計算框架,以及大數據分析的基本概念、方法、理論體系。實時大數據分析的經典算法、應用技術、工具及目前面臨的挑戰會被重點講述。