上回解釋左究竟數據科學, 大數據, 數據分析係咩東東。今次就講下佢地實質作用。
#數據科學
由於我地冇可能會預測到未來會發生咩事,所以我地需要數據嚟預測未來嘅趨勢。數據科學其實係結合咗統計學、數據分析同埋機器學習嘅方法,利用數據對實際現象進行理解同分析; 根據過去嘅模式預測未來,數據科學家檢查來自多個無關聯嘅數據庫,利用提煉出嚟嘅Data,再加上機器學習模型(Machine learning),程式設計嘅技術例如SAS, R, Python 嚟建立出一個預測模型(Predict Model),搵到可用於業務嘅連接。數據科學通過嘗試搵到新嘅模式同視角,深入了解未知世界。
#大數據
大數據意指資料嘅規模巨大,以致無法透過傳統嘅方式係一定時間內進行儲存、運算與分析。大數據嘅特性歸類為「3V」,包括資料量(Volume)、資料類型(Variety)與資料傳輸速度(Velocity)。大數據一般狹義係資料量係100TB到PB之間。大數據技術嘅作用就係利用Java, Scala, Mongo DB 黎構建大規模數據處系統黎儲存多元、種類繁多嘅數據,更快更有效率咁開發演算法同進行分析。大數據需要全新嘅處理方式,以新型嘅儲存運算方法分析數據同埋產出溝通圖表,並將該分析結果視為一種戰略資產。
#數據分析
數據分析嘅功用就係幫我地處理同匯總數據,洞悉先見。由於傳統嘅統計分析,難以應付海量嘅數據同種類,只有透過機器學習,以電腦演算法進行分析,先至能夠更快同更有效率地達成比以往更深入嘅分析 !
例如美國有啲銀行已經開始可以結合辨識人臉技術同國家安全部資料,嚟決定借貸者嘅信用等級。數據分析將會全面影響每個人與每個企業幫助決策同創造新商機。