指導(dǎo)性架構(gòu)與其目標(biāo)
NIST 大數(shù)據(jù)參考架構(gòu)的主要特點
整體結(jié)構(gòu)(5 個邏輯角色和2個維度)
角色名稱
維度名稱
信息如何在不同角色之間流動
Hadoop 架構(gòu)下核心組件的名稱
NameNode – 名字節(jié)點
MapReduce – 映射歸約
SlaveNode - 從屬節(jié)點
Job tracker – 工作跟蹤器
HDFS - 分布式文件系統(tǒng)
使用大數(shù)據(jù)參考架構(gòu)的收益
與參考架構(gòu)中的邏輯角色相關(guān)聯(lián)的職能和活動
System Orchestrator - 系統(tǒng)編配器
Data Provider - 數(shù)據(jù)提供者
Big Data Application Provider - 大數(shù)據(jù)應(yīng)用提供者
Big Data Framework Provider - 大數(shù)據(jù)框架提供者
Data Consumer - 數(shù)據(jù)消費者
本地式處理和分布式存儲處理的區(qū)別
面對海量數(shù)據(jù)的三種大數(shù)據(jù)存儲系統(tǒng)
Direct Attached Storage (DAS)- 直接附加存儲
Network Attached Storage (NAS) - 網(wǎng)絡(luò)附加存儲
Storage Area Network (SAN) - 存儲區(qū)域網(wǎng)絡(luò)
大數(shù)據(jù)存儲機制
File systems - 文件系統(tǒng)
NoSQL databases - NoSQL 數(shù)據(jù)庫
Parallel programming models - 并行編程模型
大數(shù)據(jù)實證分析體系結(jié)構(gòu)
Real time analysis- 實時分析
Off-line analysis - 離線分析
Hadoop 在大數(shù)據(jù)環(huán)境中的功能
以下 Hadoop 組件的角色
NameNode – 名字節(jié)點
MapReduce – 映射歸約
SlaveNode - 從屬節(jié)點
Job tracker – 工作跟蹤器
HDFS – 分布式文件系統(tǒng)