数据局部性(data locality):这是Hadoop的主要特性,指的是直接在存储数据的节点上做CPU密集型计算。显然,SAN/NAS不适用于任何形式的CPU密集型计算。RAID:SAN/NAS采用RAID磁盘阵列进行存储,而Hadoop框架通过复本来确保数据的可靠性和容错性。DAS采用JBOD磁盘数组进行存储,如果Hadoop节点的内置存储容量较小,可以采用DAS做扩展。如果只是想通过Hadoop做数据归档,没有计算,好吧,SAN/NAS是个选择。