Hadoop本身是分布式框架,如果在hadoop框架下,需要配合hbase,hive等工具来进行大数据计算。如果具体深入还要了解HDFS,Map/Reduce,任务机制等等。如果要分析还要考虑其他分析展现工具。
大数据还有分析才有价值
用于分析大数据的工具主要有开源与商用两个生态圈。开源大数据生态圈:1、Hadoop
HDFS、HadoopMapReduce,
HBase、Hive
渐次诞生,早期Hadoop生态圈逐步形成。2、.
Hypertable是另类。它存在于Hadoop生态圈之外,但也曾经有一些用户。3、NoSQL,membase、MongoDb商用大数据生态圈:1、一体机数据库/数据仓库:IBM
PureData(Netezza),
OracleExadata,
SAP
Hana等等。2、数据仓库:TeradataAsterData,
EMC
GreenPlum,
HPVertica
等等。3、数据集市:QlikView、
Tableau
、
以及国内的Yonghong
Data
Mart
。