数据挖掘算法+机器学习理论,常见的分类、聚类、关联、特征选择等算法。
语言:SQL、Java、Python,如果会一点shell更好。
Hadoop的MapReduce编程原理。
最重要的是理解业务需求,这个要看所在部门的业务背景知识。
PS:我现在就是这个岗位。