大数据开发工程师是大数据领域一个比较热门的岗位,有大量的传统应用需要进行大数据改造,因此岗位有较多的人才需求。这个岗位需要掌握的知识结构包括大数据平台体系结构,比如目前常见的Hadoop、Spark平台,以及众多组件的功能和应用,另外还需要掌握至少一门编程语言,比如Java、Python、Scala等。
大数据分析师是大数据领域非常重要的岗位,大数据分析师需要掌握的知识结构包括算法设计、编程语言以及呈现工具,算法设计是大数据分析师需要掌握的重点内容,而编程语言的作用则是完成算法的实现。另外,大数据分析师还需要掌握一些常见的分析工具。
大数据运维工程师的主要工作内容是搭建大数据平台、部署大数据功能组件、配置网络环境和硬件环境、维护大数据平台,大数据运维工程师需要具备的知识结构包括计算机网络、大数据平台体系结构、编程语言(编写运维脚本)等,通常情况下,大数据运维工程师也需要对数据库有深入的了解。
一般来说,在一线城市,以BAT来说它们企业给应届毕业生的起薪并不高,但只要工作拼命、能力出众,事实上入职后的2、3年里就很容易拿到15万元以上的年薪。而在三线互联网公司,同等条件下,普通技术员工的年薪一般能达到15万元左右。而准二线的互联网公司的普通员工薪水基本也能达到或超过20万元,与许多传统行业相比,这样的收入水平绝对令人艳羡。工作经验超过5年后,互联网企业中的收入差距就会拉大。
如此诱人的薪资,肯定是人人都想加入的。但加入的条件就在于需要掌握一定的技能,综合很多大数据公司的要求统计如下:
1、熟练使用SQL语言;
2、熟练使用Hadoop、M/R、Hive、Storm等开发工具;
3、熟悉Linux命令及Shell编程;
4、对数据敏感,良好的逻辑分析能力,良好沟通能力和团队精神;
5、熟悉Impala、Druid、Mdrill、ElasticSearch等大数据工具者优先;
根据企业对大数据工程师的要求,你需要学习的技术如下:
阶段一、大数据基础——java语言基础方面
(1)Java语言基础
(2) HTML、CSS与JavaScript
(3)JavaWeb和数据库
阶段二、 Linux&Hadoop生态体系
Linux体系、Hadoop离线计算大纲、分布式数据库Hbase、数据仓库Hive、数据迁移工具Sqoop、Flume分布式日志框架
阶段三、 分布式计算框架和Spark&Strom生态体系
(1)分布式计算框架
Python编程语言、Scala编程语言、Spark大数据处理、Spark—Streaming大数据处理、Spark—Mlib机器学习、Spark—GraphX 图计算、实战一:基于Spark的推荐系统(某一线公司真实项目)、实战二:新浪网(www.sina.com.cn)
(2)storm技术架构体系
Storm原理与基础、消息队列kafka、Redis工具、zookeeper详解、实战一:日志告警系统项目、实战二:猜你喜欢推荐系统实战
阶段四、 大数据项目实战(一线公司真实项目)
数据获取、数据处理、数据分析、数据展现、数据应用
阶段五、 大数据分析 —AI(人工智能)
Data Analyze工作环境准备&数据分析基础、数据可视化、Python机器学习
1、Python机器学习2、图像识别&神经网络、自然语言处理&社交网络处理、实战项目:户外设备识别分析
大数据(big data,mega data)或称巨量资料,指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。 在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据进行分析处理。大数据的5V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值密度)、Veracity(真实性)。
大数据的价值体现在以下几个方面:
1)对大量消费者提供产品或服务的企业可以利用大数据进行精准营销
2) 做小而美模式的中长尾企业可以利用大数据做服务转型[15]
3) 面临互联网压力之下必须转型的传统企业需要与时俱进充分利用大数据的价值
你好,大数据开发学习的内容,按照顺序学习就可以了,希望你早日学有所成!
Java核心
JavaWeb前后端交互
Java高级框架
常用工具和环境
Hadoop生态体系
Spark生态体系
Flink生态体系
前沿技术
hadoop 体系 hive hbase 等等 还有基础的sql、java、python 总之需要的技术蛮多,还有spark、scala等等