1.大数据架构工具与组件
企业大数据框架的搭建,多是选择基于开源技术框架来实现的,这其中就包括Hadoop、Spark、Storm、Flink为主的一系列组件框架,及其生态圈组件。
2.深入了解SQL和其它数据库解决方案
大数据工程师需要熟悉数据库管理系统,深入了解SQL。同样其它数据库解决方案,例如Cassandra或MangoDB也须熟悉,因为不是每个数据库都是由可识别的标准来构建。
3.数据仓库和ETL工具
数据仓库和ETL能力对于大数据工程师至关重要。像Redshift或Panoply这样的数据仓库解决方案,以及ETL工具,比如StitchData或Segment都非常有用。
4.基于Hadoop的分析(HBase,Hive,MapReduce等)
对基于Apache Hadoop的数据处理框架,需要有深入的了解,至少HBase,Hive和MapReduce的知识存储是必需的。
5.编码
编码与开发能力是作为大数据工程师的重要要求,主要掌握Java、Scala、Python三门语言,这在大数据当中非常关键。
声明:本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果用户发布的作品侵犯了您的权利,请联系管理员:wupeng@hqwx.com
环球青藤
官方QQ群扫描上方二维码或点击一键加群,免费领取大礼包,加群暗号:青藤。 一键加群