问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

大数据工程师日常工作内容有哪些?

发布网友 发布时间:2022-03-01 05:38

我来回答

2个回答

热心网友 时间:2022-03-01 07:07

1数据采集(采集日志数据、文件数据、接口数据,这个涉及到各种格式的转换,一般用得比较多的是 Flume 和 Logstash)

2 为集群搭大数据环境(一般公司招大数据工程师环境都已经搭好了,公司内部会有现成的大数据平台,但我这边会私下搞一套测试环境,毕竟公司内部的大数据系统权限*很多,严重影响开发效率)

3 维护大数据平台(这个应该是每个大数据工程师都做过的工作,或多或少会承担“运维”的工作)

4 数据迁移(有部分公司需要把数据从传统的数据库 Oracle、MySQL 等数据迁移到大数据集群中,这个是比较繁琐的工作,吃力不讨好)

5 应用迁移(有部分公司需要把应用从传统的数据库 Oracle、MySQL 等数据库的存储过程程序或者SQL脚本迁移到大数据平台上,这个过程也是非常繁琐的工作,无聊,高度重复且麻烦,吃力不讨好)

6 写 SQL (很多入职一两年的大数据工程师主要的工作就是写 SQL )

7 数据处理
7.1 离线数据处理(这个一般就是写写 SQL 然后扔到 Hive 中跑,其实和第一点有点重复了)
7.2 实时数据处理(这个涉及到消息队列,Kafka,Spark,Flink 这些,组件,一般就是 Flume 采集到数据发给 Kafka 然后 Spark 消费 Kafka 的数据进行处理)

8 数据可视化(这个我司是用 Spring Boot 连接后台数据与前端,前端用自己魔改的 echarts)

9 大数据平台开发(偏Java方向的,大概就是把开源的组件整合起来整成一个可用的大数据平台这样,常见的是各种难用的 PaaS 平台)

10 数据中台开发(中台需要支持接入各种数据源,把各种数据源清洗转换为可用的数据,然后再基于原始数据搭建起宽表层,一般为了节省开发成本和服务器资源,都是基于宽表层查询出业务数据)

11 搭建数据仓库(这里的数据仓库的搭建不是指 Hive ,Hive 是搭建数仓的工具,数仓搭建一般会分为三层 ODS、DW、DM 层,其中DW是最重要的,它又可以分为DWD,DWM,DWS,这个层级只是逻辑上的概念,类似于把表名按照层级区分开来的操作,分层的目的是防止开发数据应用的时候直接访问底层数据,可以减少资源,注意,减少资源开销是减少 内存 和 CPU 的开销,分层后磁盘占用会大大增加,磁盘不值钱所以没什么关系,分层可以使数据表的逻辑更加清晰,方便进一步的开发操作,如果分层没有做好会导致逻辑混乱,新来的员工难以接手业务,提高公司的运营成本,还有这个建数仓也分为建离线和实时的)

总之就是离不开写 SQL ...

热心网友 时间:2022-03-01 08:25

当前随着云计算、大数据平台逐渐开始落地应用,大数据开发工程师(行业领域)的岗位需求正在不断增加,目前也有不少程序员(Java方向)也会转向大数据开发岗位,这些岗位的岗位附加值还是比较高的。这些开发岗位的日常工作基本上就是完成代码的编写,只不过需要与大数据平台进行交互,需要调用大数据平台的各种服务来完成功能实现,总体上的难度并不算大,但是需要具有一定的行业经验。

当前大数据平台开发岗位的附加值还是比较高的,大数据平台开发岗位往往集中在大型互联网企业,随着云计算逐渐从IaaS向PaaS过渡,大数据平台开发也会基于行业特点来开发针对性比较强的PaaS平台,这是整合行业资源并搭建技术生态的一个关键。搭建PaaS平台不仅需要掌握大数据知识,同时还需要掌握云计算知识,实际上大数据和云计算本身就有比较紧密的联系,二者在技术体系结构上都是以分布式存储和分布式计算为基础,只不过关注点不同而已。

大数据运维工程师以搭建大数据平台为主,虽然这部分岗位的门槛相对比较低,但是需要学习的内容还是比较多的,而且内容也比较杂,网络知识、数据库管理知识、操作系统(Linux)知识、大数据平台(含开源和商用平台)知识都需要掌握一些,对于实践操作的要求会比较高。

最后,当前大数据工程师往往并不包含专业的数据分析岗位,一般数据分析岗位都会单独列出来,这部分岗位涉及到算法岗、开发岗(实现)和数据呈现岗等,数据分析岗位对于从业者的数学基础要求比较高,同时还需要掌握大量的数据分析工具,当然也离不开Python、Sql等知识。

关于大数据工程师日常工作内容有哪些,青藤小编就和您分享到这里了。如果您对大数据工程有浓厚的兴趣,希望这篇文章可以为您提供帮助。如果您还想了解更多关于数据分析师、大数据工程师的技巧及素材等内容,可以点击本站的其他文章进行学习。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
青松代表什么意思 ...正反面和本人照片能干什么? 注:本人照片不是手持身份证照片... 2024年建议买的5款指尖陀螺(建议收藏) 举起手来60词英语作文 ...年后的再一次发掘,引起国内外媒体的关注。病句... 油性皮肤选购粉饼时需要注意些什么? 油皮适合用什么粉饼? 十大油皮最好用粉饼 excel怎么删除重复数据Excel教你四招快速删除重复数据 奶酪的制作原理是什么? 大数据运维的主要工作内容是什么? 技师和中级工程师有什么区别吗?是一回事儿吗? “职称”和“工程师”有什么区别 数据库工程师 是什么?主要负责什么工作?企业对于这个职业都有哪些要求啊! 09年下半年软考软件设计师我考了44/55能过么 用两个月时间准备软考的软件设计师能通过么? 软考过了,就代表有该职称了吗 徐州哪里报名系统分析师 国家软考高级认证考试有什么要求 三亚的特色美食有哪些? 三亚的特色美食有哪些 三亚有哪些特产美食 2011年下半年软件设计师考试分数线是多少啊 今年上半年参加了软件设计师考试,今天查了成绩是上午45,下午49,这算过吗?45是不是分数线?压线算吗 全国计算机软考软件设计一般多少分可以进 软件设计师多少分能拿证 软件设计师 谁知道往年分数线一般都是多少?水平考试的 软件设计师考试成绩合格标准是多少 计算机等级证的有效年限有多长 GlobalSign Pdf 证书的有效期是多长? 运维的职业发展方向有哪些 学Java的,以后能找到IT相关的工作有那些。。 Java开发可以担任的职位有哪些? c语言的主要用途? C语言的用处在哪里? C语言的?:的用处 C语言中的&是什么意思啊?一般有什么用途? 浙江有什么特别的好吃的?在哪? 浙江杭州有什么特产呢 怎么样学习Java语言? 新手入门学习java语言 UI设计师需要具备什么能力呢? 优秀的UI设计师需要具备什么能力? 证券分析师成绩有效期是多久及是否需要参加培训 ISO9001认证证书到期之后怎么办 有HCNA证书可以直接考H3CSE吗 程序员或软件设计师及以上证书 iphone x摔了一下会影响到扬声器的音质吗? 今天不小心摔了iPhone x有没有事啊 iPhoneX不小心摔了一下之后就反应有点迟钝哪里出问题了?