当前位置: 首页 > 问答 > 数据分析师 > 问答详情

数据分析系统架构包含内容涉及哪些?

07月23日 08:03563人阅读
赵老师 数据分析师

1、数据源

所有大数据架构都从源代码开始。这可以包含来源于数据库的数据、来自实时源(如物联网设备)的数据,及其从应用程序(如Windows日志)生成的静态文件。

2、实时消息接收

假如有实时源,则需要在架构中构建一种机制来摄入数据。

3、数据存储

公司需要存储将通过大数据架构处理的数据。一般而言,数据将存储在数据湖中,这是一个可以轻松扩展的大型非结构化数据库。

4、批处理和实时处理的组合

公司需要同时处理实时数据和静态数据,因而应在大数据架构中内置批量和实时处理的组合。这是由于能够应用批处理有效地处理大批量数据,而实时数据需要立刻处理才能够带来价值。批处理涉及到长期运转的作业,用于筛选、聚合和准备数据开展分析。

5、分析数据存储

准备好要分析的数据后,需要将它们放到一个位置,便于对整个数据集开展分析。分析数据储存的必要性在于,公司的全部数据都聚集在一个位置,因而其分析将是全面的,而且针对分析而非事务进行了优化。这可能采用基于云计算的数据仓库或关系数据库的形式,具体取决于公司的需求。

6、分析或报告工具

在摄入和处理各类数据源之后,公司需要包含一个分析数据的工具。一般而言,公司将使用BI(商业智能)工具来完成这项工作,而且或者需要数据科学家来探索数据。

职业技能申请领取
您的姓名
您的电话
意向课程
点击领取

环球青藤

官方QQ

扫描上方二维码或点击一键加群,免费领取大礼包,加群暗号:青藤。 一键加群

问答来自

赵老师 数据分析师
好评率85% 浏览563

相关问题

数据挖掘要解决的问题有哪些?
刘老师 数据分析师
数据挖掘的常用方法有哪些?
刘老师 数据分析师
什么是数据治理?
刘老师 数据分析师
课程咨询 学员服务 公众号

扫描关注微信公众号

APP

扫描下载APP

返回顶部