1、批处理
批处理是大数据处理傍边的遍及需求,批处理主要操作大容量静态数据集,并在核算进程完成后返回成果。鉴于这样的处理模式,批处理有个明显的缺点,便是面对大规模的数据,在核算处理的功率上,不尽如人意。
现在来说,批处理在应对很多持久数据方面的体现极为出色,因而经常被用于对历史数据进行剖析。
2、流处理
批处理之后呈现的另一种遍及需求,便是流处理,针对实时进入体系的数据进行核算操作,处理成果马上可用,并会跟着新数据的抵达继续更新。
在实时性上,流处理体现优异,但是流处理同一时间只能处理一条(真正的流处理)或很少数(微批处理,Micro-batch Processing)数据,不同记录间只维持最少数的状况,对硬件的要求也要更高。
3、批处理+流处理
在实践的使用傍边,批处理和流处理一起存在的场景也很多,混合处理框架就旨在处理这类问题。供给一种数据处理的通用处理方案,不仅可以供给处理数据所需的办法,一起供给自己的集成项、库、东西,可满足图形剖析、机器学习、交互式查询等多种场景。
声明:本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果用户发布的作品侵犯了您的权利,请联系管理员:wupeng@hqwx.com
环球青藤
官方QQ群扫描上方二维码或点击一键加群,免费领取大礼包,加群暗号:青藤。 一键加群