中国简单快捷的免费行业信息发布平台
·手机版 ·注册 ·登录 ·会员中心 ·忘了密码 ·导航 ·帮助
名站在线LOGO
·设 为 首 页
·收 藏 本 站
·新 站 登 录
网站首页
|
行业供求
|
行业产品
|
行业公司
|
站内检索
|
行业资讯
|
网站导航
|
链接交换
|
流量交换
|
网友收藏
您当前的位置: 首页 > 行业贴吧 > 话题


行业贴吧

(注意:网友的发布表不代表本站立场。)
回复话题
发新话题
返回列表
话题: 大数据常用处理框架
183.17.231.*
2020-12-22 13:39:53
  发展到今天,大数据处理主要分为两类大的需求,一是批处理,一是流处理。在企业的实际业务场景当中,可能会只需要批处理或者流处理,也可能同时需要批处理和流处理,这就使得搭建大数据系统平台的时候,需要根据具体场景来进行技术选型。



  大数据处理框架,通常可以分为三类——



  ①批处理框架:Apache Hadoop



  ②流处理框架:Apache Storm、Apache Samza



  ③批处理+流处理框架:Apache Spark、Apache Flink



  这里我们不对各个框架做更具体的讲解,而是先来理解这些不同处理模式背后的思想。



  1、批处理



  批处理是大数据处理当中的普遍需求,批处理主要操作大容量静态数据集,并在计算过程完成后返回结果。鉴于这样的处理模式,批处理有个明显的缺陷,就是面对大规模的数据,在计算处理的效率上,不尽如人意。



  目前来说,批处理在应对大量持久数据方面的表现极为出色,因此经常被用于对历史数据进行分析。



  2、流处理



  批处理之后出现的另一种普遍需求,就是流处理,针对实时进入系统的数据进行计算操作,处理结果立刻可用,并会随着新数据的抵达继续更新。



  在实时性上,流处理表现优异,但是流处理同一时间只能处理一条(真正的流处理)或很少量(微批处理,Micro-batch Processing)数据,不同记录间只维持*少量的状态,对硬件的要求也要更高。



  3、批处理+流处理



  在实际的应用当中,批处理和流处理同时存在的场景也很多,混合处理框架就旨在解决这类问题。提供一种数据处理的通用解决方案,不仅可以提供处理数据所需的方法,同时提供自己的集成项、库、工具,可满足图形分析、机器学习、交互式查询等多种场景。



  大数据常用处理框架.中琛魔方大数据分析平台(www.zcmorefun.com)表示大数据系统平台的搭建,往往需要在这些开源大数据处理框架当中进行选择,因此也就要求***们有相应程度的掌握。
共0个回复
回复话题
发新话题
返回列表



新站登录--网站简介--流量交换--名站收藏夹--广告服务--友情链接--免责声明--联系我们--意见建议--违法举报--侵权举报
Copyright 2005-2024 名站在线[fwol.cn]版权所有 经营许可证:粤ICP备17047754号