A. 实时获取来自不同数据源的海量数据,经过实时分析处理,获得有价值的信息 B. 流计算秉承一个基本理念,即数据的价值随着时间的流逝而降低 C. 对于一个流计算系统来说,它应该支持TB级甚至是PB级的数据规模 D. 流计算只需要保证较低的延迟时间,即只达到秒级别即可处理一切问题
A. 在传统的数据处理流程中,存储的数据是旧的 B. 在传统的数据处理流程中,需要用户主动发出查询来获取结果 C. 传统的数据处理流程,需要先采集数据并存储在关系数据库等数据管理系统中国 D. 流计算的处理流程一般包括三个阶段:数据实时采集、数据批量计算、实时查询服务
A. 数据实时采集 B. 数据批量采集 C. 数据实时计算 D. 实时查询服务
A. 支持各种编程语言:Storm支持使用各种编程语言来定义任务 B. 容错性:Storm需要人工进行故障节点的重启、任务的重新分配 C. 可扩展性:Storm的并行特性使其可以运行在分布式集群中 D. 免费、开源:Storm是一款开源框架,可以免费使用
A. Storm将Streams的状态转换过程抽象为Spout B. Storm认为每个Stream都有一个源头,并把这个源头抽象为Spout C. Storm将Spouts 和Bolts组成的网络抽象成Topology D. Topology里面的每个处理组件都包含处理逻辑,而组件之间的连接则表示数据流动的方向
A. Hadoop Job对应Storm Topology B. Hadoop TaskTracker对应Storm Supervisor C. Hadoop JobTracker对应Storm Spout D. Hadoop Reduce对应Storm Bolt
A. 从编程的灵活性来讲,Storm是比较理想的选择,它使用Apache Thrift,可以用任何编程语言来编写 B. Spark steaming可以实现毫秒级的流计算 C. Spark steaming无法实现毫秒级的流计算 D. 在Spark上可以统一部署Spark SQL,Spark Streaming、MLlib,GraphX等组件,提供便捷的一体化编程模型
A. Storm将流数据Stream描述成一个有限的Tuple序列 B. Storm保证每个消息都能完整处理 C. Storm认为每个Stream都有一个源头,并把这个源头抽象为Spout D. Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作