针对大型图(比如社交网络和网络图)的计算问题,哪些说法是正确的?
A. 为特定的图应用定制相应的分布式实现:通用性不好
B. 基于现有的分布式计算平台进行图计算:在性能和易用性方面往往无法达到最优
C. 使用单机的图算法库,但是,在可以解决的问题的规模方面具有很大的局限性
D. 使用已有的并行图计算系统,但是,对大规模分布式系统非常重要的一些方面(比如容错),无法提供较好的支持
查看答案
针对大型图的计算,目前通用的图计算软件主要哪些
A. 基于遍历算法的、实时的图数据库,如Neo4j、OrientDB、DEX和 Infinite Graph
B. 以图顶点为中心的、基于消息传递批处理的并行引擎,如GoldenOrb、Giraph、Pregel和Hama
C. 基于遍历算法的、实时的图数据库,如GoldenOrb、Giraph、Pregel和Hama
D. 以图顶点为中心的、基于消息传递批处理的并行引擎,如Neo4j、OrientDB、DEX和 Infinite Graph
在Pregel计算框架中,图的保存格式多种多样,具体包括哪些?
A. 文本文件
B. 关系数据库
C. 键值数据库
D. 语音文件
下列对于Pregel的执行过程,哪些是正确的?
A. 选择集群中的多台机器执行图计算任务,每台机器上运行用户程序的一个副本
B. Master把一个图分成多个分区,并把分区分配到多个Worker
C. Master会把用户输入划分成多个部分,通常是基于文件边界进行划分
D. Master向每个Worker发送指令,Worker收到指令后,开始运行一个超步
在一个Worker中,它所管辖的分区的状态信息是保存在内存中的,分区中的顶点的状态信息包括?
A. 顶点的当前值
B. 以该顶点为起点的出射边列表,每条出射边包含了目标顶点ID和边的值
C. 消息队列,包含了所有接收到的、发送给该顶点的消息
D. 标志位,用来标记顶点是否处于活跃状态