利用Apriori算法计算频繁项集可以有效降低计算频繁集的时间复杂度。在以下的购物篮中,假设支持度>=3为频繁项集,在候选2-项集中需要剪枝的是( )ID 项集1 面包、牛奶2 面包、尿布、啤酒、鸡蛋3 牛奶、尿布、啤酒、可乐4 面包、牛奶、尿布、啤酒5 面包、牛奶、尿布、可乐
A. 啤酒、尿布
B. 啤酒、面包
C. 面包、尿布
D. 啤酒、牛奶
查看答案
频繁模式增长FP-growth是一种比Aprior算法更高效的关联规则挖掘算法。
A. 对
B. 错
如果规则X-->Y-X不满足置信度阈值,则形如X'-->Y-X'的规则一定也不满足置信度阈值,其中X'是X的子集。
A. 对
B. 错
关于OLAP和OLTP的区别描述,不正确的是:
A. OLAP主要是关于如何理解聚集的大量不同的数据.它与OLTP应用程序不同.
B. 与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务.
C. OLAP的特点在于事务量大,但事务内容比较简单且重复率高.
D. OLAP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统
有关数据仓库的开发特点,不正确的描述是
A. 数据仓库开发要从数据出发
B. 数据仓库使用的需求在开发初期就要明确
C. 数据仓库的开发是一个不断循环的过程,是启发式的开发
D. 在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式