某企业需要一个能够从身份证号中分析得出所属省份的自定义函数,哪种自定义函数适用于这种场景?()
A. User Defined Spitted Function(用户自定义分组函数)
B. User Defined scalar Function(用户自定义标量函数)
C. User Defined Table valued Function(用户自定义表值函数)
D. User Defined Aggregation Function(用户自定义聚组函数)
查看答案
ODPS表T中某列C的数据类型为bigint需要修改为double以下哪种方式可以实现()
A. 将表T删掉重建
B. ALTER TABLE T COLUMIN C RENANE TO CDOUBLE;
C. ALTER TABLE T DROP COLUMN C: ALTERTABLE T ADD C DOUBLE;
D. ALTER TABLE T CHANGE COLUMINS CBIGINT
某企业的数据仓库运行在大数据计算服务(MaxCompute,原ODPS)上,开发人员在加工数据时发现用户表user中的用户标识字段userjd有部分脏数据,正确的格式应该是8位的字符串。可以使用SQL语句将脏数据过滤出来()
A. select from user where length(userid)-8
B. selet from user where length(useid)l=8
C. select from user where length(useid)<>8
D. select* from user where length(userd)<>8 or userid is null
传统的MapReduce模型要求每一轮MapReduce操作之后,数据必须落地到分布式文件系统上。而一般的MapReduce应用通常由多个MapReduce作业组成,每个作业结束之后需要写入磁盘接下去的Map任务很多情况下只是读一遍数据为后续的Shuffle阶段做准备,这样其实造成了冗余的0操作。为了解决这问题,提供更优的性能,大数据计算服务提供了扩展的MapReduce模型,该模型区别于普通ma
A. 支持Map后连接任意多个 Reduce操作,如Map-Reduce-Reduce
B. 支持Map后不连接 Reduce,而是连接另一个map,如Map-Map- Reduce
C. 支持 Chain mapper/ Reducer,即支持MapReduce-Map-Reduce
D. 支持没有Map,直接进入 Reduce
以下ODPSSQL哪个效率最高(见Join语句中where条件的位置)()
A. select*from(select.from a where dt=20140301)A left outer join B on
B. id=A. id
C. 没有区别
D. select* from a left outer join B on
E. id=A id and Adt=20140301
F. select* from A left outer join B on
G. id=A.id where A dt=20140301