题目内容

小王正在使用ODP进行自然语言分析,他从门户网站上搜集了1000篇新闻报道,然后每篇存成一条纪录,然后基于这些纪录去做分词,即将每条纪录中的内容拆成很多独立的词语,保存到另一张表中,每个词语一条记录。小王对自定义函数比较熟悉,他想通过编写自定义函数实现分词功能。请帮小王做下选择,从功能角度来看,哪种自定义函数更适合处理这种场景?()

A. User Defined Scalar Function
B. User defined table valued function
C. User Defined Splitted Function
D. User Defined Aggregation Function

查看答案
更多问题

表A为ADS中的普通表,列a为其中一个普通列,类型为int以下SQL哪些是正确的()

A. Select a+ COUNT(*) FROM A
B. SELECT UDF_SYS_COUNT COLUMN(a)FROM A
C. SELECT SUM(COUNT(*)) FROM A
D. 以上都正确

大数据计算服务MaxCompute。原ODPS)中的日汇总采购表p是一张分区表每天会增加一个新的分区用于保存当天的汇总数据,按照设计只要保留最近30天的分区数据就足够了,过期的数据可以清除。为了清除过期的数据,以下哪种方式最为便捷?()

A. 创建一个 Crontab。每天删除过期数据
B. 利用ODPS的SDK开发一个小的应用定期删除过期数据
C. 创建表时指定 LIFECYCLE属性为30
D. 创建表时通过 Max patitio num指定最多只能保存30个分区

某银行在使用大数据计算服务(MaxCompute,原ODPS)进行数据分析,其中表dimbank是从ods_bank表中提取而来,当ods_bank表中的数据内容发生变更时,可以通过修正Edimbank表中的数据()

A. 使用 update语句
B. 使用 insert into语句
C. 使用 append into语句
D. 使用 insert overwrite语句

对于0DPS,下列描述正确的是?()

A. 在使用多路插入时,可对同--张表同时执行insert into 和Insert overwrite
B. 使用动态分区插入时,动态分区列必须在 select列表中
C. ODPS SQL支持 between子句
D. 对于分区表,可指定某个分区的 lifecycle,其中n为正整数,单位为天

答案查题题库