出于效率和成本的考虑,在使用ODPSMRI的时候,输入表最好应该只包含需要处理的字段,其余多余字段应该忽略。输入表wc_in包含10个字段,MR只对其中三个字段(c1,c2,c3)进行了处理,以下说法正确的是()
A. 使用包 com.alyun odps data中的 Tablelnfo类中的 setCols方法指定处理的列c1,c2,c3 from wc_in:同时调用MR的时候输入新表wc_in_new
B. MR的输入为一个SQL查询: select c1,c2,c3 from wc_in
C. 重建一张表 wc_in_new,只包含三个字段(c1,c2c3),加载数据: insert into table wc_in_new select c1,c2c3 from wc_jn;同时调用MR的时候
D. 建一个视图v_wc_ in,视图仅包括相应的三个字EX: create view v_wc_in select c1, c2, c3 from wc_in;然后把视图v.wc.in作为MR的输入
查看答案
ADS的数据导人job提交后,可以通过以下哪些方法查询当前的导入状态?()
A. 使用log命令:log
B. 使用命令: show status for
C. 使用SQL: select state from information_schema. Current_job where job_id
D. 使用DMS通过菜单项查看导入导出
AlphaGO自动驾驶等场景实现都使用了比较复杂的机器学习算法,这些算法的特点是:一个系统和外界环境不断地交互,获得外界反馈,然后决定自身的行为,达到长期目标的最优化。对这类算法的归类中,最怡当的一个是()
A. 增强学习(reinforcement learning)
B. 无监督学习(umsypervised larming)
C. 集成学习(ensemble learning)
D. 经典学习(cassio larring)
小王正在使用ODP进行自然语言分析,他从门户网站上搜集了1000篇新闻报道,然后每篇存成一条纪录,然后基于这些纪录去做分词,即将每条纪录中的内容拆成很多独立的词语,保存到另一张表中,每个词语一条记录。小王对自定义函数比较熟悉,他想通过编写自定义函数实现分词功能。请帮小王做下选择,从功能角度来看,哪种自定义函数更适合处理这种场景?()
A. User Defined Scalar Function
B. User defined table valued function
C. User Defined Splitted Function
D. User Defined Aggregation Function
表A为ADS中的普通表,列a为其中一个普通列,类型为int以下SQL哪些是正确的()
A. Select a+ COUNT(*) FROM A
B. SELECT UDF_SYS_COUNT COLUMN(a)FROM A
C. SELECT SUM(COUNT(*)) FROM A
D. 以上都正确