题目内容

在自动驾驶中,AI需要不断地通过路面信息来调整开车的决策,这种处理模式适合用()来训练出合理的策略。

查看答案
更多问题

在强化学习中,主体和环境之间交互的要素有()。
A状态
B动作
C回报

人工智能学习玩Flappy Bird过程中,只需要人类告诉AI不能碰到水管即可,不需要提供其他信息。()
参考答案:错误

状态动作函数直接决定主体该采取什么决策。()
参考答案:错误

党的先进性是:()

A. 具体的历史的
B. 一成不变的
C. 抽象的路和中国特色社会主义理论体系。在当代中国,中国特色社会主义道路是时代发展进步的唯一正确道路。坚持中国特色
D. 随时间推移变化的

答案查题题库