强化学习的框架是智能体()通过观察当前状态作出相应动作。
A. S
B. A
C. Agent
D. En对ironment
查看答案
下面关于“囚徒博弈”说法正确的是()。
A. 若两人互相合作,则二人都同判监1年
B. 若两人互相背叛,则两人都判监8年
C. 若其中一人背叛对方,对方保持沉默,沉默者将判监10年
D. 以上都对
群体机器人在设计上的关键是()。
A. 法律与道德的约束
B. 伦理意识如何设计
C. 服从意识如何设计
D. 给定任务如何进行机制设计
蚂蚁寻找最短距离原理是会首先释放()吸引更多的蚂蚁。
A. 唾液
B. 尿液
C. 外激素
D. 雄激素
下面选项中()方面目前存在群体智能。
A. 低智生物
B. 高级生物
C. 人类社会
D. 多智能体