强化学习的框架是智能体()通过观察当前状态作出相应动作。
A. S
B. A
C. Agent
D. En对ironment
下面关于“囚徒博弈”说法正确的是()。
A. 若两人互相合作,则二人都同判监1年
B. 若两人互相背叛,则两人都判监8年
C. 若其中一人背叛对方,对方保持沉默,沉默者将判监10年
D. 以上都对
群体机器人在设计上的关键是()。
A. 法律与道德的约束
B. 伦理意识如何设计
C. 服从意识如何设计
D. 给定任务如何进行机制设计
蚂蚁寻找最短距离原理是会首先释放()吸引更多的蚂蚁。
A. 唾液
B. 尿液
C. 外激素
D. 雄激素