A. ε-greedy策略是一种平衡“探索”和“开发”的方法 B. “开发”表示随机地采取某个动作,以便于尝试各种结果;“探索”表示采取当前认为最优的动作,以便于进一步优化评估当前认为最优的动作的值 C. 主体和环境之间交互的要素有状态、动作、回报 D. 在强化学习的过程中,学习率α越大,表示保持旧的学习结果的比例越大
A. 集电极、基极、发射极 B. 发射极、基极、集电极 C. 集电极、发射极、基极 D. 以上都不对
A. 发现和建立概念、范畴之间的各种关系 B. 表现资料中各个部分之间的有机关系 C. 根据范畴、概念之间的关系归纳为更高级的类属 D. 建立初步理论框架
A. 第一次是神圣同盟; B. 第二次是国际联盟; C. 第三次是联合国; D. 第四次是北约组织;
A. 见于脾湿未化,胃津已伤 B. 见于胃燥气伤,不能布津 C. 治宜淡渗利湿,清胃泄热 D. 治宜芳香宣化,清轻宣透