A. 特征灵活 B. 速度快 C. 可以容纳较多的上下文信息 D. 能够做到全局最优
A. Dropout B. 正则化 C. early stop D. Batch Normalizaiton
A. 隐马尔可夫模型 B. 支持向量机 C. 朴素贝叶斯 D. 神经网络
A. 数据增强 B. 调整超参数 C. 使用预训练网络参数 D. 减少数据集
A. 梯度消失 B. 梯度爆炸 C. 激活单元死亡 D. 鞍点