语音信号处理是一门多学科的综合技术,包括:
A. 生理、心理、语言以及声学
B. 信息论、控制论、系统论
C. 信号处理、统计分析、模式识别
D. 图像处理、计算机视觉
下列属于语音识别端到端模型的有:
A. GMM-HMM
B. Transducer
C. RNN-HMM
D. Attention
关于MS-COCO数据集,以下说法正确的是:
A. MS-COCO数据集中包含80种常见的物体类别
B. 有250万个标签示例和328000张图像
C. 用于图像识别,分割
D. MS-COCO的标注格式是xml
MNIST数据集是由Google实验室和纽约大学YannLeCun合作建立的手写数字数据库,以下说法正确的是:
A. 是单色的图像
B. 每张图像的大小为28*28
C. 数据集中共有60000张图像与标注
D. 其中测试数据50000张,训练数据10000张