以下关于MNIST数据集说法正确的是( )。
A. t10k-images.idx3-ubyte文件是存储10000张训练数据图片的。
B. 手写数字图片的尺寸为28*28。
C. t10k-labels.idx1-ubyte文件是存储10000张测试数据标签的。
D. “.idx3-ubyte”、“.idx1-ubyt”是为了存储向量和多维矩阵而设计的。
语音信号处理是一门多学科的综合技术,包括:
A. 生理、心理、语言以及声学
B. 信息论、控制论、系统论
C. 信号处理、统计分析、模式识别
D. 图像处理、计算机视觉
下列属于语音识别端到端模型的有:
A. GMM-HMM
B. Transducer
C. RNN-HMM
D. Attention
关于MS-COCO数据集,以下说法正确的是:
A. MS-COCO数据集中包含80种常见的物体类别
B. 有250万个标签示例和328000张图像
C. 用于图像识别,分割
D. MS-COCO的标注格式是xml