假设你经营一个电影帝国,想要建立一个基于协作过滤的电影推荐系统。有三个流行的评论网站(我们称之为A,B和C)用户去给电影打分,而你刚刚收购了这三家网站。您希望将这三家公司的数据集合并在一起,构建一个单一/统一的系统。在网站A上,用户对电影的排名是1到5星。在网站B上,用户的等级是1-10,而十进制值(例如,7.5)是允许的。在C网站上,评分从1到100。你也有足够的信息在一个网站上识别用户/电影,在不同的网站上使用用户/电影。下列哪些是不正确的?
A. 将这些网站的数据结合起来是不可能的。你必须建立三个独立的系统
B. 你可以没有任何修改就可以将所有三个训练集组合成一个,并可以期望从推荐系统中获得更高的性能
C. 你可以将三个数据集合并到一个数据集,但是应该先将每个数据集的评级规范化
D. 假设在一个数据库中至少有一个电影/用户没有出现在另一个数据库中,那么由于缺少数据,就没有可靠的方法来合并数据集
查看答案
关于评分预测和topn推荐,topn推荐更加适用于实际推荐场景
A. 对
B. 错
矩阵分解算法只需要用户id、商品id和评分就能建立一个推荐系统
A. 对
B. 错
Wide&Deep、DeepFM算法的结构类似
A. 对
B. 错
对于推荐系统来说,度量其效果的指标有很多,但是这些指标都不能直接的反映出用户的满意度。
A. 对
B. 错