单项选择题
共用题干题在进行数据分析时,经常要分割训练集、测试集,并且还要考虑数据预处理、特征抽取、特征工程等,那么要仔细分析这些步骤之间的相互联系。关于训练集、测试集、数据预处理、特征工程,请回答以下问题
关于缺失值填充与训练集、测试集的关系,下面正确的操作是()
A.先用全数据的均值填充缺失值,然后随机分割训练集、测试集
B.先随机分割训练集、测试集,然后用各自集合的均值填充缺失值
C.先随机分割训练集、测试集,然后用训练集的均值填充缺失值
D.先随机分割训练集、测试集,然后用测试集的均值填充缺失值
点击查看答案&解析
相关考题
-
单项选择题
ROC曲线的y轴,实际上可以由每个阈值下混淆矩阵的()计算而来
A.A/(A+B)
B.A/(A+D)
C.B/(B+C)
D.C/(B+C) -
单项选择题
ROC曲线的x轴,实际上可以由每个阈值下混淆矩阵的()计算而来
A.C/(C+D)
B.D/(A+D)
C.B/(B+C)
D.C/(B+C) -
多项选择题
根据购物篮分析的目标,最有用的规则是那些具有高支持度、信度和升度的规则,除此之外,也需要参考Lift(升度),以下关于“Lift”说法正确的是()
A.用来度量一类商品相对于它的一般购买率,此时被购买的可能性大小
B.不能避免不平衡数据标签的偏差性
C.Lift越大,数据质量越大
D.如果lift=1,说明两个事项有正向关联
