欢迎来到在线考试题库网 在线考试题库官网
logo
全部科目 > CDA数据分析师 > CDA LEVEL 3数据分析专家

单项选择题

我们有一个来自于大众点评的数据,数据集保存了用户对商家的点评数据,每个商家都有一个点评数量,假设我们的任务是使用协同过滤方法预测某用户给某商家的打分,点评数量会是一个非常有用的特征,因为人气和高评分之间有很强的相关性。现在我们将点评数量的分布绘制出来,如图所示,根据点评数量数据分布,需要对数据进行离散化,请问该数据需要离散化的原因是()

    A.数据过于集中在较小的部分
    B.数据存在明显的离群值
    C.数据不符合正态分布
    D.数据的分布不连续

点击查看答案

相关考题

  • 多项选择题
    下列关于决策树分类算法的说正确的是()

    A.树长的太高容易过拟合
    B.树长的太高容易欠拟合
    C.可以通过剪枝限制过拟合
    D.可解释性强

  • 多项选择题
    决策树归纳算法重要特点有()

    A.决策树归纳是一种构建分类模型的非参数方法
    B.已开发的构建决策树技术不需要昂贵的计算代价,即使训练集非常大,也可以快速建立模型
    C.决策树相对容易解释,特别是小型的决策树
    D.冗余属性不会对决策树的准确率造成太大的影响

  • 多项选择题
    下列对C4.5算法的描述正确的是()

    A.每个节点的分支度只能为2
    B.使用gain ratio作为节点分割的依据
    C.可以处理数值型态的字段
    D.可以处理空值的字段

微信小程序免费搜题
微信扫一扫,加关注免费搜题

微信扫一扫,加关注免费搜题