判断题 影响房价的众多因素中,房屋的面积属于离散型的数据特征。(1.0 分)
A. True
B. False
判断题 连续型数据进行离散化时,可按区间对数据进行划分。(3分)
True
B. False
判断题 构建房价趋势分析模型不需要特征工程,不需要提取重要特征。(3分)
true
false
判断题 为了更好地使用数据,有时候我们需要将连续的数据进行离散化。(3分)
true
false
判断题 特征工程是构建房价趋势分析模型的重要流程之一。(3分)
true
false
单选题 在决策树结构中,第一个起始点被称为?(4分)
根节点
父节点
子节点
叶子节点
单选题 房价趋势分析模型中,如果房子本身没有砌体贴面,导致MasVnrArea砌体饰面面积(数值型)数据中存在缺失值,应使用什么值进行填充?(4分)
0
中值
众值
平均值
单选题 拟合优度可以描述拟合效果的好坏,拟合优度的值越接近以下哪个值,拟合的效果越好?(4分)
-1
0
1
-1或1
单选题 房价趋势分析实验属于以下哪个机器学习任务?(4分)
回归
分类
聚类
降维
单选题 相关系数的大小可以描述两个变量的相关强度,相关系数的大小范围是:(4分)
(-∞, +∞)
(-∞, 0)
[-1, 1]
[0, +∞)
单选题 下列哪个不属于房价数据清洗的原因?(4分)
手工处理数据低效
结论错误
用于模型评估
数据失真
单选题 使用封顶方法处理异常值中,异常值的范围是:(4分)
超过5%或者95%
超过10%或者90%
超过15%或者85%
超过20%或者80%
单选题 采用五折交叉验证时,得到五个验证值,怎样选取最终验证值?(4分)
取五个值中的最大值
取五个值中的最小值
取五个值中的中位数
取五个值中的平均值
单选题 以下可以作为回归实验评价指标的是:(4分)
F值
RMSE
AUC值
精确率
单选题 房价趋势分析实验中,我们机器学习环境的搭建需要华为云哪个服务?(4分)
弹性云服务器
对象存储服务器
虚拟私有云
云数据库
多选题 在树结构中,一个子节点的上一层节点可能会是?(5分)
根节点
父节点
子节点
叶子节点
多选题 GBDT算法可以实现以下哪些任务?(5分)
回归
分类
聚类
降维
多选题 下列对于房价数据中类别型数据和数值型数据描述正确的是:(5分)
类别型数据是离散型数据
类别型数据是连续型数据
数值型数据是离散型数据
数值型数据是连续型数据
多选题 对于连续型数据属于统计缺失时,一般可使用哪些值进行填充?(5分)
最大值
最小值
均值
中位数
多选题 当决策树按照信息增益进行分裂时,下列说法正确的是:(5分)
信息增益越小,分裂后的复杂度减少得越多
信息增益越大,分裂后的复杂度减少得越少
信息增益越小,分裂后的复杂度减少得越少
信息增益越大,分裂后的复杂度减少得越多
多选题 在我们实际使用数据时,数据中往往存在缺失值,下列中属于造成数据缺失的原因的是:(5分)
信息暂时无法获取
信息被遗漏
获取这些信息的代价太大
系统实时性能要求较高
多选题 在房价趋势分析实验中,以下属于房价趋势分析实验流程的是?(5分)
数据预处理
提取构建重要特征
构建回归算法模型
对构建的模型进行评估优化
多选题 关于Anaconda软件的优点,下列描述正确的是:(5分)
人性化
简洁
高效
功能强大
多选题 房价趋势分析模型中,该怎样通过相关系数分析和方差分析选取来选取重要特征?(5分)
选取相关系数较大值对应的特征
选取相关系数较小值对应的特征
选取方差分析求得p值较大对应的特征
选取方差分析求得p值较小对应的特征