题目
为什么需要进行数据清洗 A. 提高数据质量B. 增加数据多样性C. 增加模型训练的效率D. 降低模型的训练成本
为什么需要进行数据清洗
- A. 提高数据质量
- B. 增加数据多样性
- C. 增加模型训练的效率
- D. 降低模型的训练成本
题目解答
答案
A
解析
数据清洗是数据预处理的重要步骤,其核心目的是确保数据的准确性和一致性。题目考查对数据清洗作用的理解,需明确其直接目标。选项中,提高数据质量(A)直接对应数据清洗的核心功能,而其他选项如增加多样性、效率或降低成本均为间接或非主要作用。
选项分析
A. 提高数据质量
数据清洗通过处理重复数据、缺失值、格式错误、异常值等问题,显著提升数据的准确性、完整性、一致性,这是数据质量的核心要素。
B. 增加数据多样性
数据多样性指数据覆盖不同场景,但数据清洗可能因剔除异常值而减少多样性,且清洗本身不直接关联多样性目标。
C. 增加模型训练的效率
清洗后的数据可能间接加快训练,但效率提升主要依赖算法优化或硬件升级,而非清洗本身。
D. 降低模型的训练成本
清洗过程可能增加前期成本,而干净数据的间接成本节约并非主要目的。