题目
在数据预处理阶段,“数据规范”的主要目的是什么? A. 删除重复数据B. 转换数据格式C. 统一数据尺度D. 扩充数据集
在数据预处理阶段,“数据规范”的主要目的是什么?
- A. 删除重复数据
- B. 转换数据格式
- C. 统一数据尺度
- D. 扩充数据集
题目解答
答案
C
解析
数据规范是数据预处理中的关键步骤,其核心目的是统一数据的尺度或分布,确保不同特征在模型训练过程中具有可比性。
- 关键概念:数据规范通常包括标准化(Standardization)和归一化(Normalization),通过缩放使数据符合特定范围或分布,避免特征量纲差异对模型性能的影响。
- 区分易混淆选项:
- 删除重复数据属于数据清洗;
- 转换数据格式属于数据转换;
- 扩充数据集属于数据增强或采样方法。
数据规范的主要目标是解决数据量纲不一致的问题。例如,若一个特征范围是0-100,另一个是0-1000,直接输入模型会导致训练困难。通过规范处理(如归一化到0-1或标准化为均值0、方差1),可消除量纲差异,提升模型效果。
- 选项分析:
- A. 删除重复数据:属于数据清洗,目的是提高数据质量。
- B. 转换数据格式:属于数据转换,如日期格式统一或类别编码。
- C. 统一数据尺度:正确,通过缩放消除量纲差异。
- D. 扩充数据集:属于数据增强,如过采样或生成新样本。