数据工程 数据工程是AI系统的基石,高质量的数据处理流水线直接决定模型的性能上限。 本章内容: 数据清洗与预处理 — 缺失值处理、异常检测、特征变换 数据增强 — 图像增强、文本增强、MixUp 表示空间对齐 — 跨模态对齐、域适应 数据版本管理 — DVC、数据血缘追踪 经典数据集 — 常用基准数据集介绍 评论 #