User:Liuyifox/sandbox

数据剖析的过程即检测已存在数据源的可用数据（例如数据库或文件），并采集数据的描述统计量及信息. 统计量采集的目的在于：
 * 1) 找出已有数据是否可以容易地用于其他用途；
 * 2) 提高通过加标签搜索到这些数据的能力，加标签的途径为关键字、描述或将数据分类；
 * 3) 给出数据质量的度量，包括：数据是否和某些标准或模式一致；
 * 4) 评估在新应用上数据集成的风险，包括连接的问题；
 * 5) 评估元数据是否准确描述了数据源的实际数据值；
 * 6) 在数据密集型项目早期即了解数据风险，避免后期出现问题造成延期或超支；
 * 7) 从企业级观点审查数据，用于像主数据管理，或者像数据治理来提高数据质量.