数据分析: 处理数据有哪些步骤?

海外翻墙免费加速器[入口]

数据处理是指对收集到的数据进行加工,将其转化为适合数据分析形式的过程。这就要求数据分析师能够从大量杂乱无章的数据中,抽取出有实际价值的数据。数据处理的方法包括数据筛选、数据转化、数据计算等。如下图所示

1.数据筛选
数据筛选就是对数据进行一个初步的判断,将一些无用的数据剔除。例如,收集手机的信息:价格为2999元,手机后盖颜色为白色,手机很漂亮,很多人买了该手机。这些信息中“很多人买了该手机”就属于无用信息,可以删除。

2.数据转化
数据转化是指将一些不容易分析的数据转化成容易分析的数据。比如,1台A电脑价值5823元,比同类型的B电脑价格高出954元。这些数据就可以转化成:A电脑比B电脑的价格高出近20%。
3.数据计算
数据计算是指在对数据进行处理的过程中将一些复杂的数据处理成较为简单的表述形式,例如上面提到的A电脑与B电脑的价格对比,就是采用了数据计算的方法。
从以上的方法中我们可以看出,数据处理并不是一项简单的工作,它在整个数据分析的过程中所占的时间比例较大,甚至在一定程度上影响着后续步骤的质量。

未经允许不得转载:陈海飞博客 » 数据分析: 处理数据有哪些步骤?

分享到:更多 ()

海外翻墙免费加速器[入口]