脏数据可被研究吗?

Posted by ZYT on February 17, 2019

背景

当今时代,DATA 是一个非常重要的概念。坐在金融大厦的人每天在想,是否能够根据股票的 K线图 发现下一次的发财机会;每个互联网大公司都在拼命收集用户的个人信息,好从中发现新的商机。因为利益的驱动,DATA 在这个时代大行其道,并且随着互联网的影响,信息爆炸式增长,并在这个时代创造出一个新的名词 BIG DATA。数据已经成为这个时代成长的基石。

脏数据可被研究吗?

在信息充斥的今天,其中的数据一定准确吗?不一定,因为:

  • 记录人员可能误记
  • 可能存在刻意数据造假

在历史学界中将最真实的历史称为第一历史,而将历史书上的记载称为第二历史。历史研究只能以正史为主进行研究,虽然在细节上会有出入,但是大的历史走向是没有问题的。

所以,同历史学,所有的数据我们只能当做“第二历史”进行研究,虽然里面充斥着脏数据,但是数据记载的大的走向是没有问题的,仍然具备研究的意义。