大数据虽然拥有海量信息,但是真正可用的数据只有很小一部分,从海量的数据中挑出一小部分数据本身就工作量巨大,更重要的是需要从看似毫无规律的数据背后挖掘、分析客户的偏好,找出突破点。互联网的快速发展提供了丰富的多层次数据,但网络用户行为数据也具有价值密度差异,拥有高数据价值密度的企业往往更具有核心竞争力。阿里巴巴掌握了全国上亿网民实名制的历史交易记录;“挖财”这样的理财软件用“免费”的噱头积累大量用户的理财数据;像雪球、知乎这样的高质量UGC社区,最大的资本就在于这些高价值密度的内容所拥有的巨大可能性。
当把焦点放在一组数据“能产生什么价值”上时,往往会忽略其生产过程,因为很多数据是经历了加工才产生这个价值的,这个过程是一个定量分类和管理的过程,也是一个标准化的过程。可按以下标准识别数据的价值,并对其进行分类:①按照是否可以再生,分为不可再生数据和可再生数据;②按照数据所处的存储层次,可分为基础层、中间层和应用层;③按照数据业务归属,可分为各个数据主体;④按照是否隐私,可分为隐私数据和非隐私数据。