大数据时代将重新改写人们对数据的认识,甚至是数据自身。因为,即使一个“数据”本身,它也是多维的,也还可以分拆,在分拆的过程中,会造就无限的商机。从信息到数据,从数据到数据颗粒,这一系列的变化,是科技发展的必然,也是社会变革的驱动力,同时,也将对保险理论和技术形成绝对挑战。
从“抽样”到“全量”
传统统计学研究的一个重要基础是抽样调查,通过抽样调查得到一定的样本数据,并以此作为分析的基础。但抽样调查存在两大限制和缺陷。一是视角,做问卷调查,需要设计调查问卷,而问卷设计本身,是带有主观色彩的,即先设定哪些领域会存在哪些问题,并据此设计出相应的问卷问题,这实际上是由过去的知识体系决定的。
然而,过去的知识体系并一定不代表着调查对象的客观和全貌,所以,抽样调查的样本本身就可能存在一定的局限性。二是样本量,在抽样调查过程中,样本量总是有限的。如果样本总量是有限的,从对象的角度看,其随机性和代表性都值得商榷。比如,街头的问卷调查,就受到一定的局限,一定是有些群体懒得搭理你,而有些群体就很喜欢跟你聊。这就意味着受调查的基本上是相对有闲的人,或比较热心公益的人,所以,调查结果至少没有代表那些拒绝的人。
另外,在市场化环境下,抽样调查也受到人们质疑,特别是在委托调查公司做抽样调查时,它的报价主要依据是调查的样本量,不少调查公司从竞争和成本的角度出发,最终只能在实际样本上“做文章”。所以,从抽样调查的样本量看,也存在一定的限制条件。
大数据时代带来的重要变化主要有两个:一是“数字社会主义”,另一是“数位人生”,即整个社会都被数字化了,每个人也被数字化了。全面数字化的信息和无处不在的感应终端,将彻底改变传统数据获取的可能性和效率。
更重要的是信息的数据化是与生俱来,这种数字化趋势将会产生两个结果:一个是这种数据(信息)很客观,第二它是全量数字,这大大降低人为和主观的干预因素,为计量科学创造一个无限的想象空间和实现的可能性,也将彻底改变统计的存在和实现方式。最典型的应用将出现在人口普查领域,以前做一次人口普查非常不易,人力资源投入大,周期长,且成本高。