数据变迁将引发保险变革
向日葵保险网
[导读]:面向未来,保险业需要就大数据时代的“数据变迁”做一个全新的思考。大数法则决定了保险业的“数据宿命”,保险是一个与数据休戚相关的行业。
但大数据时代,很多调查和统计分析方式将发生质的变化,都将彻底改变人口普查的方法,继而改变管理模式。再比如,我国每年大约有70亿人次门诊量,现在这些门诊信息均逐步地被数字化了,这意味着将彻底改变医疗诊断、流行病管理、药理学、健康管理等领域,也将彻底改变统计和精算的基础。可以预见,从抽样数据到全量数据,将引发统计、精算,乃至整个社会管理的巨大变化。
从结构到非结构
数据主要分为两类:一是结构数据,二是非结构数据,还有一种叫半结构数据。从处理的角度看,结构数据相对简单,目前对于结构数据处理的技术相对成熟。另一种是非结构数据,如音频、视频、图像等。长期以来,在整个社会的数据中结构数据的占比达到95%以上,非结构数据非常少。但近年来,特别是面向未来,非结构数据将呈现井喷式的发展,占比将大幅度并急剧提升。但是,带来的问题是未来需要我们更多地管理和处理非结构数据,既是一个挑战,更是一个商机。
如在理赔过程中,未来图像比对技术将成为理赔的一项技术,在查勘时,可以通过拍照,甚至是做一个三维图像,与原厂配件的数据做一个比对,就知道受损的面积多大,大概修复费用是多少。同时,图像比对技术还会在更大的范围进行应用,如用声音波纹比对、瞳孔比对,耳朵比对等等,进行被保险人的身份识别等,在保险领域具有非常广泛的应用前景。这些均属于非结构数据的管理和处理能力范畴。所以,非结构数据的管理和处理能力将成为未来保险业创新主要动力,行业需要高度关注。
从质量到数量、维度
过去是一个数据有限时代,能够获取数据的数量是有限的,维度就更少。在数据有限时代,人们更多地关注数据质量问题,保险公司很重要的一项工作就是抓数据质量,而数据质量一直是挺纠结的问题,原因是数据质量问题是说的容易,做起来非常难。但面向未来,在数据化、物联网、感应终端大量应用的情况下,数据将呈现“指数级”增长的趋势,数据在量上会极大的丰富,从而出现一个现象,即数据的自验证能力。
当数据量大到足够产生自验证能力时,就会降低对数据质量的要求。我们可以在日常生活中找到这样的例子,当描述一个对象“点”的数量足够大的时,尽管单个点不是那么清晰,但从大的轮廓和面上看,对象是清晰的。
除了数据的“量”和“质”的关系外,还要看到一个问题,无处不在的感应终端能够使数据的维度极大地丰富,从而使得对于对象的描述更加多维并丰满。原来更多是从一个维度去看,从一个平面去看的问题。当数据的维度不断丰富的时候,就可以从N个维度去观察对象,不仅看到正面,还可以看到背面和侧面等,且还可以实时地观察。
这使得很多在传统数据环境下,原本不可能的实现的“对象刻画”成为可能。数据的实时获取、数据维度的丰富。而且是实时丰富,将给数据利用和创新带来巨大的想象空间。但与此同时,也会带来数据的“超高维”问题,挑战传统统计学的基础。
在数据从质量到数量,到维度的时代,保险将面临从原来利用大数法则做归因分析的思维模式,向未来利用多维定律进行关系分析的思维模式,从几何学的角度看,就是通过多点进行定位的方法。从风险分析的角度看,以往更多的是用一种纵向的思维去看风险,如一个人,是通过对他家族史的风险分析,据此来判断他的性格以及各种各样风险因素,但直观地看,这个方法是很不科学的。