保险欺诈的测量研究

目前国际上对保险欺诈的定量研究主要有保险欺诈的测量(fraud measurement)、保险欺诈的识别(fraud detection)和保险欺诈的防范(fraud deterrence)。保险欺诈的测量是要衡量保险市场上的欺诈情况,而保险欺诈的识别和防范则是保险公司对待索赔欺诈的两种对策研究,前者主要是基于对索赔数据的统计分析产生能够有效识别欺诈索赔的应用策略;相应后者主要是保险契约的理论研究或者是保险公司资源重新配置(resource relocation)问题,以及对最优审核策略的性质进行预测以制止索赔欺诈的发生。 保险欺诈的测量主要是计算保险市场上存在欺诈索赔的百分比,以此来反映该市场上欺诈情况是否恶劣。这个比例与当地的自然状况、社会背景等因素有直接联系。关于欺诈测量的专业性研究,Derrig指出进行欺诈的测量首先应该有有效的欺诈定义,即所要测量的欺诈范围或类型。至于所用的测量方法也不尽相同,利用计数估计法问count data estimator)得到加拿大魁北克省(Quebec)1994年车险欺诈率为9.5%,保险人能发现的欺诈的比例仅为1/3,说明保险人没有有效识别欺诈案例;对保险欺诈的测量作了改进,作者利用logistic模型的确定项(解释变量)中加入一个遗漏错误因子(omission errors factor)得出西班牙 1993年—1996年的车险中大约至少有5%的合法索赔中含有欺诈成分未被发现。

分析保险欺诈的一个主要问题是缺乏关于欺诈方式和范围领域的系统性信息。索赔人不会向保险人说出他们是如何向保险公司成功骗保的,而保险人也不愿意在反欺诈这方面示弱甚至也不想和同行分享更多的反欺诈信息,因为这样可以显示他们自己的信息优势。这样的状态给测量欺诈索赔的发生频率和评估欺诈损失额带来很多困难。因此这方面的研究还有待发展以便能够更好地评估各种反欺诈技术方法的效用。 欺诈的识别问题事实上即是索赔分类问题,因为可以将索赔进行最简单的分类:欺诈索赔和合法索赔,寻找一种有效的索赔分类机制对保险人员来说是识别保险欺诈最根本的方法。这一数据分析过程可以分成以下几步进行:

⑴数据的搜集

在用统计分析技术之前保险公司的首要问题是搜集欺诈数据,数据的信息包括所发生的保险事故(涉及到的司机、车辆、时间、地点、证人、警察报告等信息)、索赔人(性别、年龄、失业情况和索赔的历史记录等)、索赔信息、受伤情况和医疗情况。没有数据以下这些过程可以说无从谈起。

⑵选择欺诈指示因子(fraud indicators也称为red flags)

欺诈指示因子是指能够刻画欺诈特征的一些可测信息点,在分类模型中充当解释变量。例如,从美国马萨诸塞州的个人伤害防护险(personal injury protection,简称PIP)的大量欺诈特征中筛选出10个统计上比较显著的识别点(见表1)。不同的保险环境不同的险种会有不同的欺诈指示因子,要将统计降维技术(如逐步回归、PRIDIT等方法)和专家意见相结合确定有效的欺诈指示因子,另外还要注意成本和信息得到的时差性。

⑶利用统计方法建立模型

有了上两步作基础,接下来建模分析过程有以下几步:

i.将索赔数据进行聚类,以保证同质性,需要使用五指导性分类工具(unsupervised method),当所给的样本没有分类时这一步很适合。

ii.专家的评估。有经验的专家对索赔数据分为欺诈和合法两种。这里存在的问题是主观性比较大而且专家之间的观点还可能相悖,但优点是建模过程吸取了专家意见和历史经验。

iii.有了分类样本即可通过指导性工具在类别和欺诈指示因子之间建立分类模型,最佳的分类模型除了考虑模型的预测能力外建模的成本和模型的可实现性也是必须要想到的。

iv.对结果的监测。模型的稳定性检验:要检验模型预测的结果与i和ii的结果在一个或多个样本上是否一致;模型的动态性检验:模型的实时调整以使模型的识别能力实时达到最优。

事实上,所有能够识别奇异点(outlier)的统计方法都可用来识别欺诈数据用到上述建模中。如数据挖掘、模糊集聚类、简单的回归模型。logistic回归模型、probit模型、PRIDIT主成分分析、多元神经网络方法以及思想与上述建模过程类似的电子欺诈识别技术(Electronic fraud de tection简称EFD)等。这些方法在索赔分类中的理论构架是一致的,如图2所示。

最后,由欺诈识别系统而挽回的索赔额和发现的欺诈索赔数目是度量该系统的基本测度,而对观测到的欺诈索赔进一步的统计分析可以提供保险市场欺诈的比例和存在的欺诈类型。但是完全自动的欺诈识别模型是不存在的,我们需要不断更新欺诈指示变量、随机审核和连续性的跟踪监测来保持欺诈识别系统的持续有效性。 然而,国内在保险欺诈的研究仅限于定性描述,基本集中在保险欺诈的特征表现、成因和防范对策三个方面。如文章总结出国内保险欺诈的主要表现:

①制造假象,将无端“损失”转化成保险损失

②超额保险

③重复保险

④伪造或夸大损失

⑤伪造投保和出险时间 产生保险欺诈的原因也很多,例如社会对保险欺诈的普遍容忍,投保方缺乏诚信,保险企业内部经营管理制度存在问题以及保险法律法规体系不完善等等。针对原因,学者们也提出种种防范对策,诸如提到的社会性防范:引导消费者对保险欺诈危害性进行正确认识、成立全国性的专门反保险欺诈机构、加强反保险欺诈的法制建设和执法力度,而对企业内部需要转变经营模式重视保险风险的防范、加强同业合作全面打击保险欺诈、健全保险企业的经营管理制度和内部监控管理机制、完善保险条款剔除欺诈责任。近来通过借鉴国外先进的反欺诈技术有学者提出更为具体的防范措施。

中国防范保险欺诈加强诚信建设的建议

国内保险领域的学者对保险欺诈所作的定性分析以及各种防范方法为国内保险企业的反欺诈行动明确了宏观方向,对于保险诚信建设很有意义。然而,我们应该看到现今是一个让数据说话的时代,从数据中挖掘出的信息会为保险业的决策提供重要的帮助,正如挪威著名保险学家卡尔?H.博尔奇指出:“一般来说,过去的赔款记录对于预测未来几年的赔款支出具有重要作用。而且,不同的保险人之间对于这些预测有着高度的一致性。”由此可见保险历史数据对未来预测和启示作用是至关重要的。因此我们认为中国要在保险欺诈研究领域有显著的成果出现还需注意以下几点:

保险公司应该对欺诈案例进行认真分析,从中提取有用的欺诈标识字段建立保险欺诈案例数据库。这些数据信息应该为所有保险公司***享。

保险公司应该增加具备反欺诈研究分析的人才,这些人员要具备人力资源、数据挖掘技术、保险外部顾问、统计分析技术和监测系统等方面的知识和能力,能够利用计算机软件、预设变量、统计学、数学分析技术和地理数据绘图等方法建立自动识别模型以在保险公司制定赔偿决策和反欺诈方面发挥作用。

从社会角度讲应该建立学术界和保险实务界的沟通渠道,做到产、学、研相结合。卡尔? H.博尔奇在《保险经济学》中说到:“由于保险统计资料的缺乏,保险学研究中无法发挥金融学中常见到的理论和实证研究相得益彰的相互促进作用。”保险数据信息的匮乏是导致中国保险欺诈研究比较薄弱的原因之一。(金融与保险)