AI智能总结
在利用消费者数据进行预测死亡风险方面的应用 丹尼尔·格拉布迈克尔·尼默格 执行摘要 理解和预测死亡率风险是人寿保险中的一个关键任务,它对市场细分、承保、定价和在险管理具有潜在影响。本文报告了我们关于使用消费者数据预测死亡率风险的研究结果。 在本白皮书中,我们: □定义消费者数据,并提供其在保险行业应用中的例子 □提供关于数据类型和用途在不同人寿保险应用中的背景信息 □展示我们进行的一项研究的结果,旨在了解将消费者数据纳入预测死亡风险的模型中所产生的影响 □解释本研究所采用的方法论,以及支持关键决策的分析指导原则 最终,我们的研究得出结论,当单独使用时,添加消费者数据对死亡具有强预测性。当与其他数据类型(例如,医疗理赔、信用属性等)结合用于预测死亡风险时,它会产生增量预测价值。 消费者数据定义 “消费者数据”涵盖了消费者兴趣、观点、行为或文化的各种特征。消费者数据有时也被称作“消费者生活方式”或简称“生活方式”数据。由于多个数据供应商提供某种形式的消费者数据(各有其独特之处),因此在范围或内容上没有单一的、精确的定义。然而 ,此类数据通常包括: □生活方式偏好(媒体消费、习惯、兴趣、爱好等) □购买历史指标(房屋、汽车等) □个人财务属性(收入、抵押贷款规模、付款历史记录等) □人口统计详情(年龄、性别、婚姻状况、抚养人、邮编等) 这些数据过去一直被用来洞察个人的未来消费模式和社会行为。 消费者数据通过多种方式获取,包括国家层面和地方层面的调查、浏览器cookie和社交媒体追踪,以及交易(例如信用卡)历史记录。这通常还会补充人口普查数据。这些数据获取方法可以被任何个人消费者数据供应商使用,这意味着在给定数据集中,不同字段的数据粒度可能有所不同;某些字段可能以个人层面的粒度进行衡量,而其他字段则以家庭或邮政编码层面的粒度衡量。 由于消费者数据的范围很广,某些消费者数据字段与其他知名数据类型相似,例如“健康的社会决定因素”、“信用”和“健康”数据。尽管存在明显的共性,但不应将消费者数据与这些其他数据类型混淆,因为消费者数据特别关注消费者偏好,并且是在较细粒度的层面上捕获的。例如,一个信用档案可能包含数百个与信贷额度、账户余额等相关的属性,而消费者数据可能仅捕捉少数几个高级别的与信用相关的变量,例如未偿付的抵押贷款余额。 消费者数据已被用于许多消费品和服务的营销,包括保险。最近,精算师和数据科学家探索了超出保险营销的消费者数据用途 。此类用途包括针对健康和干预项目的目标外展,这些项目旨在帮助长期护理(LTC)保单持有人。1,2以及预测在管理保健 中的住院和急诊科利用率。3研究结果鼓励了对消费者数据其他可能用途的调查,并促使我们的研究。 数据用于死亡率预测的用途 多种数据类型和来源已被证明在各种人寿保险用例中预测死亡率有价值。一些值得注意的例子包括处方历史记录、医疗理赔、信用数据、MIB(曾被称为医疗信息局)以及机动车辆记录(MVR)。这些来源在捕获的元素方面差异很大,每个来源都对个人的死亡风险提供了见解。 处方和医疗数据可用于推断潜在的医疗状况,而这些状况反过来通常与死亡率有明确的因果关系。这些数据对人寿保险公司的作用是显而易见的。相比之下,信用数据最初旨在确定个人的信用价值。通常,信用数据会捕捉诸如信用使用率、还款及时性以及信用申请行为等信息。这些信息都与个人的死亡风险没有直接联系。然而,信用数据已被证明可以预测死亡率。 将此类数据应用于实践的主要方式是通过实施机器学习算法和预测模型。除了作为人寿保险基础的风险评估外,预测模型在营销 (即客户获取和保留)以及管理在册保单持有人方面也有成熟的应用。4这些模型使用上述数据类型的各种组合作为输入,以提供对感兴趣的某些结果的预测,例如死亡率或保单失效。 消费者数据(如前所述)由无法唯一链接到个人的信息组成,因此易出错,并且根据《公平信贷报告法》(FCRA)禁止其用于任何可能导致对个人采取不利行动的商业活动。因此,消费者数据不适合用于承保或定价。然而,鉴于人寿保险的性质,对死亡率的预测始终是关注的焦点。即使对于人寿保险公司寻求联系更有可能符合人寿保险产品资格的潜在客户的市场营销用例来说,这也是真实的。 研究 概述 为探索利用消费者数据预测死亡结果所能取得的潜在益处,我们考察了多个替代预测模型的预测性能指标。所研究的模型在用于训练每个模型的输入数据的组成上有所不同。正如我们将描述的,每个模型都是使用由生命保险行业在预测死亡风险时常用的数据的不同组合构成的输入数据进行训练的。包含和不包含消费者数据的模型作为评估消费者数据预测性能的基准。 数据集描述 我们分析的数据涵盖了2016年至2020年,包含约2100万条记录,其中有超过34.2万例观察到的死亡案例。除了年龄和性别外,我们还从处方、医疗和信用数据中提取了特征,作为输入到各种模型中。 1高娃,B.,克里斯查尼茨,C.,贝利纳,R.等.(2022年4月).适用于人寿保险的人工智能建模的潜在数据源.米利曼报告.2023年12月11日,从https://www.milliman.com/-/media/milliman/pdfs/2022-articles/4-22-22_lsc-data-science-report-ai-in-life-insurance.ashx. 2millimanlara™。长期护理健康计划:一项模拟试点项目。于2023年12月11日获取https://www.milliman.com/-/media/products/lara/12-10-21-milliman-lara_simulated-pilot-case-study.ashx. 3陈,S.&伯格曼,D.(2020年1月15日).基于社会经济发展决定因素使用应用机器学习预测医疗保健利用.美国管理护理杂志.2023年12月11日,从https://doi.org/10.37765/ajmc.2020.42142. 4Batty,M.等。(2010年4月).人寿保险预测建模.德勤咨询有限责任公司。2023年12月11日获取,自 https://www.soa.org/globalassets/assets/files/research/projects/research-pred-mod-life-batty.pdf. 在本节的其余部分,我们回顾了基本的描述性总结,这些总结提供了我们研究中使用的数据的构成背景,旨在为读者提供一些对一般模式的洞察,并识别我们研究数据集中的潜在局限性。 按数据源划分的基线死亡率和命中率 对于我们在研究中考虑的每个数据源,我们将“命中”定义为:当研究中的个体至少有一个对应于该数据源的非空特征时的情况。相反,当对于给定的个体无法从给定的数据源中找到任何数据时,我们将该个体称为“未命中”。数据源的正确率是在评估使用该数据源所达到的预测性能时需要考虑的重要因素。事实上,对于命中率有限的数据源,即使其预测性能很强,也会破坏利用该数据源实施模型所能获得的任何实际效益。 从图1中,我们看到由消费者数据定义的队列在我们数据集中所有数据类型中命中率最低,但它死亡率也最低。我们的相对死亡率计算使用2015年疾病控制与预防中心(CDC)死亡率表来获得预期死亡数。值得注意的是,虽然一些信用数据属性也表现为消费者数据,但信用数据的命中率显著高于其他任何类型。 图1:按数据来源划分的命中率和相对死亡率 %OFLIVES 相对死亡率 处方命中 77.7% 95.9% 未命中 22.3% 112.3% 医疗打击 76.9% 99.5% 未命中 23.1% 102.2% 信用受损 94.4% 96.3% 未命中 5.6% 163.1% 消费者受影响 72.1% 92.8% 未命中 27.9% 125.6% 按人口统计分组的数据覆盖率 从性别来看,如图2所示,我们的研究人群性别分布大致相当。男性消费者数据的命中率高於女性,但差异並不特別顯著。 女性51.60%70.80% 图2:按性别划分的命中率性别 %OFLIVESLS击中 男48.40%73.40% 在评估年龄时,请注意消费者数据仅适用于年满18周岁及以上的个人。此外,从图3可以看出,我们的研究人群比美国总人口更年长。由于我们的研究人群主要由人寿保险申请人组成,因此这种老年年龄段的人数过多并不令人意外。 图3:按年龄分组的命中率 年龄组 %OFLIVES LS击中 18–29 12.80% 52.60% 30–39 20.50% 68.00% 40–49 18.20% 71.90% 50–59 20.30% 75.50% 60–69 18.10% 80.00% 70+ 10.10% 84.10% 关于消费者数据,不同年龄段之间的命中率存在明显差异。这种差异可以通过注意消费者数据捕捉反映各种生活事件的属性来解释 ,而这些事件似乎会随着年龄增长而累积:购房、抚养子女数量等。消费者数据与年龄之间的关系表明,如果不谨慎使用数据,可能会混淆其相关的死亡风险。 消费者功能概述 为了了解如何通过消费者特征解释死亡率风险,我们回顾了死亡率与变量“投资风险承受能力”(IRT)之间关系的一个代表性例子 。IRT是对个人投资风险承受能力的预测,分为“高”(激进)、“中等”(较激进)和“低”(保守)三个等级。需要注意的是,这一预测是由提供我们数据的供应商生成的;我们没有直接了解其生成方法。此外,“未命中”表示该个体没有消费者数据,而“缺失值”表示该个体是消费者命中但在此变量上没有有效值。 不同IRT取值下,死亡率风险(以相对死亡率尺度衡量)的变化可见于绘制的红点相对于左轴的垂直位置。每个值的相对频率可以通过比较分布条的高度与右轴来确定。 看来更高的IRT往往与较低死亡率风险一致。此外,未命中类别的人往往具有最高的死亡率风险。IRT类别间的这种死亡率风险关系大致在不同年龄和性别组中成立;然而,按人口统计分组后,IRT类别中人口的分布确实有所不同(见附录)。我们将在后续的多变量模型分析中,通过控制人口统计变量来解决这种异质性。 图4:经验相对死亡率和投资风险承受能力分布 建模方法 我们的分析着重于评估消费者数据与其他数据类型的关系中的预测能力。为了获得关于消费者数据预测能力的有效理解,并与其他数据类型进行预测能力的直接比较,在各种处方、医疗、信用和消费者输入的组合上训练了多个梯度提升树模型。该分析分为两个部分:“单一数据源”模型的分析和“组合数据源”模型的分析。 单一数据源模型仅仅是基于处方、医疗、信用或消费者数据特征之一的模型,同时结合年龄和性别进行训练的模型。一个仅基于年龄和性别的控制模型被用作比较的基准。从单独分析基于每个数据源训练的模型开始,旨在建立所考虑的每个数据源的有效性。 组合数据源模型分析比较将消费者数据添加到一个已包含其他数据类型的模型中的预测性能。特别是,我们构建了一个使用处方和医疗输入数据的模型,以与一个使用处方、医疗和消费者数据的模型进行比较。同样,我们在有和没有消费者数据的情况下,对处方、医疗和信用数据进行了模型训练和比较。 使用一套通用的训练参数对所有上述各种输入数据组合进行训练,以避免偏袒任何单个模型。我们考虑的所有模型中使用的目标变量,仅仅是是否观察到死亡(即,一个二分类结果)。 最后,我们将数据分为75%训练、15%测试和10%预留,以获得有效的样本外模型绩效评估。 建模结果 在本节中,我们回顾了上节所述模型预测性能的评估,最终目的是更好地理解将消费者数据纳入死亡率预测模型的影响。 图5展示了对测试数据评估的几个性能指标。这些指标包括布里尔评分和斯皮格尔哈特Z校准统计量,以及接收者操作特征(ROC )曲线和精确率-召回率(PR)曲线下的面积(AUC)。布里尔评分是衡量模型性能的一般指标,它受到模型预测的区分能力和准确度(即校准)的影响。斯皮格尔哈特Z校准统计量的目