2.1 业务理解
从商业的角度对业务部门的需求进行理解,包括商业背景分析、理解行业术语、业务成功标准、企业需求和设想等,对业务不了解,在模型选择上容易走弯路,而且容易陷入细节,虽然模型准确且合理,但业务用户觉得一文不值。
保险行业具有“避税”“避债”“可继承”的特点,成为高净值人士的青睐之选,特别是目前国内的投资机会较少,股市、楼市、实体经济等风险较高的情况下,保险业迎来蓬勃发展的春天,大量保险企业纷纷推出各种各样的人寿型、医疗型、投资理财型等,竞争激烈。
众所周知,由于保险业务各项条款细则较复杂,且出险认定以及赔付流程较长,传统保险采用代理人制度,即被保险人通过保险的代理销售人员购买保险,由代理人负责条款解释说明、订单确认和购买,以及出险的赔付等,受限于代理人的能力和业绩考核压力等,保险代理人并不能有效地向客户推荐其需要的险种,反而使客户对保险代理人和保险产生抵触心理,影响了企业的品牌信誉。因此,目前保险行业需要数据挖掘技术支持,通过对客户过往的保险购买记录分析客户特点,并以此为依据验证是否需要向其推荐其他险种,对于分析结果中某一客户购买概率较低的险种,则不再向其推荐,不仅减少了资源浪费,而且提高了投放精准性,促进保险公司的业务发展。
在商业中,最关键的是提炼问题,确定要解决什么问题,确定业务目标是战略问题,而选择和确认模型是战术问题。很多计算机专业的人才具有很好的解决问题能力,但缺少在大量数据集中寻找出问题、总结商业模式等能力,提出业务上要解决的问题和确认分析任务目标在数据分析过程中至关重要。目前,大部分业务目标主要是业务部门提出需求,但业务部门在面对海量数据时,只能提出一些在其技术认知范围内的直接问题,会有较大的局限,高层次的数据分析师不仅要熟知数据分析技术,还要了解商业及其他领域基础知识,能够帮助客户从数据中挖掘出新的商业模型或商业机会。
本例中,保险公司提供了以家庭为单位的历史保险投保记录,同时给出了家庭及其成员的各种属性统计结果,总共86个字段。保险公司目前正准备向客户推荐一款房车险,希望通过对这些保单记录和属性信息进行挖掘,分析哪一类客户倾向于购买此保险,并希望了解分析的过程和原因。以上目标比较简单、直接,就是要找出移动房车险客户的特征,然后依据这些特征在客户库中有选择性地进行营销活动,提高销售效率,减少运营成本。
获取某一类客户的特征后,就可以在后续的保险推广中应用相应规则,减少大量低效打扰客户的病毒式推广,这个业务目标在企业经营活动中具有很强的普遍意义,在其他行业中也有很多类似的情况。例如,酿酒企业想了解哪类客户更愿意购买新出品的一款红酒,或者车企想要知道推出某款新车的受欢迎程度等。