易明建模实践 - 用历史数据提高营销成功率
1. 准备历史数据。
在营销场景中,要预测的目标是客户的购买行为,需要搜集一些可能会影响购买行为的信息字段,比如客户的年龄、学历、工作、收入、家庭结构、生活习惯、购物偏好,以及产品的特点、促销力度等信息,收集到的相关信息越多,预测效果也会越好。
另外,我们还可以根据业务特点,分地区、分客群进行预测,比如北京地区的房价和广东城市的房价完全不一样。再比如,汽车的销售,男性客户通常会关注性能,女性客户则更关注外观,还有高端客户和中低端客户的需求特点也会大相径庭。很多时候区分客户群体的分析预测,要比全体直接预测效果要更好,更有针对性。
如果是分地区、分客群的预测,那么对应的宽表也要多准备几套,比如分 3 个客群,宽表就要对应准备 3 套。
2. 建立模型。
宽表准备好后,导入易明软件,自动建模。如果有多个客群,就建立多个模型。
3. 预测客户购买清单。
建好模型后执行预测,得到预测结果。然后按照预测的概率结果从高到低排序,排在前面的顾客营销成功率更高。
4. 学会用 lift 曲线。
营销场景中,除了用 AUC 指标来看准确率之外,还有一个很实用的评估方法,就是 Lift 曲线。Lift 表示提升指数,它表示使用和不使用预测模型获得的结果之间的比率。如下图所示,横坐标表示将预测概率从高到低排序取数,10,20……分别表示概率排名前 10%,20%……的客户,纵坐标表示在排名阶段对应的提升指数。
例如某种产品它的基准购买率为 1.5%,也就是说随机找客户去营销,平均每 100 个人里有 1.5 个人会购买该产品。
建立模型后,lift 曲线如图。
可以看到,排名前 5% 的数据提升度为 14.4,即平均在 100 人里会有 1.5*14.4=21.6 个人会购买该产品。也就是说对概率排名前 5% 的客户进行营销,要比随机的去找,成功率可提高 14.4 倍。
随着横坐标用户百分比的增加,lift 值呈递减趋势,对应客户的含金量也在降低,当降低到某个段就没太大营销的意义了。本图中排名约前 15% 的客户来说,lift 值都大于 1,也就是说对前 15% 的客户进行营销,成功率要高于随机选择客户。
我们可以根据 Lift 曲线来决定选择概率排名前多少比例的客户去做营销。Lift 曲线越陡,说明模型筛选优质客户的能力越好,比如图中的 Lift 曲线就是一个不错的模型,能够帮助我们更有效的找到目标客户,以最低的成本找到最容易成交的客户。
如果您要预测的产品只有一种或少数几种,那么到此为止就可以了,前面讲述的方法已经够用了。
5. 多产品组合购买清单
如果您需要销售的产品种类很多,比如十几种,甚至上百种。那么还可以通过挖掘客户的偏好,向其推荐产品组合,来进一步提高营销价值。比如,银行会有几十种金融产品需要营销,家电公司会有各种家电产品需要销售,超市或电商需要售卖的产品多种多样,保险公司有各种不同种类的保险需要营销……。
历史上很经典的啤酒和尿布的案例,就是通过数据挖掘将两个看似无关联的产品组合销售,使尿布和啤酒的销量双双增加。银行的金融产品种类也很多,我们也可以通过挖掘用户的购买偏好,将购买概率较高的几种产品进行组合销售。
在易明建模里也有相关的功能,可以预测产品组合购买清单。
首先我们要准备一个多目标的宽表。将预测产品所需的历史信息和目标变量做到同一个宽表里。
和之前单目标预测情况不同,这里的目标变量会有多个, 分别为 y1,y2,y3……,表示每种产品是否购买的历史数据。
然后,在配置目标变量时,将单目标变量改为多目标变量,如下图所示。
易明建模会根据用户喜好自动进行产品组合。
现在自动建模就可以了,操作步骤和单产品建模是相同的,预测完成后会出现类似图中的预测结果。
左侧第一列是产品组合的内容,第二列是用户购买该组合的概率。
将结果导出后就生成了产品组合购买清单,从而可以对前面概率较高的客户进行有针对性的营销活动。
英文版