1.描述性统计(探索性的数据分析)
不是所有项目都要用复杂的方法,描述性统计是偏简单的方法。
案例1:电信公司
客户是电信公司最大的资产,客户行为存在于交换机的通话记录
了解客户行为成为电信公司的趋势,
1.帮助电信公司找出有电话线路需求的客户让其承接多几条电话线路,就能给公司带来更大的商机
2.何时客户会需要额外的连接线路呢
我们拥有交换机的数据,将时间秒数转化为开始时间和结束时间,如何对时间进行排序,得到每个时间点的占线数,发现有时会出现满额占线的情况,就可能导致客户呼入时占线,损失商机。只要多加装两条线路就可以解决这个问题。
简单的问题用简单的方法解决。
案例2:
相信我们都有在商场购物的时候都有看见过满千送百,满五百抽好礼的优惠方案。
尤其是在周年庆或者节假日,这种间隔优惠方案就是最佳营销方案,消费者一旦听到差一点点金额就会有优惠时,很可能多买一点上去达到优惠。
客单价是营销届的一个指标,代表顾客一次来店消费总金额
通常业界会通过捆绑销售,互补品摆放(手电筒电池),来提高客单价,增加业绩,而上面说的500送豪礼,1000送百,这些优惠活动可以有效的提高客单价,一般销售人员会以500,1000,1500,倍数的直观方式吸引顾客购买更多,但是这真的是最佳的优惠方案吗?有可能这会平白损失大量的业绩
本数据是某衣服电商各顾客总消费金额资料,
我们计算每个消费者每次消费的客单价
一共有21598消费者记录,ID:顾客编号
Total_Spending字段代表对某位顾客的总消费进行汇总求和。
我们利用总消费金额为横轴,顾客人数为y轴,画直方图,从图可以看出来,所有顾客分布最多的是150—200之间的区间是最多人,大约4000多人
画出这个密度图,虚线代表定价策略
如果优化策略定在500,150~200元的顾客就会觉得要再花费一倍多的钱得到优惠,肯定不想当冤大头,如果已经购买了450元则很有可能额外购买。所以500元不是合适的优惠策略。
合适的定价策略应该是根据消费者的消费习惯(200,300,500)
我们可以看出这几个高峰是消费者的消费习惯购买
于是我们可以对着几个区隔金额进行平移来提升业绩。
于是我们就可以将300,500,800作为定价数据。
(python画图)
这样简单的描述性统计可以有效的对顾客进行分层,也可以用于区隔信用卡等物品的会员层级。同样,可以不使用折扣,改为赠品(按使用者需求改变,比如之前有一个酒店,他们的消费者是出差的人,钱是公司出的,他们就更愿意赠品和按摩之类的。)。
在增加业绩的同时也能增加消费者满意度。
统计数字:以之前的杂志数据为例
描述性统计(购买各种杂志的概率):可以看出最受欢迎的是house magazine ,(平均数),comic0.081
预测准确度。Naïve predictions基础标准,如果以准确率为标准,那么naïve predictions就是基础概率。
描述性统计:分五种杂志的平均值分布(客群区分):
和naïve prediction对比可以看出关系。
2.可视化计算(探索性的数据分析)
购买多种类杂志人群的分布
购买杂志的年龄分布。(挺均匀的,可以用来与各个不同杂志对比。)
购买汽车杂志的年龄分布(有点集中)
年龄对预测是否购买汽车杂志有帮助。
运动杂志的年龄分布(年龄对它影响不是很大。)
年龄与收入是否购买音乐杂志散点图(浅色点代表购买,黑色点代表不购买)
明显购买音乐的人偏向低收入低年龄。年龄和收入对音乐杂志的购买量预测应该有帮助
总结:简单的问题就可以通过探索性数据分析。描述性统计可以搭配可视化分析进行分析。
发表评论