当前位置:网站首页 > 探索 > 【基础数据挖掘技术】探索性数据分析

【基础数据挖掘技术】探索性数据分析

【基础数据挖掘技术】探索性数据分析文章浏览阅读964次。利用电信公司的电话线路营销和超市客户分群促销的案例介绍一些简单的数据挖掘方法_探索性数据分析 实例

1.描述性统计(探索性的数据分析)

不是所有项目都要用复杂的方法,描述性统计是偏简单的方法。

案例1:电信公司

客户是电信公司最大的资产,客户行为存在于交换机的通话记录

了解客户行为成为电信公司的趋势,

1.帮助电信公司找出有电话线路需求的客户让其承接多几条电话线路,就能给公司带来更大的商机

2.何时客户会需要额外的连接线路呢

我们拥有交换机的数据,将时间秒数转化为开始时间和结束时间,如何对时间进行排序,得到每个时间点的占线数,发现有时会出现满额占线的情况,就可能导致客户呼入时占线,损失商机。只要多加装两条线路就可以解决这个问题。

简单的问题用简单的方法解决。

案例2:

相信我们都有在商场购物的时候都有看见过满千送百,满五百抽好礼的优惠方案。

尤其是在周年庆或者节假日,这种间隔优惠方案就是最佳营销方案,消费者一旦听到差一点点金额就会有优惠时,很可能多买一点上去达到优惠。

客单价是营销届的一个指标,代表顾客一次来店消费总金额

通常业界会通过捆绑销售,互补品摆放(手电筒电池),来提高客单价,增加业绩,而上面说的500送豪礼,1000送百,这些优惠活动可以有效的提高客单价,一般销售人员会以500,1000,1500,倍数的直观方式吸引顾客购买更多,但是这真的是最佳的优惠方案吗?有可能这会平白损失大量的业绩

本数据是某衣服电商各顾客总消费金额资料,

我们计算每个消费者每次消费的客单价

一共有21598消费者记录,ID:顾客编号

Total_Spending字段代表对某位顾客的总消费进行汇总求和。

我们利用总消费金额为横轴,顾客人数为y轴,画直方图,从图可以看出来,所有顾客分布最多的是150—200之间的区间是最多人,大约4000多人

画出这个密度图,虚线代表定价策略

如果优化策略定在500,150~200元的顾客就会觉得要再花费一倍多的钱得到优惠,肯定不想当冤大头,如果已经购买了450元则很有可能额外购买。所以500元不是合适的优惠策略。

合适的定价策略应该是根据消费者的消费习惯(200,300,500)

我们可以看出这几个高峰是消费者的消费习惯购买

于是我们可以对着几个区隔金额进行平移来提升业绩。

于是我们就可以将300,500,800作为定价数据。

(python画图)

这样简单的描述性统计可以有效的对顾客进行分层,也可以用于区隔信用卡等物品的会员层级。同样,可以不使用折扣,改为赠品(按使用者需求改变,比如之前有一个酒店,他们的消费者是出差的人,钱是公司出的,他们就更愿意赠品和按摩之类的。)。

在增加业绩的同时也能增加消费者满意度。

统计数字:以之前的杂志数据为例

描述性统计(购买各种杂志的概率):可以看出最受欢迎的是house magazine ,(平均数),comic0.081

预测准确度。Naïve predictions基础标准,如果以准确率为标准,那么naïve predictions就是基础概率。

描述性统计:分五种杂志的平均值分布(客群区分):

和naïve prediction对比可以看出关系。

2.可视化计算(探索性的数据分析)

购买多种类杂志人群的分布

购买杂志的年龄分布。(挺均匀的,可以用来与各个不同杂志对比。)

购买汽车杂志的年龄分布(有点集中)

年龄对预测是否购买汽车杂志有帮助。

运动杂志的年龄分布(年龄对它影响不是很大。)

年龄与收入是否购买音乐杂志散点图(浅色点代表购买,黑色点代表不购买)

明显购买音乐的人偏向低收入低年龄。年龄和收入对音乐杂志的购买量预测应该有帮助

总结:简单的问题就可以通过探索性数据分析。描述性统计可以搭配可视化分析进行分析。

上一篇: 探索者三维建筑设计软件 V2017 官方版
下一篇: 北京探索者软件股份有限公司更新日期:2023-10-25

为您推荐

发表评论