某电商平台用户消费行为分析

数据集详细介绍

这一份数据是某电子商务平台的用户消费数据。

基本探寻

用Python剖析主导入常见的包及其载入数据,正中间被注解掉的一部分编码是由于原数据太大有一千五百多万行,计算机操作有点儿卡因此只随机抽取了在其中一部分数据,就先假定这一部分数据是完全的数据吧,能够看见除开数据库索引外有6列数据,分别是用户ID,产品ID,用户个人行为类型,用户详细地址,商品类别及其用户个人行为产生時间,在其中用户个人行为类型各自用1234表明点一下,个人收藏,加加入购物车和购买。

随后查询数据总体状况,该数据集有773156行,用户详细地址缺少了许多数据,还行此次剖析不对于用户详细地址数据。

再对数据集开展去重复实际操作,发觉并沒有反复数据。

然后对各列数据的类型做一些转换,便捷后边的计算,并从時间数据中获取日期,月份,和钟头三列数据。

最终查询一下简易的描述性分析,从这儿能够看见一些有效的信息内容,例如这一份数据集的时间段是以2014-11-18到2014-12-18恰好一个月整,这一个月内一共有19529个用户有点一下过产品,由于这儿沒有消费额度数据,因此下边的均值,四分位数等指标值就没有用了。

深入分析

计算一下日浏览和日访问者的皮尔逊相关系数r,发觉他们呈正方向关联。

画一下日浏览量和日访问者量的柱形图,发觉在双十二那一天用户最活跃性:

计算一下每一个时段的浏览数和浏览量及其两者的相关系数r,并画出柱形图

发觉用户在下午五点以后人气值逐渐提升,到夜里九点的情况下做到最高值,可以在晚上多做一些主题活动提升用户购买率。

用户在一天每个时间内不一样个人行为类型统计分析并画出柱形图,浏览量和别的几类数据差别很大,绘图的情况下除掉了浏览量:

用户不一样类型的浏览量统计分析:

能够看见从用户点一下到最终的购买流动率非常大,大家计算一下流动率达到98%:

别的好多个转换率沒有盘算,这种是十分关键的指标值,可以借助那些指标值体现出许多问题。可以将步骤再优化一点深入分析找到用户外流的核心缘故。

再根据用户的购买频次来计算一下这一个月内用户的复购率:

查询一下平均数,绝大多数用户都只购买了一次:

按日期和用户ID分类计算每一位用户每日的购买频次:

根据以上的dataframe各自计算每日购买频次,每日购买总数和每日平均购买频次并画出柱形图:

RFM模型

以2014-12-20为最终购买日期,各自计算用户的近期购买時间和这一月的购买頻率:

由于沒有消费额度数据,姑且只对用户的消费頻率和近期消费時间开展评分:

再依据评分状况相匹配上用户的使用价值类型:

再画出柱形图:

能够看见关键使用价值顾客十分的少,关键维持顾客沒有,有消费额度数据得话归类应当会更为有效,很有可能用qcut分箱会比cut分箱效果非常的好。对于无需类型的用户店家应当选用无需的业务方法,例如一般使用价值顾客,她们购买頻率不高,近期都没有购买,应当给这群用户消息推送优惠劵或是优惠促销信息内容。针对关键使用价值顾客,她们购买頻率高,最近也是有购买,是必须重点关注的用户人群,要提升这些人的满意率。

剖析結果

此次数据剖析有三个至关重要的结果

1.用户在晚上最活跃性,可以在这个时间范围多发布一些主题活动,提升用户购买率。

2.用户从访问到明确购买的转换率很低,应当提升用户的挑选作用,协助用户迅速寻找到心爱商品。

3.对于RFM模型相匹配的各种用户采用不一样的服务项目,提升用户满意度。

扫码免费用

源码支持二开

申请免费使用

在线咨询