本文使用SQL语句对50w条淘宝用户数据进行分析。
数据库:SQL Server。
1、分析目的
本文期待通过挖掘淘宝用户数据价值,研究用户活跃度,购买行为,商品销量等情况,对提升电商关键业务指标提出建议。
具体讨论问题如下:
- 从点击到购买,用户流失情况如何?
- 日常用户活跃度如何?具体的时间段用户活跃度呢?
- 特殊日期(周末)用户活跃度情况如何?
- 用户分时间段下单情况?哪个时间段下单最多?
- 核心用户有哪些,特点如何?
- 用户点击与购买之间是否存在关联?
- 哪些商品,商品类目最受欢迎,订单量最高?
2、分析框架
1、数据来源
2、数据描述
3、数据预处理
3.1截取数据
由于100w条数据量太大,使用查询语句运转太慢,所以改为选取其中50w,运行速度需6s。
3.2设置列名及属性
3.3时间戳的转化
3.4数据检查
去除重复项:
判断行为类型是否符合四类。
判断日期是否在2017年11月25日至2017年12月3日区间。
总计删除219条数据,有效数据为499782条。
1、数据概况
1.1 用户数量,不同商品数量,商品类目数量统计
49.9w条数据,主要包含4864名用户记录,24.2w商品细类和5065个商品类目。
1.2 行为类型
关注4个客户行为类型的基本数据,分析用户行为路径。
转化率节点位置
用户UV转化指标
2、用户活跃度分析
用户的点击量体现的是活跃度,通过点击量与时间的交叉分析,聚焦产品活动时间段,分析用户潜能,实现有效推广。
2.1 用户访问变化情况
点击率前三分别是12.2(周六), 12.3(周日), 12.1(周五)。12.2之前的用户平均点击量约为4.6w,12.2与12.3实现了平均32%的点击量增幅。与一周前的周六日11.25和11.26点击量对比,这个数据展示了周末用户活跃度可以经过运营活动提升的潜能。
2.2 活跃度的具体时间段
2.3 特殊日期(周末)活跃度
上文提到12.2与12.3日为点击量最多的日期,而同为周末的11.25与11.26则点击量表现不显著。下面对其进行可视化对比:
【周末】数据曲线与【点击量与时间点】曲线基本趋势相同。
下面对12.2-12.3和11.25-11.26两个周末的时间点进行对比:
细节上,10时是第一个小峰值,12时均有回落,但11月底的周末回落幅度大于12月初周末;
第二个小峰值到第二个低谷的时间长度不同,11.25-11.26下午3点达到峰值,而12.2-12.3保持点击量增长直到下午4点才开始下降;
从第二个低谷至全天峰值增长百分比不同,12月初的周末从下午5低谷至21点峰值的点击量增长率为94.5%,11月底周末的增长率为79.5%;
总体来说,0-8时之间点击量相差不大,9时之后点击量拉开差距,在21时实现差值最大,这也体现了运营活动对用户活跃度产生的影响。
19时至22时为用户最活跃时间段,点击量增长潜力巨大,商家可考虑在此时间段推出活动从而提升销售额;另外,考虑到用户的活跃时间,应注意调整客服时间,及时回复消息。
3、 用户购买行为分析
3.1 分时段下单情况
这个曲线趋势与用户活跃时间曲线基本相同,说明用户点击量与购买量存在正相关。但白天下单量与晚间差值不大,晚间时段大部分用户只浏览不购买。
3.2 下单用户分析
不同下单数量的频数分布
取前十个频数最多的数据来看,下单次数越多的用户占比越小。下单1次的用户占比最多,达33%,应多调动这部分用户的活跃度,培养用户购买习惯,提升复购率;下单2-3次的潜在忠诚客户占比为40%,应加大活动力度,稳定用户成为高频使用会员;平台高频率用户占27%,需要注重产品质量与客服,获得用户的深度认同。
核心用户的购买行为
除了订单数量外,订单额也是需要引入的维度。同时拥有高订单量和高订单额特征的用户才最具价值。需要对这些用户予以高度关注,针对其消费喜好进行定制化服务,赢得他们对产品的深度认同。
以订单量最多的用户ID1008380为例:
商家可根据其浏览及购买数据生成客户偏好数据(偏好价格区间,相似商品类目等),着重关注多次浏览商品,智能推送优选产品,从而提升销售额。
4、商品销量分析
4.1 商品销量排行榜(Top 10)
4.2 【购买】与【点击】环节相关分析
总计筛选出1993个商品,占总商品数(242165)的0.8%。
上表选取展示销量前十的且购买数大于等于浏览量的商品。这些商品对购买者具有很强的吸引力,使得购买者未多加思索便进行购买。对这一现象的具体分析需要更多的数据支持(商品特征,销售策略,品牌,质量,服务,消费者行为明细等),从而提升商品吸引力。
反过来,我们可以使用【比例】升序筛选出低于总体平均值0.02(即浏览超过50次下单1次)的商品,分析商品存在的吸引力缺失因素,为提升转化率提供解决方案。
这里的平均值=购买量(10222)/点击量(448970)
4.3 商品类目销量排行榜(Top 10)
商品类目可以为商家标签化购买者偏好提供线索,可惜的是,原始数据只有类目ID,缺少数据支持。