通过用户在小红书购买数据,探究不同变量对累计购买金额的影响,同时构建利润线性回归模型。主要使用python和SPSS。
数据共有29452条记录,7个变量:
(1) Revenue 用户下单的购买金额
(2) 3rd_party_stores 用户过往在app中从第三方购买的数量,为0则代表只在自营商品中购买
(3) Gender 性别 1:男 0:女 未知则空缺
(4) Engaged_last_30 最近30天在app上有参与重点活动(讨论,卖家秀),0:未参与,1:参与
(5) Lifecycle 生命周期分为A,B,C (分别对应注册6个月内,1年内,2年内)
(6) days_since_last_order 最近一次下单距今的天数 (小于1则代表当天有下单)
(7)previous_order_amount 以往累积的用户购买金额
1.数据预处理
2.数据分析
不同变量对累计购买金额的影响
与利润相关系数较大的变量为:age,engaged,last_order,accumulation
3)线性回归