超详解析电商数据 电商数据分析案例分享

【超详解析电商数据 电商数据分析案例分享】今天分享给大家的项目作品来自参与用户凤城,主题是基于人、货、市场的电子商务 。
平台数据分析
,分析的思路非常清晰,可视化报告的部分做的也不错,对数据分析新手来说非常具有学习价值 。
场景介绍业务背景介绍:小峰是一名新入职的BI工程师 。试用期,导师给了小峰一份电商数据,让他给出一个合理的分析结果 。
目的:小峰通过分析两年来电商平台的销售和发展情况,找出平台发展的相应结论,并给出相应的改进建议 。
分析工具:FineBI
分析思路 首先我们明确本次分析的目的是分析电商平台的相关数据,找出问题并给出相关建议,决定从传统的人、货、市场的角度进行分析 。
领域维度我们分析平台销售的健康和分布 。可以得出平台销售额的分布特征和增长趋势 。
然后通过对商品的分析,了解平台、品类销售、产品价格所处的位置,从而优化ABC分类,了解平台产品的定位 。同时我们也知道产品体验需要通过评分来优化,尝试定位产品评价低的原因 。
然后通过对会员的分析,了解会员的增长趋势和会员的分布情况,发现大量会员也分布在巴西沿海 。同时也通过AARRR模型和RFM模型了解会员的转化率和消费属性,确定重要价值客户的占比和地域分布位置,有利于精准营销 。
同时,通过对会员订单的分析,了解会员的消费时间、消费方式、平均支付时间 。同时,通过会员的评分,了解会员的潜在诉求 。
其他分析——物流分析,最后分析了平台的物流情况,发现物流不准时的比例高,物流时间长,但同时物流成本占订单成本的比例高,人的消费和接受的服务不成正比 。同时,通过低评价的不准时比例和物流时间验证了猜测,确定了低评价现象与物流服务有关 。
最后,针对上述结论和现象提出了一些改进建议 。
整体分析脑图如下:
数据整理 有九个基本数据表,如下图所示 。AAARR模型表,巴西各州辅助表,表关系和区域经纬度表是我通过其他途径获得的辅助数据表 。
主要的自助数据集宽度表有:订单核心维度聚合宽度表和RFM模型表 。
数据排序过程:
第一步:获取:登录kaggle下载公共数据集,需要翻墙并拥有kaggle账号 。(想去Kaggle参加比赛的朋友可以找我要翻墙的工具)
第二步:清洗:为了保证源数据的准确性,对上述9个EXCEL基础数据进行重复和异常值处理(如数据查重、前后时间值、金额加减等 。),由EXCEL配合相应函数完成 。因为比较简单,这里不做过多描述 。
第三步:导入传递到FineBI,为每个EXCEL表创建一个张宽表作为维度表,方便操作 。(方便添加字段或维护单个表格),为后续制作大而宽的表格奠定了数据基础 。
第四步:制作主宽表(1)聚合订单核心各维度的宽表 。
a、以Olist_order_dataset为核心表,链接维度表,创建订单核心各维度的聚合宽度表 。各表之间的血缘关系如下 。
b、选择订单核心表,通过左右合并依次与各个维度表合并 。
c增加过滤,过滤掉2017年到2018年的数据 。
d、新增栏目是否按时通过物流预计到达时间与实际到达时间的对比 。
E.添加新老成员 。
F.订单核心的每个维度的聚合宽度表已经创建,其雪花模型如下所示 。
步骤4 (2):制作主宽度表(2) RFM模型表
A.首先,获取订单核心的每个维度的聚合宽度表的对应字段 。
b,添加一个新列,从现在起的消费时间天数,然后计算平均消费时间天数,并以此来判断R值 。
同样,会员消费频率计算出的是平均会员频率,这个比值计算出的是F值 。通过会员消费金额计算平均会员消费金额,并以此计算M值 。
c、合并R、F、M,拼接R、F、M 。
用IF函数定义中文的RFM
至此,相关数据处理完毕,数据整理告一段落 。
完成分析报告 A.整体框架:根据故事的叙述做整体排版,具体为以下几个板块,任务背景,明确目的-->“场”分析-->“货”分析-->“人”分析-->其他分析-->总结建议 。
B.图表选择:您可以查看此图表进行图表选择:
c、分析思路及相应结论
实地分析:通过季度销售趋势图和环比,以及各状态的金额分布分析,了解平台的销售趋势和分布情况,了解平台销售是否健康,销售的重点领域 。
1)发现相较2017年,2018年的销售金额和销售量呈环比上升趋势,最近两季度略微下降,趋向平稳 。平台客单价在175Reals/单浮动 。说明平台整体的态势还是向上发展的 。2)了解到订单来源主要来自巴西沿海各州,其中圣保罗州,里约热内卢州,米纳斯吉拉斯州为订单量产出州TOP3,而反观巴西内地产出偏低,小风猜测这也许巴西经济中心集中在沿海各州有关 。商品分析:通过帕累托分析品类销售,通过散点图探究品类宽度和销售关系,再通过价格带分析了解平台产品定位 。通过评估比例了解产品满意度,通过分析产品完整性验证猜测 。


推荐阅读