淘宝平台广告点击数据分析报告
在广告展示数一定的条件下,点击率的高低就是决定一个广告能否被更多人看到的因素。 文章主要分析就针对“点击率”这一因素进行分析,与大家分享。
一、分析背景及目的
数据源:Ad Display/Click Data on Taobao.com 这是一份淘宝平台的广告展示/点击数据,本次分析需要从这些数据中发现某些规律或者异常,进而给运营团队提出建议 评价一个广告效果的指标就是广告的点击人数,可以反映一个广告有多少人愿意点击查看广告的内容,只有广告被点击,后续转化为购买行为才会发生。
把广告的点击人数指标拆分: 广告点击人数=广告展示数 x 点击率 ,而广告展示数又由广告商品的价格、类别影响;不同人群对不同类别商品有着不同的喜好,从而影响广告的点击率。
在广告展示数一定的条件下,点击率的高低就是决定一个广告能否被更多人看到的因素。 因此本次分析就针对【点击率】这一因素进行分析。
二、分析思路
从“广告”和“用户”两个角度进行分析:
1. 广告角度
- 分析不同广告的商品价格对点击率的影响
- 分析哪些类别的广告点击率更高,哪些类别的点击率低
2. 用户角度
- 分析性别和广告点击率有什么关系
- 结合聚类分析与RFM模型分析用户群体对广告点击率有什么关系
三、分析过程
1. 数据清洗
(1)数据概览
原始的数据集中包括三类数据,具体数据对应属性如下:
为了方便分析,抽取其中的部分字段作为分析。 从raw_sample数据集中抽取:用户ID、广告ID、是否点击 从ad_feature数据集中抽取:广告ID、类目ID、广告商品价格 从user_profile数据集中抽取:用户ID、年龄层、性别、购物层次
(2)数据组合
将三张数据表,组合到一张表中
a=raw_sample.merge(right=ad_feature,on='ad_id',how='left') b=a.merge(right=user_profile,on='user_id',how='left')
得到一张记录了用户-广告信息表
(3)缺失值处理
1)源数据中还有许多的缺失值,将性别和年龄层字段中为空值的记录删去
2)查看数据中的异常值,并将异常值删去 查看广告商品价格字段的属性值范围:
发现最大值为100000000.0元,价格过大,属于异常值,删去 再次查看价格字段的属性值范围:
还是存在数据值过大的异常值 为了方便分析对价格字段进行切分,选取更贴近日常生活的价格在1000元以内的广告记录进行分析 切片之后仍保留了751570条记录
(4)数据字段整合
对于广告商品价格字段,每个广告的商品都有各自的价格,根据价格字段不便于进行统计。新增一个字段“price_class”代表价格的区间。
(0-价格在0-100元、1-100-200元、2-200-300元…)
2. 结合图表分析
(1)分析不同广告商品价格对点击率的影响
①将广告商品价格分类
将广告按价格分为100元以下、200元以下、300元以下等10类,并计算不同价格区间中广告的点击率情况。
从图中发现,所有价格区间商品的点击率都在5%左右,其中广告商品价格在100元以下的广告点击率最高,为5.92%; 看到价格较低的广告商品点击率更高,我们一般认为是对价格敏感的浅层用户(免费用户)在这方面的点击率更高,而拥有一定消费行为和消费意识的中层、深层用户(付费用户)则更在意购物时的体验以及商品的质量。 为了验证以上说法,我们先假设100元以内的广告商品主要的点击对象是浅层用户,再通过数据验证。
② 分析100元以内广告商品点击率的用户组成
查看点击了100元以内的广告商品的用户的用户组成
从用户分布可以看出,在点击了100元以内广告商品的用户中,深度用户的比例更高,占比81.6%,而浅层用户的占比则相对少很多。这推翻了我们原来的假设。
小结:
- 17年5月6日至17年5月12日这8天里的广告点击率理想,但由于缺乏去年同期、今年上月的数据,不足以判断5%左右的广告点击率是否是一个正常水平,有待更多数据验证。
- 低价广告商品点击率更高,且点击用户中绝大多数是深度用户。建议:可以把这个数据反应给广告投放部门,在这个区域优先投放广告,既可以对浅层用户进行流量变现又能让广告让更多具有消费意愿的中、深层用户看见。
(2)分析哪些类别的广告点击率更高,哪些类别的点击率低
由于广告的类别数量众多,大部分类别的广告只有1-2次的展示,数据样本太小,因此选取展示数量最多的7个类别进行分析。
① 找出展示数、点击数、点击率最高的广告类别
可以看出类别6261广告的展示数、点击数、点击率均为最高,而类别4385广告的展示数虽然有10000+,但是点击数、点击率却是最低的。
② 分析类别4385广告效果最差的原因:
a.先按【广告商品价格】来分析
计算没有被点击的类别4385广告的商品的平均价格
而点击了类别4385广告的商品的平均价格为:
两者平均价格都在200-300区间、差异不大。结合分析(1),价格区间在200-300的广告商品点击率平均是在5.29%,而类别4385则只有3.61%。 这说明:广告商品价格不是影响类别4385广告点击率的因素
b.再按【性别】来分析
先来看看类别4385被哪些用户看到了
可以看出,类别4385的广告,主要是被推荐给了男性用户,而男性用户对这类商品的兴趣大于女性。 并且女性对这类商品的广告兴趣不高,点击率只有2.75%,是造成类别4385广告点击率低的主要原因。
c.最后按【用户年龄】来分析
来看看不同年龄段、不同性别的用户点击率有什么差异
(年龄字段含义:0:10岁以下、1:10-20岁、2:20-30岁、3:30-40岁、4:40-50岁、5:50-60岁、6:60岁以上)
从统计的数据可以看出,类别4385广告的商品主要点击群体是30岁以上男性用户,尤其是60岁以上男性兴趣最高,而女性用户对这类广告商品兴趣低。 结合a、b的分析,受30岁以上男性欢迎、价格在200-300的商品,推测是西装、皮鞋类或者烟酒类又或者是家用电器类商品
③ 小结
- 类别6261广告效果最好,有最高的点击率、展示数和点击人数。可以加大对该类别广告的资源投入,扩大广告推广效果。
- 类别4385广告点击率的原因是,这类商品对女性用户而言兴趣不大,女性用户点击率低,导致了整体的点击率低。可以在该广告的广告词中加入“父亲、爷爷”等宣传词,引导女性消费者将该类别商品作为一种礼物送给男性用户,从而提高点击率
- 类别4385的主要受众群体是30岁以上男性,为了提高点击率可以重点推荐给30岁以上男性用户。对于该类别广告商品的受众,可以适当增加产品折扣、降低商品价格,吸引点击广告的用户转换成购买用户
(3)分析性别和广告点击率有什么关系
① 计算男女人数比例
男女比例约为:1:1.6
② 计算男女各自的点击数
男女广告点击数的比例约为:1:1.7 因此,总体上女性的点击数要多于男性,但两者的点击率基本一致。
③ 比较各类别广告点击率-男女差异
可以看出,大部分类别中,女性的广告点击数都要明显大于男性的点击人数。 只有类别4385、类别4505,这两个类别的广告,男性的点击人数要超过女性的点击人数。 男女之间的主要差异是由类型6261的广告造成的,女性的点击数大约是男性的4倍。
④ 小结
- 总体上看,女性的广告点击人数明显大于男性,但两者的点击率却是差不多的。
- 类别4385、4505广告,男性的点击人数要多于女性。这类广告可能是男士服饰、汽车、烟酒这类商品
(4)分析用户群体对广告点击率有什么关系
不同的用户群体之间用户价值与消费习惯具有一定的差异,对于不同用户群体的广告投放的策略也不同。通过分析不同用户群体对广告点击率有什么关系,来制定不同的投放策略。
这里的分析通过K-Means算法来对用户进行聚类,并基于RFM模型来对用户价值进行划分。
①用K-Means算法对用户进行聚类
这里选取用户的购物层次、广告点击率、浏览广告的商品平均价格,这3个指标来作为判断用户价值的标准
- 用户的购物层次——体现用户在平台上的持续购物深度
- 广告点击率——体现用户对广告的接受程度
- 浏览广告的商品平均价格——体现用户通过广告推广能带来的潜在收益
对用户进行聚类分析:
这里将所有用户分成5类,来代表用户价值的高低。
注:三个特征在聚类时都进行了特征的标准化
从不同群体的特征分布可以得出:
- 群体5在点击率方面最大
- 群体2在浏览广告的商品平均价格最大
- 所有群体的用户在购物层次上基本没有差异
因此,我们可以出:群体5对广告的接受程度最高,非常愿意点击广告。群体2更喜好高价格的商品,对购买高价商品抱有极大兴趣。
② 用RFM模型对用户进行划分
根据用户在购物深度、点击率、观看广告商品的平均价格3个维度的表现,将用户划分为5类客户。
1)重要保持用户
- 这类用户有着高点击率,有更大的可能将用户的点击率转换为实际的购买行为。并且喜欢在平台上进行购物,是最理想的客户。
- 应优先将广告资源投放给他们身上,维持这类客户的点击率
2)重要发展用户
- 这类用户点击率中等、也喜欢在平台上进行购物,并且对广告商品的价格适中。具有很大的发展潜力
- 应加强与这类用户的联系,培养其点击广告的习惯,使他们成为高点击率的用户
3)重要挽留用户
- 这类用户点击率偏低,但是其浏览的广告商品的价格很高,对该类用户进行挽回,能提高广告转化为实际购买行为的价值
- 应加强与这类用户的互动,延长这类用户的生命周期
4)一般用户
- 这类用户点击率低,浏览广告的商品价格适中。这类用户没有点击广告的习惯,偶尔点击广告的商品价格也不高
- 应尝试投放多种类型的广告给这类用户,观察是否能找到用户感兴趣的广告商品类型,进而提高点击率。
5)低价值用户
- 这类用户点击率低,浏览广告商品价格低,属于平台的免费用户,用户价值较低
根据聚类结果,对应上述五类客户类型,进行匹配,得到客户群体的价值排名:
根据结果,我们可以发现5类用户的分布如图所示:
可以看出:最有价值的3类用户占比约为20%。这20%的用户必然贡献了广告点击率的绝大部分,平台如果希望广告效果好,就需要投入资源服务好这部分用户 一般用户、低价值用户仍为平台用户的主体,对于这类用户需要通过运营/营销策略,提高他们的活跃度/点击率,争取将他们转换成重要的用户。
③ 小结
- 重要用户占比20%,对于群体1、2、5里的用户,应针对用户特点,定向推送广告,在高点击率的同时,争取进一步提高广告的转化率,将点击落实为购买。
- 其他用户占比80%,对于群体3、4的用户,应推送多种类型的广告给这类用户,寻找用户对哪类广告的商品更感兴趣,并可以通过相应促销活动,提高其活跃度和广告点击率,争取将这类用户转换为重要用户
四、结论和建议
把上述的分析过程中的小结正例出来,得到分析结论,并综合所有的结论提出建议:
后记
由于没有深入接触过广告的业务,对于数据分析的逻辑还有待完善,本次分析也只针对了点击率这一个维度分析、拆分。而评价一个广告的推广效果的指标是有多个维度去分析的,需要更深的业务见解才能分析好。
后续会继续努力的,带来更多不同业务下的数据分析思路见解。
本文由 @Rambo goal 原创发布于人人都是产品经理,未经作者许可,禁止转载。
题图来自Unsplash,基于CC0协议。
您好,您做的这个数据分析用的phython做的还是其他的Hadoop或者spark呀
你好,请问代码可以分享一下吗?最近正在学习python数据分析这方面。谢谢。1832687462@qq.com
您好,能把您的代码给我一份吗,学习一下,谢谢您,891253255@qq.com
数据集链接:https://tianchi.aliyun.com/dataset/dataDetail?dataId=56
感谢分享~
想请教下购物深度怎么理解??