用户画像规划流程和方法

4 评论 33051 浏览 192 收藏 9 分钟

编辑导语:如今在这个大数据时代,“用户画像”这个词经常出现,它跟精准营销挂钩,可以根据一个人的兴趣、地理位置等进行精确的推送,达到良好的营销效果;本文作者分享了关于用户画像规划的流程和方法,我们一起来看一下。

互联网行业飞速的发展,带动行业业务量激增,同时伴随数据量的增加,互联网各行各业慢慢形成头部企业,2/8原则下长尾企业也越来越多;因此,在大数据量和激烈竞争下,如何更好的对产品进行营销,如何制定价格策略,越来越重要。

那么,如何制定准确的营销和价格,就需要我们针对不同人群,不同个体的特点进行精细化推荐,所要本章介绍了如何进行用户画像。

文章结构:

一、什么是用户画像

用户画像就是对用户按照一定的规则进行统计,划分,从而能够指导用户推荐,客户分层运营,达到营销效果。

昨天:手机APP大爆发是随着手机硬件的发展而发展起来的,发展前期大量APP为抢占市场纷纷上线;用户画像只是为了指导产品设计,主要用于产品设计前夕的用户访谈、用户调研的前期工作,而且一般覆盖的人群比较狭隘,精准度差,产品经理设计产品全靠感觉。

今天:行业竞争越来越大,行业产生的数据量也越来越大,各大公司开始建造自己的数据仓库;那么如何应用数据仓库中的数据,如何进行精细化运营,用户画像越来越受到重视。

明天:随着大数据技术的成熟应用,用户画像标签将越来越多,目前互联网行业中比较成功的标签系统是淘宝的千人千面,技术创新必将推动用户画像的精准度。

二、用户画像常用场景

用户画像概况可应用于一下三个场景:

  • 产品设计:开发前期的产品定位设计;
  • 产品营销:指导运营对特定用户进行推送活动信息,推广信息,个性化推荐等。
  • 产品决策:分析用户画像统计对产品的发展现状和发展趋势进行预测,及时调整产品发展路线。

按照用户标签的生产方式可分为:

统计标签:现有的可以直接从数据中提取出来的标签;包括用户自然属性,用户行为统计等信息。

规则标签:自定义规则进行标签建模;根据业务流程提取需要统计的标签。

算法模型标签:根据机器学习等算法进行用户行为预测分类;具有不确定性、开发周期长、成本高,因此系统中此类标签数量较少。

三、用户画像系统搭建流程

1. 数据采集

对用户数据进行采集,数据预处理,数据挖掘和过滤等手段得出期望的数据集。

用户数据一般分为埋点数据和业务数据:

  • 埋点数据:根据用户的行为特征进行埋点,将得到的数据进行处理存储;
  • 业务数据:用户的姓名、年龄、地理位置等自然属性,同时包括用户购买、用户评价、用户评论等隐形数据。

具体采集方法可以使用如下算法模型:

文本挖掘模型(TF-IDF):处理文本类型,提取数据信息。

TF是词频,IDF是逆向文件频率,TF-IDF是词频和逆向文件频率的乘积。

Nij就是词i在j文章中出现的次数,分母就是文章的总词数。

D就是语料库中文件总数,下面分母就是词i出现的文档数,然后取对数。

该算法可以直接调用python库Sklearn进行实现,但是该算法比较单一,不考虑词条在文章中的位置,不能准确描述词的重要程度,一般需要结合其他其他算法或者增加权重改进。

聚类算法:聚类算法较多,如ANN神经网络和贝叶斯等,聚类主要是针对冷启动用户、用户分群营销等目的;具体算法相对复杂,目前算法应用多使用python的各种库如Sklearn,包括一些框架tensorflow、caffe等。

相似度模型:一般使用相似度模型进行辅助用户分群,常用的有逻辑回归、线性回归、余弦相似度、皮尔森相似度等。

具体说下余弦相似度:

实例:

用户1和用户2通过公式计算相似度为0.945406,是不是可以解释为两个用户可以划分为同一类人,进行用户分群(计算过程只是用于解释算法,无其他意义)。

若已有数据仓库,数据采集相对比较轻松,可参考文章“每日优鲜如何搭建数据仓库?”。

2. 用户维度分析

用户分析具有多维度,随时间更新的特点,包括用户年纪、学历、兴趣、消费水平等都容易变化。

因此维度信息应该随着用户偏好发生变化,因此,在标签系统中需要有新增标签功能。

3. 维度标签化

用户画像最终的实现应该是对维度进行标签化,常用MECE法则进行标签化,防止标签界限不清晰。

标签需要根据需要进行逐级拆分,例如:

4. 标签映射,接口封装

用户画像数据导入服务器中,为后续推荐系统,营销活动服务;封装成API可以作为数据服务的内容,对其他系统提供数据支持。

5. 用户画像评估

对画像进行评估:

用户覆盖率:用户画像具体能够覆盖到多少用户,有些用户画像可能覆盖总用户的50%或者80%;所以覆盖率是用户画像应用的一个评价,覆盖率越高,对后续精准营销的策略选择越准确。

准确率:模型的准确性,如上所述,使用算法模型导致的用户分群错误或者对用户的购买意向预测错误,将直接影响购买率,影响GMV。

可拓展:用户画像在维度刻画应该是可扩展的。

及时性:如果用户画像服务到实时推荐系统中还需要用户画像的及时。

四、总结

用户画像结合大数据技术使用户刻画更加细致、及时,对日趋竞争激烈的互联网浪潮起到越来越重要应用。

 

本文由@汪仔2296 原创发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash, 基于CC0协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
海报
评论
评论请登录
  1. 好像什么都说了,又好像什么都没说。

    来自北京 回复
    1. 说的太多太技术,说的太少内容不深刻。用户画像需要了解两件事情:从技术层面讲需要了解数仓的搭建,相对应技术架构;从产品层面讲需要明确业务需求,构建标签体系(增量过程)。

      来自上海 回复
    2. 这两句话总结的到位,大佬实锤。

      来自北京 回复
  2. 各位大佬,若有工作机会请帮忙推荐下

    来自上海 回复