标签体系建设的复盘与思考(中):标签如何管理?管理标签的什么?
每个在互联网上留痕的人,都会留下一些自己的标签,那么企业该如何对标签进行管理与应用?作者结合自己的经历,对标签体系建设进行了复盘与思考,并总结了标签的管理与应用,希望对你有所启发。
一、前文回顾
在上一篇中,复盘了标签是什么?标签体系是什么?以及建立标签体系的必要性、核心步骤和原则:https://www.woshipm.com/pd/5958816.html。
这里再加深一下印象:
标签:对某一类特定群体或对象的某项特征进行抽象分类和概括[1]。标签要可解释,有具体或潜在的业务应用场景;比如商超货架上的各类商品、图书馆货架上分文别类的书籍,商品本身的规格属性标签等,都可以更好地指引消费者找到其所需的物品;
标签体系:标签的集合,且这个集合需要科学合理,可管理、可维护、可迭代。
建设标签体系的前置条件:
- 企业有足够丰富的内容、或服务、或商品;
- 企业有层次多样复杂的客户;
- 企业的业务进入稳定期,客群量级达到一定规模。
在互联网时代以前,企业/供应商制造商品、或服务、或产品,生产完了将其上到货架上,提供分类查询能力,等着消费者来购买就行了;
但在互联网时代,消费者的注意力被各类App、网站掳走了,原仅做线下业务的企业为了生存发展,不得不“线上+线下相结合”,以此来瓜分互联网的流量,吸引消费者注意力,从而购买其产品或服务。于是,原来的“等着人来买的商业模式”逐渐转变成了“主动向目标人群推销产品/服务”的商业模式。很残忍,我们每个在互联网上留痕的人,都将是这个时代下,被分析的业务对象。
在电商,或以内容推荐为主导的产品领域(如小红书、各类信息流产品),其用户(消费者)层次复杂多样、其商品或内容也足够的丰富、企业业务也进入到了稳定期;——就非常符合 建设标签体系的前置条件。——读者可思考,这两块业务,该如何建设和管理标签体系?
二、城市治理业务 | 标签的管理与应用
在城市治理业务中,政府治理的对象是:人、地、事、物、组织、情报,但治理的绝大多数目标还是落实到具体人或组织上。分析人的基本属性、行为习惯、心理特征等内容,预测人的行为动向,从而采取相应的决策方案和处置措施。
政府部门,通常有2条治理道路可选:
1)政府部门自己出资源从线下/线上主动/被动寻找本部门权责范围内的线索/案件(也就是下图中的路径①);
2)政府部门借助第三方企业,来帮助他们完成相应的业务目标或提高他们完成业务目标的效率(也就是下图中的路径②);——当下流行的是路径②(模式②)。
对于模式②, 一些企业,会开设相应的部门,专门做TOG业务,为政府部门,如【国安】、【公安】【网信办】、【住建】、【城管】、【市场监督局】、【金融监督管理局】等部门提供解决方案和产品服务,利用各类智能化系统或模块,提供一些风险线索、情报线索,以提高政府部门的工作效率。
这就要求做模式②的这些企业,需要对“现实空间”或“网络空间”或“现实+网络空间”散落着的各类实体要素及其基本属性、行为习惯等,做采集、做治理分析(甚至是精细化治理分析),以形成TO 政府部门最终可用的“线索”/“案件”/“情报”。(我待过的2家公司皆是如此,对接过的同类型的公司做政府业务也是如此)。
——而不论是面对“现实空间”还是面对“网络空间”上的各类要素,其都够复杂,所以要想针对网上或现实世界中的各类实体要素进行精细化治理和分析,建立标签体系自然是必经之路。
2.1 标签的分类与管理
1、为什么需要对标签进行管理?
标签或标签体系建设好了后,只是完成了从0-1的过程,还需要对标签的整个生命周期进行管理和迭代,使其更好地满足不用阶段的业务发展需求。
2、谁来管理?
首先,标签需求一般来自业务方,总体来看,主要有这样几类标签需求:
- 从标签值是否变化角度来划分:
1)静态标签:即该标签的标签值一般是不会变的或变化的可能性极低,如人的出生日期、姓名等;——一般也称“属性标签”。
2)动态标签:即标签的标签值是会变化的。比如人的年龄、天气的阴晴冷暖、App的日活、月活。
在动态标签中,又有比较简单的统计类标签,比如App日活、网站月活;还有需要算法模型计算的标签需求(也称“拟合标签”、“预测标签”),比如根据输入的一张图片,研判其是否存在“涉黄”;还有一些简单的规则匹配类标签,如3个月内,没有任何操作,认为该用户为“丢失用户”。
- 从标签值是否可信度角度来划分:
1)事实标签:指的是标签值是可信的,如用户手动填写、外部采买导入;
2)预测标签:即深度学习或机器学习模型研判的,存在一定的可信度;
所以,我们看,不论是多么简单的标签需求,比如人的基本属性标签,只有姓名、性别、年龄3个维度,需要支持业务按性别和年龄圈选目标用户,也需要研发来管理。
以上述业务需求为例,研发同学,需要根据业务需求,设计人的库表,是采用【竖表】(竖表方便计算,但不方便查询),还是【横表】(方便查询,但不方便计算),需要考虑这些标签的计算逻辑:标签值从哪来?——基于用户填写表单提交的呢?还是算法基于模型预测的呢?每个标签值的更新频率是如何的呢?什么条件下触发更新呢?等等一系列问题。
而随着业务的发展,标签管理往往会按如下阶段演变:1)研发管->2)产研提供标签工具供运营人员自主取数->3)厂商提供工具,客户自主取数,实现自定义分析;
3、管理标签的什么?
围绕标签的全生命周期,对标签进行管理:
1)标签的增、删、改、查;
2)标签计算策略的管理;
3)标签的应用频次管理;
4、用什么来管理标签?
Excel?在线文档?系统?
——对研发同学来说,肯定是用数据库和各类监控日志来实现标签的管理了;
——对产品运营团队来说,前期标签需求变化不频繁的情况下,可以用一些在线 excel来管理,以辅助记录每个同学的对标签的变更记录。
但随着标签需求越来越多、越来越复杂,所以,运营团队期望产研可以提供一个【标签运营管理工具】,以实现标签的增、删、改、查;标签的计算策略的管理;标签应用频次的管理。
2.2 【标签管理工具】设计
本文以“面向内部运营团队”使用的“标签管理工具”为例,进行产品设计和实践。
业务场景:城市治理业务中/舆情情报监测分析场景,厂商为政府客户提供“线索”,主要是风险信息,包含敏感信息、有害信息、负面舆情事件、“违规”账号、“违规”人物、“违规”团伙)。
不论是单条消息(可能只有文本,可能有图+文,可能有文本+视频),还是通过消息聚类得到的舆情事件;还是账号、群、人、团伙,其使用的“风险标签”体系均是一套。此外,每个业务对象,除了“风险维度”,还有其它维度的标签。比如舆情事件的“紧急程度”,“人物”的风险等级等。
该工具产品的阶段一目标:实现各个业务对象风险标签的管理。风险标签,需要由风险模型计算。
1)风险标签的增、删、改、查;及操作日志的管理;——P0
2)风险标签计算策略的开发及管理;——P0
3)风险标签的应用频次管理;——本期,在后台实现监控统计即可;
- 如下是城市治理业务分析对象:舆情事件、人的标签需求:
【标签管理工具】产品原型界面设计如下:
标签树,只是一种展现形式而已,主要实现标签的录入、查询、编辑、删除即可。
由于风险标签,需要由算法模型计算,需要训练语料。运营可以为每个标签设置关键词和语料。(即标签计算策略的配置)。
未来,该标签管理工具,可以考虑新增如下功能模块,使得该标签工具“产品化”:
1)每个标签计算策略的展示;以及标签执行周期的配置;以及标签任务运行的配置(手动触发/关闭、定时触发/关闭);
2)拓展标签类型,目前仅有算法模型类标签。考虑支持“规则类”标签,如“活跃度”标签配置、“重要程度”配置。使得运营人员/算法能够基于此挑选“重要&活跃&xx风险标签”的数据实现定向推送;
3)每类标签、每个标签的业务应用情况统计分析。——BI模块;
4)标签的变动,考虑是否需要增加审核流程;
5)提供一些业界常用的标签体系模板(包括标签体系、每个标签的计算规则都提前预置好),如RMF用户分群体系;
6)搭配算法模型自训练平台(机器学习平台,机器学习平台预置常用的NLP分类、文本分类、NLP要素抽取、NLP情感识别等模型)一同售卖;
2.3 标签的应用
- 搜索场景:为用户提供分类查询导航,使得用户能够快速的找到所需要的商品、物品、书籍、音乐..
- 推荐场景:结合用户标签、商品标签,给用户推荐其可能关注的内容、商品..
三、全文总结
本文首先回顾了 什么是标签及标签体系,标签体系的价值;然后介绍了什么样的业务场景需要建立标签体系(电商、内容推荐、城市治理业务等);接着介绍了为什么要管理标签、谁来管理标签、管理标签的什么?最后针对城市治理业务场景,给出了 “风险标签”管理工具的产品设计实例,并探讨该工具若进一步优化或沉淀成商业化产品,后续所需做的工作。
附录:本文参考文献
[1] 标签体系技术架构图 标签体系管理:https://blog.51cto.com/u_16213704/8832284?articleABtest=0
[2] 数据分析 | 基于智能标签,精准管理数据:https://blog.51cto.com/cicadasmile/2499769?articleABtest=0
[3] 数据标签管理架构 数据标签的存储与管理:https://blog.51cto.com/u_13250/8162925
四、写在最后
之前在面试虾皮搜推产品经理岗以及字节内容标签运营岗时,都被问到了为何要建标签体系,用在了哪?你怎么建的,等等一系列问题。当时没有系统化地复盘和很深入的思考过,所以很遗憾和心仪岗位擦肩而过。趁最近有时间,所以特此学习复盘梳理出来,希望对你也有所帮助~
本文由 @南方碟道 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
上中看完了,有下吗
下,就是那篇数据融合治理平台的(有些水吧)
非常有启发,写的很好
😊