指标与标签有何不同?
编辑导语:在如今的大数据时代,用数据说话更能体现出差异点,很多时候数据是最实际的表达手法,比如你的年度指标用数据来定义等等;除了这些之外,标签也是重要的一点,如今标签已经成为了各大企业都在做的一个目标;本文作者分享了指标和标签有什么异同点,我们一起来看一下。
自从大数据概念开始兴起后,好像人们都不怎么谈指标了,而津津乐道于标签。
数字经济时代,谈论指标真的落伍了吗?其实未必!指标也好,标签也罢,只要用好都能发挥其价值。
怎样才能用好它们呢,我觉得要从懂它们开始;说到懂它们,就要清楚它们的异同点,到底指标和标签有什么异同点呢?今天就来探讨一下。
一、概念不同
指标是用来定义、评价和描述特定事物的一种标准或方式;比如:新增用户数、累计用户数、用户活跃率等是衡量用户发展情况的指标,月均收入、毛利率、净利率等是用来评价企业经营状况的指标。
标签是人为设定的、根据业务场景需求,对目标对象运用一定的算法得到的高度精炼的特征标识。
可见,标签是经过人为再加工后的结果;比如:说某个人是个“酒鬼”,这里“酒鬼”就是标签,一看到“酒鬼”这个标签人们就能很快知道,这个人肯定是经常喝酒、喜欢喝酒的人。
二、构成不同
指标通常由两部分构成,即名称和取值;名称是指标的外在标识符号,取值是指标的具体内容。
指标名称是对事物质与量两方面特点的命名;指标取值是指标在具体时间、地域、条件下的数量表现。
当然,指标取值可以是定量的数值,有时候也可以是定性的描述;比如描述一个人时,性别、年龄、身高和体重是经常用到的指标,以体重是220斤为例,指标的名称体重,指标的取值就是220斤;指标如果可以数量化的话,那么都是有单位或量纲的;从词性上说,指标几乎都是名字。
标签通常就是简单的几个字或符号;还是以某人体重为220斤为例,用标签的方式来描述的话,“大胖子”就是一个可用的标签;标签一般是不可量化的,通常都是形容词或形容词+名词;比如“大胖子”就是形容词+名词的结构;标签通常是孤立的,除了基础类标签,通过一定算法加工出来的标签一般都没有单位和量纲。
三、属性与特征不同
1)指标是ICT时代和BI时代的通用语言
指标注重对事物及事件的过程进行全面的、体系化的描述,指标的描述范围更广泛,既包括过程也涵盖结果;指标更注重与业务的结合,逻辑上更严谨,表现风格也比较严肃刻板;指标更侧重业务化、严格化和数量化。
2)标签是大数据与人工智能时代的通用语言
标签比指标更有深度、更凝练,是对指标深度加工的结果;标签注重人物和实体对象的描述,标签一般侧重对局部特征和结果的描述,注重与具体业务场景的结合,描述的范围相对较窄; 标签更侧重生活化、口语化和符号化。
总之,标签源于指标,却高于指标;指标更理性,标签更感性;标签比指标更有趣、更形象化、人格化,更有画面感,但指标比标签更讲求精确性、合理性、全面性和体系化。
四、价值评价方式不同
对指标与标签的价值评估方式、评估内容与它们的应用场景相关,也与使用者的感受有关系。
对指标的价值通常用“好不好用”、“全不全面”来评价,对标签的价值通常用“准不准”、“像不像”来评价。
指标的评价较易量化,通常有一定的标准和尺度;标签的评价一般与使用者的感受、应用的结果有强关联关系,不同的人、不同的应用场景,标签能发挥的效果可能大相径庭。
还有一点,由于标签是指标进一步产品化的结果,指标是半成品,标签是成品;所以,标签有时候具有一定的商品属性。
在大数据价值链上,标签是可定价、可售卖、可交易的一种数据产品;比如:在个人征信服务领域,用户的三要素、四要素在合规使用的前提下都是可以按条收费的;而指标通常是不具备售卖价值的,指标的价值可在具体应用场景里或者被融合到产品中才能体现出来。
对价值的认知上,指标可以按照重要性分为关键指标、一般指标等,或者说高价值指标、低价值指标之类的;而标签较少提及这种说法,比如有关键指标一说,而没有关键标签一说。
五、分类不同
1)指标有很多种分类方式
比如:
- 按照指标计算逻辑,可以将指标分为原子指标、派生指标、组合指标三种类型;
- 按照对事件描述内容的不同,分为过程性指标和结果性指标;
- 按照描述对象的不同,分为用户类指标、事件类指标等;
- 按照指标的变化频率,分为静态指标和动态指标;按领域划分,有用户类指标、收入类指标、行为类指标等;
- 按照重要程度,分为主要指标和次要指标等;按职能来分,分为观测指标、管控指标和挑战指标。
当然,还有很多其它的分类方法,不再一一列举。
2)标签的分类方法通常比指标要少一些
之所以这么说,是因为指标能描述的对象范围更广,对事物的描述能做维度更全面、颗粒度更细,而标签对事物(用于对人的描述比较多)的描述则是更深入、更形象的。
- 按照标签的变化性分为静态标签和动态标签;
- 按照标签的指代和评估指标的不同,可分为定性标签和定量标签;
- 按照标签体系分级分层的方式,可以分为一级标签、二级标签、三级标签等,每一个层级的标签相当于一个业务维度的切面;
- 按照复杂程度分为:基础标签、规则标签和模型标签——基础标签通常是写实的,与指标有较高的重合度,比如身高、体重等;规则标签一般是有一些简单的规则来控制,符合某种规则时才生成相应的标签;模型标签一般需要通过某些机器学习算法来生成。
六、表现形态不同
指标的表现形态相对简单,通常以格式化的报表、直方图、趋势图、看板等图形来表示。
标签的表现形态相对复杂,我们通常说的标签是数据化的标签,数据化标签的表现形态以可视化的图表或大屏为主;比如,我们在客户画像时通常以词云图的形式来表现其特征。
事实上,在现实世界中标签还有三种表现形态:实物标签、网络标签和电子标签。
- 实物标签是用于标明物品的品名、重量、体积、用途等信息的简要标牌,例如:商品标签、价格标签、车检标签、服装吊牌、车票、登机牌都是实物标签;
- 网络标签(Tag)是一种互联网内容组织方式,是相关性很强的关键字,它能帮助人们通过关键词快速建立对内容总体印象;
- 电子标签又称RFID射频标签,是一种识别效率和准确度都比较高的识别工具,通过射频信号自动识别目标对象并获取相关数据,识别工作无须人工干预,可工作于各种恶劣环境。
七、生产过程不同
指标是生产性思维、拆解式思维,讲究的是化整为零,将事物分解开来进行多角度的描述,得到很多的指标;标签则是合成性思维、聚合式思维,讲究的是化零为整,将多个分散的指标按照一定的原理进行综合加工,得出概括性的结果。
一般情况下,先有指标,后有标签;指标是业务管理导向的,需要提前规划;标签是应用导向的,跟随业务需求的而变化,面向业务可随时增加;
指标的生产通常先要扫平数据质量问题,统一数据口径;而标签生产涉及数据质量的问题较少,因为数据质量的问题已经在指标生产阶段被解决了;指标通常存在多个口径、口径不一致的问题,而标签在这方面的问题则相对较少。
八、应用场景不同
指标的应用场景很多,涉及企业的战略、管理、运营和支撑等层面;具体包括:战略目标、市场定位、业务监测、业绩考核、任务分解、数据分析、数据建模、BI应用等。
标签的应用场景主要集中于CRM领域,尤其适合于用户运营。比如:客户画像、新增获客、沉默用户激活、存量客户维系、数据建模、数据可视化等。
指标最擅长的应用是监测、分析、评价和建模,标签最擅长的应用是标注、刻画、分类和特征提取。
特别需要指出的是,由于对结果的标注也是一种标签,所以在自然语言处理和机器学习相关的算法应用场景下,标签对于监督式学习有重要价值,只是单纯的指标难以做到的;而指标在任务分配、绩效管理等领域的作用,也是标签无法做到的。
九、管理与维护的内容不同
原则上来说,指标与标签都需要建立体系化的管理机制。就指标的管理机制而言,指标管理通常涉及三个方面:需求阶段的管理、开发过程的管理、应用过程的管理;所以,对指标的管理动作主要就是:做指标、管指标、控指标。
指标的日常管理涉及指标的定义、指标的分类、指标的权限管理等;对指标的监控与维护通常涉及缺失值、异常值、勾稽关系等方面的检查。
对标签的管理与维护通常按照标签的生命周期来开展的,涉及标签开发与发布、标签应用、标签价值评估和标签优化及下线四个阶段。
对标签的管理动作主要就是:打标签、贴标签、用标签和改标签等;为做好标签管理与维护,有必要设立专门的标签管理团队,建立标签分类、命名、描述、和实施等方面的规范,完善配套的数据采集流程、标签加工流程、标签问题处理与反馈流程等;建立标签全生命周期管理体系,与数据资产管理制度相统一,为标签在各层面的落地及管理提供建设依据。
十、小结
以上是笔者从9个方面详细解读了指标与标签的不同点。
当然,两者还是有不少共同点的,比如:指标和标签都是对事物的一种描述和解读,都是对数据加工的结果,都可以分维度拆解,都是企业的数据资产等等,还有一些共同点就不再一一展开。
剖析指标和标签的异同点是为了更好的使用它们、驾驭它们;所以,希望以上我关于指标与标签的分析能够对诸位有所启发。
#专栏作家#
黄小刚,微信公众号:大数据产品设计与运营,人人都是产品经理专栏作家。拥有超过10年的BI应用咨询与解决方案实战经验、5年大数据产品设计与管理经验。一个非主流的大数据应用专家,一个非著名的数据产品经理。
本文原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自Unsplash,基于CC0协议
有意思
有意思
比如描述一个人时,性别、年龄、身高和体重是经常用到的指标,以体重是220斤为例,指标的名称体重,指标的取值就是220斤
————性别、年龄、身高和体重是维度,不是指标。
指标的值应该是数值型的还是数值型+字符型?
标签和指标之间是否存在一定的关联关系?