站在数据产品经理角度,说说“业务诊断”

4 评论 1463 浏览 10 收藏 8 分钟

数据产品经理需要做的事情,可能是让数据会“说话”,按照本文作者的看法,即让数据从“信息化”变为“智能化”,让数据从“展示”变为“指导”。这个过程,可能就要涉及到业务诊断了。怎么理解呢?不妨来看看作者的解答。

一、前言

在3-4年的那个阶段,是我最迷茫的时候。那时已经接触了大部分数据产品相关工作,做平台、工具、报表、大屏、提数、标签,并且对数仓、数据分析、需求把控、优先级排序、项目管理、价值提炼也有了一些认识,看似做了足够多的事情。但似乎终究是被业务裹挟着跑,业务的极速增长就同步裹挟着需求的增长,无数的报表需求、取数需求扑面而来。

数据产品经理的价值到底是什么?终极目标是什么?数据团队对业务来说,到底是价值还是成本?时至今日其实也还没有问题的答案,但通过工作中的部分实践、以及业内一些资深数据产品的思考。目前我的理解是:泛化数据给使用的人,把分析的理念和框架变成数据产品,让数据“说话”。

听上去很抽象,简单来说就是从“信息化”变为“智能化”,从“数据展示”变为“指导方针”。因此就有了这章的内容,我把它分为3个部分,「业务诊断」「业务决策」「业务预测」。

  • 业务诊断:对业务异动进行诊断,讲清楚为什么发生(发现问题,定位原因)
  • 业务决策:对于已经出现的现状,给出具体的执行动作(直接告诉怎么做)
  • 业务预测:预测未来将要发生什么

接下来先介绍「业务诊断」的部分:

二、典型场景

增长产品昨天发现C端营收,下降严重,老板要求快速找到原因,大概流程如下:

1)找运营、产品等部门问问,昨天有没有重要动作;再找技术排查下是否存在技术故障;

2)问下来没有异常,尝试自己通过报表数据进行分析。

  • 「单指标多维度分析」:先看一级商品类型波动,再看二级商品类型波动,再看订单页面来源波动等等,观察是否有异常波动
  • 「多指标相关性分析」:看活跃用户数、注册用户数等相关性指标3)思绪混乱,提工单给分析师排查

人工排查通常会耗费大量时间,异动分析过程实际可以泛化为数据产品,交给机器来做,下面介绍「单指标多维度分析」自动诊断方法。

三、自动诊断方法

「单指标多维度分析」难点:

  1. 如何找到异动的关键维度;
  2. 找到关键维度后如何找到关键维度值。

解决思路:

  1. 通过现期和基期对比,看异动情况(通过趋势图);
  2. 定位影响异动最大的维度是哪个(通过基尼系数);
  3. 定位每个维度下哪个维度值影响最大(通过贡献度)。

1. 基尼系数定位异常维度

基尼系数系数定义:衡量财富分配是否均匀的指标,将拿到的收入数据从小到大排列,x轴代表人数占比的累加,y轴代表收入占比的累加,绘制出一条洛伦兹曲线,计算图中A区域的面积占比,该占比就是基尼系数,即A/A+B。基尼系数越大,代表收入差异越大。

基于此,构建基于基尼系数的定位维度问题的方案,用于计算各下钻维度方案对单个指标波动的影响程度,x轴用特征分组基期累计占比,y轴用波动值累计占比(可以为负值),基尼系数越大说明该特征对波动的解释效果越好。

这里引申出2个概念,特征分组基期累计占比(权重) 和 波动值累计占比(影响因子),下图为示例解释:

由图可知,当权重和影响因子越接近,基尼系数越趋近于0,基尼系数计算公式(火山引擎应用):

举例验证,造成异动维度 支付平台>商品>支付方式>国家>渠道

2. 贡献度定位异常维度值

在3.1中描述基尼系数时,已经引入贡献度计算逻辑,即某维度值贡献度=(该维度值现期的值-该维度值基期的值)/(大盘现期的值-大盘基期的值)。

四、产品实例(火山引擎)

第一步 :在折线图中,发现最近一天的GMV突然下降,点击下降的数据点,进行归因分析

第二步 :归因分析计算完成,点击查看归因结果。

第三步 :查看归因结果,最近一段时间GMV波动异常,默认和前一月的数据进行比较,数据下降了22.61%,按照引起下降的贡献对维度进行排名,发现sale_city的系数为0.56,是重要的影响因素,就可以针对这个区域的销售情况进行筛选并经一步分析。

本文由 @起司Criss 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自Unsplash,基于CC0协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 你好!请问下举例验证中的第4张表(带有负值的支付方式表)中的计算过程是否有误?支付方式B的影响因子应该是100%而不是60%吧。
    如果有误,修正后的基尼系数还是0.39吗?

    来自广东 回复
  2. 文章写的非常清晰!给作者点赞!请教一个小小的问题,在计算基尼系数的时候,每个维值的权重是如何定义or计算的呀?引入权重的作用又是啥嘞

    来自北京 回复
    1. 每个维度值的权重,即每个维度值基期占比。作用在于通过权重先定位基期的“贫富差距”,贫穷维度影响因子大,富裕维度影响因子小,才能定位异常。

      来自江苏 回复
    2. 明白了!感谢大佬!

      来自北京 回复