以互联网行业为背景下的数据分析通识(中)
导语:上一期我们从互联网行业特性、互联网行业常见的数据指标、数据分析概述等几个方面了解一下基于互联网行业背景下的数据分析一些基本的概念(以互联网行业为背景下的数据分析通识(上))。本期继续将从数据分析入门、数据分析基本流程两个方面来进行梳理!
四、数据分析入门
我们不要局限于入门专职数据分析的岗位,而是从广义“数据分析”的角度,来理解一下如何入门数据分析。不存在质疑自己合不合适做数据分析、纠结零基础入门难、文科生是不是很难入门等疑问,主要让大家了解“数据分析”如何入门。
但如果你想入行数据分析,就需要好好思考一些问题:我希望进入哪些数据分析的岗位呢?这职位有前景吗?自己的性格适不适合做数据分析?符合自己未来的职业定位么?入行后需要什么样的知识结构?等问题了。
因此,从什么样的人适合从事数据分析、有哪些入门的书可以推荐、有哪些入门数据分析工具推荐、其他建议几个方面,来梳理“数据分析”如何入门。
1. 什么样的人适合从事数据分析?
1)首先:从性格、兴趣、爱好等方面来看
要有一定的好奇心和不断探索未知的性格,并有兴趣去知道数据背后的逻辑,当面对分析需求、写sql代码、整理海量数据等繁琐枯燥的工作,能克服枯燥的感觉并严谨的完成这些工作,同时更要求有与人沟通以及合作的协调的能力,因为做数据分析需要与业务部门、研发部门等频繁沟通和合作、明确需求以及推动执行的。这些工作,是你喜欢的、擅长的吗?
2)其次:从学习、思考的能力方面来看
如何根据数据,来推演、分析、提出解决方案,需要你常常脑洞大开,并且数据分析是需要不断持续保持学习状态的。因为数据分析的结论,有时候会和我们的直觉背道而驰,这就需要不断的通过思考以及学习,完善自己的知识体系。
3)再者:从工具使用的熟练程度来看
我们分析数据, 就需要有数据源,然后处理数据。也就是说数据查询和处理的能力是做数据分析基本的内功。在数据处理上,就涉及到了大大小小各种各样的工具,所以就需要掌握这些工具的使用,如Excel、SQL、Tableau、Pyhon等工具。
4)最后:从心态上想想自己是否具有开放性、可容错性以及坚持不懈的毅力
数据分析的圈子里面,都非常开放。数据也好,还是数据指标也好,其本身并不是完美的,也会出错,所以我们必须拥有开放的心态以及坚持不懈的精神,所以,才能使我们不断的从数据中探索,寻求答案。
小结:总之,对于一些缺点和不足,可以考虑改进,使之不再成为短板,比如学习数据分析的基本原理、技术、工具,但是兴趣、性格、心态的方面呢?或者会成为你放弃不擅长的职业的原因。
2. 有哪些入门的书可以推荐?
对于数据分析入门,我们先要有数据分析的基本数学概念,初级数据思维,初级数据工具技能。因此,推荐的入门书籍如下:
- 基本数学概念推荐书籍:《深入浅出数据分析》《深入浅出统计学》等——了解基本的统计知识,锻炼扎实统计基础。
- 初级数据思维:《精益数据分析》 《数据思维:从数据分析到商业价值》等——了解分析方法、案例、锻炼数据思维。
- 初级数据工具技能:《谁说菜鸟不会数据分析:入门篇》《谁说菜鸟不会数据分析(工具篇)》等——了解基本知识,掌握基本的工具。
小结:总之,数据分析需要具备多方面的理论基础,比如
- 基本的数据分析知识:统计、概率论、数据挖掘基础理论等;
- 基本的商业意识:营销理论、战略规划等;
- 数据处理知识:数据库、数据结构等。
但是对于小白而言,这实在是信息量太大了,所以在入门的阶段,以上推荐书籍,基本上能清晰地让我们刚入门的朋友们知道数据分析能解决什么问题、需要什么方法论、需要掌握什么基本技术及原理等这些就足够。懂得常规知识并能找到基础的工作是入门阶段的目标。
3. 有哪些入门数据分析工具推荐?
在工具方面,推荐从Excel+SQL这2个来作为入门的数据分析工具。剩下的一些工具根据自身能力去学习,都可以自学 ,但等有SQL基础后再学Python等复杂的工具会相对容易些。
1)Excel:最基础的底层能力, 当然也是必备的
在实际工作中Excel的使用频率非常高,因为Excel函数、透视表可解决大部分问题,并能够把存储、分析、数据可视化很好的结合在一起。而且Excel的熟练程度,也会极大提升数据分析过程中的效率,让分析更加的强大。还有一个很重要的原因就是Excel的受众广。
特别是可以把分析结果展示给业务部门,或者与业务部门对接的时候,会节省大量的时间成本。但Excel功能太多,对于刚入门数据分析的也不可能掌握所有的功能,可以则需而取。主要掌握常见的功能和函数基本上就可以覆盖大部分的应用场景了,比如:
- 基础功能: 列排序、筛选、去重、求和、求平均;
- 高级功能: 透视表行列值汇总、占比汇总、过滤、排序 (主要是可视化图表);
- 数值函数:ABSCEILFLOOR···
- 逻辑函数: IFIFERROR ···
- 字符函数: LEFTRIGHTCONCATENATEVALUE ···
- 时间函数: YEARMONTHDAYDATE ···
- 高级函数: VLOOKUP···
(后面我们有专门Excel讲解,这里就 不一一展开了)
2)SQL:一门专门为数据查询所设计的编程语言,也是所有数据分析师们都必须掌握的基础要求
因为当小规模的数据处理、分析、展示Excel都可以搞定,但对于大规模的数据处理而言,Sql是必备的取数手段,在数据获取和数据清洗环节都会用到SQL,要看哪些数据需要处理,然后导出数据。
对于刚入门数据分析来讲,可以先从几个核心语句入手学习SQL:
- 检索数据:SELECT FROM
- 筛选数据:WHERE / HAVING
- 数据分组:GROUP BY
- 汇总函数:聚合函数
- 数据排序:ORDER BY
- 数据选取:LIMIT
掌握以上语句和一些基础函数后,在实际应用中可以满足我们80%左右的查询需求。而关于增删改语句,我们可以进行了解,在应用中我们基本不会接触到修改数据库的权限。推荐《SQL必知必会》这本书可以熟悉基础用法。如果为了应聘,可以去牛客网找一些真题练手,学习SQL主要还是以练题为主(后面我们有专门SQL讲解,这里就不展开了)。
小结:总之,“工欲善其事,必先利其器” ,一件称手的工具能让我们事半功倍。对于数据分析人员来说,数据分析基本流程中的数据获取、数据清洗、数据可视化分析的部分,最常用的组合是 SQL + Excel + PPT/可视化(入门级的Excel 就可以做可视化,还有一些Power BI、Tableau等可视化软件这里就不展开了)。
4. 其他建议
对于入门数据分析主要建议还是主要把精力放在数据分析的思维以及方法论的熟悉与训练上。
比如:
- 平时可以多去看一些商业数据模型、数据分析案例;
- 关注一下数据类的公众号(比如我的公众号木木自由(专注数据领域干货、经验、实战、课程分享),哈哈,但公众号的文章类目可能比较杂,建议看完要自己归类整理吸收,必须形成自己的数据体系);
- 加入一些数据分析的专业社群也是一个不错的入门法子;
- 网上很多数据分析的资料(人人都是产品经理等那些优质网站),最后逐步的一点一点的形成自己的分析思路。
小结:总之,数据分析入门并不难,入门之后的知识积累才是重点,如何在实际工作、项目中真正发挥数据分析的作用,产生价值。并且优秀的数据分析人员一定是主动发现问题、解决问题并扛得住压力的。只要明确了方向,那么剩下的就是坚持了!
五、数据分析基本流程
数据分析基本流程一般是这样的:
1. 数据理解
数据理解,即明确数据分析的目的以及问题。
因为,我们做任何事情都要有明确目的,数据分析更是如此,需要把问题以及目标定义清楚。在做分析之前,我们可以要明确几个问题:
- 理解分析的需求目标:我们为什么要做数据分析?分析什么?想要达到什么样的效果;
- 理解受众用户和业务:想通过分析达到一个什么样目的?是提升相关业务指标还是发现问题?只有明确目的才能制定合理的数据分析思路;
- 明确需求数据来源:即数据如何产生的,分析怎样的场景,比如app用户从下载到成为会员的用户路径,从而制作漏斗模型,优化付费成为会员环境,提高付费量,这就是场景。要根据场景去定义问题,梳理数据分析思路,选择数据分析的方法;
- 明确分析业务问题优先级:通过对问题进行重要性及紧急性排序,针对行的分析较为重要的问题。
2. 数据收集
数据是一切分析的基础,一般情况下,每个公司都有自己的一些服务器和数据库或者运营后台。而数据收集的程度和准确性往往就决定了数据分析结果的可靠性和有效性。
3. 数据清洗
收集好以后,我们需要对数据去做一些清洗。因为很多数据有问题,不准确的数据分析出的结果毫无价值意义。比如 数据残缺(空数据)、数据错误、数据重复、数据异常等问题,我们都需要对这些数据进行清洗。
4. 数据分析
在数据进行简单的清洗后,我们就需要去做一些数据分析了。
即通过一系列的数据分析方法从数据得到可以回答需求的答案,根据分析需求以及目的,围绕是多少、是什么、为什么、会怎样、又如何来展开,通过进行描述性分析、诊断、用户分类/分层、预测等分析方法,对数据进行分析。
1)是多少、是什么:描述性分析,评估业务现状
描述性分析主要是将基础数据进行汇总,并转化为便于理解的形式,清晰地展示目前的业务是怎么样的,例如各种周月报表、图表等。通过描述性分析可以快速评估业务特征,以及找到分析的方向。通过观察数据的分布情况、 业务指标的波动情况,从中找到出现异常的数据,并分析出异常现象的原因。
2)为什么:相关性分析,找到关键因素,进行指标拆解
基于描述分析进行问题的深入挖掘,寻找业务变化的原因,通过相关性分析,找到关键因素,进行指标拆解,分析问题是如何发生的,我们就可以从哪些方面去解决问题。
例如:发现本月整体的GMV(成交总额)减少,我们该如何发现原因?
首先,可以通过计算各个级别门店GMV变化与整体GMV变化的相关系数,确定那个类别的门店GMV对整体GMV影响最大(这里不展开具体分析,简单了解一下场景)。
其次,拆解GMV业务指标:GMV =顾客总数*成交转化率 * 平均客单价= 门店数量 * 店均人数 * 人效,当GMV发生变化时,我们可以通过分析门店数据、平均客单价、成交转化率、门店人效等子指标的变化来确定原因。
再者,指标维度下钻,GMV = A店GMV + B店GMV +C店GMV ,通过逐步细化指标维度,实现原因判断。常用的维度下钻有日期、地理等维度。
最后,挖掘并总结各种事物的相关性,进而,对于制定精准营销策略具有指导意义。
3)会怎样:预测
预测未来可能发生的事情,侧重于未来的走势以及是否可以提前规避风险。实际工作中,可根据历史数据和分析技术(如机器学习)对未来结果进行预测。
通过技术手段可以以很高的精度形成对未来的见解。但需要高深的技术知识,对于入门的朋友来说,可以通过同比,环比,对比分析,趋势、回归分析等,结合以往经验和知识,进行预测分析和判断。
4)又如何:分群、分层
基于描述、指标拆解、预测等以上一系列操作分析 ,对业务提出可落地可执行的措施。并进行用户特征、用户行为对用户进行分群分层,实现精细化运营,进一步提升运营效率和转化率。
比如,以要实现GMV的稳定增长为例,通过数据分析描述现状、发现原因、指标拆解、预测未来变化等操作,并结合业务状况,和业务运营共同制定用户分层精细化运营、增加活动力度,提升转化率等运营策略。
总之,数据分析方法有很多,如对比分析、多维分析、转化分析、留存分析等,这里就不一一展开了,可根据自己的业务场景,选择合适的分析方法!
5. 数据展现
其实也就是数据可视化,把数据结果通过不同的表和图形,可视化展现出来。
可视化是数据分析结果呈现的重要步骤,可视化是以图表方式呈现数据分析结果,这样的结果会更清晰、直观,容易被理解,对于入门级别的常见的数据可视化工具可以是excel。
6. 数据报告
经过上述一些列的步骤,得出了哪些结论?可以采取哪些优化措施?这些都需要以数据报告的形式进行呈现。基本结构如下:
- 背景——描写报告的业务背景,只有受众了解了才能知道报告的价值所在;
- 数据来源——注明数据来源,才能提高可信度;
- 数据展示——数据文字合理的排版,才会有好的可视化效果;
- 抛出结论——有结论的分析才有意义;
- 提出建议——根据分析结论提出相应的建议。
7. 结果验证
数据分析结果的应用是数据产生价值的直接体现,而这个过程需要具有数据沟通能力,业务推动能力和项目工作能力。
如果得到了结果却不知道做什么,那么这个数据分析可能就是失败的。此时我们就需要检查数据分析方法是不是有问题;其次,数据是否进行过加工处理?再其次,数据收集的是否可靠?这就需要具体问题,具体分析了。
小结:
以上就是一次标准又简洁的数据分析全流程。然而,在实际的业务分析中,一般在第七步得到了验证结果后还要回到第一步,回顾分析的目的,去与业务或者运营人员沟通,反馈结论,比如哪里有异常、原因、下一步动作等事宜,这也就使数据分析形成了“闭环”。
然后相关业务人员再次提出疑问去确立新的分析目标,通过如此反复的迭代优化及分析,可提高营销活动有效性,提高投资回报率等数据指标……“闭环”其实就是“扬长避短”,让数据引导动作到更有价值的地方,实现资源配置最大化,也就是所谓的数据驱动业务。
#专栏作家#
木兮擎天@,微信公众号:木木自由,人人都是产品经理专栏作家。多年互联网数据运营经验,涉猎运营领域较广,关注于运营、数据分析的实战案例与经验以及方法论的总结,探索运营与数据的神奇奥秘!
本文原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议
- 目前还没评论,等你发挥!