大数据时代的新玩法
【导读】数据究竟是什么?大数据未来将走向何妨?美好的大数据理想与现实之间还有多少距离?目前实践了些什么?遇到哪些困难?这些问题值得我们去思考。以下为阿里巴巴数据委员会联合阿里研究院《阿里商业评论》,举办的一场大数据思想沙龙中,10位专家的精彩观点精编。
我们要非常注意企业所处的状态,包括企业状态和数据状态。一个企业处在不同的状态之下,对于数据的关注点是不同的。例如,目前的阿里巴巴,业务量大,数据多而杂,所以我特别希望从数据里产生出它的价值。而对于数据比较小一点的公司,由于还没有这么多数据,所以短期内不用担心这个问题。
记得马总曾说过:凡是已知某种关系,运用这个关系数据计算一个东西出来,或者找出一个规律出来,这不是大数据;凡是不知道某种关系,但是刚刚找到这种关系,并且运用这种关系能产生出额外价值的时候,这就是大数据。而如果这种大数据已经找到了,它逐渐也就不是大数据了,你要再寻找跨界的其他的数据出来。当能让这个数据产生新的价值的时候,就又找到了大数据。
目前,很多公司的BI好像还没到大数据的阶段,而只是找到应用数据的一个方法而已。所以,当已经有海量数据,在这个海量数据中心里面寻找一些有价值的东西出来,这可能是大数据。
大数据让问题更加简单,也面临考验
过去,很多机构数据不够广度,所以要用很复杂的算法才能得出想要的结论。
今天,如果数据广度足够,很多时候就根本没有必要复杂计算了。例如,以前有人通过复杂的达人模型算法得出某用户是牛仔裤达人,但如果能够拿到他的微博数据,那么其实很容易就可以得出该结论的。
所以,以前的数据挖掘跟今天的数据挖掘将有很大差别的。也就是说,当一家公司的使命是将来想做一个大数据公司的话,可能要准备一些一手数据。当然,公司的收购策略,或者数据战略,不是一般的产品人能去影响的。但是,当数据的材料可以影响到没有这么复杂的算法还能实现业务,你就可以这样去做。
从“用”和“养”的观点来讲,目前很多公司已经走在“养”的路上。例如,我们说高德是一家数据公司,因为它非常注重数据的“养”。
很多公司高管会问:你拿着大数据,你能不能从数据里面进行拔高,把数据抽出来,真正找出问题?能不能从数据中直接告诉我今天到底发生了什么问题?能不能比我具有丰富经验的小二厉害?否则,老是讲数据很厉害,我感受不到。
这其实代表了业务方的期望。
其实,现阶段,很多事情大数据还是做不到,在很多地方还是不能经得起考验,所以,在很多人心目中,大数据可能还没到那回事。我们需要正视。
转型革新不仅是大数据,还有分析师
凡是BI人员,肯定是很精通数据业务的。所以当做数据挖掘或很多其他数据工作的时候,他肯定会比其他人做的更好。
当一个公司转型做数据业务时,分析师是一个非常容易转型成成功的business man的。例如,以往BI人员很怕临时需求,但是我发现一线分析师经过了这些锻炼,已经成为全能型人才:他能够从底层数据提取,到中间层数据挖掘,一直到最终解决问题全部完成。目前有一些人觉得分析师是不是已经落后了?其实,分析师成为公司未来商业应用最好的补充。
现在是转型过程一个非常重要的点,因此仅仅懂得做分析师是不够的,我们业内最需要的是数据中间人。他要知道数据架构到底要解决什么问题。他要告诉产品经理,我们需要什么样的自动化产品帮到我们业务方,我们需要什么样的模型。所以,他其实是一个很高级的商业架构师,并不是一个很高级的技术架构师。
我刚进支付宝的时候,当时分析师都走光了,那个时候发现所有东西要重新开始。第一想到是“白米饭”(注:不可或缺的工作)。“白米饭”不能解决,其他部门都会说你们在搞什么?所以开始从“白米饭”开始一级一级的建立自己BI。我觉得BI团队的建立有一条时间线,我们淘宝是先“用”,从“用”再开展到“更多的用”,几个阶段的作用是很不一样的。所以,每家公司的数据部门都要思考:什么是你的白米饭?
同时,不管哪一个数据公司,有一些是数据分析师必须要做的事。例如:BI的总监和领导人一定要在管理层一起开会。可以不说话,但是一定要进去了解公司管理的理念和思路。否则这个BI部门就废掉了,这是我自己感受最深的一点。
未来的BI部门以及数据产品原则,看阿里怎么做
前一段,我们将阿里巴巴的BI部门改名为数据技术与产品部。整个部门不叫BI部门了,但仍有一个BI二级部门存在。
未来,我想象中的BI部门可能会走向这个方向:它像一个无人看管的汽车,没有具体的小二负责,但可以走出正确的道路。当然,这不是在所有场景都能够实现,而是要先选择一些好的场景来实现。在这个场景中,数据、模型能像汽车一样自己走出来。
目前,淘宝BI数据已经尝试走向这条路了,未来怎么样可以做到像没有驾驶员的汽车一样自己找到出路,仍需要不断实践。
而对于做数字产品,阿里巴巴则有以下一些原则:
首先,这是一个单纯的商业行为;
第二,它不影响到用户的隐私;
第三,它不能影响到其他的用户。(因此,如果该产品能够帮到一家,但对另外商户影响大了,就不能做。要保证在互惠互利的前提之下再看方案怎么样。)
此外,还有一个要求:当数据产生交叉的时候,数据必须要放在我们这里。最近,阿里与很多创新性公司展开了合作,例如一些保险公司很快将数据放进来进行实验。它可以先不全量放进来,而是放一些数据进来,看数据交叉之后能不能产生效果,如果效果很好,再考虑下一步。采取小步快跑的商业思路。
来源:i天下网商
- 目前还没评论,等你发挥!