京东产品总监朱文伟:利用AI加速构建营销新模式(附大会PPT下载)

2 评论 10258 浏览 78 收藏 29 分钟

AI的本质,就是解决复杂场景的效率问题。

分享嘉宾:京东产品总监@朱文伟

本文为1月7日人人都是产品经理与腾讯大学联合主办的2017中国产品经理大会·上海站嘉宾分享内容整理总结,由人人都是产品经理合作伙伴@笔记侠 整理,部分内容有修改:

 

今天我会结合AI和营销上的想法以及落地实践的经验,分享我们的一些思考。

一、数据是AI的根本

数据很重要。我们称现在是人工智能的第三次浪潮。有两个决定因素比较能论证这件事情是可以成功的:

第一是计算力。举例来看:英伟达最近两年的股票价格增长是600%,从一家市值一百多亿美金的公司,到现在已经突破了一千两百亿,这是一个巨大的飞跃,得益于人工智能的兴起。

第二是数据。互联网在经历了这十几二十年之后,已经把用户的习惯和数据慢慢从线下引到线上。现在互联网时代整体收集数据和清洗数据成本比以往要低得多,我们可以看一下数据的重要性。

这里涉及到两部分,第一部分是数据的收集,第二部分是数据清洗。

1. 数据收集

数据收集的来源:

京东拥有我认为几乎是互联网上最完整、最精准、最高、最长完整链条的数据。

第一方面,京东商城一年有大几千亿的销售额,十几万的商家,10亿以上的商品每天沉淀在平台上,有大量的数据可以为整体的后续营销和人工智能建设服务。

第二方面,我不知道大家有没有用过京东白条?实际上像京东白条,包括理财产品,对用户来讲是有非常高价值的数据。

第三方面,是物流。今年4月份,京东宣布整个物流子集团成立,意味着京东物流从一个供给自身商城业务,扩展到社会化物流。我们现在也开始给大量的品牌方服务,可能这个商家在天猫开店,但它是用京东的仓库,用京东的整个物流体系。各个地区行业的数据获取可以更高,当然数据是永远没有止境的。

第四方面,东哥(刘强东在开年大会上)也提了无界零售。我们现有八家京X计划,包括腾讯,今日头条,都是行业里最大的媒体和流量端。通过整个的数据清洗,让我们的数据更完整。

数据收集的原则

互联网真正地采集了大量的数据,这是人工智能的第一战场。在数据整个收集过程里有几个点,是我想强调的:

第一个,数据并非越多越好

如果有些数据是无效的,也不用刻意地生产很多画像。

第二个,没有应用场景的画像没有任何价值

举个例子,比如你喜欢吃核桃,你又打王者荣耀,你觉得王者荣耀知道你喜欢吃核桃这件事情有任何价值吗?他可能给你出个核桃的装备吗?听上去好像没有什么商业意义。

第三个,大部分画像都是一种概率

大部分数据,包括用户画像,你可以认为它是一种概率。比如,在我们家大部分电商的消费都是我来完成的,也会帮我老婆买一些女性用品,由于我其他行为也不多,可能我就会被定义为一个女性用户。但实际上我在其他方面的行为并不是一个女性用户,所以它会存在偏差。

第四个,不要过度关心用户避免用户焦虑

这个在互联网早期比较多,总让用户填一些个人信息问卷;其实很少有人会认真地去填,所以尽量不要去打搅用户。

再举个例子,比如说杜蕾斯很火,我可能算出来了,你两周肯定会买一次。那到点了,我就在APP首页全部推送杜蕾斯,被别人看见,你是会觉得隐私被侵犯的,所以尽量地避免过度去关心。

2. 数据清洗

有了完整数据之后,还是要落地到商品的数据、内容的数据、店铺品牌的数据,以及最重要的用户画像上。

我们在有一套标准的体系收集用户整体链路之后,基于画像的过滤和清洗形成了几个维度:

第一,人口属性

比如你是哪里人? 现在我们在互联网上都要实名认证,通过你的身份证号可以得到你的性别、出生地,这些信息都是比较完整的(但我们绝对是保密的,我自己也都查不到每个用户的信息)。当然有很多数据是来自于金融,得益于我们的这些强关联。

第二,用户的属性偏好

你在京东的很多行为,我们会定义你的品类偏好,品牌偏好,包括商品的偏好,更细分的会在品类上。

以购买力举例,你是买一千块钱的手机,还是买一万块钱的手机,这里会存在一个价格歧视的问题;但这个价格不是说一千块钱的手机卖给你是一千,卖给他是一千五。而是说由于品牌的影响,两个商品的差异非常小;但由于我觉得你的溢价能力是比较强的,那可能就会把更贵的商品推给你。

第三,垂直标签

举个例子,母婴人群。很多人知道备孕的时候要吃叶酸,一旦你在京东买叶酸了,我就知道你可能离怀孕不久了。我们基于这个用户的行为,可以推算出她在整个母婴过程里面的状态:是在怀孕周期,还是baby刚出生。从怀孕到两岁的过程,我们都定义为母婴人群。我可以在你的周期里给你推一段奶粉、二段奶粉、三段奶粉,这是一个非常强的应用场景。

第四,外部标签

我们会有很多外部广告投放,可以获取到外部的一些用户的标签,这是电商所不具备的。

二、AI的本质是:解决复杂场景的效率问题

AI可以结合营销场景,做很多在营销上的实际应用。

在实际应用中我们定义,AI是解决复杂场景的效率问题。社会主义是提高生产力的很好的法宝,我觉得AI也是。

AI不仅仅是一个用户产品,其实对内部提升运营效率也特别有帮助。

举一个不是那么复杂的场景:

案例:京东秒杀

1. 资源分配管理成本

我们在2016年年初才开始推秒杀的智能化,最早期是这样做的:每天有十几个秒杀场次,每个场次有50个商品,每个事业部不同的GMV目标,之前是靠运营同事把这些坑位一个个分给事业部,现在通过AI来处理:第一个资源位和第五十个资源位产生的价值是完全不同的,如果是最后一个和第一个来比,可能GMV贡献度只有10%。这会导致资源管理的成本非常高,因为要精确到每一个资源位来看它的效率。

2. 资源撬动、激励

从前端运营的角度,必然想把更好的商品放到更好的位置。

比如,三只松鼠本来卖五折,基于历史销售来看,五折其实不是一个很有竞争力的价格,我希望卖到三折。

现在是很难去要求的,因为你给他的资源曝光已经非常固化了。放在第十个坑位就是那么多曝光,只是三折的转化率稍微高一点。

如果通过AI技术决定商家商品的坑位,商家能够通过加强折扣力度提升排序,那么就能够激励商家给出更有竞争力的价格。

3. 复杂场景下的用户行为差异

这个例子是跟用户相关性更高的,特别典型。

现在是冬天,大部分同学从深圳来,他可能要带很多衣服,因为深圳现在气候不是很寒冷;但是在北京,大家可能都穿着波司登(某羽绒服品牌)。所以不同区域,用户其实有很大的差异,但不仅在于区域,可能在很多行为上会存在很大的差别。

基于单一频道,我们有很多通用的模型,并且基于同一个频道做了一些差异化建设。

第一个,考虑资源撬动的问题。不仅考虑打几折,还要考虑这个折扣和历史最低价、历史销售的对比;不仅考虑它自身的销售怎么样,还会考虑它在品类里排行如何。针对秒杀这种强促销的频道,我们会更多地考虑它的销售库存——一件卖一百块钱的商品,卖一卖一百件和卖一万件,对频道的价值差异是非常大的。

第二个,看商品的实时效果。除了正常的数据以外,引入两个基于这个频道特性的数据:

  • 预约量,我们会做24小时提前曝光。看这个商品曝光之后,有多用户真正关心它,愿意来抢。
  • 售謦率。实时跟进销售进度,销售进度越高,会给一个权重。销售很低的,从销售补充的角度来讲,也会给一些权重。

第三个,最重要的用户的偏好。除了正常的品类、品牌偏好之外,我们会加上品类协同。可能这个用户在A品类没有什么行为,但我们发现用户在A品类和B品类上,是有一些销售关联度的,以及在某些品类上可能会有复购的问题。比如你买个手机,一般人应该不会在六个月到半年之内再去买第二台,这样的商品我们往往会给它做降权。

基于这些模型,我们去做整体点击率和订单转化的优化,看哪些效率高,哪些效率不高。基于一个运营场景,比如针对618、双11、优惠券等这样强促销的频道,我们会给出不同的解决方案。

因为大促期间用户的行为差异很大,我们会基于去年618或者去年双11的数据,做专门的模型训练,让用户在这个周期里面的行为表现,更趋向于我们预测的现实结果。

可能有人觉得秒杀或者像淘宝、聚划算、淘抢购,它的促销信息太强了,好像AI在里面也起不了什么效果,但从我们实际结果上来看,整体提升率能到30%。秒杀在双11周期里面,11月1号我们的销售额突破了一百亿。通过AI这个模型的优化,提升30%是一个非常大的量级。

哪些场景可以借助AI解决?

第一个,从运营端来看,人的数量永远是有限的。秒杀频道有接近100号员工,这是一个非常大的量级。 京东内部的活动,每天线上有5000个,如果一个人负责一个活动,也要需要5000个人,这个规模是不能再去扩充的。

第二个,在京东这样平台(包括阿里),很多资源和流量都是按品类来管理的,每个品类都有销售KPI,当它做活动的时候,比如生鲜做活动,是不太可能卖家电的。

结合这样两个场景,我们去看有没有办法提供一种更场景化的链路,来完成AI赋能。

案例:准备婚礼

在操办婚礼的时候,有很多事情要做:要买家电,要装修房子,要买喜糖,都是一些跨品类的长链路的行为。那么,有没有办法把很多场景通过一个机器挖掘出来,再通过自动化的方式有效组织,以非常简化的结构推荐给用户?

在这个过程里,有一些问题是必须要解决的。

第一个问题,场景怎么来?很多场景很细分,而且几乎很少有一个运营懂全局。

第二个问题,内容怎么来?场景里面有很多商品,有很多内容,总要有一个地方来确定这个规则去选品。

第三个问题,头图怎么来?页面里会有个头图,它是一个氛围图。怎么生成? 以及整体页面结构,页面样式怎么确定?

考虑到这个场景确实非常大,我们最后的结论是让机器来完成所有的事情。

如果场景数量是一个非常可控的量级,比如说50个,可能有几个运营同事就可以搞定了;但当整个数量达到5000甚至更大的时候,人的力量是非常有限的,不可能为了这个频道去招一千个人,从公司整体效率上来讲也是不可行的。

同时所有的场景都在动态变化。举个例子,比如叮咚音箱,包括小雅音箱,它也是一个场景,但这个场景可能在最近两年才起来,明年可能有另外的场景方向,这是需要一个动态调整过程的,我们希望整体过程都是可以机器化生产的。

第一个:场景怎么来?

我们把这件事情真正地交给机器。我们清洗了大量底层的数据,把所有的商品、内容、店铺、商家、达人标签化。然后去看所有用户的行为:搜索行为、访问行为以及去扒全网的,比如百度上热搜,今天发生了什么变化,以及去看不同的人群。总会有那么一群人,他的行为是领先的,我们称他为达人。他可能先穿着这件衣服,由于他穿着这件衣服就引领时尚了。这些人在京东的行为是怎么样的,我们希望可以把它聚类出来,形成一个场景挖掘。

我们挖了至少上千的频道、场景出来。

但是频道、场景挖出来之后,至少要输出到前端给用户,纯粹的后台数据是无法完成这个事情的。所以我们又设计了一个机制叫场景生成器——机器挖掘结果出来之后,提交给人,这个人负责总结频道的名字和副标题。

我们知道,百度、京东、阿里可能都在做AI写作,我们在内容生产上也做过很多这样的尝试,发现效果确实不太好。它写出来的东西(特别是这种短标题),往往是人无法理解的,或者它可能是一个纯粹的品类词,场景感非常弱;所以现在我们这部分是人在做的。确定名字之后,内容质量是人可以理解的场景下,我们会调用整个的场景频道服务。

场景生成器的作用

第一,判断品类特征,找到适应它结构。比如我买快消品,你买可乐,几乎没有人会去看商品详情页,大部分人是在列表加购,但是你去看3C商品,买手机的时候不太可能搜iPhone直接加购,这个决策成本是不太可能在这么短的链路里完成的,我们基于这种不同场景会生成不同的页面结构。

第二,抓去场景下内容自动生成头图。京东内容生态已经生产了大量的内容,在这里面,我们抓取合适这个场景的图片,结合标题生成头图。

第三,基于机器学习方法召回排序。基于前面挖掘的结果,通过一系列召回策略,生成一个频道,并且把它投到线上。

案例:怕热星人

我们频道4月份刚刚上线,在6月底的时候发现一个特别有意思的特征:运动饮料、家电(主要是空调、冰箱)这些商品的销量,有非常一致性的提升,结合机器的推荐生成了这个频道。

最好的时候,7月份和8月份这个单一频道,占整体频道销售额的20%到30%。

案例:东家小院

这是一个名字特别有京东特征的频道,东家小院是我们第一次通过整个大数据挖掘、机器学习和图像智能的方法,去尝试一个“准无人”运营的频道。这个“准”就是因为前面我们人工来定标题,随着技术进步,理论上可以让它变成一个完全无人运营的频道,大家可以在京东APP的首页入口非常靠上的位置找到它。

我们从500个频道池里面选了6个露出在首页,所有的入口都是基于用户行为的个性化的,而且这个个性化是非常实时的,基本上你点了之后再刷一下就变了。同时,我们也做了整体到内页的入口图的联动,内页也会基于所有用户的行为做相关联推荐,以及商品和内容的个性化召回——这是我们第一次尝试的一个完整的AI链路。

这是整体上线之后的一些数据表现:蓝色是UV(Unique Visitor,网站独立访客),黄色线是GMV(Gross Merchandise Volume,成交总额)。

可以看到:从4月份开始到12月份,GMV的增长比UV还要大。

在这个过程里,我们做了非常多的模型优化,并且最早的频道从一百增长到现在五百多,整体的效率在双11周期达到了最高峰。

其实UV在12月份还在增长,但为什么11月份对应的GMV是高点?因为在11月份京东的用户购物热情上涨,看到东西就买,导致我们频道整体的销售也出现峰值的情况(幽默)。这个UV数据现在差不多是几百万的量级。

三、AI是持续学习的过程

AI不是一蹴而就的。

从前面的增长数据来看:

第一,需要经过大流量的验证

AI除了数据以外,就是计算。通过流量的验证,可以收集到大量的用户行为数据。

这个和Alpha Go是不太一样的:Alpha Go的规则相对简单,只要告诉它怎么下是合法的,怎么样算赢就可以了。10月份DeepMind团队宣布了Alpha Zero通过40天的自我学习,没有接受其他任何在网络上收集的棋谱数据,就打败了原来的Alpha Go。给它数量只有两个:第一个,下棋的规则。第二个,怎么算赢?让它不断地自己和自己下。

我所说的很多人都无法想象的一些策略,但是在电商的领域,或者大家面对很多To C用户的时候,用户的数据才是价值,这是需要强输入的。

第二,基于用户体验

还是举前面的例子,几乎不太会有用户希望自己被推荐出来杜蕾斯:当别人看见的时候,发现你跟我用的是一个牌子——很尴尬是不是?

有些场景机器是不了解的,但是人了解,这个体验需要人来设定规则去做控制。

第三,业务的平衡

大家都知道京东的强项是3C,是家电。如果任由机器去做,导致的结果可能是你看到的永远都是3C,都是家电——因为从GMV产出来讲,这样的品类效率是最高的。

比如,买一台iPhoneX,现在是一万块钱,但买生鲜的客单价可能就是一百多,这是无法相比的。所以在这里面我们要考虑更多的业务场景,包括品类的均衡。

在用户看到的时候,不仅是体验,也是业务因素,要给他更丰富的品类;以及当一些品类新出来的时候,比如京东的7 FRESH刚开张,像这样的新品类,如果不靠一些战略扶持,冷启动是非常难的。因为没有任何的用户偏好,用户没有任何的行为,更谈不上品类协同,这就需要一些人为的加权来做干预。

四、平台化,赋能更多场景

整体上,如果我们只是做单点的研究去推荐,那么AI这件事情其实就失去了价值。因为这样的话需要基于所有的场景做独立化训练,实际上并不用——可以把它建成一个平台化的能力,让它可以应用到更多的场景,我们建设的平台叫京东营销投放平台。

它集成了基础的个性化推荐、精准投放、业务补充和自动化运营能力。

简单的以精准投放能力为例,对于7 FRESH,在APP里,只有当你在那家店周边三公里它的可配送范围内,我们才会把入口开放给你。

以及有很多很复杂、很繁琐的事情,包括一些业务信息的补充、异常过滤、算法的分流、数据的清洗,这是一个持续优化的过程。以及我们通过这个平台建设,赋能到更多的业务场景。

现在通过京东营销投放平台覆盖到的APP、PC的首页、618大促活动(包括一些三超的品牌活动)、通天塔、优惠券频道等,这些场景可以非常快速地接收,包括前端的埋点、数据清洗的整个过程。

当然很多时候我们提供的是一些比较通用的模型和方案。当一个大流量的业务需要做深度优化的时候,我们也会基于这个场景去做完整的深度链路的优化。

五、全新营销模式正在加速形成

我们在做AI建设去影响营销过程的时候,到底发生了什么?

我用三个关键词来总结:

第一个,规则化

传统的营销模式,是基于人对流量和资源位的管理;但是类似于东家小院这样的频道,它是形成一个规则,人是不需要参与的,或者说人在里面起到的是监督的作用:我知道什么样的商品能进来,什么样玩法的内容可以参与。

第二个,开放化

由于自动化引入,人的效率大大提升,或者说人可以释放出来了,营销曝光的资源更多了。在原始的运营模式里面能参与的商家只有头部,而现在京东16万的商家,大量商家可以参与。

在这个规模里,最多20%的商家可以在整个京东营销资源流量里去玩,剩下怎么弄?自己去做搜索。

通过规则化的实施,更多商家可以参与进来。

第三个,个性化

前端流量效率的提升,伴随而来的是销售越来越长尾。

京东从最早的标品卖手机、卖家电这种标准化的东西开始向生鲜、向时尚这样的品类去做,核心的因素就是:在大流量下用户的需求差异化非常大,而京东自身特别是做自营,其实做不过来。

京东自营现在的SKU种类也就一百多万,加上图书可能有200到300万。但是用户的需求是永无止境的,要让这十几亿的商品真正地满足,可能这个量还不够;淘宝上有因为有C店,量级可能会更高。

基于不同用户个性化需求,可以让很多细分领域的商家存活下来,在这个平台更茁壮地成长。

以上为嘉宾演讲内容。

相关阅读:

如果觉得知识「贵」,那你试试无知的代价|2017中国产品经理大会官方回顾(附PPT下载)

金融科技的产品使命(附大会PPT下载)

知识付费,下半场怎么走(附大会PPT下载)

6个步骤,打造让用户痴迷的产品(附大会PPT下载)

嘉宾PPT:关注 人人都是产品经理微信(ID:woshipm)公众号,在后台回复关键词“大会”即可获取下载地址。

本文为2017中国产品经理大会北京站嘉宾分享整理总结,未经许可,禁止转载。谢谢合作

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 想跟着BAT大咖老师学习更多系统高阶产品知识吗?
    在【产品总监修炼之道】,四位来自腾讯、百度的资深总监级导师,将和你面对面分享高阶产品必备的系统知识,帮你掌握更加全面的产品专业知识和团队管理思路……

    想了解更多详情?立即戳>>http://996.pm/z4bLB
    也快可以联系KK进行咨询哦~微信/TEL:13043462422

    PS:除了咨询问题,还能领取【产品总监课程学习笔记】! 😉

    来自广东 回复
  2. 沙发

    来自上海 回复