便利店选址和机器学习能擦出什么火花?

1 评论 5290 浏览 20 收藏 13 分钟

编辑导读:想开一个赚钱多的便利店,选址很重要!那么,应该如何确认开店的位置呢?本文从机器学习的角度,分析便利店应该怎么选址,希望对你有帮助。

萝卜同学最近做了一个梦,话说自己开了家便利店,赚了好多钱,然后抱着一堆钱笑醒了,然鹅,发现是个梦。

第二天,见了煎蛋,就对他说,我想开个便利店,你说我要怎么做呢?煎蛋顿时来劲了,发挥自己的专长,巴拉巴拉说了一大堆专业建议。

萝卜一脸黑线,请说人话,我先做啥呢?煎蛋说,那当然是先选址啊。煎蛋接着说,那我给你讲讲选址要考虑的事情。

借煎蛋的话题我们来说说选址的事。

如果你和萝卜同学有同样的想法,想开家便利店,如何才能选择一个好的物业呢?

在这儿我借之前的一个项目经历,来分享下开店背后的业务逻辑和决策,以及如何通过数据,算法来做出合理的决策和解释。

一、业务背后的事

L公司,开店多年,积累了一笔巨款,发现了开便利店是个新机会,就打算投资迅速扩张,希望通过多年开店经验的积累,快速抢占市场。但是,在开荒的过程中发现个问题,用之前的开店流程,效率太低,没法达到预定目标,能不能利用大数据和人工智能来辅助选址,提升选址效率呢?

下面我们来做下分析。

首先我们先简单解释下便利店背后的商业逻辑。

便利店的核心在便利,就是要离用户近,不管是开在社区也好、办公CBD区,还是大客流如高铁、机场等地区,位置一定离人流足够近,让用户方便看到你,甚至看到你卖的部分东西,来触发他的购买欲望,提升进店消费概率。

除了位置外,卖的商品也一定是高频消费,比如零食、早餐、口香糖等,不能卖空调、冰箱。由于快消品的净利低,经营成本固定,想要获利,就需要足够的人流来消费,提升销售额,那么位置对于便利店就显得更尤为重要了。如果不考虑其它因素,单从位置便利和销售额的相关性上分析,位置便利性和销售的相关系数的总体分布会0.7-0.9。基于这样的逻辑,我们再来看选址这件事。

二、传统的选址

传统选址主要从哪些维度来评估便利呢?主要考虑以下几个核心的维度。

  • 位置属性:所选物业位置属性,是社区、CBD,还是商圈,所在圈子的成熟度如何、距离市中心的距离等。
  • 客流:所选物业周边3公里范围内的客流量及画像。
  • POI:也叫聚客点,所选物业周边3公里范围内的大客流店,如餐馆、大型商超、医院、学校、交通枢纽等。
  • 物业概况:所选物业的基础信息、可到达性、辐射用户数、竞对店等。如物业面积、层高、店招高度、门宽、门前遮挡物、门前阶数、到主干道的距离、到公交的距离等。

以上维度通过所选物业内外两部分因素来评估便利性,考虑的维度已经比较全面了,但是在评估时,主要通过打分卡的形式,进行打分评估,相对比较分散,没法和销售额做关联分析。在决策时,决策团队只能靠着主观意义上的打分,来做出解释性不强的决定。

还有个问题,那就是在数据收集时,所有的数据收集都是要通过人为收集,收集效率低,精准度不高、而且收集成本还比较高。这些都是传统选址方法上存在的问题,也是比较难解决的。那通过AI怎么选址,可以完全解决传统存在的问题嘛?

三、智能选址

答案是不能,AI不是万能的,机器学习是基于数据基础上的统计分析和预测。如果没有数据,那AI就是空谈。所以先要从数据入手,看看哪些是可以获取的,哪些是没法获取但可以通过人为收集的,然后再评估哪些问题可以通过AI解决,怎么解决。

具体数据分析和获取的途径此略过。最终的结论是,围绕销量的客流量、画像、行为、POI、竞对等数据可以通过历史沉淀和外部合作可以获得,而所选物业的基本概况这些信息,需要通过人工进行收集。

基于这样的分析,AI可以在选址上解决一大部分问题,剩下的小部分问题需要靠人主观经验去解决。那具体如何去分配,我们下面分析下基于量化模型和专家卡模型的解决方案,是如何协同解决问题的。

四、量化模型

希望通过量化模型,围绕销售额为目标变量建立与客流量、客流画像、竞品数、POI、物业面积、订单建立数据模型,来解释这些因素间的关联关系。

下面重点说一下样本选择、特征工程、模型构建上的一些事情,描述下量化模型搭建的过程。

样本选择:我们抽取了运营一年的便利店作为样本,过滤掉日均销售额低于1000的样本,围绕此样本来构建数据集。为什么会选择1000,因为这个对于业务来讲,是基本的门槛,是经过综合评估后,日销达到这个指标才能有可能继续运营下去。

特征工程:对每个维度进行分类、分段、时间滑窗等方式做衍生变量,来寻找更贴近业务目标的特征。

比如对于客流量,我们分析了日均人流、工作人口、常驻人口、7:00-9:00人流、12:00-14:00人流,6:00-8:00人流,停留小于30分钟人流、停留30-60分钟人流、停留1小时以后人流、进店人流等;同样其它维度的数据也做了衍生,并进行综合分析,最终确定了100多个特征,构建了模型。

模型构建:最终构建的模型是预测模型和分类模型结合的综合评估模型,主要是考虑到,对于业务方来讲,如果我们输出一个销量预测,比如日销、月销、年销在决策上给的建议有限,选址团队最终想要的是决定性意见,就是适不适合开店。

那么标准是什么呢,就是给出不同类型的店日坪效,通过坪效标准来作为辅助决策的依据。

所以在预测模型基础上结合坪效构建了分类模型,通过两个模型的融合,最终输出可解释的选址建议:推荐选择 ;建议选择 ;慎重选择。

五、专家卡模型

希望通过专家卡模型,结合之前选址评估时用到的维度,通过人工经验,给出所选物业主观打分。下面就抽样、指标设计、分值设计上来简单说下模型的搭建。

样本选择:使用量化模型经过规则加工过滤后的便利店做为样本,并抽取开店决策时各维度的统计数据,完成样本数据整合。

指标设计:由业务对样本的维度、指标、枚举值进行细化梳理,汇总出专家卡评估模型。比如对于基础信息维度的指标,通过细化为:使用面积;店招高度;实际门宽;门前遮挡物;看到店招距离;内部结构等。然后再对使用面积进行指标细化,如100㎡,90-100㎡ ,小于90㎡等。目的就是通过逐步拆解,将一个复杂的维度拆分到不能拆分的程度,使解释性更强。

权重及分值:通过模型对各维度的数据相关性及权重计算。比如对于所选物业性质,如果是社区的话,那么我们计算出的权重系数是:入住率85%:0.85;60-85%:0.67;30%-60% :0.58。通过各细项的打分,获得一个总体分数再乘权重系统,获得这个物业最终的分值。

六、初期协同,最终融合

这里提到两个模型,那最终是不是还需要决策人员自己去综合评估呢?一开始是这样的,后面其实我们会考虑把专家卡模型和量化模型做融合,最终输出一个综合性的评分意见给到业务方,这样更方便选择决策了。具体怎么融合,需要结合业务综合考虑,是需要逐步探索的,但一定是值得去做实验研究的。

回到一开始的问题,机器学习带给选址业务上的帮助是什么?

首先,从效率上,缩短了信息从收集、分析、决策的过程,传统的做法可能需要一周的时间,而使用机器学习后,最多需要一天。

其次,从可解释性上,为选址提供了更精准的数据解释。比如模型的分类准确率达到85.3%时,那其实代表对于未来85.3%的备选物业,我能够提供精准的数据关联关系解释,并且模型给出的结果是符合业务对于坪效、销售额预期的。那需要承担的风险是多少呢?就是1-85.3%,而对于传统的模式下,这种风险和成功预期是没办法做到精准解释的。

再次,可解释,可衡量,那就代表了另一件事,就是提升。通过解释性让我们知道可以通过数据沉淀,模型沉淀,逐步提高我们的预期,降低我们承担的风险。而传统的做法,这种积累会沉淀到某一个人身上,人会流动,会带来不稳定的风险,可能是会增加企业的风险。

综上,机器学习能够带给选址团队的价值不仅是在效率上的提升,还能提供精准的决策解释依据,降低选址风险。

如果你想开个赚钱的便利店,可以考虑选址相关的AI产品,而不用自己在开店前,先把自己变成半个选址专家,最后还选到了一个自己心里都没谱的物业,在还没开始赚钱就已经把自己搞到精辟力尽。试试新的思路,说不定能帮你赚个盆忙钵满呢!

 

本文由 @ 不疯魔 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自Unsplash,基于CC0协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 请问作者的模型有实际落地吗?作者是怎么通过判断的结果对模型做修正从而提高算法准确率的呢?有这方面思路吗?

    来自上海 回复