便利店选址和机器学习能擦出什么火花？

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

便利店选址和机器学习能擦出什么火花？

不疯魔

2020-07-13

1 评论 5290 浏览 20 收藏

13 分钟

编辑导读：想开一个赚钱多的便利店，选址很重要！那么，应该如何确认开店的位置呢？本文从机器学习的角度，分析便利店应该怎么选址，希望对你有帮助。

萝卜同学最近做了一个梦，话说自己开了家便利店，赚了好多钱，然后抱着一堆钱笑醒了，然鹅，发现是个梦。

第二天，见了煎蛋，就对他说，我想开个便利店，你说我要怎么做呢？煎蛋顿时来劲了，发挥自己的专长，巴拉巴拉说了一大堆专业建议。

萝卜一脸黑线，请说人话，我先做啥呢？煎蛋说，那当然是先选址啊。煎蛋接着说，那我给你讲讲选址要考虑的事情。

借煎蛋的话题我们来说说选址的事。

如果你和萝卜同学有同样的想法，想开家便利店，如何才能选择一个好的物业呢？

在这儿我借之前的一个项目经历，来分享下开店背后的业务逻辑和决策，以及如何通过数据，算法来做出合理的决策和解释。

一、业务背后的事

L公司，开店多年，积累了一笔巨款，发现了开便利店是个新机会，就打算投资迅速扩张，希望通过多年开店经验的积累，快速抢占市场。但是，在开荒的过程中发现个问题，用之前的开店流程，效率太低，没法达到预定目标，能不能利用大数据和人工智能来辅助选址，提升选址效率呢？

下面我们来做下分析。

首先我们先简单解释下便利店背后的商业逻辑。

便利店的核心在便利，就是要离用户近，不管是开在社区也好、办公CBD区，还是大客流如高铁、机场等地区，位置一定离人流足够近，让用户方便看到你，甚至看到你卖的部分东西，来触发他的购买欲望，提升进店消费概率。

除了位置外，卖的商品也一定是高频消费，比如零食、早餐、口香糖等，不能卖空调、冰箱。由于快消品的净利低，经营成本固定，想要获利，就需要足够的人流来消费，提升销售额，那么位置对于便利店就显得更尤为重要了。如果不考虑其它因素，单从位置便利和销售额的相关性上分析，位置便利性和销售的相关系数的总体分布会0.7-0.9。基于这样的逻辑，我们再来看选址这件事。

二、传统的选址

传统选址主要从哪些维度来评估便利呢？主要考虑以下几个核心的维度。

位置属性：所选物业位置属性，是社区、CBD,还是商圈，所在圈子的成熟度如何、距离市中心的距离等。
客流：所选物业周边3公里范围内的客流量及画像。
POI：也叫聚客点，所选物业周边3公里范围内的大客流店，如餐馆、大型商超、医院、学校、交通枢纽等。
物业概况：所选物业的基础信息、可到达性、辐射用户数、竞对店等。如物业面积、层高、店招高度、门宽、门前遮挡物、门前阶数、到主干道的距离、到公交的距离等。

以上维度通过所选物业内外两部分因素来评估便利性，考虑的维度已经比较全面了，但是在评估时，主要通过打分卡的形式，进行打分评估，相对比较分散，没法和销售额做关联分析。在决策时，决策团队只能靠着主观意义上的打分，来做出解释性不强的决定。

还有个问题，那就是在数据收集时，所有的数据收集都是要通过人为收集，收集效率低，精准度不高、而且收集成本还比较高。这些都是传统选址方法上存在的问题，也是比较难解决的。那通过AI怎么选址，可以完全解决传统存在的问题嘛？

三、智能选址

答案是不能，AI不是万能的，机器学习是基于数据基础上的统计分析和预测。如果没有数据，那AI就是空谈。所以先要从数据入手，看看哪些是可以获取的，哪些是没法获取但可以通过人为收集的，然后再评估哪些问题可以通过AI解决，怎么解决。

具体数据分析和获取的途径此略过。最终的结论是，围绕销量的客流量、画像、行为、POI、竞对等数据可以通过历史沉淀和外部合作可以获得，而所选物业的基本概况这些信息，需要通过人工进行收集。

基于这样的分析，AI可以在选址上解决一大部分问题，剩下的小部分问题需要靠人主观经验去解决。那具体如何去分配，我们下面分析下基于量化模型和专家卡模型的解决方案，是如何协同解决问题的。

四、量化模型

希望通过量化模型，围绕销售额为目标变量建立与客流量、客流画像、竞品数、POI、物业面积、订单建立数据模型，来解释这些因素间的关联关系。

下面重点说一下样本选择、特征工程、模型构建上的一些事情，描述下量化模型搭建的过程。

样本选择：我们抽取了运营一年的便利店作为样本，过滤掉日均销售额低于1000的样本，围绕此样本来构建数据集。为什么会选择1000，因为这个对于业务来讲，是基本的门槛，是经过综合评估后，日销达到这个指标才能有可能继续运营下去。

特征工程：对每个维度进行分类、分段、时间滑窗等方式做衍生变量，来寻找更贴近业务目标的特征。

比如对于客流量，我们分析了日均人流、工作人口、常驻人口、7:00-9:00人流、12:00-14:00人流，6:00-8:00人流，停留小于30分钟人流、停留30-60分钟人流、停留1小时以后人流、进店人流等；同样其它维度的数据也做了衍生，并进行综合分析，最终确定了100多个特征，构建了模型。

模型构建：最终构建的模型是预测模型和分类模型结合的综合评估模型，主要是考虑到，对于业务方来讲，如果我们输出一个销量预测，比如日销、月销、年销在决策上给的建议有限，选址团队最终想要的是决定性意见，就是适不适合开店。

那么标准是什么呢，就是给出不同类型的店日坪效，通过坪效标准来作为辅助决策的依据。

所以在预测模型基础上结合坪效构建了分类模型，通过两个模型的融合，最终输出可解释的选址建议：推荐选择；建议选择；慎重选择。

五、专家卡模型

希望通过专家卡模型，结合之前选址评估时用到的维度，通过人工经验，给出所选物业主观打分。下面就抽样、指标设计、分值设计上来简单说下模型的搭建。

样本选择：使用量化模型经过规则加工过滤后的便利店做为样本，并抽取开店决策时各维度的统计数据，完成样本数据整合。

指标设计：由业务对样本的维度、指标、枚举值进行细化梳理，汇总出专家卡评估模型。比如对于基础信息维度的指标，通过细化为：使用面积；店招高度；实际门宽；门前遮挡物；看到店招距离；内部结构等。然后再对使用面积进行指标细化，如100㎡，90-100㎡，小于90㎡等。目的就是通过逐步拆解，将一个复杂的维度拆分到不能拆分的程度，使解释性更强。

权重及分值：通过模型对各维度的数据相关性及权重计算。比如对于所选物业性质，如果是社区的话，那么我们计算出的权重系数是：入住率85%：0.85；60-85%：0.67；30%-60% ：0.58。通过各细项的打分，获得一个总体分数再乘权重系统，获得这个物业最终的分值。

六、初期协同，最终融合

这里提到两个模型，那最终是不是还需要决策人员自己去综合评估呢？一开始是这样的，后面其实我们会考虑把专家卡模型和量化模型做融合，最终输出一个综合性的评分意见给到业务方，这样更方便选择决策了。具体怎么融合，需要结合业务综合考虑，是需要逐步探索的，但一定是值得去做实验研究的。

回到一开始的问题，机器学习带给选址业务上的帮助是什么？

首先，从效率上，缩短了信息从收集、分析、决策的过程，传统的做法可能需要一周的时间，而使用机器学习后，最多需要一天。

其次，从可解释性上，为选址提供了更精准的数据解释。比如模型的分类准确率达到85.3%时，那其实代表对于未来85.3%的备选物业，我能够提供精准的数据关联关系解释，并且模型给出的结果是符合业务对于坪效、销售额预期的。那需要承担的风险是多少呢？就是1-85.3%，而对于传统的模式下，这种风险和成功预期是没办法做到精准解释的。

再次，可解释，可衡量，那就代表了另一件事，就是提升。通过解释性让我们知道可以通过数据沉淀，模型沉淀，逐步提高我们的预期，降低我们承担的风险。而传统的做法，这种积累会沉淀到某一个人身上，人会流动，会带来不稳定的风险，可能是会增加企业的风险。

综上，机器学习能够带给选址团队的价值不仅是在效率上的提升，还能提供精准的决策解释依据，降低选址风险。

如果你想开个赚钱的便利店，可以考虑选址相关的AI产品，而不用自己在开店前，先把自己变成半个选址专家，最后还选到了一个自己心里都没谱的物业，在还没开始赚钱就已经把自己搞到精辟力尽。试试新的思路，说不定能帮你赚个盆忙钵满呢！

本文由 @ 不疯魔原创发布于人人都是产品经理。未经许可，禁止转载

题图来自Unsplash，基于CC0协议

更多精彩内容，请关注人人都是产品经理微信公众号或下载App