电商后台设计——搜索

16 评论 49640 浏览 466 收藏 13 分钟

编辑导语:我们在进行网上购物时,可以直接利用搜索功能查找想要的商品,十分快捷方便;为了方便我们的更快的找到,搜索后会根据系统内部的逻辑进行查找;本文作者详细介绍了电商平台的搜索原理以及搜索功能。

电商平台商品成千上万,为了方便用户快速查找到自己想要的商品,平台中会设置有多种查询方式,如品类搜索、关键字搜索等。

但是无论前台页面样式如何改变,系统内部的搜索逻辑其实都是同一套,今天我们就来看看电商平台的搜索原理以及常见的搜索功能要点。

一、查询种类

如果按照内部逻辑划分,电商系统中的查询通常有两类:特定维度查询和关键字查询。

1. 特定维度查询

特定维度仅可查询由系统指定的部分可属性,如品类、品牌、价格、性别、材质等,并且用户无法输入查询值,仅能选择查询值。

由于这些数据在系统内部都维护有基础数据,并且保存在指定的字段中,所以对它们的查询相对比较简单。

用户在选中对应选项时,可以获得对应的唯一ID,之后根据ID查询相应字段获得结果,查询相对比较准确。

2. 关键字查询

整个搜索功能最重要的入口,允许用户随意输入要查询的关键字,通常仅有一个查询关键字长度限制。

相对于特定维度查询,关键字查询相对比较复杂,下图是搜索的原理图,下面来一一进行分析。

二、逻辑层操作

当用户提交了查询关键字后,系统会将关键字交给搜索逻辑处理,逻辑层会进行一下几步操作:

1. 非法词过滤

由于关键字查询功能是对用户开放的,所以用户输入什么内容我们是不可控的。

我们在项目排查时经常会发现一些五花八门的关键字,其中有不少关键字比较敏感,比如涉黄、涉赌等等,这些关键字我们通常都会屏蔽,不进行数据搜索。

要屏蔽对应的关键字,后台就需要维护一套非法词库,当用户输入的关键字在非法词库中就不再做搜索,以减轻服务器压力。

网上一般有现成的词库可以直接导入系统,不满足的后台再进行维护扩充。

2. 错误词纠正

在输入查询关键字时,用户可能会输入成拼音、或者错别字,如用户本意要输入“阿迪达斯”,实际输入成“阿迪斯”,但是结果依然能返回和“阿迪达斯”匹配的数据。

这是因为逻辑中有一套纠错词处理,当系统对比有错误时,会进行纠正处理。

同样后台也需要维护了一套纠错词库,当用户输入的关键字如果在纠错词库中,系统会自动将错误关键字替换为设置好的关键字;如:阿迪斯->阿迪达斯;阿达斯->阿迪达斯,之后查询实际采用的是转换后的关键字。

3. 特定跳转

有时我们在电商平台上输入查询关键字,会发现部分关键字结果不会跳转到结果列表页,而是跳转到一个商家店铺主页或者活动页;如输入关键字“阿迪达斯”,可能直接就进入到了阿迪达斯旗舰店页面,也有可能进入阿迪达斯活动专场页面。

要实现这个功能,后台同样需要维护一套跳转规则映射库;当用户的搜索关键字与规则库中的关键字匹配时,则返回规则所指定的跳转路径,前端页面直接跳转过去——通常这个跳转规则是有时间限定的。

4. 商品搜索

当用户输入的查询关键字通过非法词过滤、纠错词纠正、特定跳转匹配后,依然没有匹配结果,这时系统会将关键字交给商品搜索服务器。

搜索服务器首先会对关键字进行分词处理,然后再根据分词进行商品查询,并根据权重规则获得商品权重值,之后再进行权重值排序,最后返回查询结果。

在商品搜索中有三个非常重要的功能:分词、权重、以及搜索维度。

分词:分词是将一个比较长的关键字拆分成多个合理的比较短的关键字(如:阿迪达斯板鞋->阿迪达斯、板鞋、鞋);说起来只是简单的一句话,但是能做出一个好的分词项目并非易事,有兴趣的同学可以自己搜索中分分词原理,这里就不多说。项目中我们通常会引用第三方的分词软件获得分词,之后再去商品服务器中去查询数据并将结果展示出来。

权重:权重是衡量某一指标的重要程度,在电商平台里都是各家的商业机密,网上公开的资料也是少之又少;一个商品的权重高低,直接决定着商品排名情况,当然也就影响着销售额了;下一篇《权重设计》我会单独介绍电商平台是如何设计的。

需要注意的是上面提到的搜索服务器不是常见的关系型数据库(如mysql),而是全文检索服务器(如solr),一般的全文检索服务器也自带有分词功能,满足中小型电商的分析和搜索是没有问题的。

搜索维度:也就是用户可以通过哪些属性对商品进行搜索; 其中基础属性中的品牌、品类、价格都会参与搜索,还有特殊属性中后台明确规定参与搜索的属性(如果忘记了可以查看《属性管理》篇)。

商品搜索服务器会根据需要参与搜索的属性,对查询出的商品信息按各属性进行分组统计,然后由代码逻辑层进行数据整理,再由前端进行展示,最终就形成了搜索列表的样式。

不知道大家在JD上搜索时有没有发现,如果输入一个覆盖品类比较大的关键字,最终的返回结果只会是同一品类的商品。

如输入查询关键字【牛】,和牛相关的商品品类有牛肉、牛仔裤、牛油果等等,实际结果只有肉类产品。

这个主要就是不同品类的商品属性不同,无法做到公用的效果,业务上需要作出一些取舍;所以大家平时设计产品时,需要多和技术聊聊,能达到的效果尽量实现,不能话就需要作出一些妥协。

以上就是一个搜索功能的核心要点,一个看似简单的搜索框,其实内部是需要多个功能进行协同完成的;下次给技术要工作周期时,可不能直说我只想要个框,你就要几周时间,以免被人笑话。

上面这几个核心要点每个也是一个功能要点,都需要单独维护;除此之外还有一些功能,具体是否使用大家需要根据自己的业务来决定。

5. 搜索统计

做为平台重要的数据入口,对用户搜索词的统计功能有多重要就不在多说了。

通过对搜索词数据的统计,可以让运营人员直观的了解到用户对品类、品牌、价格的青睐趋势,为后期的活动运营、市场预测做好数据指导。

常见的统计维度有以下几个:

  1. 每日、每周、以及每月的搜索访问量统计;
  2. 搜索关键字的排名统计(组织方式:每日、最近一周、最近一个月、每月);
  3. 各品类、各品牌的搜索排名统计(组织方式:每日、最近一周、最近一个月、每月);
  4. 各品类、各品牌排名占比(组织方式:每日、最近一周、最近一个月、每月);
  5. 各价格区间的的搜索排名统计(组织方式:每日、最近一周、最近一个月、每月)。

6. 首页推荐词

在电商首页,平台为了推广活动,会在的搜索框下面显示一些热门搜索词或者推荐搜索词,而这些搜索词通常都会跳转到指定的专题或者活动页,以提升活动曝光率。

在上面讲解的【特定跳转】功能上增加一个首页推荐词字段加以区分就能实现这个功能。

7. 搜索历史

当用户选中搜索框时,下拉列表里面会出现之前的搜索词,方便用户快捷选择。

这个只需要在用户提交搜索词时,将搜索词保存起来,之后再调取出来即可,功能比较简单。

8. 搜索推荐词

当用户选中搜索框并输入查询关键字,下拉列表中会出现相似的一些推荐词,并且推荐词后面有相应的商品数量。

这个功能是通过调用【商品搜索】功能的统计接口,实时获得的数据并显示前几位的数据。

9. 输入形式

通常查询关键字搜索默认的输入形式是文字形式,现在由于技术的发展,有实力的电商平台也引入了图片输入和语音输入方式。

其实内部逻辑一点都没有变,只是在原始的文字输入之上有加了一层识别组件,通过识别组件先将图片内容或者语音内容转为文字,再由文字进行搜索查询。

以上就是搜索功能的内容,还有遗漏的地方欢迎大家下方留言补充!

 

作者:JackLiu;个人微信公众号: 扬帆去远航(ID:Jackai_liu)

本文由 @Jack 原创发布于人人都是产品经理,未经作者许可,禁止转载。

题图来自Unsplash,基于CC0协议。

作者:Jack;个人微信公众号: 扬帆去远航(ID:Jackai_liu)

本文由 @Jack 原创发布于人人都是产品经理,未经作者许可,禁止转载。

题图来自Unsplash,基于 CC0 协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 写的很好,说的很全面,顶你大佬

    来自云南 回复
  2. 这种开源的电商后台有推荐的吗

    来自重庆 回复
  3. 大佬,能看一下你的原型吗~~~~

    来自重庆 回复
  4. 想请教一下,分词之后应该是先匹配出结果集,再对结果集进行排序?能不能说一下匹配规则的设计?

    回复
  5. 收藏了,读完有个困惑想和前辈交流。第8项搜索推荐词这里,搜索框输入“手机”后系统自动给的推荐词“手机自营”“手机支架”,是按照什么逻辑给出的呢?不太理解搜索词后缀的扩展机制,是只要该推荐词对应搜索统计的商品数量越多,系统就越优先推荐该词吗?

    来自广东 回复
    1. 这个推荐词有三种实现方法:1.通过上面讲的第三个功能,现将推荐词维护到数据库里,搜索的时候先从这里获取,这个通常在做推广的时候用的比较多;2.通过商品搜索服务器来实现,观察一下大平台的商品名称,名称里面是不是有什么信息,录入商品的时候,服务器就会做关键字处理,后期的搜索就会依赖这些关键字,最后讲这些结果汇总统计就是推荐词了

      回复
    2. 谢谢详细解答🙏,明白很多

      来自广东 回复
    3. 期待《权重设计》!!

      来自广东 回复
  6. 求分享 权重设计😍

    回复
  7. 您好,向您请教2个问题:1.落地页是跳转页面的链接吗?2.权重值能否解释一下?谢谢!!!

    来自江苏 回复
    1. 落地页是跳转页面类型,平台里面一般有多种页面:首页、搜索页、专题页、商户主页等,跳转参数里面可以填写具体的跳转地址和参数。权重值就和排序一样,值越高,越靠前!

      来自北京 回复
  8. 图片识别那里感觉不止是文字吧?再用淘宝的时候,界面上会先圈定你要搜索的东西,然后会找到和你图片上一模一样的商品,这个是怎么做到的呢?求答疑

    来自广东 回复
    1. 我们有人眼看到一张图片后,会分析出图片中有哪些内容,如有鞋子、价格、文案等,然后你想找相似的,就需要根据大脑想到的关键字去搜索。图片识别差不多也是一样的,不过这个内容是由机器识别的,之后也会返给你关键字,然后再由这些关键字去产品库里面查询!

      来自北京 回复
    2. 大佬,拜读过本文后,思路被捋顺不少,感谢!
      但是,关于图片搜索这块的逻辑解释,本人不太认同。
      如果按照你所讲述的逻辑去实现的话,势必需要先去维护一套图片转文字的AI识别系统,但是这种AI的输出值,永远也不可能是一个且稳定的值,也即是说,一张图片在一次识别中,会输出多组文字,多次识别输出的可能是多组文字,甚至关联性都不大,而且,这个图片转文字的AI识别系统还不同于OCR,不是简单的【将图片上的文字识别为字符串】,而是【将图片的示意识别为一段文字型的描述性语言】,这个在技术难度和人工成本(数据标注)上,远远超过绝大多数公司可承担的范围。简单来说,目前可以将一张【椅子.jpg】识别为【椅子】,更近一步可识别为【一个红色的斜着放的三只脚的椅子】,但是永远也无法完整的表达图片作者的意图,【阿玛尼牌春季限量款红色三脚椅子】,那么就会导致识别准确率低下,搜索失真。
      ps:关于【永远也无法完整的表达图片作者的意图】的解释: 一方面是图片所包含信息太过复杂,存在太多信息噪点,另一方面则是会存在强烈的主观意愿,作为人类都无法完整理解图片作者的意图,AI就更不可能了(因为AI需要人为去投喂数据和训练)
      而我所构想的图片搜索是,基于图片本身属性的搜索,【图片】->【分类】->【识别图片特征】->【在图库中搜索】->【输出搜索结果】,基于这个路径,完全不需要将图片本身的示意转换成文字特征,只需要先对图片进行分类,然后进行特征比对即可,当然,这个方案的成本也很高,也有一定的技术门槛,但是至少是目前的技术和人力水平可以实现的方式。

      以上,请大佬点评。

      来自广东 回复
    3. 你说的对~ 这个就依赖于机器学习了,直接对图片进行学习和处理,属于computer vision (CV)的技术范畴。

      来自北京 回复
  9. 拆分关键词、识别主关键词、整词搜索、关键词纠错……

    来自上海 回复