电商入门(4):如果我来负责搜狗云表情的搜索功能,会怎样去优化?
通过体验云表情APP的搜索功能,本文作者希望从APP端展现出来的规律和现象,猜测目前云表情搜索功能的后台逻辑,进而假设如果是自己负责云表情搜索功能,会怎样去优化搜索。
之前抽出时间体验了一下搜狗云表情APP,这是一款工具型APP。先说说为什么会把它列入到电商入门的系列里面呢?因为之前有说过,如果有机会,我要说一说电商里面的另一个灵魂——搜索,现在积蓄还不够,所以会抽出时间去研究一下其他具备搜索功能的APP,希望能逐步提炼出一些自己的东西,以后才有可能写出电商领域的搜索。(ps:如果把云表情的单个表情比作电商的一个sku,你可能会对我的意图理解得更深刻些~)
通过体验云表情APP的搜索功能,我希望从APP端展现出来的规律和现象,猜测目前云表情搜索功能的后台逻辑,进而假设如果是自己负责云表情搜索功能,会怎样去优化搜索。
所以本文的大概框架和思路是:现象 → 猜测 → 优化,一共写了4个case:分类及元素归属、关键词匹配效率、语义分析以及标签体系。
注:下文元素指一个表情(jpg、gif、……)
Case1:分类及元素归属
现象:
- 输入任意不同关键词,转搜索结果页,可见结果列表分暴漫、视频截屏、卡通形象、纯文字4类聚合展示全部匹配元素;
- 切换分类,比如从暴漫切换到视频截屏,各类中所包含的元素不重复。
猜测如下:
- 没有前、后台分类的区分,前台分类即为后台分类,也就是说云表情后台只有:暴漫、视频截屏、卡通形象、纯文字4个分类;
- 每一个元素只能归属于一个后台分类,进而导致每一个元素只能归属于一个前台分类。
优化:
后台分类是用来管理素材的,一般枝叶较密;前台分类是方便用户筛选的,一般枝叶稀疏,两者用途不一样。从可扩展性角度出发(素材增多),前、后台分类一致不利于日后类目扩展以及应对素材急剧增加带来的问题。
- 建立前台分类和后台分类;
- 一个前台分类可对应多个后台分类;
- 每一个元素仅可挂在一个后台分类上,但在前台展示时,可能出现在多个前台分类中。
Case2:关键词匹配效率
现象:
分别输入“快乐”、“快乐宝”、“快乐拉”和“宝拉”4个关键词(由表情包“快乐宝拉”拆分得来):
- “快乐”和“快乐宝”可搜索得到“快乐宝拉”表情包,“快乐拉”和“宝拉”无表情包展示,但在结果列表中有“快乐宝拉”相关元素展示;
- 搜索“快乐拉”关键词,在结果列表中包含“快乐”、“快乐宝拉”和“拉”3者元素之并集。
猜测如下:
- 依据关键词优先查询表情包库,若无匹配表情包(名称),则仅在结果列表中展示全部与(已拆分)关键词匹配的元素;
- 表情包搜索不支持表情包(名称)中间空缺(如快乐*拉这样),但支持尾部空缺(如快乐宝*这样)[注:但某些关键词,如“快乐”,却能匹配出“我超快乐”表情包];
- 按关键词搜索元素时,结果列表包含该关键词所有被拆分的有效(包括模糊匹配)关键词包含元素之并集。
优化:
- 优化搜索关键词与表情包(名称)匹配效率,如“宝拉”和“快乐*拉”能匹配出“快乐宝拉”表情包;
- 优化结果列表(即有效(包括模糊匹配)关键词包含元素之并集)排序,如优化搜索“快乐拉”关键词的结果展示列表。
Case3:语义分析
现象:
- 分别输入“开心”、“快乐”和“高兴”3个同义词,转搜索结果页:
- 关键词“开心”对应结果页,匹配出了“不开心”表情包;
- 各关键词对应结果列表页中元素有交集(比例很高)。
猜测如下:
- 尚未做语义分析功能;
- 假设第一条成立,那么同义词搜索对应结果呈现出高相似度的现象,可以说明一个元素可能对应多个标签,比如结果中相同元素均具备“开心”、“快乐”和“高兴”三个标签,所以不论搜索“开心”、“快乐”还是“高兴”,它们都能出现在结果列表中。
优化:
优化语义分析功能,至少在搜索结果中不能出现自相矛盾的元素,比如搜索“开心”,结果中出现“不开心”元素。
Case4:标签体系
现象:
- 输入关键词“开心”,转搜索结果页:
- 开心❤表情包中部分表情,并未展现在下方结果列表中。
猜测如下:
- 每一个元素都存在一个或多个关键词(标签),同一个表情包可以收录具备不同标签的元素(通过其他案例发现同一个元素可以被不同表情包收录);
- 补充:通过以上case2其实还可以猜测:后台可能没有从表情包的维度去维护标签(对表情包来说,可能仅仅只维护了一个表情包名称)。
优化:
- 一个表情包代表同类型元素的合集,它们一般具有相似的属性(标签),后台可以在表情包的维度维护标签,表情包下所有元素继承表情包的标签,这样可以解决当搜索“开心”时,“开心❤”表情包中所有元素也会陈列在下方结果列表中。
- 后台建立完善的表情包体系,因为在元素日益增多时,元素分门别类以表情包这个维度聚合必然是未来的发展方向。
我最近也是想多积累一些搜索相关的知识点,欢迎大家和我讨论,在底下留言就可以了~
持续产出干货是我的初衷,相信也是你关注我的初衷!
相关阅读
作者:QJQ,微信公众号:倔牛的人生
本文由 @QJQ 原创发布于人人都是产品经理。未经许可,禁止转载。
题图来源于网络
然后就是不断的评估建模bulabula
其实都是本质标签体系,切分term,在把这些term经过一系列的数据计算加权(包括词的基础热度、词相关性、图本身质量等等维度)等最终得出分值再展现
同建议做个配图,方便理解
赞一个文章调理清楚,如果配图就能不用费劲脑补咯。
另外我认为这样类比有点牵强,毕竟前后端菜单挂靠的设计电商是标配。或许可以找几个小伙伴组队一起,分专题讨论,一个人负责一个平台。京东淘宝亚马逊一人一个,从叶子类目的维护到搜索,从运费模板设计到排名竞价,或许针对性强一点哈。
本文相对电商入门系列前3篇文章,确实有点晦涩。
研究电商搜索的时候一般最好是研究电商,但是为了积累其他行业内搜索相关功能知识点,退而求其次的选择了一些不相关的东西,哈哈哈~
电商的搜索太复杂了,如你所说的,和类目、商品属性等等一系列都有关,如果可以咱们可以一起讨论啊,搜索我之前也没接触过,还在学习中,需要和各位朋友学习~
关键词匹配搜索这里,我认为是采用了 文本分词和ES搜索。
(“快乐”和“快乐宝”可搜索得到“快乐宝拉”),是因为前缀匹配;
(“快乐拉”关键词,在结果列表中包含“快乐”、“快乐宝拉”和“拉”)是因为“快乐拉”分词成了“快乐”和“拉”,然后通过ES搜索出来;
(“快乐”,却能匹配出“我超快乐”表情包)同样是因为ES搜索的结果。
而采用这种分词和搜索方式,优化点恐怕是不好解决了。
可以,可以,我先去研究下文本分词和ES搜索这两个词的概念,看来搜索这块儿我还是很业余的,哈哈哈